hypothesis testing 快过时了 - Faculty版

本页内容为未名空间相应帖子的节选和存档，一周内的贴子最多显示50字，超过一周显示500字访问原贴

Faculty版 - hypothesis testing 快过时了

相关主题
● 有这样一个学生	● future research
● 真是搞不懂为啥一堆人在这里跳脚骂教授	● 终于体会到什么是politics
● [合集] 看上个学期evaluation	● 怎样对待 arrogant Ph.D. students
● 我也说几句faculty interview	● 科学理论
● 上午面试居然问了我的弱点是什么？	● 关于推荐信的问题
● 对方chair电话来邀请onsite interview的时候我好像提了些过分要求	● 想请教大家一个棘手的问题
● 请教如何写postdoc fellowship的proposal	● 关于job talk的问题
● 有关chalk talk的准备	● 怎么应付公立学校里懒惰又arrogant的staff们？

相关话题的讨论汇总
话题: hypothesis话题: 数据话题: testing话题: 方法话题: 科研

进入Faculty版参与讨论

(共1页)

t********7
发帖数: 2691

传统科学研究以验证假设为基础，不过这种思想在大数据的冲击之下，很快就要过时了。
其实hypothesis testing 是旧时代生产效率低下的产物，那时候收集数据很难，控制
各种条件也很难，当然，分析数据的手段也很有限。所以，就形成了每次做一个实验，
每一个实验验证一个假设的科学研究方法。
可是如今时代不同了，现在的技术手段，往往可以同时采出来很多数据，跑一个程序就
可以算好几种统计运算验证好几个假设。但是老一辈的研究人员还受传统思想的禁锢
，经常以什么多重比较问题来攻击这些新的研究方法。
这种科研思想已经跟不上科研技术的进步了。除了效率低下以外，这种科研思想其实是
助长了科研人员的arrogance，鼓励他们基于成见去限定研究的问题，僵化了他们的脑
袋。基本上还没有做实验，他们脑子里就已经有了既定的假设，这是一种open-minded
，尊重客观事实的做研究的态度吗？而且很多人就是为了维护self-correctness不惜代
价，严重扭曲了科学研究的严肃性。这种科研思想以及执着于这种科研思想的老顽固们
，已经成为新时代科学进步的绊脚石。
在新的科研方法和大数据的冲击之下，恐怕等不到这些老一辈研究人员淡出历史舞台，
这种落后的科研思想就会慢慢被抛弃了。当然，期间还需要新一辈的科学家们多多努力
发出自己的声音。

o****9
发帖数: 479

我听明白了你的论点。我本人对hypothesis testing和基于大数据的方法都接受。我没
觉得这二者是互斥的，我反倒觉得这二者是相互补充的。而且，我认为一味依赖于大数
据的方法，很可能会涌现出一些fake discovery. 一个Discovery既要有对现象的观察
，也要有对观察到的现象的合理解释。大数据的方法可以帮助我们方便地看到很多原先
意想不到的现象，但对观察到的现象的合理解释还是要靠hypothesis testing。
如果你认为大数据的方法可以把knowledge discovery的过程自动化，那我觉得那是纯
忽悠了。我认为大数据的方法可以辅助传统方法，加速研究进程，但我不认为大数据的
方法会取代传统方法，

了。

【在 t********7 的大作中提到】

: 传统科学研究以验证假设为基础，不过这种思想在大数据的冲击之下，很快就要过时了。
: 其实hypothesis testing 是旧时代生产效率低下的产物，那时候收集数据很难，控制
: 各种条件也很难，当然，分析数据的手段也很有限。所以，就形成了每次做一个实验，
: 每一个实验验证一个假设的科学研究方法。
: 可是如今时代不同了，现在的技术手段，往往可以同时采出来很多数据，跑一个程序就
: 可以算好几种统计运算验证好几个假设。但是老一辈的研究人员还受传统思想的禁锢
: ，经常以什么多重比较问题来攻击这些新的研究方法。
: 这种科研思想已经跟不上科研技术的进步了。除了效率低下以外，这种科研思想其实是
: 助长了科研人员的arrogance，鼓励他们基于成见去限定研究的问题，僵化了他们的脑
: 袋。基本上还没有做实验，他们脑子里就已经有了既定的假设，这是一种open-minded

C***t
发帖数: 915

说的好呀！
再举个例子，（我不是学天文的）1975年两个天文学家预言可以有中子星（和曼哈顿大
小，顶两个太阳重）生存在red giant里面。去年真地发现了。

【在 o****9 的大作中提到】

: 我听明白了你的论点。我本人对hypothesis testing和基于大数据的方法都接受。我没
: 觉得这二者是互斥的，我反倒觉得这二者是相互补充的。而且，我认为一味依赖于大数
: 据的方法，很可能会涌现出一些fake discovery. 一个Discovery既要有对现象的观察
: ，也要有对观察到的现象的合理解释。大数据的方法可以帮助我们方便地看到很多原先
: 意想不到的现象，但对观察到的现象的合理解释还是要靠hypothesis testing。
: 如果你认为大数据的方法可以把knowledge discovery的过程自动化，那我觉得那是纯
: 忽悠了。我认为大数据的方法可以辅助传统方法，加速研究进程，但我不认为大数据的
: 方法会取代传统方法，
:
: 了。

t********7
发帖数: 2691

hypothesis testing 同样会有fake discovery。并不是说你自己能解释的就是对的，
你解释不了的就是错的。如果这样，你到底是要获取新知识，还是只是验证你已经有的
想法？

【在 o****9 的大作中提到】

t********7
发帖数: 2691

这跟古代巫师求雨，结果真下雨了，有啥区别？没有求到的就不提了，求到了就说巫师
很灵。人类的arrogance决定了人类只关注自己的正确，而忽略自己的错误。

【在 C***t 的大作中提到】

: 说的好呀！
: 再举个例子，（我不是学天文的）1975年两个天文学家预言可以有中子星（和曼哈顿大
: 小，顶两个太阳重）生存在red giant里面。去年真地发现了。

o****9
发帖数: 479

对呀，你说的没错，我自己的解释是否合理不是我说了算的，是要看我的解释是否与一
个已知的体系自洽。Einstein的相对论是一个假说，这个假说被验证了很多年来看是不
是和实际观察有冲突。量子力学也是一个假说（或模型），据我的理解，量子力学还是
没有完全与物理的其他部分完全吻合。本人非物理人士，一知半解，业余见解而已。

【在 t********7 的大作中提到】

: hypothesis testing 同样会有fake discovery。并不是说你自己能解释的就是对的，
: 你解释不了的就是错的。如果这样，你到底是要获取新知识，还是只是验证你已经有的
: 想法？

t********7
发帖数: 2691

一个已知的体系依然是现有知识框架的禁锢。
比如在天圆地方的已知体系中，的确是解释不了为什么海上的船远远地只能看见船顶的
现象。但是你总不能把人家发现这个现象的小孩当成神经病吧。
新发现肯定是要挑战已知体系。不能挑战的，只能说是不怎么重要的发现。

【在 o****9 的大作中提到】

: 对呀，你说的没错，我自己的解释是否合理不是我说了算的，是要看我的解释是否与一
: 个已知的体系自洽。Einstein的相对论是一个假说，这个假说被验证了很多年来看是不
: 是和实际观察有冲突。量子力学也是一个假说（或模型），据我的理解，量子力学还是
: 没有完全与物理的其他部分完全吻合。本人非物理人士，一知半解，业余见解而已。

d***a
发帖数: 13752

验证假设会不会过时我不知道。大数据就是一个新名词，不要为之过于激动。:)

了。
minded

【在 t********7 的大作中提到】

C***t
发帖数: 915

从你的这段话看出，原来你之所以反对hypothesis，就是觉得它是没有什么根据的瞎猜
瞎碰。不知你有没有听过一句话，“现实比小说更荒谬”。比如上面说的星中星，是根
据已知的某些双体旋转系统灭亡的规律，进行计算推断后得出的必然结论。不懂行的瞎
编都不知道怎么编。
我一直觉得，discovery没什么了不起。大自然造好了，你发现了而已。能够推出看似
狂妄的假设，最终却被现实验证，那才是人类是智慧生物的表现。
We are the true miracle of the universe!

【在 t********7 的大作中提到】

: 这跟古代巫师求雨，结果真下雨了，有啥区别？没有求到的就不提了，求到了就说巫师
: 很灵。人类的arrogance决定了人类只关注自己的正确，而忽略自己的错误。

t********7
发帖数: 2691

问题是，大多数的假设都没啥建设性，很多就是像前面的ID 说的那样，在现有的框架
中玩个文字游戏，自娱自乐而已。
真像爱因斯坦那样的理论学家，什么大数据和实验都是衬托而已。即便如此，如你说的
“能够推出看似: 狂妄的假设，最终却被现实验证，那才是人类是智慧生物的表现。”
，也无非就是为了彰显自己的聪明（就是我说的self-correctness），远远看来，实
在很好笑。

【在 C***t 的大作中提到】

: 从你的这段话看出，原来你之所以反对hypothesis，就是觉得它是没有什么根据的瞎猜
: 瞎碰。不知你有没有听过一句话，“现实比小说更荒谬”。比如上面说的星中星，是根
: 据已知的某些双体旋转系统灭亡的规律，进行计算推断后得出的必然结论。不懂行的瞎
: 编都不知道怎么编。
: 我一直觉得，discovery没什么了不起。大自然造好了，你发现了而已。能够推出看似
: 狂妄的假设，最终却被现实验证，那才是人类是智慧生物的表现。
: We are the true miracle of the universe!

相关主题
● 对方chair电话来邀请onsite interview的时候我好像提了些过分要求	● future research
● 请教如何写postdoc fellowship的proposal	● 终于体会到什么是politics
● 有关chalk talk的准备	● 怎样对待 arrogant Ph.D. students
进入Faculty版参与讨论

C***t
发帖数: 915

你活得太束缚自己了！

【在 t********7 的大作中提到】

: 问题是，大多数的假设都没啥建设性，很多就是像前面的ID 说的那样，在现有的框架
: 中玩个文字游戏，自娱自乐而已。
: 真像爱因斯坦那样的理论学家，什么大数据和实验都是衬托而已。即便如此，如你说的
: “能够推出看似: 狂妄的假设，最终却被现实验证，那才是人类是智慧生物的表现。”
: ，也无非就是为了彰显自己的聪明（就是我说的self-correctness），远远看来，实
: 在很好笑。

t********7
发帖数: 2691

不懂您啥意思。我怎么束缚自己了？

【在 C***t 的大作中提到】

: 你活得太束缚自己了！

c*******h
发帖数: 1096

且不说 hypothesis testing 在各个具体背景下的重要意义，就这一概念而言，它本身
是一个严谨的科学态度，不应该有异议。Hypothesis testing 跟大数据这两个概念，
本身就是 apples and oranges，没有可比性。如果非要从科学观去评论，我倒要批评
一下趋之若鹜的大数据研究。就像 Michael Jordan 说的，大家看到大数据、深度学习
等热门课题一下子造就了很多应用，提高了很多预测准确率，却忽略了数字背后的可靠
性，没有一个好的理论框架去解释为什么一个方法 work 或者不 work，这是极端危险
的。
举一个具备理工背景的人都懂的例子，线性回归。我们看 Wikipedia 的这张图：
https://en.wikipedia.org/wiki/Linear_regression#/media/File:Anscombe%27s_
quartet_3.svg
线性回归做的事情就是给你一堆点，你把大致通过这堆点的直线斜率和截距算出来。现
成的软件到处都有，最傻瓜的只需要你按一下按键结果就出来了。但是很明显，上面这
张图只有左上角的那个情况最 make sense。看到其它情况你的第一反应很有可能是：
那些点根本就不在一条线上嘛。是的，你的直觉很对。我们深入一点，用统计的语言解
释一下为什你的直觉很对。线性回归基于一个假设：数据点离直线的距离呈独立同方差
正态分布。除了左上角的情形，其它情形明显都不满足这个假设。这就是 hypothesis
testing 的重要性：你不单止要会套公式算线性回归，还要回头去检查一下做线性回归
是否 make sense。这跟你有多少数据无关；多少数据你都得检查。
诚然，hypothesis testing 不是任何情况都能做的。例如，它同样受 curse of
dimensionality 的约束。这个约束在大数据时代有现实意义。大数据不一定是数据量
大，也有可能是维度高。在这种情况下，无论数据量有多大都不足以对分布进行足够的
采样。例如1000维的数据，即使每个维度只有两个取值，其样本空间总共就有2^1000个
取值（约等于1后面有300个零）。这样盲目做 hypothesis testing 不一定有意义。但
至少你总得说些什么。不是一个“大数据”砸下来做借口就什么都不用干了。例如你要
做预测，那除了算预测值之外你还得给一个置信区间。置信区间怎么来？置信区间是基
于分布假设的，在基于正态分布的假设下你就得有一个 likelihood 的值。不然你说明
天下雨，也不说百分之多少的可能性，谁信呐。你预测说 A 股下个礼拜会跌破3000点
，也不告诉别人你基于什么 model 算的，这个 model 有多可靠，那谁会听你的呀。

了。
minded

【在 t********7 的大作中提到】

e****s
发帖数: 1125

真心不懂：大数据导出的结果难道不用验证吗？大数据里找出来的规律结果本身不就是
一个Hypothesis吗？难道数据矿里挖出来就是真理了？

t********7
发帖数: 2691

ls各位说的不无道理，但是依然是攻击大数据的陈词滥调。我并不是说大数据要代替
hypothesis testing，大数据的确不是一个完美的研究方法，但是即使大数据不代替，
也会有别的方法来代替。因为hypothesis testing的局限性是不可忽视的。ls各位忙着
攻击大数据，但是没有人address hypothesis testing的limitation，比如我原帖中的
这段话。之所以没有人来讨论这个缺陷，就是因为这个缺陷是众所周知的，但是正是大
家为了defend self-correctness，谁都心知肚明，谁都不敢拿到台面来说。
“这种科研思想其实是助长了科研人员的arrogance，鼓励他们基于成见去限定研究的
问题，僵化了他们的脑袋。基本上还没有做实验，他们脑子里就已经有了既定的假设，
这是一种open-minded，尊重客观事实的做研究的态度吗？而且很多人就是为了维护
self-correctness不惜代
价，严重扭曲了科学研究的严肃性。”
我听说有的领域，一些模型和理论已经被证明是错的了，但是因为老的模型和理论养活
了支持该理论的无数徒子徒孙，支撑着无数的funding，那些证明理论错误的发现，就
被刻意打压和忽视。我想大家都听说过类似的事情，也许不知不觉中已经助纣为虐了。
新事物的出现总是会面对很多质疑。大数据也是一样。然而科学研究这个本该日新月异
的领域，却经常远远落后于工业界，难道不是一帮老顽固思维僵化的缘故吗？

b********r
发帖数: 12

It is classic statistics versus Bayesian

d***a
发帖数: 13752

这是胡说八道，乱扣帽子吧。:)

【在 t********7 的大作中提到】

: ls各位说的不无道理，但是依然是攻击大数据的陈词滥调。我并不是说大数据要代替
: hypothesis testing，大数据的确不是一个完美的研究方法，但是即使大数据不代替，
: 也会有别的方法来代替。因为hypothesis testing的局限性是不可忽视的。ls各位忙着
: 攻击大数据，但是没有人address hypothesis testing的limitation，比如我原帖中的
: 这段话。之所以没有人来讨论这个缺陷，就是因为这个缺陷是众所周知的，但是正是大
: 家为了defend self-correctness，谁都心知肚明，谁都不敢拿到台面来说。
: “这种科研思想其实是助长了科研人员的arrogance，鼓励他们基于成见去限定研究的
: 问题，僵化了他们的脑袋。基本上还没有做实验，他们脑子里就已经有了既定的假设，
: 这是一种open-minded，尊重客观事实的做研究的态度吗？而且很多人就是为了维护
: self-correctness不惜代

r******9
发帖数: 2632

"not even wrong"
Stop wasting time on this bullshit.

t********7
发帖数: 2691

不知所云。不知道您这样怎么给学生讲课呢。

【在 r******9 的大作中提到】

: "not even wrong"
: Stop wasting time on this bullshit.

g*k
发帖数: 1797

这么高深的讨论，长见识了，谢谢。

相关主题
● 科学理论	● 关于job talk的问题
● 关于推荐信的问题	● 怎么应付公立学校里懒惰又arrogant的staff们？
● 想请教大家一个棘手的问题	● 刚审完几个NSF proposal,发现亚裔写的比老美好
进入Faculty版参与讨论

P*S
发帖数: 381

呵呵，楼主先给大家科普一下大数据，再进行比较好不好？给你一堆数据，几个T或者
更多，你心目中的大数据怎么下结论？怎么做推断？
这里都是明白人，如果解释清楚，大家会接受。没解释直接下结论，很难接受。

w**********t
发帖数: 334

为lz的初生牛犊不畏虎点个赞。等将来，牛犊子也变成老虎的时候，再来看看这个帖子
，一定要记得分享做老虎的感想。

w**********t
发帖数: 334

估计lz需要补一些统计101，才能理解你在讲啥 :)。

【在 c*******h 的大作中提到】

: 且不说 hypothesis testing 在各个具体背景下的重要意义，就这一概念而言，它本身
: 是一个严谨的科学态度，不应该有异议。Hypothesis testing 跟大数据这两个概念，
: 本身就是 apples and oranges，没有可比性。如果非要从科学观去评论，我倒要批评
: 一下趋之若鹜的大数据研究。就像 Michael Jordan 说的，大家看到大数据、深度学习
: 等热门课题一下子造就了很多应用，提高了很多预测准确率，却忽略了数字背后的可靠
: 性，没有一个好的理论框架去解释为什么一个方法 work 或者不 work，这是极端危险
: 的。
: 举一个具备理工背景的人都懂的例子，线性回归。我们看 Wikipedia 的这张图：
: https://en.wikipedia.org/wiki/Linear_regression#/media/File:Anscombe%27s_
: quartet_3.svg

a**z
发帖数: 1426

建议你说事情重点放在说事情，而不是喷。
你对hypothesis testing框架的批评都是对的，但是两点
1，这个框架存在的意义你不明白。
2，你的新框架（大数据）是什么，怎么就好怎么就好你没说明白。

了。
minded

【在 t********7 的大作中提到】

l********g
发帖数: 400

幼稚

了。
minded

【在 t********7 的大作中提到】

t********7
发帖数: 2691

谢谢批评，真诚接受。请您来说一下hypothesis testing框架存在的意义是什么，让俺
也长点见识。谢谢！

【在 a**z 的大作中提到】

: 建议你说事情重点放在说事情，而不是喷。
: 你对hypothesis testing框架的批评都是对的，但是两点
: 1，这个框架存在的意义你不明白。
: 2，你的新框架（大数据）是什么，怎么就好怎么就好你没说明白。
:
: 了。
: minded

C***t
发帖数: 915

呵呵，见你被围攻，于心不忍啊！
从你的昵称就可以看出，起码小我15岁。还处在表面叛逆，抗拒权威，但其实又没有底
气真正和权威对抗的年龄和阅历阶段。你可能觉得我们这些“老人”都很沉闷，按部就
班，那我就跟你说句实话，其实越老的越“反叛”，只不过我们和你们看中的东西不同
。对于表象的东西，我们早已不争，面子之类的，都无所谓。但是到了节骨眼上，有个
机会一定会把握住，一步踏到风头浪尖上，决不腿软。
“无非是彰显自己的聪明才智。”对了，只要彰显的不是愚笨就行了。有才华不必捂着。

【在 t********7 的大作中提到】

: 不懂您啥意思。我怎么束缚自己了？

t********7
发帖数: 2691

我觉得科学研究要忘记自我，如果每个人关注的都是如何表现自己，而不是研究对象本
身，这个行业跟娱乐圈有啥区别。。。。

着。

【在 C***t 的大作中提到】

: 呵呵，见你被围攻，于心不忍啊！
: 从你的昵称就可以看出，起码小我15岁。还处在表面叛逆，抗拒权威，但其实又没有底
: 气真正和权威对抗的年龄和阅历阶段。你可能觉得我们这些“老人”都很沉闷，按部就
: 班，那我就跟你说句实话，其实越老的越“反叛”，只不过我们和你们看中的东西不同
: 。对于表象的东西，我们早已不争，面子之类的，都无所谓。但是到了节骨眼上，有个
: 机会一定会把握住，一步踏到风头浪尖上，决不腿软。
: “无非是彰显自己的聪明才智。”对了，只要彰显的不是愚笨就行了。有才华不必捂着。

p********n
发帖数: 90

2nd.

【在 b********r 的大作中提到】

: It is classic statistics versus Bayesian

c*******h
发帖数: 1096

如果楼主老老实实做model selection的话，没有人会用假设检验去要挟作者的。真有
这样的事发生的话就是Bayesian派的固步自封了。说到底科研是要讲道理的。如果自己
说的话没人买帐的话，反思一下总比责骂别人要有用得多。

【在 p********n 的大作中提到】

: 2nd.

相关主题
● 郁闷，还是没有offer	● 真是搞不懂为啥一堆人在这里跳脚骂教授
● 有没有teach如何做科研的书？	● [合集] 看上个学期evaluation
● 有这样一个学生	● 我也说几句faculty interview
进入Faculty版参与讨论

l********o
发帖数: 5629

faculty就不要谈什么大数据了，大数据都是公司搞出来的，faculty根本不懂大数据。
都是一群知识僵化的老古董。

o****2
发帖数: 241

见识到真正的老成了，支持一个
Truelove小弟也让我欢乐了一把，有意思的小盆友

着。

【在 C***t 的大作中提到】

s**********e
发帖数: 33562

楼主没学过假设检验吧。真是不知所云。民科就别到这里混了。

F*P
发帖数: 3204

说得好。鼓掌。

【在 c*******h 的大作中提到】

M*****l
发帖数: 4478

科学结论必须要有可证伪性。这是仅仅依靠大数据方法难以达到的。
科学的前进需要证伪求真的逻辑过程。就好比我们的老祖宗在天文、农业、工业、医学
等领域获得了大量经验性结论也大大促进了生产力的发展，但是缺乏逻辑体系，在发展
的关键节点被西方甩开了。
大数据是很好的方法，能帮人们看到原本很难想到的hypothesis。但如果没有
hypothesis testing的辅助，那么就会像中医一样，遇到发展的瓶颈。

【在 t********7 的大作中提到】

: 谢谢批评，真诚接受。请您来说一下hypothesis testing框架存在的意义是什么，让俺
: 也长点见识。谢谢！

o****9
发帖数: 479

说得好啊。和你相比，我的功力明显不够。

【在 M*****l 的大作中提到】

: 科学结论必须要有可证伪性。这是仅仅依靠大数据方法难以达到的。
: 科学的前进需要证伪求真的逻辑过程。就好比我们的老祖宗在天文、农业、工业、医学
: 等领域获得了大量经验性结论也大大促进了生产力的发展，但是缺乏逻辑体系，在发展
: 的关键节点被西方甩开了。
: 大数据是很好的方法，能帮人们看到原本很难想到的hypothesis。但如果没有
: hypothesis testing的辅助，那么就会像中医一样，遇到发展的瓶颈。

(共1页)

进入Faculty版参与讨论

相关主题
● 怎么应付公立学校里懒惰又arrogant的staff们？	● 上午面试居然问了我的弱点是什么？
● 刚审完几个NSF proposal,发现亚裔写的比老美好	● 对方chair电话来邀请onsite interview的时候我好像提了些过分要求
● 郁闷，还是没有offer	● 请教如何写postdoc fellowship的proposal
● 有没有teach如何做科研的书？	● 有关chalk talk的准备
● 有这样一个学生	● future research
● 真是搞不懂为啥一堆人在这里跳脚骂教授	● 终于体会到什么是politics
● [合集] 看上个学期evaluation	● 怎样对待 arrogant Ph.D. students
● 我也说几句faculty interview	● 科学理论

相关话题的讨论汇总
话题: hypothesis话题: 数据话题: testing话题: 方法话题: 科研

#	版面	帖数(主题数)
-	全站	4871 (796)
1	Military	3777 (569)
2	Stock	341 (51)
3	Joke	117 (17)
4	History	116 (3)
5	Automobile	100 (9)
6	USANews	55 (9)
7	Midlife	45 (1)
8	Headline	41 (41)
9	Dreamer	33 (13)
10	FleaMarket	32 (20)
11	Living	30 (7)

boards

未名新帖统计// 7月16日

历史上的今天