t********7 发帖数: 2691 | 1 传统科学研究以验证假设为基础,不过这种思想在大数据的冲击之下,很快就要过时了。
其实hypothesis testing 是旧时代 生产效率低下的产物,那时候收集数据很难,控制
各种条件也很难,当然,分析数据的手段也很有限。所以,就形成了每次做一个实验,
每一个实验验证一个假设的科学研究方法。
可是如今时代不同了,现在的技术手段,往往可以同时采出来很多数据,跑一个程序就
可以算好几种统计运算 验证好几个假设。但是 老一辈的研究人员还受传统思想的禁锢
,经常以什么多重比较问题来攻击这些新的研究方法。
这种科研思想已经跟不上科研技术的进步了。除了效率低下以外,这种科研思想其实是
助长了科研人员的arrogance,鼓励他们基于成见去限定研究的问题,僵化了他们的脑
袋。基本上还没有做实验,他们脑子里就已经有了既定的假设,这是一种open-minded
,尊重客观事实的做研究的态度吗?而且很多人就是为了维护self-correctness不惜代
价,严重扭曲了科学研究的严肃性。这种科研思想以及执着于这种科研思想的老顽固们
,已经成为新时代科学进步的绊脚石。
在新的科研方法和大数据的冲击之下,恐怕等不到这些老一辈研究人员淡出历史舞台,
这种落后的科研思想就会慢慢被抛弃了。当然,期间还需要新一辈的科学家们多多努力
发出自己的声音。 |
o****9 发帖数: 479 | 2 我听明白了你的论点。我本人对hypothesis testing和基于大数据的方法都接受。我没
觉得这二者是互斥的,我反倒觉得这二者是相互补充的。而且,我认为一味依赖于大数
据的方法,很可能会涌现出一些fake discovery. 一个Discovery既要有对现象的观察
,也要有对观察到的现象的合理解释。大数据的方法可以帮助我们方便地看到很多原先
意想不到的现象,但对观察到的现象的合理解释还是要靠hypothesis testing。
如果你认为大数据的方法可以把knowledge discovery的过程自动化,那我觉得那是纯
忽悠了。我认为大数据的方法可以辅助传统方法,加速研究进程,但我不认为大数据的
方法会取代传统方法,
了。
【在 t********7 的大作中提到】 : 传统科学研究以验证假设为基础,不过这种思想在大数据的冲击之下,很快就要过时了。 : 其实hypothesis testing 是旧时代 生产效率低下的产物,那时候收集数据很难,控制 : 各种条件也很难,当然,分析数据的手段也很有限。所以,就形成了每次做一个实验, : 每一个实验验证一个假设的科学研究方法。 : 可是如今时代不同了,现在的技术手段,往往可以同时采出来很多数据,跑一个程序就 : 可以算好几种统计运算 验证好几个假设。但是 老一辈的研究人员还受传统思想的禁锢 : ,经常以什么多重比较问题来攻击这些新的研究方法。 : 这种科研思想已经跟不上科研技术的进步了。除了效率低下以外,这种科研思想其实是 : 助长了科研人员的arrogance,鼓励他们基于成见去限定研究的问题,僵化了他们的脑 : 袋。基本上还没有做实验,他们脑子里就已经有了既定的假设,这是一种open-minded
|
C***t 发帖数: 915 | 3 说的好呀!
再举个例子,(我不是学天文的)1975年两个天文学家预言可以有中子星(和曼哈顿大
小,顶两个太阳重)生存在red giant里面。去年真地发现了。
【在 o****9 的大作中提到】 : 我听明白了你的论点。我本人对hypothesis testing和基于大数据的方法都接受。我没 : 觉得这二者是互斥的,我反倒觉得这二者是相互补充的。而且,我认为一味依赖于大数 : 据的方法,很可能会涌现出一些fake discovery. 一个Discovery既要有对现象的观察 : ,也要有对观察到的现象的合理解释。大数据的方法可以帮助我们方便地看到很多原先 : 意想不到的现象,但对观察到的现象的合理解释还是要靠hypothesis testing。 : 如果你认为大数据的方法可以把knowledge discovery的过程自动化,那我觉得那是纯 : 忽悠了。我认为大数据的方法可以辅助传统方法,加速研究进程,但我不认为大数据的 : 方法会取代传统方法, : : 了。
|
t********7 发帖数: 2691 | 4 hypothesis testing 同样会有fake discovery。并不是说你自己能解释的就是对的,
你解释不了的就是错的。如果这样,你到底是要获取新知识,还是只是验证你已经有的
想法?
【在 o****9 的大作中提到】 : 我听明白了你的论点。我本人对hypothesis testing和基于大数据的方法都接受。我没 : 觉得这二者是互斥的,我反倒觉得这二者是相互补充的。而且,我认为一味依赖于大数 : 据的方法,很可能会涌现出一些fake discovery. 一个Discovery既要有对现象的观察 : ,也要有对观察到的现象的合理解释。大数据的方法可以帮助我们方便地看到很多原先 : 意想不到的现象,但对观察到的现象的合理解释还是要靠hypothesis testing。 : 如果你认为大数据的方法可以把knowledge discovery的过程自动化,那我觉得那是纯 : 忽悠了。我认为大数据的方法可以辅助传统方法,加速研究进程,但我不认为大数据的 : 方法会取代传统方法, : : 了。
|
t********7 发帖数: 2691 | 5 这跟古代巫师求雨,结果真下雨了,有啥区别?没有求到的就不提了,求到了就说巫师
很灵。 人类的arrogance决定了人类只关注自己的正确,而忽略自己的错误。
【在 C***t 的大作中提到】 : 说的好呀! : 再举个例子,(我不是学天文的)1975年两个天文学家预言可以有中子星(和曼哈顿大 : 小,顶两个太阳重)生存在red giant里面。去年真地发现了。
|
o****9 发帖数: 479 | 6 对呀,你说的没错,我自己的解释是否合理不是我说了算的,是要看我的解释是否与一
个已知的体系自洽。Einstein的相对论是一个假说,这个假说被验证了很多年来看是不
是和实际观察有冲突。量子力学也是一个假说(或模型),据我的理解,量子力学还是
没有完全与物理的其他部分完全吻合。本人非物理人士,一知半解,业余见解而已。
【在 t********7 的大作中提到】 : hypothesis testing 同样会有fake discovery。并不是说你自己能解释的就是对的, : 你解释不了的就是错的。如果这样,你到底是要获取新知识,还是只是验证你已经有的 : 想法?
|
t********7 发帖数: 2691 | 7 一个已知的体系依然是现有知识框架的禁锢。
比如在天圆地方的已知体系中,的确是解释不了为什么海上的船远远地只能看见船顶的
现象。但是你总不能把人家发现这个现象的小孩当成神经病吧。
新发现肯定是要挑战已知体系。不能挑战的,只能说是不怎么重要的发现。
【在 o****9 的大作中提到】 : 对呀,你说的没错,我自己的解释是否合理不是我说了算的,是要看我的解释是否与一 : 个已知的体系自洽。Einstein的相对论是一个假说,这个假说被验证了很多年来看是不 : 是和实际观察有冲突。量子力学也是一个假说(或模型),据我的理解,量子力学还是 : 没有完全与物理的其他部分完全吻合。本人非物理人士,一知半解,业余见解而已。
|
d***a 发帖数: 13752 | 8 验证假设会不会过时我不知道。大数据就是一个新名词,不要为之过于激动。:)
了。
minded
【在 t********7 的大作中提到】 : 传统科学研究以验证假设为基础,不过这种思想在大数据的冲击之下,很快就要过时了。 : 其实hypothesis testing 是旧时代 生产效率低下的产物,那时候收集数据很难,控制 : 各种条件也很难,当然,分析数据的手段也很有限。所以,就形成了每次做一个实验, : 每一个实验验证一个假设的科学研究方法。 : 可是如今时代不同了,现在的技术手段,往往可以同时采出来很多数据,跑一个程序就 : 可以算好几种统计运算 验证好几个假设。但是 老一辈的研究人员还受传统思想的禁锢 : ,经常以什么多重比较问题来攻击这些新的研究方法。 : 这种科研思想已经跟不上科研技术的进步了。除了效率低下以外,这种科研思想其实是 : 助长了科研人员的arrogance,鼓励他们基于成见去限定研究的问题,僵化了他们的脑 : 袋。基本上还没有做实验,他们脑子里就已经有了既定的假设,这是一种open-minded
|
C***t 发帖数: 915 | 9 从你的这段话看出,原来你之所以反对hypothesis,就是觉得它是没有什么根据的瞎猜
瞎碰。不知你有没有听过一句话,“现实比小说更荒谬”。比如上面说的星中星,是根
据已知的某些双体旋转系统灭亡的规律,进行计算推断后得出的必然结论。不懂行的瞎
编都不知道怎么编。
我一直觉得,discovery没什么了不起。大自然造好了,你发现了而已。能够推出看似
狂妄的假设,最终却被现实验证,那才是人类是智慧生物的表现。
We are the true miracle of the universe!
【在 t********7 的大作中提到】 : 这跟古代巫师求雨,结果真下雨了,有啥区别?没有求到的就不提了,求到了就说巫师 : 很灵。 人类的arrogance决定了人类只关注自己的正确,而忽略自己的错误。
|
t********7 发帖数: 2691 | 10 问题是,大多数的假设都没啥建设性,很多就是像前面的ID 说的那样,在现有的框架
中 玩个文字游戏,自娱自乐而已。
真像爱因斯坦那样的理论学家,什么大数据和实验都是衬托而已。即便如此,如你说的
“能够推出看似: 狂妄的假设,最终却被现实验证,那才是人类是智慧生物的表现。”
, 也无非就是为了彰显自己的聪明(就是我说的self-correctness),远远看来,实
在很好笑。
【在 C***t 的大作中提到】 : 从你的这段话看出,原来你之所以反对hypothesis,就是觉得它是没有什么根据的瞎猜 : 瞎碰。不知你有没有听过一句话,“现实比小说更荒谬”。比如上面说的星中星,是根 : 据已知的某些双体旋转系统灭亡的规律,进行计算推断后得出的必然结论。不懂行的瞎 : 编都不知道怎么编。 : 我一直觉得,discovery没什么了不起。大自然造好了,你发现了而已。能够推出看似 : 狂妄的假设,最终却被现实验证,那才是人类是智慧生物的表现。 : We are the true miracle of the universe!
|
|
|
C***t 发帖数: 915 | 11 你活得太束缚自己了!
【在 t********7 的大作中提到】 : 问题是,大多数的假设都没啥建设性,很多就是像前面的ID 说的那样,在现有的框架 : 中 玩个文字游戏,自娱自乐而已。 : 真像爱因斯坦那样的理论学家,什么大数据和实验都是衬托而已。即便如此,如你说的 : “能够推出看似: 狂妄的假设,最终却被现实验证,那才是人类是智慧生物的表现。” : , 也无非就是为了彰显自己的聪明(就是我说的self-correctness),远远看来,实 : 在很好笑。
|
t********7 发帖数: 2691 | 12 不懂您啥意思。我怎么束缚自己了?
【在 C***t 的大作中提到】 : 你活得太束缚自己了!
|
c*******h 发帖数: 1096 | 13 且不说 hypothesis testing 在各个具体背景下的重要意义,就这一概念而言,它本身
是一个严谨的科学态度,不应该有异议。Hypothesis testing 跟大数据这两个概念,
本身就是 apples and oranges,没有可比性。如果非要从科学观去评论,我倒要批评
一下趋之若鹜的大数据研究。就像 Michael Jordan 说的,大家看到大数据、深度学习
等热门课题一下子造就了很多应用,提高了很多预测准确率,却忽略了数字背后的可靠
性,没有一个好的理论框架去解释为什么一个方法 work 或者不 work,这是极端危险
的。
举一个具备理工背景的人都懂的例子,线性回归。我们看 Wikipedia 的这张图:
https://en.wikipedia.org/wiki/Linear_regression#/media/File:Anscombe%27s_
quartet_3.svg
线性回归做的事情就是给你一堆点,你把大致通过这堆点的直线斜率和截距算出来。现
成的软件到处都有,最傻瓜的只需要你按一下按键结果就出来了。但是很明显,上面这
张图只有左上角的那个情况最 make sense。看到其它情况你的第一反应很有可能是:
那些点根本就不在一条线上嘛。是的,你的直觉很对。我们深入一点,用统计的语言解
释一下为什你的直觉很对。线性回归基于一个假设:数据点离直线的距离呈独立同方差
正态分布。除了左上角的情形,其它情形明显都不满足这个假设。这就是 hypothesis
testing 的重要性:你不单止要会套公式算线性回归,还要回头去检查一下做线性回归
是否 make sense。这跟你有多少数据无关;多少数据你都得检查。
诚然,hypothesis testing 不是任何情况都能做的。例如,它同样受 curse of
dimensionality 的约束。这个约束在大数据时代有现实意义。大数据不一定是数据量
大,也有可能是维度高。在这种情况下,无论数据量有多大都不足以对分布进行足够的
采样。例如1000维的数据,即使每个维度只有两个取值,其样本空间总共就有2^1000个
取值(约等于1后面有300个零)。这样盲目做 hypothesis testing 不一定有意义。但
至少你总得说些什么。不是一个“大数据”砸下来做借口就什么都不用干了。例如你要
做预测,那除了算预测值之外你还得给一个置信区间。置信区间怎么来?置信区间是基
于分布假设的,在基于正态分布的假设下你就得有一个 likelihood 的值。不然你说明
天下雨,也不说百分之多少的可能性,谁信呐。你预测说 A 股下个礼拜会跌破3000点
,也不告诉别人你基于什么 model 算的,这个 model 有多可靠,那谁会听你的呀。
了。
minded
【在 t********7 的大作中提到】 : 传统科学研究以验证假设为基础,不过这种思想在大数据的冲击之下,很快就要过时了。 : 其实hypothesis testing 是旧时代 生产效率低下的产物,那时候收集数据很难,控制 : 各种条件也很难,当然,分析数据的手段也很有限。所以,就形成了每次做一个实验, : 每一个实验验证一个假设的科学研究方法。 : 可是如今时代不同了,现在的技术手段,往往可以同时采出来很多数据,跑一个程序就 : 可以算好几种统计运算 验证好几个假设。但是 老一辈的研究人员还受传统思想的禁锢 : ,经常以什么多重比较问题来攻击这些新的研究方法。 : 这种科研思想已经跟不上科研技术的进步了。除了效率低下以外,这种科研思想其实是 : 助长了科研人员的arrogance,鼓励他们基于成见去限定研究的问题,僵化了他们的脑 : 袋。基本上还没有做实验,他们脑子里就已经有了既定的假设,这是一种open-minded
|
e****s 发帖数: 1125 | 14 真心不懂:大数据导出的结果难道不用验证吗?大数据里找出来的规律结果本身不就是
一个Hypothesis吗?难道数据矿里挖出来就是真理了? |
t********7 发帖数: 2691 | 15 ls各位说的不无道理,但是依然是攻击大数据的陈词滥调。我并不是说大数据要代替
hypothesis testing,大数据的确不是一个完美的研究方法,但是即使大数据不代替,
也会有别的方法来代替。因为hypothesis testing的局限性是不可忽视的。ls各位忙着
攻击大数据,但是没有人address hypothesis testing的limitation,比如我原帖中的
这段话。之所以没有人来讨论这个缺陷,就是因为这个缺陷是众所周知的,但是正是大
家为了defend self-correctness,谁都心知肚明,谁都不敢拿到台面来说。
“这种科研思想其实是助长了科研人员的arrogance,鼓励他们基于成见去限定研究的
问题,僵化了他们的脑袋。基本上还没有做实验,他们脑子里就已经有了既定的假设,
这是一种open-minded,尊重客观事实的做研究的态度吗?而且很多人就是为了维护
self-correctness不惜代
价,严重扭曲了科学研究的严肃性。”
我听说有的领域,一些模型和理论已经被证明是错的了,但是因为老的模型和理论养活
了支持该理论的无数徒子徒孙,支撑着无数的funding,那些证明理论错误的发现,就
被刻意打压和忽视。我想大家都听说过类似的事情,也许不知不觉中已经助纣为虐了。
新事物的出现总是会面对很多质疑。大数据也是一样。然而科学研究这个本该日新月异
的领域,却经常远远落后于工业界,难道不是一帮老顽固思维僵化的缘故吗? |
b********r 发帖数: 12 | 16 It is classic statistics versus Bayesian |
d***a 发帖数: 13752 | 17 这是胡说八道,乱扣帽子吧。:)
【在 t********7 的大作中提到】 : ls各位说的不无道理,但是依然是攻击大数据的陈词滥调。我并不是说大数据要代替 : hypothesis testing,大数据的确不是一个完美的研究方法,但是即使大数据不代替, : 也会有别的方法来代替。因为hypothesis testing的局限性是不可忽视的。ls各位忙着 : 攻击大数据,但是没有人address hypothesis testing的limitation,比如我原帖中的 : 这段话。之所以没有人来讨论这个缺陷,就是因为这个缺陷是众所周知的,但是正是大 : 家为了defend self-correctness,谁都心知肚明,谁都不敢拿到台面来说。 : “这种科研思想其实是助长了科研人员的arrogance,鼓励他们基于成见去限定研究的 : 问题,僵化了他们的脑袋。基本上还没有做实验,他们脑子里就已经有了既定的假设, : 这是一种open-minded,尊重客观事实的做研究的态度吗?而且很多人就是为了维护 : self-correctness不惜代
|
r******9 发帖数: 2632 | 18 "not even wrong"
Stop wasting time on this bullshit. |
t********7 发帖数: 2691 | 19 不知所云。不知道您这样怎么给学生讲课呢。
【在 r******9 的大作中提到】 : "not even wrong" : Stop wasting time on this bullshit.
|
g*k 发帖数: 1797 | |
|
|
P*S 发帖数: 381 | 21 呵呵,楼主先给大家科普一下大数据,再进行比较好不好?给你一堆数据,几个T或者
更多,你心目中的大数据怎么下结论?怎么做推断?
这里都是明白人,如果解释清楚,大家会接受。没解释直接下结论,很难接受。 |
w**********t 发帖数: 334 | 22 为lz的初生牛犊不畏虎点个赞。等将来,牛犊子也变成老虎的时候,再来看看这个帖子
,一定要记得分享做老虎的感想。 |
w**********t 发帖数: 334 | 23 估计lz需要补一些统计101,才能理解你在讲啥 :)。
【在 c*******h 的大作中提到】 : 且不说 hypothesis testing 在各个具体背景下的重要意义,就这一概念而言,它本身 : 是一个严谨的科学态度,不应该有异议。Hypothesis testing 跟大数据这两个概念, : 本身就是 apples and oranges,没有可比性。如果非要从科学观去评论,我倒要批评 : 一下趋之若鹜的大数据研究。就像 Michael Jordan 说的,大家看到大数据、深度学习 : 等热门课题一下子造就了很多应用,提高了很多预测准确率,却忽略了数字背后的可靠 : 性,没有一个好的理论框架去解释为什么一个方法 work 或者不 work,这是极端危险 : 的。 : 举一个具备理工背景的人都懂的例子,线性回归。我们看 Wikipedia 的这张图: : https://en.wikipedia.org/wiki/Linear_regression#/media/File:Anscombe%27s_ : quartet_3.svg
|
a**z 发帖数: 1426 | 24 建议你说事情重点放在说事情,而不是喷。
你对hypothesis testing框架的批评都是对的,但是两点
1,这个框架存在的意义你不明白。
2,你的新框架(大数据)是什么,怎么就好怎么就好你没说明白。
了。
minded
【在 t********7 的大作中提到】 : 传统科学研究以验证假设为基础,不过这种思想在大数据的冲击之下,很快就要过时了。 : 其实hypothesis testing 是旧时代 生产效率低下的产物,那时候收集数据很难,控制 : 各种条件也很难,当然,分析数据的手段也很有限。所以,就形成了每次做一个实验, : 每一个实验验证一个假设的科学研究方法。 : 可是如今时代不同了,现在的技术手段,往往可以同时采出来很多数据,跑一个程序就 : 可以算好几种统计运算 验证好几个假设。但是 老一辈的研究人员还受传统思想的禁锢 : ,经常以什么多重比较问题来攻击这些新的研究方法。 : 这种科研思想已经跟不上科研技术的进步了。除了效率低下以外,这种科研思想其实是 : 助长了科研人员的arrogance,鼓励他们基于成见去限定研究的问题,僵化了他们的脑 : 袋。基本上还没有做实验,他们脑子里就已经有了既定的假设,这是一种open-minded
|
l********g 发帖数: 400 | 25 幼稚
了。
minded
【在 t********7 的大作中提到】 : 传统科学研究以验证假设为基础,不过这种思想在大数据的冲击之下,很快就要过时了。 : 其实hypothesis testing 是旧时代 生产效率低下的产物,那时候收集数据很难,控制 : 各种条件也很难,当然,分析数据的手段也很有限。所以,就形成了每次做一个实验, : 每一个实验验证一个假设的科学研究方法。 : 可是如今时代不同了,现在的技术手段,往往可以同时采出来很多数据,跑一个程序就 : 可以算好几种统计运算 验证好几个假设。但是 老一辈的研究人员还受传统思想的禁锢 : ,经常以什么多重比较问题来攻击这些新的研究方法。 : 这种科研思想已经跟不上科研技术的进步了。除了效率低下以外,这种科研思想其实是 : 助长了科研人员的arrogance,鼓励他们基于成见去限定研究的问题,僵化了他们的脑 : 袋。基本上还没有做实验,他们脑子里就已经有了既定的假设,这是一种open-minded
|
t********7 发帖数: 2691 | 26 谢谢批评,真诚接受。请您来说一下hypothesis testing框架存在的意义是什么,让俺
也长点见识。谢谢!
【在 a**z 的大作中提到】 : 建议你说事情重点放在说事情,而不是喷。 : 你对hypothesis testing框架的批评都是对的,但是两点 : 1,这个框架存在的意义你不明白。 : 2,你的新框架(大数据)是什么,怎么就好怎么就好你没说明白。 : : 了。 : minded
|
C***t 发帖数: 915 | 27 呵呵,见你被围攻,于心不忍啊!
从你的昵称就可以看出,起码小我15岁。还处在表面叛逆,抗拒权威,但其实又没有底
气真正和权威对抗的年龄和阅历阶段。你可能觉得我们这些“老人”都很沉闷,按部就
班,那我就跟你说句实话,其实越老的越“反叛”,只不过我们和你们看中的东西不同
。对于表象的东西,我们早已不争,面子之类的,都无所谓。但是到了节骨眼上,有个
机会一定会把握住,一步踏到风头浪尖上,决不腿软。
“无非是彰显自己的聪明才智。”对了,只要彰显的不是愚笨就行了。有才华不必捂着。
【在 t********7 的大作中提到】 : 不懂您啥意思。我怎么束缚自己了?
|
t********7 发帖数: 2691 | 28 我觉得科学研究要忘记自我,如果每个人关注的都是如何表现自己,而不是研究对象本
身,这个行业跟娱乐圈有啥区别。。。。
着。
【在 C***t 的大作中提到】 : 呵呵,见你被围攻,于心不忍啊! : 从你的昵称就可以看出,起码小我15岁。还处在表面叛逆,抗拒权威,但其实又没有底 : 气真正和权威对抗的年龄和阅历阶段。你可能觉得我们这些“老人”都很沉闷,按部就 : 班,那我就跟你说句实话,其实越老的越“反叛”,只不过我们和你们看中的东西不同 : 。对于表象的东西,我们早已不争,面子之类的,都无所谓。但是到了节骨眼上,有个 : 机会一定会把握住,一步踏到风头浪尖上,决不腿软。 : “无非是彰显自己的聪明才智。”对了,只要彰显的不是愚笨就行了。有才华不必捂着。
|
p********n 发帖数: 90 | 29 2nd.
【在 b********r 的大作中提到】 : It is classic statistics versus Bayesian
|
c*******h 发帖数: 1096 | 30 如果楼主老老实实做model selection的话,没有人会用假设检验去要挟作者的。真有
这样的事发生的话就是Bayesian派的固步自封了。说到底科研是要讲道理的。如果自己
说的话没人买帐的话,反思一下总比责骂别人要有用得多。
【在 p********n 的大作中提到】 : 2nd.
|
|
|
l********o 发帖数: 5629 | 31 faculty就不要谈什么大数据了,大数据都是公司搞出来的,faculty根本不懂大数据。
都是一群知识僵化的老古董。 |
o****2 发帖数: 241 | 32 见识到真正的老成了,支持一个
Truelove小弟也让我欢乐了一把,有意思的小盆友
着。
【在 C***t 的大作中提到】 : 呵呵,见你被围攻,于心不忍啊! : 从你的昵称就可以看出,起码小我15岁。还处在表面叛逆,抗拒权威,但其实又没有底 : 气真正和权威对抗的年龄和阅历阶段。你可能觉得我们这些“老人”都很沉闷,按部就 : 班,那我就跟你说句实话,其实越老的越“反叛”,只不过我们和你们看中的东西不同 : 。对于表象的东西,我们早已不争,面子之类的,都无所谓。但是到了节骨眼上,有个 : 机会一定会把握住,一步踏到风头浪尖上,决不腿软。 : “无非是彰显自己的聪明才智。”对了,只要彰显的不是愚笨就行了。有才华不必捂着。
|
s**********e 发帖数: 33562 | 33 楼主没学过假设检验吧。真是不知所云。民科就别到这里混了。 |
F*P 发帖数: 3204 | 34 说得好。鼓掌。
【在 c*******h 的大作中提到】 : 且不说 hypothesis testing 在各个具体背景下的重要意义,就这一概念而言,它本身 : 是一个严谨的科学态度,不应该有异议。Hypothesis testing 跟大数据这两个概念, : 本身就是 apples and oranges,没有可比性。如果非要从科学观去评论,我倒要批评 : 一下趋之若鹜的大数据研究。就像 Michael Jordan 说的,大家看到大数据、深度学习 : 等热门课题一下子造就了很多应用,提高了很多预测准确率,却忽略了数字背后的可靠 : 性,没有一个好的理论框架去解释为什么一个方法 work 或者不 work,这是极端危险 : 的。 : 举一个具备理工背景的人都懂的例子,线性回归。我们看 Wikipedia 的这张图: : https://en.wikipedia.org/wiki/Linear_regression#/media/File:Anscombe%27s_ : quartet_3.svg
|
M*****l 发帖数: 4478 | 35 科学结论必须要有可证伪性。这是仅仅依靠大数据方法难以达到的。
科学的前进需要证伪求真的逻辑过程。就好比我们的老祖宗在天文、农业、工业、医学
等领域获得了大量经验性结论也大大促进了生产力的发展,但是缺乏逻辑体系,在发展
的关键节点被西方甩开了。
大数据是很好的方法,能帮人们看到原本很难想到的hypothesis。但如果没有
hypothesis testing的辅助,那么就会像中医一样,遇到发展的瓶颈。
【在 t********7 的大作中提到】 : 谢谢批评,真诚接受。请您来说一下hypothesis testing框架存在的意义是什么,让俺 : 也长点见识。谢谢!
|
o****9 发帖数: 479 | 36 说得好啊。和你相比,我的功力明显不够。
【在 M*****l 的大作中提到】 : 科学结论必须要有可证伪性。这是仅仅依靠大数据方法难以达到的。 : 科学的前进需要证伪求真的逻辑过程。就好比我们的老祖宗在天文、农业、工业、医学 : 等领域获得了大量经验性结论也大大促进了生产力的发展,但是缺乏逻辑体系,在发展 : 的关键节点被西方甩开了。 : 大数据是很好的方法,能帮人们看到原本很难想到的hypothesis。但如果没有 : hypothesis testing的辅助,那么就会像中医一样,遇到发展的瓶颈。
|