由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
CS版 - frequentist vs bayesian
相关主题
graphical model, n-gram, HMM...包子求助,转Artificial Intelligence
就业-数据分析?data analyst问一个概率表述问题
这里有人研究神经网络的吗?帮忙找一篇paper
PRM中Bayesian Parameter Estimation的问题Probabilistic Relational Models 搞什么的啊
computer vision/pattern recognition - Probabilistic framework code问一个 information retrieval 问题。。。
machine learning vs data mining courses谁来谈谈connectionism和computationalism
牛人很神奇的简历啊PHD opening in Univ. of South Carolina EECS
哪位大侠谈谈 Bayesian 公式吧。求paper 下载
相关话题的讨论汇总
话题: bayesian话题: 模型话题: ml话题: 统计
进入CS版参与讨论
1 (共1页)
d*****u
发帖数: 17243
1
统计里面有这两大阵营。
在自然科学和社会科学领域,长期以来几乎是frequentist的天下,
好多做实验的人对bayesian analysis一无所知
而计算机专业好多人似乎一点也不懂frequentist的东西
有的连基本的t-test, anova都不知道
人工智能里的模型也确实都是bayesian的东西
大家怎么看
j****a
发帖数: 1277
2
you are talking about stats and machine learning, which are simply two
subjects

【在 d*****u 的大作中提到】
: 统计里面有这两大阵营。
: 在自然科学和社会科学领域,长期以来几乎是frequentist的天下,
: 好多做实验的人对bayesian analysis一无所知
: 而计算机专业好多人似乎一点也不懂frequentist的东西
: 有的连基本的t-test, anova都不知道
: 人工智能里的模型也确实都是bayesian的东西
: 大家怎么看

d*****u
发帖数: 17243
3
machine learning绝大部分是基于bayesian statistics的
但是bayesian的方法不限于ML
两者有些东西当然是一样的,比如研究各种概率分布
但是基本出发点不太一样

【在 j****a 的大作中提到】
: you are talking about stats and machine learning, which are simply two
: subjects

p*********g
发帖数: 226
4
> machine learning绝大部分是基于bayesian statistics的
这话可不能随便讲,有人要介意的。。。

【在 d*****u 的大作中提到】
: machine learning绝大部分是基于bayesian statistics的
: 但是bayesian的方法不限于ML
: 两者有些东西当然是一样的,比如研究各种概率分布
: 但是基本出发点不太一样

f*****x
发帖数: 2748
5
Bayesian的文章越来越多了,好处是花不多时间了解一个问题,然后计算机帮助你干活
了。Bayesian出起文章来是多快
好省。估计以后统计/ML是Bayesian的天下了。

【在 d*****u 的大作中提到】
: 统计里面有这两大阵营。
: 在自然科学和社会科学领域,长期以来几乎是frequentist的天下,
: 好多做实验的人对bayesian analysis一无所知
: 而计算机专业好多人似乎一点也不懂frequentist的东西
: 有的连基本的t-test, anova都不知道
: 人工智能里的模型也确实都是bayesian的东西
: 大家怎么看

d*****u
发帖数: 17243
6
bayesian计算量比较大,但是我觉得更有意思,
因为很多时候体现了人的思维过程,或者可以想象出其中的物理背景
而传统的统计,真的比较boring

【在 f*****x 的大作中提到】
: Bayesian的文章越来越多了,好处是花不多时间了解一个问题,然后计算机帮助你干活
: 了。Bayesian出起文章来是多快
: 好省。估计以后统计/ML是Bayesian的天下了。

N**D
发帖数: 10322
7
对,Bayesian出文章快,花个graphical model, inference 一下,就好
frequencist 难

【在 f*****x 的大作中提到】
: Bayesian的文章越来越多了,好处是花不多时间了解一个问题,然后计算机帮助你干活
: 了。Bayesian出起文章来是多快
: 好省。估计以后统计/ML是Bayesian的天下了。

r********3
发帖数: 2998
8
计算机专业研究的问题更底层一些,更实在一些。比如说,计算机方向研究了几十年的
,数据库技术,搜索引擎,输入和输出的规则都是很明确的,但是你如何做得好?如何
做得快??
而统计里面,对于数据的解释很抽象,从来不考虑这个数据是怎么存的,怎么取得,怎
么算的,仿佛一切的数据都是随手一抓随手一挥就成了的。
现实世界里面,并不需要那么虚幻的分析。因为统计里面总是想用一种model去仿真,
但是现实世界太复杂了,于是很难让人相信。实际需求里面,你能把现实世界最基本的
数据查询,数据搜索问题解决好,就已经很了不起了。比如说,Oracle的数据库,
Google的搜索引擎。

【在 d*****u 的大作中提到】
: 统计里面有这两大阵营。
: 在自然科学和社会科学领域,长期以来几乎是frequentist的天下,
: 好多做实验的人对bayesian analysis一无所知
: 而计算机专业好多人似乎一点也不懂frequentist的东西
: 有的连基本的t-test, anova都不知道
: 人工智能里的模型也确实都是bayesian的东西
: 大家怎么看

p*********g
发帖数: 226
9
有一种统计叫 nonparametrics

【在 r********3 的大作中提到】
: 计算机专业研究的问题更底层一些,更实在一些。比如说,计算机方向研究了几十年的
: ,数据库技术,搜索引擎,输入和输出的规则都是很明确的,但是你如何做得好?如何
: 做得快??
: 而统计里面,对于数据的解释很抽象,从来不考虑这个数据是怎么存的,怎么取得,怎
: 么算的,仿佛一切的数据都是随手一抓随手一挥就成了的。
: 现实世界里面,并不需要那么虚幻的分析。因为统计里面总是想用一种model去仿真,
: 但是现实世界太复杂了,于是很难让人相信。实际需求里面,你能把现实世界最基本的
: 数据查询,数据搜索问题解决好,就已经很了不起了。比如说,Oracle的数据库,
: Google的搜索引擎。

r********3
发帖数: 2998
10
对,很多machine learning并非都是基于这个。
我现在review很多ML的paper,已经很反感那种probabilistic model的paper了。主要
是因为,他们各自总是提出自己的model,然后paper就是如何去estimate这个
probability。感觉就是在一中虚拟假定的世界里面去推导一堆虚拟的结果。实际试验
结果,都是很值得商榷的。
举个极端的例子。学统计的人来解决地震预测的问题,做法就是计算这样现象,那样现
象等等和地震发生的这样那样的probabilities,最后推导出一个整体的conditional
probability。
但是,这样的结果根本无法得到真正地震学,地质学家的认可。因为统计模型,始终是
在用表现去总结表现。我们需要的是掌握不变的自然现象的本质和问题的本质,而不是
随机的表现。如果你掌握了真正的自然规律,世界上任何一件事情都不是一个随机过程
,而是有根可循的。作为一个地质学家,最重要的贡献就是在于发现这个可循的根。
如果人类可以在有生之年,真正深入地球内部,勘探出地幔的物理化学结构,然后测量
出月球引力或者,地热温度如何影响地幔的物理和化学变化,从而了解地震发生的真正
原因。这个才是真正地质学上的贡献。

【在 p*********g 的大作中提到】
: > machine learning绝大部分是基于bayesian statistics的
: 这话可不能随便讲,有人要介意的。。。

相关主题
machine learning vs data mining courses包子求助,转Artificial Intelligence
牛人很神奇的简历啊问一个概率表述问题
哪位大侠谈谈 Bayesian 公式吧。帮忙找一篇paper
进入CS版参与讨论
d*****u
发帖数: 17243
11
我觉得这是两个领域的问题
比如现在从预报地震的角度出发,要弄清地质运动的规律显然是不现实的。
但是如果能把各种表现特征综合起来建立联系
弄清他们之间的统计规律
这不失为一种好办法
人家也不会claim这就取代了地球物理的研究
最多是取代了一些预报的方法
就像医生看病,也是先根据各种症状来推测病因
然后再去做化验或者透视
而根据症状推测病因的过程其实就是统计分析,只是现在没那么量化
说到底,ML是一种engineering

【在 r********3 的大作中提到】
: 对,很多machine learning并非都是基于这个。
: 我现在review很多ML的paper,已经很反感那种probabilistic model的paper了。主要
: 是因为,他们各自总是提出自己的model,然后paper就是如何去estimate这个
: probability。感觉就是在一中虚拟假定的世界里面去推导一堆虚拟的结果。实际试验
: 结果,都是很值得商榷的。
: 举个极端的例子。学统计的人来解决地震预测的问题,做法就是计算这样现象,那样现
: 象等等和地震发生的这样那样的probabilities,最后推导出一个整体的conditional
: probability。
: 但是,这样的结果根本无法得到真正地震学,地质学家的认可。因为统计模型,始终是
: 在用表现去总结表现。我们需要的是掌握不变的自然现象的本质和问题的本质,而不是

d*****u
发帖数: 17243
12
如果你掌握了真正的自然规律,世界上任何一件事情都不是一个随机过程
,而是有根可循的。
——————————
这个还真不好说。拿物理来说,deterministic的规律只存在于经典物理理论。
具体说就是经典力学和电磁学。连热学都不行。

【在 r********3 的大作中提到】
: 对,很多machine learning并非都是基于这个。
: 我现在review很多ML的paper,已经很反感那种probabilistic model的paper了。主要
: 是因为,他们各自总是提出自己的model,然后paper就是如何去estimate这个
: probability。感觉就是在一中虚拟假定的世界里面去推导一堆虚拟的结果。实际试验
: 结果,都是很值得商榷的。
: 举个极端的例子。学统计的人来解决地震预测的问题,做法就是计算这样现象,那样现
: 象等等和地震发生的这样那样的probabilities,最后推导出一个整体的conditional
: probability。
: 但是,这样的结果根本无法得到真正地震学,地质学家的认可。因为统计模型,始终是
: 在用表现去总结表现。我们需要的是掌握不变的自然现象的本质和问题的本质,而不是

r********3
发帖数: 2998
13
我只是打个比喻。我的意思是,科学研究应该尽量去挖掘期中不变的本质和规律。不要
过多依赖从数据表现去分析问题和解释问题。而是应该深入现象的本质,去解释其内在
规律。当然,如果从一种数据分析方法学的角度来研究,也是可以的。但是不要过分夸
大ML在现实中的用处,它在实际当中现实问题上的贡献其实很小。所以说,从很多很多
ML的paper实验结果,都是值得商榷的。以地震研究来说,研究各种fancy的统计模型,
还不如老老实实研究一下抗高压高热的打井转头。

【在 d*****u 的大作中提到】
: 如果你掌握了真正的自然规律,世界上任何一件事情都不是一个随机过程
: ,而是有根可循的。
: ——————————
: 这个还真不好说。拿物理来说,deterministic的规律只存在于经典物理理论。
: 具体说就是经典力学和电磁学。连热学都不行。

N**D
发帖数: 10322
14
同反感

【在 r********3 的大作中提到】
: 对,很多machine learning并非都是基于这个。
: 我现在review很多ML的paper,已经很反感那种probabilistic model的paper了。主要
: 是因为,他们各自总是提出自己的model,然后paper就是如何去estimate这个
: probability。感觉就是在一中虚拟假定的世界里面去推导一堆虚拟的结果。实际试验
: 结果,都是很值得商榷的。
: 举个极端的例子。学统计的人来解决地震预测的问题,做法就是计算这样现象,那样现
: 象等等和地震发生的这样那样的probabilities,最后推导出一个整体的conditional
: probability。
: 但是,这样的结果根本无法得到真正地震学,地质学家的认可。因为统计模型,始终是
: 在用表现去总结表现。我们需要的是掌握不变的自然现象的本质和问题的本质,而不是

d*****u
发帖数: 17243
15
我感觉这个ML的思路在心理学里应该很有用。
现在也有人在做。但是真正完全渗透过去还得些年头。

【在 r********3 的大作中提到】
: 我只是打个比喻。我的意思是,科学研究应该尽量去挖掘期中不变的本质和规律。不要
: 过多依赖从数据表现去分析问题和解释问题。而是应该深入现象的本质,去解释其内在
: 规律。当然,如果从一种数据分析方法学的角度来研究,也是可以的。但是不要过分夸
: 大ML在现实中的用处,它在实际当中现实问题上的贡献其实很小。所以说,从很多很多
: ML的paper实验结果,都是值得商榷的。以地震研究来说,研究各种fancy的统计模型,
: 还不如老老实实研究一下抗高压高热的打井转头。

d******e
发帖数: 7844
16
你的逻辑很神奇。
Probabilistic Models又不是解决问题的唯一方法,自然有它适用的范围,像图像和文
本,这种通常被认为存在一个generative process或者近似的generative process,我
用Bayesian有什么可指责的?什么问题都拿来套用当然不行,很多人乱做model,只能说
他们不严肃,并不是Probabilistic models有什么错。
同样,统计也不是什么问题都能解决,你这种极端的例子说白了就是抬杠。你去看看生
物里面传统的t检验管不管用?我需要的是解决问题,我管你本质的model是什么样,我
就这么建模,行得通就OK了。先解决问题,再去探讨本质,这种风格随处可见。
Machine Learning和统计都是工具罢了,能不能真正解决问题不是看工具灵不灵,而是
看用工具的人。
btw:把SVM只当成QP的同学,还是不要对机器学习来妄加评论了,呵呵

【在 r********3 的大作中提到】
: 对,很多machine learning并非都是基于这个。
: 我现在review很多ML的paper,已经很反感那种probabilistic model的paper了。主要
: 是因为,他们各自总是提出自己的model,然后paper就是如何去estimate这个
: probability。感觉就是在一中虚拟假定的世界里面去推导一堆虚拟的结果。实际试验
: 结果,都是很值得商榷的。
: 举个极端的例子。学统计的人来解决地震预测的问题,做法就是计算这样现象,那样现
: 象等等和地震发生的这样那样的probabilities,最后推导出一个整体的conditional
: probability。
: 但是,这样的结果根本无法得到真正地震学,地质学家的认可。因为统计模型,始终是
: 在用表现去总结表现。我们需要的是掌握不变的自然现象的本质和问题的本质,而不是

h*i
发帖数: 3446
17
ML就是最初从认知心理学里面引发出来的, 所以不存在渗透过去的问题。
主观Bayesian的方法用在其他科学都可以,用在心理学上就是本末倒置:因为主观
Bayesian(e.g. E.T. Jaynes那一套)就是一种思维方法,本身正是心理学需要解释的
对象。所以,在心理学里面,Bayesian学派虽然近年势头有一些回升,但总归还是不被
主流接受的。

【在 d*****u 的大作中提到】
: 我感觉这个ML的思路在心理学里应该很有用。
: 现在也有人在做。但是真正完全渗透过去还得些年头。

h*i
发帖数: 3446
18
你忘了ALL YOUR BAYES ARE BELONG TO US!

【在 d*****u 的大作中提到】
: machine learning绝大部分是基于bayesian statistics的
: 但是bayesian的方法不限于ML
: 两者有些东西当然是一样的,比如研究各种概率分布
: 但是基本出发点不太一样

d*****u
发帖数: 17243
19
讨论起源没有意义
计算机的很多(如果不是所有)算法都可以说来自于人的思维过程。
包括最简单的排序、查找这些都是。
但是在计算机这个领域发展了以后,就成为解决各种问题的工具,
包括cognitive modeling
比如普通的心理学家并不清楚怎么构造一个bayes net
也不知道怎么train
而他们如果对此工具有熟练的掌握
那就可以解决一些问题
还有基于bayes方法的模型并不限于bayes net
还有markov random field这些
我感觉有时候都可以用来构造模型(也有人用了)
总之各学科多互相了解是有好处的

【在 h*i 的大作中提到】
: ML就是最初从认知心理学里面引发出来的, 所以不存在渗透过去的问题。
: 主观Bayesian的方法用在其他科学都可以,用在心理学上就是本末倒置:因为主观
: Bayesian(e.g. E.T. Jaynes那一套)就是一种思维方法,本身正是心理学需要解释的
: 对象。所以,在心理学里面,Bayesian学派虽然近年势头有一些回升,但总归还是不被
: 主流接受的。

h*i
发帖数: 3446
20
搞认知科学的要熟悉学科历史才行,否则不明白各种学说的来龙去脉,容易产生错误认
识。
Bayesian的心理模型在八十年代左右被认为是失败了,这是为什么现在的“普通的心理
学家并不清楚怎么构造一个bayes net”的原因,没有很多人愿意花功夫在失败的理论
上面。被认为失败的原因主要是基于Tversky, Kaheman等人的工作, 发现人的判断推
理过程不符合Bayes定理,而是有一些biases的, 这两人因此获得了经济学炸药奖。在
那以后,认知心理学里面的一个流行的事情就是找出一种又一种的bias来。
好了,现在为什么Bayesian模型又有抬头之势呢?一个就是很多人对biases很厌倦了,
层出不穷的biases搞得好像人的思维完全就是irrational的,没有什么理论能解释一样
,这和心理学的宏大科学目标也不合拍。所以有些心理学家又开始搞Bayesian模型了,
特别是一些年轻人,比如Griffiths, Tenenbaum等人,都经常在NIPS之类的会上灌水的
。第二个原因和Bayesian在ML流行一样,就是计算技术发展使得Bayesian模型有了可行
性。
但是,Bayesian模型的根本问题在于它不提供一个心理过程的模型,这样就很难让很多
心理学家满意,所以在心理学里面总归会是一个比较小众的东西。过去一些坚持搞的人
基本都脱离心理学了,比如搞Graphic Model的那个有名的Michael Jordan.

【在 d*****u 的大作中提到】
: 讨论起源没有意义
: 计算机的很多(如果不是所有)算法都可以说来自于人的思维过程。
: 包括最简单的排序、查找这些都是。
: 但是在计算机这个领域发展了以后,就成为解决各种问题的工具,
: 包括cognitive modeling
: 比如普通的心理学家并不清楚怎么构造一个bayes net
: 也不知道怎么train
: 而他们如果对此工具有熟练的掌握
: 那就可以解决一些问题
: 还有基于bayes方法的模型并不限于bayes net

相关主题
Probabilistic Relational Models 搞什么的啊PHD opening in Univ. of South Carolina EECS
问一个 information retrieval 问题。。。求paper 下载
谁来谈谈connectionism和computationalism求书: An Introduction to Probabilistic Graphical Models by (转载)
进入CS版参与讨论
d*****u
发帖数: 17243
21
任何model都不可能account for all attributes。否则就不是model而是description。
至于说bias,一方面可以考虑prior,另一方面可以增加连接的复杂度(如果需要的话
)。换言之,人不是计算机,所以受记忆等因素的影响很大。但是这些都是基本模型的
augment而已,都是可以数学实现的。而因为这些附加原因就放弃整个model的方法是可
笑的。

【在 h*i 的大作中提到】
: 搞认知科学的要熟悉学科历史才行,否则不明白各种学说的来龙去脉,容易产生错误认
: 识。
: Bayesian的心理模型在八十年代左右被认为是失败了,这是为什么现在的“普通的心理
: 学家并不清楚怎么构造一个bayes net”的原因,没有很多人愿意花功夫在失败的理论
: 上面。被认为失败的原因主要是基于Tversky, Kaheman等人的工作, 发现人的判断推
: 理过程不符合Bayes定理,而是有一些biases的, 这两人因此获得了经济学炸药奖。在
: 那以后,认知心理学里面的一个流行的事情就是找出一种又一种的bias来。
: 好了,现在为什么Bayesian模型又有抬头之势呢?一个就是很多人对biases很厌倦了,
: 层出不穷的biases搞得好像人的思维完全就是irrational的,没有什么理论能解释一样
: ,这和心理学的宏大科学目标也不合拍。所以有些心理学家又开始搞Bayesian模型了,

d*****u
发帖数: 17243
22
但是,Bayesian模型的根本问题在于它不提供一个心理过程的模型
h*i
发帖数: 3446
23
This kind of thinking is what give modelers bad names. If modelers do not
themselves set the bar high, why should expect people to take them seriously?

description。

【在 d*****u 的大作中提到】
: 任何model都不可能account for all attributes。否则就不是model而是description。
: 至于说bias,一方面可以考虑prior,另一方面可以增加连接的复杂度(如果需要的话
: )。换言之,人不是计算机,所以受记忆等因素的影响很大。但是这些都是基本模型的
: augment而已,都是可以数学实现的。而因为这些附加原因就放弃整个model的方法是可
: 笑的。

h*i
发帖数: 3446
24
I agree with you on this one. Unfortunately, most psychologists do not.

【在 d*****u 的大作中提到】
: 但是,Bayesian模型的根本问题在于它不提供一个心理过程的模型
1 (共1页)
进入CS版参与讨论
相关主题
求paper 下载computer vision/pattern recognition - Probabilistic framework code
求书: An Introduction to Probabilistic Graphical Models by (转载)machine learning vs data mining courses
招收计算机硕士学生(University of Texas-Pan American) (转载)牛人很神奇的简历啊
求教machine learning的基础材料哪位大侠谈谈 Bayesian 公式吧。
graphical model, n-gram, HMM...包子求助,转Artificial Intelligence
就业-数据分析?data analyst问一个概率表述问题
这里有人研究神经网络的吗?帮忙找一篇paper
PRM中Bayesian Parameter Estimation的问题Probabilistic Relational Models 搞什么的啊
相关话题的讨论汇总
话题: bayesian话题: 模型话题: ml话题: 统计