发帖数: 1 | 1 “概率”一词,已无孔不入地侵入现代人生活的方方面面,装NB也好、扮SB也罢,就像
当年有人喜欢把U盘挂在胸前乱晃,把似懂非懂的“概率”挂在嘴边已成一种时尚。
人生,不过是一场确定性死亡的概率游戏?
这个清明节出了点意外,这么说吧,那一刻有很大的概率要与科学网永远了,上帝保佑
!清明思故人,大学同窗可舟兄生前曾感叹:“上帝开了我个天大的玩笑!”,大名鼎
鼎的霍金有个中国学生叫吴忠超(霍金科普著作的中译本,几乎都是他的杰作),可舟
兄在美国与吴忠超做了N年面对面邻居,M年后,却不幸得了与霍金一模一样的病,以概
率的语言,这算中头彩吧?
前些日子,死气沉沉的科学网好似恢复了一丁点人气,XX帮与YXX帮因张天蓉博主的博
文《概率论悖论》而纠缠厮杀,双方火拼的根本原因是《概率论悖论》中的贝叶斯概率
例子:
王宏去医院作验血实验,检查他患上了X疾病的可能性,其结果居然为阳性,把他吓了
一大跳,赶忙到网上查询。网上的资料说,实验总是有误差的,这种实验有“百分之一
的假阳性率和百分之一的假阴性率”。这句话的意思是说,在得病的人中做实验,有1%
的人是假阳性,99%的人是真阳性。而在未得病的人中做实验,... 阅读全帖 |
|
s******y 发帖数: 17729 | 2 你这个先验概率假设的不对,不应该以投诉了来设定先验概率,因为对于老张,投诉了
,比如像这次这样,丫就直接挂了,没有第二次机会,如果以100次来说的话,只要有一
次老张就挂,而真实的先验概率是老张得手了,而没有被发现的概率,所以这个只有老
张知道。前面那个谁说的对,先验概率无法设定 |
|
z********n 发帖数: 59 | 3 我是做system的,对概率不大熟悉.
最近看论文,虽然自己恶补了一点知识,但还是有很多疑问,希望大家帮我解答一下.
论文中是对一个N维的向量求先验分布,其中每一个维度都是时间t。
文章做出了推断:
1.每个维度都符合正态分布。然后因为维度是时间t,所以假设了每个维度的均值都符
合InvGamma(1,1)分布.
2.下面推算协方差矩阵:由于共轭的条件不符合,没办法使用InvWishart分布来进行推算
3.改成使用Gibbs sampler来生成先验分布
4.又假设每个维度正太分布的方差符合InvGamma(1,1),最后用循环来不断生成矩阵,直
到满足正定性退出
5.生成矩阵的时候,相关系数使用GenBeta(-1,1,1,1)来生成,即(-1,1)的范围,参数
为(1,1)的Beta分布
我对这5点都存有疑问:
1.InvGamma(1,1)分布是范围>0的什么分布啊?为什么要用(1,1)呢?
2.共轭的条件不符合:解释是不能总是获得实际数据,共轭必须满足什么条件啊?
3.在这种条件下可以使用Gibbs sampler生成先验分布吗?我查了一下,要有概率转移
矩阵才可以使用Gib... 阅读全帖 |
|
z********n 发帖数: 59 | 4 我是做system的,对概率不大熟悉.
最近看论文,虽然自己恶补了一点知识,但还是有很多疑问,希望大家帮我解答一下.
论文中是对一个N维的向量求先验分布,其中每一个维度都是时间t。
文章做出了推断:
1.每个维度都符合正态分布。然后因为维度是时间t,所以假设了每个维度的均值都符
合InvGamma(1,1)分布.
2.下面推算协方差矩阵:由于共轭的条件不符合,没办法使用InvWishart分布来进行推算
3.改成使用Gibbs sampler来生成先验分布
4.又假设每个维度正太分布的方差符合InvGamma(1,1),最后用循环来不断生成矩阵,直
到满足正定性退出
5.生成矩阵的时候,相关系数使用GenBeta(-1,1,1,1)来生成,即(-1,1)的范围,参数
为(1,1)的Beta分布
我对这5点都存有疑问:
1.InvGamma(1,1)分布是范围>0的什么分布啊?为什么要用(1,1)呢?
2.共轭的条件不符合:解释是不能总是获得实际数据,共轭必须满足什么条件啊?
3.在这种条件下可以使用Gibbs sampler生成先验分布吗?我查了一下,要有概率转移
矩阵才可以使用Gib... 阅读全帖 |
|
b*****g 发帖数: 919 | 5 P(E|AB)=1/2 是先验概率
P(E|AB)=3/7 是后验概率
P(E|任意两个)=3/7 先验后验都一样
染色会改变先验概率 |
|
B********4 发帖数: 7156 | 6 能用贝叶斯定理来推导后验概率,是因为已知先验概率。
P(A|B)=P(B|A)*P(A)/P(B)
P(B|A)是性侵了法院判有罪的概率. 你就是能接触所有文件,也不能知道是不是真性侵
。 要能知道,那岂不是100%无冤案?
P(A)是已知老张这个情况(但不知道判决结果)他真犯罪的概率。这个不就是本版争论
最大的概率吗?有人说不可能,概率是0.01,有人说非常可能,概率是0.99.
P(B)是历史上象老张这个情况,陪审团判有罪的概率。这个靠搜索记录是有可能查到的
,但谁有这个本事去调查?
楼主的先验概率都是自己瞎猜的,所以结果也就是和瞎猜一样,没有任何意义。我也可
以瞎猜一个
P(B|A): 相信美国陪审团冤案不太高, 给0.8;
P(A): 这个是最难的。既然网友的观点对半分,给0.5;
P(B): 美国陪审团在证据比较弱的情况下判性侵有罪的概率。既然谁都不知道,公平起
见给0.5;
所以最后P(A)=0.8 张真性侵的概率为80%。 |
|
r******e 发帖数: 244 | 7 【 以下文字转载自 EE 讨论区 】
发信人: realhire (realhire), 信区: EE
标 题: [求助] 使用MCMC方法和卡尔曼滤波求后验概率遇到一些问题求助
发信站: BBS 未名空间站 (Wed May 8 16:14:26 2013, 美东)
我的问题是这样的:
意志一个系统状态X的先验分布为N(mu, sigma),和测量更新方程: Z=HX+V,
H为线性矩阵,V为测量噪声,设为normal分布. 要求X的后验概率密度.
我使用了两种方法:
1 基于random walking 的MCMC方法, 但是这个方法求的后验概率的均值和方差都很不
稳定. 我已经使用超过100万次的转移,效果还是不理想. 我用的是M_H的方法,求解一个
未知参数为二维的问题, 转移概率 : 后验概率~先验概率*likehood函数.
2 所以我想通过卡尔曼滤波的方法,求的这个后验概率的真实的均值和方差, 以下是我
的结论:
E(X_hat)=(I-K*H)*E(X)+ K*Z
Cox(X_hat)=(I-K*H)*Cov(X)*(I-K*H)' +K*Cov(Z)*K'
K=C... 阅读全帖 |
|
r******e 发帖数: 244 | 8 我的问题是这样的:
意志一个系统状态X的先验分布为N(mu, sigma),和测量更新方程: Z=HX+V,
H为线性矩阵,V为测量噪声,设为normal分布. 要求X的后验概率密度.
我使用了两种方法:
1 基于random walking 的MCMC方法, 但是这个方法求的后验概率的均值和方差都很不
稳定. 我已经使用超过100万次的转移,效果还是不理想. 我用的是M_H的方法,求解一个
未知参数为二维的问题, 转移概率 : 后验概率~先验概率*likehood函数.
2 所以我想通过卡尔曼滤波的方法,求的这个后验概率的真实的均值和方差, 以下是我
的结论:
E(X_hat)=(I-K*H)*E(X)+ K*Z
Cox(X_hat)=(I-K*H)*Cov(X)*(I-K*H)' +K*Cov(Z)*K'
K=Cov(X)*H'*(H*Cov(X)*H+Cov(Z))^-1
K是卡尔曼滤波增益, X_hat表示后验值. 用这个公式算出的均值和方差和MCMC方法在先
验概率均值为0时,基本一致.
但均值如果不为零,则结果不符合.
求各位卡尔曼高手,说说,我这个推导有问题么? 还有MC... 阅读全帖 |
|
q****8 发帖数: 3281 | 9 先验概率本就是个人不同的,只要有理有据就行,又没逼着你用我的先验概率。 |
|
q****8 发帖数: 3281 | 10 来点干货,用概率论来推测老张犯案的可能性。
有人声称:“都判25年了,还没性侵吗?” 还有人说:“法官,律师,陪审团,那么
多人还没你一个人聪明?”一些大妈大叔太感情用事,代入感太强。我不能说他们中没
人是经过理性分析,觉得老张真的性侵的可能性大,但大多数人是看到判了25年,而且
美国法律流程完善,所以认定老张性侵属实。也就是说,你们根据老张被判有罪这一事
实,来推论老张性侵属实。
现在用贝叶斯定理来解释一下,让大妈大叔看看这个逻辑是多么可笑。贝叶斯定理是大
多概率统计书里第一章的内容,有些放在第二第三章,不信或不懂我说的可以去参考教
科书。
事件A:老张性侵属实
事件B:老张被判有罪
事件B是已知发生事件,现在要考虑P(A|B),也就是基于老张被判25年的事实,问老张性
侵属实的概率是多少。
P(A|B)= P(B|A)*P(A)/P(B)
P(B|A):
这是基于老张性侵属实的事实,问老张被判有罪的概率是多少?性侵案件属实的话通常
会留下DNA等铁证,如果没有铁证,通常会有辅佐证据,以及合理的被害人论述,外加
陪审团同情小女孩的因素,这个概率会是很高,我给个95%。
-------... 阅读全帖 |
|
j****i 发帖数: 68152 | 11 来点干货,用概率论来推测老张犯案的可能性。
有人声称:“都判25年了,还没性侵吗?” 还有人说:“法官,律师,陪审团,那么
多人还没你一个人聪明?”一些大妈大叔太感情用事,代入感太强。我不能说他们中没
人是经过理性分析,觉得老张真的性侵的可能性大,但大多数人是看到判了25年,而且
美国法律流程完善,所以认定老张性侵属实。也就是说,你们根据老张被判有罪这一事
实,来推论老张性侵属实。
现在用贝叶斯定理来解释一下,让大妈大叔看看这个逻辑是多么可笑。贝叶斯定理是大
多概率统计书里第一章的内容,有些放在第二第三章,不信或不懂我说的可以去参考教
科书。
事件A:老张性侵属实
事件B:老张被判有罪
事件B是已知发生事件,现在要考虑P(A|B),也就是基于老张被判25年的事实,问老张性
侵属实的概率是多少。
P(A|B)= P(B|A)*P(A)/P(B)
P(B|A):
这是基于老张性侵属实的事实,问老张被判有罪的概率是多少?性侵案件属实的话通常
会留下DNA等铁证,如果没有铁证,通常会有辅佐证据,以及合理的被害人论述,外加
陪审团同情小女孩的因素,这个概率会是很高,我给个95%。
-------... 阅读全帖 |
|
n******s 发帖数: 1523 | 12 以下的都是先验概率(a priori)。主要是因为后验概率依赖于对出过的牌的解读。不
同的人得出的概率也就千差万别。
1)庄没红A,首出K被对方的Ace 拍死的概率多大?答案是~ 2/3。
以下三种情况K死了 (对家天绝的情况被忽视了):
a)下家一张红A, 概率是 (25/75 * 50/74 )*2 ~= 4/9
b)下家2张 红A,概率是 (25/75 * 24/74) ~= 1/9
c)下家没红A,对家也没红A,概率是 (1 - 4/9 - 1/9)* (25/50 * 24/49) ~= 1
/9
合起来大概,4/9+1/9+1/9 = 2/3。
2)庄没红A,首攻10,这个计算太复杂了。还要涉及到K,Q, J的分布。不过如果假设
那些的概率小到可以忽略不计(肯定是小的,没有算过到底多小)。假设也是被A拍死
的话,概率也就差不多2/3了。
3)庄没红A,首冲KK,悲剧的概率多大? 这个要简单些,就是下家或上家有AA的时候:
1/9*2 ~ = 2/9。 |
|
h***c 发帖数: 12 | 13 一点理解,也不知道对不
我对这5点都存有疑问:
1.InvGamma(1,1)分布是范围>0的什么分布啊?为什么要用(1,1)呢?
如果 x 是 invgamma(1,1),那 1/x 是exponential(1).
用(1,1)的原因可能是1,简单,2,pdf相对平滑,能够cover a large range with
decent probability.
2.共轭的条件不符合:解释是不能总是获得实际数据,共轭必须满足什么条件啊?
似乎是说有些data不是normal,而是truncated normal。这种条件下用wishart也不共轭
3.在这种条件下可以使用Gibbs sampler生成先验分布吗?我查了一下,要有概率转移
矩阵才可以使用Gibbs sampler吧?
不是用gibbs sampler生成prior。
文章是说既然不共轭,就不能直接用wishart来得到posterior samples。需要gibbs来
做。跟prior的生成没有关系
4.为什么可以这么循环呢,协方差矩阵里面的初始值是怎么产生的呢?
diagonal的值从invgamma sample... 阅读全帖 |
|
z********n 发帖数: 59 | 14 谢谢啊 终于有人指导我了
抛去这些不说,我在想,如果我全部的先验都设成均匀分布怎么样,结果肯定会影响很
大吧
我看了Gibbs sampler,我不明白在这个Gibbs sampler里面, 什么是初始状态,什么
是转移矩阵
还有一个问题,如果让你重新设计一次,你会怎么设计呢?
这里面还有一个关键点,"Inspection Paradox",因为这一点,他把所有的时间信息都
加了进来,组成了一个相当大的向量。如果这么说的话,在任何一个时刻进行观察,都
有可能发生"Inspection Paradox",也就是说所有bayesian概率计算的时候,都可以把
时间信息加进去吗?
再次感谢你!
distribution
covariances. |
|
X****r 发帖数: 3557 | 15 你这个1/3,2/3不对吧。
假设:
1.这个unknown是boy还是girl的先验概率各为1/2。
2.护士在六个小孩中随机挑选一个领走,概率各为1/6。
3.(1)和(2)独立。
已知:
i.护士领走的是boy。
求:
在(i)下unknown为boy的后验概率。
在(1)-(3)假设下,此概率空间包含12种状态,各为1/12概率:
123456
B+++---
G++----
其中1-6代表小孩序号,B和G代表unknown为boy或girl的情况,
+代表boy,-代表girl
由上图可见,护士领走boy的概率是5/12。已知这个事件已经发生,
在这个5里面,B占3/5,G占2/5。也就是unknown为boy的后验概率
是3/5。 |
|
n******s 发帖数: 1523 | 16 苹果这个算的是错的,不过也差不多。其实我以前帖过,不过估计没人注意。
1)2个A是一样的,要当不一样也行,不过最后所有的数字都加倍,不会改变概率。
2)具体算法如下: 剩余3家75张牌 - 也就是75个坑,每家25个。第一个A落第2家的可
能性是25/75 = 1/3。在第一个A落第2家的情况下,第2个A落第2家的可能性是24/74。
所以第2家有AA的概率是(25/75)* (24/74) ~= 1/9。同理第4家AA的概率是大约1/9。
加一块,KK被敌人抓的概率约等于2/9。
3)这个只是先验概率。更有用的是后验概率,要用到城城提到的bayesian,通俗的说
就是老邢的发牌器可能有bias,这样的话KK被AA抓的可能性就不知道是多少了,除非谁
去统计下。 |
|
B********4 发帖数: 7156 | 17 贝叶斯定理是为了解释一个新的知识(P(B)判有罪)出来以后,对之前的先验概率(
P(A)老张犯罪了)应该怎样修正。
修正因子P(B|A)/P(B)也有時被稱作標准相似度(standardised likelihood),贝叶斯
定理可表述為:
后驗概率 = 標准相似度*先驗概率
基于我们都同意这样一个假设:美国冤案率还没超过50%。所以这个修正肯定是会在P(A
)基础上提高。所以P(A)(在不知道审判结果的情况下老张犯罪概率)其实非常关键,
而这个其实就是争论最大的地方。 |
|
m*****t 发帖数: 16663 | 18 你没有变量,你算个屁的概率。
你说说你的先验概率是多少?你知道AI赢李的概率有多大吗?
你怎么玩被噎死?
啊? |
|
h***i 发帖数: 3844 | 19 来,解释一下这句话
这是老张性侵小女孩的先验概率,也就是在陪审团宣判前,预估的老张犯案的概率。
这个概率为什么需要在陪审团宣判前? |
|
|
u******d 发帖数: 166 | 21 我只看了第一题,我就觉得第一题的答案不对,应该是1/8.
"Karen heard from her classmate Maggie, that Mrs. Smith has two kids."
Maggie有可能说的是假话,也有可能说的是真话。=》50%
如果她说的是真话,那两个女孩的概率是 =》50%×50%
先验概率算乘积,所以答案是50%×50%×50% = 12.5% |
|
|
h*****0 发帖数: 4889 | 23 老大……
P(E)才是先验概率好不好……
P(E|AB)就是指在AB这个事件发生的前提下E的概率。 |
|
M**S 发帖数: 3483 | 24 先验概率你自己定咯,合理就行。变量还需要我给么?自己不知道该以哪个作啊?你这
水平,也就适合做做小学应用题,什么都告诉你了,一步出结果。 |
|
m*****t 发帖数: 16663 | 25 你真搞笑。
我可以认为机器必胜可以吗?
没有先验概率,什么结果都可以有。 |
|
m*****t 发帖数: 16663 | 26 你要别人自己根据统计数据生成先验概率是可以的。
但只有一局的数据是绝对不行的。
我对你的智力底线很服气了。 |
|
T****t 发帖数: 11162 | 27 靠,你就是拿那个先验概率骗人的。
要是100次了,还会失手吗。 |
|
m**i 发帖数: 9848 | 28 楼主算P(A)的方法确实不太靠谱。
可以把老张就当个普通人,用“因为猥亵儿童罪上庭的人里面有多少人是真的干过坏事
”这个作为一个比较靠谱的先验概率。 |
|
m**i 发帖数: 9848 | 29 我认为,你的计算其实最重要的是P(B)
如果按照大家认为的,美国法律制度的优越性之一:证据弱的情况下大多数时候都判无
罪,本案证据又很弱(我不了解,貌似版上共识),那么P(B)作为先验概率,就应该相
当小,小于0.1。除非你认为美国法律是狗屎,即使证据很弱的情况下,都有70%的可能
被抓去坐牢,P(B)才可能等于0.7。 |
|
X****r 发帖数: 3557 | 30 这四种情况的先验概率是不一样的。
直接不考虑小孩的顺序是错的。 |
|
s*m 发帖数: 6980 | 31 在已知一个小孩叫Jessica的前提下, 你说说那四种情况的先验概率怎么不一样了? |
|
s*m 发帖数: 6980 | 32 我又想了想这个先验概率的事情, 在这四种样本空间中.
P(男 Jessica)=P (女 Jessica)
P(Jessica 男)=P (Jessica 女)
你觉得呢? |
|
z***f 发帖数: 159 | 33 裸K要不要出,如果你知道上家AAK10, 下家10, 你出不出。
算了,还是先扔鸡蛋把先验概率搞清楚吧 |
|
l********k 发帖数: 613 | 34 不能算指导,就是讨论吧。
如果prior设成都是uniform distribution,我不知道结果会不会差别很大,我倾向于相
信结果应该相差不大。我做过几个Project为了simplify,很多prior都假设成为
uniform distribution的。你如果非常感兴趣,你可以自己实验一下,然后来说说结果。
Gibbs sampler的初始sample值都是随机选择的或者用其他的heuristic(如果有的话)
设定的吧。转移矩阵里面的值应该是conditional probabilities.
第一次看到inspection paradox,挺有趣的,看了下别人的blog,对你的问题的回答是
不能千篇一律的把用bayesian的概率算法都加上时间,这种现象发生在当你在inspect
一个process之中的一个时间点/段的时候,所以我认为,当你在看整个process的时候
,计算marginal probability的时候不必要把时间也包含进去做adjustment。 |
|
v*******l 发帖数: 5042 | 35 ☆─────────────────────────────────────☆
poof (plan de vida) 于 (Tue Feb 11 16:26:36 2014, 美东) 提到:
简单的说,这个问题的实质在于持枪自伤的概率更大还是帮助自己脱险的概率更大。
美国的持枪自杀率比凶杀率高了一个量级,所以不难得出结论,自伤的风险更高。数据
也是这么说的。
但是为什么很多人觉得持枪更安全呢?
有个类似的问题: 开车安全还是坐飞机安全? 从概率上来说,飞机安全多了。现在
这是大家的共识,但是很多人还是觉得自己开车更安全...为什么会有这种现象呢?
这个心理学现象,是缘于人总是觉得自己能支配的事情更安全...被别人支配很不爽。
还有一个心理现象:人总是有觉得自己与众不同..所以经常会有人说,我开车肯定没
事,我玩枪肯定没事,我是例外。 但是统计表明,人都很类似,例外的人远远小于自
信的人.就好比相信自己种彩票的人总是大大多于实际中彩票的人。
虽这么说,有枪的同学还是别过于担心,因为自杀的概率虽然比凶杀高个量级,但是也
不算高。自杀也就美国第10大死因吧(前面死因的除了车祸,其... 阅读全帖 |
|
C*******r 发帖数: 10345 | 36 这里面有统计学的一个根本哲学问题在里面:概率到底是主观的还是客观的。一般频率
学派认为是客观的,而贝叶斯学派认为是主观的。
从先验后验角度讲,如果俺认为在自己决策问题上先验概率对俺无意义,只有后验有意
义,那么确实无法反驳。比如说明天下不下雨的概率:客观派认为这个概率是相同气象
条件的天的群体出现雨的频率;主观派认为由于气象条件极其复杂,根本没有什么气象
条件完全相同的两天,所以讨论这种频率无意义,这个概率就是一个主观估计。
这两派别都有一定道理,一般普通人觉得频率派道理大,但是如果经过仔细思考,频率
派哲学确实大有问题。比如说人这个群体,真的有完全相同的人吗?每个人自杀的概率
都一样吗?显然不是。在自我角度来说,使用先验概率做决策明显是不正确的,因为自
我不是人这个群体的一个随机抽样。所以这个概率对统计员有意义,对个人决策无意义。 |
|
d**0 发帖数: 984 | 37 我不是那个意思。
如果你知道先验概率,比如十年中出一个天才的概率是一亿分之一,那么你估算我国可
能一年出一个天才。
但问题是你不知道先验概率啊。那么怎么估算先验概率呢,如果你观察地球十万年,出
了一万个天才,你可以大概得出十年出一个。
问题是你有可能一千年内一个天才也看不到,别说30年了。你不能根据这个说天才的概
率是多少,你的样本根本不够。
这还只是他论证中的一个小错误。更大的错误是我前面说的偷换概念。 |
|
m*******y 发帖数: 148 | 38 增加这么一个因素也许能使原模型变简单,但问题是还要计算进来神自身的先验概率…
… 姑且先不说没有客观的直接证据证明神存在,即使只是算其概率,由于神必须比其
创造物更复杂,先验概率会比原模型更小(越复杂的模型先验概率越小)……
总之科学范围内神的假设确实不是很有力的。
最后那句话反过来也是一样啊 :) 真理唯一不唯一不好说,我个人的想法是尽量减少先
验的部分,尽可能实事求是喽。 |
|
T*******I 发帖数: 5138 | 39 归根到底,任何统计方法实质上是一个测量工具或尺度。同样,一个先验前提(例如先
验概率)的假定也就是在该前提所在的尺度上的一个或几个点的决定。如果这个先验前
提是一个连续尺度,例如概率,那么,选择这个假定的先验概率的概率等于0, 除非你
有了充分的经验事实作为选择的支持。
说到底,统计是认识未知世界,如果你没有掌握关于未知世界的一个“真实表象”或样
本,无论谁也没有能力完成一个统计认知。你不可以说,如果前提是……,那么结论就
是……。这样的话等于没有说,因为你没有可能性来确定你的前提是否成立。
从频率主义者的角度出发,我们需要样本,但结论不是关于样本本身的直接描述,而是
样本背后的总体的估计。一个人可以把样本本身描绘得100%精确,但关于总体的结论却
并非如此。这就是随机误差的估计与推断的逻辑前提。
总之,现代统计学的理论和方法起源于由培根创立的大不列颠经验主义哲学体系,而非
欧洲大陆理性主义哲学系统。而频率主义正是继承了大不列颠经验主义哲学体系,而
Bayesian者从认识论的根源上属于欧洲大陆的理性主义哲学系统。事实上,统计学的
发展本身是为了解决经验主义哲学体系而非理性主义哲学系统 |
|
f****0 发帖数: 835 | 40 对《韩寒代笔探讨:强质疑、弱质疑、和忽悠》一文意见的简要回复
尽管收到了很多回复和信件,但由于这篇文章本来就是写着玩的,所以不准备一一回复
了。写个公开的回复吧。
1.来信收到
有人指出,标题顿号用错了。谢谢:)
还有人说这篇貌似公允云云。我文章开头就写了,由于大家关心站队,为了防止大
家说我“公允,各打50大板”之类的废话,所以我对此事的判断在文章一开始就列出了
:从目前的证据看,韩寒长篇和竞赛作品代笔可能性非常小,善意推定的话,韩寒早期
作品和博客,也应该是他自己的作品。
尤其是说《三重门》是韩仁均代笔的,其荒谬程度就好像指证墨武的《武林高手在
校园》是金庸代笔的一样,装中立都显得很搞笑。大家是没看过《三重门》还是怎么着
?是不是以为是部巨作啊?完全不理解。这只是当年各种中学校园笑话段子、动漫、流
行歌曲横行的一本畅销书而已。上次的文章发出后,有人来信问我的文章里“卧石答春
绿”是什么意思?这是一个中学笑话段子,韩寒在《三重门》中用来讽刺读死书的人。
有人问“Wait and See”是什么意思,这是90年代初中期的热门动画片《兔子,等着瞧
》每集都有的片头... 阅读全帖 |
|
h*******y 发帖数: 304 | 41 对《韩寒代笔探讨:强质疑、弱质疑、和忽悠》一文意见的简要回复ZZ
破破的桥
尽管收到了很多回复和信件,但由于这篇文章本来就是写着玩的,所以不准备一一回复
了。写个公开的回复吧。
1.来信收到
有人指出,标题顿号用错了。谢谢:)
还有人说这篇貌似公允云云。我文章开头就写了,由于大家关心站队,为了防止大
家说我“公允,各打50大板”之类的废话,所以我对此事的判断在文章一开始就列出了
:从目前的证据看,韩寒长篇和竞赛作品代笔可能性非常小,善意推定的话,韩寒早期
作品和博客,也应该是他自己的作品。
尤其是说《三重门》是韩仁均代笔的,其荒谬程度就好像指证墨武的《武林高手在
校园》是金庸代笔的一样,装中立都显得很搞笑。大家是没看过《三重门》还是怎么着
?是不是以为是部巨作啊?完全不理解。这只是当年各种中学校园笑话段子、动漫、流
行歌曲横行的一本畅销书而已。上次的文章发出后,有人来信问我的文章里“卧石答春
绿”是什么意思?这是一个中学笑话段子,韩寒在《三重门》中用来讽刺读死书的人。
有人问“Wait and See”是什么意思,这是90年代初中期的热门动画片《兔子,等着瞧
》... 阅读全帖 |
|
C*N 发帖数: 1792 | 42 35岁后的女性唐诗率,这个是先验概率,你认识这个人以后,得到信息,比如身体状况
,家庭情况,甚或习惯等,估算出来的是 后验概率,在有观测值,而后验概率影响比
较大的情况下,先验概率上的差别基本上没有太大的意义 |
|
T*******I 发帖数: 5138 | 43 按照频率主义的观点,关于总体的一切结论都在样本所提供的全部信息之中,统计所要
做的是采用适当的算法将这些信息抽象出来。如果样本信息不够,就无法引出结论。在
频率主义者看来,在这种情形下不能人为引入无法确定的信息来引出结论。而Bayesian
恰恰就是这样做的。
让我举个简单的实例来说明频率主义和Bayesian的差别:
假设某个模型要有性别变量的参与,按照Bayesian的做法,可以假定男女之间的比为1:1,或者说男女出生的先验概率各为0.5,由于这个先验概率的引入,模型可以说很理想。可是,按照频率主义者的观点,我们不知道男女出生的概率是否是0.5,因为还有很多性别畸变的情形发生,因而,男女以及性别畸变者的出生概率根本无法确定,只能通过样本来估计。 |
|
m*****a 发帖数: 2160 | 44 其实从医学专业角都,体检比你想象的远远要复杂
总体而言,我国的体检非常不靠谱
至于为什么不靠谱,这里面涉及的东西非常的专业,甚至我国有些医生对于医学辅助检
查和体检都有误解。简单而言可以归纳为一个概率与统计问题,所以医学检查都有假阳
性和假阴性的风险,而这个风险大小是受检查本身准确程度(灵敏度和特异度)和患者
患某种疾病风险大小(“先验概率”)共同决定的,对于先验概率较小的人群(比如没
有任何症状的人),即使再准确的检查,出现假阳性的相对风险都是比较
大的,而出现阳性时为了证实是真阳性还是假阳性可能会带来本没必要的焦虑(特别是
需要长期多次复查的情况)、有风险的有创检查或过度治疗等。并不是说这个检查让你
获益的可能性完全为零(真阳性客观上也是有可能发生的),而是不一定利大于弊。
而国内医生说的也是完全错误的,特别是肿瘤标志物,准确度非常差,用作常规体检非
常不靠谱。那个同事提示体检查血也不会因此得到“早治疗早获益从而避免死亡”的获
益,而反而可能由于各种假阳性结果而接受没必要的有创检查或不得不在不断复查中焦虑 |
|
发帖数: 1 | 45 总体而言,我国的体检非常不靠谱
至于为什么不靠谱,这里面涉及的东西非常的专业,甚至我国有些医生对于医学辅助检
查和体检都有误解。简单而言可以归纳为一个概率与统计问题,所以医学检查都有假阳
性和假阴性的风险,而这个风险大小是受检查本身准确程度(灵敏度和特异度)和患者
患某种疾病风险大小(“先验概率”)共同决定的,对于先验概率较小的人群(比如没
有任何症状的人),即使再准确的检查,出现假阳性的相对风险都是比较
大的,而出现阳性时为了证实是真阳性还是假阳性可能会带来本没必要的焦虑(特别是
需要长期多次复查的情况)、有风险的有创检查或过度治疗等。并不是说这个检查让你
获益的可能性完全为零(真阳性客观上也是有可能发生的),而是不一定利大于弊。
而国内医生说的也是完全错误的,特别是肿瘤标志物,准确度非常差,用作常规体检非
常不靠谱。那个同事提示体检查血也不会因此得到“早治疗早获益从而避免死亡”的获
益,而反而可能由于各种假阳性结果而接受没必要的有创检查或不得不在不断复查中焦
虑 |
|
c*********2 发帖数: 2752 | 46 楼主你有医学常识么 楼主你是傻逼么
: 总体而言,我国的体检非常不靠谱
: 至于为什么不靠谱,这里面涉及的东西非常的专业,甚至我国有些医生对于医学
辅助检
: 查和体检都有误解。简单而言可以归纳为一个概率与统计问题,所以医学检查都
有假阳
: 性和假阴性的风险,而这个风险大小是受检查本身准确程度(灵敏度和特异度)
和患者
: 患某种疾病风险大小(“先验概率”)共同决定的,对于先验概率较小的人群(
比如没
: 有任何症状的人),即使再准确的检查,出现假阳性的相对风险都是比较
: 大的,而出现阳性时为了证实是真阳性还是假阳性可能会带来本没必要的焦虑(
特别是
: 需要长期多次复查的情况)、有风险的有创检查或过度治疗等。并不是说这个检
查让你
: 获益的可能性完全为零(真阳性客观上也是有可能发生的),而是不一定利大于
弊。
: 而国内医生说的也是完全错误的,特别是肿瘤标志物,准确度非常差,用作常规
体检非
|
|
发帖数: 1 | 47 “总体而言,我国的体检非常不靠谱
至于为什么不靠谱,这里面涉及的东西非常的专业,甚至我国有些医生对于医学辅助检
查和体检都有误解。简单而言可以归纳为一个概率与统计问题,所以医学检查都有假阳
性和假阴性的风险,而这个风险大小是受检查本身准确程度(灵敏度和特异度)和患者
患某种疾病风险大小(“先验概率”)共同决定的,对于先验概率较小的人群(比如没
有任何症状的人),即使再准确的检查,出现假阳性的相对风险都是比较
大的,而出现阳性时为了证实是真阳性还是假阳性可能会带来本没必要的焦虑(特别是
需要长期多次复查的情况)、有风险的有创检查或过度治疗等。并不是说这个检查让你
获益的可能性完全为零(真阳性客观上也是有可能发生的),而是不一定利大于弊。
而国内医生说的也是完全错误的,特别是肿瘤标志物,准确度非常差,用作常规体检非
常不靠谱。那个同事提示体检查血也不会因此得到“早治疗早获益从而避免死亡”的获
益,而反而可能由于各种假阳性结果而接受没必要的有创检查或不得不在不断复查中焦虑
科普兰514 发表于 2/14/2018 10:13:23 AM ”
呵呵作为统计和流行病资深教授,你的这个完全就是业界... 阅读全帖 |
|
l*y 发帖数: 21010 | 48 国内这种体检傻逼得很。
统计学上讲,现在有了一定体检证据,还需要有很强的先验概率,才有患病的可能。这
个先验概率,就是说你是高危人群,比如有家族病史或者BRCA基因突变或者到了疾病高
发的年龄段。只有高危人群做这种才有价值的。否则的话,大概率是假阳性,极大浪费
医疗资源,而且还影响生活。很多时候体检,比如CT胸透,反而诱发癌症,导致CT胸透
筛查的人的肺癌死亡率大于不做的人,这些是有大型Clinical trial证实的。
关键是高风险。 |
|
U*****e 发帖数: 2882 | 49 嗯,就是这么理解的.
对你的那个问题,如果A相信每次点球的方向都是随机而且独立的,他仍然相信下一次射
门方向的概率是50-50。没有任何的learning。就像你扔了100次50-50的硬币,都是正
面,如果你相信硬币没问题,你下次还是不会只押正面.
话说回来,其实频率论和贝叶斯论的区别不是那么大。如果你改变先验概率的形式,比
如二项式分布(p,1-p)的参数p本身服从0-1的一致分布,那么learning也还是有意义的
,因为他更精确的告诉你p的实现。
必须承认,先验概率这东西在数学上灵活了,在实证上就带来很大问题。理论上很多时
候干脆不管混合策略。 |
|
k*****e 发帖数: 22013 | 50 这是从献血这个讨论延伸出来的一个问题。 禁止同性恋献血的最大理由就是:统
计数据表明同性恋中HIV+的比例很高,远远高过异性恋。 很多人认为,统计数据
的差异,就是对两个群体差别对待的合理理由。
其实献血本身并不是很好的例子,首先如某网友指出,献血是不是一种权利就有争
议。 过于分散的讨论不是本文感兴趣的范围,本文集中讨论统计数据能否作为区
别对待的理由。 作为一个推广之后的伦理问题,这不仅限于献血,不仅限于同志
,也适用于其他情况和其他人群。
抽样调查是一种后验知识,有了经验之后再得出结论。 而来献血的一个人,除非
这人曾经被检查过,否则我们对他是没有经验的,要决定怎么对待一个我们不了解
的人,这就是先验判断。 统计数据仅仅告诉你一个同志是HIV+的概率,但是并不
表明任何一个具体的同志与HIV之间存在必然联系。 先验判断可能造成的结果就是
,一个同性恋可能一辈子只有一个性伴侣,但是却被认为与HIV+挂钩,从而被区别
对待。
如果用统计结果来做先验判断是合理的,我们就可以构造出以下情况: 根据统计
结果,外地人犯罪率比本地人高。因此为了保护出租车司机的生命安全,我们可以
禁止外地人打 |
|