c****r 发帖数: 969 | 1 前面看有牛人发的一片文章,然后后来有人指出他的confidence interval 理解错了
该怎样理解才正确? |
s*****n 发帖数: 2174 | 2 传统的Frequencist的解释大体是:
1. 真值是fixed, but unknown.
2. 根据一组样本, 计算一个95%置信度的置信区间
3. 如果你(理论上)重复抽样很多次(比如N次), 每次都计算一个相应的置信区间. 那么
95%的情况下, 置信区间会覆盖住真值. 或者说真值(确定不变的)落在置信区间(根据样
本变化)之间.
最重要的是: "假如我们可以重复这个抽样很多次..." |
d******e 发帖数: 7844 | 3 Lim 真值在区间内的次数/N as N->无穷大=0.95
【在 s*****n 的大作中提到】 : 传统的Frequencist的解释大体是: : 1. 真值是fixed, but unknown. : 2. 根据一组样本, 计算一个95%置信度的置信区间 : 3. 如果你(理论上)重复抽样很多次(比如N次), 每次都计算一个相应的置信区间. 那么 : 95%的情况下, 置信区间会覆盖住真值. 或者说真值(确定不变的)落在置信区间(根据样 : 本变化)之间. : 最重要的是: "假如我们可以重复这个抽样很多次..."
|
c*****m 发帖数: 4817 | 4 传统的Frequencist的确是应该这样理解,但这个也确实不make sense。
因为现实中不可能对含有fixed并且unknown参数的随即变量重复抽样多次,现实中data
就只有一个,按传统方法计算也就只能得到一个固定的置信区间,这个区间要么覆盖真
值,要么不覆盖,根本就没有概率的问题。
【在 s*****n 的大作中提到】 : 传统的Frequencist的解释大体是: : 1. 真值是fixed, but unknown. : 2. 根据一组样本, 计算一个95%置信度的置信区间 : 3. 如果你(理论上)重复抽样很多次(比如N次), 每次都计算一个相应的置信区间. 那么 : 95%的情况下, 置信区间会覆盖住真值. 或者说真值(确定不变的)落在置信区间(根据样 : 本变化)之间. : 最重要的是: "假如我们可以重复这个抽样很多次..."
|
l********g 发帖数: 14 | 5 那根据这组样本计算的这一个specific的区间(两个值)有什么用呢?
楼下的高人,我注册时间少于3天不能回复。
在这里请教的是:
区间估计和假设检验又是统一的,也就是说和p-value是统一的,这又怎样解释呢? |
g**r 发帖数: 425 | 6 这个置信区间,其实还是个随机变量。
把下限当一个随机变量,上限当一个随机变量,其实你估计的两个值,还是两个点估计。
给定了点估计和方差后,这个所谓的置信区间不增加任何信息量,只给外行一个实际值
应该落在这个里面的错觉。 好像老祖宗FISHER是很反对这个做法的,只坚持用他的P-
Value。
这个是贝叶斯学派攻击FREQUETIST的最常见的攻击点之一。
【在 l********g 的大作中提到】 : 那根据这组样本计算的这一个specific的区间(两个值)有什么用呢? : 楼下的高人,我注册时间少于3天不能回复。 : 在这里请教的是: : 区间估计和假设检验又是统一的,也就是说和p-value是统一的,这又怎样解释呢?
|
s*****n 发帖数: 2174 | 7 所以这就成了Bayesian 批评 Frequencist 的一个重要因素.
归根结底就是那个本质问题, 能否假设我们可以重复这个实验(抽样)多次.
Bayesian的prior理论, 其实也很牵强, 也成为Frequencist攻击的对象.
总体上, 统计的很多东西, 主观性很强.
data
【在 c*****m 的大作中提到】 : 传统的Frequencist的确是应该这样理解,但这个也确实不make sense。 : 因为现实中不可能对含有fixed并且unknown参数的随即变量重复抽样多次,现实中data : 就只有一个,按传统方法计算也就只能得到一个固定的置信区间,这个区间要么覆盖真 : 值,要么不覆盖,根本就没有概率的问题。
|
d******e 发帖数: 7844 | 8 好用就行啊,管他真正到最后那个说得通呢
【在 s*****n 的大作中提到】 : 所以这就成了Bayesian 批评 Frequencist 的一个重要因素. : 归根结底就是那个本质问题, 能否假设我们可以重复这个实验(抽样)多次. : Bayesian的prior理论, 其实也很牵强, 也成为Frequencist攻击的对象. : 总体上, 统计的很多东西, 主观性很强. : : data
|
h******a 发帖数: 198 | 9 其实贝叶斯的prior还是挺有道理的,把“参数” 这种东西看成固定不变的量 有点机
械。 hierarchical bayes或者emprical bayes都挺有意思的。 |
g**r 发帖数: 425 | 10
p-value只是在H0上做文章,从概念上讲,是在H0成立的情况下,更极端情况发生的概
率。这个是个概率概念,解释起来也用不着用REPEAT SAMPLING,但是不直观。
置信区间的概念是NEYMAN提出来的,NEYMAN-PERSON假设检验也是NEYMAN提出来的,这
两个一致。而P-VALUE的概念是FISHER提出来的,这个在之前。NEYMAY的假设检验和
FISHER的P VALUE并无矛盾,且表面上要直观的多,但是究竟有多大意义,则很难讲。
在1934年NEYMAN在RSS发表关于这个CI的演讲的时候,当时的大会主席BOWLEY教授是这
样评价的:
I am not certain whter to ask for an explanation or to cast a doubt. It is
suggested in the paper that the work is difficult to follow and I may be one
of those who have been misled by it. I can only say that I h
【在 l********g 的大作中提到】 : 那根据这组样本计算的这一个specific的区间(两个值)有什么用呢? : 楼下的高人,我注册时间少于3天不能回复。 : 在这里请教的是: : 区间估计和假设检验又是统一的,也就是说和p-value是统一的,这又怎样解释呢?
|
z*********o 发帖数: 541 | 11
【在 c****r 的大作中提到】 : 前面看有牛人发的一片文章,然后后来有人指出他的confidence interval 理解错了 : 该怎样理解才正确?
|