由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
Statistics版 - 关于Bootstrap法需要强调的是
相关主题
有个bootstrap的问题想找人讨论下。请教大神们关于bootstrap
Dr. Efron要来DC讲座了,我该去听吗?请教bootstrap的问题
[合集] 有个bootstrap的问题想找人讨论下。standard deviation v.s. standard error
求用R做bootstrap的example script请教如果计算CI for the ratio of two independent means?
请教一个bootstrapping的问题。请大牛推荐cross validation 方面的好Book/Paper
Re: 讨论讨论Bootstrap和resampling吧请问:bootstrap的应用范围
bootstrap真的能让让我们逼近“真理”吗请教一个bootstrap的问题(包子)
random forest里面为什么是"可放回"的resample呢?紧急请教两个关于resampling的概念问题
相关话题的讨论汇总
话题: bootstrap话题: 空间话题: 认知话题: 概率
进入Statistics版参与讨论
1 (共1页)
T*******I
发帖数: 5138
1
我提出的问题的理性基础。我认为这个方法改变了原始的统计认知(也就是人们所理解的
统计分析)的对象,因为这将带给我们两个不同的概率密度空间:
A=来自总体E的一个原始样本所表达或构成的概率空间。我们试图得到的统计量集合S{A}被定义在这个空间上。
B=基于A上的反复抽样所得的Bootstrapped样本统计量所表达或构成的概率空间。
我们试图用定义在这个概率空间上的同质统计量集合S{B}来替代S{A}以便估计总体的同质参数集合P{E}。
我们原本只能用S{A}来估计P{E},现在却要用S{B}来估计P{E},而B不是直接来自总体E的一个随机样本,因为A和B的抽样背景和条件截然不同。请问,你能用S{B}来估计P{E}吗?除非你能证明
S{B} =~ S{A}
也就是要证明
概率空间A =~ 概率空间B
因为S对于A和B同质。这里的符号=~表示“等于”或“近似地”等于。
这个证明是极其困难的,因为事实上这个命题是不可能成立的,但它就是Bootstrap法在统计应用领域的一个绝对且唯一的前提条件。这确实是一个哲学问题,因为统计学就是一个认知的方法论。任何认知都有客体和主体,只有客体在被认知的过程中保持一致或同一性,认知的结果才具有一致性或同一性。
因此,一个统计学家的逻辑思辨能力的匮乏必然导致其在方法学研究上的错误和混乱。
G********t
发帖数: 334
2
没有人能懂你说的什么。大师你是不是感到很寂寞啊?
T*******I
发帖数: 5138
3
看起来我所理解的Bootstrap与你所掌握的不同。可否请你以平均数或某一回归模型的
参数估计来简述一下一个bootstrap的算法过程以便让我们有机会看看它是如何带给我
们最终结果的?我不需要任何中间证明过程。谢谢。

【在 G********t 的大作中提到】
: 没有人能懂你说的什么。大师你是不是感到很寂寞啊?
w*******9
发帖数: 1433
4
能不能说S(A)和S(B) 差个1/sqrt(n)?
T*******I
发帖数: 5138
5
应该不能这么说。在实际的随机世界里也应该没有这种确定性的函数关系。人的理性假
设能力再强大也没有用。

【在 w*******9 的大作中提到】
: 能不能说S(A)和S(B) 差个1/sqrt(n)?
T*******I
发帖数: 5138
6
我提出的问题的理性基础。我认为这个方法改变了原始的统计认知(也就是人们所理解的
统计分析)的对象,因为这将带给我们两个不同的概率密度空间:
A=来自总体E的一个原始样本所表达或构成的概率空间。我们试图得到的统计量集合S{A}被定义在这个空间上。
B=基于A上的反复抽样所得的Bootstrapped样本统计量所表达或构成的概率空间。
我们试图用定义在这个概率空间上的同质统计量集合S{B}来替代S{A}以便估计总体的同质参数集合P{E}。
我们原本只能用S{A}来估计P{E},现在却要用S{B}来估计P{E},而B不是直接来自总体E的一个随机样本,因为A和B的抽样背景和条件截然不同。请问,你能用S{B}来估计P{E}吗?除非你能证明
S{B} =~ S{A}
也就是要证明
概率空间A =~ 概率空间B
因为S对于A和B同质。这里的符号=~表示“等于”或“近似地”等于。
这个证明是极其困难的,因为事实上这个命题是不可能成立的,但它就是Bootstrap法在统计应用领域的一个绝对且唯一的前提条件。这确实是一个哲学问题,因为统计学就是一个认知的方法论。任何认知都有客体和主体,只有客体在被认知的过程中保持一致或同一性,认知的结果才具有一致性或同一性。
因此,一个统计学家的逻辑思辨能力的匮乏必然导致其在方法学研究上的错误和混乱。
G********t
发帖数: 334
7
没有人能懂你说的什么。大师你是不是感到很寂寞啊?
T*******I
发帖数: 5138
8
看起来我所理解的Bootstrap与你所掌握的不同。可否请你以平均数或某一回归模型的
参数估计来简述一下一个bootstrap的算法过程以便让我们有机会看看它是如何带给我
们最终结果的?我不需要任何中间证明过程。谢谢。

【在 G********t 的大作中提到】
: 没有人能懂你说的什么。大师你是不是感到很寂寞啊?
w*******9
发帖数: 1433
9
能不能说S(A)和S(B) 差个1/sqrt(n)?
T*******I
发帖数: 5138
10
应该不能这么说。在实际的随机世界里也应该没有这种确定性的函数关系。人的理性假
设能力再强大也没有用。

【在 w*******9 的大作中提到】
: 能不能说S(A)和S(B) 差个1/sqrt(n)?
i*****T
发帖数: 1855
11
lz这个有点钻牛角尖了吧。这个貌似是不好证,不过不知有没有搞测度的大牛讲讲。但
这个就算个公理让大家都认可,逻辑上也没啥说不过去吧。
这就好比你要非说1+1=2与3-1=2不是一个2,谁也没着啊。
j*****e
发帖数: 182
12
Intuitively, when the sample size is sufficiently large, your sample will be
essentially the underlying distribution and the resampling distribution
will be close to the unknown distribution of interest. Therefore, the
bootstrap method works asymptotically.
Bootstrap is not always feasible. For example, it can't be used to estimate
lower or upper percentiles. People should use bootstrap with caution,
because it takes a great knowledge to assure the resampling distribution is
actually mimicing the distribution of your estimator/test statistic. Not all
the asymptotics have been solved. So, bootstrap should only be used when
there is no other available method.
Please read the book by Davison and Hinkley before you comment on the method.
T*******I
发帖数: 5138
13
怎么能说那个命题的证明是钻牛角尖呢?那是一个极其重要的首要命题。
玩数学的人最会论证A = B之类的命题了,但前提是这个命题被发现或提出来。

【在 i*****T 的大作中提到】
: lz这个有点钻牛角尖了吧。这个貌似是不好证,不过不知有没有搞测度的大牛讲讲。但
: 这个就算个公理让大家都认可,逻辑上也没啥说不过去吧。
: 这就好比你要非说1+1=2与3-1=2不是一个2,谁也没着啊。

T*******I
发帖数: 5138
14
Bootstrap法的构建、展开式讨论和应用都必须以那个命题得到了证明为前提,否则一
切都是枉然或陷入数字游戏。

be
estimate
is
all

【在 j*****e 的大作中提到】
: Intuitively, when the sample size is sufficiently large, your sample will be
: essentially the underlying distribution and the resampling distribution
: will be close to the unknown distribution of interest. Therefore, the
: bootstrap method works asymptotically.
: Bootstrap is not always feasible. For example, it can't be used to estimate
: lower or upper percentiles. People should use bootstrap with caution,
: because it takes a great knowledge to assure the resampling distribution is
: actually mimicing the distribution of your estimator/test statistic. Not all
: the asymptotics have been solved. So, bootstrap should only be used when
: there is no other available method.

1 (共1页)
进入Statistics版参与讨论
相关主题
紧急请教两个关于resampling的概念问题请教一个bootstrapping的问题。
last issue of statistical scienceRe: 讨论讨论Bootstrap和resampling吧
咨询一门统计课程的内容(Computer Intensive Statistical Methods)bootstrap真的能让让我们逼近“真理”吗
● 咨询一门统计课程的内容(Computer Intensive Statistical Methods)random forest里面为什么是"可放回"的resample呢?
有个bootstrap的问题想找人讨论下。请教大神们关于bootstrap
Dr. Efron要来DC讲座了,我该去听吗?请教bootstrap的问题
[合集] 有个bootstrap的问题想找人讨论下。standard deviation v.s. standard error
求用R做bootstrap的example script请教如果计算CI for the ratio of two independent means?
相关话题的讨论汇总
话题: bootstrap话题: 空间话题: 认知话题: 概率