由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
Statistics版 - 请教一个bootstrapping的问题。
相关主题
有个bootstrap的问题想找人讨论下。[合集] 问个简单的问题
[合集] 有个bootstrap的问题想找人讨论下。大小样本比较
请问:bootstrap的应用范围请问如果sample size<5 如何准确估计 mean
2 sample t-test with bootstrap 怎么搞?a question on sample size
Faster Random Sampling with Replacement请帮忙两个power analysis 的问题,包子答谢
random forest里面为什么是"可放回"的resample呢?请教一个bootstrap的问题(包子)
求用R做bootstrap的example script紧急请教两个关于resampling的概念问题
关于Bootstrap法需要强调的是Re: 讨论讨论Bootstrap和resampling吧
相关话题的讨论汇总
话题: obs话题: sample话题: model
进入Statistics版参与讨论
1 (共1页)
a******n
发帖数: 11246
1
请教各位朋友一个关于bootstrapping方法本身的问题。
背景是这样的,N个observations,要fit一个model,假设model形式是Y=a+bX。
我理解的bootstrapping做法是,从这N个obs里re-sample N个obs, with replacement
,得到新的一组N obs,反复re sample,得到上千组N个的obs。每组fit一次model,最
后把上千个a和b平均一下。请问我这么做对么?
另外一种做法是,re-sample少量几次,比如10次吧,然后把这些re-sampled obs和原
来的N个合并在一起,这样一共有11*N个obs,直接fit model。这样做对吗?我总觉得
这么做和我理解的是完全不一样的,根本不能算bootstrapping,谁帮我confirm一下呀
q******n
发帖数: 272
2
第二种不是BOOTSTRAPPING. BOOTSTRAPPING can also be done by shuffling and
allocating residuals and created new Y, which is Yhat+sample(residuals).
a******n
发帖数: 11246
3
多谢!你说的这个方法我也看到了,叫fixed-x / model-based resampling。那顺带问
一下,这个方法用来build linear model很好理解,但怎么应用到logistic
regression上呢?
Thanks~

【在 q******n 的大作中提到】
: 第二种不是BOOTSTRAPPING. BOOTSTRAPPING can also be done by shuffling and
: allocating residuals and created new Y, which is Yhat+sample(residuals).

a******n
发帖数: 11246
4
顶一个,有没有朋友知道有没有这种re-sample做法。

replacement

【在 a******n 的大作中提到】
: 请教各位朋友一个关于bootstrapping方法本身的问题。
: 背景是这样的,N个observations,要fit一个model,假设model形式是Y=a+bX。
: 我理解的bootstrapping做法是,从这N个obs里re-sample N个obs, with replacement
: ,得到新的一组N obs,反复re sample,得到上千组N个的obs。每组fit一次model,最
: 后把上千个a和b平均一下。请问我这么做对么?
: 另外一种做法是,re-sample少量几次,比如10次吧,然后把这些re-sampled obs和原
: 来的N个合并在一起,这样一共有11*N个obs,直接fit model。这样做对吗?我总觉得
: 这么做和我理解的是完全不一样的,根本不能算bootstrapping,谁帮我confirm一下呀
: ?

A*****r
发帖数: 795
5
bootstrap当然是第一个了
孙天使好歹也是phd啊.......汗

replacement

【在 a******n 的大作中提到】
: 请教各位朋友一个关于bootstrapping方法本身的问题。
: 背景是这样的,N个observations,要fit一个model,假设model形式是Y=a+bX。
: 我理解的bootstrapping做法是,从这N个obs里re-sample N个obs, with replacement
: ,得到新的一组N obs,反复re sample,得到上千组N个的obs。每组fit一次model,最
: 后把上千个a和b平均一下。请问我这么做对么?
: 另外一种做法是,re-sample少量几次,比如10次吧,然后把这些re-sampled obs和原
: 来的N个合并在一起,这样一共有11*N个obs,直接fit model。这样做对吗?我总觉得
: 这么做和我理解的是完全不一样的,根本不能算bootstrapping,谁帮我confirm一下呀
: ?

I*****a
发帖数: 5425
6
1) If you can't get the distributions of ahat and bhat without bootstrapping
, method 2 won't give that either.
2) If you can directly estimate, say the variance of ahat and bhat, by
assumptions, then method 2 tends to give you smaller variances with bias.

replacement

【在 a******n 的大作中提到】
: 请教各位朋友一个关于bootstrapping方法本身的问题。
: 背景是这样的,N个observations,要fit一个model,假设model形式是Y=a+bX。
: 我理解的bootstrapping做法是,从这N个obs里re-sample N个obs, with replacement
: ,得到新的一组N obs,反复re sample,得到上千组N个的obs。每组fit一次model,最
: 后把上千个a和b平均一下。请问我这么做对么?
: 另外一种做法是,re-sample少量几次,比如10次吧,然后把这些re-sampled obs和原
: 来的N个合并在一起,这样一共有11*N个obs,直接fit model。这样做对吗?我总觉得
: 这么做和我理解的是完全不一样的,根本不能算bootstrapping,谁帮我confirm一下呀
: ?

c***z
发帖数: 6348
7
thanks for sharing! I am studying bootstrap too, for a totally different
purpose: adjust for sample bias
just wondering if the following would work:
if my sample has 35% male, while I know that the population has 50% male. I
am resampling with replacement, so that my new sample has 50% male. Then I
do things with the new sample.
w*******n
发帖数: 469
8
The first method, but need use all samples from sampling for model fitting!

replacement

【在 a******n 的大作中提到】
: 请教各位朋友一个关于bootstrapping方法本身的问题。
: 背景是这样的,N个observations,要fit一个model,假设model形式是Y=a+bX。
: 我理解的bootstrapping做法是,从这N个obs里re-sample N个obs, with replacement
: ,得到新的一组N obs,反复re sample,得到上千组N个的obs。每组fit一次model,最
: 后把上千个a和b平均一下。请问我这么做对么?
: 另外一种做法是,re-sample少量几次,比如10次吧,然后把这些re-sampled obs和原
: 来的N个合并在一起,这样一共有11*N个obs,直接fit model。这样做对吗?我总觉得
: 这么做和我理解的是完全不一样的,根本不能算bootstrapping,谁帮我confirm一下呀
: ?

1 (共1页)
进入Statistics版参与讨论
相关主题
Re: 讨论讨论Bootstrap和resampling吧Faster Random Sampling with Replacement
Google面试问题random forest里面为什么是"可放回"的resample呢?
bootstrap真的能让让我们逼近“真理”吗求用R做bootstrap的example script
sample distribution的理解关于Bootstrap法需要强调的是
有个bootstrap的问题想找人讨论下。[合集] 问个简单的问题
[合集] 有个bootstrap的问题想找人讨论下。大小样本比较
请问:bootstrap的应用范围请问如果sample size<5 如何准确估计 mean
2 sample t-test with bootstrap 怎么搞?a question on sample size
相关话题的讨论汇总
话题: obs话题: sample话题: model