a******n 发帖数: 11246 | 1 请教各位朋友一个关于bootstrapping方法本身的问题。
背景是这样的,N个observations,要fit一个model,假设model形式是Y=a+bX。
我理解的bootstrapping做法是,从这N个obs里re-sample N个obs, with replacement
,得到新的一组N obs,反复re sample,得到上千组N个的obs。每组fit一次model,最
后把上千个a和b平均一下。请问我这么做对么?
另外一种做法是,re-sample少量几次,比如10次吧,然后把这些re-sampled obs和原
来的N个合并在一起,这样一共有11*N个obs,直接fit model。这样做对吗?我总觉得
这么做和我理解的是完全不一样的,根本不能算bootstrapping,谁帮我confirm一下呀
? |
q******n 发帖数: 272 | 2 第二种不是BOOTSTRAPPING. BOOTSTRAPPING can also be done by shuffling and
allocating residuals and created new Y, which is Yhat+sample(residuals). |
a******n 发帖数: 11246 | 3 多谢!你说的这个方法我也看到了,叫fixed-x / model-based resampling。那顺带问
一下,这个方法用来build linear model很好理解,但怎么应用到logistic
regression上呢?
Thanks~
【在 q******n 的大作中提到】 : 第二种不是BOOTSTRAPPING. BOOTSTRAPPING can also be done by shuffling and : allocating residuals and created new Y, which is Yhat+sample(residuals).
|
a******n 发帖数: 11246 | 4 顶一个,有没有朋友知道有没有这种re-sample做法。
replacement
【在 a******n 的大作中提到】 : 请教各位朋友一个关于bootstrapping方法本身的问题。 : 背景是这样的,N个observations,要fit一个model,假设model形式是Y=a+bX。 : 我理解的bootstrapping做法是,从这N个obs里re-sample N个obs, with replacement : ,得到新的一组N obs,反复re sample,得到上千组N个的obs。每组fit一次model,最 : 后把上千个a和b平均一下。请问我这么做对么? : 另外一种做法是,re-sample少量几次,比如10次吧,然后把这些re-sampled obs和原 : 来的N个合并在一起,这样一共有11*N个obs,直接fit model。这样做对吗?我总觉得 : 这么做和我理解的是完全不一样的,根本不能算bootstrapping,谁帮我confirm一下呀 : ?
|
A*****r 发帖数: 795 | 5 bootstrap当然是第一个了
孙天使好歹也是phd啊.......汗
replacement
【在 a******n 的大作中提到】 : 请教各位朋友一个关于bootstrapping方法本身的问题。 : 背景是这样的,N个observations,要fit一个model,假设model形式是Y=a+bX。 : 我理解的bootstrapping做法是,从这N个obs里re-sample N个obs, with replacement : ,得到新的一组N obs,反复re sample,得到上千组N个的obs。每组fit一次model,最 : 后把上千个a和b平均一下。请问我这么做对么? : 另外一种做法是,re-sample少量几次,比如10次吧,然后把这些re-sampled obs和原 : 来的N个合并在一起,这样一共有11*N个obs,直接fit model。这样做对吗?我总觉得 : 这么做和我理解的是完全不一样的,根本不能算bootstrapping,谁帮我confirm一下呀 : ?
|
I*****a 发帖数: 5425 | 6 1) If you can't get the distributions of ahat and bhat without bootstrapping
, method 2 won't give that either.
2) If you can directly estimate, say the variance of ahat and bhat, by
assumptions, then method 2 tends to give you smaller variances with bias.
replacement
【在 a******n 的大作中提到】 : 请教各位朋友一个关于bootstrapping方法本身的问题。 : 背景是这样的,N个observations,要fit一个model,假设model形式是Y=a+bX。 : 我理解的bootstrapping做法是,从这N个obs里re-sample N个obs, with replacement : ,得到新的一组N obs,反复re sample,得到上千组N个的obs。每组fit一次model,最 : 后把上千个a和b平均一下。请问我这么做对么? : 另外一种做法是,re-sample少量几次,比如10次吧,然后把这些re-sampled obs和原 : 来的N个合并在一起,这样一共有11*N个obs,直接fit model。这样做对吗?我总觉得 : 这么做和我理解的是完全不一样的,根本不能算bootstrapping,谁帮我confirm一下呀 : ?
|
c***z 发帖数: 6348 | 7 thanks for sharing! I am studying bootstrap too, for a totally different
purpose: adjust for sample bias
just wondering if the following would work:
if my sample has 35% male, while I know that the population has 50% male. I
am resampling with replacement, so that my new sample has 50% male. Then I
do things with the new sample. |
w*******n 发帖数: 469 | 8 The first method, but need use all samples from sampling for model fitting!
replacement
【在 a******n 的大作中提到】 : 请教各位朋友一个关于bootstrapping方法本身的问题。 : 背景是这样的,N个observations,要fit一个model,假设model形式是Y=a+bX。 : 我理解的bootstrapping做法是,从这N个obs里re-sample N个obs, with replacement : ,得到新的一组N obs,反复re sample,得到上千组N个的obs。每组fit一次model,最 : 后把上千个a和b平均一下。请问我这么做对么? : 另外一种做法是,re-sample少量几次,比如10次吧,然后把这些re-sampled obs和原 : 来的N个合并在一起,这样一共有11*N个obs,直接fit model。这样做对吗?我总觉得 : 这么做和我理解的是完全不一样的,根本不能算bootstrapping,谁帮我confirm一下呀 : ?
|