由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
Statistics版 - 请教大神们关于bootstrap
相关主题
求用R做bootstrap的example script有个bootstrap的问题想找人讨论下。
两个有关于R的小问题?[合集] 有个bootstrap的问题想找人讨论下。
a R loop question关于Bootstrap法需要强调的是
这个R程序能帮改进一下吗?请教一个bootstrapping的问题。
请教R Code, 多谢!Dr. Efron要来DC讲座了,我该去听吗?
求问一个R apply 函数的问题突然对直线拟合的R不明白起来了
R 扫描matrix请教一个概率题的思路
bootstrap真的能让让我们逼近“真理”吗R question
相关话题的讨论汇总
话题: bootstrap话题: 样本话题: perl话题: otu话题: matrix
进入Statistics版参与讨论
1 (共1页)
p********y
发帖数: 15
1
我有13个样本,每个样本2000+的count data,现在要对每个样本算出的一个index求
bootstrap confidence interval,bootstrap的时候有个限制条件,就是每个样本
resample之后的total count总和要绝对等于一个数,我现在用R sample() 跑while
loop 加限制条件生成新的data,用新data算index再找CI,但这样很慢,题目要求要抽
100,000个,我跑1000个就要180多秒了,如果一定要用R跑,有什么好办法可以快点?
我还会Perl还没想过Perl怎么写。请大神们支招!
s*r
发帖数: 2757
2
you do not have weibi...so i just answer briefly
perl could be 10 times faster than r
you need a unix cluster to do this
p********y
发帖数: 15
3

不好意思,我好穷。。。追问一下,Perl为什么快呢,用cluster是说每个样本单独作
为一个job跑,同时跑所以快?

【在 s*r 的大作中提到】
: you do not have weibi...so i just answer briefly
: perl could be 10 times faster than r
: you need a unix cluster to do this

S******y
发帖数: 1123
4
Can you share your R code?
p********y
发帖数: 15
5
mat=matrix(0,ncol=100000,nrow=nrow(OTU_matrix))
i=0
while (i<=100000){
new=sample(OTU_matrix[,1],nrow(OTU_matrix),replace=T)
if (sum(new)==4190){
mat[,i]=new
i=i+1
}
}
OTU_matrix每列是我要抽的样本,mat是我要生成的resampling data
p********y
发帖数: 15
6
对新data算我要的参数很快,就是生成新data很慢,试着跑了这个100,000的,需要五
个小时才能跑完
s*r
发帖数: 2757
7
r 不兴用循环 google key word: apply plyr

【在 p********y 的大作中提到】
: mat=matrix(0,ncol=100000,nrow=nrow(OTU_matrix))
: i=0
: while (i<=100000){
: new=sample(OTU_matrix[,1],nrow(OTU_matrix),replace=T)
: if (sum(new)==4190){
: mat[,i]=new
: i=i+1
: }
: }
: OTU_matrix每列是我要抽的样本,mat是我要生成的resampling data

p********y
发帖数: 15
8
我发现慢的原因主要是有的样本里的数有很多的零,数值也不大,有的最大count就200
多,这样很难满足总和等于4190的条件,就要一直resample...
s*r
发帖数: 2757
9
有了这样一个限制条件,resample出来的distribution还是原来的population吗
有限制条件的话,sample到N-1的时候,就要看剩下的数里面有那个可以让总合等于
4190的么。。。
也许Dynamic Programming: Combination Sum对你有帮助

200

【在 p********y 的大作中提到】
: 我发现慢的原因主要是有的样本里的数有很多的零,数值也不大,有的最大count就200
: 多,这样很难满足总和等于4190的条件,就要一直resample...

1 (共1页)
进入Statistics版参与讨论
相关主题
R question请教R Code, 多谢!
Urgent R Question求问一个R apply 函数的问题
R 画图问题求教R 扫描matrix
【R求问】关于vector赋值bootstrap真的能让让我们逼近“真理”吗
求用R做bootstrap的example script有个bootstrap的问题想找人讨论下。
两个有关于R的小问题?[合集] 有个bootstrap的问题想找人讨论下。
a R loop question关于Bootstrap法需要强调的是
这个R程序能帮改进一下吗?请教一个bootstrapping的问题。
相关话题的讨论汇总
话题: bootstrap话题: 样本话题: perl话题: otu话题: matrix