b******3 发帖数: 4385 | 1 目的:(1)预测单位体积的某种液体中某种细菌的数目,(2)选定一个体积为x的样本进
行测量所对应的variance
数据:由于特殊原因只有了7个样本结果(每个样本体积大小不等,知道体积和细菌数
目)
想用bootstrap 来解决,但是不知道如何处理这种每个数据点的体积不一样的情况,请
问哪位大侠能指引一下,不甚感激!! |
r********n 发帖数: 6979 | 2 每个体积不一样无所谓啊
你要的不是单位体积液体中的细菌数目么
每个样本先算出单位密度
然后对7个样本bootstrap
mean还好
用7个样本估计variance
CI会很大吧
我反正是不会相信的
【在 b******3 的大作中提到】 : 目的:(1)预测单位体积的某种液体中某种细菌的数目,(2)选定一个体积为x的样本进 : 行测量所对应的variance : 数据:由于特殊原因只有了7个样本结果(每个样本体积大小不等,知道体积和细菌数 : 目) : 想用bootstrap 来解决,但是不知道如何处理这种每个数据点的体积不一样的情况,请 : 问哪位大侠能指引一下,不甚感激!!
|
b******3 发帖数: 4385 | 3 之所以这么觉得用七个算VARIANCEK可行是因为取得七个样本的体积基本上测试的值已
经接近平均值,现在想确定大概取多少体积测比较合理以及对应的偏差
【在 r********n 的大作中提到】 : 每个体积不一样无所谓啊 : 你要的不是单位体积液体中的细菌数目么 : 每个样本先算出单位密度 : 然后对7个样本bootstrap : mean还好 : 用7个样本估计variance : CI会很大吧 : 我反正是不会相信的
|
v*******e 发帖数: 11604 | 4 就像2楼说的那样做就行了。另外不知道你用bootstrap是啥意思,7个数据点,求mean
和variance是简单计算就行了。 |
b******3 发帖数: 4385 | 5 因为这个里面涉及到一个一次测量多大体积可以得到一个比较具有代表性结果的问题。
我这七个数据点分别来自10ml, 30ml, 50ml ,60ml ,55ml, 45ml, 33ml,因为这个几个
数据点不是完全相同的,所以直接平均,直接算偏差应该不大合适,因为每个样本点的
的期望variance不一样,体积越大的期望variance就越小,所以这些点应该不可以简单
认为是来自iid,应该需要一定的矫正,但是我又不知道如何矫正
mean
【在 v*******e 的大作中提到】 : 就像2楼说的那样做就行了。另外不知道你用bootstrap是啥意思,7个数据点,求mean : 和variance是简单计算就行了。
|
v*******e 发帖数: 11604 | 6 细菌在液体中是均匀分布的吗?如果是,假设单位体积里面平均有lambda个细菌,你实
测的单位体积里面的细菌数是泊松分布的,其均值为lambda,variance也是lambda。如
果你测X体积里面的细菌数,那么均值是X*lambda,variance也是X*lambda;所以你从
测X体积的细菌数来计算均值,采用的方法是用X体积里面的细菌数除以X;这个值的均
值是lambda,variance是X*lambda/(X*X)=lambda/X。所以测的体积越大,variance
越小。
如果细菌在液体中不是均匀分布而是有cluster,那么其分布就不是容易弄的了。 |
b******3 发帖数: 4385 | 7 这里似乎不假设它是均匀了根本无法解决这个问题的。
假设是柏松分布,现在的目的是需要估计到lambda。这样测得多大体积,已经其对应的
variance 自然也可以出来了,可是现在的数据点有限,而且来自不同体积,不知道具
体该怎么算到lambda
variance
【在 v*******e 的大作中提到】 : 细菌在液体中是均匀分布的吗?如果是,假设单位体积里面平均有lambda个细菌,你实 : 测的单位体积里面的细菌数是泊松分布的,其均值为lambda,variance也是lambda。如 : 果你测X体积里面的细菌数,那么均值是X*lambda,variance也是X*lambda;所以你从 : 测X体积的细菌数来计算均值,采用的方法是用X体积里面的细菌数除以X;这个值的均 : 值是lambda,variance是X*lambda/(X*X)=lambda/X。所以测的体积越大,variance : 越小。 : 如果细菌在液体中不是均匀分布而是有cluster,那么其分布就不是容易弄的了。
|
v*******e 发帖数: 11604 | 8
这个把所有的体积加起来,所有的细菌数加起来,然后除就行了。
这个可以通过自己写出泊松分布的likelihood function(7个泊松分布的乘积),然后
最大似然估计就出来了。
【在 b******3 的大作中提到】 : 这里似乎不假设它是均匀了根本无法解决这个问题的。 : 假设是柏松分布,现在的目的是需要估计到lambda。这样测得多大体积,已经其对应的 : variance 自然也可以出来了,可是现在的数据点有限,而且来自不同体积,不知道具 : 体该怎么算到lambda : : variance
|
w*******9 发帖数: 1433 | 9 泊松分布有点overkill,更简单的就用linear regression,如果对测量误差还有啥定
性的了解还可weighted least square。 |
j*****e 发帖数: 182 | 10 Please check the topic of Poisson Rate Regression in the Agresti's book. In
SAS PROC GENMOD, this can be implemented by
model count=/dist=Poi offset=log_volumn;
Bootstrapping is certainly not the solution. |