s********0 发帖数: 51 | 1 假设有相互独立的三组数,每组100个,都成正态分布且独立,平均值分别是0.3,0.2,0
.1,方差都是1.
Group1: x_{1,1},x_{1,2},...,x_{1,100} i.i.d ~ N(mu1=0.3,1)
Group2: x_{2,1},x_{2,2},...,x_{2,100} i.i.d ~ N(mu2=0.2,1)
Group3: x_{3,1},x_{3,2},...,x_{3,100} i.i.d ~ N(mu3=0.1,1)
现在定义三个null hypothesis :H0_12: mu1=mu2, H0_13: mu1=mu3, H0_23: mu2=mu3
根据公式,可以得到三个假设检验的power ( power12 = P(reject H0_12|mu1=0.3,mu2
=0.2) )
现在的问题是: 如何计算 P(reject H0_12 and reject H0_13 | mu1=0.3,mu2=0.2,
mu3=0.1)
主要问题是,这两个假设检验(reject H0_12 和 reject H0_13)并不是独立的。有人
知道怎么算吗?谢谢了!
以下是一些的simulation的结果:
根据公式:power12= 0.104507, power13=0.2902664,power23=0.104507,这个跟
simulation是相符的。根据R simulation,
P(reject H0_12 and reject H0_13 | mu1=0.3,mu2=0.2,mu3=0.1)= 0.0673
P(reject H0_12 and reject H0_23 | mu1=0.3,mu2=0.2,mu3=0.1)= 0.0055
P(reject H0_13 and reject H0_23 | mu1=0.3,mu2=0.2,mu3=0.1)= 0.064
那么理论上如何能推出这三个数呢? | k*******a 发帖数: 772 | 2 算出 test statistics T1, T2, T3的joint distribution
因为sample size够大,可以用multivariate normal 近似
standardize 之后应该 mean(T1)=mean(T2)=sqrt(2)/2, var(T1)=var(T2)=1 cov(T1,
T2)=1/2
reject region就是近似 T1>1.96 and T2>1.96 | s********0 发帖数: 51 | 3 非常感谢你的解答,我觉得挺有道理的。但是我不太明白三个统计量的平均值,方差,
尤其是协方差是如何算出来的。能不能写的再详细一点,多谢了。
,
【在 k*******a 的大作中提到】 : 算出 test statistics T1, T2, T3的joint distribution : 因为sample size够大,可以用multivariate normal 近似 : standardize 之后应该 mean(T1)=mean(T2)=sqrt(2)/2, var(T1)=var(T2)=1 cov(T1, : T2)=1/2 : reject region就是近似 T1>1.96 and T2>1.96
| k*******a 发帖数: 772 | 4 T1 = [mean(X1) - mean(X2)]/[sqrt(2/n)*S] , S 近似为方差 sigma=1
T2= [mean(X2) - mean(X3)]/[sqrt(2)/n*S]
所以 mean(T1)=mean(T2)= 0.1/(sqrt(2/100)) =sqrt(2)/2
Var(T1)=Var(T2)近似为 1 因为standardized了
cov(T1, T2) = -var[mean(X2)]/[2/n*S^2] = - 1 / 2
T3可以类似得出
不过算出来的三个概率和你有些差异:0.0672, 0.00088, 0.0672
【在 s********0 的大作中提到】 : 非常感谢你的解答,我觉得挺有道理的。但是我不太明白三个统计量的平均值,方差, : 尤其是协方差是如何算出来的。能不能写的再详细一点,多谢了。 : : ,
| s********0 发帖数: 51 | 5 谢谢你,你解答的非常详细。我刚刚按照你的思路又推倒了一遍,
E(T3) = sqrt(2)
cov(T1,T3)=cov(T2,T3)=1/2
只是reject region应该是Ti < -1.96 or Ti > 1.96, i=1,2,3. 所以
P(reject H0_12 and H0_13) = P((T1 > 1.96 or T1 < -1.96) and (T2 > 1.96
or T2 < -1.96)),它是由四个小区域组成的。把四个区域的积分都加起来得到的三个
数分别是:0.06731796,0.005512534,0.06731796,已经跟simulation非常接近了。
再次
感谢你的帮助。
【在 k*******a 的大作中提到】 : T1 = [mean(X1) - mean(X2)]/[sqrt(2/n)*S] , S 近似为方差 sigma=1 : T2= [mean(X2) - mean(X3)]/[sqrt(2)/n*S] : 所以 mean(T1)=mean(T2)= 0.1/(sqrt(2/100)) =sqrt(2)/2 : Var(T1)=Var(T2)近似为 1 因为standardized了 : cov(T1, T2) = -var[mean(X2)]/[2/n*S^2] = - 1 / 2 : T3可以类似得出 : 不过算出来的三个概率和你有些差异:0.0672, 0.00088, 0.0672
|
|