z**********i 发帖数: 12276 | 1 It seems like an ANOVA, but the outcome is rate or count, so I am not sure
how to do that correctly.
DENOMINATOR是所有的病人数量,NUMERATOR是这些病人中多少被治愈.治愈率是
NUMERATOR/DENOMINATOR.
TIME 是季度.
我想计算BETWEEN HOSPITAL和WITHIN HOSPITAL的VARIANCE.
Time denominator numerator
Hospital 1: 1 20 10
Hospital 1: 2 18 10
Hospital 1: 3 15 8
Hospital 1: 4 22 11
Hospital 2: 1 120 110
Hospital 2: 2 115 100
Hospital 2: 3 100 88
Hospital 2: 4 118 101
Hospital 3: 1 13 10
Hospital 3: 2 15 10
Hospital 3: 3 20 8
Hospital 3: 4 18 11 |
m*****y 发帖数: 229 | 2 不太晓得你分开分子分母的意思。我个人觉得可以把它们合并作治愈率,然后用split-
plot design。Time是within factor, hospital是between subject factor。不过估
计跟你想要的不一样。
within hospital
time 1 time 2 time 3 time 4
between Hospital 1 0.5 0.2 0.3 0.4
hospital Hospital 2 0.8 0.9 0.7 0.3
Hospital 3 0.33 0.44 0.55 0.66 |
z**********i 发帖数: 12276 | 3 多谢你的回复,能稍微详细点吗?
晚上发包子!
split-
【在 m*****y 的大作中提到】 : 不太晓得你分开分子分母的意思。我个人觉得可以把它们合并作治愈率,然后用split- : plot design。Time是within factor, hospital是between subject factor。不过估 : 计跟你想要的不一样。 : within hospital : time 1 time 2 time 3 time 4 : between Hospital 1 0.5 0.2 0.3 0.4 : hospital Hospital 2 0.8 0.9 0.7 0.3 : Hospital 3 0.33 0.44 0.55 0.66
|
t**c 发帖数: 539 | 4 感觉这里hospital是fixed,所以不需要split-plot design吧?
找到一篇paper,对categorical data,是这么做variance partition的: |
t**c 发帖数: 539 | 5
【在 t**c 的大作中提到】 : 感觉这里hospital是fixed,所以不需要split-plot design吧? : 找到一篇paper,对categorical data,是这么做variance partition的:
|
z**********i 发帖数: 12276 | 6 多谢回复,这里我担心的是outcome是RATE,不是normal distribution.
比如,anova假定是正态分布的数据.
【在 t**c 的大作中提到】
|
t**c 发帖数: 539 | 7 对,因为是categorical data,所以不能用一般意义上的anova。
我上个帖子在附件里贴出了怎么对categorical data做variance的partition.
具体到你的数据:
两个category (0或者1):I = 2
三个group (hospital1 to hospital 3): G = 3
根据每个group有多少 Y = 1 多少 Y = 0,代入公式,就可以得到你要的答案了。
当然这样子没有考虑时间这个因素。
如果你的最终目的是想知道hospital的effect,我觉得更常见的方法是用logistic
regression。
【在 z**********i 的大作中提到】 : 多谢回复,这里我担心的是outcome是RATE,不是normal distribution. : 比如,anova假定是正态分布的数据.
|
z**********i 发帖数: 12276 | 8 2个category 是理解成binomial?每个病人或者治愈或者没有?
多谢你的回复,接包子.
我想知道between hospital的effect占总的variance的多少.
时间因素很重要.
【在 t**c 的大作中提到】 : 对,因为是categorical data,所以不能用一般意义上的anova。 : 我上个帖子在附件里贴出了怎么对categorical data做variance的partition. : 具体到你的数据: : 两个category (0或者1):I = 2 : 三个group (hospital1 to hospital 3): G = 3 : 根据每个group有多少 Y = 1 多少 Y = 0,代入公式,就可以得到你要的答案了。 : 当然这样子没有考虑时间这个因素。 : 如果你的最终目的是想知道hospital的effect,我觉得更常见的方法是用logistic : regression。
|
m*****y 发帖数: 229 | 9 今天翻回去看了下以前上课的ppt,觉得repeated measure可以。因为用SPSS GLM
repeated measure 的结果里会出现两个table,“test of within subject effect”
和"test of between subject effect"。total variance在第一个table里,between
hospital variance 在第二个table里,所以应该可以知道“between hospital的
effect占总的variance的多少”。
很久前学得了,都快忘光了,也不知道对不对。谢谢你的包子,呵呵。 |
s*r 发帖数: 2757 | 10 你又不做test,和正太没关系
【在 z**********i 的大作中提到】 : 多谢回复,这里我担心的是outcome是RATE,不是normal distribution. : 比如,anova假定是正态分布的数据.
|
t**c 发帖数: 539 | 11 我个人觉得即使不做test,还是和正太不正太有关系的。
因为一般的anova或者linear model,都基于均值和方差是独立的这个假设。
这个假设正太分布是满足的,但是binomial就不满足了。 |
t**c 发帖数: 539 | 12 我觉得该不该用mixed的model,取决于楼主这里是要把hospital作为一个fixed的变量(只有1-3这3个选项),还是random的变量。
如果是前者,是用两个dummy variable来model hospital effect,估计的参数是两个coefficients。
如果是后者,估计的是hospital这个randome variable的variance。但是这里response variable是catigorical data,情况就变得有点复杂。因为用mixed model的话,也应该用multilevel logistic (or probit) model。用intercept only model,可以估计出level 2的variance。但是这个variance是针对latent variable而言,并不是response variable的variance。
【在 m*****y 的大作中提到】 : 今天翻回去看了下以前上课的ppt,觉得repeated measure可以。因为用SPSS GLM : repeated measure 的结果里会出现两个table,“test of within subject effect” : 和"test of between subject effect"。total variance在第一个table里,between : hospital variance 在第二个table里,所以应该可以知道“between hospital的 : effect占总的variance的多少”。 : 很久前学得了,都快忘光了,也不知道对不对。谢谢你的包子,呵呵。
|
z**********i 发帖数: 12276 | 13 你的理论水平肯定是PHD LEVEL的.
我上LONGITUDINAL 课的时候,完全没有很懂.老师是照顾情面给我个B. :-(
我的医院有很多,时间也有很多,我列了3个是为了方便理解.
MIXED MODEL是否可以给出WITHIN和BETWEEN VARIANCE,我不知道,几乎没用过.
但OUTCOME是RATE,要GENERALIZED LINEAR MODEL.GEE是MARGINAL MODEL,可能没有
VARIANCE的计算. 用NLMIXED做GENERALIZED MIXED MODEL,或许可以得到VARIANCE?
我的知识实在是有限...
多谢大家的回复!
量(只有1-3这3个选项),还是random的变量。
个coefficients。
response variable是catigorical data,情况就变得有点复杂。因为用mixed model的
话,也应该用multilevel logistic (or probit) model。用intercept only model,可
以估计出level 2的variance。但是这个variance是针对latent variable而言,并不是
response variable的variance。
【在 t**c 的大作中提到】 : 我觉得该不该用mixed的model,取决于楼主这里是要把hospital作为一个fixed的变量(只有1-3这3个选项),还是random的变量。 : 如果是前者,是用两个dummy variable来model hospital effect,估计的参数是两个coefficients。 : 如果是后者,估计的是hospital这个randome variable的variance。但是这里response variable是catigorical data,情况就变得有点复杂。因为用mixed model的话,也应该用multilevel logistic (or probit) model。用intercept only model,可以估计出level 2的variance。但是这个variance是针对latent variable而言,并不是response variable的variance。
|