s*******w 发帖数: 27 | 1 在学校时, 总认为在做ANOVA,REGRESSION 分析前要检测Y是不是正态分布。 但在实
际工作中, 好像Y 很难达到这个要求。 我现在只是把Y plot 一下,去掉看似OUTLIER
的极大和极小的值就直接RUN ANOVA,CORR,REGRESSION.我们小公司只有我一个做统计
的。 我的心里很没底,我的做法对吗? 各位高手能给我一些建议吗?在此,先谢过大
家!!! |
l*********s 发帖数: 5409 | 2 The normality assumption is about the fitted errors, not the response Y. |
d******9 发帖数: 404 | 3 If sample size > 30, it approximately has normal distribution. |
s*******w 发帖数: 27 | 4 是的! 做REGRESSION 的时候, 我就是看fitted error。如果它不是正态的, 我一般
就试着LOG(Y)。这样对吗?
所以你的意思是REGRESSION 不需要做是吧?那需要去掉极小和极大值吗?
还有做ANOVA和CORR 的时候呢? 我需要 check the normality assumption 吗?
非常感谢你的回复!!! |
h***i 发帖数: 3844 | 5 when sample size is big, should be ok
【在 s*******w 的大作中提到】 : 是的! 做REGRESSION 的时候, 我就是看fitted error。如果它不是正态的, 我一般 : 就试着LOG(Y)。这样对吗? : 所以你的意思是REGRESSION 不需要做是吧?那需要去掉极小和极大值吗? : 还有做ANOVA和CORR 的时候呢? 我需要 check the normality assumption 吗? : 非常感谢你的回复!!!
|
d**********r 发帖数: 24123 | 6 理论上是需要的。不过如果Sample Size 大,那不做也可。还有就是找找paper,如果
别人做了,拿过来用就行。
【在 s*******w 的大作中提到】 : 是的! 做REGRESSION 的时候, 我就是看fitted error。如果它不是正态的, 我一般 : 就试着LOG(Y)。这样对吗? : 所以你的意思是REGRESSION 不需要做是吧?那需要去掉极小和极大值吗? : 还有做ANOVA和CORR 的时候呢? 我需要 check the normality assumption 吗? : 非常感谢你的回复!!!
|
G*****t 发帖数: 57 | 7 可是真的数据其实多少都可能不是正态的,要看数据来源是不是可靠
个人觉得还要要check下
要不是正态的也得找找原因,看是什么样的histogram才能决定怎么做合适吧 |
s*******w 发帖数: 27 | 8 多谢各位的指点!!!
总结一下
Run ANOVA 和 CORR 时, 根据 Central Limit Theorem, it is not necessary to
check normality assumption if sample size is big enough.
Run GLM 时, 要看histogram来决定用哪个link func 和 validate the normality
assumption by examinging the residuals.
^-^ |