I*M 发帖数: 937 | 1 在分析数据的时候经常会有这样一个问题,一个histogram所展示的数据究竟代表一个
population还是两个或多个?比如附件里的一个例子,量了颗粒直径,发现大部分在0.
175,可能在0.075附近有一个小峰,怎样通过统计学的方法来判断这是一个大的
population还是两个population叠加在一起?
翻了以前的资料,看到有种说法是,如果峰高大于总数的1/2次幂,就可以认为这是一
个signal。对这种说法还不是很理解。怎样判断峰高的高度呢?如果两个高斯分布的
population混在一起,中间不是会变得很平坦么。
还有种说法是做t-text,看p-value如何。这个具体做起来是怎样呢?我的理解是把前
后两个峰的数据分别做高斯拟合,然后把高斯拟合的两个曲线做t-test。如果是这样的
话,做t-test的两组数据怎么取呢?是用高斯拟合曲线的横坐标?
这个问题经常会碰到。有时候很明显的两个峰,老师还会说这个不一定显著。所以我很
想知道怎样来判断是否显著这个问题。先谢谢大家了!!! |
s******s 发帖数: 13035 | 2 你是想test这个是不是一个正态分布么?直接run个normality test不就行了
0.
【在 I*M 的大作中提到】 : 在分析数据的时候经常会有这样一个问题,一个histogram所展示的数据究竟代表一个 : population还是两个或多个?比如附件里的一个例子,量了颗粒直径,发现大部分在0. : 175,可能在0.075附近有一个小峰,怎样通过统计学的方法来判断这是一个大的 : population还是两个population叠加在一起? : 翻了以前的资料,看到有种说法是,如果峰高大于总数的1/2次幂,就可以认为这是一 : 个signal。对这种说法还不是很理解。怎样判断峰高的高度呢?如果两个高斯分布的 : population混在一起,中间不是会变得很平坦么。 : 还有种说法是做t-text,看p-value如何。这个具体做起来是怎样呢?我的理解是把前 : 后两个峰的数据分别做高斯拟合,然后把高斯拟合的两个曲线做t-test。如果是这样的 : 话,做t-test的两组数据怎么取呢?是用高斯拟合曲线的横坐标?
|
b******y 发帖数: 627 | 3 You can fit your profile to a single normal distribution with two adjustable
variables (mean and variance) and obtain a residual; then fit it to two
normal distributions coexisting with four adjustable variables (two means
and two variances) and obtain a residual. Run F-test to see whether the
improvement on the residual justify the necessity of invoking the
complicated model, i.e. two normal distributions coexisting. |
I*M 发帖数: 937 | 4 非常感谢!!
adjustable
【在 b******y 的大作中提到】 : You can fit your profile to a single normal distribution with two adjustable : variables (mean and variance) and obtain a residual; then fit it to two : normal distributions coexisting with four adjustable variables (two means : and two variances) and obtain a residual. Run F-test to see whether the : improvement on the residual justify the necessity of invoking the : complicated model, i.e. two normal distributions coexisting.
|
n********t 发帖数: 1079 | 5 如果你的假设前提是数据都来自normal distribution,可以用R的mclust package,中
间有mclustBIC/mclusteModel直接估算最佳模型 |
z*********8 发帖数: 1203 | 6 如果只是比较2组的数据的话,你说的f test是anova里的多组数据适用把,当然2组的
话也不是不可以用。因为你的数据好像不能确定是不是normal distribution(因为样
本小)我倒是觉得应该就run个non-parametric test,什么wilcoxon rank sum test(
for non parametric non paired data), rank test, wilcoxon rank test(later
two for non parametric paired data)之类的。我说的不一定对啊,刚考完生统的人
路过。严重理论跟实践脱节啊!
adjustable
【在 b******y 的大作中提到】 : You can fit your profile to a single normal distribution with two adjustable : variables (mean and variance) and obtain a residual; then fit it to two : normal distributions coexisting with four adjustable variables (two means : and two variances) and obtain a residual. Run F-test to see whether the : improvement on the residual justify the necessity of invoking the : complicated model, i.e. two normal distributions coexisting.
|