t*****t 发帖数: 773 | 1 我看到发表的非常好的期刊上的文章,有些文章的附件下载下来阅读时 发现很多测的
的指标的数据的群体平均值(比如小鼠群体药剂刺激后的某些指标, N>20)远远小于
群体测定的标准误。这个问题我疑惑的是,该怎么理解? 群体变异程度这么大,数据
靠谱吗?
谢谢! 因为自己实验过程中要是遇到这些问题,一般都是重新设计实验,重新测定,
尽量减小SD值的 |
s******s 发帖数: 13035 | 2 很正常,不觉得有啥不正常
【在 t*****t 的大作中提到】 : 我看到发表的非常好的期刊上的文章,有些文章的附件下载下来阅读时 发现很多测的 : 的指标的数据的群体平均值(比如小鼠群体药剂刺激后的某些指标, N>20)远远小于 : 群体测定的标准误。这个问题我疑惑的是,该怎么理解? 群体变异程度这么大,数据 : 靠谱吗? : 谢谢! 因为自己实验过程中要是遇到这些问题,一般都是重新设计实验,重新测定, : 尽量减小SD值的
|
x**2 发帖数: 255 | 3 我有和楼主一样的疑问
这个。。。正常么?
【在 s******s 的大作中提到】 : 很正常,不觉得有啥不正常
|
s******s 发帖数: 13035 | 4 给一个理由,为啥mean必须大于sd? 有啥不正常的
【在 x**2 的大作中提到】 : 我有和楼主一样的疑问 : 这个。。。正常么?
|
h******s 发帖数: 3420 | 5 这个SD特定于某个population, 某个statistical test.
你不能拿population A 的SD 去套 population B 的 mean
这么小的sample 往往还有power (type ii error ) 的问题
这里面牵扯到比较复杂的统计知识,是不是有效应该由统计学的parameter 来决定,不
能这样简单加减
建议你找专门的statistician 分析data
【在 t*****t 的大作中提到】 : 我看到发表的非常好的期刊上的文章,有些文章的附件下载下来阅读时 发现很多测的 : 的指标的数据的群体平均值(比如小鼠群体药剂刺激后的某些指标, N>20)远远小于 : 群体测定的标准误。这个问题我疑惑的是,该怎么理解? 群体变异程度这么大,数据 : 靠谱吗? : 谢谢! 因为自己实验过程中要是遇到这些问题,一般都是重新设计实验,重新测定, : 尽量减小SD值的
|
t******g 发帖数: 372 | 6 这种想法是基于 snr/cv 这些信噪比的概念而来的.
可以作为数据质量的一个检验方式,但不是对所有生物实验数据都有价值,还和数据测
量的scale有关系。具体到你的例子,某pop内treat后的指标如此事实上是正常的,尤
其测量值都不大接近0,虽然不完美; 但如果treat前也是如此,组内差异极大,那就该
重来了。
换句话说,这种qc是不是有价值还要看你要回答什么样的问题,如果你要得出一个很一
般性的结论,这种se大于mean的数据不能提供足够的证据。但如果你只想得出存在一种
可能性,或者目的是拿这个测量值作为性状进行相关分析,这样差异大的数据反而是你
想要的。
【在 t*****t 的大作中提到】 : 我看到发表的非常好的期刊上的文章,有些文章的附件下载下来阅读时 发现很多测的 : 的指标的数据的群体平均值(比如小鼠群体药剂刺激后的某些指标, N>20)远远小于 : 群体测定的标准误。这个问题我疑惑的是,该怎么理解? 群体变异程度这么大,数据 : 靠谱吗? : 谢谢! 因为自己实验过程中要是遇到这些问题,一般都是重新设计实验,重新测定, : 尽量减小SD值的
|
t*****t 发帖数: 773 | 7 非常有道理!
【在 t******g 的大作中提到】 : 这种想法是基于 snr/cv 这些信噪比的概念而来的. : 可以作为数据质量的一个检验方式,但不是对所有生物实验数据都有价值,还和数据测 : 量的scale有关系。具体到你的例子,某pop内treat后的指标如此事实上是正常的,尤 : 其测量值都不大接近0,虽然不完美; 但如果treat前也是如此,组内差异极大,那就该 : 重来了。 : 换句话说,这种qc是不是有价值还要看你要回答什么样的问题,如果你要得出一个很一 : 般性的结论,这种se大于mean的数据不能提供足够的证据。但如果你只想得出存在一种 : 可能性,或者目的是拿这个测量值作为性状进行相关分析,这样差异大的数据反而是你 : 想要的。
|
l********k 发帖数: 14844 | 8 如果被统计的数值可正可负,mean和std不需要有什么大小关系。如果被统计的数据都
是非负的,std仍然可能大于mean,这个取决于具体的分布。比如指数分布,mean =
std,[0 0 1 1],也是mean = std。而比如说[0 0 1], mean = 0.333, std = 0.47,
std > mean.
简言之,分布的不对称性越大,std越是一个不好的参数。如果要画图,通常不能画
mean +/- std bar graph,而是要画成boxplot: |
t*****t 发帖数: 773 | 9 呵呵,土人受教了。
【在 l********k 的大作中提到】 : 如果被统计的数值可正可负,mean和std不需要有什么大小关系。如果被统计的数据都 : 是非负的,std仍然可能大于mean,这个取决于具体的分布。比如指数分布,mean = : std,[0 0 1 1],也是mean = std。而比如说[0 0 1], mean = 0.333, std = 0.47, : std > mean. : 简言之,分布的不对称性越大,std越是一个不好的参数。如果要画图,通常不能画 : mean +/- std bar graph,而是要画成boxplot:
|
C*****h 发帖数: 926 | 10 如果测量值正态分布,而且测量值都不小于零,那么STDEV不可能大于AVE。
如果测量的值有负数,或者测量值不是正态分布的,那么STDEV有可能大于AVE。
如果测量值不是正态分布的,最好不要用AVE+/-STDEV,没什么意义。
【在 t*****t 的大作中提到】 : 我看到发表的非常好的期刊上的文章,有些文章的附件下载下来阅读时 发现很多测的 : 的指标的数据的群体平均值(比如小鼠群体药剂刺激后的某些指标, N>20)远远小于 : 群体测定的标准误。这个问题我疑惑的是,该怎么理解? 群体变异程度这么大,数据 : 靠谱吗? : 谢谢! 因为自己实验过程中要是遇到这些问题,一般都是重新设计实验,重新测定, : 尽量减小SD值的
|
|
|
s******s 发帖数: 13035 | 11 en. 楼主的疑惑就是因为脑子里默认了正态分布,所以觉得
不可思议。这个默认是错误的
【在 C*****h 的大作中提到】 : 如果测量值正态分布,而且测量值都不小于零,那么STDEV不可能大于AVE。 : 如果测量的值有负数,或者测量值不是正态分布的,那么STDEV有可能大于AVE。 : 如果测量值不是正态分布的,最好不要用AVE+/-STDEV,没什么意义。
|
l********k 发帖数: 14844 | 12 搞死分布任意实数都有非零的概率出现。不过在平均比较大的情况下,泊松分布近似等
于搞死分布。
你说的没错,很多统计结果,根本就不是搞死分布,最好搞个实际的概率模型来描述,
还能整出点定量的东西。不过可能很多纯生物的人到这儿就走不动了。
【在 C*****h 的大作中提到】 : 如果测量值正态分布,而且测量值都不小于零,那么STDEV不可能大于AVE。 : 如果测量的值有负数,或者测量值不是正态分布的,那么STDEV有可能大于AVE。 : 如果测量值不是正态分布的,最好不要用AVE+/-STDEV,没什么意义。
|
z**********8 发帖数: 766 | |
t******g 发帖数: 372 | 14 统计是理想化的,有时甚至是空想的
而生物是实验的,有局限性,如sample size
多数在用的优雅的param统计校验 是需要前提条件的,如最常见的normal或者poisson
分布
对于dev统计方法的人,他们可能会告诉你sample要足够大抽样要独立,这样即使不是
正态也可以放松近似成正态,thanks to almighty CLT。 然后什么叫足够大 就仁者见
仁了。5?10?20?30? 随便simulate一下 你会发现即使从真的正态分布的数据里重
复抽30个然后验证正态性,还是可能会有5%左右fail,从poisson抽可能15%甚至更高;
当mean接近0时或者有负数,sd>mean是几乎肯定的。对于多数非负的测量值,如果mean
足够大,就是ls说的这种情况,也能更好的逼进正态分布。
至于解决方式,找到真实的分布不太可能,permutation这种非参数校验就是个万金油
,容易实现就是机器累点。
ps,刚发现lz标题写的sd,文中写的标准误=sd/sqrt(n),不要搞混。。。
【在 l********k 的大作中提到】 : 搞死分布任意实数都有非零的概率出现。不过在平均比较大的情况下,泊松分布近似等 : 于搞死分布。 : 你说的没错,很多统计结果,根本就不是搞死分布,最好搞个实际的概率模型来描述, : 还能整出点定量的东西。不过可能很多纯生物的人到这儿就走不动了。
|
t*****t 发帖数: 773 | |