问一个SD值大于Ave的问题 - Biology版

本页内容为未名空间相应帖子的节选和存档，一周内的贴子最多显示50字，超过一周显示500字访问原贴

Biology版 - 问一个SD值大于Ave的问题

相关主题
● 问个统计的问题	● 投的论文，怎么办呢
● 这个图叫什么名字？	● 如何算P value?
● TCGA 数据库求助： BRCA1突变肿瘤下两种subsets药物敏感度比较	● 大家发文章用standard deviation，还是standard error？
● 想快速入门NGS sequence analysis, 怎样开始比较科学？	● 警告：天津医科大学某医院，某国家XX中心不要再投Journal of Neuro-Oncology
● 简单地说说生物医学里的统计应用吧	● 统计方法请教－如何计算这种差异的p值
● iq 测试	● [转载] 科学技术的重大变革：生物芯片
● Question about statistical test for data significance	● [合集] polyribosome的延长时间有什么实验方法可以比较啊
● hypermethyation 统计问题求教	● 请教一个简单的数据统计问题

相关话题的讨论汇总
话题: sd话题: mean话题: ave话题: std话题: 大于

进入Biology版参与讨论

(共1页)

t*****t
发帖数: 773

我看到发表的非常好的期刊上的文章，有些文章的附件下载下来阅读时发现很多测的
的指标的数据的群体平均值（比如小鼠群体药剂刺激后的某些指标， N>20）远远小于
群体测定的标准误。这个问题我疑惑的是，该怎么理解？群体变异程度这么大，数据
靠谱吗？
谢谢！因为自己实验过程中要是遇到这些问题，一般都是重新设计实验，重新测定，
尽量减小SD值的

s******s
发帖数: 13035

很正常，不觉得有啥不正常

【在 t*****t 的大作中提到】

: 我看到发表的非常好的期刊上的文章，有些文章的附件下载下来阅读时发现很多测的
: 的指标的数据的群体平均值（比如小鼠群体药剂刺激后的某些指标， N>20）远远小于
: 群体测定的标准误。这个问题我疑惑的是，该怎么理解？群体变异程度这么大，数据
: 靠谱吗？
: 谢谢！因为自己实验过程中要是遇到这些问题，一般都是重新设计实验，重新测定，
: 尽量减小SD值的

x**2
发帖数: 255

我有和楼主一样的疑问
这个。。。正常么？

【在 s******s 的大作中提到】

: 很正常，不觉得有啥不正常

s******s
发帖数: 13035

给一个理由，为啥mean必须大于sd? 有啥不正常的

【在 x**2 的大作中提到】

: 我有和楼主一样的疑问
: 这个。。。正常么？

h******s
发帖数: 3420

这个SD特定于某个population, 某个statistical test.
你不能拿population A 的SD 去套 population B 的 mean
这么小的sample 往往还有power （type ii error ) 的问题
这里面牵扯到比较复杂的统计知识，是不是有效应该由统计学的parameter 来决定，不
能这样简单加减
建议你找专门的statistician 分析data

【在 t*****t 的大作中提到】

t******g
发帖数: 372

这种想法是基于 snr/cv 这些信噪比的概念而来的.
可以作为数据质量的一个检验方式，但不是对所有生物实验数据都有价值，还和数据测
量的scale有关系。具体到你的例子，某pop内treat后的指标如此事实上是正常的，尤
其测量值都不大接近0,虽然不完美; 但如果treat前也是如此，组内差异极大，那就该
重来了。
换句话说，这种qc是不是有价值还要看你要回答什么样的问题，如果你要得出一个很一
般性的结论，这种se大于mean的数据不能提供足够的证据。但如果你只想得出存在一种
可能性,或者目的是拿这个测量值作为性状进行相关分析，这样差异大的数据反而是你
想要的。

【在 t*****t 的大作中提到】

t*****t
发帖数: 773

非常有道理！

【在 t******g 的大作中提到】

: 这种想法是基于 snr/cv 这些信噪比的概念而来的.
: 可以作为数据质量的一个检验方式，但不是对所有生物实验数据都有价值，还和数据测
: 量的scale有关系。具体到你的例子，某pop内treat后的指标如此事实上是正常的，尤
: 其测量值都不大接近0,虽然不完美; 但如果treat前也是如此，组内差异极大，那就该
: 重来了。
: 换句话说，这种qc是不是有价值还要看你要回答什么样的问题，如果你要得出一个很一
: 般性的结论，这种se大于mean的数据不能提供足够的证据。但如果你只想得出存在一种
: 可能性,或者目的是拿这个测量值作为性状进行相关分析，这样差异大的数据反而是你
: 想要的。

l********k
发帖数: 14844

如果被统计的数值可正可负，mean和std不需要有什么大小关系。如果被统计的数据都
是非负的，std仍然可能大于mean，这个取决于具体的分布。比如指数分布，mean =
std，[0 0 1 1]，也是mean = std。而比如说[0 0 1]， mean = 0.333, std = 0.47，
std > mean.
简言之，分布的不对称性越大，std越是一个不好的参数。如果要画图，通常不能画
mean +/- std bar graph，而是要画成boxplot:

t*****t
发帖数: 773

呵呵，土人受教了。

【在 l********k 的大作中提到】

: 如果被统计的数值可正可负，mean和std不需要有什么大小关系。如果被统计的数据都
: 是非负的，std仍然可能大于mean，这个取决于具体的分布。比如指数分布，mean =
: std，[0 0 1 1]，也是mean = std。而比如说[0 0 1]， mean = 0.333, std = 0.47，
: std > mean.
: 简言之，分布的不对称性越大，std越是一个不好的参数。如果要画图，通常不能画
: mean +/- std bar graph，而是要画成boxplot:

C*****h
发帖数: 926

如果测量值正态分布，而且测量值都不小于零，那么STDEV不可能大于AVE。
如果测量的值有负数，或者测量值不是正态分布的，那么STDEV有可能大于AVE。
如果测量值不是正态分布的，最好不要用AVE+/-STDEV，没什么意义。

【在 t*****t 的大作中提到】

相关主题
● iq 测试	● 投的论文，怎么办呢
● Question about statistical test for data significance	● 如何算P value?
● hypermethyation 统计问题求教	● 大家发文章用standard deviation，还是standard error？
进入Biology版参与讨论

s******s
发帖数: 13035

en. 楼主的疑惑就是因为脑子里默认了正态分布，所以觉得
不可思议。这个默认是错误的

【在 C*****h 的大作中提到】

: 如果测量值正态分布，而且测量值都不小于零，那么STDEV不可能大于AVE。
: 如果测量的值有负数，或者测量值不是正态分布的，那么STDEV有可能大于AVE。
: 如果测量值不是正态分布的，最好不要用AVE+/-STDEV，没什么意义。

l********k
发帖数: 14844

搞死分布任意实数都有非零的概率出现。不过在平均比较大的情况下，泊松分布近似等
于搞死分布。
你说的没错，很多统计结果，根本就不是搞死分布，最好搞个实际的概率模型来描述，
还能整出点定量的东西。不过可能很多纯生物的人到这儿就走不动了。

【在 C*****h 的大作中提到】

z**********8
发帖数: 766

学习了，谢谢

t******g
发帖数: 372

统计是理想化的，有时甚至是空想的
而生物是实验的，有局限性，如sample size
多数在用的优雅的param统计校验是需要前提条件的，如最常见的normal或者poisson
分布
对于dev统计方法的人，他们可能会告诉你sample要足够大抽样要独立，这样即使不是
正态也可以放松近似成正态，thanks to almighty CLT。然后什么叫足够大就仁者见
仁了。5？10？20？30？随便simulate一下你会发现即使从真的正态分布的数据里重
复抽30个然后验证正态性，还是可能会有5%左右fail，从poisson抽可能15%甚至更高;
当mean接近0时或者有负数，sd>mean是几乎肯定的。对于多数非负的测量值，如果mean
足够大，就是ls说的这种情况，也能更好的逼进正态分布。
至于解决方式，找到真实的分布不太可能，permutation这种非参数校验就是个万金油
，容易实现就是机器累点。
ps，刚发现lz标题写的sd，文中写的标准误=sd/sqrt(n)，不要搞混。。。

【在 l********k 的大作中提到】

: 搞死分布任意实数都有非零的概率出现。不过在平均比较大的情况下，泊松分布近似等
: 于搞死分布。
: 你说的没错，很多统计结果，根本就不是搞死分布，最好搞个实际的概率模型来描述，
: 还能整出点定量的东西。不过可能很多纯生物的人到这儿就走不动了。

t*****t
发帖数: 773

谢谢，谢谢，谢谢！了解了很多

(共1页)

进入Biology版参与讨论

相关主题
● 请教一个简单的数据统计问题	● 简单地说说生物医学里的统计应用吧
● 我就抛砖引玉了吧	● iq 测试
● 有人成功从基础研究lab找工作到临床lab吗?	● Question about statistical test for data significance
● 如何测定细胞内proteasome的量？	● hypermethyation 统计问题求教
● 问个统计的问题	● 投的论文，怎么办呢
● 这个图叫什么名字？	● 如何算P value?
● TCGA 数据库求助： BRCA1突变肿瘤下两种subsets药物敏感度比较	● 大家发文章用standard deviation，还是standard error？
● 想快速入门NGS sequence analysis, 怎样开始比较科学？	● 警告：天津医科大学某医院，某国家XX中心不要再投Journal of Neuro-Oncology

相关话题的讨论汇总
话题: sd话题: mean话题: ave话题: std话题: 大于

#	版面	帖数(主题数)
-	全站	4871 (796)
1	Military	3777 (569)
2	Stock	341 (51)
3	Joke	117 (17)
4	History	116 (3)
5	Automobile	100 (9)
6	USANews	55 (9)
7	Midlife	45 (1)
8	Headline	41 (41)
9	Dreamer	33 (13)
10	FleaMarket	32 (20)
11	Living	30 (7)

boards

未名新帖统计// 7月16日

历史上的今天