由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
Biology版 - 问一个SD值大于Ave的问题
相关主题
问个统计的问题投的论文, 怎么办呢
这个图叫什么名字?如何算P value?
TCGA 数据库求助: BRCA1突变肿瘤下两种subsets药物敏感度比较大家发文章用standard deviation,还是standard error?
想快速入门NGS sequence analysis, 怎样开始比较科学?警告:天津医科大学某医院,某国家XX中心不要再投Journal of Neuro-Oncology
简单地说说生物医学里的统计应用吧统计方法请教-如何计算这种差异的p值
iq 测试[转载] 科学技术的重大变革:生物芯片
Question about statistical test for data significance[合集] polyribosome的延长时间有什么实验方法可以比较啊
hypermethyation 统计问题求教请教一个简单的数据统计问题
相关话题的讨论汇总
话题: sd话题: mean话题: ave话题: std话题: 大于
进入Biology版参与讨论
1 (共1页)
t*****t
发帖数: 773
1
我看到发表的非常好的期刊上的文章,有些文章的附件下载下来阅读时 发现很多测的
的指标的数据的群体平均值(比如小鼠群体药剂刺激后的某些指标, N>20)远远小于
群体测定的标准误。这个问题我疑惑的是,该怎么理解? 群体变异程度这么大,数据
靠谱吗?
谢谢! 因为自己实验过程中要是遇到这些问题,一般都是重新设计实验,重新测定,
尽量减小SD值的
s******s
发帖数: 13035
2
很正常,不觉得有啥不正常

【在 t*****t 的大作中提到】
: 我看到发表的非常好的期刊上的文章,有些文章的附件下载下来阅读时 发现很多测的
: 的指标的数据的群体平均值(比如小鼠群体药剂刺激后的某些指标, N>20)远远小于
: 群体测定的标准误。这个问题我疑惑的是,该怎么理解? 群体变异程度这么大,数据
: 靠谱吗?
: 谢谢! 因为自己实验过程中要是遇到这些问题,一般都是重新设计实验,重新测定,
: 尽量减小SD值的

x**2
发帖数: 255
3
我有和楼主一样的疑问
这个。。。正常么?

【在 s******s 的大作中提到】
: 很正常,不觉得有啥不正常
s******s
发帖数: 13035
4
给一个理由,为啥mean必须大于sd? 有啥不正常的

【在 x**2 的大作中提到】
: 我有和楼主一样的疑问
: 这个。。。正常么?

h******s
发帖数: 3420
5
这个SD特定于某个population, 某个statistical test.
你不能拿population A 的SD 去套 population B 的 mean
这么小的sample 往往还有power (type ii error ) 的问题
这里面牵扯到比较复杂的统计知识,是不是有效应该由统计学的parameter 来决定,不
能这样简单加减
建议你找专门的statistician 分析data

【在 t*****t 的大作中提到】
: 我看到发表的非常好的期刊上的文章,有些文章的附件下载下来阅读时 发现很多测的
: 的指标的数据的群体平均值(比如小鼠群体药剂刺激后的某些指标, N>20)远远小于
: 群体测定的标准误。这个问题我疑惑的是,该怎么理解? 群体变异程度这么大,数据
: 靠谱吗?
: 谢谢! 因为自己实验过程中要是遇到这些问题,一般都是重新设计实验,重新测定,
: 尽量减小SD值的

t******g
发帖数: 372
6
这种想法是基于 snr/cv 这些信噪比的概念而来的.
可以作为数据质量的一个检验方式,但不是对所有生物实验数据都有价值,还和数据测
量的scale有关系。具体到你的例子,某pop内treat后的指标如此事实上是正常的,尤
其测量值都不大接近0,虽然不完美; 但如果treat前也是如此,组内差异极大,那就该
重来了。
换句话说,这种qc是不是有价值还要看你要回答什么样的问题,如果你要得出一个很一
般性的结论,这种se大于mean的数据不能提供足够的证据。但如果你只想得出存在一种
可能性,或者目的是拿这个测量值作为性状进行相关分析,这样差异大的数据反而是你
想要的。

【在 t*****t 的大作中提到】
: 我看到发表的非常好的期刊上的文章,有些文章的附件下载下来阅读时 发现很多测的
: 的指标的数据的群体平均值(比如小鼠群体药剂刺激后的某些指标, N>20)远远小于
: 群体测定的标准误。这个问题我疑惑的是,该怎么理解? 群体变异程度这么大,数据
: 靠谱吗?
: 谢谢! 因为自己实验过程中要是遇到这些问题,一般都是重新设计实验,重新测定,
: 尽量减小SD值的

t*****t
发帖数: 773
7
非常有道理!

【在 t******g 的大作中提到】
: 这种想法是基于 snr/cv 这些信噪比的概念而来的.
: 可以作为数据质量的一个检验方式,但不是对所有生物实验数据都有价值,还和数据测
: 量的scale有关系。具体到你的例子,某pop内treat后的指标如此事实上是正常的,尤
: 其测量值都不大接近0,虽然不完美; 但如果treat前也是如此,组内差异极大,那就该
: 重来了。
: 换句话说,这种qc是不是有价值还要看你要回答什么样的问题,如果你要得出一个很一
: 般性的结论,这种se大于mean的数据不能提供足够的证据。但如果你只想得出存在一种
: 可能性,或者目的是拿这个测量值作为性状进行相关分析,这样差异大的数据反而是你
: 想要的。

l********k
发帖数: 14844
8
如果被统计的数值可正可负,mean和std不需要有什么大小关系。如果被统计的数据都
是非负的,std仍然可能大于mean,这个取决于具体的分布。比如指数分布,mean =
std,[0 0 1 1],也是mean = std。而比如说[0 0 1], mean = 0.333, std = 0.47,
std > mean.
简言之,分布的不对称性越大,std越是一个不好的参数。如果要画图,通常不能画
mean +/- std bar graph,而是要画成boxplot:
t*****t
发帖数: 773
9
呵呵,土人受教了。

【在 l********k 的大作中提到】
: 如果被统计的数值可正可负,mean和std不需要有什么大小关系。如果被统计的数据都
: 是非负的,std仍然可能大于mean,这个取决于具体的分布。比如指数分布,mean =
: std,[0 0 1 1],也是mean = std。而比如说[0 0 1], mean = 0.333, std = 0.47,
: std > mean.
: 简言之,分布的不对称性越大,std越是一个不好的参数。如果要画图,通常不能画
: mean +/- std bar graph,而是要画成boxplot:

C*****h
发帖数: 926
10
如果测量值正态分布,而且测量值都不小于零,那么STDEV不可能大于AVE。
如果测量的值有负数,或者测量值不是正态分布的,那么STDEV有可能大于AVE。
如果测量值不是正态分布的,最好不要用AVE+/-STDEV,没什么意义。

【在 t*****t 的大作中提到】
: 我看到发表的非常好的期刊上的文章,有些文章的附件下载下来阅读时 发现很多测的
: 的指标的数据的群体平均值(比如小鼠群体药剂刺激后的某些指标, N>20)远远小于
: 群体测定的标准误。这个问题我疑惑的是,该怎么理解? 群体变异程度这么大,数据
: 靠谱吗?
: 谢谢! 因为自己实验过程中要是遇到这些问题,一般都是重新设计实验,重新测定,
: 尽量减小SD值的

相关主题
iq 测试投的论文, 怎么办呢
Question about statistical test for data significance如何算P value?
hypermethyation 统计问题求教大家发文章用standard deviation,还是standard error?
进入Biology版参与讨论
s******s
发帖数: 13035
11
en. 楼主的疑惑就是因为脑子里默认了正态分布,所以觉得
不可思议。这个默认是错误的

【在 C*****h 的大作中提到】
: 如果测量值正态分布,而且测量值都不小于零,那么STDEV不可能大于AVE。
: 如果测量的值有负数,或者测量值不是正态分布的,那么STDEV有可能大于AVE。
: 如果测量值不是正态分布的,最好不要用AVE+/-STDEV,没什么意义。

l********k
发帖数: 14844
12
搞死分布任意实数都有非零的概率出现。不过在平均比较大的情况下,泊松分布近似等
于搞死分布。
你说的没错,很多统计结果,根本就不是搞死分布,最好搞个实际的概率模型来描述,
还能整出点定量的东西。不过可能很多纯生物的人到这儿就走不动了。

【在 C*****h 的大作中提到】
: 如果测量值正态分布,而且测量值都不小于零,那么STDEV不可能大于AVE。
: 如果测量的值有负数,或者测量值不是正态分布的,那么STDEV有可能大于AVE。
: 如果测量值不是正态分布的,最好不要用AVE+/-STDEV,没什么意义。

z**********8
发帖数: 766
13
学习了,谢谢
t******g
发帖数: 372
14
统计是理想化的,有时甚至是空想的
而生物是实验的,有局限性,如sample size
多数在用的优雅的param统计校验 是需要前提条件的,如最常见的normal或者poisson
分布
对于dev统计方法的人,他们可能会告诉你sample要足够大抽样要独立,这样即使不是
正态也可以放松近似成正态,thanks to almighty CLT。 然后什么叫足够大 就仁者见
仁了。5?10?20?30? 随便simulate一下 你会发现即使从真的正态分布的数据里重
复抽30个然后验证正态性,还是可能会有5%左右fail,从poisson抽可能15%甚至更高;
当mean接近0时或者有负数,sd>mean是几乎肯定的。对于多数非负的测量值,如果mean
足够大,就是ls说的这种情况,也能更好的逼进正态分布。
至于解决方式,找到真实的分布不太可能,permutation这种非参数校验就是个万金油
,容易实现就是机器累点。
ps,刚发现lz标题写的sd,文中写的标准误=sd/sqrt(n),不要搞混。。。

【在 l********k 的大作中提到】
: 搞死分布任意实数都有非零的概率出现。不过在平均比较大的情况下,泊松分布近似等
: 于搞死分布。
: 你说的没错,很多统计结果,根本就不是搞死分布,最好搞个实际的概率模型来描述,
: 还能整出点定量的东西。不过可能很多纯生物的人到这儿就走不动了。

t*****t
发帖数: 773
15
谢谢,谢谢,谢谢! 了解了很多
1 (共1页)
进入Biology版参与讨论
相关主题
请教一个简单的数据统计问题简单地说说生物医学里的统计应用吧
我就抛砖引玉了吧iq 测试
有人成功从基础研究lab找工作到临床lab吗?Question about statistical test for data significance
如何测定细胞内proteasome的量?hypermethyation 统计问题求教
问个统计的问题投的论文, 怎么办呢
这个图叫什么名字?如何算P value?
TCGA 数据库求助: BRCA1突变肿瘤下两种subsets药物敏感度比较大家发文章用standard deviation,还是standard error?
想快速入门NGS sequence analysis, 怎样开始比较科学?警告:天津医科大学某医院,某国家XX中心不要再投Journal of Neuro-Oncology
相关话题的讨论汇总
话题: sd话题: mean话题: ave话题: std话题: 大于