由买买提看人间百态

topics

全部话题 - 话题: pvalue
1 2 3 4 5 下页 末页 (共5页)
y***i
发帖数: 11639
1
来自主题: Statistics版 - 请教Nature上一篇关于pValue的短文
这是我目前对这篇文章的理解,大侠们帮我看看有什么错没有?
发信人: yuuli (听,...听), 信区: Biology
标 题: Re: 请教Nature上一篇关于pValue的短文
发信站: BBS 未名空间站 (Mon Mar 10 11:26:50 2014, 美东)
仔细想了想,我觉得这篇文章是典型的fuss about nothing。
他说的坏的一种情况就是:H1其实是错的(或者是几率很小的),但结果好死不死得
到了一个高的 pValue,这种情况下,其实null hypthosis成立的几率比H1成立的几率
大。这时候做出reject null hypothosis的推断是错的。
但这种情况有多少?在生物学研究里会不会造成严重危害?
首先,这种情况是小几率事件随机发生,本身机会不大。当然夜路走多了总会遇见鬼
,这个就是说的遇见鬼的情况。(文章里说的pVlue = 0.05, false alarm = 0.29,但
这种情况下还得到pValue = 0.05的结果其实是小几率撞到了。)
注:文章开始的那个例子就是典型夜路撞鬼的倒霉蛋,第一次得到了pVal... 阅读全帖
y***i
发帖数: 11639
2
仔细想了想,我觉得这篇文章是典型的fuss about nothing。
他说的坏的一种情况就是:H1其实是错的(或者是几率很小的),但结果好死不死得
到了一个高的 pValue,这种情况下,其实null hypthosis成立的几率比H1成立的几率
大。这时候做出reject null hypothosis的推断是错的。
但这种情况有多少?在生物学研究里会不会造成严重危害?
首先,这种情况是小几率事件随机发生,本身机会不大。当然夜路走多了总会遇见鬼
,这个就是说的遇见鬼的情况。(文章里说的pVlue = 0.05, false alarm = 0.29,但
这种情况下还得到pValue = 0.05的结果其实是小几率撞到了。)
注:文章开始的那个例子就是典型夜路撞鬼的倒霉蛋,第一次得到了pValue = 0.01
,第二次没了pValue = 0.5。要不是数据收集的问题,就是倒了一次霉而已。但文章完
全不提他其实是中了奖,说的给人的感觉好像每个pValue = 0.01的结果,都很有可能
下一次得到pValue = 0.5
其次,这种情况,因为其随机小几率特性,简单... 阅读全帖
r******g
发帖数: 600
3
你的null hypothesis和你实际上计算pvalue的算法必须是一样的啊
文章里面那个图:
根据之前的hypothesis,某个实验是 A结果 比 B结果 大概 1:19ratio 的 情况
比如一个组,重复了实验100遍,最后结果是 11:89, expectation是1:19,算出来的
pvalue 是0.05! 如果100次实验如果结果更加 strong 是 30:70, Pvalue就更低 0.
01.
因为在一个sampling distribution of 这个 statistic 的情况里,出现这种30:70的
概率自然比 11:89 更低了!
但是如果是tossing coin这种1:1概率的事情,你的nullhypothesis就变了,于是,当
你撒100次,得到11:89的情况时,你的P value就会变的非常非常significant P<0.01
我文章没读完,但是,我估计作者可能是这个意思吧~ 统计真是高深的学问撒,学了
真的好有意思
r******g
发帖数: 600
4
你的null hypothesis和你实际上计算pvalue的算法必须是一样的啊
文章里面那个图:
根据之前的hypothesis,某个实验是 A结果 比 B结果 大概 1:19ratio 的 情况
比如一个组,重复了实验100遍,最后结果是 11:89, expectation是1:19,算出来的
pvalue 是0.05! 如果100次实验如果结果更加 strong 是 30:70, Pvalue就更低 0.
01.
因为在一个sampling distribution of 这个 statistic 的情况里,出现这种30:70的
概率自然比 11:89 更低了!
但是如果是tossing coin这种1:1概率的事情,你的nullhypothesis就变了,于是,当
你撒100次,得到11:89的情况时,你的P value就会变的非常非常significant P<0.01
我文章没读完,但是,我估计作者可能是这个意思吧~ 统计真是高深的学问撒,学了
真的好有意思
y***i
发帖数: 11639
5
来自主题: Statistics版 - 请教Nature上一篇关于pValue的短文
【 以下文字转载自 Biology 讨论区 】
发信人: yuuli (听,...听), 信区: Biology
标 题: 请教Nature上一篇关于pValue的短文
发信站: BBS 未名空间站 (Thu Mar 6 14:45:15 2014, 美东)
http://www.nature.com/news/scientific-method-statistical-errors
看得我晕头转向,实在不能理解那个唯一的一张图讲什么。谁能帮帮我。我发了一个
评论:
Can anyone help me understand the "probable cause" picture of the paper? I
admit that I am lost. 1. What is the meaning of "odds of hypothesis"? A
hypothesis can be Right, or wrong. What is odds of it mean? If we know the
odds, do we still need to know pValu... 阅读全帖
y***i
发帖数: 11639
6
来自主题: Statistics版 - 请教Nature上一篇关于pValue的短文
【 以下文字转载自 Biology 讨论区 】
发信人: yuuli (听,...听), 信区: Biology
标 题: 请教Nature上一篇关于pValue的短文
发信站: BBS 未名空间站 (Thu Mar 6 14:45:15 2014, 美东)
http://www.nature.com/news/scientific-method-statistical-errors
看得我晕头转向,实在不能理解那个唯一的一张图讲什么。谁能帮帮我。我发了一个
评论:
Can anyone help me understand the "probable cause" picture of the paper? I
admit that I am lost. 1. What is the meaning of "odds of hypothesis"? A
hypothesis can be Right, or wrong. What is odds of it mean? If we know the
odds, do we still need to know pValu... 阅读全帖
y***i
发帖数: 11639
7
http://www.nature.com/news/scientific-method-statistical-errors
看得我晕头转向,实在不能理解那个唯一的一张图讲什么。谁能帮帮我。我发了一个
评论:
Can anyone help me understand the "probable cause" picture of the paper? I
admit that I am lost. 1. What is the meaning of "odds of hypothesis"? A
hypothesis can be Right, or wrong. What is odds of it mean? If we know the
odds, do we still need to know pValue? 2. How can I get the number in the
picture: 【with 1 to 19 odds of hypothesis】 + 【pValue = 0.05】 --> odds
become 11%vs. 89%. Thank... 阅读全帖
a******k
发帖数: 1190
8
没明白pvalue的计算怎么可以和把握(odds?likelihood?)有关系
我理解的pvalue只是检验你一个hypothesis的可能性
在你这个例子里,只能说明你的effect有5%的可能性是假的(也就是no,这是一个yes
or no的问题)
和50%的把握,71%的把握有什么关系?
如果你要检验这个effect是不是有50%的概率,你应该做一个test
看最后得到结果的分步是不是接近50%,这同样是一个yes or no的问题
并不能把你估计修正成71%
y***i
发帖数: 11639
9
多谢!大体明白了!多谢ferdinandshe大侠和其他大侠侠女!
我现在的初步理解 这个5%:95% + 【pVlue = 0.05】 -->30% vs. 70%的意思大概是
这样的,大家看看对不对:
两盘细胞,一个有treatment,一个没有treatment,我们得到了结果pValue = 0.05,
是不是说明这个treatment就有显著的效果呢?不一定。
比如想象做实验的人很sloppy,两盘细胞过了他的手,就有95%的可能性不一样了。他
得到的数据是 pValue = 0.05,其实只有11%的可能性是treatment有显著效果,89%的
可能性是这不是real effect.

y***i
发帖数: 11639
10
http://www.nature.com/news/scientific-method-statistical-errors
看得我晕头转向,实在不能理解那个唯一的一张图讲什么。谁能帮帮我。我发了一个
评论:
Can anyone help me understand the "probable cause" picture of the paper? I
admit that I am lost. 1. What is the meaning of "odds of hypothesis"? A
hypothesis can be Right, or wrong. What is odds of it mean? If we know the
odds, do we still need to know pValue? 2. How can I get the number in the
picture: 【with 1 to 19 odds of hypothesis】 + 【pValue = 0.05】 --> odds
become 11%vs. 89%. Thank... 阅读全帖
a******k
发帖数: 1190
11
没明白pvalue的计算怎么可以和把握(odds?likelihood?)有关系
我理解的pvalue只是检验你一个hypothesis的可能性
在你这个例子里,只能说明你的effect有5%的可能性是假的(也就是no,这是一个yes
or no的问题)
和50%的把握,71%的把握有什么关系?
如果你要检验这个effect是不是有50%的概率,你应该做一个test
看最后得到结果的分步是不是接近50%,这同样是一个yes or no的问题
并不能把你估计修正成71%
y***i
发帖数: 11639
12
多谢!大体明白了!多谢ferdinandshe大侠和其他大侠侠女!
我现在的初步理解 这个5%:95% + 【pVlue = 0.05】 -->30% vs. 70%的意思大概是
这样的,大家看看对不对:
两盘细胞,一个有treatment,一个没有treatment,我们得到了结果pValue = 0.05,
是不是说明这个treatment就有显著的效果呢?不一定。
比如想象做实验的人很sloppy,两盘细胞过了他的手,就有95%的可能性不一样了。他
得到的数据是 pValue = 0.05,其实只有11%的可能性是treatment有显著效果,89%的
可能性是这不是real effect.

y***i
发帖数: 11639
13
是。但对具体的任何一个问题,都没有这个比例。所以对任何一个具体问题,他算出
来的那些“false alarming ratio”都没有任何指导意义。你不能指着任何一个问题,
说它pValue = 0.05 的false alarming ratio 是 0.29。而这正是文章中做的。你看原
文 “ a P value of 0.05 raises that chance to at least 29%. So Motyl's
finding had a greater than one in ten chance of being a false alarm.
Likewise, the probability of replicating his original result was not 99%, as
most would assume, but something closer to 73% — or only 50%, if he wanted
another 'very significant' result”

这是错的。 Motyl的结论是错的,那他不能重复的机会... 阅读全帖
e**h
发帖数: 46
14
来自主题: Statistics版 - logrank test onesided pvalue
向版上大牛们请教个问题:
我有两组肿瘤病人,分别用两种治疗方法。用logrank test检测两组病人存活时间是否
相同。但是logrank test 只能得到two-sided pvalue。现在我们需要one-sided
pvalue。该怎么计算?请版上大牛推荐个方法和学习资料。包子感谢。
y***i
发帖数: 11639
15
expectation是1:19,结果是11:89,这个pValue = 0.05 是什么意思?1:19的
hypothesis更成立了还是更不成立了?觉得你这个不对啊。。。

0.
01
r******g
发帖数: 600
16
没有问题啊
Null Hypothesis 是 1:19啊
(通俗的解释啊)
你的结果是11:89,P value=0.05的意思是,在null hypothesis基础上只有5%的概率
得到比11:89的情况更extreme的结果啊!所以,你的实验结果是阳性啊啊,换句话说
,你的实验结果跟1:19不一样!
所以,在1:19的背景下,想得到11:89的结果已经是难上加难了,如果想得到30:70
就更难了,只有1%可能得到比30:70更extreme的结果!所以,非常非常不可能,也就
是说,原来1:19的null hypothesis被你的数据推翻了,于是,你的结果是阳性的!
比如,你做一个 RTPCR,control RQ value是 1,1.2, 1.3
实验组 结果是 89, 90, 100.
做这个rtpcr之前,你是不知道结果的,所以你的null hypothesis是,control=
experimtal
显然,你这个结果情况下P value会很低了,因为,基于你的null hypothesis 出现89.
90,100的概率太低了,所以,你的Pvalue很低... 阅读全帖
y***i
发帖数: 11639
17
有点类似。这个5% vs. 95%的“把握”是指,之前的实验,发现了什么结果,事后会
发现
5%是真的,95%是假的。
然后这一次,我们得到了pValue = 0.05,那么11%的可能性是真的。
y***i
发帖数: 11639
18
expectation是1:19,结果是11:89,这个pValue = 0.05 是什么意思?1:19的
hypothesis更成立了还是更不成立了?觉得你这个不对啊。。。

0.
01
r******g
发帖数: 600
19
没有问题啊
Null Hypothesis 是 1:19啊
(通俗的解释啊)
你的结果是11:89,P value=0.05的意思是,在null hypothesis基础上只有5%的概率
得到比11:89的情况更extreme的结果啊!所以,你的实验结果是阳性啊啊,换句话说
,你的实验结果跟1:19不一样!
所以,在1:19的背景下,想得到11:89的结果已经是难上加难了,如果想得到30:70
就更难了,只有1%可能得到比30:70更extreme的结果!所以,非常非常不可能,也就
是说,原来1:19的null hypothesis被你的数据推翻了,于是,你的结果是阳性的!
比如,你做一个 RTPCR,control RQ value是 1,1.2, 1.3
实验组 结果是 89, 90, 100.
做这个rtpcr之前,你是不知道结果的,所以你的null hypothesis是,control=
experimtal
显然,你这个结果情况下P value会很低了,因为,基于你的null hypothesis 出现89.
90,100的概率太低了,所以,你的Pvalue很低... 阅读全帖
y***i
发帖数: 11639
20
有点类似。这个5% vs. 95%的“把握”是指,之前的实验,发现了什么结果,事后会
发现
5%是真的,95%是假的。
然后这一次,我们得到了pValue = 0.05,那么11%的可能性是真的。
s******s
发帖数: 13035
21
总结一下。
p-value是啥?
p-value描述的是 P( Data | H0 )
但是学术界经常把它理解成 P( H0 | Data )
但凡学过prob 101都知道这两个没啥关系,要有关系,
也就是 P( H0 | Data ) = pvalue * P(H0) / P(Data)
所以,要算figure 1上的数,至少要知道先验的P(H0)是多少,
另外,P(Data)更难求,那么可以用
P(Data) = P(Data|H0)*P(H0) + P(Data|HA)*P(HA)等来求,
那么HA也变得重要。估计Berger后面做了一系列关于P(H0)和
P(Data)的假设才算出来那几个数字,理解意思就好,不用强求

I
y***i
发帖数: 11639
22
问题是文章掩饰了这是小几率事件。而且可以通过repeat轻易矫正。这我是翻来覆去
才想明白的。说实话,除了我怀疑有多少人能看文章,然后象我一样认真想明白的。没
想明白的,心里面肯定都是留下了作者恐吓pValue现在用法如何错误的映象。看文章后
面那些的欢呼的评论就知道。
【 在 Dua (Dua) 的大作中提到: 】
significant
高?
对你是很常见是吧?所以你知道这原因是什么,出了这种情况,再重复一次。这对我
们是常识,这种情况,根本是nothing.
但你看看文章前面用多大的篇幅详细写一个博士生碰到了这么个情况,纯洁的心灵受
到了极大的震撼,年轻的美梦随风而去。
“For a brief moment in 2010, Matt Motyl was on the brink of scientific
glory: he had discovered that extremists quite literally see the world in
black and white.
The results were “plain as day”, recal... 阅读全帖
r********n
发帖数: 6979
23
来自主题: Statistics版 - 如何解读非常小的p-value?
我知道你和后面一个人说的什么意思了
可能是我原帖里面没有说清楚
你们说的是这个test本身可能type I error比较高(一个pvalue没法说明这个test的好
坏)
这些我都同意
问题是我关心的不是test本身的好坏(当然这个是个问题, 只是不是我现在关心的问
题)
假设test本身的assumption都成立
我关心的是两种分类方法的好坏
t-test只是用来分辨的一种方法而已(也可以用别的statistical test)
用分类方法一把1000个sample分成两类: 假设一类有400个sample, 一类有600个
sample
然后可以在这两组之间做一个unpaired ttest
得到第一个pvalue=0.00001
用分类方法而把1000个sample分成另外两类:假设一类有250个sample, 一类有750个
sample
再做一个unpaired ttest
得到第二个pvalue=0.000001
我的问题是
因为第二个pvalue比第一个pvalue小(虽然两个pvalue本身都已经highly significant)
也就是说第二种分类方法分出来的... 阅读全帖
r********n
发帖数: 6979
24
来自主题: Statistics版 - 如何解读非常小的p-value?
这个1000个sample是sample size
也是真实的数据
我没法simulate这些数据
我的理解是
pvalue是指在null hypothesis成立的情况下,观测到这样一组数据的可能性
如果pvalue非常小(<0.05)
那就是说数据说明null hypothesis不大可能成立(反之, pvalue不太小的话, 则只
能说明, 数据没法说明null hypothesis是不是成立)
如果test的assumption都成立的话(对ttest来说的话, gaussian, equal variance)
那么type I error rate(false positive rate)应该和pvalue是一样的
我的问题不是关于这个test的!
我假设test本身没有问题
关心的是采用不同分类方法以及相同的test
得出来的pvlue能不能用来评价不同的分类方法(而不是评价test本身)
这里null hypothesis=两组数据有一样的mean
因为pvalue都非常小
说明两种分类方法都能把这1000个sample分成有不同mean的两组(换句话说, 两种分
类方... 阅读全帖
G***G
发帖数: 16778
25
来自主题: Statistics版 - lm中的main effect
suppose
y~a+b+c
a,b,c都是fixed factor
现在anova发现
a,b 有pvalue<0.05
c对应的pvalue=0.3
那么请问我在报告a,b的main effect的时候是直接用这个pvalue
还是重新定义一个模型y~a+b (因为c不重要,所以去掉)
然后对新模型,用anova
得出新的pvalue
我是用新pvalue,还是旧的pvalue呢?
谢谢!
r********n
发帖数: 6979
26
来自主题: Statistics版 - 如何解读非常小的p-value?
就像你说的
如果我有一种分类方法
可以把top quantile和bottom quantile分离出来
那这个分类方法就是一个好的分类方法
当然实际上
分类的方法当然不是象你说的用rank这么简单
因为这个给的这组数据其实相当于ground truth
分类方法本身是看不到的
分类方法用的是别的数据得到这个分类的
我又想这个问题
基本上是在test这么一个hypothesis
当p<<0.05的时候, 两个不同的pvalue实际上有多大区别
如果可以设计这么一个对应的statistics
那基本就是看pvalue of pvalues是不是significant
看起来好像没有这么一个test。。。
不过实际上
当pvalue这么小的时候
可能像你说的
test本身的性质可能更重要了
要是test本身的一些assumption没有满足的话
导致的区别可能要比pvalue从0.000001变到0.00001的影响要大的多

top
v*******e
发帖数: 11604
27

这太容易了。Pvalue can be as small as you want.
N=c(100,1000,10000,100000)
PValue=rep(as.numeric(NA),length(N))
RSquared=rep(as.numeric(NA),length(N))
for (i in 1:length(N)){
sigmma=rnorm(N[i],0,1)
x=rnorm(N[i],0,1)
y=0.1*x+sigmma
RSquared[i]=summary(lm(y~0+x))$"r.squared"
PValue[i]=summary(lm(y~0+x))$"coefficients"[1,4]
}
data.frame(N,RSqaured,PValue)
N RSquared PValue
1 1e+02 0.007324693 3.947863e-01
2 1e+03 0.014429159 1.392340e-04
3 1e+04 0.010822982 1.792036e-25
4 1e... 阅读全帖
d***s
发帖数: 1062
28
谢谢上面两位的帮忙,终于能分析了。
但是分析结果好像不是很好。
大部分的gene sets在WT里upregulated了,但是在KO里就
很少。我分析了好几个gene sets database都是这样。
不仅如此,KO组里一个能看的enrichment plot都没有。
我用的都是默认的parameter,有些parameter是不是应该改一改。
Enrichment in phenotype: WT (4 samples)
701 / 797 gene sets are upregulated in phenotype WT
0 gene sets are significant at FDR < 25%
13 gene sets are significantly enriched at nominal pvalue < 1%
36 gene sets are significantly enriched at nominal pvalue < 5%
Enrichment in phenotype: KO (4 samples)
96 /... 阅读全帖
G***G
发帖数: 16778
29
来自主题: Biology版 - linear model的categorial variable
lm(y~x)
x是个categorial variable {a, b, c, d}
我们可以得到3个pvalue xb, xc, xd
这3个pvalue都说明什么?
如果x是一个numerical variable
我们只能得到一个pvalue
这个pvalue能说明 x 对于y的重要性.
如果x是categorial variable,能得出x对于y的重要性吗?
G***G
发帖数: 16778
30
来自主题: Statistics版 - linear model的categorial variable
lm(y~x)
x是个categorial variable {a, b, c, d}
我们可以得到3个pvalue xb, xc, xd
这3个pvalue都说明什么?
如果x是一个numerical variable
我们只能得到一个pvalue
这个pvalue能说明 x 对于y的重要性.
如果x是categorial variable,能得出x对于y的重要性吗?
y***i
发帖数: 11639
31
来自主题: Biology版 - 请教一个简单的数据统计问题
谈一下我的理解。
pValue意思是:如果完全随机的话,撞大运撞到这个状态的几率是多少。
microarray如果是你查确定的基因,那么可以直接用pValue。但如果你从1万个probe
中找到significant,那么,撞大运你也能撞上10k X 0.05 = 500个probe,都是随机但
pValue都小于0.05. 所以这时候就不能用0.05的阈值。

err
leve
H0为
Xalpha,
率就
typ
进行
那个
太太
果你
了六
了(
撞一
果,
可能
是问
G***G
发帖数: 16778
32
来自主题: Biology版 - false discovery rate
how to calculate false discoery rate from a list of pvalues?
1) in the server side
2) in the client side
3) database server
suppose a database with a table which has a column pvalue.
how to caluclate FDR from the pvalue column?
g*********r
发帖数: 281
33
来自主题: Biology版 - qvalue
qvalue 是 pvalue 经过 multiple test adjustment以后得到的,它和你进行的test总
数目有关。如果你确定你的test数目是这么多,你不应该人为降低这个值。它的cutoff
和pvalue一样。你把它当作pvalue好了。
f*********8
发帖数: 165
34
来自主题: Statistics版 - 请教一个SAS coding
我有两组数据:
data1有两个variable:location, Pvalue (900 obs)
data2有两个variable: start, end (10 observations)
我想比较location是否在start和end之间,如果是的话data就merge到一起,如果多个
location在同一个start-end区间,这些location的Pvalue就用来算Mean Pvalue.其他
不在任何start-end区间的location就删除。
请问这个应该怎末coding?多谢了。
c********h
发帖数: 330
35
这个pvalue相当于比较两个模型
模型1:y~1
模型2:y~1+x
如果pvalue很小,说明如果模型1是对的,就是如果所以变量的系数都是0,你得到这样
一个fitting results的概率是非常非常小的。
一般要一个significance level, 比如0.05,那么pvalue小于0.05,就拒绝模型1。
但我觉得它不能说明回归系数等于样本算出来的值的概率很大... 那需要做其他的test
p******x
发帖数: 441
36
大哥你从任意一个分布里面随机抽2k个数字,均分成2组,每组k个。
1. two group t-test的时候的t statistic is asymptotic standard normal as k
goes larger.
2. 算pvalue的时候默认用one sided,就是pvalue=P(standard normal>t)=1-Phi(t),
where Phi() this the cumulative distribution function(CDF) of standard
normal.
3. 用定理:let X be a random variable with monotonic CDF F(), then F(X)
follows U[0,1]. 所以Phi(t) and 1- Phi(t) are both U[0,1].
k***t
发帖数: 276
37
写个Least Recently Used Cache的Class好像是几家公司常见题。
有没有面试可用的精简一些的Sample Code?
或哪个大拿给写一个范本。谢了。
还有,copy-on-write的string class。
我这里贡献一个smart pointer class。Code来自http://www.codeproject.com/KB/cpp/SmartPointers.aspx
class RC
{
private:
int count; // Reference count
public:
void AddRef()
{
// Increment the reference count
count++;
}
int Release()
{
// Decrement the reference count and
// return the reference count.
return --count;
... 阅读全帖
a***n
发帖数: 404
38
reject null hypothsis 不是好事么?
汗死。。。你讲得这个你觉得我pvalue都编程算出来了,会不知道。。晕啊。
我以为你说pvalue太小了也不能reject了。所以不是什么好事。。原来你的意思是
reject了,就不是好事了。看来咱么对于好事坏事的理解有区别啊。呵呵。 不是一直
都是区别大是好事么?reject是好事么?
G***G
发帖数: 16778
39
来自主题: Biology版 - false discovery rate
其实就是因为我们没有真集。
所以不知道用什么方法虑噪。
还有一个trick,就是threshold如何选取。如果你认为corrected pvalue最好,
或者你认为fold change 最好,或者你认为常规pvalue最好,
那么这个threshold取多少呢? 显然这个对结果影响很大。
我经常看到一些人的论文,对同一个数据集,前后发表的不同论文中,居然采用
不同的threshold来得到不同意义的markers。
也就是说,threshold是随意的,是你认为什么结果能打动reviewer,你就用什么
threshold。
这就是目前科学界的状态。
y***j
发帖数: 11235
40
来自主题: Biology版 - false discovery rate
真集是啥东西?google了一下都是美女写真集。
你说的情况,不就是审稿的觉得用false discovery rate比较好,你非要用没有矫正过
的p值么。跟你说的每个人一个标准一个意思么。没有矫正的过的pvalue肯定不十分适用于multtest,原因我上面已经说过了
。或者你不怕假阳性,这样搞也可以,后续验证的工作量等着你。
而且为什么不能同时用调整后pvalue(当然这里有不同方法选择的问题)和fold change(有几倍选择的问题),但是跟没调整过的p值来比,已经不是核心问题了。
n******7
发帖数: 12463
41
来自主题: Biology版 - 请教一个P值稳定性的问题
想了一会儿,你说的例子应该是的,不过CI有两个值,跟pv+fold-change 可以替换也不奇怪
各种test都会用到 parametric 和 non-parametric 都有
最近主要做enrichment的分析,用Fisher exact test
一般就报告一下pvalue和relative enrichment
但是就像主贴说的,当sample比较少的时候,pv很不稳定。这时候就需要一个比较大的
RE来保证观察到enrichment是有意义的。往往需要一个pv的cutoff和一个RE的cutoff来
保证这一点。
我看到一些其他方案。比如DAVID算GO enrichment的时候,把实际有某个GO注释的基因
数减一,这样算出的Pvalue是个保守的估计
y***i
发帖数: 11639
42
来自主题: Biology版 - 请问诸位chi-square test (转载)
我好像明白了。不是用percentage计算出来的,是用cell counting的数据算chi-
square pValue,类似fisher exact test
变化 不变
control A B
treated C D
然后用A/B/C/D这4个数据计算出chi-square pValue
G***G
发帖数: 16778
43
来自主题: Biology版 - bash命令
a tab delimited text file has 7 columns
the 7th column is pvalue.
which bash command can let us choose all the rows with pvalue <0.01?
suppose the result file is A.
I have another two questions about bash.
How to remove first line from a file B using bash, and then combine with
file A
into a new file C?
Sorry, I am a windows guy, not familiar with mac or linux.
o*****p
发帖数: 2977
44
我用R编的数据
> d1 <- rep(2:6,c(1,2,25,2,1))
> d1
[1] 2 3 3 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 5 5 6
> d2 <- rep(0:8,4)
> d2
[1] 0 1 2 3 4 5 6 7 8 0 1 2 3 4 5 6 7 8 0 1 2 3 4 5 6 7 8 0 1 2 3 4 5 6 7 8
> ks.test(d1,d2)
Two-sample Kolmogorov-Smirnov test
data: d1 and d2
D = 0.34767, p-value = 0.03566
alternative hypothesis: two-sided
Warning message:
In ks.test(d1, d2) : cannot compute exact p-value with ties
> wilcox.test(d1,d2)
Wilcoxon rank sum test with continuity cor... 阅读全帖
G***G
发帖数: 16778
45
四个bar,两两比较,会有6个pvalue,都标在图上吗?
其实,我更关心如何解释这些两两比较的pvalue
比如:a,b,c,d
ab,ac,ad,bc,bd,cd,这些比较能说明什么呢?能说明这些不同的之间的关联吗?
好像不行。能说明a,b,c,d之间有递进关系吗?也不行。
无非,也就是6个孤立的两两比较而已。毫无意义。
y********0
发帖数: 638
46
来自主题: ChineseMed版 - 再请教一个统计检验的问题
单纯从统计结果来讲,即使没有第二个实验结果。 这个p=0.0099属于边缘pvalue,下
结论的时候也要非常小心,不能随意得出推翻H0的结论。 这两个结果本身都没什么错
,属于统计结果,从某种程度上代表了得出某种结论的风险。
这个只是提供给决策者的其中一种依据,决策者面对的绝不不可能就这么一个单一的证
据。我们就说一个普通的医生吧,即使在pvalue不显著的情况下,他也可能根据其他的
依据,譬如统计上的effect size来判断某一种药的使用结果,当然也可能跟他承担的
后果不严重有关。
l*******f
发帖数: 243
47
个人认为可以找表里最小的一个值, 然后你的Pvalue<该值,
结论: 因为Pvalue<该值<0.05(whatever your alpha level is),reject null and
conclude``````
s*r
发帖数: 2757
48
the p value will only tell you whether the correlation is significantly
different from 0. but the real question may be whether the correlation is
very close to 1
many ways can give you a pvalue. eg the pvalue from the regression
coefficient in a linear regression, and each way will have its problem, eg,
the normality assumption for linear regression if linear regression is used
in a small sample

.
other.
y***i
发帖数: 11639
49
来自主题: Statistics版 - 各位大侠:请教一个统计学问题
如果我想ttest对比A,B两组样本。每组有3N个样本。但因为条件限制,我不能得到任何
一个样本的数据。这3N个样本每3个一小组,我只能得到每小组的3个样本的和,或者说
平均值。所以我要对比的是A, B两组N个平均值数据。
这种情况下我得到的ttest pValue需要修正么?要怎么修正才等于每个样本对比的
pValue?(假设符合标准分布)
w*******9
发帖数: 1433
50
paired data variability 小所以需要的size小,这是为什么要pair. 比如x=rnorm(
100), y=x+0.01, 如果是paired, pvalue=0. 如果是unpaired, pvalue会很大。
你说的paired survival sample size 很有意思,你看见的sample size
modification 能给个链接吗
?我想学习学习。

),
design
1 2 3 4 5 下页 末页 (共5页)