e****p 发帖数: 354 | 1 记得有人问过但找不到帖子了,
三次重复试验,每次QPCR有三个TECH REP
Rep1
GOI-Houskeep
delta Ct: Con -2.9; Treatment: 2.1
Rep2
GOI-Houskeep
delta Ct: Con -1.9; Treatment: 2.0
Rep3
GOI-Houskeep
detla Ct: Con -2.1; Treatment: 3.0
请问如何综合三次结果用DELTA DELTA CT的方法算出 fold change +- 标准误啊,而且
把CON的平均值算成1
请高人指点 |
T****u 发帖数: 424 | 2 RT-PCR 结果的计算方法
未名 三楼楼长 03-25-2011
RT-PCR 技术已经推广了有些年头。但从众多已发表的文章中不难看出,很多试验
者的计算多多少少都存在问题。甚至,有些介绍算法的文章都存在明显的错误。因
此,有必要对试验人员讲解计算方法。这样不仅可以尽可能避免计算错误,也能更
好地理解RT-PCR 原理。以下讲解只针对单色RT-PCR,也就是说,在任意一个
well 里,只能用一对primers 检测一个样品。
一、RT-PCR 到底要测什么?
RT-PCR(这里,RT 指 real-time。区别于rt:逆转录)是量化基因表达的一种方
法。如果说western blot 是针对蛋白水平,RT-PCR 就是针对mRNA 水平。
基因表达在蛋白水平上,已经经过了多个数量级的放大。或者说一个mRNA 模板
分子可以翻译出无数蛋白分子。所以,蛋白可以很容易地用抗体探测到。但
mRNA 数目太少,直接用探针检测有困难。所以必须要人为放大扩增才能检测
到。这就是PCR 的目的。
不管是先做逆转录得cDNA,再做PCR,还是逆转录+PCR 一气呵成,RT-PCR 归
根结底是以mRNA 为模板的。无论怎样复杂的曲线分析、Ct 值的转化和计算,
RT-PCR 最终的目的是要探究样品中mRNA 的含量。所以我们要利用测量值(Ct
值)计算出mRNA 的含量。重复一遍:计算结果要表示出mRNA 的量。
二、Ct 值的概念以及两个Ct 值的平均值
1,RT-PCR 得出的直接测量数据是Ct 值。这个Ct 值跟我们的终极目标mRNA 含
量是什么关系呢?
如上图,这是一个对数扩增曲线的示意图。Ct 值代表曲线达到阈值水平时的cycle
数。例如,上图中左边曲线的Ct 值为a。那么该样品中的mRNA 含量如何表达?
我们定义阈值线所代表的mRNA 含量为1。每经过一个cycle,双链DNA 产品就
翻一番。该样品经过了a 次cycle,PCR 产物是模板数量的2a 倍,达到了阈值水平
1。那么样品中原有mRNA 模板的含量就是a 2
1 。
2,我们现在有两条曲线,得出两个Ct 值a 和b。那么这两个样品的平均Ct 值是多
少呢?我可以很负责任地告诉你,答案
2
a + b
是错误的。
打个简单的比方就明白了。我和你分pizza 饼。我吃了1/2 张,你吃了1/4 张,你
能说我们人均1/3 张饼吗?再比如,一个pH1 的溶液和一个pH3 的溶液(非缓冲
溶液),等容混合以后的平均pH 是2 吗?
在第1 小节中我们已经了解到Ct 值的意义。在表达mRNA 的算式中,Ct 值处于分
母和指数的双重位置上。那么两个样品的平均Ct 值,应该是这两个样品等容积混
合后的“混合样品”的Ct 值。计算公式:
⎟ ⎟ ⎟ ⎟
⎠
⎞
⎜ ⎜ ⎜ ⎜
⎝
⎛ +
−
2
2
1
2
1
log2
a b
三、内参的引用及其简单计算
如同western blot 要用某housekeeping gene 做loading control,RT-PCR 也要采用某
housekeeping gene 作为内参。最后结果表达为目标基因mRNA 含量与housekeeping
gene 的mRNA 含量的比值。
假设上图中,左边曲线使housekeeping gene,右边曲线为目标基因,则结果如下表
示: a b
a
b
−
−
−
= 2
2
2 。注意,a-b 通常是个负数。有的时候为了看起来简单,可以直接表
达为a-b,我们一般用ΔCt 来代表这个数值。
四、duplicates 的处理
为了减小误差,也为了防止某个well 的反应出现意外而丢失这个数据点,我们经
常要做duplicates,甚至triplicates。
一对duplicates 通常给出4 个数字,见下表:
Housekeeping a1 a2
Target b1 b2
我看到很多教程上是这样教的:分别得出ΔCt1=(a1-b1)和ΔCt2=(a2-b2),然后
求ΔCt1 和ΔCt2 的代数平均。这样的算法有两处明显错误:
1,不论Ct 值还是ΔCt 值,都不能简单地搞代数平均。这一点,在第三段第2 节已
经介绍过了。不再赘述。
2,这个算法显然把a1 和b1 划归一组,把a2 和b2 划到了另一组。这样的做法是
不恰当的。实验中没有任何操作表明(1)a1 和b1 是对应的,(2)a1 不能b2 对
应。a2 亦然。实际上,是a1、a2 的平均值对应b1、b2 的平均值。平均值的算法请
参照第二段第2 节,对应内参的计算请参看第三段。综合起来,这个样品的最终数
据,也就是它的目标基因mRNA 与housekeeping gene 的mRNA 的比值是
R = 1 2
1 2
2 2
2 2
b b
a a
− −
− −
+
+
从另外一个角度说,duplicates 这4 个数字来自同一个样品,只能得出唯一的值来
代表这个样品,并参与后面的统计学分析。简单地讲,就是不能因为作了
duplicates,就把样本数n 变成了2n。
四、对照组与治疗组的对比方法和统计学分析
至此,RT-PCR 的计算没有最终完成。还需要最后的正常化(normalization)和统
计学分析。将对照组(0 组),治疗1 组(1 组)、2 组……所有R 值都用对照组
(也可以用别的组)各样品R 值的代数平均来进行正常化。用正常化后的数字
(暂且称它为N 值)做统计学分析。比如0 组平均N 值永远为1。
RT-PCR 是比较敏感的试验方法。一般来说,与0 组差距超过5-10 倍才算有生物学
意义。所以,做统计的时候,有人建议把每个N 值都转换为lgN。由于又取回了对
数,lgN 从某种意义上说,与Ct 值等价。但这并不意味着,就可以不经过以上计
算,直接用Ct 值或者说ΔCt 值来做统计学分析。
五、补充
1,两个正数求平均,无论是代数平均、几何平均、对数平均,平均值总是落在这
两个数值之间。如果这两个数值差别很小,那么所有的平均值几乎相等。但这并不
意味着可以任意用一种平均代替另一种平均算法。
2,在笔算、计算器年代,由于条件限制,可以用简便的平均代替正确的平均算
法。前提是两个数值相近,误差小于一定范围。现在是电脑时代,制作一个模板,
以后多次套用,并不是很艰难的事情。所以,我还是建议大家根据公式,仔细做一
个模板。一来,并不是每个样品都符合“理想条件”;二来,也对试验原理有一个
基本了解,有助于更好理解试验数据,并进行trouble shooting。
【在 e****p 的大作中提到】 : 记得有人问过但找不到帖子了, : 三次重复试验,每次QPCR有三个TECH REP : Rep1 : GOI-Houskeep : delta Ct: Con -2.9; Treatment: 2.1 : Rep2 : GOI-Houskeep : delta Ct: Con -1.9; Treatment: 2.0 : Rep3 : GOI-Houskeep
|
T****u 发帖数: 424 | 3 https://www.dropbox.com/s/zb1w7eyj1186u0z/032511RT-PCR%E8%AE%A1%E7%AE%97.pdf
pdf link
【在 e****p 的大作中提到】 : 记得有人问过但找不到帖子了, : 三次重复试验,每次QPCR有三个TECH REP : Rep1 : GOI-Houskeep : delta Ct: Con -2.9; Treatment: 2.1 : Rep2 : GOI-Houskeep : delta Ct: Con -1.9; Treatment: 2.0 : Rep3 : GOI-Houskeep
|
e****p 发帖数: 354 | 4 多谢文件,但并没有提到如何算标准误的问题,DELTA CT不能平均我知道, 但R值计算
每个重复试验(对照组和试验组)只能计算一个R值
我一般用2^delta delta ct 算出变化倍数再平均,但每次对照组的值都是1了,没法算
标准误。用没有关于计算标准误的资料。
pdf
【在 T****u 的大作中提到】 : https://www.dropbox.com/s/zb1w7eyj1186u0z/032511RT-PCR%E8%AE%A1%E7%AE%97.pdf : pdf link
|
T****u 发帖数: 424 | 5 https://www.dropbox.com/s/uw7td57yrb353pc/Qpcr.pdf
【在 e****p 的大作中提到】 : 多谢文件,但并没有提到如何算标准误的问题,DELTA CT不能平均我知道, 但R值计算 : 每个重复试验(对照组和试验组)只能计算一个R值 : 我一般用2^delta delta ct 算出变化倍数再平均,但每次对照组的值都是1了,没法算 : 标准误。用没有关于计算标准误的资料。 : : pdf
|
e****p 发帖数: 354 | |
l***s 发帖数: 841 | 7 Ct不能平均? 这个未必吧。 这里的误差算的是PCR测量误差,一般来说是线性的,所以
算平均应该没什么问题。比如一个值16.5,一个值17.0,应该可以平均起来为16.75.
【在 e****p 的大作中提到】 : 多谢文件,但并没有提到如何算标准误的问题,DELTA CT不能平均我知道, 但R值计算 : 每个重复试验(对照组和试验组)只能计算一个R值 : 我一般用2^delta delta ct 算出变化倍数再平均,但每次对照组的值都是1了,没法算 : 标准误。用没有关于计算标准误的资料。 : : pdf
|
d****i 发帖数: 2346 | 8
我觉得应该是算出deltaCt以后再平均。
【在 l***s 的大作中提到】 : Ct不能平均? 这个未必吧。 这里的误差算的是PCR测量误差,一般来说是线性的,所以 : 算平均应该没什么问题。比如一个值16.5,一个值17.0,应该可以平均起来为16.75.
|
l***s 发帖数: 841 | 9 DeltaCt以后就晚了。因为是测量误差,应该首先address。 我们的做法是:对于每个
基因,取duplicated Ct平均值,然后算deltaCt。因此最终只有一个deltaCt值。
【在 d****i 的大作中提到】 : : 我觉得应该是算出deltaCt以后再平均。
|
d****i 发帖数: 2346 | 10
加入三个replicates,那你怎么计算SE?
【在 l***s 的大作中提到】 : DeltaCt以后就晚了。因为是测量误差,应该首先address。 我们的做法是:对于每个 : 基因,取duplicated Ct平均值,然后算deltaCt。因此最终只有一个deltaCt值。
|
l***s 发帖数: 841 | 11 Technical replicates算SE没有什么意义。 一般来说 同一实验组内Ct variation不超
过0.2,SE几乎为0. 正确的做法是做三次独立的实验,这才是真正意义上的replicates。
【在 d****i 的大作中提到】 : : 加入三个replicates,那你怎么计算SE?
|
T****u 发帖数: 424 | 12 其实大家不要太纠结数学上的这些算法
如果你的实验结果因为怎么算SE会有不同的结论,这个变化也实在是太trivial了。 |