c*******d 发帖数: 192 | 1 这几天看了toptip的高通量DNA测序技术在生物学研究中的应用,,受益匪浅.. 俺们实验
室的研究也focus这种应用..所以平时也作了很多数据分析.. 这里比较一下两种测序的
平台(solid和solexa),,相关的软件,,也讨论一下他们的应用.. 本人经验有限,,本文权
当抛砖引玉,,希望各位大侠多多指教:
1. raw sequence 编码
SOLiD: Solid采用color-coded序列输出. 所以输出的序列除了首位以外,,都是数字(0-
3). 没两位编码一个nucleotide.. T0132123. 然后根据一个编码表,,可以转换成
nucleotide序列.
Solexa: 输出采用nucleotide编码, 不需要任何转换..
2. yield
两种测序技术每个单位的yield都在15M左右 (最近一次solexa平均yield约20M per
Lane).. 好像solid是spot,, solexa叫lane..solid每次可以测8个spot,, solexa每次
可以测序8个lane.. 所以从raw输出的数量来说,,两个没有大的差别..
3. S | A**H 发帖数: 4797 | 2 谢谢分析
今年早些时候Genome Biology有一篇文章做了三家的比较,大致的结论是Illumina得最
好。观点是否有失偏颇尚待其他研究佐证。
Evaluation of NGS platforms for population targeted sequencing studies
我认为SOLiD的问题在它的color-space上面:它最终要死在它的这个color-code上面。
它这个color-code让搞生物的人很糊涂,甚至让搞数据分析的人也难把握其中奥妙。比
如说楼上所说的“b. solid用所有35bp作alignment,,最多允许6个mismatches”,我的
理解肯定是6个color space mismatches,而不是nucleotide space mismatches,大概
地说,一个nucleotide space mismatch 小于或这等于 2个 color space mismatches
。当然即便如此,允许6个color space mismatches in 35-bp 还是太多了。
SOLiD的技术小组已经注意到了这个问题,但是 |
|