a***e 发帖数: 1010 | 1 如何通过高通量的测序数据寻找染色体易位,基本流程是什么样的,有哪些标准软件可
用。
谢谢 。 |
r**********e 发帖数: 587 | 2 If you mean inter- or intra- chromosomal translocation, many structural
variation/SV software could help you
Breakdancer/CREST
Genome Strip
Delly
If I'm correct, Breakdancer/CREST specifically designed for tumor/matched
control; mostly because translocation is usually seen in cancer but not
other disease
个人觉得现在NGS 各种SV的软件挺多的,也用了一段时间了,随着1000genome完工。但
五花八门,用起来寻找想要的数据还真是不那么容易的,毕竟这种东西比SNP复杂的多
的多的多的多
【在 a***e 的大作中提到】 : 如何通过高通量的测序数据寻找染色体易位,基本流程是什么样的,有哪些标准软件可 : 用。 : 谢谢 。
|
s******s 发帖数: 13035 | 3 Dream Challenge里面上次看应该是DELLY最强,最近没研究过。
这玩意儿很困难,就算最简单的情况下,而且200x,最好的DELLY
也差不多只有50%的detection.
【在 r**********e 的大作中提到】 : If you mean inter- or intra- chromosomal translocation, many structural : variation/SV software could help you : Breakdancer/CREST : Genome Strip : Delly : If I'm correct, Breakdancer/CREST specifically designed for tumor/matched : control; mostly because translocation is usually seen in cancer but not : other disease : 个人觉得现在NGS 各种SV的软件挺多的,也用了一段时间了,随着1000genome完工。但 : 五花八门,用起来寻找想要的数据还真是不那么容易的,毕竟这种东西比SNP复杂的多
|
r**********e 发帖数: 587 | 4 说下我的comments吧
DELLY其实是比较新的软件,综合了paired-end discordant和split-read两种signal来
make calls,自然是不错的,而且也是1000genome使用的软件之一,而且最后结果提供
vcf format
SV领域最早最原始的三个软件,我个人认为的,read-depth的CNVnator;discordant的
breakdancer;以及split-read的Pindel;后续陆陆续续出来了很多类似软件,其实大
同小异,很多都是为了发文章而发文章的trash paper。上面说的三个软件,虽然都是
基于一种signal,但都算元老,1000genome使用的软件,而且关键是有四五年历史,很
多人使用,所以一直在update,debug,maintain,使用起来比较上手。但CNVnator是
不可能计算translocation的,Pindel可以找到translocation但Pindel是针对比较小的
structural variation,因为big SV的computational cost太高
还有一个超级好的genome strip,MIT/broad开发的,我一直没去try,但应该是最棒的
,融合了各种signal,而且是population-scale的,和GATK一样都有很好的维护,但是
都非常非常非常复杂,很多option需要很久的学习和调试。
所以我建议你从breakdancer和DELLY入手;如果能找到你要的东西就不用别的了。
=========================================================
另外,的确structural variation的难度太高了。所以大量的bioinformatics甚至CS专
业的phd都在做这个研究。
目前所有的软件,都有bias主要偏向寻找deletion;
但我不认为需要200X的depth,没必要。我自己的whole genome seq大概30-40X,就足
够call CNV/SV了,如果是比较容易找到的比如deletion或者small insertion。那个
1000genome计划,很多都是5-10X的shallow coverage,一样可以做SV calling,当然
当你depth低的时候,一个做法是把好几个bam file的reads拼在一起,同时calling SV
,这就是population-scale
计算sensitivity什么50%的detection我觉得没意义;因为坦白说以上不同软件的计算
结果很多都不能overlap,因为SV过于复杂。这个领域的最大最大最大最大最大的瓶颈
还是reads are too short,所以那些very long insertion以及更加复杂的基因组学永
恒难题的repetitive sequence,哪怕你用1000X的depth也研究不出来,因为reads太短
所以可以mapping到无数地方尤其是重复基因组序列。
以上个人看法
【在 s******s 的大作中提到】 : Dream Challenge里面上次看应该是DELLY最强,最近没研究过。 : 这玩意儿很困难,就算最简单的情况下,而且200x,最好的DELLY : 也差不多只有50%的detection.
|
i*e 发帖数: 352 | 5 顶
个人草草试过Lumpy,Delly,Pindel,BreakDancer,Scalpel,SoftSearch,CNVkit,
Manta等等
一般有人问起,我也是说先上Delly,Delly的translocation花费时间最长,不过这也
是没太好办法的事
【在 r**********e 的大作中提到】 : 说下我的comments吧 : DELLY其实是比较新的软件,综合了paired-end discordant和split-read两种signal来 : make calls,自然是不错的,而且也是1000genome使用的软件之一,而且最后结果提供 : vcf format : SV领域最早最原始的三个软件,我个人认为的,read-depth的CNVnator;discordant的 : breakdancer;以及split-read的Pindel;后续陆陆续续出来了很多类似软件,其实大 : 同小异,很多都是为了发文章而发文章的trash paper。上面说的三个软件,虽然都是 : 基于一种signal,但都算元老,1000genome使用的软件,而且关键是有四五年历史,很 : 多人使用,所以一直在update,debug,maintain,使用起来比较上手。但CNVnator是 : 不可能计算translocation的,Pindel可以找到translocation但Pindel是针对比较小的
|
s******s 发帖数: 13035 | 6 赞内容贴,学习了
不过不同意sensitivity不重要。正是因为各种caller的result区别太大了,所以FP和
FN才特别
重要。
【在 r**********e 的大作中提到】 : 说下我的comments吧 : DELLY其实是比较新的软件,综合了paired-end discordant和split-read两种signal来 : make calls,自然是不错的,而且也是1000genome使用的软件之一,而且最后结果提供 : vcf format : SV领域最早最原始的三个软件,我个人认为的,read-depth的CNVnator;discordant的 : breakdancer;以及split-read的Pindel;后续陆陆续续出来了很多类似软件,其实大 : 同小异,很多都是为了发文章而发文章的trash paper。上面说的三个软件,虽然都是 : 基于一种signal,但都算元老,1000genome使用的软件,而且关键是有四五年历史,很 : 多人使用,所以一直在update,debug,maintain,使用起来比较上手。但CNVnator是 : 不可能计算translocation的,Pindel可以找到translocation但Pindel是针对比较小的
|
n******7 发帖数: 12463 | 7 好贴,版主应该设精
看来超长reads才是根本解决方案?
【在 r**********e 的大作中提到】 : 说下我的comments吧 : DELLY其实是比较新的软件,综合了paired-end discordant和split-read两种signal来 : make calls,自然是不错的,而且也是1000genome使用的软件之一,而且最后结果提供 : vcf format : SV领域最早最原始的三个软件,我个人认为的,read-depth的CNVnator;discordant的 : breakdancer;以及split-read的Pindel;后续陆陆续续出来了很多类似软件,其实大 : 同小异,很多都是为了发文章而发文章的trash paper。上面说的三个软件,虽然都是 : 基于一种signal,但都算元老,1000genome使用的软件,而且关键是有四五年历史,很 : 多人使用,所以一直在update,debug,maintain,使用起来比较上手。但CNVnator是 : 不可能计算translocation的,Pindel可以找到translocation但Pindel是针对比较小的
|