l*******i 发帖数: 153 | 1 请问版里做bioinfo的牛人:
RNA-seq数据做QC时通用的标准是怎样的?因课题需要,我们在重新分析GEO里的一批数
据,用FastQC评估该批数据,发现几乎所有read后半部分的score偏低(见下图)。像
这种情况,应该怎样处理比较合理?
1)Filter by quality: quality cut-off设定为20,90%,结果一半左右的reads会被
扔掉。而文章中宣称其可保留85%以上的read。是我这种filter设定参数有问题吗?一
般的标准是怎样的?
2)Trim:把每个read后30碱基去掉。这样做可行否?理由是什么?
3)针对这种情况,更合理、准确的的方法是什么?
谢谢! |
c********e 发帖数: 598 | 2
1)If the quality score is 20, what is the average read length?
Can you show us the original sra files?
【在 l*******i 的大作中提到】 : 请问版里做bioinfo的牛人: : RNA-seq数据做QC时通用的标准是怎样的?因课题需要,我们在重新分析GEO里的一批数 : 据,用FastQC评估该批数据,发现几乎所有read后半部分的score偏低(见下图)。像 : 这种情况,应该怎样处理比较合理? : 1)Filter by quality: quality cut-off设定为20,90%,结果一半左右的reads会被 : 扔掉。而文章中宣称其可保留85%以上的read。是我这种filter设定参数有问题吗?一 : 般的标准是怎样的? : 2)Trim:把每个read后30碱基去掉。这样做可行否?理由是什么? : 3)针对这种情况,更合理、准确的的方法是什么? : 谢谢!
|
l*******i 发帖数: 153 | 3 谢谢回复!
read length is 100.
【在 c********e 的大作中提到】 : : 1)If the quality score is 20, what is the average read length? : Can you show us the original sra files?
|
M*P 发帖数: 6456 | 4 直接切掉后面30bp试试吧,这个数据貌似很老吧,illumina新一些的机器都没这么差了。
★ 发自iPhone App: ChineseWeb 7.8
【在 l*******i 的大作中提到】 : 请问版里做bioinfo的牛人: : RNA-seq数据做QC时通用的标准是怎样的?因课题需要,我们在重新分析GEO里的一批数 : 据,用FastQC评估该批数据,发现几乎所有read后半部分的score偏低(见下图)。像 : 这种情况,应该怎样处理比较合理? : 1)Filter by quality: quality cut-off设定为20,90%,结果一半左右的reads会被 : 扔掉。而文章中宣称其可保留85%以上的read。是我这种filter设定参数有问题吗?一 : 般的标准是怎样的? : 2)Trim:把每个read后30碱基去掉。这样做可行否?理由是什么? : 3)针对这种情况,更合理、准确的的方法是什么? : 谢谢!
|