由买买提看人间百态

topics

全部话题 - 话题: icgc
(共0页)
n******7
发帖数: 12463
1
来自主题: Biology版 - 有没有tumor CNA的统计数据
谢谢详细解答,有些是我知道的,有些细节我确实不清楚
我之前就发现TCGA的CNA主要都是array平台来的,而且很多信息不是很清楚(比如有个
cnv/nocnv的注释,去年ACCR我问了TCGA的人,也没完全说明白)
我用TCGA的data matrix 入口download过所有的lv3 data和部分lv2 data
他们那个bulk download没搞清楚怎么用...
TCGA Assembler和firebrowse都没用过,annotation database也是第一次听说
TCGA把这么重要的东西藏这么深也太挫了,我现在文章都写好了。。
我决定先投了,reviewer让QC再QC吧,结果应该只会更好
我们需要WGS data, 在TCGA dcc 只有WES的data,WGS都在cgHub
但是我们不想自己从bam开始处理,想直接拿SNV/SV的calling,这个ICGC可以提供,所
以我们需要access
昨天我想要一个很简单的统计,比如每个cancer sample,整个genome上%多少的region
是double deletion, single dele... 阅读全帖
c******a
发帖数: 267
2
注:带朋友发文,请直接使用文中Email联系方式!
中山大学肿瘤防治中心(华南肿瘤学国家重点实验室), 肿瘤遗传学方向贝锦新研究员
课题组主要从事恶性肿瘤等复杂疾病遗传学和基因组学研究,研究内容围绕“精准医学
”核心理念,旨在通过基因组、表达谱、基因组编辑和免疫细胞类群等组学手段,在群
体、个体、实验模型和单细胞等层面,发现与恶性肿瘤等重大疾病早期诊断、个体化治
疗靶点或方案、疗效判断等相关的生物标志物和策略,并阐明疾病致病分子机制,为恶
性肿瘤等重大疾病的精准医疗提供有效解决方案。本团队负责搭建中山大学精准医学科
学中心高通量组学平台、运营中山大学肿瘤防治中心高通量测序及分析平台,所在依托
单位华南肿瘤学国家重点实验室拥有先进的动物、细胞、分子水平相关研究平台。
现因课题组科研工作需要,公开招聘课题助理。现因课题组科研工作需要,公开招聘在
编工作人员、专职科研人员(生物信息学或肿瘤学相关)和博士后(生物信息学、肿瘤
发生分子机制研究)多名。我们将提供满意的工作、学习和生活氛围,让你的才华得到
最大程度的重视与发挥。
有意者请发送简历至邮箱[email protected]/... 阅读全帖
l******u
发帖数: 936
3
关于藏人的文章是 www.sciencemag.org/content/329/5987/75
是 1000 genomes project 的一部分。1000 genomes project 发表了很多文章,不是
楼主说的这么一篇。这样大的project, 类似的现在很火的ICGC, 一般会在 Nature,
Science, Cell 上灌水好几篇的。 唉,大家如果不了解genomics 领域,还是多查查
,再来评论吧。
l******u
发帖数: 936
4
It is totally different things. The future direction could be systematically
combining CRISPR/Cas, Cre-lox, and tet-on/off technique to temporally and
spatially switch on and off different genes in specific pathway or study the
crosstalk between pathways using the methods, the candidate genes/pathways
should be from the data mining using the public human omics data base, for
example TCGA, ICGC ......
n******7
发帖数: 12463
5
来自主题: Biology版 - 有没有tumor CNA的统计数据
TCGA 的CNA基本都是microarray based
基于WGS的data存在CGhub
这些data process过后再ICGC有(我在TCGA死活没找到)
而这个是controlled access
s******s
发帖数: 13035
6
来自主题: Biology版 - 有没有tumor CNA的统计数据
你的理解是错误的。你要找什么data,我也许可以帮到你。
只有raw sequence BAM和FASTQ在CGHub, 其他所有的都在TCGA DCC.
DCC有两个入口,controlled里面是所有有序列的data, 包括genotyping,
variant,和一些pcr sequencing。如果是mutation (tumor - normal), CNA
这些,全部都是open access.
CNA主要是AFFY SNP6的,也有一些其他的平台,包括low coverage WGS,
这些都是open access。问题是TCGA号称 no platform left behind, 所以方法
虽然多,但是并不是所有的disease都有所有的data type.
TCGA的data我一般在三个地方找,DCC是一处,或者用TCGA Assembler
拉,另外常见的open data可以去firebrowse.org下载。firebrowse的好处是
QC有问题的data都扔掉了,然后都combine成matrix form。你要自己找DCC
的data,必须去TCGA ... 阅读全帖
s******s
发帖数: 13035
7
来自主题: Biology版 - 有没有tumor CNA的统计数据
我一般都是直接去
tcga-data.nci.nih.gov/tcgafiles/ftp_auth/distro_ftpusers/anonymous/tumor/
WGS的data主要是low coverage CNA,有很多;mutation calling的可能和WXS
混在一起了。我知道TCGA现在在做multi center calling, 大多数data应该很快会
出来。
ICGC的mutation可以下载了么?我知道刚差不多finish了sanger pipeline; 其他
的两个刚开始。
关于cnv/nocnv,我的理解是cnv是tumor的cnv, nocnv大概是tumor relative normal
的cnv. 意思就是,既然你没有normal的cnv data, 那么一般研究应该用nocnv, 也就是
把normal的也考虑进去了。
annotation这玩意儿连几篇marker paper和pan-can paper上面都没提。不过他们
估计都知道,直接去firebrowse搞就不用考虑annotation了。annotation里面有很多
比如疾病分... 阅读全帖
n******7
发帖数: 12463
8
来自主题: Biology版 - 有没有tumor CNA的统计数据

我一般都是直接去
tcga-data.nci.nih.gov/tcgafiles/ftp_auth/distro_ftpusers/anonymous/tumor/
--
这个不错。不过好像没有sample annotation information? 用data matrix会生成一
个包,里面有每个sample的annotation。比较重要的就是sample code,因为这里面有
tumor sample也有normal control。我写了个脚本,从local 文件里面抽取想要的
sample挺方便的
WGS的data主要是low coverage CNA,有很多;mutation calling的可能和WXS
混在一起了。我知道TCGA现在在做multi center calling, 大多数data应该很快会
出来。
ICGC的mutation可以下载了么?我知道刚差不多finish了sanger pipeline; 其他
的两个刚开始。
--
这个我也了解不多,我们知道有处理过的data之后,就混乱进去,现在等他们给我们一
个什么wiki的access,估计有do... 阅读全帖
s******s
发帖数: 13035
9
据说ICGC的专家们现在正在一头汗的QC呢
n******7
发帖数: 12463
10
是的
前段时间参加ICGC的会议,大致就是这样
感受就是,外围的组要玩转这些data,很难,各种坑都不跟你说的
s******s
发帖数: 13035
11
连ICGC都算不上内围。甚至几个Center的头都不一定知道,
很多东西只有具体干活的人知道,我也是dig出来几个问题,
给每个center发个email问,才一头瀑布汗啊。。。
i*e
发帖数: 352
12
看看那个ICGC-TCGA DREAM的东东,能不能最后给个大体的方案吧
n******7
发帖数: 12463
13
来自主题: Biology版 - 转行 bioinformatics

1. 这波NGS(还有三代测序TGS)热,我觉得会比microarray热持续的更久也更有前途一
些。不知道你怎么看?microarray的兴衰,对NGS/TGS的发展有什么启示?microarray
的衰落基本上是和NGS的发展有关,那么NGS/TGS的衰落会由什么新兴技术造成?
----
如果没有NGS,microarray现在依然会很火。个人认为NGS是继PCR之后对生物医学科研
影响最大的技术,也是最能体现bioinfo价值的技术。我是all-in了。
----
2. 关于“生物信息的projects大致分两类”,这两类有没有可能结合起来?我也特别
喜欢研究问题。我总觉得生物学领域有很多很有意思的课题,我是做Evo-Devo的,接触
过很多很有意思的模式/非模式生物和系统。我总觉得如果能深入挖掘的话,会有不少
有意思的东西。但是我技术不够,所以从NGS开始在一点点学习方法和技术,以后想把
统计、编程、算法等方面再加强一下。我尝试过拉着CS科班出身的同学来研究Biology
,结果不太成功。。。而且自己的性格也是,自己学明白了,用着才舒服。所以想探讨
一下有没有方法真正的把开发... 阅读全帖
n******7
发帖数: 12463
14
来自主题: Biology版 - 转行 bioinformatics

1. 这波NGS(还有三代测序TGS)热,我觉得会比microarray热持续的更久也更有前途一
些。不知道你怎么看?microarray的兴衰,对NGS/TGS的发展有什么启示?microarray
的衰落基本上是和NGS的发展有关,那么NGS/TGS的衰落会由什么新兴技术造成?
----
如果没有NGS,microarray现在依然会很火。个人认为NGS是继PCR之后对生物医学科研
影响最大的技术,也是最能体现bioinfo价值的技术。我是all-in了。
----
2. 关于“生物信息的projects大致分两类”,这两类有没有可能结合起来?我也特别
喜欢研究问题。我总觉得生物学领域有很多很有意思的课题,我是做Evo-Devo的,接触
过很多很有意思的模式/非模式生物和系统。我总觉得如果能深入挖掘的话,会有不少
有意思的东西。但是我技术不够,所以从NGS开始在一点点学习方法和技术,以后想把
统计、编程、算法等方面再加强一下。我尝试过拉着CS科班出身的同学来研究Biology
,结果不太成功。。。而且自己的性格也是,自己学明白了,用着才舒服。所以想探讨
一下有没有方法真正的把开发... 阅读全帖
(共0页)