由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
Biology版 - 招做Genomics的Ph.D. level bioinformatician,芝大,待遇从优
相关主题
芝大生物信息招人:大数据中心/NCI GDC用WGS寻找疾病structural variation的文章
请问哪位大牛可以帮助获得TCGA level 1 data传统生物phd怎么能转到生物信息领域
关于Bioinformatics 职位关于genomics/bioinformatics/systems biology再发问
elife收肿瘤的文章吗包子贴,征求建议
招聘计算生物/生物信息学博后,tumor sequencing 方向, NIH/NCIpostdoc工资真TMD越来越低了
请教cancer genomics的牛牛们a bioinformatician/statistician position is opened at NYC
clinical genomic现在还有什么搞头?Medical genomics未来职业方向选择
翻墙求合作Oxford Nanopore 纽约 opening
相关话题的讨论汇总
话题: genomics话题: gdc话题: data话题: commons
进入Biology版参与讨论
1 (共1页)
s******s
发帖数: 13035
1
https://ctds.uchicago.edu/careers
芝加哥大学转化数据科学中心,前身叫大数据科学中心
介绍一下,组里项目很多,是第一个做出来Data Commons的(NCI's
Genomics Data Commons),现在NIH各大分部大数据大跃进,基本
都有我们插一腿. 组里有几个自己的云,光GDC一个项目就有20PB的
storage, CPU core上万。其他几个项目也有用AWS/GCP的。
有人会问你怎么还在发广告,还没找到人啊?其实是一直招人,上
次发广告的时候组里三十号人,现在差不多七十号,所以广告一直有。
待遇从优的意思就是绝对比普通学校的bioinformatician待遇高很多,
是和学校做CS的同级别类似待遇。组里这么多bioinformatician, 只有
一个是和老婆回西班牙,其他的这么多年没有跳槽的。
这个名额主要是给GDC工作,prefer genomics和pipeline background.
当然,你的background不一样也没事,有其他强项我们也会考虑,比
如编程超强等也行,我们也不止GDC一个项目。有兴趣的直接到网上
申请,有问题直接email问,或者给我投条也行,不保证及时恢复哟。
s******s
发帖数: 13035
2
好像job link不work了,用这个吧
https://uchicago.wd5.myworkdayjobs.com/en-US/External/job/Shoreland/Senior-
Bioinformatician-1_JR03570

【在 s******s 的大作中提到】
: https://ctds.uchicago.edu/careers
: 芝加哥大学转化数据科学中心,前身叫大数据科学中心
: 介绍一下,组里项目很多,是第一个做出来Data Commons的(NCI's
: Genomics Data Commons),现在NIH各大分部大数据大跃进,基本
: 都有我们插一腿. 组里有几个自己的云,光GDC一个项目就有20PB的
: storage, CPU core上万。其他几个项目也有用AWS/GCP的。
: 有人会问你怎么还在发广告,还没找到人啊?其实是一直招人,上
: 次发广告的时候组里三十号人,现在差不多七十号,所以广告一直有。
: 待遇从优的意思就是绝对比普通学校的bioinformatician待遇高很多,
: 是和学校做CS的同级别类似待遇。组里这么多bioinformatician, 只有

s******s
发帖数: 13035
3
link fixed and point to https://uchicago.wd5.myworkdayjobs.com/External/job/
Shoreland/Senior-Bioinformatician_JR03573

【在 s******s 的大作中提到】
: 好像job link不work了,用这个吧
: https://uchicago.wd5.myworkdayjobs.com/en-US/External/job/Shoreland/Senior-
: Bioinformatician-1_JR03570

h****n
发帖数: 92
4
赞,我记得之前版上好多NGS方向phd找工作的。顺便问一下您在芝加哥大学转化数据科
学中心是做什么方向的呢?可以私信我
s******s
发帖数: 13035
5
GDC: https://gdc.cancer.gov/
Gen3: https://ctds.uchicago.edu/gen3/
Other Data Commons: https://ctds.uchicago.edu/datacommons/ (还有很多没列出来
的,大概乘以2或者乘以3)

【在 h****n 的大作中提到】
: 赞,我记得之前版上好多NGS方向phd找工作的。顺便问一下您在芝加哥大学转化数据科
: 学中心是做什么方向的呢?可以私信我

s******s
发帖数: 13035
6
解释一下我们中心主要做什么
最大的一部分是做工程项目。GDC https://gdc.cancer.gov/是我们做的最早的也是
现在最大的data commons项目,基本上NCI CCG support的研究项目,里面有基因组数
据的都会过来,现在已经有十几个项目了(很多数据没放出来)。大家不知道CCG是干
啥的,就是做TCGA的部门,做癌症基因组这行的TCGA都知道把。现在TCGA的数据我们全
分析过一遍,在我们OpenStack的云上,然后在Google和AWS上各有一个几千个TB的copy,
现在FireCloud,7-bridges啥的都是在用云上的数据。计划以后的项目都这么搞,不愿
意下载数据的我们直接提供可视化页面分析,愿意下载在电脑里少量分析的可以用我们
的工具下载,要大量分析的,直接上云随意。
btw, 对国内科委生物大数据项目有兴趣的可以去看看国内的五年计划,基本要求就是
按照我们现在已经实现的部分写的,不谦虚的说,我们是美国第一个成功搭建的data
commons, 比国内基本领先三到五年。
在GDC的基础上,我们推出了一系列可以帮助别人搭建data commons,叫做Gen3 https:
//ctds.uchicago.edu/gen3/. 这方面我们有很多合作单位,也有很多high profile的
项目。当然有些项目实在太high profile, 信息发布都有保密的需要,我就不能说了。
一部分现在不保密的列在这里https://ctds.uchicago.edu/datacommons/,如果对这方
面了解比较多的,应该知道KidsFirst和BloodPac. 如果对大数据比较有兴趣的, ASCO
和AACR都有专门的session, 是现在NCI以及NIH今后的重点扶植方向。
除了工程项目之余的时间就是做research, 只要idea好,老板都支持。多数是大数据项
目,以癌症以及非癌症疾病的基因组等(蛋白组,甲基化组)为主,也有做天文地理水
文EMR的。计算量从来都不是问题,但是没有wet lab, 如果有新发现的话要找合作,当
然芝大不管是基础生物实验室还是医院里面找合作还是很容易的。

【在 h****n 的大作中提到】
: 赞,我记得之前版上好多NGS方向phd找工作的。顺便问一下您在芝加哥大学转化数据科
: 学中心是做什么方向的呢?可以私信我

r***t
发帖数: 110
7
特意登录进来帮忙顶一下,不认识楼主,不过赞这个态度。另外同行表示楼主做的方向
很不错,
有兴趣的人赶紧联系吧。
d********m
发帖数: 3662
8
rplot
哈哈

【在 r***t 的大作中提到】
: 特意登录进来帮忙顶一下,不认识楼主,不过赞这个态度。另外同行表示楼主做的方向
: 很不错,
: 有兴趣的人赶紧联系吧。

c********e
发帖数: 598
9

请教一下,metadata 用 GraphQL 有啥特殊优势?

【在 s******s 的大作中提到】
: https://ctds.uchicago.edu/careers
: 芝加哥大学转化数据科学中心,前身叫大数据科学中心
: 介绍一下,组里项目很多,是第一个做出来Data Commons的(NCI's
: Genomics Data Commons),现在NIH各大分部大数据大跃进,基本
: 都有我们插一腿. 组里有几个自己的云,光GDC一个项目就有20PB的
: storage, CPU core上万。其他几个项目也有用AWS/GCP的。
: 有人会问你怎么还在发广告,还没找到人啊?其实是一直招人,上
: 次发广告的时候组里三十号人,现在差不多七十号,所以广告一直有。
: 待遇从优的意思就是绝对比普通学校的bioinformatician待遇高很多,
: 是和学校做CS的同级别类似待遇。组里这么多bioinformatician, 只有

s******s
发帖数: 13035
10
GraphQL实现起来方便呗,大家又比较熟,通用性比较好。我们一些需要实时更新的
query,基本上用这个来实现。
另一方面,我们现有的大型项目,比如GDC,其实主要API是ElasticSearch(ES)支持
的,这个性能好很多。如果你看看Exploration Page的Oncogrid的话,几百上千个病人
,所有的主要mutation以及主要clinical data,能够直接作出动态交互式的视图。但
是坏处是不能直接实时query我们的图形数据库,只在data freeze以后,每次release
的时候需要重建ES Index。
btw,我们底层图形数据库叫做PSqlGraph, 用PostgreSQL实现我们需要的图形数据库功
能,是一个同事花了三个月写的。这个也是被逼的,因为当年做项目的时候open
source的图形数据库实在功能太弱,包括neo4j都被阉割的没法用,只能自给自足了。
说这么多是为了表明,除了bioinfo以外,中心里面各种IT人才太多,有好的想法和需
求大家会一起合作实现

【在 c********e 的大作中提到】
:
: 请教一下,metadata 用 GraphQL 有啥特殊优势?

b*******r
发帖数: 22
11
统计和生物 双博士 (还有个CS master),有一篇一作 Nature Methods 关于 NGS
data 分析 (目前 citation ~500), 一篇一作 PNAS, 两篇  一作 使用
nature language progressing (and deep learning) 分析 electronic medical
records (medical informatics top journals), 一篇 一作 JBC (signal
transduction analysis, wet lab). 还有一篇一作 反应器设计的工程文章。 其他还
有共同一作 Bioinformatics 的蛋白组学文章一篇,N作文章几篇。 熟练 Pyathon,
Perl and R. C 也能写点, 但不擅长。 请问背景match 您的工作吗? 谢谢 ! 忘了
, 给本科生上过一年 Machine learning and Python 课.
s******s
发帖数: 13035
12
听上去很厉害啊。欢迎来申请

【在 b*******r 的大作中提到】
: 统计和生物 双博士 (还有个CS master),有一篇一作 Nature Methods 关于 NGS
: data 分析 (目前 citation ~500), 一篇一作 PNAS, 两篇  一作 使用
: nature language progressing (and deep learning) 分析 electronic medical
: records (medical informatics top journals), 一篇 一作 JBC (signal
: transduction analysis, wet lab). 还有一篇一作 反应器设计的工程文章。 其他还
: 有共同一作 Bioinformatics 的蛋白组学文章一篇,N作文章几篇。 熟练 Pyathon,
: Perl and R. C 也能写点, 但不擅长。 请问背景match 您的工作吗? 谢谢 ! 忘了
: , 给本科生上过一年 Machine learning and Python 课.

1 (共1页)
进入Biology版参与讨论
相关主题
Oxford Nanopore 纽约 opening招聘计算生物/生物信息学博后,tumor sequencing 方向, NIH/NCI
生物信息学求职请教cancer genomics的牛牛们
NIH Chemical Genomics Center介绍clinical genomic现在还有什么搞头?
大家觉得genomic cancer study有前途吗?感觉很忽悠人啊翻墙求合作
芝大生物信息招人:大数据中心/NCI GDC用WGS寻找疾病structural variation的文章
请问哪位大牛可以帮助获得TCGA level 1 data传统生物phd怎么能转到生物信息领域
关于Bioinformatics 职位关于genomics/bioinformatics/systems biology再发问
elife收肿瘤的文章吗包子贴,征求建议
相关话题的讨论汇总
话题: genomics话题: gdc话题: data话题: commons