Redian新闻
>
招做Genomics的Ph.D. level bioinformatician,芝大,待遇从优
avatar
招做Genomics的Ph.D. level bioinformatician,芝大,待遇从优# Biology - 生物学
s*s
1
https://ctds.uchicago.edu/careers
芝加哥大学转化数据科学中心,前身叫大数据科学中心
介绍一下,组里项目很多,是第一个做出来Data Commons的(NCI's
Genomics Data Commons),现在NIH各大分部大数据大跃进,基本
都有我们插一腿. 组里有几个自己的云,光GDC一个项目就有20PB的
storage, CPU core上万。其他几个项目也有用AWS/GCP的。
有人会问你怎么还在发广告,还没找到人啊?其实是一直招人,上
次发广告的时候组里三十号人,现在差不多七十号,所以广告一直有。
待遇从优的意思就是绝对比普通学校的bioinformatician待遇高很多,
是和学校做CS的同级别类似待遇。组里这么多bioinformatician, 只有
一个是和老婆回西班牙,其他的这么多年没有跳槽的。
这个名额主要是给GDC工作,prefer genomics和pipeline background.
当然,你的background不一样也没事,有其他强项我们也会考虑,比
如编程超强等也行,我们也不止GDC一个项目。有兴趣的直接到网上
申请,有问题直接email问,或者给我投条也行,不保证及时恢复哟。
avatar
s*s
2
好像job link不work了,用这个吧
https://uchicago.wd5.myworkdayjobs.com/en-US/External/job/Shoreland/Senior-
Bioinformatician-1_JR03570

【在 s******s 的大作中提到】
: https://ctds.uchicago.edu/careers
: 芝加哥大学转化数据科学中心,前身叫大数据科学中心
: 介绍一下,组里项目很多,是第一个做出来Data Commons的(NCI's
: Genomics Data Commons),现在NIH各大分部大数据大跃进,基本
: 都有我们插一腿. 组里有几个自己的云,光GDC一个项目就有20PB的
: storage, CPU core上万。其他几个项目也有用AWS/GCP的。
: 有人会问你怎么还在发广告,还没找到人啊?其实是一直招人,上
: 次发广告的时候组里三十号人,现在差不多七十号,所以广告一直有。
: 待遇从优的意思就是绝对比普通学校的bioinformatician待遇高很多,
: 是和学校做CS的同级别类似待遇。组里这么多bioinformatician, 只有

avatar
h*n
4
赞,我记得之前版上好多NGS方向phd找工作的。顺便问一下您在芝加哥大学转化数据科
学中心是做什么方向的呢?可以私信我
avatar
s*s
6
解释一下我们中心主要做什么
最大的一部分是做工程项目。GDC https://gdc.cancer.gov/是我们做的最早的也是
现在最大的data commons项目,基本上NCI CCG support的研究项目,里面有基因组数
据的都会过来,现在已经有十几个项目了(很多数据没放出来)。大家不知道CCG是干
啥的,就是做TCGA的部门,做癌症基因组这行的TCGA都知道把。现在TCGA的数据我们全
分析过一遍,在我们OpenStack的云上,然后在Google和AWS上各有一个几千个TB的copy,
现在FireCloud,7-bridges啥的都是在用云上的数据。计划以后的项目都这么搞,不愿
意下载数据的我们直接提供可视化页面分析,愿意下载在电脑里少量分析的可以用我们
的工具下载,要大量分析的,直接上云随意。
btw, 对国内科委生物大数据项目有兴趣的可以去看看国内的五年计划,基本要求就是
按照我们现在已经实现的部分写的,不谦虚的说,我们是美国第一个成功搭建的data
commons, 比国内基本领先三到五年。
在GDC的基础上,我们推出了一系列可以帮助别人搭建data commons,叫做Gen3 https:
//ctds.uchicago.edu/gen3/. 这方面我们有很多合作单位,也有很多high profile的
项目。当然有些项目实在太high profile, 信息发布都有保密的需要,我就不能说了。
一部分现在不保密的列在这里https://ctds.uchicago.edu/datacommons/,如果对这方
面了解比较多的,应该知道KidsFirst和BloodPac. 如果对大数据比较有兴趣的, ASCO
和AACR都有专门的session, 是现在NCI以及NIH今后的重点扶植方向。
除了工程项目之余的时间就是做research, 只要idea好,老板都支持。多数是大数据项
目,以癌症以及非癌症疾病的基因组等(蛋白组,甲基化组)为主,也有做天文地理水
文EMR的。计算量从来都不是问题,但是没有wet lab, 如果有新发现的话要找合作,当
然芝大不管是基础生物实验室还是医院里面找合作还是很容易的。

【在 h****n 的大作中提到】
: 赞,我记得之前版上好多NGS方向phd找工作的。顺便问一下您在芝加哥大学转化数据科
: 学中心是做什么方向的呢?可以私信我

avatar
r*t
7
特意登录进来帮忙顶一下,不认识楼主,不过赞这个态度。另外同行表示楼主做的方向
很不错,
有兴趣的人赶紧联系吧。
avatar
d*m
8
rplot
哈哈

【在 r***t 的大作中提到】
: 特意登录进来帮忙顶一下,不认识楼主,不过赞这个态度。另外同行表示楼主做的方向
: 很不错,
: 有兴趣的人赶紧联系吧。

avatar
c*e
9

请教一下,metadata 用 GraphQL 有啥特殊优势?

【在 s******s 的大作中提到】
: https://ctds.uchicago.edu/careers
: 芝加哥大学转化数据科学中心,前身叫大数据科学中心
: 介绍一下,组里项目很多,是第一个做出来Data Commons的(NCI's
: Genomics Data Commons),现在NIH各大分部大数据大跃进,基本
: 都有我们插一腿. 组里有几个自己的云,光GDC一个项目就有20PB的
: storage, CPU core上万。其他几个项目也有用AWS/GCP的。
: 有人会问你怎么还在发广告,还没找到人啊?其实是一直招人,上
: 次发广告的时候组里三十号人,现在差不多七十号,所以广告一直有。
: 待遇从优的意思就是绝对比普通学校的bioinformatician待遇高很多,
: 是和学校做CS的同级别类似待遇。组里这么多bioinformatician, 只有

avatar
s*s
10
GraphQL实现起来方便呗,大家又比较熟,通用性比较好。我们一些需要实时更新的
query,基本上用这个来实现。
另一方面,我们现有的大型项目,比如GDC,其实主要API是ElasticSearch(ES)支持
的,这个性能好很多。如果你看看Exploration Page的Oncogrid的话,几百上千个病人
,所有的主要mutation以及主要clinical data,能够直接作出动态交互式的视图。但
是坏处是不能直接实时query我们的图形数据库,只在data freeze以后,每次release
的时候需要重建ES Index。
btw,我们底层图形数据库叫做PSqlGraph, 用PostgreSQL实现我们需要的图形数据库功
能,是一个同事花了三个月写的。这个也是被逼的,因为当年做项目的时候open
source的图形数据库实在功能太弱,包括neo4j都被阉割的没法用,只能自给自足了。
说这么多是为了表明,除了bioinfo以外,中心里面各种IT人才太多,有好的想法和需
求大家会一起合作实现

【在 c********e 的大作中提到】
:
: 请教一下,metadata 用 GraphQL 有啥特殊优势?

avatar
b*r
11
统计和生物 双博士 (还有个CS master),有一篇一作 Nature Methods 关于 NGS
data 分析 (目前 citation ~500), 一篇一作 PNAS, 两篇  一作 使用
nature language progressing (and deep learning) 分析 electronic medical
records (medical informatics top journals), 一篇 一作 JBC (signal
transduction analysis, wet lab). 还有一篇一作 反应器设计的工程文章。 其他还
有共同一作 Bioinformatics 的蛋白组学文章一篇,N作文章几篇。 熟练 Pyathon,
Perl and R. C 也能写点, 但不擅长。 请问背景match 您的工作吗? 谢谢 ! 忘了
, 给本科生上过一年 Machine learning and Python 课.
avatar
s*s
12
听上去很厉害啊。欢迎来申请

【在 b*******r 的大作中提到】
: 统计和生物 双博士 (还有个CS master),有一篇一作 Nature Methods 关于 NGS
: data 分析 (目前 citation ~500), 一篇一作 PNAS, 两篇  一作 使用
: nature language progressing (and deep learning) 分析 electronic medical
: records (medical informatics top journals), 一篇 一作 JBC (signal
: transduction analysis, wet lab). 还有一篇一作 反应器设计的工程文章。 其他还
: 有共同一作 Bioinformatics 的蛋白组学文章一篇,N作文章几篇。 熟练 Pyathon,
: Perl and R. C 也能写点, 但不擅长。 请问背景match 您的工作吗? 谢谢 ! 忘了
: , 给本科生上过一年 Machine learning and Python 课.

相关阅读
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。