avatar
招人denovo assembly# Biology - 生物学
h*t
1
刚从老板那里要来的一个opening。公司在旧金山湾区。项目是denovo assembly。要求
是对bioinformatics略懂,会C++,python编程。
我们组主要目前正在开发denovo assembly的软件,主要目标是能够结合我们公司的测
序技术来组装human genome,希望能够超过现有的assemblers表现,获得高覆盖度低错
误率。职位本身是入门级的,以实现算法开发程序为主,会有相当多的编程任务。
具体的细节HR还在弄,我先提前来收收简历。有兴趣的请站内短信给我。
avatar
c*r
2
如果可以的话,能稍微介绍一下工作和项目的一些信息吗?专门找de novo assembly的
职位还是不多见。
主要用到已有的de novo assembly的pipeline(Trinity,SOAP,oases等)来组装数据
,还是要自己开发?要求会C++,python编程看样子是要开发软件吗?
序列来自人、动物、植物还是微生物?Genome还是transcriptome?测序的技术是
Illumina、PacBio还是其它技术?主要是做基础研究还是有具体应用?我对这几个问题
挺感兴趣主要是想了解一下这个领域趋势。我觉得很多应用已经不能局限在仅使用
reference上,会丢掉不少参考序列里没有的但是可能有价值的信息。de novo
assembly对硬件、运算时间、算法等都要求很高,但是结果会很有价值。
谢谢!

【在 h******t 的大作中提到】
: 刚从老板那里要来的一个opening。公司在旧金山湾区。项目是denovo assembly。要求
: 是对bioinformatics略懂,会C++,python编程。
: 我们组主要目前正在开发denovo assembly的软件,主要目标是能够结合我们公司的测
: 序技术来组装human genome,希望能够超过现有的assemblers表现,获得高覆盖度低错
: 误率。职位本身是入门级的,以实现算法开发程序为主,会有相当多的编程任务。
: 具体的细节HR还在弄,我先提前来收收简历。有兴趣的请站内短信给我。

avatar
h*t
3
抱歉,之前写得比较简略。
我们组主要目前正在开发denovo assembly的软件,主要目标是能够结合我们公司的测
序技术来组装human genome,希望能够超过现有的assemblers表现,获得高覆盖度低错
误率。职位本身是入门级的,以实现算法开发程序为主,会有相当多的编程任务。

【在 c*********r 的大作中提到】
: 如果可以的话,能稍微介绍一下工作和项目的一些信息吗?专门找de novo assembly的
: 职位还是不多见。
: 主要用到已有的de novo assembly的pipeline(Trinity,SOAP,oases等)来组装数据
: ,还是要自己开发?要求会C++,python编程看样子是要开发软件吗?
: 序列来自人、动物、植物还是微生物?Genome还是transcriptome?测序的技术是
: Illumina、PacBio还是其它技术?主要是做基础研究还是有具体应用?我对这几个问题
: 挺感兴趣主要是想了解一下这个领域趋势。我觉得很多应用已经不能局限在仅使用
: reference上,会丢掉不少参考序列里没有的但是可能有价值的信息。de novo
: assembly对硬件、运算时间、算法等都要求很高,但是结果会很有价值。
: 谢谢!

avatar
c*r
4
"希望能够超过现有的assemblers表现",这个很期待,希望能早日用上你们的软件!
有几个问题想和你再交流交流,还请多多指教。
你们的目标是结合你们公司的测序技术,也就是说你们有自己的测序技术?你们在湾区
的话,你们公司是Illumina,PacBio还是life technologies/Thermo Fisher?那么这
个软件会是商业软件了吧,会不会开源? ^_^
很好奇你们的软件会只针对一种测序方法还是几种测序方法都通用。各种测序技术产生
的reads都有特点,Illumina通量的大,但是短,而且有bias,组装之后gap很多;
PacBio长,bias小,但是错误率高(可以通过多测几遍来校正),成本高所以不普及(
我觉得以后成本下来了可以和Illumina抢市场)。不知道你们会主要针对哪一种测序技
术?
算法方面你们要开发新的算法?还是基于de Bruijn graphs的算法吗?
如果只针对人的genome的话,会开发或者兼容其他物种genome?不同物种的GC%、复杂
程度都不同,肯定不能用同一套参数来组装。像我们这种不以人为研究对象的,你们会
不会考虑一下照顾照顾我们的需求?^_^
我只用过Trinity组装转录组,感觉Trinity对内存容量要求太高了,有段时间连我们学
校的HPC都没有大内存的queue。而且reads多的话,跑都要跑五六天。所以如果能在普
通服务器上短时间就能跑完而且组装质量好的话,那肯定很受欢迎!
谢谢!

【在 h******t 的大作中提到】
: 抱歉,之前写得比较简略。
: 我们组主要目前正在开发denovo assembly的软件,主要目标是能够结合我们公司的测
: 序技术来组装human genome,希望能够超过现有的assemblers表现,获得高覆盖度低错
: 误率。职位本身是入门级的,以实现算法开发程序为主,会有相当多的编程任务。

avatar
n*7
5
我估计转行的用C++的很稀有
就我这些年的经验
C++在bioinfo的研究中用的不多
做pipeline用不上
做methodology往往也是Matlab R Python+Numpy这类开发快速的语言,还有不少java的
就是做aligner这类对性能要求高的用,但是做这块的人相对少很多
身边用C++的都是已经有很强的CS背景
这样的人折腾了这么久,估计也不会只是找个入门级的bioinfo工作
avatar
s*s
6
其实你找的是developer,不是bioinfomatician

【在 h******t 的大作中提到】
: 刚从老板那里要来的一个opening。公司在旧金山湾区。项目是denovo assembly。要求
: 是对bioinformatics略懂,会C++,python编程。
: 我们组主要目前正在开发denovo assembly的软件,主要目标是能够结合我们公司的测
: 序技术来组装human genome,希望能够超过现有的assemblers表现,获得高覆盖度低错
: 误率。职位本身是入门级的,以实现算法开发程序为主,会有相当多的编程任务。
: 具体的细节HR还在弄,我先提前来收收简历。有兴趣的请站内短信给我。

avatar
l*y
7
请懂行大牛解惑,做human genome为啥要denovo
avatar
v*e
8

可能做癌症的

【在 l***y 的大作中提到】
: 请懂行大牛解惑,做human genome为啥要denovo
avatar
v*e
9

可能做癌症的

【在 l***y 的大作中提到】
: 请懂行大牛解惑,做human genome为啥要denovo
avatar
n*7
10
programmer应该是符合吧
所以我觉得转行的bioinfomatician会C++的不错
而会C++的bioinfomatician 也应该不会对这个入门职位感兴趣

【在 s******s 的大作中提到】
: 其实你找的是developer,不是bioinfomatician
avatar
e*6
11
工资大概多少?

【在 n******7 的大作中提到】
: programmer应该是符合吧
: 所以我觉得转行的bioinfomatician会C++的不错
: 而会C++的bioinfomatician 也应该不会对这个入门职位感兴趣

avatar
e*o
12
主要看钱多少
title扯淡 语言一个星期就上手了

【在 n******7 的大作中提到】
: programmer应该是符合吧
: 所以我觉得转行的bioinfomatician会C++的不错
: 而会C++的bioinfomatician 也应该不会对这个入门职位感兴趣

avatar
n*7
13
最近开始看工作信息
入门==钱很少
去indeed搜 junior xxx可以参考一下

【在 e*********6 的大作中提到】
: 工资大概多少?
avatar
e*6
14
我觉得这个岗位要想找个能长期干的不应该低于亚麻的主流工资,不然找来人家也是骑
驴找马

【在 e*******o 的大作中提到】
: 主要看钱多少
: title扯淡 语言一个星期就上手了

avatar
n*7
15
正经广告的话
title就决定了工资范围和对你的期待
我觉得C++对于那种一直写脚本的bioinformatian们来说
一个星期是搞不定的
特别还要实现xx 算法,对于一直做pipeline和data analysis的也有些挑战
当然,你要是压力不大,我可以说我一天上手
反正边做边学呗

【在 e*******o 的大作中提到】
: 主要看钱多少
: title扯淡 语言一个星期就上手了

avatar
e*6
16
从低级往高级语言转容易,反之难

【在 n******7 的大作中提到】
: 正经广告的话
: title就决定了工资范围和对你的期待
: 我觉得C++对于那种一直写脚本的bioinformatian们来说
: 一个星期是搞不定的
: 特别还要实现xx 算法,对于一直做pipeline和data analysis的也有些挑战
: 当然,你要是压力不大,我可以说我一天上手
: 反正边做边学呗

avatar
n*7
17
对,手动挡换自动挡要容易很多
例外是完全不同的paradigm,比如functional programming
这个我一直有兴趣,可惜bioinfo里面应用不多,一直没有机会学

【在 e*********6 的大作中提到】
: 从低级往高级语言转容易,反之难
avatar
c*r
18
给你站内发短信了。
我有一个哥们儿,Software Engineering和Electrical and
Computer Engineering的硕士,会C/C++, Java, SQL, C#,Python等,懂生物信息,对
这个职位很感兴趣。谢谢!

【在 h******t 的大作中提到】
: 刚从老板那里要来的一个opening。公司在旧金山湾区。项目是denovo assembly。要求
: 是对bioinformatics略懂,会C++,python编程。
: 我们组主要目前正在开发denovo assembly的软件,主要目标是能够结合我们公司的测
: 序技术来组装human genome,希望能够超过现有的assemblers表现,获得高覆盖度低错
: 误率。职位本身是入门级的,以实现算法开发程序为主,会有相当多的编程任务。
: 具体的细节HR还在弄,我先提前来收收简历。有兴趣的请站内短信给我。

avatar
e*o
19
有个workflow engine biokepi 是ocaml写的
打车问一下
有没有简单易用的workflow engine? 最常用的是snakemake?

【在 n******7 的大作中提到】
: 对,手动挡换自动挡要容易很多
: 例外是完全不同的paradigm,比如functional programming
: 这个我一直有兴趣,可惜bioinfo里面应用不多,一直没有机会学

avatar
n*7
20
ocaml很nb
在代码简洁和运行效率两方面综合起来是最好的
可惜library是个大问题
MS的F#就是基于ocaml的,一片好评
可惜是MS的东西,linux下面基本没人用
scala是目前最流行的FP语言
还能支持java package
GATK就有大量的scala代码
可惜太繁杂,很多屎坑
bioinfo的项目/公司,要么在乎performance上c/c++
要么在乎简单可靠上java
scala有些尴尬
clojure我觉得很好玩,但是目前对工作没用的东西都不想花太多时间
workflow engine我没用过
我们这里做过Pegasus 的培训,我看了一下觉得没必要
实在不喜欢过度设计的系统
这里有个讨论,什么情况下用workflow engine
http://programmers.stackexchange.com/questions/103972/when-to-u
最佳回复是:
When you want to use a shiny but clunky wizard UI to and replace simple code
with something hard-to-debug, hard-to-test, and full of opaque error-codes.
.. That's when I recommend to use a workflow engine. – JasonTrue Aug 26 '11
at 17:36

【在 e*******o 的大作中提到】
: 有个workflow engine biokepi 是ocaml写的
: 打车问一下
: 有没有简单易用的workflow engine? 最常用的是snakemake?

avatar
e*o
21
我觉得还是有用 不过主要问题是试过几个都不好用 都是自己的dsl 又没有明确的规范

【在 n******7 的大作中提到】
: ocaml很nb
: 在代码简洁和运行效率两方面综合起来是最好的
: 可惜library是个大问题
: MS的F#就是基于ocaml的,一片好评
: 可惜是MS的东西,linux下面基本没人用
: scala是目前最流行的FP语言
: 还能支持java package
: GATK就有大量的scala代码
: 可惜太繁杂,很多屎坑
: bioinfo的项目/公司,要么在乎performance上c/c++

avatar
f*8
22
hg19还是有很多gap的。另外,其实不同的人种都需要自己的reference。
现在的reference genome还是sanger测序搞的(花了好多钱~3B), 如果能用illumina
,pacbio/nanopore或者是其他新的测序技术搞出来个新的高质量的reference就nb了。

【在 l***y 的大作中提到】
: 请懂行大牛解惑,做human genome为啥要denovo
avatar
e*6
23
我觉得生物版的人特别忧国忧民,都在讨论大趋势。这种帖子都第二页了居然没人问工
资。看类似统计版或者job hunting版都是问工资的。要是工资低了还要被骂

规范

【在 e*******o 的大作中提到】
: 我觉得还是有用 不过主要问题是试过几个都不好用 都是自己的dsl 又没有明确的规范
avatar
c*r
24
发站内信问了,楼主没理我。。。

【在 e*********6 的大作中提到】
: 我觉得生物版的人特别忧国忧民,都在讨论大趋势。这种帖子都第二页了居然没人问工
: 资。看类似统计版或者job hunting版都是问工资的。要是工资低了还要被骂
:
: 规范

avatar
n*7
25
生物版的主题就是逃避现实
要么就是谈论各种跟自己不相关的神仙,指点下江山
要么就是揭露各种黑暗,感叹一下世事艰难
而偶尔有招工的贴,也不是自己努力想申请就可以拿到的
生物人找工作太难,顺便一个职位都拼的刺刀见红
本来BBRC水平就可以胜任的,NCS的人跟你抢
工资比postdoc高估计就成了
就这个贴,专门强调了是入门职位,适合转行人士,我基本确定工资高不了
你要是有兴趣直接问楼主

【在 e*********6 的大作中提到】
: 我觉得生物版的人特别忧国忧民,都在讨论大趋势。这种帖子都第二页了居然没人问工
: 资。看类似统计版或者job hunting版都是问工资的。要是工资低了还要被骂
:
: 规范

avatar
e*o
26
湾区 8万 只少不会多

【在 n******7 的大作中提到】
: 生物版的主题就是逃避现实
: 要么就是谈论各种跟自己不相关的神仙,指点下江山
: 要么就是揭露各种黑暗,感叹一下世事艰难
: 而偶尔有招工的贴,也不是自己努力想申请就可以拿到的
: 生物人找工作太难,顺便一个职位都拼的刺刀见红
: 本来BBRC水平就可以胜任的,NCS的人跟你抢
: 工资比postdoc高估计就成了
: 就这个贴,专门强调了是入门职位,适合转行人士,我基本确定工资高不了
: 你要是有兴趣直接问楼主

avatar
d*r
27
湾区不是最近公布贫困线都25万了,在贫困线以下的可以住政府的廉租房吗?
8万简直是塞牙缝都还不够啊,还更少?

【在 e*******o 的大作中提到】
: 湾区 8万 只少不会多
avatar
h*t
28
我是楼主。
不知道是换了标题的关系还是周末大家比较有时间,回帖一下多了起来。
水平有限,学术讨论就不参加了。回答几个大家关心的问题。
1. 这个职位是不是程序员?
是。但不是“主流”的程序员。我们不搞手机app,不弄什么网络服务器,我们只是用c
++给公司的测序系统编写基因组装程序。Scientific programmer可能是更合适的title
。组里现在都是programmers,我略微倾向于能够招个有一定生物或者生物信息背景的
,用来丰富团队的组成,拓宽视野。
2. 为什么说是入门级?
主要是不要求一定有相关工作经验,不要求一定有很强背景。这不是一个senior职位。
3. 待遇如何?
我觉得还是不错的。差不多是旧金山湾区的普通程序员的入门级工资。所以应该比别的
行业别的地区的入门级工资要高上那么一些。当然旧金山湾区的生活成本在那里,这个
你自己综合考虑。
这个职位是上周我从大老板那里要来的,HR处理起来可能需要一点时间。去年招人的时
候,网投过来的candidates实在差太远面试了大半年才招了一个,这次贴出来希望能有
更多更好的candidates,也希望给忙于求职的朋友们增加一些机会。
avatar
e*o
29
没有最少只有更少
要是去学校更低 包括Stanford

【在 d*****r 的大作中提到】
: 湾区不是最近公布贫困线都25万了,在贫困线以下的可以住政府的廉租房吗?
: 8万简直是塞牙缝都还不够啊,还更少?

avatar
s*r
30
平时用c++干活做bioinfo的都是牛人,应该看不上这种入门职位
直接招个能写c++的算了,实现算法要懂啥生物

【在 h******t 的大作中提到】
: 刚从老板那里要来的一个opening。公司在旧金山湾区。项目是denovo assembly。要求
: 是对bioinformatics略懂,会C++,python编程。
: 我们组主要目前正在开发denovo assembly的软件,主要目标是能够结合我们公司的测
: 序技术来组装human genome,希望能够超过现有的assemblers表现,获得高覆盖度低错
: 误率。职位本身是入门级的,以实现算法开发程序为主,会有相当多的编程任务。
: 具体的细节HR还在弄,我先提前来收收简历。有兴趣的请站内短信给我。

avatar
F*t
31
生物的能玩转C++几乎不可能
生物信息的能玩C++是高手,页不太可能去干初级职位。
事实上,生物信息用R,python,perl的是主流
用java和C的有一些
用C++的我还没见过。

用c
title

【在 h******t 的大作中提到】
: 我是楼主。
: 不知道是换了标题的关系还是周末大家比较有时间,回帖一下多了起来。
: 水平有限,学术讨论就不参加了。回答几个大家关心的问题。
: 1. 这个职位是不是程序员?
: 是。但不是“主流”的程序员。我们不搞手机app,不弄什么网络服务器,我们只是用c
: ++给公司的测序系统编写基因组装程序。Scientific programmer可能是更合适的title
: 。组里现在都是programmers,我略微倾向于能够招个有一定生物或者生物信息背景的
: ,用来丰富团队的组成,拓宽视野。
: 2. 为什么说是入门级?
: 主要是不要求一定有相关工作经验,不要求一定有很强背景。这不是一个senior职位。

avatar
e*6
32
我是bioinfo我也用c++但我不是牛人。。。。

【在 s******r 的大作中提到】
: 平时用c++干活做bioinfo的都是牛人,应该看不上这种入门职位
: 直接招个能写c++的算了,实现算法要懂啥生物

avatar
d*r
33
学生物的玩转C++的还是很多的。
生物信息玩转C++的也很多,版上某人的PhD老板就是:
http://reducio.princeton.edu/cm/ogt
他们实验室出来直接去花街投行写C++没问题。

【在 F*******t 的大作中提到】
: 生物的能玩转C++几乎不可能
: 生物信息的能玩C++是高手,页不太可能去干初级职位。
: 事实上,生物信息用R,python,perl的是主流
: 用java和C的有一些
: 用C++的我还没见过。
:
: 用c
: title

avatar
w*e
34
come on!
人家是cs 专业的好不好!

【在 d*****r 的大作中提到】
: 学生物的玩转C++的还是很多的。
: 生物信息玩转C++的也很多,版上某人的PhD老板就是:
: http://reducio.princeton.edu/cm/ogt
: 他们实验室出来直接去花街投行写C++没问题。

avatar
W*o
35
元芳你怎么看?这个其实算cs便bioinfo的了

【在 d*****r 的大作中提到】
: 学生物的玩转C++的还是很多的。
: 生物信息玩转C++的也很多,版上某人的PhD老板就是:
: http://reducio.princeton.edu/cm/ogt
: 他们实验室出来直接去花街投行写C++没问题。

avatar
s*x
36
Olga是计算机系的。

【在 d*****r 的大作中提到】
: 学生物的玩转C++的还是很多的。
: 生物信息玩转C++的也很多,版上某人的PhD老板就是:
: http://reducio.princeton.edu/cm/ogt
: 他们实验室出来直接去花街投行写C++没问题。

avatar
d*r
37
她不是招了很多生物学本科背景的学生吗,而且他们都后来出路都不错。
不要纠结于生物系还是计算机系,其实都是一回事。

【在 s*********x 的大作中提到】
: Olga是计算机系的。
avatar
s*a
38
@demoner: 其实都是一回事
That's true but only to top talents. Most people are not in that category.
相关阅读
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。