Redian新闻
>
该转到computational bio领域吗
avatar
该转到computational bio领域吗# Biology - 生物学
t*l
1
现在刚到博士2年级,lab还没定,之前的lab rotation都黄了,我们学校phd项目是个
雨伞项目,从结构生物学,到分子细胞基础生物医学,到化学药理医学影像都可以做,
还有一些做计算的。但是我们1年级主修的课程是传统的那种基础生物医学课程。我现
在犹豫是不是可以转到computational 这个领域,有一个老师做算法分析的。刚联系她
,她的感觉貌似是知道我是一个传统背景的学生,建议我走co-mentor和一个做high-
through put的 wet Lab。 还是自己的学生做的都是高级computational modeling.她
要的background 什么matlab那些玩意我也没接触过。
现在真的很犹豫,不知道是不是要继续走一个纯wet-lab路线(之前我做的都是纯web-
lab的,后来做了点bisulfate-seq,但也是之前的准备过程,后来的分析都是别人做的
),还是一个想她建议的wet-dry合作。我更想做一个纯dry lab的person, 这样正好把
CS学了。我想是在dry lab修炼,以后或者的出路会更多一点。 就是不知道从头学起
要多久? 我们学校倒是还有一个computational bio phd的合作的graduate school 项
目,和别的学校一起合办的。博士以后还有4-5年,如果现在转,还来得及?
avatar
f*h
2
来得及。。。我认识一些没有计算背景的都转了,只要愿意学

【在 t**l 的大作中提到】
: 现在刚到博士2年级,lab还没定,之前的lab rotation都黄了,我们学校phd项目是个
: 雨伞项目,从结构生物学,到分子细胞基础生物医学,到化学药理医学影像都可以做,
: 还有一些做计算的。但是我们1年级主修的课程是传统的那种基础生物医学课程。我现
: 在犹豫是不是可以转到computational 这个领域,有一个老师做算法分析的。刚联系她
: ,她的感觉貌似是知道我是一个传统背景的学生,建议我走co-mentor和一个做high-
: through put的 wet Lab。 还是自己的学生做的都是高级computational modeling.她
: 要的background 什么matlab那些玩意我也没接触过。
: 现在真的很犹豫,不知道是不是要继续走一个纯wet-lab路线(之前我做的都是纯web-
: lab的,后来做了点bisulfate-seq,但也是之前的准备过程,后来的分析都是别人做的
: ),还是一个想她建议的wet-dry合作。我更想做一个纯dry lab的person, 这样正好把

avatar
f*h
3
给你举个例子,sean eddy博士的时候就是纯生物的,不过你要是为了上cs的课还是和
老师先说好,省得到时候闹不愉快

【在 t**l 的大作中提到】
: 现在刚到博士2年级,lab还没定,之前的lab rotation都黄了,我们学校phd项目是个
: 雨伞项目,从结构生物学,到分子细胞基础生物医学,到化学药理医学影像都可以做,
: 还有一些做计算的。但是我们1年级主修的课程是传统的那种基础生物医学课程。我现
: 在犹豫是不是可以转到computational 这个领域,有一个老师做算法分析的。刚联系她
: ,她的感觉貌似是知道我是一个传统背景的学生,建议我走co-mentor和一个做high-
: through put的 wet Lab。 还是自己的学生做的都是高级computational modeling.她
: 要的background 什么matlab那些玩意我也没接触过。
: 现在真的很犹豫,不知道是不是要继续走一个纯wet-lab路线(之前我做的都是纯web-
: lab的,后来做了点bisulfate-seq,但也是之前的准备过程,后来的分析都是别人做的
: ),还是一个想她建议的wet-dry合作。我更想做一个纯dry lab的person, 这样正好把

avatar
w*e
4
做医学影像的偏临床的应用也挺好的。PET, SPET, angiography, fMRI 之类的。这些
都是工科的东西,出来可以找engineer的工作。貌似比较好找。
avatar
e*o
5
当然转,混得好就做research,混不好就当码工。
avatar
x*m
6
千万别去那种干湿都做的lab,这种lab的pi大部分也是半吊子的计算背景,懂个皮毛。
到头来回去push你去做实验,美其名曰know how to generate data and analyze data.
要找就要找stat或者cs的pi,最好他们跟wet lab有合作,你弄些data分析,多学学算
法,统计模型,对将来找工作有好处。
avatar
u*1
7
sean eddy
我看成了 sean cody

【在 f*****h 的大作中提到】
: 给你举个例子,sean eddy博士的时候就是纯生物的,不过你要是为了上cs的课还是和
: 老师先说好,省得到时候闹不愉快

avatar
f*h
8
这,我还专门查了一下。。。

【在 u*********1 的大作中提到】
: sean eddy
: 我看成了 sean cody

avatar
E*g
9
有两种情况
1. 围绕统计相关的。生物信息学,生物统计。
2. 围绕统计力学相关的。如动力学,结构也算吧。
感觉每个水都挺深的。如果考虑到将来就业,直接CS,如果誓死将考研做到底,不追求
金钱财富一类的,建议踏踏实实将所有的都好好学学,包括wet lab的东西。没有经过
wet lab的训练,一般很难有那种感性认识。还有一些做计算的,纯粹是自娱自乐,不
管wet lab是个什么样的情况,这样做计算的,我感觉比较危险。
avatar
s*y
10
觉不觉得这人长得有几分象Shelton Cooper ?

【在 f*****h 的大作中提到】
: 这,我还专门查了一下。。。
avatar
u*1
11
我表示你说的有一部分道理,但依然强烈反对

data.

【在 x******m 的大作中提到】
: 千万别去那种干湿都做的lab,这种lab的pi大部分也是半吊子的计算背景,懂个皮毛。
: 到头来回去push你去做实验,美其名曰know how to generate data and analyze data.
: 要找就要找stat或者cs的pi,最好他们跟wet lab有合作,你弄些data分析,多学学算
: 法,统计模型,对将来找工作有好处。

avatar
u*1
12
我说说我的经历和看法,因为我过去的处境和你一模一样
首先要说,如果你对sequencing/bioinformatics不反感的话,这是个非常好的方向(
至少我个人觉得)。有的人还真的是看到一大堆数字就感觉头疼吐血,如果你是这类人
,那还是算了吧。
我本科做RNA的,本科毕业的时候(大概2010年左右),那时候什么RNA-seq和CLIP刚刚
兴起(但好像貌似到现在短短几年就发展很普及了),所以我国内的那个lab他们做什
么RNA-seq啦CLIP啦我觉得非常的有趣神奇,因为你一下子可以有几千万条的alignment
,那么多信息。当时我benchwork做的很郁闷(但现在想想一个小本科生能做出啥呢)
,所以看到他们计算机按一下回车键就可以有那么多条的data出现,我真的是非常渴望
那种感觉。所以很搞笑的是,我在RNA lab最大的收获不是对RNA本身的认识,而是埋下
了对genomics/sequencing的兴趣的种子。所以现在想想真的是非常非常感激过去的实
验室,几乎决定了我未来的方向和兴趣。所以顺便说一句,越是年纪小的时候越不要给
自己规划太细节的未来,而是应该培养对科学的认知以及一个开阔良好的视野,这是极
端重要的。
我来美国之后也正好是经济形势不好。第一个rotation找的是epigenetics的一个牛人
,只做benchwork;这老板是天才,他也懂一点点bioinformatics,但绝对不够给你指
导因为他实验室的计算分析都是送到其他实验室做的。搞的我挺郁闷,就直接去找
bioinformatics系一个做population genetics/evolutionary的老板,我相信他未来也
是大牛;在他这里完全就是做statistics,可以受到很好的statistics的训练。而我当
时的鬼点子也是:正好,直接say goodbye to benchwork,彻底的去学数学。但坦白说
,我对evolution一点点兴趣都没有!关键是我觉得这个领域就是个自己乱意淫的领域
,感觉就是大家玩弄不同的statistics model来改进下calculating power,没有半点
的实际应用。然后正好这个老师转到欧洲去了,我也就想算了,反正没兴趣。于是找到
了这第三个老师,一个assistant prof,半吊子的bioinformatician;他自己是医生,
也搞research,有benchwork,也同时懂计算,当然了他也是业余的。但在他实验室也
基本是30%的bench和70%的computation
他主业是做microbiology/immunology里面的计算的,这是他clinic方面的兴趣。我从
本科一直的理想都是human genome,坦白说当时有点不爽;但心里想美国形势这么差,
能找到lab就不错了,还是个computation lab;这个immunology/microbio总要比那个
什么莫名其妙的evolution要有趣的多。更不要说,很多真正计算出身的established
professor,尤其是功利push的,他们大部分看你没有计算背景是不要你的,因为他们
需要你直接就能来干活。所以这也是很多人不敢转bioinformatics或者转不了的原因,
完全看你的机缘造化是否遇到好人。我这个小老板,是assistant prof,刚来,坦白说
他自己也是半吊子,所以看我还比较有热情,就要了。当然了,我很感激这个小老板,
因为他是非常teaching的一个老师,真的是“老师”,他以能教育栽培你为荣,而不像
大部分的老板(尤其中国老板)直接当你是奴隶干活。这真是我的幸运之处。
于是我就在这个assistant prof这里做rotation,当中我自然要问:你有funding吗要
人吗blabla的。极端幸运的是,或者出乎我意料的是,他正好要和一个做神经病学的超
级大牛合作。这也很正常,因为小老板刚来医学院,需要依靠一些大牛老板生存下去;
而大牛一般都需要各种合作者。至少他俩如何勾搭上的,我猜测也是因为他们都是医生
吧,虽然是不同科系;大牛老板可能看小老板是难得的懂bioinformatics的医生,或许
比其他那些只会cs或者biology的bioinformatician更好交流。
于是我就以neurology和bioinformatics的joint student的身份开始了我PHD的研究。
其实很搞笑的是,我的所有salary和funding都是这个大老板pay的,因为他不缺钱;而
小老板不pay我半分钱但是给我更多的指导。更搞笑的是,第二年都开始了大半年,我
都没见过这个pay我工资的“大老板”;因为我第二年一开始一直都在bioinformatics/
computation的training。现在想想,我当时那是一点点计算都不懂,连linux系统是啥
都不知道。当时也会很怀疑自己是否做的下去,豁出去了。然后过了大半年,慢慢上了
路,可以见人了,就和大老板见了面。但总的来说我的第二年都是在做计算,和大老板
没啥接触。所以我第二年哪怕是qualifying exam的proposal都是和计算相关的,完全
脱离neurology,因为我不懂神经生物学/神经病学。那个时候更加感觉自己是个会跑一
些简单程序的technician,坦白说能跑点程序我就很有成就感了,完全不懂科学。
大概到了第二年末,我做计算机的同时,也自己做sequencing library,开始学
neurology,参加大牛实验室的各种组会;然后sequencing数据有些成果,需要实验验
证,也就在大牛实验室里有了自己的bench。

【在 t**l 的大作中提到】
: 现在刚到博士2年级,lab还没定,之前的lab rotation都黄了,我们学校phd项目是个
: 雨伞项目,从结构生物学,到分子细胞基础生物医学,到化学药理医学影像都可以做,
: 还有一些做计算的。但是我们1年级主修的课程是传统的那种基础生物医学课程。我现
: 在犹豫是不是可以转到computational 这个领域,有一个老师做算法分析的。刚联系她
: ,她的感觉貌似是知道我是一个传统背景的学生,建议我走co-mentor和一个做high-
: through put的 wet Lab。 还是自己的学生做的都是高级computational modeling.她
: 要的background 什么matlab那些玩意我也没接触过。
: 现在真的很犹豫,不知道是不是要继续走一个纯wet-lab路线(之前我做的都是纯web-
: lab的,后来做了点bisulfate-seq,但也是之前的准备过程,后来的分析都是别人做的
: ),还是一个想她建议的wet-dry合作。我更想做一个纯dry lab的person, 这样正好把

avatar
u*1
13
上面是我的经历,下面说下我的感想感悟:
1. 永远别怀疑自己的能力;尤其bioinformatics这一行。说白了我到现在也是个大外
行,不懂计算机。但bioinformatics != 计算机,bioinformatics != coding。除非
你做什么algorithm的开发,对coding技术要求很高,不然的话对我们大部分所谓的
bioinformatician,我们都是用人家已经开发好的program,什么BWA,什么GATK;你觉
得你开发的过人家Broad的那群天才吗?相反,我觉得很多CS出身人压根不懂生物或者
医学,他们能做的就是写点什么新的程序,然后证明下自己的计算power比已有的要强
,发个文章,他们也不maintain他们的program,N多bug,也不会有人用他们的program
;在我看来他们就是制造垃圾paper的。所以bioinformatics的本质不是coding,而是
等你有生物医学的问题的时候,你要会用计算机来解决你的生物问题。这才是核心。很
多不懂生物医学的计算背景的人,他们无非是看bio的funding多,钱多人傻来忽悠忽悠
,混口饭吃罢了。
2.bioinfor的核心在于生物。这点我感悟太深了。第二年的时候只会跑点程序就很开心
了,你要我做个read alignment没问题,要我做SNP calling也没问题,但你要问我为
什么要做这个,我完全不知道自己在干啥。
到后来对biology了解的多了以后,才慢慢懂得一系列的东西,neurological disease
本身的特点,有什么研究进展,disease genetics/genomics;过去只会SNP,慢慢的开
始分析haplotype;过去只盯着coding region,现在慢慢扩展到noncoding;过去只会
分析现成的data,却不知道到底sequencing这个过程是如何产生这些data的。过去只知
道传统的测序技术,现在知道去看看新兴的技术。所有的这些知识都交织在一起的,从
生物到医学,从基因组到遗传学,从测序到生物信息分析再到下游的验证实验。你必须
都懂才会体会到其中的奥妙,才能更好的设计自己的研究,其实到后来你就感觉到,所
有的兴趣好奇灵感都是来源于生命科学本身的,也是支撑我们做下去的动力,什么计算
机的东西就是个工具,工具。
3. 如果你要做bio这一行,那尽量就坚持bench和bioinformatics都做。如我上面说的
,bioinfor其实是个人都可以做,只是工具而已;更不要说bioinfor/sequencing发展
如此迅猛,或许以后人人都要用,人人都要会;那么也只有现在就开始全方位的
training才能让自己以后更加有竞争力。
当然,我以上说的前提是你很热爱bio的研究;对生物医学问题有兴趣有钻研精神,那
肯定很快乐。但如果你是想通过bioinfor转行到CS的,well,我过去其实也是这个想法
,肯定也是一条路子,但对我这种对精神需求要求很高的人,完全是一种浪费生命的折
磨。因为如果我的目标是CS,那我为什么要在这里做bioinfor浪费时间?说白了就是你
暂时没办法转行的一种妥协。
anyway,兴趣快乐是第一位的。做科学的人本来就应该热爱科学,只不过现实往往很残
酷。

【在 t**l 的大作中提到】
: 现在刚到博士2年级,lab还没定,之前的lab rotation都黄了,我们学校phd项目是个
: 雨伞项目,从结构生物学,到分子细胞基础生物医学,到化学药理医学影像都可以做,
: 还有一些做计算的。但是我们1年级主修的课程是传统的那种基础生物医学课程。我现
: 在犹豫是不是可以转到computational 这个领域,有一个老师做算法分析的。刚联系她
: ,她的感觉貌似是知道我是一个传统背景的学生,建议我走co-mentor和一个做high-
: through put的 wet Lab。 还是自己的学生做的都是高级computational modeling.她
: 要的background 什么matlab那些玩意我也没接触过。
: 现在真的很犹豫,不知道是不是要继续走一个纯wet-lab路线(之前我做的都是纯web-
: lab的,后来做了点bisulfate-seq,但也是之前的准备过程,后来的分析都是别人做的
: ),还是一个想她建议的wet-dry合作。我更想做一个纯dry lab的person, 这样正好把

avatar
s*a
14
强烈赞码这么多字!

alignment

【在 u*********1 的大作中提到】
: 我说说我的经历和看法,因为我过去的处境和你一模一样
: 首先要说,如果你对sequencing/bioinformatics不反感的话,这是个非常好的方向(
: 至少我个人觉得)。有的人还真的是看到一大堆数字就感觉头疼吐血,如果你是这类人
: ,那还是算了吧。
: 我本科做RNA的,本科毕业的时候(大概2010年左右),那时候什么RNA-seq和CLIP刚刚
: 兴起(但好像貌似到现在短短几年就发展很普及了),所以我国内的那个lab他们做什
: 么RNA-seq啦CLIP啦我觉得非常的有趣神奇,因为你一下子可以有几千万条的alignment
: ,那么多信息。当时我benchwork做的很郁闷(但现在想想一个小本科生能做出啥呢)
: ,所以看到他们计算机按一下回车键就可以有那么多条的data出现,我真的是非常渴望
: 那种感觉。所以很搞笑的是,我在RNA lab最大的收获不是对RNA本身的认识,而是埋下

avatar
f*h
15
同意~~

【在 s******y 的大作中提到】
: 觉不觉得这人长得有几分象Shelton Cooper ?
avatar
x*d
16
不能赞同更多!我的经历也和你差不多,目前也在一个RNA-Seq lab。欢迎交流!

alignment

【在 u*********1 的大作中提到】
: 我说说我的经历和看法,因为我过去的处境和你一模一样
: 首先要说,如果你对sequencing/bioinformatics不反感的话,这是个非常好的方向(
: 至少我个人觉得)。有的人还真的是看到一大堆数字就感觉头疼吐血,如果你是这类人
: ,那还是算了吧。
: 我本科做RNA的,本科毕业的时候(大概2010年左右),那时候什么RNA-seq和CLIP刚刚
: 兴起(但好像貌似到现在短短几年就发展很普及了),所以我国内的那个lab他们做什
: 么RNA-seq啦CLIP啦我觉得非常的有趣神奇,因为你一下子可以有几千万条的alignment
: ,那么多信息。当时我benchwork做的很郁闷(但现在想想一个小本科生能做出啥呢)
: ,所以看到他们计算机按一下回车键就可以有那么多条的data出现,我真的是非常渴望
: 那种感觉。所以很搞笑的是,我在RNA lab最大的收获不是对RNA本身的认识,而是埋下

avatar
h*y
17
顶这个牛牛,
非常同意你说的,bioinformatics的核心是生物。

program

【在 u*********1 的大作中提到】
: 上面是我的经历,下面说下我的感想感悟:
: 1. 永远别怀疑自己的能力;尤其bioinformatics这一行。说白了我到现在也是个大外
: 行,不懂计算机。但bioinformatics != 计算机,bioinformatics != coding。除非
: 你做什么algorithm的开发,对coding技术要求很高,不然的话对我们大部分所谓的
: bioinformatician,我们都是用人家已经开发好的program,什么BWA,什么GATK;你觉
: 得你开发的过人家Broad的那群天才吗?相反,我觉得很多CS出身人压根不懂生物或者
: 医学,他们能做的就是写点什么新的程序,然后证明下自己的计算power比已有的要强
: ,发个文章,他们也不maintain他们的program,N多bug,也不会有人用他们的program
: ;在我看来他们就是制造垃圾paper的。所以bioinformatics的本质不是coding,而是
: 等你有生物医学的问题的时候,你要会用计算机来解决你的生物问题。这才是核心。很

avatar
f*7
18
站在生物的角度做bioinformatics,把bioinformatics当成工具,是一个上手比较快的
途径,做PhD的时候也能发文章发的不错,但是sustainability 是个问题, 以后找工作
的时候会有难度(无论是academia还是industry). 做bioinformatics最怕的是做的什么
都懂一些,但是什么又都不精通。

program

【在 u*********1 的大作中提到】
: 上面是我的经历,下面说下我的感想感悟:
: 1. 永远别怀疑自己的能力;尤其bioinformatics这一行。说白了我到现在也是个大外
: 行,不懂计算机。但bioinformatics != 计算机,bioinformatics != coding。除非
: 你做什么algorithm的开发,对coding技术要求很高,不然的话对我们大部分所谓的
: bioinformatician,我们都是用人家已经开发好的program,什么BWA,什么GATK;你觉
: 得你开发的过人家Broad的那群天才吗?相反,我觉得很多CS出身人压根不懂生物或者
: 医学,他们能做的就是写点什么新的程序,然后证明下自己的计算power比已有的要强
: ,发个文章,他们也不maintain他们的program,N多bug,也不会有人用他们的program
: ;在我看来他们就是制造垃圾paper的。所以bioinformatics的本质不是coding,而是
: 等你有生物医学的问题的时候,你要会用计算机来解决你的生物问题。这才是核心。很

avatar
d*7
19
赞,非常同意,干湿同时做

alignment

【在 u*********1 的大作中提到】
: 我说说我的经历和看法,因为我过去的处境和你一模一样
: 首先要说,如果你对sequencing/bioinformatics不反感的话,这是个非常好的方向(
: 至少我个人觉得)。有的人还真的是看到一大堆数字就感觉头疼吐血,如果你是这类人
: ,那还是算了吧。
: 我本科做RNA的,本科毕业的时候(大概2010年左右),那时候什么RNA-seq和CLIP刚刚
: 兴起(但好像貌似到现在短短几年就发展很普及了),所以我国内的那个lab他们做什
: 么RNA-seq啦CLIP啦我觉得非常的有趣神奇,因为你一下子可以有几千万条的alignment
: ,那么多信息。当时我benchwork做的很郁闷(但现在想想一个小本科生能做出啥呢)
: ,所以看到他们计算机按一下回车键就可以有那么多条的data出现,我真的是非常渴望
: 那种感觉。所以很搞笑的是,我在RNA lab最大的收获不是对RNA本身的认识,而是埋下

avatar
f*h
20
干的湿的都各有所长吧,写BWA的不也是个国内的博士吗?天才不天才的后人给的称号
,适合做什么只有自己知道,也只有自己摸索得出来吧。。。
avatar
s*a
21
那computational imaging呢?

data.

【在 x******m 的大作中提到】
: 千万别去那种干湿都做的lab,这种lab的pi大部分也是半吊子的计算背景,懂个皮毛。
: 到头来回去push你去做实验,美其名曰know how to generate data and analyze data.
: 要找就要找stat或者cs的pi,最好他们跟wet lab有合作,你弄些data分析,多学学算
: 法,统计模型,对将来找工作有好处。

avatar
u*r
22
那个国内的博士是学理论物理的,算法、编程能力不是盖的。那他来励志有点不合适吧
,呵呵。

【在 f*****h 的大作中提到】
: 干的湿的都各有所长吧,写BWA的不也是个国内的博士吗?天才不天才的后人给的称号
: ,适合做什么只有自己知道,也只有自己摸索得出来吧。。。

avatar
G*9
23

program
必须发包子鼓励。

【在 u*********1 的大作中提到】
: 上面是我的经历,下面说下我的感想感悟:
: 1. 永远别怀疑自己的能力;尤其bioinformatics这一行。说白了我到现在也是个大外
: 行,不懂计算机。但bioinformatics != 计算机,bioinformatics != coding。除非
: 你做什么algorithm的开发,对coding技术要求很高,不然的话对我们大部分所谓的
: bioinformatician,我们都是用人家已经开发好的program,什么BWA,什么GATK;你觉
: 得你开发的过人家Broad的那群天才吗?相反,我觉得很多CS出身人压根不懂生物或者
: 医学,他们能做的就是写点什么新的程序,然后证明下自己的计算power比已有的要强
: ,发个文章,他们也不maintain他们的program,N多bug,也不会有人用他们的program
: ;在我看来他们就是制造垃圾paper的。所以bioinformatics的本质不是coding,而是
: 等你有生物医学的问题的时候,你要会用计算机来解决你的生物问题。这才是核心。很

avatar
t*l
24
谢谢你那么多字的回复,感觉很有用。
我今天和这个做计算的老师谈了谈,她问我学过线性代数,或者计算机课程吗。我本科
生物,从来没想过计算机科学和统计这些东西。这个计算的教授做的是新的算分分析,
但是同时也给几个wet-lab的分析一些chip-seq,CLIP这些data,她说分析别人的data都
是routine method,但是她自己的学生都是要做新method. 所以就目前来说,我的背景
无法加入她的lab.她建议我先修一下bioinfo和system bio的课程在第二年,然后有了
wet-lab之后,可以来她的dry lab做个summer rotation学学programing之类的。
我第一年也在一个大牛的wet-lab里面做rotation,我的project就是bisulfate-seq.但
是我做的就是准备工作,后期用mi-seq出来的data是带我的博后自己分析出来的。当时
感觉自己就像是个傻子,除了pcr,cell culture就什么都不知道,计算机一点都不会
,我也是那时候才意识到计算机挺重要的,而且我想以后的我做的wet-lab的实验会涉
及很多sequcing data的分析,我想在phd期间,起码学会了自力更生,我总不能每次做
完一个big data set,就去找core的人帮我分析吧。还有就是以后读完phd,找工作或者
找博后。我不知道bioinfo这边要懂多深?会不会在bioinfo这边找工作容易点。

program

【在 u*********1 的大作中提到】
: 上面是我的经历,下面说下我的感想感悟:
: 1. 永远别怀疑自己的能力;尤其bioinformatics这一行。说白了我到现在也是个大外
: 行,不懂计算机。但bioinformatics != 计算机,bioinformatics != coding。除非
: 你做什么algorithm的开发,对coding技术要求很高,不然的话对我们大部分所谓的
: bioinformatician,我们都是用人家已经开发好的program,什么BWA,什么GATK;你觉
: 得你开发的过人家Broad的那群天才吗?相反,我觉得很多CS出身人压根不懂生物或者
: 医学,他们能做的就是写点什么新的程序,然后证明下自己的计算power比已有的要强
: ,发个文章,他们也不maintain他们的program,N多bug,也不会有人用他们的program
: ;在我看来他们就是制造垃圾paper的。所以bioinformatics的本质不是coding,而是
: 等你有生物医学的问题的时候,你要会用计算机来解决你的生物问题。这才是核心。很

avatar
b*z
25
学bioinformatics就是个工具
进人这个领域,就是进公司或研究所当工具,就像会计、统计师一样
别指望做科研会有多大前景,因为你自己都不打算认真研究一下所分析数据的
生物背景和真正要解决的问题

大外
除非
你觉
或者
要强
而是
。很

【在 t**l 的大作中提到】
: 谢谢你那么多字的回复,感觉很有用。
: 我今天和这个做计算的老师谈了谈,她问我学过线性代数,或者计算机课程吗。我本科
: 生物,从来没想过计算机科学和统计这些东西。这个计算的教授做的是新的算分分析,
: 但是同时也给几个wet-lab的分析一些chip-seq,CLIP这些data,她说分析别人的data都
: 是routine method,但是她自己的学生都是要做新method. 所以就目前来说,我的背景
: 无法加入她的lab.她建议我先修一下bioinfo和system bio的课程在第二年,然后有了
: wet-lab之后,可以来她的dry lab做个summer rotation学学programing之类的。
: 我第一年也在一个大牛的wet-lab里面做rotation,我的project就是bisulfate-seq.但
: 是我做的就是准备工作,后期用mi-seq出来的data是带我的博后自己分析出来的。当时
: 感觉自己就像是个傻子,除了pcr,cell culture就什么都不知道,计算机一点都不会

avatar
f*h
26
他做的project是bioinformatics的,其实人家肯定有天赋,但是我想生物中也有很多
小的问题需要用计算解决,不一定每个人都要解决一些很重要的问题

【在 u**r 的大作中提到】
: 那个国内的博士是学理论物理的,算法、编程能力不是盖的。那他来励志有点不合适吧
: ,呵呵。

avatar
f*h
27
其实总是觉得生物人自我菲薄,总把这些数理背景看得很神秘,其实就是本科几堂课的
区别。。。

【在 f*****h 的大作中提到】
: 他做的project是bioinformatics的,其实人家肯定有天赋,但是我想生物中也有很多
: 小的问题需要用计算解决,不一定每个人都要解决一些很重要的问题

avatar
t*l
28
什么课,报个名字?

【在 f*****h 的大作中提到】
: 其实总是觉得生物人自我菲薄,总把这些数理背景看得很神秘,其实就是本科几堂课的
: 区别。。。

avatar
f*h
29
只把个人看过的东西并觉得有用的说说。
数学方面,那本all of statistics应该蛮简单的书,但学之前应该会微积分(多元的
也要),线性代数。
计算机,可以看看introduction to algorithm,MIT的。学之前可以看看Mathematics
for Computer Science by Eric Lehman and Tom Leighton(网上有)。
如果是要做sequence analysis的话,可以看看biological sequence analysis。这本
书有点难,需要查些文献,不过出来混,总要查的。
machine learning的话网上的andrew ng的课和caltech的learning from data可以入门
,再想看看细节可以看看Pattern Recognition and Machine Learning。
如果你做systems biology或别的什么的就不清楚了。
这些都算基本的,如果你要钻研某个课题的话,看完这些东西,再看看文献,也应该知
道该看什么东西了。。。其实个人觉得即使你不写很难的程序,理解这些算法只有好处
,没有坏处,还有那么多生物人转计算的,(sean eddy,david baker。。。)尽可以
不用怕,个人觉得如果只是应用这些工具的话,纯粹是一个熟能生巧的过程。。。
如果你真想做出什么重大突破的话,可以看看那些计算大牛的paper,比如david
haussler就是hidden markov model应用在sequence analysis中(现在人家做cancer
genomics了),这应该有赖于他的计算机背景,Stephen Altschul的话是统计建模很牛
,牛人总是有绝技的,david baker是直觉?(瞎掰的,请指正)heng li的话应该是图
论(?)当然,这是说笑了,重大科学成就都有天才的成分,说这些的意思是除了基本
的知识,再有某个领域的专长就更好了,不过我导师还有很多其他的牛人都是对生物理
解的好,所以还是要看个人,看你的兴趣在哪里。。。

【在 t**l 的大作中提到】
: 什么课,报个名字?
avatar
f*p
30
搞computational的可能好些,虽然opening不像普通千老那么多,但是找到了,就比较
稳定。如果这种饭碗丢了,基本上都是自己招的。做computational得要掌握C之类的,
就算编的差点,你得让code能work。另外,可能还得掌握一些API,做并行计算,或者
图像分析。都有现成的库可以调用,不用自己写,但是你得会用。
avatar
u*1
31
爱一个人没有理由,不爱一个人可以找出一千条理由。
人家老师不要你或许有很多很多原因,他只是找个借口搪塞下罢了。
可以感觉你的这个老师应该是专门的pure dry lab吧。那么他自然有他自己的
preference
在我看来,很多人把bioinformatics和benchwork彻底划分开,是非常愚蠢的。或许90
年代刚兴起的时候,那时候运算能力低,各种算法软件都没有,而且能做bioinfor的单
位也很少(比如human genome project),所以需要非常专业的计算机人才来做。但现
在完全不同,各种program平台都有了,每个独立的小实验室都有sequencing数据,都
需要相关人才。
bioinform作为新兴的科学,那你可以质问你的老师:你一开始就是做这行的吗? 明显
他也不是。他也是从其他的学科转到bioinfor的,对不对?既然你能做成功,我为什么
不能做成功?我比你年轻,平台更好。所以我最不爽那些倚老卖老或者仗着自己是数理
出身觉得自己很了不起的所谓的bioinformatician
可以预料到未来,我们有很便捷快速的sequencer产生无数的data,非常强大容量的
server储存数据,有非常user-friendly的program来帮我们分析,那时候
bioinformatics会跟做PCR一样的平常;人人都可以做,人人也必须会做。
很多benchwork出身的会有心理上的障碍,质疑自己的数学物理水平能不能做bioinfor
;而那些数学出身的人则会有优越感,他们也同时会利用这种优越感(比如你的这个老
师),故意把什么CLIP分析的methodology说的很复杂神秘,这样可以排挤掉其他人的
竞争,保护他们的饭碗。但其实我认真负责的说,大部分人就是跑人家做好的program
,要的是做这个东西的经验;而跑人家的program是每个人都可以做到的。而且纵然就
是看/写source code,你其实硬着头皮去学也一定可以学会。在我眼里这种所谓开发
methodology的paper很多就是crap;你开发那么多所谓的new method,发了个文章,但
请问有人用吗?在你的小圈子里popular吗?没人用你的软件,你就不会不断debug来
maintain,最后你的软件/methodology就是一堆shit被淹没在文章里,毫无意义。反正
我是看了太多paper,无非就是在那里玩数字游戏,哗众取宠的要证明自己的program
achieve better power;有的问题比如是被现成的sequencing technology所限制,你
玩弄再多的statistics也没办法,本质还是要革新测序技术。而其
实在每个小的领域,都有一款最popular最powerful的methodology的软件大家在使用(
比如read alignment你会想到BWA,找SNP你会想到GATK,做GWAS你就一定会用plink)
;我们尽力把这样的软件发展好,就可以造福大家了。根本不需要太多的methodology
的crap paper出来。
bioinformatics被那些数理的人“神化”了;现在bioinfor应该回归最本质的地位:生
物研究在面对大规模数据时候的一种工具。我们需要的人才是真正懂得生物,能问出很
好的biomed问题的,同时会用计算机作为工具来解决问题的人才。这才是王道。所以你
看到很多学校program现在都是joint student(也可能是经费紧张,或者bioinfor要依
附wet lab的牛老板),其实这是一种很好的training模式
Again,bioinformatics甚至genetics都是digital game;你要治病就人要追根溯源,还
是要最直接的benchwork/clinical trial

【在 t**l 的大作中提到】
: 谢谢你那么多字的回复,感觉很有用。
: 我今天和这个做计算的老师谈了谈,她问我学过线性代数,或者计算机课程吗。我本科
: 生物,从来没想过计算机科学和统计这些东西。这个计算的教授做的是新的算分分析,
: 但是同时也给几个wet-lab的分析一些chip-seq,CLIP这些data,她说分析别人的data都
: 是routine method,但是她自己的学生都是要做新method. 所以就目前来说,我的背景
: 无法加入她的lab.她建议我先修一下bioinfo和system bio的课程在第二年,然后有了
: wet-lab之后,可以来她的dry lab做个summer rotation学学programing之类的。
: 我第一年也在一个大牛的wet-lab里面做rotation,我的project就是bisulfate-seq.但
: 是我做的就是准备工作,后期用mi-seq出来的data是带我的博后自己分析出来的。当时
: 感觉自己就像是个傻子,除了pcr,cell culture就什么都不知道,计算机一点都不会

avatar
u*1
32
当时感觉自己就像是个傻子,除了pcr,cell culture就什么都不知道,计算机不会
这种感觉当然是很不爽的,觉得自己很傻。
但如果只是别人把data给你,你做点计算机分析,那会是同样的equally的傻;感觉会
非常的莫名其妙。而且如果数据出现了异常,你也搞不清楚到底是咋回事。我过去就分
析一个family pedigree的exome sequences,看Y染色体的reads alignment会发现人家
压根把爸爸和妈妈给label错了;那么我自然不相信这个pedigree的任何label,他们能
把父母label错,那或许也会把小孩label成父母,父母label成小孩,对吧?所以你要
重新做haplotype的分析来确定他们的关系。
所以最有满足感最科学的就是,自己同时做bench产生数据,自己分析;一切命运掌握
自己手中

【在 b**z 的大作中提到】
: 学bioinformatics就是个工具
: 进人这个领域,就是进公司或研究所当工具,就像会计、统计师一样
: 别指望做科研会有多大前景,因为你自己都不打算认真研究一下所分析数据的
: 生物背景和真正要解决的问题
:
: 大外
: 除非
: 你觉
: 或者
: 要强

avatar
u*1
33
比如hidden markov model,刚开始的时候都会觉得,哇好fancy哦好高深哦
其实看多了,也就那么回事;多少program都用这个
这种东西,多去看下wikipedia,读几个review就可以大概了解了。当然你要说运用的
很好,或者一些高级的,那确实要水平,但我们一般不需要那些。
总之,不要被这些个东西吓倒。我们中国人的智商都可以学会。
归根结底,biology is hard part。你能问出怎样的biomed问题,如何用计算机解决生
物问题,计算机算出的结果如何用下游实验验证,这才是关乎自己事业成功所在。
搞科研就是钻研精神,有兴趣有动力,多多钻研,肯定会飞快长进的

Mathematics

【在 f*****h 的大作中提到】
: 只把个人看过的东西并觉得有用的说说。
: 数学方面,那本all of statistics应该蛮简单的书,但学之前应该会微积分(多元的
: 也要),线性代数。
: 计算机,可以看看introduction to algorithm,MIT的。学之前可以看看Mathematics
: for Computer Science by Eric Lehman and Tom Leighton(网上有)。
: 如果是要做sequence analysis的话,可以看看biological sequence analysis。这本
: 书有点难,需要查些文献,不过出来混,总要查的。
: machine learning的话网上的andrew ng的课和caltech的learning from data可以入门
: ,再想看看细节可以看看Pattern Recognition and Machine Learning。
: 如果你做systems biology或别的什么的就不清楚了。

avatar
y*y
34
这位说的真好啊!

alignment

【在 u*********1 的大作中提到】
: 我说说我的经历和看法,因为我过去的处境和你一模一样
: 首先要说,如果你对sequencing/bioinformatics不反感的话,这是个非常好的方向(
: 至少我个人觉得)。有的人还真的是看到一大堆数字就感觉头疼吐血,如果你是这类人
: ,那还是算了吧。
: 我本科做RNA的,本科毕业的时候(大概2010年左右),那时候什么RNA-seq和CLIP刚刚
: 兴起(但好像貌似到现在短短几年就发展很普及了),所以我国内的那个lab他们做什
: 么RNA-seq啦CLIP啦我觉得非常的有趣神奇,因为你一下子可以有几千万条的alignment
: ,那么多信息。当时我benchwork做的很郁闷(但现在想想一个小本科生能做出啥呢)
: ,所以看到他们计算机按一下回车键就可以有那么多条的data出现,我真的是非常渴望
: 那种感觉。所以很搞笑的是,我在RNA lab最大的收获不是对RNA本身的认识,而是埋下

avatar
a*m
35
这样的application为主的research估计做上两年就会自觉没趣了,不过好处是能水不
少文章,只是这年头分析越来越难当一作了
跑自己编的程序跟照着manual跑别人程序的感觉和性质是完全不一样的
前者methodology个人认为是PHD学生应该关注的,脑力活,也正因为这些methods的
crap paper才能推动bioinfo算法的改进
后者招个cs的undergrad summer student也能搞,搞出来结果给别人分析生物学意义,
或者call出来结果bench上找tech验证一下,这种labor work没有挑战性,做个
rotation什么没背景的尝试尝试就okay了。当然研究算法的肯定也要跟别人的算法比,
所以这一步怎么也免不了,有的时候也可以从别人的application里面找灵感。
我个人的观点是:如果以后要去业界,那一定要去dry lab,没人在乎你做了多少
benchwork有多少生物学重大发现,更看重你又多少数理背景;如果以后要搞学术,最
好干湿结合,paper容易做大,将来申请position也吃香。

【在 u*********1 的大作中提到】
: 比如hidden markov model,刚开始的时候都会觉得,哇好fancy哦好高深哦
: 其实看多了,也就那么回事;多少program都用这个
: 这种东西,多去看下wikipedia,读几个review就可以大概了解了。当然你要说运用的
: 很好,或者一些高级的,那确实要水平,但我们一般不需要那些。
: 总之,不要被这些个东西吓倒。我们中国人的智商都可以学会。
: 归根结底,biology is hard part。你能问出怎样的biomed问题,如何用计算机解决生
: 物问题,计算机算出的结果如何用下游实验验证,这才是关乎自己事业成功所在。
: 搞科研就是钻研精神,有兴趣有动力,多多钻研,肯定会飞快长进的
:
: Mathematics

avatar
u*1
36
这段话就是典型的bioinformatician的想法
要么开发自己的methodology,要么按照别人的想法跑跑别人的程序(当然是开发自己
的methodology有趣有含金量的多)
But where is BIOLOGY?
"搞出来结果给别人分析生物学意义,或者call出来结果bench上找tech验证一下,这种
labor work没有挑战性"
这话说的也太轻巧了。。。
做纯bioinfor而一点不懂biology的问题是,你完全是为别人做嫁衣裳,毫无成就感;
感觉你的整个科学事业都是掌握在别人手里。
而如果自己的expertise是coding是计算,而对生物一点没兴趣,为何不干脆直接去CS
算了。。。现实生活里能运用computing的地方太多了,更加有应用价值,而生物数据
只不过是一个很小的范围。
“做大paper”这种话听起来很无奈很混日子的感觉。我们的目标应该是利用
computation解决科学问题,推动科学发展,大paper只不过是副产物而已。

【在 a**m 的大作中提到】
: 这样的application为主的research估计做上两年就会自觉没趣了,不过好处是能水不
: 少文章,只是这年头分析越来越难当一作了
: 跑自己编的程序跟照着manual跑别人程序的感觉和性质是完全不一样的
: 前者methodology个人认为是PHD学生应该关注的,脑力活,也正因为这些methods的
: crap paper才能推动bioinfo算法的改进
: 后者招个cs的undergrad summer student也能搞,搞出来结果给别人分析生物学意义,
: 或者call出来结果bench上找tech验证一下,这种labor work没有挑战性,做个
: rotation什么没背景的尝试尝试就okay了。当然研究算法的肯定也要跟别人的算法比,
: 所以这一步怎么也免不了,有的时候也可以从别人的application里面找灵感。
: 我个人的观点是:如果以后要去业界,那一定要去dry lab,没人在乎你做了多少

avatar
l*1
37
Relevant to the quantitative abstraction automaton QDAAk (B) of a
biochemical system B is a discrete time Markov chain.
LZ can understand how much of below one paper its contents?
title:
'On Approximative Reachability Analysis of Biochemical Dynamical Systems.'
Transactions on Computational Systems Biology XIV
Lecture Notes in Computer Science Volume 7625, 2012, pp 77-101
pdf file web link:
http://link.springer.com/chapter/10.1007%2F978-3-642-35524-0_4
or below PhD Dissertation:
Construction of Algebraic Abstractions for Systems Biology
http://theses.cz/id/x7020m/?furl=%2Fid%2Fx7020m%2F;so=nx;lang=e
PDF link:
HTTP double dot //is.muni.cz/th/139877/fi_r/jana_fabrikova_thesis_proposal_
and_publications.
pdf
one judge standard
your understood
if below< 30% you better do your wet bio still,
if > 70% then you already 转到computational bio领域 (not just Bioinfo)
avatar
N*n
38
等你毕业,连博士后都找不到的时候,可不要回来抱怨。
市场决定一切,说科研很虚,工作重要。

CS

【在 u*********1 的大作中提到】
: 这段话就是典型的bioinformatician的想法
: 要么开发自己的methodology,要么按照别人的想法跑跑别人的程序(当然是开发自己
: 的methodology有趣有含金量的多)
: But where is BIOLOGY?
: "搞出来结果给别人分析生物学意义,或者call出来结果bench上找tech验证一下,这种
: labor work没有挑战性"
: 这话说的也太轻巧了。。。
: 做纯bioinfor而一点不懂biology的问题是,你完全是为别人做嫁衣裳,毫无成就感;
: 感觉你的整个科学事业都是掌握在别人手里。
: 而如果自己的expertise是coding是计算,而对生物一点没兴趣,为何不干脆直接去CS

avatar
a*y
39
写得很好哦

program

【在 u*********1 的大作中提到】
: 上面是我的经历,下面说下我的感想感悟:
: 1. 永远别怀疑自己的能力;尤其bioinformatics这一行。说白了我到现在也是个大外
: 行,不懂计算机。但bioinformatics != 计算机,bioinformatics != coding。除非
: 你做什么algorithm的开发,对coding技术要求很高,不然的话对我们大部分所谓的
: bioinformatician,我们都是用人家已经开发好的program,什么BWA,什么GATK;你觉
: 得你开发的过人家Broad的那群天才吗?相反,我觉得很多CS出身人压根不懂生物或者
: 医学,他们能做的就是写点什么新的程序,然后证明下自己的计算power比已有的要强
: ,发个文章,他们也不maintain他们的program,N多bug,也不会有人用他们的program
: ;在我看来他们就是制造垃圾paper的。所以bioinformatics的本质不是coding,而是
: 等你有生物医学的问题的时候,你要会用计算机来解决你的生物问题。这才是核心。很

avatar
a*y
40
也很赞同
很有同感。

【在 f*******7 的大作中提到】
: 站在生物的角度做bioinformatics,把bioinformatics当成工具,是一个上手比较快的
: 途径,做PhD的时候也能发文章发的不错,但是sustainability 是个问题, 以后找工作
: 的时候会有难度(无论是academia还是industry). 做bioinformatics最怕的是做的什么
: 都懂一些,但是什么又都不精通。
:
: program

avatar
h*9
41
你如果是学生,建议跟一个dry lab,打好数理基础。如果你独立了,一定要做干湿结
合的项目,这样你的数理技能才能发挥。
avatar
a*y
42
没有湿的经验,也很难上手的吧

【在 h*****9 的大作中提到】
: 你如果是学生,建议跟一个dry lab,打好数理基础。如果你独立了,一定要做干湿结
: 合的项目,这样你的数理技能才能发挥。

avatar
f*d
43
的确,等到第二个博士后的时候就更加明白了

【在 N******n 的大作中提到】
: 等你毕业,连博士后都找不到的时候,可不要回来抱怨。
: 市场决定一切,说科研很虚,工作重要。
:
: CS

avatar
h*9
44
技能很重要,不论对于就业或者当PI,你总要有一技之长。数理基础相较于实验技能,
更难培养。而且,仅就就业而言,数理是万金油,干什么都行,都缺不了,但实验室里
的那些技术,大部分都是屠龙之技,好看但不实用,出了实验室什么也干不了。
avatar
f*7
45
你这想法有点naive啊,等到你毕业找工作的时候就能体会到了。tool developer比
tool user找工作要容易多了,无论是academia还是industry.
而且现在有多少CS/Stat出身搞bioinformatics的是完全不懂biology的?
PhD的时候还是把基本功打扎实比较重要。

CS

【在 u*********1 的大作中提到】
: 这段话就是典型的bioinformatician的想法
: 要么开发自己的methodology,要么按照别人的想法跑跑别人的程序(当然是开发自己
: 的methodology有趣有含金量的多)
: But where is BIOLOGY?
: "搞出来结果给别人分析生物学意义,或者call出来结果bench上找tech验证一下,这种
: labor work没有挑战性"
: 这话说的也太轻巧了。。。
: 做纯bioinfor而一点不懂biology的问题是,你完全是为别人做嫁衣裳,毫无成就感;
: 感觉你的整个科学事业都是掌握在别人手里。
: 而如果自己的expertise是coding是计算,而对生物一点没兴趣,为何不干脆直接去CS

相关阅读
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。