Redian新闻
>
Heng Li长得就像个天才码农啊
avatar
Heng Li长得就像个天才码农啊# Biology - 生物学
C*l
1
如何在保证学生健康营养的前提下,做一个快速简单由方便的午餐呢。今天给大家推荐
一款美味健康又可以减脂的健康午餐,特别适合学生党、白领、上班族等等时间比较紧
张的人群。
简单快手又有营养,我们就是既讲究快,又讲究好吃,还要求美味,我们首先要准
备一个金枪鱼罐头,这个各大超市都是有售卖的,也可以网上购买,金枪鱼有很高的营
养价值,蛋白质含量高达20%,,还在青春期的学生党可以补钙,减肥的上班族可以不
用担心,因为它虽然营养价值高,但脂肪含量很低。
其次我们需要准备一些蔬菜,生菜、西兰花、小油菜、番茄 或者是准备一根玉米也
是可以的。把玉米煮好切成一小块一小块的形状。
在准备一些意大利面,把面放入水中,煮开,要多煮一会,开了之后可以焖一下,让
它更加好吃,然后在另一个锅里放入刚才的蔬菜丁,进行翻炒,番茄最后放,因为番茄
的话比较软,可以适当的加上水,熬成番茄汁、然后放入我们刚才煮好的意大利面,放
入少量的盐和胡椒粉准备起锅盛出放入一个盘子里。
然后把刚才我们准备的金枪鱼罐头加热一下,在锅中翻炒几下,喜欢的可以放入适量
的鱼松,然后起锅放入刚才我们准备好的盘子李就完成了。
avatar
l*y
2
Update: Not available any more.
I was invited to review the manuscript. But I do not have the time. I can
recommend you while I decline this invitation. So you may or may not be
contacted by the editor. Send me your Name, Title, and contact email if
you
want to try your luck.
avatar
n*g
4
好人啊

【在 l****y 的大作中提到】
: Update: Not available any more.
: I was invited to review the manuscript. But I do not have the time. I can
: recommend you while I decline this invitation. So you may or may not be
: contacted by the editor. Send me your Name, Title, and contact email if
: you
: want to try your luck.

avatar
m*t
5
说点个人看法,
Heng Li的成就,不足以找到非常top的学校做faculty,可能差一些的他又不想去。也
可能各种funding压力比较大,外加在broad 过的也很开心一样
Li Heng的东西属于需求驱动型的,换谁都能开发出来,技术难度并不高。具体说,当
年short sequence 测序发明出来之后,对每一个short sequence的mapping准确性要求
没有那么高的,但是对于mapping 每一个sequence的速度提高了很多,他刚好在这个关
口,写出来了BWA等程序,BWA的技术难度并不是非常高。
这个非常像比尔盖茨开发windows,从command line系统到图形界面系统,谁能赶上这
个趋势都能开发出来,盖茨只是那个时候的幸运儿拿到了IBM的订单。
不太一样的是Jobs,他的坚持的确把iPhone出现的时间提前了好几年,不然智能机大规
模普及还要差几年。
另一个不太一样的是谷歌,那个时候大家都知道从网上搜索信息是以后的大势所趋,并
且好几年的时间也都没人开发出来有效的算法来解决排序问题,Larry Page就解决了这
个问题。如果换做Li Heng的情况,就好比二代short seq 测序出来好几年了,始终没
有好的mapping的办法可以高效map,Li Heng提出了方法解决了这个问题
avatar
l*6
6
好像他最近几年发文不行,英语口语也一般,在美国找PI的位置有难度,被两个Broad
Institute的PI当技术员用。每个人都有优点,也有缺点。你真的了解仇子龙,
soldiera, WuforAVSD么?

PI?

【在 j*********g 的大作中提到】
: http://www.edubilla.com/award/benjamin-franklin-award/heng-li/
: http://lh3lh3.users.sourceforge.net
: 真的牛人。为什么在Broad Institute还只是research scientist(千老?),不是PI?
: 反之很多垃圾人当上了PI,狗p不通,还趾高气扬,比如本版的仇子龙、soldiera、
: WuforAVSD;
: 而Heng Li这样的真正的牛人只能当千老。这世道,真是笑贫不笑娼的时代啊。

avatar
p*e
7
说码农太低估了lh,他的物理数学背景远远超出你们的想象,他其实是个很纯粹的人,
有点像Yitang。唉,经常看着公司里那些拿着几十万工资只知道NGS这三个字就开始忽
悠然后满面风光的人,不得不说这个世界真的挺讽刺的。希望有一天lh再鸣惊人吧,
不管怎样,希望他好。
avatar
k*z
8
三个字
不会吹
avatar
C*l
9
看下主页,应当是理想主义者。
现在是精致利己主义者的天下。
avatar
s*y
10
Liheng写的bwa系列的东西,别说普通马龙,就是高级马龙也未必写的出来。不是说这玩
意儿有多高深。关键是能把sequence序列那些需求和算法有机的结合。刷题马工就算了
,连需求都理解不透,弄出来的东西就像满地的生物软件一样,没法用。

【在 m*********t 的大作中提到】
: 说点个人看法,
: Heng Li的成就,不足以找到非常top的学校做faculty,可能差一些的他又不想去。也
: 可能各种funding压力比较大,外加在broad 过的也很开心一样
: Li Heng的东西属于需求驱动型的,换谁都能开发出来,技术难度并不高。具体说,当
: 年short sequence 测序发明出来之后,对每一个short sequence的mapping准确性要求
: 没有那么高的,但是对于mapping 每一个sequence的速度提高了很多,他刚好在这个关
: 口,写出来了BWA等程序,BWA的技术难度并不是非常高。
: 这个非常像比尔盖茨开发windows,从command line系统到图形界面系统,谁能赶上这
: 个趋势都能开发出来,盖茨只是那个时候的幸运儿拿到了IBM的订单。
: 不太一样的是Jobs,他的坚持的确把iPhone出现的时间提前了好几年,不然智能机大规

avatar
l*6
12
言过其实了。你问问coding man会不会写。关键是没人愿意就为了文章免费coding。

这玩

【在 s******y 的大作中提到】
: Liheng写的bwa系列的东西,别说普通马龙,就是高级马龙也未必写的出来。不是说这玩
: 意儿有多高深。关键是能把sequence序列那些需求和算法有机的结合。刷题马工就算了
: ,连需求都理解不透,弄出来的东西就像满地的生物软件一样,没法用。

avatar
s*s
13
偶像啊。
估计是不愿意烦心申请funding,比较enjoy干活,一旦做PI一般80%的时间就废掉了
吧。
Heng Li的影响还是远远超过一个BWA的,虽然这个就已经很夸张了。要知道GRCh38
很多序列也不过是Heng Li在N年前做的37的decoy序列。要知道SAM/BAM以及VCF这
种二代分析的标准格式都是那个小团队的(最近刚送给GA4GH). 可以这么说,他基本
上就是二代测序的幕后黑手了,就这两个标准格式,就极大的加速了几乎所有的NGS
应用开发

PI?

【在 j*********g 的大作中提到】
: http://www.edubilla.com/award/benjamin-franklin-award/heng-li/
: http://lh3lh3.users.sourceforge.net
: 真的牛人。为什么在Broad Institute还只是research scientist(千老?),不是PI?
: 反之很多垃圾人当上了PI,狗p不通,还趾高气扬,比如本版的仇子龙、soldiera、
: WuforAVSD;
: 而Heng Li这样的真正的牛人只能当千老。这世道,真是笑贫不笑娼的时代啊。

avatar
c*r
14
在一次MSU NGS暑期课程上,Biostarts的Admin、PSU的PI,Istvan Albert,对mapping
god Li Heng公开表示了极大的钦佩。
avatar
n*7
15
你就是生物版的laoselang
专门来搞笑的

【在 m*********t 的大作中提到】
: 说点个人看法,
: Heng Li的成就,不足以找到非常top的学校做faculty,可能差一些的他又不想去。也
: 可能各种funding压力比较大,外加在broad 过的也很开心一样
: Li Heng的东西属于需求驱动型的,换谁都能开发出来,技术难度并不高。具体说,当
: 年short sequence 测序发明出来之后,对每一个short sequence的mapping准确性要求
: 没有那么高的,但是对于mapping 每一个sequence的速度提高了很多,他刚好在这个关
: 口,写出来了BWA等程序,BWA的技术难度并不是非常高。
: 这个非常像比尔盖茨开发windows,从command line系统到图形界面系统,谁能赶上这
: 个趋势都能开发出来,盖茨只是那个时候的幸运儿拿到了IBM的订单。
: 不太一样的是Jobs,他的坚持的确把iPhone出现的时间提前了好几年,不然智能机大规

avatar
c*o
16
真是二代测序的神
基本上几个数据处理的国标都绕不开他
如果当初要求点商业提成现在估计都够经费自己建一个broad了

【在 s******s 的大作中提到】
: 偶像啊。
: 估计是不愿意烦心申请funding,比较enjoy干活,一旦做PI一般80%的时间就废掉了
: 吧。
: Heng Li的影响还是远远超过一个BWA的,虽然这个就已经很夸张了。要知道GRCh38
: 很多序列也不过是Heng Li在N年前做的37的decoy序列。要知道SAM/BAM以及VCF这
: 种二代分析的标准格式都是那个小团队的(最近刚送给GA4GH). 可以这么说,他基本
: 上就是二代测序的幕后黑手了,就这两个标准格式,就极大的加速了几乎所有的NGS
: 应用开发
:
: PI?

avatar
n*7
17
这个我看过,学术界最黑的就是通过匿名review恶意打压竞争对手
不过到他那个级别的也不在意发在哪里了
引用率说明一切
我最近的文章也是被一贱人装傻恶意拖着
他一个人导致的工作量是其他几个reviewer加起来的3倍
二审三审又车轱辘装傻反复纠缠一些细节
还好这些废话给我们提供了足够的data
然后通过我们的RIP系统(reviewer inference procedure)
找到了这个贱人是上海某校的
以后有他好看

【在 k****z 的大作中提到】
: 不会吹牛拉关系
: 他的bwa-mem至今没有发表,只好放到xiv上,已经引用六百多次了
: Aligning sequence reads, clone sequences and assembly contigs with BWA-MEM
: 他自己写的可笑的review
: https://sourceforge.net/p/bio-bwa/mailman/message/30894287/

avatar
n*7
18
SAM/BAM就是二代测序的实际标准
现在有些reads data都用BAM了,因为可以加注释
做标准比做产品难多了
Li Heng说过,最难的就是取舍
功能多了太复杂,一般人用不上那么多功能,就不愿意用
太少了又会限制应用的场景
而且这东西得有前瞻性
不能过两年不行了必须搞个不兼容的新格式
那样没人跟你玩的

【在 s******s 的大作中提到】
: 偶像啊。
: 估计是不愿意烦心申请funding,比较enjoy干活,一旦做PI一般80%的时间就废掉了
: 吧。
: Heng Li的影响还是远远超过一个BWA的,虽然这个就已经很夸张了。要知道GRCh38
: 很多序列也不过是Heng Li在N年前做的37的decoy序列。要知道SAM/BAM以及VCF这
: 种二代分析的标准格式都是那个小团队的(最近刚送给GA4GH). 可以这么说,他基本
: 上就是二代测序的幕后黑手了,就这两个标准格式,就极大的加速了几乎所有的NGS
: 应用开发
:
: PI?

avatar
m*t
19
所以问题就在这里,这个技术不难,只是他赶上了而已,当然能赶上这波热潮就是本事
,没有贬低他的意思。但是这种技术,只要有需求就能开发出来,就看需求是否够大(
¥¥¥的数量)

【在 n******7 的大作中提到】
: SAM/BAM就是二代测序的实际标准
: 现在有些reads data都用BAM了,因为可以加注释
: 做标准比做产品难多了
: Li Heng说过,最难的就是取舍
: 功能多了太复杂,一般人用不上那么多功能,就不愿意用
: 太少了又会限制应用的场景
: 而且这东西得有前瞻性
: 不能过两年不行了必须搞个不兼容的新格式
: 那样没人跟你玩的

avatar
n*7
20
抱歉,我觉得把你放那里你也设计不出来

【在 m*********t 的大作中提到】
: 所以问题就在这里,这个技术不难,只是他赶上了而已,当然能赶上这波热潮就是本事
: ,没有贬低他的意思。但是这种技术,只要有需求就能开发出来,就看需求是否够大(
: ¥¥¥的数量)

avatar
m*t
21
你哑口无言了就开始人身攻击。楼上有人提过,这种东西没有持续的经济刺激,其实安
心去思考的人不多。还有什么专利之类的,都是扯淡了

【在 n******7 的大作中提到】
: 抱歉,我觉得把你放那里你也设计不出来
avatar
n*7
22
说你能力不如别人不叫人身攻击
其实就是把10个你那里并行处理也做不出来
你自己不承认我也没啥要哑口无言的
达克效应的例子我见过很多

【在 m*********t 的大作中提到】
: 你哑口无言了就开始人身攻击。楼上有人提过,这种东西没有持续的经济刺激,其实安
: 心去思考的人不多。还有什么专利之类的,都是扯淡了

avatar
j*g
23
但是如果他当初要钱,肯定有人开发其它免费的了吧
就像Matlab虽然好用,生信都用R,因为平台免费

: 真是二代测序的神
:基本上几个数据处理的国标都绕不开他
:如果当初要求点商业提成现在估计都够经费自己建一个

【在 c******o 的大作中提到】
: 真是二代测序的神
: 基本上几个数据处理的国标都绕不开他
: 如果当初要求点商业提成现在估计都够经费自己建一个broad了

avatar
w*o
24
RIP这么牛的东西都有啊。可以分享吗?

【在 n******7 的大作中提到】
: 这个我看过,学术界最黑的就是通过匿名review恶意打压竞争对手
: 不过到他那个级别的也不在意发在哪里了
: 引用率说明一切
: 我最近的文章也是被一贱人装傻恶意拖着
: 他一个人导致的工作量是其他几个reviewer加起来的3倍
: 二审三审又车轱辘装傻反复纠缠一些细节
: 还好这些废话给我们提供了足够的data
: 然后通过我们的RIP系统(reviewer inference procedure)
: 找到了这个贱人是上海某校的
: 以后有他好看

avatar
c*o
25
是啊,当初花了不少时间在matlab上,后面还是得从头学R和python,虽然matlab大部
分功能和操作性都可以碾压,但是抵不过免费

【在 j*********g 的大作中提到】
: 但是如果他当初要钱,肯定有人开发其它免费的了吧
: 就像Matlab虽然好用,生信都用R,因为平台免费
:
: : 真是二代测序的神
: :基本上几个数据处理的国标都绕不开他
: :如果当初要求点商业提成现在估计都够经费自己建一个

avatar
e*o
26
生信软件收钱等于自绝于人民。

【在 j*********g 的大作中提到】
: 但是如果他当初要钱,肯定有人开发其它免费的了吧
: 就像Matlab虽然好用,生信都用R,因为平台免费
:
: : 真是二代测序的神
: :基本上几个数据处理的国标都绕不开他
: :如果当初要求点商业提成现在估计都够经费自己建一个

avatar
l*q
27
re

【在 p*****e 的大作中提到】
: 说码农太低估了lh,他的物理数学背景远远超出你们的想象,他其实是个很纯粹的人,
: 有点像Yitang。唉,经常看着公司里那些拿着几十万工资只知道NGS这三个字就开始忽
: 悠然后满面风光的人,不得不说这个世界真的挺讽刺的。希望有一天lh再鸣惊人吧,
: 不管怎样,希望他好。

avatar
s*s
28
如果按你这种说法,也就爱因斯坦相对论这种超前20年的属于牛人,
其他所有的牛人都属于正好赶上了这波热潮。

【在 m*********t 的大作中提到】
: 所以问题就在这里,这个技术不难,只是他赶上了而已,当然能赶上这波热潮就是本事
: ,没有贬低他的意思。但是这种技术,只要有需求就能开发出来,就看需求是否够大(
: ¥¥¥的数量)

avatar
n*7
29
我们RIP的文章一直在投
每次都被reviewer黑了

【在 w******o 的大作中提到】
: RIP这么牛的东西都有啊。可以分享吗?
avatar
s*r
30
人在broad拿的工资不见得会比码农少
avatar
D*a
31
又想去工业界,又看不起需求导向,不分裂吗?

【在 m*********t 的大作中提到】
: 所以问题就在这里,这个技术不难,只是他赶上了而已,当然能赶上这波热潮就是本事
: ,没有贬低他的意思。但是这种技术,只要有需求就能开发出来,就看需求是否够大(
: ¥¥¥的数量)

avatar
l*3
32
前天吃午饭时有人告诉我这里有对我的讨论,就过来看看了,才想起来我几年前还注册
过帐号,就冒第一个泡吧。
最常见的问题是我为什么不当PI。其实我最近也有了PI的名头,但确实没有做PI的事情
。主要是我更喜欢第一线的工作,但拉钱很分散精力。我也挺怕误人子弟,尤其是自己
忙的时候可能对手下照顾不周。再者Broad和David Reich多年来一直给我很大的自由度
,我可以拿他们的钱而不常接他们的直属项目(对此我始终非常感激并有些愧疚);而
且做纯计算的目前在工业界机会也还算多,我已经拒掉几个offer了。因此我没有很大
的压力和动力去找PI,而我又不是积极求变的人,所以没有广撒网去申请。次要的还有
一点家庭因素,不在此赘述。mitbbsrobot和lecroc2016说的也很对:像我这样过于偏
重计算的找好地儿的faculty还需努力。我也在申funding中,希望有所改变。
Nature biotech曾经有篇文章以邮件形式采访过不少写工具的。在那篇文章中我和其他
几个人都提到工具成功的最重要因素之一是timing,我的确得益于此,我到处也这么说
。不过我还想为自己辩护一下:没有我的工作,大家现在还会有统一的比对格式,但是
这个格式会晚很多才出现,而且很可能会缺少些现有的功能。技术的难易和作用不身在
其中有时不易准确评估。
说回Broad,前两天Nature正好有一篇介绍Broad staff的文章,基本属实。Broad对待
staff相对来说是不错的,大家可以来试试。
avatar
e*o
33
赞大牛

【在 l*3 的大作中提到】
: 前天吃午饭时有人告诉我这里有对我的讨论,就过来看看了,才想起来我几年前还注册
: 过帐号,就冒第一个泡吧。
: 最常见的问题是我为什么不当PI。其实我最近也有了PI的名头,但确实没有做PI的事情
: 。主要是我更喜欢第一线的工作,但拉钱很分散精力。我也挺怕误人子弟,尤其是自己
: 忙的时候可能对手下照顾不周。再者Broad和David Reich多年来一直给我很大的自由度
: ,我可以拿他们的钱而不常接他们的直属项目(对此我始终非常感激并有些愧疚);而
: 且做纯计算的目前在工业界机会也还算多,我已经拒掉几个offer了。因此我没有很大
: 的压力和动力去找PI,而我又不是积极求变的人,所以没有广撒网去申请。次要的还有
: 一点家庭因素,不在此赘述。mitbbsrobot和lecroc2016说的也很对:像我这样过于偏
: 重计算的找好地儿的faculty还需努力。我也在申funding中,希望有所改变。

avatar
j*g
34
wow,大神现身,合影~

:前天吃午饭时有人告诉我这里有对我的讨论,就过来看看了,才想起来我几年前还注
册过帐号,就冒第一个泡吧。
:最常见的问题是我为什么不当PI。其实我最近也有了PI的名头,但确实没有做PI的事
情。主要是我更喜欢第一线的工作,但拉钱很分散精力。我也挺怕误人子弟,尤其是自
己忙的时候可能对手下照顾不周。再者Broad和David Reich多年来一直给我很大的自由
度,我可以拿他们的钱而不常接他们的直属项目(对此我始终非常感激并有些愧疚);
而且做纯计算的目前在工业界机会也还算多,我已经拒掉几个offer了。因此我没有很大
:的压力和动力去找PI,而我又不是积极求变的人,所以没有广撒网去申请。次要的还
有一点家庭因素,不在此赘述。mitbbsrobot和lecroc2016说的也很对:像我这样过于偏
:重计算的找好地儿的faculty还需努力。我也在申funding中,希望有所改变。
:Nature biotech曾经有篇文章以邮件形式采访过不少写工具的。在那篇文章中我和其
他几个人都提到工具成功的最重要因素之一是timing,我的确得益于此,我到处也这么
说。不过我还想为自己辩护一下:没有我的工作,大家现在还会有统一的比对格式,但
是这个格式会晚很多才出现,而且很可能会缺少些现有的功能。技术的难易和作用不身
在其中有时不易准确评估。
:说回Broad,前两天Nature正好有一篇介绍Broad staff的文章,基本属实。Broad对待
:staff相对来说是不错的,大家可以来试试。

【在 l*3 的大作中提到】
: 前天吃午饭时有人告诉我这里有对我的讨论,就过来看看了,才想起来我几年前还注册
: 过帐号,就冒第一个泡吧。
: 最常见的问题是我为什么不当PI。其实我最近也有了PI的名头,但确实没有做PI的事情
: 。主要是我更喜欢第一线的工作,但拉钱很分散精力。我也挺怕误人子弟,尤其是自己
: 忙的时候可能对手下照顾不周。再者Broad和David Reich多年来一直给我很大的自由度
: ,我可以拿他们的钱而不常接他们的直属项目(对此我始终非常感激并有些愧疚);而
: 且做纯计算的目前在工业界机会也还算多,我已经拒掉几个offer了。因此我没有很大
: 的压力和动力去找PI,而我又不是积极求变的人,所以没有广撒网去申请。次要的还有
: 一点家庭因素,不在此赘述。mitbbsrobot和lecroc2016说的也很对:像我这样过于偏
: 重计算的找好地儿的faculty还需努力。我也在申funding中,希望有所改变。

avatar
G*G
35
有个小问题。在samtool诞生之前,人们是怎么使用bam文件的?
人们用什么工具读取和理解这个bam文件?
bam文件的格式和接口是不是一开始就是公开的?还是是公司秘密的文件格式?

【在 l*3 的大作中提到】
: 前天吃午饭时有人告诉我这里有对我的讨论,就过来看看了,才想起来我几年前还注册
: 过帐号,就冒第一个泡吧。
: 最常见的问题是我为什么不当PI。其实我最近也有了PI的名头,但确实没有做PI的事情
: 。主要是我更喜欢第一线的工作,但拉钱很分散精力。我也挺怕误人子弟,尤其是自己
: 忙的时候可能对手下照顾不周。再者Broad和David Reich多年来一直给我很大的自由度
: ,我可以拿他们的钱而不常接他们的直属项目(对此我始终非常感激并有些愧疚);而
: 且做纯计算的目前在工业界机会也还算多,我已经拒掉几个offer了。因此我没有很大
: 的压力和动力去找PI,而我又不是积极求变的人,所以没有广撒网去申请。次要的还有
: 一点家庭因素,不在此赘述。mitbbsrobot和lecroc2016说的也很对:像我这样过于偏
: 重计算的找好地儿的faculty还需努力。我也在申funding中,希望有所改变。

avatar
t*m
36
天啊,我是来跟大牛合影的....

【在 l*3 的大作中提到】
: 前天吃午饭时有人告诉我这里有对我的讨论,就过来看看了,才想起来我几年前还注册
: 过帐号,就冒第一个泡吧。
: 最常见的问题是我为什么不当PI。其实我最近也有了PI的名头,但确实没有做PI的事情
: 。主要是我更喜欢第一线的工作,但拉钱很分散精力。我也挺怕误人子弟,尤其是自己
: 忙的时候可能对手下照顾不周。再者Broad和David Reich多年来一直给我很大的自由度
: ,我可以拿他们的钱而不常接他们的直属项目(对此我始终非常感激并有些愧疚);而
: 且做纯计算的目前在工业界机会也还算多,我已经拒掉几个offer了。因此我没有很大
: 的压力和动力去找PI,而我又不是积极求变的人,所以没有广撒网去申请。次要的还有
: 一点家庭因素,不在此赘述。mitbbsrobot和lecroc2016说的也很对:像我这样过于偏
: 重计算的找好地儿的faculty还需努力。我也在申funding中,希望有所改变。

avatar
c*r
37
膜拜一下大牛~
前年有幸在Broad Aviv实验室做了一个月数据分析,感觉Broad真是做事情的好地方,
各种硬件、软件、合作、资源都是太好了!羡慕~
顺便请教一个问题,如果我的reads和reference的variation > 5%,建议用什么
aligner或参数?我做海胆,野生的,genetic variation很大。2006 genome测序的文
章里提到:
It was known that single-copy DNA in the sea urchin varied by as much as 4
to 5% [single nucleotide polymorphism (SNP) plus insertion/deletion (indel)]
, which is much greater than human (~0.5%) (3). Moreover, alignment of WGS
reads to the early v 0.1 WGS assembly revealed at least one SNP per 100
bases, as well as a comparable frequency of indel variants.
http://science.sciencemag.org/content/early/2017/05/17/science.aam6393.full
所以如果我做同个物种或者不同物种的mapping时(后者的variation大约在6%以上)
,有没有什么推荐?
Stampy怎么样?
多谢!

【在 l*3 的大作中提到】
: 前天吃午饭时有人告诉我这里有对我的讨论,就过来看看了,才想起来我几年前还注册
: 过帐号,就冒第一个泡吧。
: 最常见的问题是我为什么不当PI。其实我最近也有了PI的名头,但确实没有做PI的事情
: 。主要是我更喜欢第一线的工作,但拉钱很分散精力。我也挺怕误人子弟,尤其是自己
: 忙的时候可能对手下照顾不周。再者Broad和David Reich多年来一直给我很大的自由度
: ,我可以拿他们的钱而不常接他们的直属项目(对此我始终非常感激并有些愧疚);而
: 且做纯计算的目前在工业界机会也还算多,我已经拒掉几个offer了。因此我没有很大
: 的压力和动力去找PI,而我又不是积极求变的人,所以没有广撒网去申请。次要的还有
: 一点家庭因素,不在此赘述。mitbbsrobot和lecroc2016说的也很对:像我这样过于偏
: 重计算的找好地儿的faculty还需努力。我也在申funding中,希望有所改变。

avatar
n*7
38
跟风合个影
大牛说话就是实在

【在 l*3 的大作中提到】
: 前天吃午饭时有人告诉我这里有对我的讨论,就过来看看了,才想起来我几年前还注册
: 过帐号,就冒第一个泡吧。
: 最常见的问题是我为什么不当PI。其实我最近也有了PI的名头,但确实没有做PI的事情
: 。主要是我更喜欢第一线的工作,但拉钱很分散精力。我也挺怕误人子弟,尤其是自己
: 忙的时候可能对手下照顾不周。再者Broad和David Reich多年来一直给我很大的自由度
: ,我可以拿他们的钱而不常接他们的直属项目(对此我始终非常感激并有些愧疚);而
: 且做纯计算的目前在工业界机会也还算多,我已经拒掉几个offer了。因此我没有很大
: 的压力和动力去找PI,而我又不是积极求变的人,所以没有广撒网去申请。次要的还有
: 一点家庭因素,不在此赘述。mitbbsrobot和lecroc2016说的也很对:像我这样过于偏
: 重计算的找好地儿的faculty还需努力。我也在申funding中,希望有所改变。

avatar
l*y
39
合影留念

【在 l*3 的大作中提到】
: 前天吃午饭时有人告诉我这里有对我的讨论,就过来看看了,才想起来我几年前还注册
: 过帐号,就冒第一个泡吧。
: 最常见的问题是我为什么不当PI。其实我最近也有了PI的名头,但确实没有做PI的事情
: 。主要是我更喜欢第一线的工作,但拉钱很分散精力。我也挺怕误人子弟,尤其是自己
: 忙的时候可能对手下照顾不周。再者Broad和David Reich多年来一直给我很大的自由度
: ,我可以拿他们的钱而不常接他们的直属项目(对此我始终非常感激并有些愧疚);而
: 且做纯计算的目前在工业界机会也还算多,我已经拒掉几个offer了。因此我没有很大
: 的压力和动力去找PI,而我又不是积极求变的人,所以没有广撒网去申请。次要的还有
: 一点家庭因素,不在此赘述。mitbbsrobot和lecroc2016说的也很对:像我这样过于偏
: 重计算的找好地儿的faculty还需努力。我也在申funding中,希望有所改变。

avatar
d*m
40
heng li你和同是broad出来的erez lieberman谁牛?
avatar
p*e
41
一个实力派,一个偶像派

【在 d********m 的大作中提到】
: heng li你和同是broad出来的erez lieberman谁牛?
avatar
l*3
42
GoooG:sam,bam和samtools是一起做的。没有先后。一直都是公开的。
cellcreator:可以试试stampy,毕竟它是少数考虑了高突变率的short-read mapper。
但不知效果会怎样,没有经验。你也可以考虑先组装再比对。高heterozygosity可能同
样难办,不过有时间的话可以试一个样品。
dimorphism:我很欣赏跟生物密切结合的应用,所以Erez Lieberman更牛。
profile:谢谢你的鼓励和你前面的祝福,谢谢!
avatar
c*r
43
多谢大牛给建议!
因为要用到一个软件HyLiTEhttps://hylite.sourceforge.io/做杂合体中的Allele-
specific expression,类似相当于人里边检查小孩基因组里来自父亲和来自母亲的等
位基因分别的表达水平,只不过我的实验里是用的来自两个不同物种的父亲和母亲以及
他们的杂交后代,在杂交后代里检查来自两个物种的基因的各自表达水平,从而研究基
因调控。这两个物种种内的突变就有4-5% (Coding sequence低一些,Stampy map结果
显示整体平均在1.7%-3.4%之间,个别基因肯定会超出这个范围),种间的突变更高,用
stampy map结果显示整体平均的variation比例在7%左右。第一步怎么mapping是个很头
疼的问题。
HyLiTE可以使用一个亲本的genome/transcriptome做reference,自动分析allele-
specific expression,比较省心。默认的是用bowtie,但是bowtie最大的突变率好像
是5%(1 mismatch per 20 bp seed?)。所以我换成了Stampy。我想evaluate一下
mapping的结果。大牛能指点方向吗?有没有好的文章/Manual/protocol,具体说说怎
么evaluate mapping的效果。这个对下一步的分析至关重要。
还有鉴于种内差异都这么大,我计划采用来自一个个体的多个stage的RNAseq做de novo
assembly作为reference(而不是pool多个来自个体的reads,那样虽然reads总数多,
但variation也大,造成de novo assembly有很多false positive iosforms),然后用
HiLiTE分别以两个物种作为reference做mapping和分析allele-specific expression,
看看gene level有没有Bias。这里两个物种的reference还要选择共有的gene,相同的
overlap的区域作为reference以保证可比性。不知道这个计划听起来如何?有哪些设计
上的缺陷和不足?有没有更好的建议?
多谢!

【在 l*3 的大作中提到】
: GoooG:sam,bam和samtools是一起做的。没有先后。一直都是公开的。
: cellcreator:可以试试stampy,毕竟它是少数考虑了高突变率的short-read mapper。
: 但不知效果会怎样,没有经验。你也可以考虑先组装再比对。高heterozygosity可能同
: 样难办,不过有时间的话可以试一个样品。
: dimorphism:我很欣赏跟生物密切结合的应用,所以Erez Lieberman更牛。
: profile:谢谢你的鼓励和你前面的祝福,谢谢!

avatar
S*6
44
抓紧过来和老李合一个影。。
谢谢你的工作。
我从2007年开始接触二代测序数据分析。那时候这个Solexa 技术刚刚商业化,被
Illumina 公司收购。
那时候用它自带的ELAND。还自己试着用过BLAT和FASTA,后者主要是作为自己写的寻找
indel 工具的一部分。
再往后就是 BWA, BOWTIE, novoalign
avatar
d*m
45
都是broad出来的新人,eriz lieberman和michell guttman谁牛。

【在 l*3 的大作中提到】
: GoooG:sam,bam和samtools是一起做的。没有先后。一直都是公开的。
: cellcreator:可以试试stampy,毕竟它是少数考虑了高突变率的short-read mapper。
: 但不知效果会怎样,没有经验。你也可以考虑先组装再比对。高heterozygosity可能同
: 样难办,不过有时间的话可以试一个样品。
: dimorphism:我很欣赏跟生物密切结合的应用,所以Erez Lieberman更牛。
: profile:谢谢你的鼓励和你前面的祝福,谢谢!

avatar
r*t
46
赞,过来跟大牛合影。
另外赞一下标题,曾经开会的时候跟真人聊过,很贴切,真的是天才码农。
avatar
D*e
47
同赞,过来跟大牛合影!!
那天吃饭忘了合影了!!!啊啊啊啊

【在 l*3 的大作中提到】
: GoooG:sam,bam和samtools是一起做的。没有先后。一直都是公开的。
: cellcreator:可以试试stampy,毕竟它是少数考虑了高突变率的short-read mapper。
: 但不知效果会怎样,没有经验。你也可以考虑先组装再比对。高heterozygosity可能同
: 样难办,不过有时间的话可以试一个样品。
: dimorphism:我很欣赏跟生物密切结合的应用,所以Erez Lieberman更牛。
: profile:谢谢你的鼓励和你前面的祝福,谢谢!

avatar
j*g
48
都是牛人,Lieberman专注3D染色体,guttman是不是方向更杂乱。

:都是broad出来的新人,eriz lieberman和michell guttman谁牛。

【在 d********m 的大作中提到】
: 都是broad出来的新人,eriz lieberman和michell guttman谁牛。
avatar
M*r
49
跟牛人合个影!!希望未来有机会跟牛人合作。。。

【在 l*3 的大作中提到】
: 前天吃午饭时有人告诉我这里有对我的讨论,就过来看看了,才想起来我几年前还注册
: 过帐号,就冒第一个泡吧。
: 最常见的问题是我为什么不当PI。其实我最近也有了PI的名头,但确实没有做PI的事情
: 。主要是我更喜欢第一线的工作,但拉钱很分散精力。我也挺怕误人子弟,尤其是自己
: 忙的时候可能对手下照顾不周。再者Broad和David Reich多年来一直给我很大的自由度
: ,我可以拿他们的钱而不常接他们的直属项目(对此我始终非常感激并有些愧疚);而
: 且做纯计算的目前在工业界机会也还算多,我已经拒掉几个offer了。因此我没有很大
: 的压力和动力去找PI,而我又不是积极求变的人,所以没有广撒网去申请。次要的还有
: 一点家庭因素,不在此赘述。mitbbsrobot和lecroc2016说的也很对:像我这样过于偏
: 重计算的找好地儿的faculty还需努力。我也在申funding中,希望有所改变。

avatar
y*i
50
和大牛合影,葱白葱白。

【在 l*3 的大作中提到】
: 前天吃午饭时有人告诉我这里有对我的讨论,就过来看看了,才想起来我几年前还注册
: 过帐号,就冒第一个泡吧。
: 最常见的问题是我为什么不当PI。其实我最近也有了PI的名头,但确实没有做PI的事情
: 。主要是我更喜欢第一线的工作,但拉钱很分散精力。我也挺怕误人子弟,尤其是自己
: 忙的时候可能对手下照顾不周。再者Broad和David Reich多年来一直给我很大的自由度
: ,我可以拿他们的钱而不常接他们的直属项目(对此我始终非常感激并有些愧疚);而
: 且做纯计算的目前在工业界机会也还算多,我已经拒掉几个offer了。因此我没有很大
: 的压力和动力去找PI,而我又不是积极求变的人,所以没有广撒网去申请。次要的还有
: 一点家庭因素,不在此赘述。mitbbsrobot和lecroc2016说的也很对:像我这样过于偏
: 重计算的找好地儿的faculty还需努力。我也在申funding中,希望有所改变。

avatar
B*l
51
成功是99%的networking 1%的实力 iq 努力
avatar
s*s
52
合影沾个光。
各大论坛也经常见到大侠回答问题。
Btw, 有个tabix的问题。有没有可能除了coordinates再多index一个column.
可能的use case是比如很大的MAF file要看某个具体sample在某点的突变,或者VCF里面
选某个FILTER value一类的。

【在 l*3 的大作中提到】
: 前天吃午饭时有人告诉我这里有对我的讨论,就过来看看了,才想起来我几年前还注册
: 过帐号,就冒第一个泡吧。
: 最常见的问题是我为什么不当PI。其实我最近也有了PI的名头,但确实没有做PI的事情
: 。主要是我更喜欢第一线的工作,但拉钱很分散精力。我也挺怕误人子弟,尤其是自己
: 忙的时候可能对手下照顾不周。再者Broad和David Reich多年来一直给我很大的自由度
: ,我可以拿他们的钱而不常接他们的直属项目(对此我始终非常感激并有些愧疚);而
: 且做纯计算的目前在工业界机会也还算多,我已经拒掉几个offer了。因此我没有很大
: 的压力和动力去找PI,而我又不是积极求变的人,所以没有广撒网去申请。次要的还有
: 一点家庭因素,不在此赘述。mitbbsrobot和lecroc2016说的也很对:像我这样过于偏
: 重计算的找好地儿的faculty还需努力。我也在申funding中,希望有所改变。

avatar
W*D
53
我希望你自重!

PI?

【在 j*********g 的大作中提到】
: http://www.edubilla.com/award/benjamin-franklin-award/heng-li/
: http://lh3lh3.users.sourceforge.net
: 真的牛人。为什么在Broad Institute还只是research scientist(千老?),不是PI?
: 反之很多垃圾人当上了PI,狗p不通,还趾高气扬,比如本版的仇子龙、soldiera、
: WuforAVSD;
: 而Heng Li这样的真正的牛人只能当千老。这世道,真是笑贫不笑娼的时代啊。

avatar
W*D
54
avatar
f*r
55
MPEG国际标准组织(就是那个做MP3, MP4的MPEG)开始了一个新的工作小组做DNA数据的
压缩和传输国际标准。 有人有兴趣一起搞吗?

【在 l*3 的大作中提到】
: GoooG:sam,bam和samtools是一起做的。没有先后。一直都是公开的。
: cellcreator:可以试试stampy,毕竟它是少数考虑了高突变率的short-read mapper。
: 但不知效果会怎样,没有经验。你也可以考虑先组装再比对。高heterozygosity可能同
: 样难办,不过有时间的话可以试一个样品。
: dimorphism:我很欣赏跟生物密切结合的应用,所以Erez Lieberman更牛。
: profile:谢谢你的鼓励和你前面的祝福,谢谢!

avatar
l*3
56
cellcreator: 不好意思,我对这类数据没有太多经验
shakuras:tabix不是专门针对VCF的。你要用bcftools或者类似的工具。
freshsugar:值得关注,但总体来说我不看好。这种事情只有长期在第一线分析批量真
实数据的人才能做好,他们好像缺少这类人。再者cram并不算差,大家不会为了一点提
高就换一个全新的格式的。
avatar
m*g
57
赶紧跳出来和大神合影。
大神有帖子介绍写过的各种工具的推荐和建议之类的吗?我是生信小白,刚开始学习呢。

【在 l*3 的大作中提到】
: cellcreator: 不好意思,我对这类数据没有太多经验
: shakuras:tabix不是专门针对VCF的。你要用bcftools或者类似的工具。
: freshsugar:值得关注,但总体来说我不看好。这种事情只有长期在第一线分析批量真
: 实数据的人才能做好,他们好像缺少这类人。再者cram并不算差,大家不会为了一点提
: 高就换一个全新的格式的。

avatar
h*s
58

走出学校就是情商+外貌 >>>>>>> 智商了。

【在 B*****l 的大作中提到】
: 成功是99%的networking 1%的实力 iq 努力
avatar
n*g
59
小李,你的工具简介有力 是上品
[在 lh3 (lh3) 的大作中提到:]
:cellcreator: 不好意思,我对这类数据没有太多经验
:shakuras:tabix不是专门针对VCF的。你要用bcftools或者类似的工具。
:freshsugar:值得关注,但总体来说我不看好。这种事情只有长期在第一线分析批量
真实数据的人才能做好,他们好像缺少这类人。再者cram并不算差,大家不会为了一点
提高就换一个全新的格式的。
avatar
f*r
60
cram 只能压缩SAM/BAM吧?他们这回的目标是fastq。做压缩MPEG那边是在行的。缺的
应该是第一线分析数据的人。不过现在有UK Sanger的人在一起做。

【在 l*3 的大作中提到】
: cellcreator: 不好意思,我对这类数据没有太多经验
: shakuras:tabix不是专门针对VCF的。你要用bcftools或者类似的工具。
: freshsugar:值得关注,但总体来说我不看好。这种事情只有长期在第一线分析批量真
: 实数据的人才能做好,他们好像缺少这类人。再者cram并不算差,大家不会为了一点提
: 高就换一个全新的格式的。

avatar
f*n
61
天啊OMG
赶紧来沾沾仙气儿
很多年前从biostar上看到 lh3
到现在MITBBS看到 lh3
曾经还全身心投入科研
现在恨透科研
真是感怀,岁月匆匆
lh3 ,就是个金质招牌

【在 l*3 的大作中提到】
: GoooG:sam,bam和samtools是一起做的。没有先后。一直都是公开的。
: cellcreator:可以试试stampy,毕竟它是少数考虑了高突变率的short-read mapper。
: 但不知效果会怎样,没有经验。你也可以考虑先组装再比对。高heterozygosity可能同
: 样难办,不过有时间的话可以试一个样品。
: dimorphism:我很欣赏跟生物密切结合的应用,所以Erez Lieberman更牛。
: profile:谢谢你的鼓励和你前面的祝福,谢谢!

avatar
I*i
62
向牛人学习

【在 l*3 的大作中提到】
: 前天吃午饭时有人告诉我这里有对我的讨论,就过来看看了,才想起来我几年前还注册
: 过帐号,就冒第一个泡吧。
: 最常见的问题是我为什么不当PI。其实我最近也有了PI的名头,但确实没有做PI的事情
: 。主要是我更喜欢第一线的工作,但拉钱很分散精力。我也挺怕误人子弟,尤其是自己
: 忙的时候可能对手下照顾不周。再者Broad和David Reich多年来一直给我很大的自由度
: ,我可以拿他们的钱而不常接他们的直属项目(对此我始终非常感激并有些愧疚);而
: 且做纯计算的目前在工业界机会也还算多,我已经拒掉几个offer了。因此我没有很大
: 的压力和动力去找PI,而我又不是积极求变的人,所以没有广撒网去申请。次要的还有
: 一点家庭因素,不在此赘述。mitbbsrobot和lecroc2016说的也很对:像我这样过于偏
: 重计算的找好地儿的faculty还需努力。我也在申funding中,希望有所改变。

avatar
d*u
63

如果heng li能去上上商学院的课,可能结果就更好了,名利双收。

【在 n******7 的大作中提到】
: 抱歉,我觉得把你放那里你也设计不出来
avatar
o*p
64
nm,大神出没。

【在 l*3 的大作中提到】
: cellcreator: 不好意思,我对这类数据没有太多经验
: shakuras:tabix不是专门针对VCF的。你要用bcftools或者类似的工具。
: freshsugar:值得关注,但总体来说我不看好。这种事情只有长期在第一线分析批量真
: 实数据的人才能做好,他们好像缺少这类人。再者cram并不算差,大家不会为了一点提
: 高就换一个全新的格式的。

avatar
k*a
65
和牛人合影!
若干年前开会上曾见过你,当时才入行,还没有充分理解你的工作的分量。谢谢你写了
这么多有用的工具,国人骄傲。

【在 l*3 的大作中提到】
: 前天吃午饭时有人告诉我这里有对我的讨论,就过来看看了,才想起来我几年前还注册
: 过帐号,就冒第一个泡吧。
: 最常见的问题是我为什么不当PI。其实我最近也有了PI的名头,但确实没有做PI的事情
: 。主要是我更喜欢第一线的工作,但拉钱很分散精力。我也挺怕误人子弟,尤其是自己
: 忙的时候可能对手下照顾不周。再者Broad和David Reich多年来一直给我很大的自由度
: ,我可以拿他们的钱而不常接他们的直属项目(对此我始终非常感激并有些愧疚);而
: 且做纯计算的目前在工业界机会也还算多,我已经拒掉几个offer了。因此我没有很大
: 的压力和动力去找PI,而我又不是积极求变的人,所以没有广撒网去申请。次要的还有
: 一点家庭因素,不在此赘述。mitbbsrobot和lecroc2016说的也很对:像我这样过于偏
: 重计算的找好地儿的faculty还需努力。我也在申funding中,希望有所改变。

avatar
m*T
66
非常感谢你对ngs领域的巨大贡献!更欣赏你这种不为各利所动的品质,很多诱惑不是
一般人能轻易抵挡住的,钦佩!!!

【在 l*3 的大作中提到】
: 前天吃午饭时有人告诉我这里有对我的讨论,就过来看看了,才想起来我几年前还注册
: 过帐号,就冒第一个泡吧。
: 最常见的问题是我为什么不当PI。其实我最近也有了PI的名头,但确实没有做PI的事情
: 。主要是我更喜欢第一线的工作,但拉钱很分散精力。我也挺怕误人子弟,尤其是自己
: 忙的时候可能对手下照顾不周。再者Broad和David Reich多年来一直给我很大的自由度
: ,我可以拿他们的钱而不常接他们的直属项目(对此我始终非常感激并有些愧疚);而
: 且做纯计算的目前在工业界机会也还算多,我已经拒掉几个offer了。因此我没有很大
: 的压力和动力去找PI,而我又不是积极求变的人,所以没有广撒网去申请。次要的还有
: 一点家庭因素,不在此赘述。mitbbsrobot和lecroc2016说的也很对:像我这样过于偏
: 重计算的找好地儿的faculty还需努力。我也在申funding中,希望有所改变。

相关阅读
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。