Redian新闻
>
全基因组数据研究SV/CNV用什么软件
avatar
全基因组数据研究SV/CNV用什么软件# Biology - 生物学
d*u
1
http://us.acer.com/ac/en/US/content/model/NT.L0SAA.002
MS 店里不带docking station标价499
这是不是第一个平民价格+桌面系统的板子?
没时间多玩,就摸了几下,做工不错,屏幕分辨率一般,稍有点厚,摸着右后方有点发
热,不知道是前面人运行了什么还是放着就发热
avatar
r*e
2
whole-genome数据来call structural variation(SV)和copy number variation(CNV)
一般SV就是三种signal, read-pair(RP), read-depth(RD), split-read(SR)
1000Genome project里用了一些比如Breakdancer,CNVnator这样元老型的软件,但缺
点是都只用一种signal
现在使用combine multiple signal的软件越来越多并且成了主流,比如Delly。Delly
主要是基于SR和RP,当然现在也有了后期基于RD的filter
SV的问题是,SV本质过于复杂,有不同size,不同type的SV,一种signal或者
algorithm很难完全对付,所以sensitivity和specificity都不高(跟SNP calling比起
来);为了得到更好的结果,有两种想法:
1. 对于一个genome,把Breakdancer,CNVnator,Delly等等的结果merge起来;只挑选
出同时被好几种tools支持的SV callings。这个很容易想到,就是用bedtools找
overlap,最后specificity会大大提高,但问题是sensitivity会大大降低
2. 就只用Delly这种先进的软件。比如Delly结果上进一步用RD来filter,让最后结果
是基于SR, RP, RD 三种signal,这样比硬生生的intersect两种不同的tools要温和点
(我个人觉得),或许sensitivity不会那么受到损伤
是不是第二种做法更好呢,尤其如果我现在只研究deletion?不知道自己讲明白了没。
希望听更多高人的指点
avatar
G*h
3
跟 BF 卖的那个一样?

【在 d*********u 的大作中提到】
: http://us.acer.com/ac/en/US/content/model/NT.L0SAA.002
: MS 店里不带docking station标价499
: 这是不是第一个平民价格+桌面系统的板子?
: 没时间多玩,就摸了几下,做工不错,屏幕分辨率一般,稍有点厚,摸着右后方有点发
: 热,不知道是前面人运行了什么还是放着就发热

avatar
r*e
4
dd

CNV)
Delly

【在 r**********e 的大作中提到】
: whole-genome数据来call structural variation(SV)和copy number variation(CNV)
: 一般SV就是三种signal, read-pair(RP), read-depth(RD), split-read(SR)
: 1000Genome project里用了一些比如Breakdancer,CNVnator这样元老型的软件,但缺
: 点是都只用一种signal
: 现在使用combine multiple signal的软件越来越多并且成了主流,比如Delly。Delly
: 主要是基于SR和RP,当然现在也有了后期基于RD的filter
: SV的问题是,SV本质过于复杂,有不同size,不同type的SV,一种signal或者
: algorithm很难完全对付,所以sensitivity和specificity都不高(跟SNP calling比起
: 来);为了得到更好的结果,有两种想法:
: 1. 对于一个genome,把Breakdancer,CNVnator,Delly等等的结果merge起来;只挑选

avatar
c*r
6
不懂,帮顶!
顺便问几个naive的问题,不同个体之间的各种SVs大概有多少?这些SVs是不是对于以
后个性化治疗什么的极为重要?
现在哪种测序技术对于准确检测出这些SVs更有优势?Illumina?Ion Torrent? PacBio
? Complete Genomics?其它?数据分析看样子还是一个巨大的挑战?先做de novo
assembly然后和reference比较是否可行?
avatar
l*x
7
atom的板子,没兴趣。。
avatar
r*e
8
1. 不同个体之间的各种SVs大概有多少?
SV的问题是,有不同种类deletion,insertion,duplication, CNV, translocation,
inversion, segmental duplication...
而且有不同的size,小的1bp,大的好几MB
这两个维度都是SNP研究里不曾遇到的
如果你要问一个human being有多少SV? 我觉得目前都无法回答。因为目前的研究大部
分还是基于short reads的针对基因组的uniq sequence。真正SV hotspot是repetitive
region,但我们无法研究。当然,对于NA12828,人们做了大量研究,really high-
depth seq, Pacbio long reads,或许对这个样本的总结可以给你答案
所以不管是NGS技术,还是后续的计算,SV都是基因组学最大的难关;而难关中的难关
就是那些repetitive seq。
2. 这些SVs是不是对于以后个性化治疗什么的极为重要
对于非常巨大的比如1MB deletion,一般会造成新生儿的neurodevelopmental defect
,所以这对产检的意义非常巨大的。但是如此巨大的deletion第一少见第二用array这
种传统方式就可以检测到。NGS可以检测比如10KB, 100KB的deletion,但是这样
medium size的deletion对疾病的贡献就需要基础研究了
3. 现在哪种测序技术对于准确检测出这些SVs更有优势?Illumina?Ion Torrent?
PacBio
主流当然Illumina
但是game changer,大革命肯定是long reads。我很久没接触Pacbio了。不知道Pacbio
的error rate是否还那么高
一旦long reads出现,BWA什么的就要被淘汰。我们会回到过去BLAST的时代

PacBio

【在 c*********r 的大作中提到】
: 不懂,帮顶!
: 顺便问几个naive的问题,不同个体之间的各种SVs大概有多少?这些SVs是不是对于以
: 后个性化治疗什么的极为重要?
: 现在哪种测序技术对于准确检测出这些SVs更有优势?Illumina?Ion Torrent? PacBio
: ? Complete Genomics?其它?数据分析看样子还是一个巨大的挑战?先做de novo
: assembly然后和reference比较是否可行?

avatar
c*r
10
谢科普!
我以前也觉得PacBio错误率高,嫌弃它。现在搞明白了,PacBio可以通过对同一个分子
重复测序来correction,把错误率降到非常低。但是PacBio成本比较高,比Illumina还
是贵不少。不缺钱的话应用PacBio可以做不少事情,de novo assembly在好几个物种里
一个染色体就是一个contig,在人里边还是差一些但是比illumina要厉害。
等PacBio成本降下来了,肯定对SV研究会有新的方法和认识。

translocation,
repetitive

【在 r**********e 的大作中提到】
: 1. 不同个体之间的各种SVs大概有多少?
: SV的问题是,有不同种类deletion,insertion,duplication, CNV, translocation,
: inversion, segmental duplication...
: 而且有不同的size,小的1bp,大的好几MB
: 这两个维度都是SNP研究里不曾遇到的
: 如果你要问一个human being有多少SV? 我觉得目前都无法回答。因为目前的研究大部
: 分还是基于short reads的针对基因组的uniq sequence。真正SV hotspot是repetitive
: region,但我们无法研究。当然,对于NA12828,人们做了大量研究,really high-
: depth seq, Pacbio long reads,或许对这个样本的总结可以给你答案
: 所以不管是NGS技术,还是后续的计算,SV都是基因组学最大的难关;而难关中的难关

avatar
r*e
12
What's the average length of contig in Pacbio?
I remember like 10KB?
Maybe I'm too out-dated
If it's only 10KB....well think about human chromosome1, 100000kB level?

【在 c*********r 的大作中提到】
: 谢科普!
: 我以前也觉得PacBio错误率高,嫌弃它。现在搞明白了,PacBio可以通过对同一个分子
: 重复测序来correction,把错误率降到非常低。但是PacBio成本比较高,比Illumina还
: 是贵不少。不缺钱的话应用PacBio可以做不少事情,de novo assembly在好几个物种里
: 一个染色体就是一个contig,在人里边还是差一些但是比illumina要厉害。
: 等PacBio成本降下来了,肯定对SV研究会有新的方法和认识。
:
: translocation,
: repetitive

avatar
S*r
13
i3/i5都号称9小时, 不太相信。

【在 G*****h 的大作中提到】
: i3 的电池能多用 2 小时不?
avatar
c*r
14
PacBio P6-C4 单个read读长可以达到50%大于20KB
组装的contig长度最长能达到多少我不知道,和测序深度有关。人的染色体50M到300M
大小。目前还没有见过de novo assembly可以组装成完整染色体的。
单看de novo assembly,PacBio完败Illumina。

【在 r**********e 的大作中提到】
: What's the average length of contig in Pacbio?
: I remember like 10KB?
: Maybe I'm too out-dated
: If it's only 10KB....well think about human chromosome1, 100000kB level?

avatar
k*s
15
不要轻易错过这个板子,是目前最理想的。比iPad还轻,电池真能跑9小时,双核的CPU
,比以前的Atom快多了。除了1080p硬解,还能硬压。IPS触摸屏,非常漂亮。Dock做得
非常好,电池加倍,重量还是比所有的Ultrabook还轻。我等3G版的W511。
avatar
s*o
16
这个板子前面聊了一火车了,翻翻旧帖吧
avatar
p*n
17
w700 is as thick as a brick and has no stylus
avatar
S*r
18
那samsung的 700T 呢, 有wacom digitizer. 1.9 lbs。
装到键盘dock上有头重脚轻的感觉, 难怪屏幕往后倾斜角度不大, 大了估计会往后倒。

【在 p********n 的大作中提到】
: w700 is as thick as a brick and has no stylus
avatar
l*z
19
+1

CPU

【在 k**********s 的大作中提到】
: 不要轻易错过这个板子,是目前最理想的。比iPad还轻,电池真能跑9小时,双核的CPU
: ,比以前的Atom快多了。除了1080p硬解,还能硬压。IPS触摸屏,非常漂亮。Dock做得
: 非常好,电池加倍,重量还是比所有的Ultrabook还轻。我等3G版的W511。

avatar
N*m
20
不错

【在 d*********u 的大作中提到】
: http://us.acer.com/ac/en/US/content/model/NT.L0SAA.002
: MS 店里不带docking station标价499
: 这是不是第一个平民价格+桌面系统的板子?
: 没时间多玩,就摸了几下,做工不错,屏幕分辨率一般,稍有点厚,摸着右后方有点发
: 热,不知道是前面人运行了什么还是放着就发热

avatar
s*m
21
羡慕死美国的便宜电器了,这边w510不但贵还没货,就为这也要准备去美国定居。
相关阅读
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。