b*r
2 楼
我知道一般NGS的结果都会先往reference genome 去做alignment
我关心的是recurrent translocation,断裂重接到位置相对固定,我的目的是想找到
手里的十万个细胞里有多少发生了这种translocation
用NGS的话,怎么来做比较好?直接align的话,那些跨过断裂点的可能根本align不上
被扔了。de novo assembly显然计算工作量大,而且如果translocation的细胞的丰度
低,可能直接就测不到。
不知道这么做难不难:就是把常见断裂并且重接的那一段突变后序列也加到reference
genome里面,然后随便给他个命名比如chromosome 24,然后去align,有重接的序列会
和这一段非常吻合,就不会被扔掉了。
或者还有什么别的比较简单的办法吗
我关心的是recurrent translocation,断裂重接到位置相对固定,我的目的是想找到
手里的十万个细胞里有多少发生了这种translocation
用NGS的话,怎么来做比较好?直接align的话,那些跨过断裂点的可能根本align不上
被扔了。de novo assembly显然计算工作量大,而且如果translocation的细胞的丰度
低,可能直接就测不到。
不知道这么做难不难:就是把常见断裂并且重接的那一段突变后序列也加到reference
genome里面,然后随便给他个命名比如chromosome 24,然后去align,有重接的序列会
和这一段非常吻合,就不会被扔掉了。
或者还有什么别的比较简单的办法吗
m*5
3 楼
同问!!
s*s
4 楼
我瞎说两句没试过。
如果你知道具体的断裂点,就是只想看几千上万的candidate,而不是全看的话。
你把这个看成RNA就行了。把chromosome看成gene,把断裂点之间看成exon,
把跨断裂点的序列看成transcript, 自己做一个GTF file,然后用TOPHAT2, STAR
一类的试试。
reference
【在 b****r 的大作中提到】
: 我知道一般NGS的结果都会先往reference genome 去做alignment
: 我关心的是recurrent translocation,断裂重接到位置相对固定,我的目的是想找到
: 手里的十万个细胞里有多少发生了这种translocation
: 用NGS的话,怎么来做比较好?直接align的话,那些跨过断裂点的可能根本align不上
: 被扔了。de novo assembly显然计算工作量大,而且如果translocation的细胞的丰度
: 低,可能直接就测不到。
: 不知道这么做难不难:就是把常见断裂并且重接的那一段突变后序列也加到reference
: genome里面,然后随便给他个命名比如chromosome 24,然后去align,有重接的序列会
: 和这一段非常吻合,就不会被扔掉了。
: 或者还有什么别的比较简单的办法吗
如果你知道具体的断裂点,就是只想看几千上万的candidate,而不是全看的话。
你把这个看成RNA就行了。把chromosome看成gene,把断裂点之间看成exon,
把跨断裂点的序列看成transcript, 自己做一个GTF file,然后用TOPHAT2, STAR
一类的试试。
reference
【在 b****r 的大作中提到】
: 我知道一般NGS的结果都会先往reference genome 去做alignment
: 我关心的是recurrent translocation,断裂重接到位置相对固定,我的目的是想找到
: 手里的十万个细胞里有多少发生了这种translocation
: 用NGS的话,怎么来做比较好?直接align的话,那些跨过断裂点的可能根本align不上
: 被扔了。de novo assembly显然计算工作量大,而且如果translocation的细胞的丰度
: 低,可能直接就测不到。
: 不知道这么做难不难:就是把常见断裂并且重接的那一段突变后序列也加到reference
: genome里面,然后随便给他个命名比如chromosome 24,然后去align,有重接的序列会
: 和这一段非常吻合,就不会被扔掉了。
: 或者还有什么别的比较简单的办法吗
d*u
7 楼
现在做variant calling的软件已经很成熟了,你要做的这个肯定有很多软件可以用。
我不是做variant-calling的,但是我分析RNA-seq的数据并且对VC有一点了解吧,你说
的这种junction-spanning reads, 只要测序的通量上去了且序列够长(100bp),做
alignment的软件都会考虑进去的。找断裂点跟找novel splicing junction很像,假如
你的断裂点很固定的话,也可以采用你说的那种方法做。但是在考虑这些之前,我觉得
完全可以先试试现有的软件。
reference
【在 b****r 的大作中提到】
: 我知道一般NGS的结果都会先往reference genome 去做alignment
: 我关心的是recurrent translocation,断裂重接到位置相对固定,我的目的是想找到
: 手里的十万个细胞里有多少发生了这种translocation
: 用NGS的话,怎么来做比较好?直接align的话,那些跨过断裂点的可能根本align不上
: 被扔了。de novo assembly显然计算工作量大,而且如果translocation的细胞的丰度
: 低,可能直接就测不到。
: 不知道这么做难不难:就是把常见断裂并且重接的那一段突变后序列也加到reference
: genome里面,然后随便给他个命名比如chromosome 24,然后去align,有重接的序列会
: 和这一段非常吻合,就不会被扔掉了。
: 或者还有什么别的比较简单的办法吗
我不是做variant-calling的,但是我分析RNA-seq的数据并且对VC有一点了解吧,你说
的这种junction-spanning reads, 只要测序的通量上去了且序列够长(100bp),做
alignment的软件都会考虑进去的。找断裂点跟找novel splicing junction很像,假如
你的断裂点很固定的话,也可以采用你说的那种方法做。但是在考虑这些之前,我觉得
完全可以先试试现有的软件。
reference
【在 b****r 的大作中提到】
: 我知道一般NGS的结果都会先往reference genome 去做alignment
: 我关心的是recurrent translocation,断裂重接到位置相对固定,我的目的是想找到
: 手里的十万个细胞里有多少发生了这种translocation
: 用NGS的话,怎么来做比较好?直接align的话,那些跨过断裂点的可能根本align不上
: 被扔了。de novo assembly显然计算工作量大,而且如果translocation的细胞的丰度
: 低,可能直接就测不到。
: 不知道这么做难不难:就是把常见断裂并且重接的那一段突变后序列也加到reference
: genome里面,然后随便给他个命名比如chromosome 24,然后去align,有重接的序列会
: 和这一段非常吻合,就不会被扔掉了。
: 或者还有什么别的比较简单的办法吗
b*r
8 楼
收到,学习了!
【在 d*********u 的大作中提到】
: 现在做variant calling的软件已经很成熟了,你要做的这个肯定有很多软件可以用。
: 我不是做variant-calling的,但是我分析RNA-seq的数据并且对VC有一点了解吧,你说
: 的这种junction-spanning reads, 只要测序的通量上去了且序列够长(100bp),做
: alignment的软件都会考虑进去的。找断裂点跟找novel splicing junction很像,假如
: 你的断裂点很固定的话,也可以采用你说的那种方法做。但是在考虑这些之前,我觉得
: 完全可以先试试现有的软件。
:
: reference
【在 d*********u 的大作中提到】
: 现在做variant calling的软件已经很成熟了,你要做的这个肯定有很多软件可以用。
: 我不是做variant-calling的,但是我分析RNA-seq的数据并且对VC有一点了解吧,你说
: 的这种junction-spanning reads, 只要测序的通量上去了且序列够长(100bp),做
: alignment的软件都会考虑进去的。找断裂点跟找novel splicing junction很像,假如
: 你的断裂点很固定的话,也可以采用你说的那种方法做。但是在考虑这些之前,我觉得
: 完全可以先试试现有的软件。
:
: reference
n*e
10 楼
这个帖子很好,学习了,谢谢!
S*t
12 楼
这个有现成的方法可参考。简单说来,你可以利用4C的pipeline高效准确地定位你的
translocation。4C的pipeline就是利用一个已知的片段去寻找跟它连接在一起的未知
片段。比如片段A和B容易形成translocation,那么将A或B分别作为fixed的片段输入到
pipeline里去寻找translocation partner,就可以找到B或者A,并且还会告诉你准确
的translocation junctions。除了A,B之外,你可能还能找到另外的translocation
partners. 但愿你有好运气。
话说回来,你这个用NGS全基因组测序真是大炮打蚊子。可以去看看Fred Alt实验室的
一些文章,主要做的就是genome-wide translocation的鉴定。
reference
【在 b****r 的大作中提到】
: 我知道一般NGS的结果都会先往reference genome 去做alignment
: 我关心的是recurrent translocation,断裂重接到位置相对固定,我的目的是想找到
: 手里的十万个细胞里有多少发生了这种translocation
: 用NGS的话,怎么来做比较好?直接align的话,那些跨过断裂点的可能根本align不上
: 被扔了。de novo assembly显然计算工作量大,而且如果translocation的细胞的丰度
: 低,可能直接就测不到。
: 不知道这么做难不难:就是把常见断裂并且重接的那一段突变后序列也加到reference
: genome里面,然后随便给他个命名比如chromosome 24,然后去align,有重接的序列会
: 和这一段非常吻合,就不会被扔掉了。
: 或者还有什么别的比较简单的办法吗
translocation。4C的pipeline就是利用一个已知的片段去寻找跟它连接在一起的未知
片段。比如片段A和B容易形成translocation,那么将A或B分别作为fixed的片段输入到
pipeline里去寻找translocation partner,就可以找到B或者A,并且还会告诉你准确
的translocation junctions。除了A,B之外,你可能还能找到另外的translocation
partners. 但愿你有好运气。
话说回来,你这个用NGS全基因组测序真是大炮打蚊子。可以去看看Fred Alt实验室的
一些文章,主要做的就是genome-wide translocation的鉴定。
reference
【在 b****r 的大作中提到】
: 我知道一般NGS的结果都会先往reference genome 去做alignment
: 我关心的是recurrent translocation,断裂重接到位置相对固定,我的目的是想找到
: 手里的十万个细胞里有多少发生了这种translocation
: 用NGS的话,怎么来做比较好?直接align的话,那些跨过断裂点的可能根本align不上
: 被扔了。de novo assembly显然计算工作量大,而且如果translocation的细胞的丰度
: 低,可能直接就测不到。
: 不知道这么做难不难:就是把常见断裂并且重接的那一段突变后序列也加到reference
: genome里面,然后随便给他个命名比如chromosome 24,然后去align,有重接的序列会
: 和这一段非常吻合,就不会被扔掉了。
: 或者还有什么别的比较简单的办法吗
b*r
13 楼
我不是用全基因组测序,我就是打个比方,在根据reference genome节选出来的
wildtype reference sequence 之外加一截最有可能生成translocation的 序列,以简
便的提高translocation的探测灵敏度
你的思路很明白,和我回头去看看你推荐的文章,谢谢
【在 S*******t 的大作中提到】
: 这个有现成的方法可参考。简单说来,你可以利用4C的pipeline高效准确地定位你的
: translocation。4C的pipeline就是利用一个已知的片段去寻找跟它连接在一起的未知
: 片段。比如片段A和B容易形成translocation,那么将A或B分别作为fixed的片段输入到
: pipeline里去寻找translocation partner,就可以找到B或者A,并且还会告诉你准确
: 的translocation junctions。除了A,B之外,你可能还能找到另外的translocation
: partners. 但愿你有好运气。
: 话说回来,你这个用NGS全基因组测序真是大炮打蚊子。可以去看看Fred Alt实验室的
: 一些文章,主要做的就是genome-wide translocation的鉴定。
:
: reference
wildtype reference sequence 之外加一截最有可能生成translocation的 序列,以简
便的提高translocation的探测灵敏度
你的思路很明白,和我回头去看看你推荐的文章,谢谢
【在 S*******t 的大作中提到】
: 这个有现成的方法可参考。简单说来,你可以利用4C的pipeline高效准确地定位你的
: translocation。4C的pipeline就是利用一个已知的片段去寻找跟它连接在一起的未知
: 片段。比如片段A和B容易形成translocation,那么将A或B分别作为fixed的片段输入到
: pipeline里去寻找translocation partner,就可以找到B或者A,并且还会告诉你准确
: 的translocation junctions。除了A,B之外,你可能还能找到另外的translocation
: partners. 但愿你有好运气。
: 话说回来,你这个用NGS全基因组测序真是大炮打蚊子。可以去看看Fred Alt实验室的
: 一些文章,主要做的就是genome-wide translocation的鉴定。
:
: reference
s*s
14 楼
Structure variant还很不成熟。
记得dream challenge今年做过比赛,全世界小组竞争。好像一个200X的序列,
最好的一家也才50%。
【在 d*********u 的大作中提到】
: 现在做variant calling的软件已经很成熟了,你要做的这个肯定有很多软件可以用。
: 我不是做variant-calling的,但是我分析RNA-seq的数据并且对VC有一点了解吧,你说
: 的这种junction-spanning reads, 只要测序的通量上去了且序列够长(100bp),做
: alignment的软件都会考虑进去的。找断裂点跟找novel splicing junction很像,假如
: 你的断裂点很固定的话,也可以采用你说的那种方法做。但是在考虑这些之前,我觉得
: 完全可以先试试现有的软件。
:
: reference
记得dream challenge今年做过比赛,全世界小组竞争。好像一个200X的序列,
最好的一家也才50%。
【在 d*********u 的大作中提到】
: 现在做variant calling的软件已经很成熟了,你要做的这个肯定有很多软件可以用。
: 我不是做variant-calling的,但是我分析RNA-seq的数据并且对VC有一点了解吧,你说
: 的这种junction-spanning reads, 只要测序的通量上去了且序列够长(100bp),做
: alignment的软件都会考虑进去的。找断裂点跟找novel splicing junction很像,假如
: 你的断裂点很固定的话,也可以采用你说的那种方法做。但是在考虑这些之前,我觉得
: 完全可以先试试现有的软件。
:
: reference
s*s
16 楼
要是我做的,肯定第一个try的就是把structure variation那些做成extra的sequence,
然后
BWA; 第二种就是前面说的做GTF,然后用Bowtie/tophat/star做RNA-Seq.
第一种方法更加straightforward一点,不过后处理稍微麻烦一点,要仔细看一下最后
的结果,写一些script去filter掉一些cases,比如low quality的mapping, secondary/
alternative alignment, 还有map在这些contig的也未必跨SV。
法?
【在 b****r 的大作中提到】
: 那我说的这种位置相对已知,而且配对的只有那么几种可能的情况呢,你推荐什么算法?
然后
BWA; 第二种就是前面说的做GTF,然后用Bowtie/tophat/star做RNA-Seq.
第一种方法更加straightforward一点,不过后处理稍微麻烦一点,要仔细看一下最后
的结果,写一些script去filter掉一些cases,比如low quality的mapping, secondary/
alternative alignment, 还有map在这些contig的也未必跨SV。
法?
【在 b****r 的大作中提到】
: 那我说的这种位置相对已知,而且配对的只有那么几种可能的情况呢,你推荐什么算法?
m*T
17 楼
这个建议不错,赞一个
sequence,
secondary/
【在 s******s 的大作中提到】
: 要是我做的,肯定第一个try的就是把structure variation那些做成extra的sequence,
: 然后
: BWA; 第二种就是前面说的做GTF,然后用Bowtie/tophat/star做RNA-Seq.
: 第一种方法更加straightforward一点,不过后处理稍微麻烦一点,要仔细看一下最后
: 的结果,写一些script去filter掉一些cases,比如low quality的mapping, secondary/
: alternative alignment, 还有map在这些contig的也未必跨SV。
:
: 法?
sequence,
secondary/
【在 s******s 的大作中提到】
: 要是我做的,肯定第一个try的就是把structure variation那些做成extra的sequence,
: 然后
: BWA; 第二种就是前面说的做GTF,然后用Bowtie/tophat/star做RNA-Seq.
: 第一种方法更加straightforward一点,不过后处理稍微麻烦一点,要仔细看一下最后
: 的结果,写一些script去filter掉一些cases,比如low quality的mapping, secondary/
: alternative alignment, 还有map在这些contig的也未必跨SV。
:
: 法?
m*T
18 楼
这个建议不错,赞一个
sequence,
secondary/
【在 s******s 的大作中提到】
: 要是我做的,肯定第一个try的就是把structure variation那些做成extra的sequence,
: 然后
: BWA; 第二种就是前面说的做GTF,然后用Bowtie/tophat/star做RNA-Seq.
: 第一种方法更加straightforward一点,不过后处理稍微麻烦一点,要仔细看一下最后
: 的结果,写一些script去filter掉一些cases,比如low quality的mapping, secondary/
: alternative alignment, 还有map在这些contig的也未必跨SV。
:
: 法?
sequence,
secondary/
【在 s******s 的大作中提到】
: 要是我做的,肯定第一个try的就是把structure variation那些做成extra的sequence,
: 然后
: BWA; 第二种就是前面说的做GTF,然后用Bowtie/tophat/star做RNA-Seq.
: 第一种方法更加straightforward一点,不过后处理稍微麻烦一点,要仔细看一下最后
: 的结果,写一些script去filter掉一些cases,比如low quality的mapping, secondary/
: alternative alignment, 还有map在这些contig的也未必跨SV。
:
: 法?
e*6
20 楼
这个问题很有意思。你提的解法很有道理,不过应该命名成chr25,有些人喜欢X,Y分
别叫23,24. 但是你的方法的问题是,你必须知道突变后的序列的各种可能的排列组合
。并且,如果你用pair end测序,是不是有更好的分析办法
reference
【在 b****r 的大作中提到】
: 我知道一般NGS的结果都会先往reference genome 去做alignment
: 我关心的是recurrent translocation,断裂重接到位置相对固定,我的目的是想找到
: 手里的十万个细胞里有多少发生了这种translocation
: 用NGS的话,怎么来做比较好?直接align的话,那些跨过断裂点的可能根本align不上
: 被扔了。de novo assembly显然计算工作量大,而且如果translocation的细胞的丰度
: 低,可能直接就测不到。
: 不知道这么做难不难:就是把常见断裂并且重接的那一段突变后序列也加到reference
: genome里面,然后随便给他个命名比如chromosome 24,然后去align,有重接的序列会
: 和这一段非常吻合,就不会被扔掉了。
: 或者还有什么别的比较简单的办法吗
别叫23,24. 但是你的方法的问题是,你必须知道突变后的序列的各种可能的排列组合
。并且,如果你用pair end测序,是不是有更好的分析办法
reference
【在 b****r 的大作中提到】
: 我知道一般NGS的结果都会先往reference genome 去做alignment
: 我关心的是recurrent translocation,断裂重接到位置相对固定,我的目的是想找到
: 手里的十万个细胞里有多少发生了这种translocation
: 用NGS的话,怎么来做比较好?直接align的话,那些跨过断裂点的可能根本align不上
: 被扔了。de novo assembly显然计算工作量大,而且如果translocation的细胞的丰度
: 低,可能直接就测不到。
: 不知道这么做难不难:就是把常见断裂并且重接的那一段突变后序列也加到reference
: genome里面,然后随便给他个命名比如chromosome 24,然后去align,有重接的序列会
: 和这一段非常吻合,就不会被扔掉了。
: 或者还有什么别的比较简单的办法吗
相关阅读
能教授来了普林后才知道春闺原来如此寂寞吧 (转载)厉害:NIH SRO到系统里改reviewers打得分 (转载)Re: 20伪币求一篇Proquest论文影响“种族特征”的其实也就几个基因千老海归千万别去南大生科院!!!讨论一下:dimorphism生物人不可不知的国内外十大生命科学领军人物请教一下如果找审稿攒reviewNIH增加预算[hobite]我的操作记录综合大学开通识课,什么课程名称好一些?生物版,聊一点生物吧施一公能够获得诺贝尔奖吗?Re: Physician Assistant 微信群Re: 特大消息:枪手控制普林斯顿大学校园,美女颜教授很危险!merge 两个genome assembly files元培学院出烈士,关键时刻看千老 (转载)EB2018 San Diego老板就是你们的上帝我老公说,他的博士后老板是他的衣食父母 (转载)