Redian新闻
>
ChIPseq想专门看重复区域能实现吗
avatar
ChIPseq想专门看重复区域能实现吗# Biology - 生物学
y*n
1
I am a CS senior at top20 CS department in US who is looking for a Microsoft
FT Software Engineer referral.
I am currently holding a SE FT offer from B company and will be having
onsite interview with Amazon next Wed, I have several interview experience
with Google, FB and Linkedin(all get rejected).
I have applied MSFT for two times but still haven't get a chance to have an
interview with Microsoft.
Can someone help me to get an interview? If you want my resume please
contact me at xiayuan0623 at gmail
Thanks a lot.
avatar
j*g
2
如果target是通过结合基因组上的重复区域发挥作用。
做alignment的时候,想专门看repetitive区域,怎么做到;bowtie或者BWA怎么设置。
一般情况都是把重复区域过滤掉了吧?
avatar
z*e
3
所谓的repetitive区域其实也还是会有多态性,所以还是会有uniquely mapped reads
。建议直接默认设置做就是了。先做出一个结果,再调整参数。

【在 j*********g 的大作中提到】
: 如果target是通过结合基因组上的重复区域发挥作用。
: 做alignment的时候,想专门看repetitive区域,怎么做到;bowtie或者BWA怎么设置。
: 一般情况都是把重复区域过滤掉了吧?

avatar
j*g
4
这样大量过滤掉了 ,按默认设置没看到多少repetitive regions,特别是SINEs

:所谓的repetitive区域其实也还是会有多态性,所以还是会有uniquely mapped
reads
:。建议直接默认设置做就是了。先做出一个结果,再调整参数。

【在 z*****e 的大作中提到】
: 所谓的repetitive区域其实也还是会有多态性,所以还是会有uniquely mapped reads
: 。建议直接默认设置做就是了。先做出一个结果,再调整参数。

avatar
z*e
5
按默认设置没看到多少repetitive regions。你具体是怎么统计的,能说下不?
avatar
y*1
6
对repetitive region的研究是ChIP-Seq技术上的瓶颈,或者说是ChIP本身的瓶颈,暂
时可能无法克服。在ChIP的时候sonication后基本上DNA应该平均300bp左右,但是人类
基因组很多repeat都远比这个长,所以从ChIP的角度resolution根本不够。
另外如果从测序的角度来说,除非用MiSeq,read长度300+可能还好一些,能提高一些
mappability。所谓的pair-end 100bp根本对repeat研究没有什么太大的帮助。对绝大
多数alignment软件来说,100+100并不等于200.
最后就是有一些in silico methods,例如跟RSEM类似的CSEM可以使用EM来map ChIP-
seq reads,但是效果并不是很好。
repeat研究任重道远,但是估计研究来研究去,其实还是一堆junk DNA :D
avatar
l*k
7
像Alu刚好300bp,pair-end seq是不是能看到了?


: 对repetitive region的研究是ChIP-Seq技术上的瓶颈,或者说是ChIP本身的瓶
颈,暂

: 时可能无法克服。在ChIP的时候sonication后基本上DNA应该平均300bp左右,但
是人类

: 基因组很多repeat都远比这个长,所以从ChIP的角度resolution根本不够。

: 另外如果从测序的角度来说,除非用MiSeq,read长度300 可能还好一些,能提
高一些

: mappability。所谓的pair-end 100bp根本对repeat研究没有什么太大的帮助。
对绝大

: 多数alignment软件来说,100 100并不等于200.

: 最后就是有一些in silico methods,例如跟RSEM类似的CSEM可以使用EM来map
ChIP-

: seq reads,但是效果并不是很好。

: repeat研究任重道远,但是估计研究来研究去,其实还是一堆junk DNA :D



【在 y*******1 的大作中提到】
: 对repetitive region的研究是ChIP-Seq技术上的瓶颈,或者说是ChIP本身的瓶颈,暂
: 时可能无法克服。在ChIP的时候sonication后基本上DNA应该平均300bp左右,但是人类
: 基因组很多repeat都远比这个长,所以从ChIP的角度resolution根本不够。
: 另外如果从测序的角度来说,除非用MiSeq,read长度300+可能还好一些,能提高一些
: mappability。所谓的pair-end 100bp根本对repeat研究没有什么太大的帮助。对绝大
: 多数alignment软件来说,100+100并不等于200.
: 最后就是有一些in silico methods,例如跟RSEM类似的CSEM可以使用EM来map ChIP-
: seq reads,但是效果并不是很好。
: repeat研究任重道远,但是估计研究来研究去,其实还是一堆junk DNA :D

avatar
y*1
8
如果这个repeat是300bp,而测序用的100x2 PE
那可能align之后,default的输出结果可能有几种情况
1)两个read都在repeat区域,那每个read都会输出排名靠前的几个alignment,无法确
认具体是genome里哪个repeat
2)其中一个read能map到repeat边缘的unique区域,那么这个read能输出unique
alignment。另外一个read输出排名靠前的几个alignment,这个可以通过自己写的小脚
本只选择离unique mapped read最近的那个alignment。
3)两个read都是map到unique区域,这个就没有问题了。
根据上面的几种情况,虽然能得到一些uniquely mapped的read,但是也只是这个
repeat附近ChIP的部分信息,还是不能准确估算ChIP的信号强弱。

【在 l**k 的大作中提到】
: 像Alu刚好300bp,pair-end seq是不是能看到了?
:
:
: 对repetitive region的研究是ChIP-Seq技术上的瓶颈,或者说是ChIP本身的瓶
: 颈,暂
:
: 时可能无法克服。在ChIP的时候sonication后基本上DNA应该平均300bp左右,但
: 是人类
:
: 基因组很多repeat都远比这个长,所以从ChIP的角度resolution根本不够。
:
: 另外如果从测序的角度来说,除非用MiSeq,read长度300 可能还好一些,能提
: 高一些
:
: mappability。所谓的pair-end 100bp根本对repeat研究没有什么太大的帮助。

avatar
l*k
9
Alu属于sine,是散在重复序列,如果片段长度也是300,刚好落在一个元件内部的概率
很低吧,也就是情况2比较多,还是能得到一些信息的。


: 如果这个repeat是300bp,而测序用的100x2 PE

: 那可能align之后,default的输出结果可能有几种情况

: 1)两个read都在repeat区域,那每个read都会输出排名靠前的几个alignment,
无法确

: 认具体是genome里哪个repeat

: 2)其中一个read能map到repeat边缘的unique区域,那么这个read能输出unique

: alignment。另外一个read输出排名靠前的几个alignment,这个可以通过自己写
的小脚

: 本只选择离unique mapped read最近的那个alignment。

: 3)两个read都是map到unique区域,这个就没有问题了。

: 根据上面的几种情况,虽然能得到一些uniquely mapped的read,但是也只是这个

: repeat附近ChIP的部分信息,还是不能准确估算ChIP的信号强弱。



【在 y*******1 的大作中提到】
: 如果这个repeat是300bp,而测序用的100x2 PE
: 那可能align之后,default的输出结果可能有几种情况
: 1)两个read都在repeat区域,那每个read都会输出排名靠前的几个alignment,无法确
: 认具体是genome里哪个repeat
: 2)其中一个read能map到repeat边缘的unique区域,那么这个read能输出unique
: alignment。另外一个read输出排名靠前的几个alignment,这个可以通过自己写的小脚
: 本只选择离unique mapped read最近的那个alignment。
: 3)两个read都是map到unique区域,这个就没有问题了。
: 根据上面的几种情况,虽然能得到一些uniquely mapped的read,但是也只是这个
: repeat附近ChIP的部分信息,还是不能准确估算ChIP的信号强弱。

avatar
z*e
10
再加上shift的话,还是可以考察的。楼主不出来了,楼主在断定不能考察的时候是否
考虑shift的因素了。
[在 lxzk (流浪) 的大作中提到:]
:Alu属于sine,是散在重复序列,如果片段长度也是300,刚好落在一个元件内部的概
率很低吧,也就是情况2比较多,还是能得到一些信息的。
:<br>: 如果这个repeat是300bp,而测序用的100x2 PE
:<br>: 那可能align之后,default的输出结果可能有几种情况
:<br>: 1)两个read都在repeat区域,那每个read都会输出排名靠前的几个
alignment,无法确
:<br>: 认具体是genome里哪个repeat
:<br>: 2)其中一个read能map到repeat边缘的unique区域,那么这个read能
输出unique
:<br>: alignment。另外一个read输出排名靠前的几个alignment,这个可以
通过自己写的小脚
:<br>: 本只选择离unique mapped read最近的那个alignment。
:<br>: 3)两个read都是map到unique区域,这个就没有问题了。
:<br>: 根据上面的几种情况,虽然能得到一些uniquely mapped的read,但是
也只是这个
:..........
avatar
i*0
11
求教各位大神,RNA-seq里面如何看这些重复序列的转录本的丰都?
avatar
y*1
12
如果是RNASeq可以用RSEM来map multi-reads
或者使用alignment free method,直接count相似的序列的数量

【在 i*********0 的大作中提到】
: 求教各位大神,RNA-seq里面如何看这些重复序列的转录本的丰都?
相关阅读
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。