Redian新闻
>
devono DNA motif finding 的意义
avatar
devono DNA motif finding 的意义# Biology - 生物学
k*g
1
本人做bioinformatics,在帮人分析非transcription factor的ChIP-seq数据,对
literature中的一些分析非常不解,想请教一下。谢谢!
很多descriptive的paper会以如下方式做DNA motif分析
先在一堆candidate region比如ChIP-seq peak,里做devono motif finding,得到几个
motif sequence,比如说甲
然后比较甲和已知的transcription factor 的motif,说甲长得像A,B,C,D,....
最后写一些和transcription factor A B C D ... 相关的story
如果最后目的是知道有哪些transcription factor在那里的话,为什么不直接 在
candidate regions 里 search 已知的 motif A B C D,略过denovo motif finding的
步骤呢?个人感觉加了这一步会lose information。直接search的话可以找到更多,而
且容易做enrichment test。
avatar
R*n
2
从文章角度,你说的基本是现在story telling的八股文。
从生物角度, ABCD单一或combination在不同的过程中起的作用还未知,即便是有
reasonable的解释,也是一个复杂过程中的一个snapshot.TF binding可以是transient
也可以是相对stable。

【在 k********g 的大作中提到】
: 本人做bioinformatics,在帮人分析非transcription factor的ChIP-seq数据,对
: literature中的一些分析非常不解,想请教一下。谢谢!
: 很多descriptive的paper会以如下方式做DNA motif分析
: 先在一堆candidate region比如ChIP-seq peak,里做devono motif finding,得到几个
: motif sequence,比如说甲
: 然后比较甲和已知的transcription factor 的motif,说甲长得像A,B,C,D,....
: 最后写一些和transcription factor A B C D ... 相关的story
: 如果最后目的是知道有哪些transcription factor在那里的话,为什么不直接 在
: candidate regions 里 search 已知的 motif A B C D,略过denovo motif finding的
: 步骤呢?个人感觉加了这一步会lose information。直接search的话可以找到更多,而

avatar
y*1
3
你说的motif prediction使用以下两种都是可行的方法。
A)已知的transcription factor binding sites,例如jaspar+FIMO
B) de novo motif finding,例如MEME
不过A)已知的binding sites信息量不是很大,像是Jaspar里,比较可信的也就是8-900
个左右。而使用B) de novo,虽然很comprehensive,但是也有很多限制的因素。例如
motif size的选择,或者找到motif后,也不知道是哪个transcription factor。
这些motif prediction都是对之后的实验有一定的指导作用。例如如果你做一个TF KO
的chipseq,如果你在peak中没有看到这个TFBS的enrichment,那一般来说实验肯定有
问题。不过因为这些都是纯序列的prediction,真正的信息量有限,不建议over
interpret。那些指着TFBS prediction直接发文章的,通常结果也不太可信。

【在 k********g 的大作中提到】
: 本人做bioinformatics,在帮人分析非transcription factor的ChIP-seq数据,对
: literature中的一些分析非常不解,想请教一下。谢谢!
: 很多descriptive的paper会以如下方式做DNA motif分析
: 先在一堆candidate region比如ChIP-seq peak,里做devono motif finding,得到几个
: motif sequence,比如说甲
: 然后比较甲和已知的transcription factor 的motif,说甲长得像A,B,C,D,....
: 最后写一些和transcription factor A B C D ... 相关的story
: 如果最后目的是知道有哪些transcription factor在那里的话,为什么不直接 在
: candidate regions 里 search 已知的 motif A B C D,略过denovo motif finding的
: 步骤呢?个人感觉加了这一步会lose information。直接search的话可以找到更多,而

avatar
k*g
4
多谢解释!

transient

【在 R****n 的大作中提到】
: 从文章角度,你说的基本是现在story telling的八股文。
: 从生物角度, ABCD单一或combination在不同的过程中起的作用还未知,即便是有
: reasonable的解释,也是一个复杂过程中的一个snapshot.TF binding可以是transient
: 也可以是相对stable。

avatar
k*g
5
多谢解释!
我是统计出身,没太懂您说的对后续实验的指导意义,可以再解释一下吗?
这个project是做老鼠,还剩了一点material,不够做chip-seq。如果发现有有趣的
motif在某些target region里,有什么实验方法去validate少量的target吗?谢谢。
ps,有关tfbs prediction,作为statistician,我也觉得非常不靠谱。

900
KO

【在 y*******1 的大作中提到】
: 你说的motif prediction使用以下两种都是可行的方法。
: A)已知的transcription factor binding sites,例如jaspar+FIMO
: B) de novo motif finding,例如MEME
: 不过A)已知的binding sites信息量不是很大,像是Jaspar里,比较可信的也就是8-900
: 个左右。而使用B) de novo,虽然很comprehensive,但是也有很多限制的因素。例如
: motif size的选择,或者找到motif后,也不知道是哪个transcription factor。
: 这些motif prediction都是对之后的实验有一定的指导作用。例如如果你做一个TF KO
: 的chipseq,如果你在peak中没有看到这个TFBS的enrichment,那一般来说实验肯定有
: 问题。不过因为这些都是纯序列的prediction,真正的信息量有限,不建议over
: interpret。那些指着TFBS prediction直接发文章的,通常结果也不太可信。

avatar
y*1
6
可以试试ChIP-PCR去validate
相关阅读
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。