Redian新闻
>
说说自己的研究:microRNA target的预测方法的生物信息学研究
avatar
说说自己的研究:microRNA target的预测方法的生物信息学研究# Biology - 生物学
N*D
1
【 以下文字转载自 SanDiego 讨论区 】
发信人: pascaldechin (小帕), 信区: SanDiego
标 题: 完了, 余震在逐渐往北走
发信站: BBS 未名空间站 (Sun Apr 4 19:30:59 2010, 美东)
现在正在 SD 正东面的沙漠里面. 那两个小余震是最新的.
有沿断裂带北上之势.
avatar
E*T
2
microRNA target的预测方法的生物信息学研究
microRNA target的预测工作已经有块10年的历史了,最早的MIT Broad研究所的
TargetScan方法在2005年发表问世,他主要是根据target靶点和生物上的保守性来预测
。 其详细的机制下面来讲。 到后来的Upenn的DIANA-microT,主要是根据计算microRNA
和他的target mRNA的结合能来预测。期间还有其他的,比如PicTar, miRanda, PITA,
等等,大概的方法都大差不差。
大家知道microRNA首先是在一些蛋白的帮助下,比如Dicer,Ago2等,找到相对应的mRNA
target。 microRNA序列很小,大概有20bp作用,但是他们能形成一个特定的二级机构
。其中一个很重要的位置就是target 种子序列(seeds),他是大概10bp左右的序列,
专门用来结合mRNA。而且mRNA上面也有和seeds种子序列想对的序列。 对 每一种
microRNA来说,都有他们特异的seeds序列。当microRNA遇到mRNA的时候,有很多因素
可以影响他们相互结合。 一个是mRNA和microRNA的二级结构或者更高的结构。 这个容
易理解,他们必须保持好一定的姿势才能相互拥抱。 当然他们首先要match,这里所说
的match就是是他们的seed sequence要配对。 还有其他的因素,比如seed sequence旁
边的序列也影响他们结合,但是重要性要小很多。 根据以上原理,大家所用的target
预测方法都用来计算以上的影响因素。 比如说,二级结构很难看到,但是有的指标可
以来衡量他们,就是自由能。 一般保持一个好的姿势都需要很高的自由能。 这个道理
很简单,大家谈恋爱的时候,你必须时刻保持高的热情。 有专门的软件来计算(RNA
hybrid),你只要输入mRNA and microRNA sequence, 就可以来得出一个值。
还有研究发现遗传保守性可以来评价microRNA target的一个因素,大家都知道,如果
一个microRNA target sequence 很重要,当然保守性就高,从果蝇到人都有这个seed
match,就说明大差不差了。 但是生物复杂性很高,有很多的microRNA target没有保
守性这个指标。 还有研究表明mRNA 3’ 段很重要,大多时候结合位点都在这个位置。
根据以上原理,我们自己设计的算法也是考虑了以上因素。 首先以上计算的因素都已
经知道,但是还有几个问题不是很清楚。首先对一个特定的mRNA来说,microRNA大多数
情况下的有多个target结合位点,比如他们可以8bp 完全match, 7bp, 6bp也可以其作
用,到底哪个重要呢,怎么的有个加权平均吧。 我们的方法就很好的解决了这个问题
。首先我们计算了信噪比signal /noise ratio。 这个好解释: 设想一下一个8bp的
seeds 如果一个够长的mRNA序列完全随机打乱来说,也有时候能形成一个match的配对
,但是这些就是我们所说的Noise,没有多少用处,也就是所说的撞大运。 但是如果某
个基因确定是microRNA的target, 那么他们seed match的概率应该是比随机高很多。
根据这个原理,我们把实验或者文献报道确认的microRNA和他的mRNA target找出来,
看看target seed matched 序列出现的概率,然后打乱顺序,看看能出现多少个target
seed matched 序列 ,你就会发现他们不同的match,不同的seeds就有不同的信噪比
,我们就拿着这个作为一个系数来计算总的target score. 如果用公式来说明:
TargetScore = (seed match1’s score)X(its signal/ratio)+ (seed match2’s
score)X(its signal/ratio)+……..
我们还研究了mRNA不同区域的信噪比,发现确实存在差异,3’段的很高,5’,还有
coding region紧随其后。
相关文章发表在BMC bioinformatics:
Xu et al., 2014. Identifying microRNA targets in different regions. BMC
bioinformatics, 15: S4
http://www.biomedcentral.com/1471-2105/15/S7/S4
如果有问题站内联系。
说明我们有相关网站,找出来的micRNA target可能和其他的方法不太一样,这个差别
,一个原因就是各家用了不同的系数造成的。大家要多方比较,看看那个可能性大。
avatar
E*T
3
写的也比较乱,写的目的一个是觉得好玩,还有就是大家发表文章的时候,能引用我们
的文章,大家工作不容易,就算相互帮忙把。
avatar
s*a
4
两篇都是灌水的文章。还是好好读书用功吧
avatar
M*P
5
没好意思说,其实楼主还是很有勇气的。

★ 发自iPhone App: ChineseWeb 7.8

【在 s******a 的大作中提到】
: 两篇都是灌水的文章。还是好好读书用功吧
avatar
E*T
6
是呀,就是灌水的文章。
还有,我倒是觉得通俗的写出自己的研究思路也很难,特别是公式很多的,不过这两篇
正好,所以写了。还有其他的,也是灌水的,就很难写出让外行一看就懂的。
虽然是灌水,但是方法简单有效,如果能被大家应用到自己的科研上,也算不错。
多联系。

【在 s******a 的大作中提到】
: 两篇都是灌水的文章。还是好好读书用功吧
avatar
c*3
7
你要是自己都说是灌水的了,还指望别人用啊?
就用户体验来讲,你这个完全比不上DianaMicroT,TargetScan
3楼话糙理不糙。要是phd在读的话,踏踏实实做点事儿吧,灌水的东西有2篇成了,多
了就不是好事儿了

【在 E******T 的大作中提到】
: 是呀,就是灌水的文章。
: 还有,我倒是觉得通俗的写出自己的研究思路也很难,特别是公式很多的,不过这两篇
: 正好,所以写了。还有其他的,也是灌水的,就很难写出让外行一看就懂的。
: 虽然是灌水,但是方法简单有效,如果能被大家应用到自己的科研上,也算不错。
: 多联系。

avatar
E*T
8
多谢批评,不过做方法的,大部分都是炮灰,看看microRNA预测,大概有20种了,也就
是Diana, and targetScan。
做生物相关的,太基础了,找不到工作,片应用就是灌水。

【在 c***3 的大作中提到】
: 你要是自己都说是灌水的了,还指望别人用啊?
: 就用户体验来讲,你这个完全比不上DianaMicroT,TargetScan
: 3楼话糙理不糙。要是phd在读的话,踏踏实实做点事儿吧,灌水的东西有2篇成了,多
: 了就不是好事儿了

avatar
c*3
9
你想弄引用,就去写review,或者做工具比较
别做这种工具,尤其是已经一大堆的
avatar
E*T
10
我这也是没有办法,力不从心呀。
不过看着我码字的份上,大家引用的时候就捎带上我们吧,有谁做microRNA的跟我说一
声。

【在 c***3 的大作中提到】
: 你想弄引用,就去写review,或者做工具比较
: 别做这种工具,尤其是已经一大堆的

avatar
h*n
11
说实话, 预测miRNA -- mRNA 这事吧, 准确性其实不太重要, 重要的是不要遗漏就可以
了.
因为预测的结果要验证, 然后根据具体研究领域选几个target来深挖. 而且不同组织不
同细胞类型都差很多, 所以还得靠实验.
avatar
E*T
12
你的这个问题很好,我们有相关文章在发表。

【在 h********n 的大作中提到】
: 说实话, 预测miRNA -- mRNA 这事吧, 准确性其实不太重要, 重要的是不要遗漏就可以
: 了.
: 因为预测的结果要验证, 然后根据具体研究领域选几个target来深挖. 而且不同组织不
: 同细胞类型都差很多, 所以还得靠实验.

avatar
r*e
13
你们这些人也太mean了。哪怕人家灌水,勇于说说自己的research也应该被鼓励
但是我对于miRNA的所谓bioinformatics预测是不抱有任何希望的。还是要做实验

microRNA
mRNA

【在 E******T 的大作中提到】
: microRNA target的预测方法的生物信息学研究
: microRNA target的预测工作已经有块10年的历史了,最早的MIT Broad研究所的
: TargetScan方法在2005年发表问世,他主要是根据target靶点和生物上的保守性来预测
: 。 其详细的机制下面来讲。 到后来的Upenn的DIANA-microT,主要是根据计算microRNA
: 和他的target mRNA的结合能来预测。期间还有其他的,比如PicTar, miRanda, PITA,
: 等等,大概的方法都大差不差。
: 大家知道microRNA首先是在一些蛋白的帮助下,比如Dicer,Ago2等,找到相对应的mRNA
: target。 microRNA序列很小,大概有20bp作用,但是他们能形成一个特定的二级机构
: 。其中一个很重要的位置就是target 种子序列(seeds),他是大概10bp左右的序列,
: 专门用来结合mRNA。而且mRNA上面也有和seeds种子序列想对的序列。 对 每一种

avatar
n*7
14
几年前做过这个东西
说实话,一般组发这种东西就是灌水,别人也不会用的
做bioinfo都知道,想claim自己方法有什么优点还是很容易的
基本原则是,除非你有很明确的理由,否则用这个领域最popular的工具
看这你码字的份上,把自己project坑了,不划算啊
没核心技术的话,还不如做database引用好搞

【在 E******T 的大作中提到】
: 我这也是没有办法,力不从心呀。
: 不过看着我码字的份上,大家引用的时候就捎带上我们吧,有谁做microRNA的跟我说一
: 声。

avatar
j*x
15
多数时候,还是需要bioinformatics给一些提示或方向,或者划定一个范围,才有实验
验证的可能,否则只能是大海捞针,如果对bioinformatics的预测不抱任何希望的话,
很多miRNA的研究就根本没有希望。
和Broad Institute的相关人士交流过,事实上单纯的supervised miRNA target
prediction,他们可以做到准确率50%左右,简单说就是,给出一个miRNA,预测出2个
target candidate,至少有一个可以被实验验证。如果是给出一个miRNA和一个mRNA,
预测是否有targeting及其interaction site,那么准确性应该更高。
这其实和我个人的经验比较吻合。做过两次new miRNA target prediction,一次给了2
个candidate一次给了3个,最终都有一个能被验证为真靶点。当然,实际投入的精力也
比较多,远不是跑个TargetScan或者什么其他的软件选个top3 hits那么简单。不过也
可能是我运气比较好,呵呵。

【在 r**********e 的大作中提到】
: 你们这些人也太mean了。哪怕人家灌水,勇于说说自己的research也应该被鼓励
: 但是我对于miRNA的所谓bioinformatics预测是不抱有任何希望的。还是要做实验
:
: microRNA
: mRNA

avatar
r*e
16
请问您是用什么软件?我个人的经验好像microRNA target预测准确率比较高的还是3‘
UTR区域。但我个人关注点都在intron。我觉得intron区域的预测很糟糕。当然我可能
有偏见。所以求赐教!

2

【在 j****x 的大作中提到】
: 多数时候,还是需要bioinformatics给一些提示或方向,或者划定一个范围,才有实验
: 验证的可能,否则只能是大海捞针,如果对bioinformatics的预测不抱任何希望的话,
: 很多miRNA的研究就根本没有希望。
: 和Broad Institute的相关人士交流过,事实上单纯的supervised miRNA target
: prediction,他们可以做到准确率50%左右,简单说就是,给出一个miRNA,预测出2个
: target candidate,至少有一个可以被实验验证。如果是给出一个miRNA和一个mRNA,
: 预测是否有targeting及其interaction site,那么准确性应该更高。
: 这其实和我个人的经验比较吻合。做过两次new miRNA target prediction,一次给了2
: 个candidate一次给了3个,最终都有一个能被验证为真靶点。当然,实际投入的精力也
: 比较多,远不是跑个TargetScan或者什么其他的软件选个top3 hits那么简单。不过也

avatar
h*n
17
我发过两篇miRNA in lung cancer的文章, 觉得用组织切片做IHC很重要, 可以知道这
种miRNA在那个细胞类型里面多或者少, 然后机理的研究才有意义.

【在 E******T 的大作中提到】
: 你的这个问题很好,我们有相关文章在发表。
avatar
E*T
18

我们的研究也表明了这一点,信噪比最好的地方在3‘UTR

【在 r**********e 的大作中提到】
: 请问您是用什么软件?我个人的经验好像microRNA target预测准确率比较高的还是3‘
: UTR区域。但我个人关注点都在intron。我觉得intron区域的预测很糟糕。当然我可能
: 有偏见。所以求赐教!
:
: 2

avatar
E*T
19
都是生物信息学的方法,就是结合mRNA,and miRNA的表达,做的是方法学的文章,只是
用了这两种数据。

【在 h********n 的大作中提到】
: 我发过两篇miRNA in lung cancer的文章, 觉得用组织切片做IHC很重要, 可以知道这
: 种miRNA在那个细胞类型里面多或者少, 然后机理的研究才有意义.

avatar
n*7
20

你这个不叫准确率,叫precision
如果是给出一个miRNA和一个mRNA,
这个才是准确率
2
最好几个软件一起做,在取结果比较可靠

【在 j****x 的大作中提到】
: 多数时候,还是需要bioinformatics给一些提示或方向,或者划定一个范围,才有实验
: 验证的可能,否则只能是大海捞针,如果对bioinformatics的预测不抱任何希望的话,
: 很多miRNA的研究就根本没有希望。
: 和Broad Institute的相关人士交流过,事实上单纯的supervised miRNA target
: prediction,他们可以做到准确率50%左右,简单说就是,给出一个miRNA,预测出2个
: target candidate,至少有一个可以被实验验证。如果是给出一个miRNA和一个mRNA,
: 预测是否有targeting及其interaction site,那么准确性应该更高。
: 这其实和我个人的经验比较吻合。做过两次new miRNA target prediction,一次给了2
: 个candidate一次给了3个,最终都有一个能被验证为真靶点。当然,实际投入的精力也
: 比较多,远不是跑个TargetScan或者什么其他的软件选个top3 hits那么简单。不过也

avatar
j*x
21
我不是太在行这些词的中文翻译,谢谢提醒。
几个软件一起做再取交集,听起来很美,实际用起来效果非常有限(个人经验),个人
感觉意义不大。

【在 n******7 的大作中提到】
:
: 你这个不叫准确率,叫precision
: 如果是给出一个miRNA和一个mRNA,
: 这个才是准确率
: 2
: 最好几个软件一起做,在取结果比较可靠

avatar
j*x
22
你关注的是intron区?我有点糊涂,miRNA默认是靶向细胞质中的成熟mRNA吧,这里应
该没intron什么事,还是你在考虑某种特殊的情形?

【在 r**********e 的大作中提到】
: 请问您是用什么软件?我个人的经验好像microRNA target预测准确率比较高的还是3‘
: UTR区域。但我个人关注点都在intron。我觉得intron区域的预测很糟糕。当然我可能
: 有偏见。所以求赐教!
:
: 2

avatar
E*T
23
有的miRNA的target可能在intron,这是不知道功能。

【在 j****x 的大作中提到】
: 你关注的是intron区?我有点糊涂,miRNA默认是靶向细胞质中的成熟mRNA吧,这里应
: 该没intron什么事,还是你在考虑某种特殊的情形?

相关阅读
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。