Redian新闻
>
问个计算生物学问题RNAseq / motif finding
avatar
问个计算生物学问题RNAseq / motif finding# Biology - 生物学
G*1
1
RT
最近做了好几只盐水鸭送人,汤没有扔掉,就做了菠菜皮肚鸭汤粉
avatar
S*M
2
帮朋友问个问题
已做了细菌的whole genome的RNAseq
得到上千个mRNA的sequence,另外每个mRNA都得到了一个我们感兴趣的数值(scalar)
不知道有什么算法,能够在这些mRNA里寻找sequence motif,来解释这个scalar的变化
我好像听说最简单的machine learning可以用来预测binary的变量
我们感兴趣的是个连续变量,不知道有没有问题?
另外不知道是不是要把几千个mRNA先align一下(比如Transcription Starting Site对
齐)
才能进行motif finding?
问的比较外行
多谢指教!
avatar
B*n
3
哇 好吃
不过我断句断了好久哈哈
我想菠菜皮是啥东西
avatar
g*i
4
你朋友用什么方法做的sequencing?是把cDNA的小片段加上tag以后直接测序吗?如果是
这样的话,当然要先做mapping,计算每个transcript的表达量。挑选出显著变化的基因
或者是transcripts,将相应的sequence拿去做motif分析。网络上有很多工具可以做
motif分析。

【在 S*M 的大作中提到】
: 帮朋友问个问题
: 已做了细菌的whole genome的RNAseq
: 得到上千个mRNA的sequence,另外每个mRNA都得到了一个我们感兴趣的数值(scalar)
: 不知道有什么算法,能够在这些mRNA里寻找sequence motif,来解释这个scalar的变化
: 我好像听说最简单的machine learning可以用来预测binary的变量
: 我们感兴趣的是个连续变量,不知道有没有问题?
: 另外不知道是不是要把几千个mRNA先align一下(比如Transcription Starting Site对
: 齐)
: 才能进行motif finding?
: 问的比较外行

avatar
G*1
5
下回我加空格分割 :)

【在 B********n 的大作中提到】
: 哇 好吃
: 不过我断句断了好久哈哈
: 我想菠菜皮是啥东西

avatar
M*P
6
我朋友的一个软件可以干这个:
Manuscript:
http://genomebiology.com/2010/11/2/R19
Software:
http://www.genome.duke.edu/labs/ohler/research/transcription/cE

【在 S*M 的大作中提到】
: 帮朋友问个问题
: 已做了细菌的whole genome的RNAseq
: 得到上千个mRNA的sequence,另外每个mRNA都得到了一个我们感兴趣的数值(scalar)
: 不知道有什么算法,能够在这些mRNA里寻找sequence motif,来解释这个scalar的变化
: 我好像听说最简单的machine learning可以用来预测binary的变量
: 我们感兴趣的是个连续变量,不知道有没有问题?
: 另外不知道是不是要把几千个mRNA先align一下(比如Transcription Starting Site对
: 齐)
: 才能进行motif finding?
: 问的比较外行

avatar
b*t
7
皮肚是什么?

【在 G****1 的大作中提到】
: RT
: 最近做了好几只盐水鸭送人,汤没有扔掉,就做了菠菜皮肚鸭汤粉

avatar
h*c
8
Your questions is so not clear, what is "scalar"? How does it related to
sequence motif?
In general, you definitely need to align RNA-seq reads to the genome, that's
the very first step for further analysis. You also need to consider
possible mutations when searching for motifs.
avatar
s*m
9
我猜是炸猪皮?

【在 b*******t 的大作中提到】
: 皮肚是什么?
avatar
G*1
11
是炸猪皮

【在 s****m 的大作中提到】
: 我猜是炸猪皮?
avatar
S*M
12
我说的scalar(vs vector)就是对应每个transcript,都有一个实验测得的标量
现在想找到一个sequence motif来解释这个标量的变化
我们想干的好像类似预测transcription factor binding site的motif
不过后者里,sequence motif解释的因变量是discrete的

's

【在 h*********c 的大作中提到】
: Your questions is so not clear, what is "scalar"? How does it related to
: sequence motif?
: In general, you definitely need to align RNA-seq reads to the genome, that's
: the very first step for further analysis. You also need to consider
: possible mutations when searching for motifs.

avatar
j*p
13
我所知道的通过RNAseq来找motif,多数是这2种情况:
1. 两个sample,control/treat,跑两个RNAseq,找differential expressed genes
,拿到这个gene list,问,这些gene有什么共同点,例如,gene promoter有没有已知
的TF 的motif,这样可以至少给出几个candidate TF,可以接下来做故事;或者这些
gene sequence本身有什么motif(如果gene又长又多,技术上很难算,当然我遇到这种
情况较少,或者基本不work)。
2. 两个试验,一个input,一个pull down,例如做RNA methylation,RNA-RNA
interaction,等等,通常这种情况是找出RNA中某些位点,信号enrich over input (
如果没input,就是over nothing)。 问题是,这些enriched sites有没有motif(
sequence similarity)。
请问你是哪种情况,如果都不是,不知道能否把你的问题问的清楚些。

【在 S*M 的大作中提到】
: 我说的scalar(vs vector)就是对应每个transcript,都有一个实验测得的标量
: 现在想找到一个sequence motif来解释这个标量的变化
: 我们想干的好像类似预测transcription factor binding site的motif
: 不过后者里,sequence motif解释的因变量是discrete的
:
: 's

avatar
b*r
14
你的问题确实看不太懂
什么叫做whole genome的RNAseq
细菌的genome都是DNA,不是RNA
另外我认为不管是RNA 还是DNA,肯定要先align好。现在的测序平台错误都很多,如果
我是reviewer看到有人直接拿原始的测序data来往后推,肯定把这文章打回去
相关阅读
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。