S*M
2 楼
帮朋友问个问题
已做了细菌的whole genome的RNAseq
得到上千个mRNA的sequence,另外每个mRNA都得到了一个我们感兴趣的数值(scalar)
不知道有什么算法,能够在这些mRNA里寻找sequence motif,来解释这个scalar的变化
我好像听说最简单的machine learning可以用来预测binary的变量
我们感兴趣的是个连续变量,不知道有没有问题?
另外不知道是不是要把几千个mRNA先align一下(比如Transcription Starting Site对
齐)
才能进行motif finding?
问的比较外行
多谢指教!
已做了细菌的whole genome的RNAseq
得到上千个mRNA的sequence,另外每个mRNA都得到了一个我们感兴趣的数值(scalar)
不知道有什么算法,能够在这些mRNA里寻找sequence motif,来解释这个scalar的变化
我好像听说最简单的machine learning可以用来预测binary的变量
我们感兴趣的是个连续变量,不知道有没有问题?
另外不知道是不是要把几千个mRNA先align一下(比如Transcription Starting Site对
齐)
才能进行motif finding?
问的比较外行
多谢指教!
B*n
3 楼
哇 好吃
不过我断句断了好久哈哈
我想菠菜皮是啥东西
不过我断句断了好久哈哈
我想菠菜皮是啥东西
g*i
4 楼
你朋友用什么方法做的sequencing?是把cDNA的小片段加上tag以后直接测序吗?如果是
这样的话,当然要先做mapping,计算每个transcript的表达量。挑选出显著变化的基因
或者是transcripts,将相应的sequence拿去做motif分析。网络上有很多工具可以做
motif分析。
【在 S*M 的大作中提到】
: 帮朋友问个问题
: 已做了细菌的whole genome的RNAseq
: 得到上千个mRNA的sequence,另外每个mRNA都得到了一个我们感兴趣的数值(scalar)
: 不知道有什么算法,能够在这些mRNA里寻找sequence motif,来解释这个scalar的变化
: 我好像听说最简单的machine learning可以用来预测binary的变量
: 我们感兴趣的是个连续变量,不知道有没有问题?
: 另外不知道是不是要把几千个mRNA先align一下(比如Transcription Starting Site对
: 齐)
: 才能进行motif finding?
: 问的比较外行
这样的话,当然要先做mapping,计算每个transcript的表达量。挑选出显著变化的基因
或者是transcripts,将相应的sequence拿去做motif分析。网络上有很多工具可以做
motif分析。
【在 S*M 的大作中提到】
: 帮朋友问个问题
: 已做了细菌的whole genome的RNAseq
: 得到上千个mRNA的sequence,另外每个mRNA都得到了一个我们感兴趣的数值(scalar)
: 不知道有什么算法,能够在这些mRNA里寻找sequence motif,来解释这个scalar的变化
: 我好像听说最简单的machine learning可以用来预测binary的变量
: 我们感兴趣的是个连续变量,不知道有没有问题?
: 另外不知道是不是要把几千个mRNA先align一下(比如Transcription Starting Site对
: 齐)
: 才能进行motif finding?
: 问的比较外行
M*P
6 楼
我朋友的一个软件可以干这个:
Manuscript:
http://genomebiology.com/2010/11/2/R19
Software:
http://www.genome.duke.edu/labs/ohler/research/transcription/cE
【在 S*M 的大作中提到】
: 帮朋友问个问题
: 已做了细菌的whole genome的RNAseq
: 得到上千个mRNA的sequence,另外每个mRNA都得到了一个我们感兴趣的数值(scalar)
: 不知道有什么算法,能够在这些mRNA里寻找sequence motif,来解释这个scalar的变化
: 我好像听说最简单的machine learning可以用来预测binary的变量
: 我们感兴趣的是个连续变量,不知道有没有问题?
: 另外不知道是不是要把几千个mRNA先align一下(比如Transcription Starting Site对
: 齐)
: 才能进行motif finding?
: 问的比较外行
Manuscript:
http://genomebiology.com/2010/11/2/R19
Software:
http://www.genome.duke.edu/labs/ohler/research/transcription/cE
【在 S*M 的大作中提到】
: 帮朋友问个问题
: 已做了细菌的whole genome的RNAseq
: 得到上千个mRNA的sequence,另外每个mRNA都得到了一个我们感兴趣的数值(scalar)
: 不知道有什么算法,能够在这些mRNA里寻找sequence motif,来解释这个scalar的变化
: 我好像听说最简单的machine learning可以用来预测binary的变量
: 我们感兴趣的是个连续变量,不知道有没有问题?
: 另外不知道是不是要把几千个mRNA先align一下(比如Transcription Starting Site对
: 齐)
: 才能进行motif finding?
: 问的比较外行
h*c
8 楼
Your questions is so not clear, what is "scalar"? How does it related to
sequence motif?
In general, you definitely need to align RNA-seq reads to the genome, that's
the very first step for further analysis. You also need to consider
possible mutations when searching for motifs.
sequence motif?
In general, you definitely need to align RNA-seq reads to the genome, that's
the very first step for further analysis. You also need to consider
possible mutations when searching for motifs.
S*M
10 楼
谢谢
【在 M*P 的大作中提到】
: 我朋友的一个软件可以干这个:
: Manuscript:
: http://genomebiology.com/2010/11/2/R19
: Software:
: http://www.genome.duke.edu/labs/ohler/research/transcription/cE
【在 M*P 的大作中提到】
: 我朋友的一个软件可以干这个:
: Manuscript:
: http://genomebiology.com/2010/11/2/R19
: Software:
: http://www.genome.duke.edu/labs/ohler/research/transcription/cE
S*M
12 楼
我说的scalar(vs vector)就是对应每个transcript,都有一个实验测得的标量
现在想找到一个sequence motif来解释这个标量的变化
我们想干的好像类似预测transcription factor binding site的motif
不过后者里,sequence motif解释的因变量是discrete的
's
【在 h*********c 的大作中提到】
: Your questions is so not clear, what is "scalar"? How does it related to
: sequence motif?
: In general, you definitely need to align RNA-seq reads to the genome, that's
: the very first step for further analysis. You also need to consider
: possible mutations when searching for motifs.
现在想找到一个sequence motif来解释这个标量的变化
我们想干的好像类似预测transcription factor binding site的motif
不过后者里,sequence motif解释的因变量是discrete的
's
【在 h*********c 的大作中提到】
: Your questions is so not clear, what is "scalar"? How does it related to
: sequence motif?
: In general, you definitely need to align RNA-seq reads to the genome, that's
: the very first step for further analysis. You also need to consider
: possible mutations when searching for motifs.
j*p
13 楼
我所知道的通过RNAseq来找motif,多数是这2种情况:
1. 两个sample,control/treat,跑两个RNAseq,找differential expressed genes
,拿到这个gene list,问,这些gene有什么共同点,例如,gene promoter有没有已知
的TF 的motif,这样可以至少给出几个candidate TF,可以接下来做故事;或者这些
gene sequence本身有什么motif(如果gene又长又多,技术上很难算,当然我遇到这种
情况较少,或者基本不work)。
2. 两个试验,一个input,一个pull down,例如做RNA methylation,RNA-RNA
interaction,等等,通常这种情况是找出RNA中某些位点,信号enrich over input (
如果没input,就是over nothing)。 问题是,这些enriched sites有没有motif(
sequence similarity)。
请问你是哪种情况,如果都不是,不知道能否把你的问题问的清楚些。
【在 S*M 的大作中提到】
: 我说的scalar(vs vector)就是对应每个transcript,都有一个实验测得的标量
: 现在想找到一个sequence motif来解释这个标量的变化
: 我们想干的好像类似预测transcription factor binding site的motif
: 不过后者里,sequence motif解释的因变量是discrete的
:
: 's
1. 两个sample,control/treat,跑两个RNAseq,找differential expressed genes
,拿到这个gene list,问,这些gene有什么共同点,例如,gene promoter有没有已知
的TF 的motif,这样可以至少给出几个candidate TF,可以接下来做故事;或者这些
gene sequence本身有什么motif(如果gene又长又多,技术上很难算,当然我遇到这种
情况较少,或者基本不work)。
2. 两个试验,一个input,一个pull down,例如做RNA methylation,RNA-RNA
interaction,等等,通常这种情况是找出RNA中某些位点,信号enrich over input (
如果没input,就是over nothing)。 问题是,这些enriched sites有没有motif(
sequence similarity)。
请问你是哪种情况,如果都不是,不知道能否把你的问题问的清楚些。
【在 S*M 的大作中提到】
: 我说的scalar(vs vector)就是对应每个transcript,都有一个实验测得的标量
: 现在想找到一个sequence motif来解释这个标量的变化
: 我们想干的好像类似预测transcription factor binding site的motif
: 不过后者里,sequence motif解释的因变量是discrete的
:
: 's
b*r
14 楼
你的问题确实看不太懂
什么叫做whole genome的RNAseq
细菌的genome都是DNA,不是RNA
另外我认为不管是RNA 还是DNA,肯定要先align好。现在的测序平台错误都很多,如果
我是reviewer看到有人直接拿原始的测序data来往后推,肯定把这文章打回去
什么叫做whole genome的RNAseq
细菌的genome都是DNA,不是RNA
另外我认为不管是RNA 还是DNA,肯定要先align好。现在的测序平台错误都很多,如果
我是reviewer看到有人直接拿原始的测序data来往后推,肯定把这文章打回去
相关阅读
求推荐微生物实验室Cell到底是个什么地位的期刊?skype 面试前 PI 要research proposal 是什么意思?文献求助从苏联的前车之鉴看我国重返诺贝尔奖之路北极熊真的不怕火?求下载书籍 1包子Trump proposes to cut NIH funding by $1.2bn this year感叹生物科技最近进步更快国内测序价格怎么比美国还贵?庆祝韩副主席自然论文发表一周年what is FP + FN求问出国读博的选择问题有去AACR的么AACR这样的会无聊不call for reviewers (转载)how to insert svg into powerpoint 2013?仇子龙又要发大文章了转 食物短缺的时候五次大灭绝事件