Redian新闻
>
[求助]RNA-seq data怎么做broad的GSEA分析
avatar
[求助]RNA-seq data怎么做broad的GSEA分析# Biology - 生物学
t*o
1
coast to coast,穿着过去可以么?反正就是到了住hotel,面试完了就飞回来;想不
出还要带什么行李
avatar
f*g
2
今天网上从家出来 看见床上掉两块钱 本着不浪费不以物小而不为的的原则 我就吼了

妈 床上两块拿走了哈 刚喊完还没等老妈说话 我家狗一面嚎着一面就冲了过来 正纳闷
我哪招惹它了
老妈慢悠的过来说了一句 : 那是它晚上买肠的钱 。。。。。
狗也是认识rmb的 。
avatar
d*s
3
做了一个rna-seq,core给了我们一个excel file。里面有一个很长的list of gene,
每个gene有对应的pvale,logFC,和每个sample的raw read counts以及FPKM。
GSEA是用来分析microarray data,但是网站上说也可以分析RNA-seq data。研究了半
天没搞明白。
1.不知道数据格式怎么转换。
2.不懂GSEA Preranked analysis是什么,这个prerank 是必须的嘛?
3.因为是RNA-seq,怎么选chip platform?
4.怎么让我的list里的gene name对应上MsigDB里的gene name?
求大牛帮忙。先谢谢了。
avatar
m*y
4
用西服自带的套子装着,对折一下可以放进登机箱的,一般没什么问题的
也可以直接穿上省事

【在 t******o 的大作中提到】
: coast to coast,穿着过去可以么?反正就是到了住hotel,面试完了就飞回来;想不
: 出还要带什么行李

avatar
B*Z
5
不是美刀?
avatar
z*t
6
bioconductor里面应该有做RNA-seqGSEA的R包,你可以用
我的办法不一定对,用我们bioinfo的话就是do things which pre-rank is not
designed for..
不过就是用pre-rank的办法做gene set enrichment
pre-rank需要一个rank file你把differential gene按照fold change或者p val 从高
到低rank一下就可以用pre-rank跑了。platform name选gene symbol,忘了哪里一个输
入栏可以让你pick 6个大类的MisgDB gene name

【在 d***s 的大作中提到】
: 做了一个rna-seq,core给了我们一个excel file。里面有一个很长的list of gene,
: 每个gene有对应的pvale,logFC,和每个sample的raw read counts以及FPKM。
: GSEA是用来分析microarray data,但是网站上说也可以分析RNA-seq data。研究了半
: 天没搞明白。
: 1.不知道数据格式怎么转换。
: 2.不懂GSEA Preranked analysis是什么,这个prerank 是必须的嘛?
: 3.因为是RNA-seq,怎么选chip platform?
: 4.怎么让我的list里的gene name对应上MsigDB里的gene name?
: 求大牛帮忙。先谢谢了。

avatar
t*o
7
直接穿做overnight flight会皱了么?
avatar
f*g
8
从国内臭百转来的。觉得好笑,和大家分享。

【在 B*****Z 的大作中提到】
: 不是美刀?
avatar
x*d
9

1.
自己按照GSEA网站上gct的格式把你的RNA-seq改成gct格式,比如这样
#1.2
20000 6
Symbol Description WT1 WT2.。。。
ACTN1 Actin1 100 100
你可以用FPKM来做GSEA。gene symbol必须大写!因为GSEA用的gene set都是大小写敏
感,而且全是大写的。
2.不是必须的
3.不需要选,自己collapse by gene symbol,除掉duplicate,然后在GSEA界面那里吧
collapse的选项关掉
4.如果你的gene name是official gene symbol的话那就是MSigDB的gene name,个别
gene name可能不一样,这个你得自己去鉴别。实际做的话影响不大。

【在 d***s 的大作中提到】
: 做了一个rna-seq,core给了我们一个excel file。里面有一个很长的list of gene,
: 每个gene有对应的pvale,logFC,和每个sample的raw read counts以及FPKM。
: GSEA是用来分析microarray data,但是网站上说也可以分析RNA-seq data。研究了半
: 天没搞明白。
: 1.不知道数据格式怎么转换。
: 2.不懂GSEA Preranked analysis是什么,这个prerank 是必须的嘛?
: 3.因为是RNA-seq,怎么选chip platform?
: 4.怎么让我的list里的gene name对应上MsigDB里的gene name?
: 求大牛帮忙。先谢谢了。

avatar
d*t
10

如果皱了,hotel可以自己烫下

【在 t******o 的大作中提到】
: 直接穿做overnight flight会皱了么?
avatar
d*s
11
谢谢上面两位的帮忙,终于能分析了。
但是分析结果好像不是很好。
大部分的gene sets在WT里upregulated了,但是在KO里就
很少。我分析了好几个gene sets database都是这样。
不仅如此,KO组里一个能看的enrichment plot都没有。
我用的都是默认的parameter,有些parameter是不是应该改一改。
Enrichment in phenotype: WT (4 samples)
701 / 797 gene sets are upregulated in phenotype WT
0 gene sets are significant at FDR < 25%
13 gene sets are significantly enriched at nominal pvalue < 1%
36 gene sets are significantly enriched at nominal pvalue < 5%
Enrichment in phenotype: KO (4 samples)
96 / 797 gene sets are upregulated in phenotype KO
0 gene sets are significantly enriched at FDR < 25%
0 gene sets are significantly enriched at nominal pvalue < 1%
0 gene sets are significantly enriched at nominal pvalue < 5%
贴了一个enrichment plot,在所有的分析里总是zero cross at 10132,这个正常吗?
是不是靠近中间比较好一点?

【在 d***s 的大作中提到】
: 做了一个rna-seq,core给了我们一个excel file。里面有一个很长的list of gene,
: 每个gene有对应的pvale,logFC,和每个sample的raw read counts以及FPKM。
: GSEA是用来分析microarray data,但是网站上说也可以分析RNA-seq data。研究了半
: 天没搞明白。
: 1.不知道数据格式怎么转换。
: 2.不懂GSEA Preranked analysis是什么,这个prerank 是必须的嘛?
: 3.因为是RNA-seq,怎么选chip platform?
: 4.怎么让我的list里的gene name对应上MsigDB里的gene name?
: 求大牛帮忙。先谢谢了。

avatar
b*u
12
true

【在 m*********y 的大作中提到】
: 用西服自带的套子装着,对折一下可以放进登机箱的,一般没什么问题的
: 也可以直接穿上省事

avatar
d*s
13

谢谢,看了一下GSEA的youtube video,好像pre-rank以后再跑GSEA结果反而不好,和
permutation有关。

【在 z*t 的大作中提到】
: bioconductor里面应该有做RNA-seqGSEA的R包,你可以用
: 我的办法不一定对,用我们bioinfo的话就是do things which pre-rank is not
: designed for..
: 不过就是用pre-rank的办法做gene set enrichment
: pre-rank需要一个rank file你把differential gene按照fold change或者p val 从高
: 到低rank一下就可以用pre-rank跑了。platform name选gene symbol,忘了哪里一个输
: 入栏可以让你pick 6个大类的MisgDB gene name

avatar
d*s
14

谢谢提醒,不知道省了我多少时间!

【在 x*****d 的大作中提到】
:
: 1.
: 自己按照GSEA网站上gct的格式把你的RNA-seq改成gct格式,比如这样
: #1.2
: 20000 6
: Symbol Description WT1 WT2.。。。
: ACTN1 Actin1 100 100
: 你可以用FPKM来做GSEA。gene symbol必须大写!因为GSEA用的gene set都是大小写敏
: 感,而且全是大写的。
: 2.不是必须的

avatar
x*d
15

GSEA does not show directionality, so "significantly enriched in WT" could
be either positively enriched in WT or negatively enriched in WT.

【在 d***s 的大作中提到】
: 谢谢上面两位的帮忙,终于能分析了。
: 但是分析结果好像不是很好。
: 大部分的gene sets在WT里upregulated了,但是在KO里就
: 很少。我分析了好几个gene sets database都是这样。
: 不仅如此,KO组里一个能看的enrichment plot都没有。
: 我用的都是默认的parameter,有些parameter是不是应该改一改。
: Enrichment in phenotype: WT (4 samples)
: 701 / 797 gene sets are upregulated in phenotype WT
: 0 gene sets are significant at FDR < 25%
: 13 gene sets are significantly enriched at nominal pvalue < 1%

avatar
d*s
16

make sense.Thanks.
所有的gene sets 都分析了,居然一个FDR<0.25都没有。

【在 x*****d 的大作中提到】
:
: GSEA does not show directionality, so "significantly enriched in WT" could
: be either positively enriched in WT or negatively enriched in WT.

avatar
x*d
17

hallmark gene sets are very small (50 gene sets) so it is very stringent.
Try C2 CP: Canonical pathways or C5 GO Biological Process.

【在 d***s 的大作中提到】
:
: make sense.Thanks.
: 所有的gene sets 都分析了,居然一个FDR<0.25都没有。

avatar
w*o
18
应该是多重检验校正的问题吧,你把多余的gene sets去掉,着重分析你感兴趣的几个
gene sets,应该FDR会小很多。

【在 d***s 的大作中提到】
:
: make sense.Thanks.
: 所有的gene sets 都分析了,居然一个FDR<0.25都没有。

avatar
d*s
19

谢谢,看了这两个gene sets。没什么enrichment。可能就是没什么变化,或者sample
的variation太大。

【在 x*****d 的大作中提到】
:
: hallmark gene sets are very small (50 gene sets) so it is very stringent.
: Try C2 CP: Canonical pathways or C5 GO Biological Process.

avatar
d*s
20

谢谢,试了几个individual gene sets。没什么enrichment。可能就是没什么变化。

【在 w*********o 的大作中提到】
: 应该是多重检验校正的问题吧,你把多余的gene sets去掉,着重分析你感兴趣的几个
: gene sets,应该FDR会小很多。

avatar
z*o
21
GSEA 就是做出来的FDR会很大,经常没有enriched的pathway. 换换其他方法,不用不
停的试GSEA了。
avatar
d*s
22

有什么推荐的吗?

【在 z********o 的大作中提到】
: GSEA 就是做出来的FDR会很大,经常没有enriched的pathway. 换换其他方法,不用不
: 停的试GSEA了。

avatar
n*7
23
随便想到的两点点建议:
1. 用DESeq2做DE 分析,我个人比较信任这个工具
2. 用基于表达值变化的分析工具做enrichment分析。理论上说,这个比先找DE基因,
再做enrichment要先进。几年前用过pathwayExpress,现在的主流工具不知道是啥。

【在 d***s 的大作中提到】
:
: 有什么推荐的吗?

相关阅读
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。