avatar
GSEA questions# Biology - 生物学
c*1
1
1. The default “Metric for ranking genes” is “Signal2Noise”. I ran
GSEA, and used this option, and got good results. But when I go through the
manual, I found this note “The default metric for ranking genes is the
signal-to-noise ratio. To use this metric, your phenotype file must define
at least two categorical phenotypes and your expression dataset must contain
at least three (3) samples for each phenotype. If you are using a
continuous phenotype or your expression dataset contains fewer than three
samples per phenotype, you must choose a different ranking metric.” For NGS
data, we usually have two replicates, which means we cannot use Signal to
noise as metric for ranking genes. Is that true for real practice?
2. Is it better to use whole transcriptome or filtered gene list (based
on p value cutoff) as input?
avatar
c*1
2
顶一下。没人懂这个么?
avatar
f*k
3
我只是根据我自己摸索的经验来说,我发现GSEA网站给的解释让人看得都晕晕的。
1. 我主要分析自己的RNAseq数据,我最多有三个样品,control,样品1,样品2,所以
我一般都选择log2 ratio的metrics.
另外,你的replicates要merge(比如做average)以后再做input,GSEA不接受
replicates作为input,这一点在Q&A部分都有明确解释。
2. 我也有同样的疑问,我自己用filtered list作为input,但是由于filtered list基
因数目要远小于整个transcriptome的基因数目,所以就要调整minimum size, 用默认
15的时候经常是出错,我都要改到10甚至5,才能出结果。
我觉得整个transcriptome也可以作为input,因为GSEA会做样品间的互相比较和统计学
分析,filtered list反而降低了GSEA进行gene set组合的可能性。但是transciptome
里是明显的垃圾信息或者false positive的基因,我想还是先过滤掉会更好,GSEA结果
会更干净。
不过我不是这方面的专家,坐等专家解答。
avatar
c*1
4
欢迎讨论,多谢你意见。
关于样品的数目,其实最好是把 biological replicates都input。你说的把
replicates merge,其实是针对technical replicates。你可以在phenotype labels这
一栏,不同一组的replicates分到一组。网站有这段说明:
Samples. Each sample must have a unique identifier. If you have technical
replicates, you generally want to remove them by averaging or some other
data reduction technique. For example, assume you have five tumor samples
and five control samples each run three times (three replicate columns) for
a total of 30 data columns. You would average the three replicate columns
for each sample and create a dataset containing 10 data columns (five tumor
and five control).

transciptome

【在 f******k 的大作中提到】
: 我只是根据我自己摸索的经验来说,我发现GSEA网站给的解释让人看得都晕晕的。
: 1. 我主要分析自己的RNAseq数据,我最多有三个样品,control,样品1,样品2,所以
: 我一般都选择log2 ratio的metrics.
: 另外,你的replicates要merge(比如做average)以后再做input,GSEA不接受
: replicates作为input,这一点在Q&A部分都有明确解释。
: 2. 我也有同样的疑问,我自己用filtered list作为input,但是由于filtered list基
: 因数目要远小于整个transcriptome的基因数目,所以就要调整minimum size, 用默认
: 15的时候经常是出错,我都要改到10甚至5,才能出结果。
: 我觉得整个transcriptome也可以作为input,因为GSEA会做样品间的互相比较和统计学
: 分析,filtered list反而降低了GSEA进行gene set组合的可能性。但是transciptome

avatar
G*n
5
可以把replicates直接放进去,不需要先merge成mean或者average

transciptome

【在 f******k 的大作中提到】
: 我只是根据我自己摸索的经验来说,我发现GSEA网站给的解释让人看得都晕晕的。
: 1. 我主要分析自己的RNAseq数据,我最多有三个样品,control,样品1,样品2,所以
: 我一般都选择log2 ratio的metrics.
: 另外,你的replicates要merge(比如做average)以后再做input,GSEA不接受
: replicates作为input,这一点在Q&A部分都有明确解释。
: 2. 我也有同样的疑问,我自己用filtered list作为input,但是由于filtered list基
: 因数目要远小于整个transcriptome的基因数目,所以就要调整minimum size, 用默认
: 15的时候经常是出错,我都要改到10甚至5,才能出结果。
: 我觉得整个transcriptome也可以作为input,因为GSEA会做样品间的互相比较和统计学
: 分析,filtered list反而降低了GSEA进行gene set组合的可能性。但是transciptome

avatar
d*e
6
1 你首先要确保有足够的sample数量。比如你要比较2组,每组2个,一共只有4个
sample,那么GSEA不是很适合,因为误差可能很大。如果一定要做,那么用什么方法都
无所谓。不要merge sample。
2 不要filter out transcriptome,你可以选择不同定义的gene sets,就是gmt文件,
来选择你要比较的gene是transcriptome里面的。

the
contain
NGS

【在 c****1 的大作中提到】
: 1. The default “Metric for ranking genes” is “Signal2Noise”. I ran
: GSEA, and used this option, and got good results. But when I go through the
: manual, I found this note “The default metric for ranking genes is the
: signal-to-noise ratio. To use this metric, your phenotype file must define
: at least two categorical phenotypes and your expression dataset must contain
: at least three (3) samples for each phenotype. If you are using a
: continuous phenotype or your expression dataset contains fewer than three
: samples per phenotype, you must choose a different ranking metric.” For NGS
: data, we usually have two replicates, which means we cannot use Signal to
: noise as metric for ranking genes. Is that true for real practice?

相关阅读
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。