生信和数据挖掘必备:一款超好用的基因组分析工具网站!
目前,很多科研工作者热衷于做肿瘤研究,利用生物信息学和数据挖掘方法,如GEO,TCGA等,做到不用做实验,也能发SCI文章。
本文介绍一款适用于肿瘤基因组分析的在线网站:GSCALite
(链接:http://bioinfo.life. hust.edu.cn/web/GSCALite/)
GSCALite是一个肿瘤基因组分析平台,该平台整合了来自TCGA库的33种肿瘤类型的基因组数据,GDSC,CTRP的药物反应数据,以及来自GTEX的正常组织数据,用于统一的数据分析流程中的基因组分析。待分析完成后,数据和结果的可以从官网直接下载。
该工具网站是华中科技大学生命科学学院的郭安源团队开发的,用于基因组癌症分析,相关介绍发表在《Bioinformatics》杂志上。
图片来源于《Bioinformatics》官网
图片来源于网站
2)SNV:统计学,分布,类型及其生存意义
3)CNV:杂合/纯合 CNV缺失/扩增的统计资料
4)甲基化:甲基化影响生存和表达
5)肿瘤通路活性:10种癌症通路的活性
6)miRNA网络:通过miRNA的基因调控网络
7)药物分析:表达与药物敏感性的相关(IC50)
8)GTEx: 基因在正常组织和eQTL的表达。
本文以RAS家族基因为例,来分享一下该网站的功能。
在框中输入想要研究的基因,注意至少输入5个基因,否则无法输出结果。点击TCGA库中的肿瘤或组织类型,以及右侧分析类型。在下方会显示所选的基因总个数,有效和无效个数,并可以导出数据。
图片来源与官网
接下来,点击“Start Gene Set Analysis”按钮,查看分析结果。
TCGA Cancer
miRNA表达
该模块分析结果提供基因差异表达,生存分析和亚型分析,相应的图形结果提供PDF,png和EPS多种文件格式下载。
单核苷酸变异(SNV)分析
SNV模块能显示特定肿瘤类型中的SNV频率和基因集的变异类型。突变对总体生存OS的作用通过对数秩检验来评估。
①SNV percentage profile: 该部分展现特定肿瘤类型中所选基因的相对SNV频率,每一行表示一个基因。
图片结果来源于官网
②SNV summary:显示变体类型(SNP或DEL),变体分类和SNV类等。
图片结果来源于官网
③SNV>显示在选定的TCGA肿瘤类型中详细的SNV信息的基因集。
图片结果来源于官网
④SNV survival plot:该部分显示选定的肿瘤类型中有或无SNV的样本的Kaplan-Meier生存评估。
CNV分析
该部分结果图形包括CNV Pie distribution(CNV)类别(杂合/纯合,删除/扩增)。Heat CNV部分表示CNV分类在选定癌症类型中的分布。CNV to expression 则显示CNV于基因表达的关系。
甲基化分析
该模块主要探讨所选肿瘤与配对正常人之间的甲基化差异。包括Differential Methylation, Methylation survival和Methylation to Expression三部分。本研究图形如下:
图片截图来源于官网
通路活性
该模块包括Global percentage, Heatmap percentage和Relation network三个部分,主要提示选定肿瘤类型的基因整体活性,基因对通路的影响百分比(激活/抑制)和基因的表达。
miRNA网络
提供一个miRNA调节网络,可视化miRNA对基因的潜在调节,见图。
图片来源于官网
药物敏感性分析
该模块整合了GDSC和CTRP中癌细胞系的药物敏感性和基因表达谱数据进行研究。通过Spearman相关分析以药物的敏感性进行基因组中各个基因的表达。
GETX Normal Tissues
该模块包括GETX expression, 以热图和箱式图显示所选GETX正常组织中查询基因集的表达谱和分析得分。同时Table of eQTL in GTEX dataset会以表格形式展示。
微信扫码关注该文公众号作者