2022年单基因泛癌5+新套路!性价比超高!赶紧来学!
大家好,我叫莎莎,今天给大家介绍一篇泛癌相关的5分+生信分析为主加以简单实验验证的文章。2022年3月发表在“Frontiers in Oncology”上,题为:“A Comprehensive Analysis of the Glutathione Peroxidase 8 (GPX8) in Human Cancer”。正文包括8个图和3个表,接下来,就从“挑圈联靠”角度详细介绍一下单基因泛癌分析的方法吧!
一、研究背景
已有多项研究报道人癌组织中谷胱甘肽过氧化物酶8(GPX8)可能与胃癌和乳腺癌的预后不良有关。然而,GPX8在泛癌(pan-cancer)中的预后潜力仍不清楚。
本篇范文旨在通过全面的分析探讨GPX8在人类癌症中的预后和免疫学作用,并确认其在胶质母细胞瘤(GBM)中的致癌作用。
二、数据库与分析工具
GEO https://www.ncbi.nlm.nih.gov/geo/
TCGA https://portal.gdc.cancer.gov/
GO http://geneontology.org/
KEGG https://www.kegg.jp/
STRING https://string-db.org/
TIMER http://timer.cistrome.org/
CPTAC http://ualcan.path.uab.edu/analysis-prot.html
The Human Protein Atlas (HPA) http://www.proteinatlas.org/
KM Plotter https://kmplot.com/analysis/
The PrognoScan http://dna00.bio.kyutech.ac.jp/PrognoScan/index.html
cBioPortal https://www.cbioportal.org/
GEPIA http://gepia.cancer-pku.cn/index.html
三、套路解读
“挑”-----泛癌与正常组织的差异表达
图1| GPX8基因在不同肿瘤中的表达
作者首先使用多个数据库检索了GPX8基因在不同类型的肿瘤肿瘤组织和正常组织中的表达差异。
(Oncomine现在已不能使用,但不影响思路学习。)
研究者在TIMER数据库和Oncomine数据库中探讨了GPX8基因在不同类型癌症中的表达情况。
(Oncomine现在已不能使用,但不影响思路学习。换个数据集做泛癌分析即可。)
Oncomine显示GPX8基因的表达水平在泛癌中显著上调,包括BRCA(乳腺癌),CHOL(胆管癌),结肠腺癌,GBM(胶质母细胞瘤多形性),头颈部鳞状细胞癌,肾肾透明细胞癌,肾肾透明细胞癌乳头状细胞癌),LIHC(肝肝细胞癌),LUAD(肺腺癌),LUSC(肺鳞状细胞癌)、STAD(胃腺癌)(图1A、B)。
TIMER也揭示了GPX8基因在泛癌中的表达水平显著上调。
在加入GTEx数据集的正常组织作为对照后,图1C显示了所有TCGA肿瘤中GPX8的肿瘤和邻近正常组织,进一步证实GPX8在BRCA、CoAD、GBM/LGG、hNSC、KIRC、Kirp、LUAD和STAD组织中的表达显著高于正常组织(图1D)。
图2| GPX8蛋白在不同肿瘤中的表达
UALCAN门户网站的CPTAC分析被用来确定GPX8在六种癌症中的蛋白表达水平
CPTAC分析结果显示,GPX8蛋白表达上调,并与结肠癌、肾透明细胞癌、LUAD和UCEC的病理分期相关(图2A、B)。
人类蛋白质图谱(HPA)用来确认GPX8在结肠、肾脏、肺、子宫内膜等正常或肿瘤组织中的表达。
HPA数据库的数据显示,GPX8在正常或肿瘤组织的结肠、肾脏、肺、子宫内膜中的表达水平不同(图2C)。G P X 8在大多数癌症中都高表达。
接下来研究者采用TCGA数据集来研究GPX8的表达与不同癌症预后的相关性。
“靠”—GPX8具有临床诊断意义
图3| 癌症患者的生存预后分析
应用TCGA数据集研究GPX8的表达与不同肿瘤预后的关系。用Kaplan-Meier Plotter分析GPX8的表达与总生存期和疾病特异性生存期的相关性。
分析结果表明,GPX8的表达显著影响G B M / L G G , K I R C , K I R P , L U A D a n d S T A D 的预后(图3A、B)。
The PrognoScan 用于分析GEO数据集中GPX8表达和生存之间的关系。
GEO数据集显示,GPX8高表达与脑癌、结直肠癌和肺癌患者的预后较差相关(图3C)。
对TCGA和GTEx的RNAseq数据进行分析和可视化,计算ROC曲线下面积(AUC)以判断诊断和预后,验证GPX8在不同癌症中的诊断价值。如图3D所示,GPX8对BRCA、GBM/LGG、HNSC、KIRC、KIRP和STAD具有中等程度的诊断准确性(AUCs高于0.7,甚至0.8)。
通过分析GPX8在GBM/LGG、KIRC、Kirp和STAD中的表达与临床数据的关系。
结果显示GPX8的高表达与GBM/LGG的WHO分级和年龄、KIRC和STAD的T分期和病理分期有关。然而,GPX8的高表达与Kirp的其他临床特征无明显相关性。
单因素分析显示,OS与GBM/LGG的WHO分级和T分期,KIRC和Kirp的N期、M期和病理T期,STAD的N期和M期相关。
多因素分析显示,OS与WHO的GBM/LGG分级、KIRC的M分期、Kirp和STAD分期及STAD的N分期有关。
“联”---GPX8的表达与DNA的突变有关以及与免疫浸润有关
图4| 癌症组织中GPX8基因甲基化分析及突变特征
通过对TCGA的RNAseq和甲基化芯片数据的研究,在GBM/LGG、KIRC和STAD中观察到GPX8的表达与启动子区的GPX8 DNA甲基化水平呈负相关。不同的癌症类型表现出不同的相关系数。(图4A)。
遗传改变分析展示GPX8基因的突变频率和突变类型,其中GPX8的改变频率>4%,主要类型为扩增(图4B)。
基于cBioPortal数据库,发现GPX8错义突变(missensemutation)是基因改变的主要类型,S61Y/F改变是重要的位点,在2例COAD、1例BLCA和1例UCEC中检测到该突变(图4C)。
图4D展示GPX8蛋白三维结构中的S61Y/F位点。
图5| GPX8表达与肿瘤浸润性免疫细胞的相关性分析
利用TIMER2的“gene_Corr”模块探讨GPX8与肿瘤相关成纤维细胞的相关性。用R包“GSVA”(30)的单样本基因集浓缩分析(SsGSEA)分析GPX8与免疫细胞的相关性。
TIMER、TIDE、XCEL、MCPCOUNTER、EPIC算法的结果表明,在许多人类癌症中,包括GBM、LGG、KIRC、KIRP和STAD,GPX8的表达与癌症相关的成纤维细胞之间存在正相关关系(图5A)。
基于TCGA数据库,R软件包 "GSVA "的结果显示,在这些癌症中观察到GPX8和不同的免疫细胞的正相关关系(图5B-E)
图6 | TIMER中GPX8表达与免疫细胞的相关性分析
TIMER数据库的散点图数据表明,GPX8的表达水平与免疫细胞相关(图6)。
总而言之,GPX8的表达与免疫浸润有关。
“圈”---功能聚类
图7| GPX8和GPX8结合蛋白的分析
研究者使用STRING 和GEPIA用于预测GPX8的结合蛋白构建蛋白质相互作用网络(图7A)。
研究者利用TCGA数据库中的GBM/LGG、KIRC、KIRC和STAD的RNAseq数据,分析了GPX8、IKBIP、SERPINH1、PPIC、OSTC、TNFAIP8和CRTAP之间的共表达。
GO和KEGG分析表明,GPX8和GPX8结合蛋白主要参与谷胱甘肽代谢(图7B)并显示了这些通路的关系(图7C)。
研究者利用TCGA数据库中的GBM/LGG、KIRC、KIRC和STAD的RNAseq数据,分析了GPX8、IKBIP、SERPINH1、PPIC、OSTC、TNFAIP8和CRTAP之间的共表达。共表达分析结果表明,GPX8在IKBIP、SERPINH1、PPIC、OSTC、TNFAIP8和CRTAP之间共表达(图7D)。
最后,研究者选择了一种典型的人类肿瘤—神经胶质瘤(GBM),用很常规的实验qRT-PCR和Wesern Blot做了一下功能验证。
图8| GPX8在GBM细胞中表达上调,并与体外迁移和侵袭有关
为了确定GPX8的功能,研究者选择了一种典型的人类肿瘤—神经胶质瘤(GBM)进行进一步的研究。通过与正常人星形胶质细胞系比较,qRT-PCR和WB结果表明GPX8在GBM细胞中高表达,包括LN-299、A172和U251(图8A)。
针对GPX8的不同位点设计了两个shRNA。QRT-PCR和WB结果表明,两个sh-RNAs都具有良好的抑制GPX8表达的效率(图8B)。
作者观察到GPX8的敲低(knockdown)可以抑制GBM细胞的迁移和侵袭(图8C,D)。
为了证实GPX8在原发肿瘤中的表达,收集了GBM患者的肿瘤组织和癌旁组织。通过与同一患者的正常组织进行比较,WB结果表明GPX8在GBM组织中高表达(图8E)。
患者的临床参数如图8F所示。
四、总结
这篇文章属于比较常见的单基因泛癌的研究工作。
从转录,蛋白水平分析目的基因在正常组织和癌组织的表达差异(挑),
从DNA突变与免疫浸润的角度理解表达差异的原因。
通过通路分析和蛋白质互作网络分析该基因涉及的通路,解释GPX8在肿瘤中的作用机制(联),
同时也对GPX8蛋白做功能聚类(圈),
通过多种相关性分析,预后分析等方法研究GPX8在临床诊断的意义,可以作为候选的临床诊断分子。(靠)
用RT-PCR和Western blot实验验证该基因在神经胶质瘤细胞系中高表达,给前面的分析结果提供进一步的支持。
这篇文章的分析方法和思路很普遍,表达也很清楚,好学易上手。使用的数据丰富,工作量也不少,最后的实验结果是很大的加分项。
文章的语言比较朴实易读,条理清晰,对每一步分析是用来做什么的,达到什么目的,都解释得很清楚。
这样的文风失之精炼,有刻意增加字数的嫌疑,但如果有小白对一些常用分析方法不甚了然,本文是一篇不错的学习材料,可以用来理清写文章思路。
—END—
撰文丨莎 莎
排版丨三叶虫
编辑丨三叶虫
微信扫码关注该文公众号作者