8+细胞焦亡+预后模型!思路打开!
各位小伙伴大家好,我是灰灰,本期给大家复现分享的是一篇2022年10月发表在8+的医学杂志J Transl Med上细胞焦亡的生信文章~
文章题目
文章背景
细胞焦亡(pyroptosis)是由炎性小体引发的一种细胞程序性死亡,表现为细胞不断胀大直至细胞膜破裂,导致细胞内容物释放进而引起强烈的炎症反应。细胞焦亡的发生依赖于炎性半胱天冬酶(caspase)和GSDMs蛋白家族,简单来说就是被激活的caspase切割GSDMs蛋白,释放出其N端结构域,该结构域结合膜脂并在细胞膜上打孔,导致细胞渗透压的变化,进而发生胀大直至细胞膜破裂。
胰腺癌(PAAD)是一种扩散迅速、预后差的癌症肿瘤,其5年生存率估计仅为1%。越来越多的研究表明,细胞焦亡在癌症的进展中起着重要的作用。因此,深入研究焦亡在胰腺癌发生和进展中的作用,以及建立相关的焦亡预后模型,对PAAD的治疗具有重要意义。
目前还没有建立与PAAD焦亡相关的预后模型来预测PAAD患者的预后。因此,本研究中,作者系统地探讨了焦相关基因的预后价值及其与临床特征的相关性,从而揭示了焦相关基因作为PAAD患者潜在预后生物标志物和新的治疗靶点的重要作用。
PS:原文中并没有提到焦亡基因的来源,不同文章对焦亡相关基因的定义差距很大,其中应用最多的是从文献综述(PMID: 30842595、PMID: 31501419、PMID: 28813641、PMID: 25879280)中获取的33个焦亡基因,这里我们以这33个焦亡基因进行文章的复现,具体焦亡相关基因如下表所示:
文章思路
差异表达
Figure 2:PAAD组织和正常组织之间不同表达焦亡相关基因
临床意义
Figure 3:构建TCGA队列中基于焦亡相关基因的风险预后模型
Figure 4:TCGA队列中风险模型的构建
Figure 5:预测胰腺癌患者生存概率的列线图
交互网络
Figure 6:针对PAAD治疗的筛选药物
Figure 7:肿瘤微环境与免疫细胞分析
功能聚类
Figure S1:GO/KEGG的功能富集
Figure S5:GSEA富集分析
文章复现
1、使用工具
仙桃学术工具(https://www.xiantao.love/)
Networkanalyst数据库(https://www.networkanalyst.ca/)
STRING数据库(https://string-db.org/)
cBioPortal 数据库(http://www.cbioportal.org/)
CTD数据库(https://ctdbase.org/)
PubChem 网站(https://pubchem.ncbi.nlm.nih.gov/)
TIMER数据库 (https://cistrome.shinyapps.io/timer/)
2.复现步骤
Figure 1:技术路线图
整个文章的技术路线如Figure 1 所示,关于技术路线图的绘制可参考我们解螺旋《技术路线图绘制教程》的单元课,里面涵盖了多个常用软件的详细操作步骤及实例演示。
Figure 2:PAAD组织和正常组织之间不同表达焦亡相关基因
进入仙桃学术工具(https://www.xiantao.love/),左侧导航栏中选择表达差异(挑)中[云]非配对样本→选择胰腺癌的数据集,默认其它参数,点击确认,在下方说明文件中点击数据下载栏中的百度云超链接,即可下载UCSC XENA经Toil流程(Vivian J et al., 2017)统一处理的TCGA的PAAD(胰腺癌)和GTEx中对应的正常组织TPM格式的RNAseq数据。
进入仙桃学术工具(https://www.xiantao.love/),左侧导航栏中选择基础绘图中简易ID转换(人源)→上传步骤(1)中下载的数据ID,点击确认,最终转换结果如下
提取33个焦亡基因的表达矩阵如下:
进入Networkanalyst数据库(https://www.networkanalyst.ca/),点击左下角Gene Expression Table
选择物种H.sapiens(human),Data type为Microarray data,ID type为Official Gene Symbol,Gene-level summarization为Mean,上传整理好的焦亡基因表达矩阵,点击Submit,运行完成后点击右下方proceed
弹出的界面默认相关参数,点击Submid,运行完成后点击右下方proceed
点击Download即可下载得到差异分析结果
进入仙桃学术工具(https://www.xiantao.love/),左侧导航栏中选择表达差异(挑)中(临时)火山图→上传焦亡基因极其log FC和Pvalue,输入标记的分子,默认其它参数,点击确认,即可得到焦亡基因的火山图
进入STRING数据库(https://string-db.org/),输入差异表达的28个焦亡基因,选五物种homo sapiens,点击search
默认相关参数,点击as a vector graphic:download SVG即可得到差异表达的28个焦亡基因的PPI
进入仙桃学术工具(https://www.xiantao.love/),左侧导航栏中选择表达差异(挑)中复杂热图(上传)→上传焦亡基因的表达矩阵,默认其它参数,点击确认,即可得到焦亡基因的热图
进入仙桃学术工具(https://www.xiantao.love/),左侧导航栏中选择表达差异(挑)中[云]非配对样本→选择胰腺癌数据集,输入焦亡基因,默认其它参数,点击确认,即可得到焦亡基因的箱式图
进cBioPortal 数据库(http://www.cbioportal.org/),选择TCGA中胰腺癌数据集,点击Query by Gene
默认相关参数,基因输入框中输入差异表达焦亡基因,点击Submit Query
即可得到差异焦亡基因在胰腺癌中的突变概况图,点击Download即可下载图片
Figure 3:构建TCGA队列中基于焦亡相关基因的风险预后模型
进入仙桃学术工具(https://www.xiantao.love/),左侧导航栏中选择预后分析中临时[云]单因素/多因素Cox回归→选择胰腺癌数据集,输入差异表达的焦亡基因,默认其它参数,点击确认,即可得到焦亡基因在胰腺癌中的单因素/多因素Cox分析结果,分别点击EXCEL和Riskscore保存
进入仙桃学术工具(https://www.xiantao.love/),左侧导航栏中选择基础绘图中的森林图→分别上传步骤(1)中得到的单因素和多因素结果,默认其它参数,点击确认,即可分别得到得到单因素和多因素的森林图
进入仙桃学术工具(https://www.xiantao.love/),左侧导航栏中选择预后分析中[云]lasso系数筛选→选择胰腺癌数据集,输入步骤(2)中单因素Cox分析得到的预后基因,默认其它参数,点击确认,即可得到文中的Figure3C
同时保存结果为lasso系数筛选
进入仙桃学术工具(https://www.xiantao.love/),左侧导航栏中选择预后分析中lasso变量轨迹图→选择步骤(3)保存的lasso系数筛选结果,默认其它参数,点击确认,即可得到文中的Figure3D
Figure 4:TCGA队列中风险模型的构建
进入仙桃学术工具(https://www.xiantao.love/),左侧导航栏中选择预后分析中风险因子图→上传Figure 3中Cox回归分析保存的Riskscore文件
默认相关参数,点击确认,即可得到文中Figure 4中的风险因子图
进入仙桃学术工具(https://www.xiantao.love/),左侧导航栏中选择基础绘图中生存曲线-二分类/数值/单组→上传Figure 3中Cox回归分析保存的Riskscore文件
默认相关参数,即可得到文中Figure 4B高低风险组的预后生存曲线
进入仙桃学术工具(https://www.xiantao.love/),左侧导航栏中选择表达差异(挑)中复杂热图(上传)→上传lasso系数筛选得到的5个焦亡基因的表达矩阵,同时按照RiskScore进行中位数将其分为高低风险组,默认其它参,点击确认,即可得到文中Figure 4D
进入仙桃学术工具(https://www.xiantao.love/),左侧导航栏中选择基础绘图中时间依赖性ROC→上传Figure 3中Cox回归分析保存的Riskscore数据,预测年限调整为1年、3年、5年,默认其它参,点击确认,即可得到文中Figure 4E
Figure 5:预测胰腺癌患者生存概率的列线图
PS:关于列线图模型的构建,一方面可以用lassos筛选的的5个预后焦亡基因的表达联合临床变量构建,另外也可以用焦亡基因Cox回归分析后得到的Riskscore联合临床变量
进入仙桃学术工具(https://www.xiantao.love/),左侧导航栏中选择预后分析中[云]预后列线图→选择胰腺癌数据集,输入临床变量以及预后焦亡基因,预测年限调整为1年、3年、5年,默认其它参,点击确认,即可得到预后焦亡基因的表达联合临床变量构建的列线图
点击下方数据下载里面原始临床数据+RNAseq编号对应的百度云超链接,下载相应的临床数据
提取相关临床变量,同时匹配添加焦亡基因Cox回归分析后得到的Riskscore列,最终整理格式如下
进入仙桃学术工具(https://www.xiantao.love/),左侧导航栏中选择预后分析中预后列线图上传→上传整理好的上方数据,输入临床变量以及预后焦亡基因,预测年限调整为1年、2年、3年,默认其它参,点击确认,即可得到Riskscore联合临床变量构建的列线图
进入仙桃学术工具(https://www.xiantao.love/),左侧导航栏中选择预后分析中[云] 预后Calibration分析→这里上传的数据格式和列线图数据一致,调整预测年限与线图数预测年限一致,默认其它参,点击确认,待分析完成后保存为Calibration分析上传
进入仙桃学术工具(https://www.xiantao.love/),左侧导航栏中选择预后分析中[云] Calibration可视化→点击上方分析后保存的云数据,调整预测年限与线图数预测年限一致,默认其它参,点击确认,即可得到对应预测年限的预后Calibration图
进入仙桃学术工具(https://www.xiantao.love/),左侧导航栏中选择基础绘图中诊断性ROC-独立指标→上传临床变量、Riskscore以及event的数据并将临床变量亚型转化为数值,具体数据格式如下
默认其它参,点击确认,即可得到文中Figure5E
Figure 6:针对PAAD治疗的筛选药物
PS:原文中药物预测使用了pRRophetic包对高低风险组进行了药物预测,这里我们转换一种思路,零代码对lasso分析得到的预后相关焦亡基因进行药物预测
进入CTD数据库(https://ctdbase.org/),检索栏中输入焦亡基因NLRP1,点击Search
弹出的界面选择Chemicals,即可看到与焦亡基因NLRP1相关的化合物(这里可以根据Interactions对化合物筛选)
进入PubChem 网站(https://pubchem.ncbi.nlm.nih.gov/),检索栏中输入Valproic acid,点击右侧放大镜进行搜索
弹出的界面,点击右侧导航栏中3D conformer即可得到Valproic acid的3D结构图
同样操作可以获取其它预后相关焦亡基因的化合物以及其对应的3D结构
Figure 7:肿瘤微环境与免疫细胞分析
PS:原文中Figure 7是通CIBERSORT包对高低分析组进行了免疫分析,这部分相关代码的学习,小伙伴们可参考挑圈联靠推文《免疫浸润利器——CIBERSORT纯代码实操》和《审稿人用的升级版免疫浸润分析,多一个X,CIBERSORT有啥差别?》进行学习和实战;当然这里也可以零代码对lasso分析得到的预后相关焦亡基因进行相关免疫分析,这里以TIMER数据库进行演示
进入TIMER数据库 (https://cistrome.shinyapps.io/timer/),导航栏中选择Gene,Gene Symbol输入预后相关焦亡基因NLRP1,Cancer Types中输入PAAD,Immune Infiltrates默认B cell,CD8+ T cell,CD4+ T cell,macrophage,neutrophil ,dendritic cell ,点击Submit,即可得到胰腺癌中焦亡基因NLRP1与多种免疫细胞的关系
Figure S1:GO/KEGG的功能富集
此外,文中补充材料中Figure S1也涉及到差异焦亡基因的GO和KEGG富集分析,这里给大家用仙桃工具进行演示
进入仙桃学术工具,点击左侧导航栏中的功能聚类(圈)→GO/KEGG富集分析,分子列表输入差异焦亡基因,富集分析选择全部GO项目,点击确认
保存结果为GO并下载excel结果
点击左侧导航栏中的功能聚类(圈)→GO/KEGG可视化,选择分析好的项目GO,类型可选择气泡图,输入显示的富集条目,方法选择分面,点击确认保存即可得到GO富集分析气泡图
进入仙桃学术工具,点击左侧导航栏中的功能聚类(圈)→ GOKEGG(联合logFC)→富集分析,上传差异焦亡基因及其对应的LogFC,富集分析类型选择KEGG,点击确认,待分析完成后,保存结果为KEGG,并下载EXCEL结果
进入仙桃学术工具,点击左侧导航栏中的功能聚类(圈)→ GOKEGG(联合logFC)→圈图,点击上方刚刚分析好的云数据,基本参数输入显示的KEGG富集条目,点击确认保存即可得到KEGG富集分析圈图
Figure S5:GSEA富集分析
PS:补充材料中的Figure S5是对高低风险组进行的GSEA富集分析,这里可以重复利用Networkanalyst数据库对高低风险组进行差异分析(具体步骤可参见前方Figure2的复现内容),分析后提取所有基因及其对应的LogFC即可进行GSEA富集,这里我们依旧以仙桃学术进行演示
进入仙桃学术工具,点击左侧导航栏中的功能聚类(圈)→GSEA富集分析,上传高低风险组差异分析结果中的所有基因及其对应的LogFC,默认其它参数,点击确认
进入仙桃学术工具,点击左侧导航栏中的功能聚类(圈)→ GSEAf富集→GSEA可视化,点击上方刚刚分析好的云数据,基本参数输入显示的GSEA富集条目,点击确认保存即可得到GSEA图
整个文章结构布局相对清晰明了,正文结果主要是基于TCGA数据集中的焦亡基因构建临床模型以及对高低风险组进行药物分析、免疫分析,而其补充文件又通过两个GEO数据集对TCGA数据结果进行验证,并且也进行了机制探索(GO/KEGG/GSEA富集分析)和细胞层面实验的验证进行。除了实验部分,其它内容基本上都得到了复现或者同等替换,不知道屏幕前的你是否有所启发和收获?好啦,以上就是本次焦亡生信文献复现分享的全部内容啦,愿屏幕前的你学有所获,下期再见,886
微信扫码关注该文公众号作者