Redian新闻
>
9图4表完整复现3.8分生信SCI,干货满满

9图4表完整复现3.8分生信SCI,干货满满

公众号新闻

各位小伙伴大家好,我是四叶草~~ 今天带来的这篇文章“ULBP2 is a biomarker related to prognosis and immunity in colon cancer”2022年12月发表在Molecular and Cellular Biochemistry期刊的生信文章,我们一起来看一下吧。
题目:

ULBP2 is a biomarker related to prognosis and immunity in colon cancer ULBP2是结肠癌中与预后和免疫相关的生物标志物

期刊:Molecular and Cellular Biochemistry

IF:3.842
全文共9图4表(正文8图3表,补充材料1图1表(技术路线图和免疫相关基因列表))

1

期刊介绍:

2

文章概要

套路:单基因

基因:ULBP2

数据来源:TCGA-COAD(数据集),ImmPort(数据库)

技术路线:根据原文补充材料中的技术路线图,我们来看一下原文的技术路线。
通过TCGA数据库提取临床数据和mRNA序列数据并通过ImmPort数据库下载免疫相关基因→差异表达mRNA(DEmRNA)的鉴定和预后分析→通过韦恩图分析DEmRNA和免疫相关基因的关系,找出重合部分的和免疫相关的DEmRNA→鉴定ULBP2为目标基因,并且ULBP2在结肠癌中高表达并且和不良预后有关→ULBP2表达和临床参数的相关性分析→功能富集分析→ULBP2表达和肿瘤免疫相关分析→结果表明,ULBP2和肿瘤免疫相关,并且可能是一个和结肠癌诊断和预后相关的生物标志物,同时可能是结肠癌免疫治疗的1个潜在靶点。
关于技术路线图的绘制可参考我们解螺旋《技术路线图绘制教程》的单元课,里面涵盖了多个常用软件的详细操作步骤及实例演示。
链接:
https://pan.baidu.com/s/1ohoFC1vBqmrhdgAbRWk0fA
提取码:egue

3

图表简介

Fig. 1 | 对结肠癌(CC)中mRNA的分布以及与免疫和预后相关的差异表达mRNA的鉴定

Fig. 2 | 上调ULBP2与结直肠癌预后不良有关

Table1 | ULBP2表达和临床病理特征相关(列联表形式的基线资料表)

Table 2 | logistic回归分析

Fig. 3 | ULBP2表达与临床病理参数的相关性

Table 3 | 单因素和多因素Cox回归分析结肠癌(CC)患者临床病理参数

Fig. 4 | 结肠癌(CC)样本差异表达免疫相关基因的功能富集分析(GO-KEGG富集分析气泡图)

Fig. 5 | 8个在ULBP2高表达结肠癌(CC)样本中显著富集的信号通路(GSEA富集分析-经典可视化图)

Fig. 6 | ULBP2表达水平和肿瘤免疫(免疫浸润分析)

Fig. 7 | ULBP2表达水平和免疫细胞的关系(免疫浸润分析)

Fig. 8 | 肿瘤免疫检查点和ULBP2表达水平(相关性散点图)

4

分析工具

➡仙桃学术(https://www.xiantao.love/)(新版)
各种生信分析工具

➡ImmPort数据库
(https://www.immport.org/shared/home)
免疫相关基因下载

5

复现流程

首先复现Fig. 1

Fig. 1 | 对结肠癌(CC)中mRNA的分布以及与免疫和预后相关的差异表达mRNA的鉴定,包括3张小图:
Fig. 1a | DEmRNA的火山图
Fig. 1b | DEmRNA和免疫相关基因的韦恩图
Fig. 1c | ULBP2和共表达mRNA的热图

首先需要进入仙桃学术生信工具界面,具体操作如下:

进入仙桃学术(https://www.xiantao.love/)(新版)→选择“生信工具”,输入登录信息。

因为免费版、基础版和高级版三个版本之间能用的模块以及能保存的历史记录上限以及部分下载和结果说明有差别。我们选择模块数量最多,能保存的历史记录上限最高的高级版进行复现。
Fig. 1a复现:

第1步:筛选分子

点击上方菜单栏【全部工具】→点击左侧导航栏【表达差异】→点击右侧导航栏[云]筛选分子→选择数据集“TCGA-COAD”→选择【临床变量】为【(临床)status】→添加分组(左侧为参考组,右侧为实验组)→默认【分析参数】→点击【确认】,出现任务提交成功提醒→在【历史记录】中查询保存的【筛选分子】结果,更名并下载【筛选分子】数据。

第2步:数据整理

根据得到的筛选分子结果,筛选基因类型protein coding(mRNA),并保留gene name和log2FoldChange几列数据,删除其余列,调整列顺序,修改列名,得到的数据如下所示:
第3步:火山图绘制

点击上方工具选择栏【全部工具】→点击左侧导航栏【表达差异】→点击【火山图】→上传第2步整理好的数据→点击【验证】→【主要参数】中【logFC阈值】为1.5,【P值阈值】为0.05→【标注】基因ULBP2→默认其他主要参数→点击【确认】→下载【差异表格.csv】和火山图图片。

Fig. 1b复现:

第1步:筛选预后相关分子

点击上方工具选择栏【全部工具】→点击左侧导航栏【临床意义】→点击【预后筛选】→选择云端数据集TCGA-COAD→默认【主要参数】→点击【确认】→下载并整理数据,获得预后相关的mRNA列表并添加Fig. 1复现得到的DEmRNA列表,形成预后相关mRNA-DEmRNA列表。
第2步:

点击【全部工具】→点击左侧的【基础绘图】→选择【韦恩图】→选择预后相关mRNA-DEmRNA列表→点击【验证】→默认主要参数→下载【交集情况.xlsx】。

第3步:

通过Immport数据库下载免疫相关基因

登录Immport数据库(https://www.immport.org/home)→选择【Resources】→下拉页面,选择【gene list】→点击【gene summary】获得免疫相关基因列表→文件拖到打开的EXCEL文件中,去除重复基因,获得1793个免疫相关基因。

第4步:

再次用韦恩图获得预后和免疫相关DEmRNA,下载交集情况和韦恩图。

Fig. 1c复现:

第1步:单基因相关性筛选

点击【全部工具】→点击左侧的【交互网络】→选择【交互网络】→[云] 单基因相关性筛选→选择云端数据集TCGA-COAD→输入分子ULBP2→选择相关性系数计算方法Spearman→点击确认→在弹出的成功提示中点击【确认】→在【历史记录】中更名并下载单基因相关性分析结果。



第2步:数据筛选和排序

原文分别在正相关和负相关top5的mRNA,我们也参考原文方法进行数据筛选:Gene type列选择protein coding(mRNA),相关系数选择correlation Spearman,pvalue Spearman选择<0.05,筛选correlation Spearman>0,降序排列选取top5基因;筛选correlation Spearman<0,升序排列选取top5基因。


10个共表达基因如下所示:
第3步:共表达热图绘制

点击【全部工具】→点击左侧的【交互网络】→选择【[云]共表达热图】→检查系统自动记忆的云端数据集和分子是否分别为TCGA-COAD和ULBP2→复制粘贴上1步得到的10个共表达基因→【标注】选择星号→点击确认→下载共表达热图。

Fig. 2 | 上调ULBP2与结直肠癌预后不良有关,包括5张小图:

Fig. 2a | ULBP2在泛癌中的表达
Fig. 2b | TCGA数据库结肠癌样本ULBP2的分组比较图
(Normal vs Tumor)
Fig. 2c | TCGA数据库结肠癌样本ULBP2的配对图
(Normal vs Tumor)
Fig. 2d | ULBP2的ROC曲线
Fig. 2e | ULBP2的K-M曲线



Fig. 2a复现:

点击【全部工具】→点击左侧的【其他】→选择【[泛癌]分组比较】→选择云端数据集TCGA-GTEx-ALL→输入分子ULBP2→【展示】箱图→设置【误差线类型】→点击确认→下载泛癌分组比较图。
Fig. 2b复现:

点击工具选择栏【全部工具】→点击左侧导航栏【表达差异】→点击右侧【 [云]疾病vs非疾病】→选择云端数据集(TCGA-COAD)→输入ULBP2→【展示】【箱】→选择误差线类型→默认其他主要参数→点击【确认】→下载图片。

Fig. 2c复现:

点击工具选择栏【全部工具】→点击左侧导航栏【表达差异】→点击右侧【 [云]配对图】→检查系统自动记忆的云端数据集和分子是否分别为TCGA-COAD 和ULBP2→默认主要参数→点击【确认】→下载基因表达分组比较图。


Fig. 2d复现:

点击仙桃学术工具上方的工具选择栏【全部工具】→点击左侧导航栏【临床意义】→点击右侧导航栏【诊断类】中的【诊断ROC】→选择云端数据集(TCGA-COAD)→输入ULBP2→默认主要参数→点击【确认】→下载ROC曲线图片。


Fig. 2e复现:

点击仙桃学术工具上方的工具选择栏【全部工具】→点击左侧导航栏【临床意义】→点击右侧导航栏【预后类】中的【[云]生存曲线(KM图)】→检查系统自动记忆的数据集和分子是否分别为TCGA-COAD 和 ULBP2→【预后参数】时间设置为【月】→默认其他主要参数→点击【确认】→下载生存曲线(KM图)。


Table1 | ULBP2表达和临床病理特征相关(列联表形式的基线资料表)
Table1复现:

点击仙桃学术工具上方的工具选择栏【全部工具】→点击左侧导航栏【临床意义】→点击右侧导航栏【临床相关】中的【[云]基线资料表】→检查系统自动记忆的数据集和分组变量是否分别为TCGA-COAD 和 ULBP2→选择变量并添加分组→默认主要参数→点击【确认】→下载基线资料表。


Table 2 | logistic回归分析

Table 2复现:

第1步:临床数据下载

点击工具选择栏【分析工具】→点击左侧导航栏【临床意义】→点击右侧预后类带[云]标识的基于云端数据的分析模块,这里以【[云] 生存曲线(KM图)】为例→默认所有参数→点击【确认】→点击【方法学】→点击【百度云超链接】并复制提取码→在新窗口中粘贴提取码并点击【提取文件】→选择文件并点击【下载】。

从原始临床数据中提取以下列数据:

patient.stage_event.tnm_categories.pathologic_categories.pathologic_T
patient.stage_event.tnm_categories.pathologic_categories.pathologic_N
patient.stage_event.tnm_categories.pathologic_categories.pathologic_M
patient.stage_event.pathologic_stage
patient.preoperative_pretreatment_cea_level     patient.
lymphatic_invasion patient.age_at_initial_pathologic_diagnosis
patient.gender
第2步:添加每个样本ULBP2表达量分组信息。

可以先在RNAseq标准化后的表达谱中复制并转置样本编号和ULBP2表达量到新建的EXCEL工作表中,并用mid函数提取样本信息的前12位。
整理临床变量构成分组并简化列名。用VLOOKUP函数精确匹配样本编号和ULBP2表达量,并用MEDIAN函数计算ULBP2表达量中位数,用IF函数对样本进行分类,大于中位数的为ULBP2高表达样本,用数字1表示;小于中位数的为ULBP2低表达样本,用数字0表示
最终整理成上传仙桃的数据如下所示:
注意:先出现的分类会被当做参考组,影响 OR 值和置信区间计算,所以需要调整变量出现的顺序,最好第二行全部为参考组的分类,第一列中先出现的变量。
第3步:单因素多因素Logistic[二分类]
点击仙桃学术工具上方的工具选择栏【全部工具】→点击左侧导航栏【临床意义】→点击右侧导航栏【预后类】中的【单因素多因素Logistic[二分类]】→上传第2步整理好的数据→点击【验证】→默认主要参数→点击【确认】→下载Logistic回归结果。

Fig. 3 | ULBP2表达与临床病理参数的相关性,包括5张小图:
Fig. 3a | ULBP2表达和T stage相关(临床病理参数的分组比较图)
Fig. 3b-3e | 亚组K-M曲线
Fig. 3a复现:

点击仙桃学术工具上方的工具选择栏【全部工具】→点击左侧导航栏【临床意义】→点击右侧导航栏【临床相关】中的【[云]临床意义(分组)】→检查系统自动记忆的数据集和分子是否分别为TCGA-COAD 和 ULBP2→选择变量pathologic_T stage并添加分组→默认主要参数→点击【确认】→下载临床意义分组对比图。

Fig. 3b-e复现:以M0为例

点击仙桃学术工具上方的工具选择栏【全部工具】→点击左侧导航栏【临床意义】→点击右侧导航栏【预后类】中的【[云]亚组KM图】→检查系统自动记忆的数据集和分子是否分别为TCGA-COAD 和 ULBP2→选择变量pathologic_M stage并添加分组M0→预后参数【时间】设置为【月】→默认其他主要参数→点击【确认】→下载临床意义分组对比图。

Table 3 | 单因素和多因素Cox回归分析结肠癌(CC)患者临床病理参数
Table 3复现:

点击仙桃学术工具上方的工具选择栏【全部工具】→点击左侧导航栏【临床意义】→点击右侧导航栏【预后类】中的【[云]Cox回归】→检查系统自动记忆的数据集是否为TCGA-COAD→选择变量并添加分组→默认主要参数→点击【确认】→下载单因素和多因素Cox回归结果三线表。

Fig. 4 | 结肠癌(CC)样本差异表达免疫相关基因的功能富集分析(GO-KEGG富集分析气泡图),包括2张小图:
Fig. 4a | 和ULBP2以及其共表达mRNA相关的GO功能富集分析
Fig. 4b | 和ULBP2以及其共表达mRNA相关的KEGG通路
Fig. 4a复现:

我们没有找到原文所用的ULBP2共表达mRNA的数量,因为后面进行的GSEA需要进行单基因-差异分析,所以我们先在GO和KEGG富集分析前进行单基因-差异分析,并基于获得的差异表达基因进行GO和KEGG富集分析。

第1步:单基因-差异分析

点击仙桃工具选择栏【全部工具】→点击左侧导航栏【表达差异】→点击右侧导航栏【[云]单基因-差异分析】→选择数据集TCGA-GOAD→输入分子ULBP2→默认【分组参数】→默认【分析参数】→点击【确认】,出现任务提交成功提醒→在【历史记录】中查询保存的【单基因差异分析】结果,下载【单基因差异分析】数据,整理数据,提取mRNA,用阈值padj<0.05,|logFC|>1筛选差异表达基因。

第2步:GO富集分析

点击上方工具选择栏【全部工具】→点击左侧导航栏的【功能聚类】→点击右侧导航栏【GOKEGG】中的【[GOKEGG]分析】→上传第1步得到的差异表达基因列表→点击【验证】→【富集参数】的【条目】选择【全部GO】→默认其他参数→点击【确认】→点击【保存结果】→在历史记录里更名并下载【GOKEGG.xlsx】,整理表格并提取top15显著富集的GO term。

第3步:GO富集分析-气泡图绘制。

点击上方工具选择栏【分析工具】→点击左侧导航栏【功能聚类】→点击右侧导航栏【GOKEGG】中的【[GOKEGG]气泡图】→选择第2步保存结果的数据→top15显著富集的GO term ID→默认其他参数→点击【确认】→下载图片。

出现了字迹重叠,调整图片大小:
Fig. 4b复现:

参考Fig. 4a的复现,只需要在GOKEGG富集分析中选择KEGG条目就可以,这里就不进行复现了,大家可以自己尝试一下。

Fig. 5 |8个在ULBP2高表达结肠癌(CC)样本中显著富集的信号通路(GSEA富集分析-经典可视化图),包括8张小图:

Fig. 5a-5h | 8个在ULBP2高表达结肠癌(CC)样本中显著富集的信号通路

Fig. 5复现:

第1步,整理差异分析表格,保留所有mRNA的id和logFC两列数据,如下所示:

第2步:GSEA富集分析

点击上方菜单栏【全部工具】→点击左侧导航栏【功能聚类】→点击右侧导航栏【GSEA分析】中的【[GSEA]富集分析】→上传第1步整理好的数据→点击【验证】→默认主要参数→点击【确认】→提示“任务提交成功”,点击【确定】→在【历史记录】中更名并下载GSEA分析结果→以其他文献中用到过的|NES|>1, p adj<0.05, qvalue <0.25为阈值,筛选显著富集的通路。

第3步:GSEA经典可视化

点击【全部工具】→点击左侧导航【功能聚类】→点击右侧导航栏【GSEA分析】中的【[GSEA]经典可视化】→选择第2步保存的结果→输入显著富集的通路ID→默认其他主要参数→点击【确认】→下载GSEA经典可视化图。

Fig. 6 | ULBP2表达水平和肿瘤免疫(免疫浸润分析),包括9张小图:

Fig. 6a | ULBP2和24个免疫浸润细胞的相关性棒棒糖图
Fig. 6b-6i | ULBP2和7个免疫浸润细胞的相关性散点图((b)CD8+ T cells, (c) DC cells, (d) T cells, (e) NK cells, (f) Th1 cells, (g) Th2 cells, (h) Treg cells, and (i) Macrophage cells)
Fig. 6a复现:

点击上方菜单栏【全部工具】→点击左侧导航栏【交互网络】→点击右侧导航栏【免疫浸润】中的【[免疫浸润-云]棒棒糖图】→检查云端数据集和分子是否分别为TCGA-COAD和ULBP2→默认ssgsea算法和34个免疫细胞→默认其他主要参数→点击【确认】→保存免疫浸润-棒棒糖图。

Fig. 6b-6i复现:以T cells为例

点击上方菜单栏【全部工具】→点击左侧导航栏【交互网络】→点击右侧导航栏【免疫浸润】中的【[免疫浸润-云]相关性散点图】→检查云端数据集和分子是否分别为TCGA-COAD和ULBP2→【算法】中选择T cells→默认其他主要参数→点击【确认】→保存免疫浸润-相关性散点图。


Fig. 7| ULBP2表达水平和免疫细胞的关系(免疫浸润分析),包括7张小图:

Fig. 7a-7g | ULBP2和7个免疫浸润细胞的分组比较图
Fig. 7复现:以TH1 cells为例

点击上方菜单栏【全部工具】→点击左侧导航栏【交互网络】→点击右侧导航栏【免疫浸润】中的【[免疫浸润-云]单基因高低组差异】→检查云端数据集和分子是否分别为TCGA-COAD和ULBP2→【算法】中选择TH1 cells→默认其他主要参数→点击【确认】→保存免疫浸润-单基因高低组差异对比图。

Fig. 8 | 肿瘤免疫检查点和ULBP2表达水平(相关性散点图),包括3张小图:

Fig. 8a-8c | ULBP2和(a) PD-1 (PDCD1), (b) PD-L1 (CD274), and (c) CTLA4的表达相关散点图

Fig. 8复现:以PDCD1为例

点击上方菜单栏【全部工具】→点击左侧导航栏【交互网络】→点击右侧导航栏【相关性】中的【表达相关散点图】→检查云端数据集和主分子是否分别为TCGA-COAD和ULBP2→【补充分子】输入PDCD1→默认主要参数→点击【确认】→保存表达相关散点图。

好啦,以上就是本篇文章复现的所有内容。

这里最后再给大家小结一下,从TCGA数据集DEmRNA到预后和免疫相关的DEmRNA,作者筛选出了目标基因ULBP2。基于这个目标基因,接着表达差异分析和生存曲线表明目标基因ULBP2在结肠癌中高表达并且和不良预后有关。

后面又进行了ULBP2表达和临床参数的相关性分析,功能富集分析,ULBP2表达和肿瘤免疫相关分析。这些结果表明,ULBP2和肿瘤免疫相关且可能是一个和结肠癌诊断和预后相关的生物标志物,同时可能是结肠癌免疫治疗的1个潜在靶点。

从研究结果来看,最终的结论非常有说服力。

大家可以把这篇文章的分析方法用在自己的研究中,比如对某种疾病的TCGA数据集进行差异分析得到DEmRNA,结合预后筛选和免疫相关基因,并通过韦恩图得到预后和免疫相关的DEmRNA。

通过这种方式筛选目标基因,再针对目标基因进行列联表形式的基线资料表分析,Logistic回归,Cox回归,基因表达和临床病理参数的相关性(分组对比图)分析,亚组K-M,功能富集分析,肿瘤免疫相关分析(免疫浸润分析和表达相关散点图)等。

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
没做实验!3个月发6分+SCI,这13个生信数据库快速搞定生信SCI!军旅故事原创系列(46)大米饭一次 Nacos 导致的 CPU 飙高问题完整复盘瞒不住了!这个方法发生信SCI,接收快、影响因子多2分!(附干货)不会R,4个月发表生信SCI稳稳毕业!没有科技,全是狠活!大咖云集,干货满满,来亚马逊云科技中国峰会深度解读AIGC的现在和未来3小时生信复现实操演示,炫酷美图0代码一键出!生信小白福音!惊呆!不会R语言、Python软件,零基础的师姐却三个月发二区生信SCI……哭了!生信SCI连续被拒三次,差点延毕,医学生也太惨了!好在师姐给我发了这……聊聊干货满满的中法联合声明3.62分肿瘤生信SCI全文复现,GOKEGG富集分析与信号通路JWST推翻了什么?2分+非肿瘤生信文章全文复现,6张图满满干货!想顺利毕业?一站式GEO数据挖掘教程来了,零代码也能搞定5+生信SCI……(快收藏)干货满满!巴菲特股东大会最全解读:AI、美元、银行危机、中美关系、接班人、减持苹果等都涉及到了0门槛克隆ChatGPT方案再升级,开源模型完整复现,在线体验无需注册推荐几个干货满满的优质公众号,有用又有趣 | 荐号发几张我孙子比赛的滑雪片 不是我拍的嗷嗷快!生信SCI的硬核技术,TCGA挖掘就用它!(附文章框架)太实用了!全文干货!12图4表,2.64分干湿结合SCI全文复现亚城慈济,新春祈福师兄连发3篇生信SCI从未退稿!背后神操作90%人居然都知道!简单5张图,用最简单生信SCI的模板套路复现!快速发表毕业就它了!实操性极强,9图1表,2022年9月2.595分非肿瘤生信SCI复现如何让孩子爱上阅读?这场发布会干货满满!GEO+TCGA双重挖掘!8图3表,3.9分肿瘤生信SCI全文复现入门首选!小白走这个路子分分钟发表5分生信文章!(附工具推荐)深思熟虑后,我决定揭秘师兄连发6篇干湿结合生信SCI秘密套路"当前仍为布局权益资产好时机"!这家银行理财子公司深度揭秘"固收+",干货满满卷哭了!985医学硕士,实验室没人带,发不了生信SCI,结果出乎意料......什么!简简单单2图1表冲JCR一区,孟德尔随机化赛高分生信不吹不黑!几周工作量10分钟搞定,用这个3个月发表6.16分生信SCI(附教程)东西方的战争: 东升西降古今谈1月最新出炉!3.776分肿瘤免疫生信SCI,全文6图0代码复现YYDS!科研党必备的常见10大经典信号通路合集,干货满满!
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。