平平无奇的病理组学套路,是什么让它发到Nature子刊?
1 整体感知
1.题目要素拆解
文章题目提供了三条信息:
1)预测变量:病理组学
2)结局:预后、预测疗效
3)研究对象:胃癌(GC)
2.文章基本信息
杂志 | Nature Communications |
分区 | Q1 |
IF | 17.694 |
发表时间 | 2022.11.12 |
3.核心要素
研究对象(P):接受根治性胃部切除术的胃癌(GC)患者(训练集,n = 264;验证集,n = 264)
预后模型(I/C):LASSO-Cox回归模型构建的病理组学signature;
结局指标(O):总生存期OS,无病生存期DFS
研究类型(S):回顾性队列研究,预后预测类型
研究目的:开发基于病理组学特征的预后预测模型,用于预测胃癌(GC)患者的总生存期(OS)和无病生存期(DFS),并识别出从辅助化疗受益的II期和III期患者。
4.变量分析
预测变量(X):病理组学signature
结局变量(Y): 5年OS、5年DFS
协变量(Z):年龄、性别、ECOG-PS评分、血清肿瘤标志物(CEA、CA19-9)、肿瘤部位、肿瘤大小、肿瘤分级、Lauren分型、肿瘤浸润深度、淋巴结转移、远处转移、TNM分期、是否接受辅助化疗
5.研究背景
临床问题:尽管近年来胃癌的发病率和死亡率显著降低,但患者预后异质性较大,辅助化疗的生存获益也有很大差异;因此,准确地预测预后和辅助化疗获益是临床胃癌患者风险分层不可或缺的一部分。
目前方法不足:目前临床上TNM分期系统提供的预后信息不充分,不能准确识别哪些患者更有可能从辅助化疗中受益;而基于基因表达数据的分型系统受到分析成本和复杂性的限制,未能在临床上受到广泛应用。
本文解决方式:基于此,作者利用组织病理学图像提取病理组学特征,构建预后预测模型,以期为胃癌患者预后分层和临床诊治决策提供参考。
1.workflow展示
Figure 1
我们先来看一下流程图,重点描述病理组学模型PSGC的构建过程
组织切片后进行H&E染色,扫描成数字化图像,选取具有代表性的tile
特征提取(图像质量特征、图像共定位特征、图像粒度特征)
特征选择(LASSO-Cox)
模型构建
1.纳入排除标准建立
第一部分:文章方法部分解读
① 术前接受新辅助化疗、放疗或放化疗
第二部分:PICOS原则梳理
第三部分:纳排及分组结果
3.图像分割
4.特征提取(+数据预处理)
工具:本文特征提取过程采用CellProfiler软件(4.0.7版本)进行。
>>补充:CellProfiler由剑桥Broad研究所开发,是一款免费的生物图像定量分析开源软件(https://cellprofiler.org/)。
特征类型
提取结果
最终共提取90个病理组学特征,每个特征定量的值为10个tile的平均值,用于进一步的统计分析。
5.特征选择
特征选择:在训练集中,采用10折交叉+LASSO-Cox回归模型进行特征选择,最终得到12个病理组学特征(Figure S2),通过所选特征的线性组合构建模型PSGC。
Figure S2
补充材料中对PSGC中的各特征及权重进行了进一步展示:
至此,基于病理组学的预后模型PSGC构建完毕。
6.模型建立
Table 2
基于此,作者构建了融合模型(基于PSGC和TNM分期模型的组合),并绘制列线图:
Figure 3
1.预后模型的评价
Figure 2
Figure 4
Figure S18
Figure S19
>>补充:交互作用(Interaction effect)指两个或多个自变量(A因素和B因素)对于某个结局变量(比如身高)的影响时,A因素和B因素各个水平之间是否存在着相互作用关系,或者说两因素同时存在时的作用是否等于两因素单独作用之和(相加交互作用)或之积(相乘交互作用)。目前多采用在回归方程中纳入因素乘积项的方法进行分析。
交互分析的意义:
▢ 识别对某干预受益最大的人群(亚组);
▢ 识别最可能施加干预的协变量以降低主要暴露因素的效应(另一主要暴露因素不容易施加干预的情况下);
▢ 揭示暴露影响疾病发生的机制;
▢ 提高评价某暴露对结局影响总效应的把握度;
▢ 仅从纯统计学角度,包含交互作用项的模型拟合数据更好。
交互分析适用范围:
▣ X和Y可以是分类变量也可以是连续变量;
▣ 做交互作用检验的变量可以是二分类或多分类变量,如果原始数据是连续变量需要转换为分类变量;
▣ 各种研究类型都可以做:RCT、队列、病例对照、横断面等。
◆ 按不同变量进行分层分析,交互作用P值不显著,表明不同层结果一致;
◆ 交互作用P值显著,则表明不同层结果有差异。
2.融合模型的评价
模型区分度评价:
在训练集中,C-index(for OS)= 0.809,C-index(for DFS)= 0.792;
在验证集中,C-index(for OS)= 0.784,C-index(for DFS)= 0.794。
Table S6
在训练集中,AUROC(for OS)= 0.901,AUROC(for DFS)= 0.891;
在验证集中,AUROC(for OS)= 0.887,AUROC(for DFS)= 0.888。
Figure S15
模型校准度评价:
Figure S16
模型临床获益评价:
Figure S17
模型间的比较:
Table S7
该文是胃癌领域首个基于病理组学预测预后和辅助化疗益处的研究(不得不佩服作者紧跟热点敏锐的嗅觉~);
套路框架完整有条理,多指标评价建立的融合模型,是个值得新手入门学习的模范文章;
通过CellProfiler软件和LASSO-Cox提取、选择特征,可操作性强,难度不大;
将融合模型与传统的TNM分期模型进行对比,对整合上病理组学之后预测性能的提升进行评价,有一定的临床应用价值;
文章使用PSGC预测辅助化疗益处时,检验了PSGC与辅助化疗的交互作用,是文章的一个亮点。
2023-03-07
微信扫码关注该文公众号作者