杂志 | Cancer |
分区 | 2区 |
IF | 6.575 |
发表时间 | 14 December 2022 |
结局指标(O):诊断临床上显著的 PCa (clinically significant PCa, csPCa)(GG≥3)研究类型(S):回顾性队列研究,对GG ≥3和GG=1或2进行分类研究目的:开发了一种基于MRI的非侵入性机器学习算法,用于早期预测 csPCa① mpMRI:在过去十年,用于诊断临床怀疑患有前列腺癌的患者(PCa)的策略已从系统性活检转变为首先使用多参数磁共振成像(mpMRI)。与单独进行系统活检相比,mpMRI 靶向活检已被证明能够提高临床上显著的 PCa (clinically significant PCa, csPCa)的诊断,mpMRI有许多的局限性,如扫描质量或报告的变异性、读者阅片的变异性以及学习曲线较为陡峭。mpMRI-衍生的参数如表观扩散系数值(ADC)能够用于PCa患者的风险分层。但其主要是基于视觉特征,常常受到医师的限制。影像组学和机器学习的方式能够提高mpMRI的诊断能力。②PCa:Gleason 分级组(GG)≥3的患者与 GG1和 GG2患者相比,预后明显较差,因此确定具有不良肿瘤结局风险的男性对于提供最佳治疗至关重要。鉴别 csPCa 与良性或非csPCa对于临床患者管理来说非常重要,在器官局限性 PCa 的临床管理中,主动监测是低风险疾病(GG1)根治性治疗的安全替代方案,而其对有利中等风险 PCa (GG = 2)仍然存在争议。本研究利用机器学习算法,开发一个基于ML 模型来预测csPCa (即 GG ≥3)。同时建立了一个基于提取局部放射性特征的图像处理程序,通过这个程序分析了 GG1、 GG2和 GG ≥3之间的相似性和差异性。这使得甚至在任何活检检查之前就可以预测高风险疾病。
A.图像采集:mpMRI,生成ADC
B.图像分割:ImageJ ,放射科医师手动分割
C.特征提取:来自ADC
D.特征选择:LASSO+ Wilcoxon rank-sum test
E.分类器构建及验证:SVM机器学习算法
观察性、回顾性、单中心研究:2020年9月至2021年12月在放射科进行mpMRI 上至少有一个 PIRADS ≥3病变的220名患者被纳入。① mpMRI 方案不完全符合欧洲前列腺癌研究指南中提出的成像方案第二部分:PICOS原则梳理
年龄:作者并未对年龄进行限制,本研究中年龄平均71.3 ± 7.4分期分级:根据Gleason分级, 肿瘤病变从1到5分级。最终确诊117例 PCa 病变,其中61例 GG < 3,56例 GG ≥3影像设备:1.5T扫描仪(Signa HDxt; GE Healthcare, Chicago, IL, USA)
序列:快速松弛快速旋转回声(Fast Relaxation Fast Spin Echo, FR-FSE) T2w,DWI 和动态对比增强(DCE)序列
扫描参数:依据已发表的文章“Gaudiano, Caterina et al. “PI-RADS version 2.1 for the evaluation of transition zone lesions: a practical guide for radiologists.” The British journal of radiology vol. 95,1131 (2022): 20210916. doi:10.1259/bjr.20210916”。
DWI参数如下:
获得ADC(Apparent diffusion coefficient,表观弥散系数):使用couple b = 50,1000 s/mm2处理以获得 ADC 图
O:
结局:穿刺活检病例诊断PCa的分级(GG是否大于等于3)
第三部分:纳排及分组结果
最终纳入102例患者,患者的基线资料表以及临床病理活检特征如下表:
由于 ADC在评估外周和过渡区中的作用,作者决定专门纳入 ADC,这也有利于分析双参数 MRI 方案中的适用性。③ 检索到 mpMRI 结果后,对 ADC 进行手动分割,在 T2上得到相应的检查,沿着可见的边界勾画出可疑的病变区域和整个前列腺区域。④在合适的windowing处理后,放射科医师使用ImageJ v1.53对ROI区域进行勾画。Bevilacqua, Alessandro et al. “The Primacy of High B-Value 3T-DWI Radiomics in the Prediction of Clinically Significant Prostate Cancer.” Diagnostics (Basel, Switzerland) vol. 11,5 739. 21 Apr. 2021, doi:10.3390/diagnostics11050739
在前列腺 ROI (图2a)内局部计算10个一阶特征(即平均值,中值,峰度,偏度,熵,均匀性,四分差,变易系数,标准差和中值平均差) ,其中每个像素被分配一个在矩形窗口上计算的一阶特征(以像素本身为中心)(图2b)。因此,通过 PCa ROI 的二进制掩码实现并过滤特征的10(比色)参数映射(图2c)。经过初步测试,选择了9 × 9像素的窗口作为最佳窗口。然后,通过12个全局描述符(即与上面相同的10个一阶特征,加上像素分布的最后十分位数的平均值和中位数) ,将 PCa 内基于像素的测量值总结为单个值(图2d) ; 这产生了120个放射性特征(图2e)。此外,还在 ADC 映射上计算了12个全局描述符(图2f)。特征选择:两个步骤 Lasso+Wilcoxon rank sum test基于研究人群的最小样本量(56例GG≥3),作者决定最多包含4个影像组学特征来构建预测GG≥3的“影像组学特征”。① 首先,基于LASSO回归,利用10折交叉验证(cross-validation,CV)在最小CV误差规则下搜索筛选特征子集,并根据样本所属类别(GG < 3和GG≥3)的先验概率对样本进行加权;②最终的特征向量通过支持向量机(SVM)(具有线性核)进行筛选,其数量相当于第一阶段四个特征的所有可能组合的总数。最后的组合在判别能力最强的组合中被选择为知情度(I)最高的组合,即Wilcoxon秩和检验的p值最小,p < 10−3,同时考虑Holm-Bonferroni校正。从132个特征开始,LASSO检测出17个特征的初步子集。88个4-dim特征向量的结果是显著的(p < 10−7),以I=0.68选择了其中最具分辨力的特征向量。最终的特征向量由局部变异系数的中位数(𝑐𝑣−𝑚)、局部均值的均匀性(𝜇−𝑢)、局部偏度的偏度(𝑠−𝑠)和IQR指的标准偏差(𝜎−𝐼𝑄𝑅)组成。图3显示𝑐𝑣(b)、𝜇(c)、s (d)和𝜎(e)的四个比色图的非cspca (GG2)的代表性ADC切片(a)的示例。为了验证本研究对研究人群的临床假设,采用前期选择的4-dim 特征向量对不同 GGs 进行相似性分析:GG = 1,GG = 2和 GG = 3之间的多重比较,并扩展到 GG ≥3。结果:箱线图显示了影像组学特征能够区分 GG = 1,GG = 2和 GG ≥3,并且所有组之间存在显着差异(p~10-11).① 特征增强以提高训练集和测试集的统计显著性:方法依据既往发表的文章Renzulli, Matteo et al. “Automatically Extracted Machine Learning Features from Preoperative CT to Early Predict Microvascular Invasion in HCC: The Role of the Zone of Transition (ZOT).” Cancers vol. 14,7 1816. 3 Apr. 2022, doi:10.3390/cancers14071816。过采样特征各有200个样本,GG < 3和GG≥3平均分配,分别为负(N)类和正(P)类,为了评估增强特征的统计代表性,在原始人群上建立了一个初步模型,并与最终分类器进行了比较。②基于支持向量(SV)在特征空间中的位置,采用线性SVM分类器开发预测模型。线性核使用了最小数量的超参数,从而有助于最小化原始总体的过拟合风险。最后,这一选择使得能够对原始总体和扩增后的模型进行合理的比较。对于在过采样数据集上开发的确定模型,使用SVM边缘规则将总样本的四分之三分配到训练阶段,而最后1 / 4的样本留给外部测试,每个子集保持P和N的实例比例相等。SVM训练采用100次3倍交叉验证,每次使用MatLab内置贝叶斯优化算法估计SVM超参数、线性尺度𝛾和错误分类代价C。③对于每个训练过的SVM,使用二项式logit函数预测样本属于估计类别(即影像组学评分)的可能性。①构建受试者工作特征(ROC)曲线,每次SVM运行时,选择测试集上AUC最高的模型。最后,在整个训练集中对剩余模型进行评估,并根据AUC和I递减值进行排序。选择两种指标性能最高的分类器并在测试集上进行验证。②使用AUC、SN、SP、I、阳性预测值(positive predictive value, PPV)和NPV评估分类性能。① SVM预测模型: 𝛾=0.0366、𝐶=0.0010。根据特征递减顺序,cv-m,𝜎−𝐼𝑄𝑅, , 𝜇−𝑢, 𝑠−𝑠 最重要,公式如下:在训练集中AUC = 0.90 (95% CI, 0.84-0.95), SN = 85%, SP = 87%,得到I = 0.72。在测试集中, AUC = 0.88 (95% CI, 0.68 ~ 0.94), SN = SP = 84%,对应I = 0.68。训练集的PPV和NPV分别为86%和85%,而测试集的PPV和NPV均为84%。因此,在训练集中用10个FP和11个FN,在测试集中用4个FP和FN误差实现了GG≥3的预测。④ 初步模型的分类结果:为了完整起见,研究者还分析了在没有任何特征样本增强的情况下开发的初步模型的性能。本研究利用机器学习算法,开发一个基于 ADC 的 ML 模型来促进利用mpMRI 对csPCa (即 GG ≥3)进行预测。以靶向活检的病理诊断分级为标准,利用LASSO和SVM机器学习算法对源自于ADC的132个影像组学特征进行筛选,得到4个特征用于构建分类器模型。该模型除了能很好地预测csPCa外(测试集的敏感性=特异性= 84%),本研究还将GG = 2的患者归类于为非csPCa(在统计学上相当于GG = 1),因此GG = 2的患者可以接受随访,而GG≥3的患者需要接受根治性治疗。①临床意义:通过机器学习方法对影像组学特征进行活检前评估,可以帮助临床医师避免患者进行不必要的活检,尤其是在交界性病例中。在大多数研究都聚焦于PCa的诊断和预后研究时,本研究关注PCa的分级管理,选题创新。②影像学处理:来自于mpMRI生成ADC的ML应用,较为少见。③方法学:影像组学特征产生了对应于ADC切片的参数色彩图。这有助于多学科团队中的临床医师对组织特性进行特征解读和更广泛的理解。④预测性能好:AUC、SN、SP等指标在训练集和测试集中都表现出很好的预测性能。②患者在一个医院接受mpMRI 和 MRI 靶融合活检,从而增加了研究人群的同质性④由于临床和病理 GG 之间可能存在显著差异,依赖于活检样本的 ML 模型可能影响区分病理 GG1、2和 GG3的准确性, 需要进一步根据接受根治性前列腺切除术治疗的患者的病理标本来验证模型撰文丨卡特
排版丨顶顶