仅用67位患者的CT数据的影像组学研究如何发表在顶刊欧放？

公众号新闻

2023-05-18 08:05

一、整体感知

1.题目要素拆解

文章题目提供了三条信息：

1）预测变量：基于CT的影像组学特征

2）预测结局：前列腺癌骨转移

3）研究对象：CT中无法人眼直接判断是否存在骨转移的前列腺癌患者

2.文章基本信息

杂志	European Radiology
分区	2区
IF	7.034
发表时间	24 September 2021

3.核心要素

研究对象（P）：CT中无法人眼直接判断是否存在骨转移的67例前列腺癌患者

分类器（I/C）：梯度提升决策树（Gradient Boosting Decision Tree，GBDT）机器学习算法

结局指标（O）：是否存在骨转移（ ⁶⁸ Ga-PSMA检测作为参照标准）

研究类型（S）：回顾性队列研究，对是否存在骨转移进行分类

研究目的：基于CT图像数据的影像组学特征能否区分前列腺癌患者CT上人眼看不见的骨转移和无骨转移。

4.变量分析

预测变量（X）：CT影像组学特征

结局变量（Y）: 是否存在骨转移

协变量（Z）：年龄、体重、身高、BMI、分期分级、治疗措施等

5.研究背景

临床问题及研究GAP：前列腺癌的转移性扩散主要发生在骨骼，常常累及骨盆、脊椎、肋骨。约12%的患者在诊断时出现骨转移，预后较差。对于小的骨转移，由于没有明显的骨结构改变，CT中仅能表现出微小的改变，难以很好地区分。临床中通常使用68 Ga-PSMA作为放射性示踪剂结合PET-CT以检测前列腺癌患者的骨转移情况。68 Ga-PSMA检测出骨转移的患者中，CT常常显示出没有骨转移征象。基于CT的影像组学特征在前列腺癌骨转移中的应用可能能够揭示人眼无法直接检测到的信息。

本文解决方式：本研究旨在利用机器学习算法，探讨基于CT的影像组学特征能否区分前列腺癌患者CT上人眼看不见的骨转移和无骨转移。

二、模型构建

1.workflow

● 数据预处理及增强

● 图像分割：3Dslicer 半自动分割

● 特征提取：从单个分割中计算出每个影像的特征

● 特征选择：ICC>0.90；Boruta降维及特征消除；相关性系数、随机森林模型

● 分类器构建及验证：梯度提升决策树（Gradient Boosting Decision Tree，GBDT）机器学习算法

2.纳入排除标准建立

影像数据来源：

单中心医院队列：2016年5月至2019年6月期间在一个三级转诊中心接受影像学检查的196例胸椎和/或腰椎和/或骨盆中68 Ga-PSMA 阳性的骨转移患者。

纳入标准

✤ 胸椎和/或腰椎和/或骨盆中68 Ga-PSMA 阳性的前列腺癌骨转移患者

✤ CT中无法人眼直接判断是否存在骨转移

✤ 临床数据完整

排除标准

❖ 临床数据不完整

❖ CT中可以直接分辨存在骨转移

❖ 患者拒绝使用他们的数据用于医学研究

❖ 影像质量不佳

第二部分：PICOS原则梳理

P：

年龄：作者并未对年龄进行限制；（本文：年龄71±7）

分期分级：无限制

治疗方案：无限制（本文手术75%；放化疗100%）

骨转移分类：胸椎、腰椎、左侧髂骨、右侧髂骨、骶骨

I/C：

PET-CT：Discovery VCT 690 PET/CT (GE Healthcare)(n = 38)或 Discovery MI PET/CT (GE Healthcare)(n = 29)

对比剂：68Ga-PSMA (平均剂量 ± 标准差，130 ± 11MBq，范围114-158MBq)

CT：作为PET-CT的一部分

影像设备：CT

影像检查时间点：治疗前；

层厚：1.25 mm

参数：管电压140kVp，自动剂量调制为80mA/切片的管电流，准直512 × 0.976，俯仰1.0，旋转时间0.5 s，覆盖速度78mm/s，视野(FOV)50cm。横向像素尺寸为1.00，切片厚度为1.25 mm。

O：

结局：是否存在骨转移（CT中人眼无法分辨的）

第三部分：纳排及分组结果

共纳入67名患者（表1），根据PET-CT结果，67名患者的椎骨、髂骨、骶骨中共有205个存在骨转移、86个不存在骨转移（表2）。通过数据增强方法带多数类权重的少数类样本过采样（MWMOTE），使得骨转移组（n=205）和正常骨组（n=205）的样本量一致。然后使用0.8:0.2的比率将平衡的数据集随机分为训练集(n = 328，n = 164个骨转移和 n = 164个正常骨)和验证集(n = 82，n = 41个骨转移和 n = 41个正常骨)。

3.图像分割

① 由两名医生（分别具有1年和4年肿瘤放射学经验）在独立、盲法的情况下对CT图像使用3D Slicer进行半自动分割（图2）。

② 转移骨的分割：使用标准段编辑器工具手动分割具有68Ga-PSMA 阳性骨转移(67例患者中总共205个转移)的整个骨(例如整个椎骨或整个髂骨)

③正常骨的分割：手动分割在PET/CT 上显示无骨转移的胸/腰椎和骨盆骨 (67名患者中共有86个正常骨)

4.预处理及数据增强

预处理目的：在特征提取之前，对分割的图像进行预处理，以尽量减少对比度和亮度变化对纹理特征的影响。

预处理方法：使用 sitkBSpline 作为 SimpleITK 常数对图像进行空间重采样至2 × 2 × 2mm; 将信号强度值离散至25的容器宽度，并进行相对强度的重新缩放（relative intensity rescaling）。

数据增强目的：解决数据集轻微不平衡现象，以实现数据平衡、避免模型的过拟合。

数据增强方法：利用R中的imbalance包进行数据增强，并通过imbalance包中的MWMOTE算法对少数类进行过采样。MWMOTE算法通过利用多数类权重的少数类样本合成多数类样本，使得骨转移组（n=205）和正常骨组（n=205）的样本量一致。

5.特征提取

特征提取及计算特征值：

工具：本文特征提取及计算采用pyRadiomics进行，提取到五个方面的特征：

➤ histogram

➤ gray-level cooccurrence matrix (GLCM)

➤ gray-level run length matrix (GLRLM)

➤ gray-level size zone matrix (GLSZM)

➤ gray-level dependence matrix (GLDM).

特征提取：

▷ voxelArrayShift设置为1000，使用pyRadiomics对所有分割好的骨进行特征提取。

▷ 提取上述五个方面的特征

▷ 对于每个特征矩阵，应用附加小波滤波(每级8次分解)和5种不同的高斯滤波器拉普拉斯滤波(sigma 值分别为1,2,3,4和5)

▷ 没有提取形状特征

提取结果：

提取1218个影像学特征（五个方面）

6. 重复性分析

① 医生1在分割后4周随机选择10例患者进行分割，从而确定观察者内重复性；医生2分割相同的图像，已确定观察者间重复性。

② 通过计算组内相关系数(ICC)来评估观察者内部和观察者间影像组学特征的一致性。采用0.90的截断值来选择高度可重复性的特征。

7.特征选择

① 根据观察者内部和观察者间重复性的计算，总共排除了1218个特征中的367个，ICC < 0.90被认为是不可重复的。

② 在使用 Z-score标准化将所有特征标准化后，其余851个特征被输入 Boruta 降维和特征消除算法，从而选择出对分类的准确性最重要的105个特征（图S1）。

③ 由于Boruta算法不考虑数据的共线性问题，下一步计算相关性矩阵以检测高度相关的特征（Pearson 系数大于0.6）（图3），在对11个检测到的相关聚类中的每个聚类拟合单独的随机森林模型（random forest models），从每个聚类中只选择一个平均递减准确度指数（mean decrease accuracy index ）最高的特征用于进一步分析。

上下滑动

最终选择的11个特征：

log.sigma.5.0.mm GLDM dependence non-uniformity normalized, wavelet-LHL-transformed GLSZM gray-level non-uniformity (GLN), log.sigma.4.0.mm GLSZM zone percentage, log.sigma.5.0.mm GLCM inverse variance, wavelet-HHL-transformed first-order mean, wavelet-LHH-transformed first-order entropy, wavelet-LLL-transformed GLSZM large-area low gray-level emphasis (LALGLE), wavelet-HHH-transformed GLSZM large-area high gray-level emphasis (LAHGLE), wavelet-HLL-transformed GLCM cluster shade, log.sigma.5.0.mm GLDM dependence variance, and wavelet-LHH transformed GLDM large dependence low gray-level emphasis (LDLGLE)

三、影像组学分类器的建立及评价

影像组学分类器的构建方法：

① 训练集样本分为正常骨和骨转移骨，对选定的11个影像组学特征进行梯度提升决策树（Gradient Boosting Decision Tree，GBDT）机器学习算法

②模型调参：nround = 50，max _ deep = 3，eta = 0.4，γ = 0，colsample _ bytree = 0.8，min _ child _ weight = 1，subsample = 0.75

分类器的表现：

① 在测试集中采样留一法交叉验证检测模型的表现。经过训练的模型在测试集中的分类准确度为0.84(95% CI : 0.74-0.91，p < 0.001) ），灵敏度为78% ，特异性为90% (图4a)

②图4b表明某些模型过拟合。进一步的特征减少并没有导致模型的性能提升。

四、全文总结

本文建立了一个基于CT的影像组学分类器模型来区分人眼无法识别存在骨转移情况的前列腺癌患者的CT图像中，是否存在骨转移征象。以68Ga-PSMA PET/CT 作为参考标准，在选定的11个最重要的 CT 衍生的影像特征上训练的梯度增强树模型达到了90% 的诊断准确性，灵敏度为91% ，特异性为88% 。该分类器能够准确区分前列腺癌患者的有无骨转移情况，以减少漏诊，有希望作为前列腺癌骨转移的筛选方法。