仅用67位患者的CT数据的影像组学研究如何发表在顶刊欧放?
一、整体感知
"
1.题目要素拆解
文章题目提供了三条信息:
1)预测变量:基于CT的影像组学特征
2)预测结局:前列腺癌骨转移
3)研究对象:CT中无法人眼直接判断是否存在骨转移的前列腺癌患者
2.文章基本信息
3.核心要素
研究对象(P):CT中无法人眼直接判断是否存在骨转移的67例前列腺癌患者
分类器(I/C):梯度提升决策树(Gradient Boosting Decision Tree,GBDT)机器学习算法
结局指标(O):是否存在骨转移( 68 Ga-PSMA检测作为参照标准)
研究类型(S):回顾性队列研究,对是否存在骨转移进行分类
研究目的:基于CT图像数据的影像组学特征能否区分前列腺癌患者CT上人眼看不见的骨转移和无骨转移。
4.变量分析
预测变量(X):CT影像组学特征
结局变量(Y): 是否存在骨转移
协变量(Z):年龄、体重、身高、BMI、分期分级、治疗措施等
5.研究背景
临床问题及研究GAP:前列腺癌的转移性扩散主要发生在骨骼,常常累及骨盆、脊椎、肋骨。约12%的患者在诊断时出现骨转移,预后较差。对于小的骨转移,由于没有明显的骨结构改变,CT中仅能表现出微小的改变,难以很好地区分。临床中通常使用68 Ga-PSMA作为放射性示踪剂结合PET-CT以检测前列腺癌患者的骨转移情况。68 Ga-PSMA检测出骨转移的患者中,CT常常显示出没有骨转移征象。基于CT的影像组学特征在前列腺癌骨转移中的应用可能能够揭示人眼无法直接检测到的信息。
本文解决方式:本研究旨在利用机器学习算法,探讨基于CT的影像组学特征能否区分前列腺癌患者CT上人眼看不见的骨转移和无骨转移。
二、模型构建
"
1.workflow
2.纳入排除标准建立
单中心医院队列:2016年5月至2019年6月期间在一个三级转诊中心接受影像学检查的196例胸椎和/或腰椎和/或骨盆中68 Ga-PSMA 阳性的骨转移患者。
✤ 胸椎和/或腰椎和/或骨盆中68 Ga-PSMA 阳性的前列腺癌骨转移患者
✤ CT中无法人眼直接判断是否存在骨转移
✤ 临床数据完整
❖ 临床数据不完整
❖ CT中可以直接分辨存在骨转移
❖ 患者拒绝使用他们的数据用于医学研究
❖ 影像质量不佳
第三部分:纳排及分组结果
共纳入67名患者(表1),根据PET-CT结果,67名患者的椎骨、髂骨、骶骨中共有205个存在骨转移、86个不存在骨转移(表2)。通过数据增强方法带多数类权重的少数类样本过采样(MWMOTE),使得骨转移组(n=205)和正常骨组(n=205)的样本量一致。然后使用0.8:0.2的比率将平衡的数据集随机分为训练集(n = 328,n = 164个骨转移和 n = 164个正常骨)和验证集(n = 82,n = 41个骨转移和 n = 41个正常骨)。
3.图像分割
① 由两名医生(分别具有1年和4年肿瘤放射学经验)在独立、盲法的情况下对CT图像使用3D Slicer进行半自动分割(图2)。
② 转移骨的分割:使用标准段编辑器工具手动分割具有68Ga-PSMA 阳性骨转移(67例患者中总共205个转移)的整个骨(例如整个椎骨或整个髂骨)
③正常骨的分割:手动分割在PET/CT 上显示无骨转移的胸/腰椎和骨盆骨 (67名患者中共有86个正常骨)
4.预处理及数据增强
预处理目的:在特征提取之前,对分割的图像进行预处理,以尽量减少对比度和亮度变化对纹理特征的影响。
预处理方法:使用 sitkBSpline 作为 SimpleITK 常数对图像进行空间重采样至2 × 2 × 2mm; 将信号强度值离散至25的容器宽度,并进行相对强度的重新缩放(relative intensity rescaling)。
数据增强目的:解决数据集轻微不平衡现象,以实现数据平衡、避免模型的过拟合。
数据增强方法:利用R中的imbalance包进行数据增强,并通过imbalance包中的MWMOTE算法对少数类进行过采样。MWMOTE算法通过利用多数类权重的少数类样本合成多数类样本,使得骨转移组(n=205)和正常骨组(n=205)的样本量一致。
5.特征提取
工具:本文特征提取及计算采用pyRadiomics进行,提取到五个方面的特征:
➤ histogram
➤ gray-level cooccurrence matrix (GLCM)
➤ gray-level run length matrix (GLRLM)
➤ gray-level size zone matrix (GLSZM)
➤ gray-level dependence matrix (GLDM).
特征提取:
▷ voxelArrayShift设置为1000,使用pyRadiomics对所有分割好的骨进行特征提取。
▷ 提取上述五个方面的特征
▷ 对于每个特征矩阵,应用附加小波滤波(每级8次分解)和5种不同的高斯滤波器拉普拉斯滤波(sigma 值分别为1,2,3,4和5)
▷ 没有提取形状特征
提取结果:
提取1218个影像学特征(五个方面)
6. 重复性分析
① 医生1在分割后4周随机选择10例患者进行分割,从而确定观察者内重复性;医生2分割相同的图像,已确定观察者间重复性。
② 通过计算组内相关系数(ICC)来评估观察者内部和观察者间影像组学特征的一致性。采用0.90的截断值来选择高度可重复性的特征。
7.特征选择
上下滑动
三、影像组学分类器的建立及评价
"
四、全文总结
"
优点
局限性
①单中心,样本量较小,缺乏样本量较大的外部验证;
②回顾性研究的一些固有缺陷,成像方案(如采集和重建参数)的标准化不足;
③缺乏足够的验证、统计 I类错误的存在阻碍了研究向临床转化的实现;
④没有68Ga-PSMA 摄取的骨盆骨和椎骨被认为是不受影响的、无转移的骨;
⑤数据增强处理,部分数据来自于同一患者的不同观察结果的配对数据,可能导致模型存在过拟合;
⑥没有结合临床参数构建模型。
END
2023-05-05
2023-05-02
微信扫码关注该文公众号作者