Redian新闻
>
仅用67位患者的CT数据的影像组学研究如何发表在顶刊欧放?

仅用67位患者的CT数据的影像组学研究如何发表在顶刊欧放?

公众号新闻

一、整体感知


"


1.题目要素拆解


          





文章题目提供了三条信息:

1)预测变量:基于CT的影像组学特征

2)预测结局:前列腺癌骨转移

3)研究对象:CT中无法人眼直接判断是否存在骨转移的前列腺癌患者



2.文章基本信息

  
杂志
European Radiology
分区
2区
IF
7.034
发表时间
24 September 2021



3.核心要素 

研究对象(P):CT中无法人眼直接判断是否存在骨转移的67例前列腺癌患者

分类器(I/C):梯度提升决策树(Gradient Boosting Decision Tree,GBDT)机器学习算法

结局指标(O):是否存在骨转移( 68 Ga-PSMA检测作为参照标准)

研究类型(S):回顾性队列研究,对是否存在骨转移进行分类

研究目的:基于CT图像数据的影像组学特征能否区分前列腺癌患者CT上人眼看不见的骨转移和无骨转移。



4.变量分析 

 

预测变量(X):CT影像组学特征

结局变量(Y):  是否存在骨转移

协变量(Z):年龄、体重、身高、BMI、分期分级、治疗措施等



5.研究背景  

临床问题及研究GAP:前列腺癌的转移性扩散主要发生在骨骼,常常累及骨盆、脊椎、肋骨。约12%的患者在诊断时出现骨转移,预后较差。对于小的骨转移,由于没有明显的骨结构改变,CT中仅能表现出微小的改变,难以很好地区分。临床中通常使用68 Ga-PSMA作为放射性示踪剂结合PET-CT以检测前列腺癌患者的骨转移情况。68 Ga-PSMA检测出骨转移的患者中,CT常常显示出没有骨转移征象。基于CT的影像组学特征在前列腺癌骨转移中的应用可能能够揭示人眼无法直接检测到的信息。

本文解决方式:本研究旨在利用机器学习算法,探讨基于CT的影像组学特征能否区分前列腺癌患者CT上人眼看不见的骨转移和无骨转移。


二、模型构建


" 


1.workflow 

● 数据预处理及增强
● 图像分割:3Dslicer 半自动分割
● 特征提取:从单个分割中计算出每个影像的特征
● 特征选择:ICC>0.90;Boruta降维及特征消除;相关性系数、随机森林模型
 分类器构建及验证:度提升决策树(Gradient Boosting Decision Tree,GBDT)机器学习算法

2.纳入排除标准建立 

 

影像数据来源:

单中心医院队列:2016年5月至2019年6月期间在一个三级转诊中心接受影像学检查的196例胸椎和/或腰椎和/或骨盆中68 Ga-PSMA 阳性的骨转移患者。


纳入标准

胸椎和/或腰椎和/或骨盆中68 Ga-PSMA 阳性的前列腺癌骨转移患者

CT中无法人眼直接判断是否存在骨转移

临床数据完整

排除标准

临床数据不完整

CT中可以直接分辨存在骨转移

患者拒绝使用他们的数据用于医学研究

影像质量不佳


第二部分:PICOS原则梳理
P:
年龄:作者并未对年龄进行限制;(本文:年龄71±7)
分期分级:无限制
治疗方案:无限制(本文手术75%;放化疗100%)
骨转移分类:胸椎、腰椎、左侧髂骨、右侧髂骨、骶骨


I/C:
PET-CT:Discovery VCT 690 PET/CT (GE Healthcare)(n = 38)或 Discovery MI PET/CT (GE Healthcare)(n = 29)
对比剂:68Ga-PSMA (平均剂量 ± 标准差,130 ± 11MBq,范围114-158MBq)


CT:作为PET-CT的一部分
影像设备:CT
影像检查时间点:治疗前;
层厚:1.25 mm
参数:管电压140kVp,自动剂量调制为80mA/切片的管电流,准直512 × 0.976,俯仰1.0,旋转时间0.5 s,覆盖速度78mm/s,视野(FOV)50cm。横向像素尺寸为1.00,切片厚度为1.25 mm。


O:
结局:是否存在骨转移(CT中人眼无法分辨的)

第三部分:纳排及分组结果

共纳入67名患者(表1),根据PET-CT结果,67名患者的椎骨、髂骨、骶骨中共有205个存在骨转移、86个不存在骨转移(表2)。通过数据增强方法带多数类权重的少数类样本过采样(MWMOTE),使得骨转移组(n=205)和正常骨组(n=205)的样本量一致。然后使用0.8:0.2的比率将平衡的数据集随机分为训练集(n = 328,n = 164个骨转移和 n = 164个正常骨)和验证集(n = 82,n = 41个骨转移和 n = 41个正常骨)。




3.图像分割  

① 由两名医生(分别具有1年和4年肿瘤放射学经验)在独立、盲法的情况下对CT图像使用3D Slicer进行半自动分割(图2)。

② 转移骨的分割:使用标准段编辑器工具手动分割具有68Ga-PSMA 阳性骨转移(67例患者中总共205个转移)的整个骨(例如整个椎骨或整个髂骨)

③正常骨的分割:手动分割在PET/CT 上显示无骨转移的胸/腰椎和骨盆骨 (67名患者中共有86个正常骨) 



4.预处理及数据增强 

预处理目的:在特征提取之前,对分割的图像进行预处理,以尽量减少对比度和亮度变化对纹理特征的影响。

预处理方法:使用 sitkBSpline 作为 SimpleITK 常数对图像进行空间重采样至2 × 2 × 2mm; 将信号强度值离散至25的容器宽度,并进行相对强度的重新缩放(relative intensity rescaling)。

数据增强目的:解决数据集轻微不平衡现象,以实现数据平衡、避免模型的过拟合。

数据增强方法:利用R中的imbalance包进行数据增强,并通过imbalance包中的MWMOTE算法对少数类进行过采样。MWMOTE算法通过利用多数类权重的少数类样本合成多数类样本,使得骨转移组(n=205)和正常骨组(n=205)的样本量一致。



5.特征提取

特征提取及计算特征值

工具:本文特征提取及计算采用pyRadiomics进行,提取到五个方面的特征:

➤ histogram

➤ gray-level cooccurrence matrix (GLCM)

gray-level run length matrix (GLRLM)

gray-level size zone matrix (GLSZM)

gray-level dependence matrix (GLDM).


特征提取:

voxelArrayShift设置为1000,使用pyRadiomics对所有分割好的骨进行特征提取。

  提取上述五个方面的特征

对于每个特征矩阵,应用附加小波滤波(每级8次分解)和5种不同的高斯滤波器拉普拉斯滤波(sigma 值分别为1,2,3,4和5)

没有提取形状特征


提取结果

提取1218个影像学特征(五个方面)



6. 重复性分析

① 医生1在分割后4周随机选择10例患者进行分割,从而确定观察者内重复性;医生2分割相同的图像,已确定观察者间重复性。

②  通过计算组内相关系数(ICC)来评估观察者内部和观察者间影像组学特征的一致性。采用0.90的截断值来选择高度可重复性的特征。



7.特征选择

根据观察者内部和观察者间重复性的计算,总共排除了1218个特征中的367个,ICC < 0.90被认为是不可重复的。
在使用 Z-score标准化将所有特征标准化后,其余851个特征被输入 Boruta 降维和特征消除算法,从而选择出对分类的准确性最重要的105个特征(图S1)。


由于Boruta算法不考虑数据的共线性问题,下一步计算相关性矩阵以检测高度相关的特征(Pearson 系数大于0.6)(图3),在对11个检测到的相关聚类中的每个聚类拟合单独的随机森林模型(random forest models),从每个聚类中只选择一个平均递减准确度指数(mean decrease accuracy index )最高的特征用于进一步分析。



上下滑动

最终选择的11个特征:
log.sigma.5.0.mm GLDM dependence non-uniformity normalized, wavelet-LHL-transformed GLSZM gray-level non-uniformity (GLN), log.sigma.4.0.mm GLSZM zone percentage, log.sigma.5.0.mm GLCM inverse variance, wavelet-HHL-transformed first-order mean, wavelet-LHH-transformed first-order entropy, wavelet-LLL-transformed GLSZM large-area low gray-level emphasis (LALGLE), wavelet-HHH-transformed GLSZM large-area high gray-level emphasis (LAHGLE), wavelet-HLL-transformed GLCM cluster shade, log.sigma.5.0.mm GLDM dependence variance, and wavelet-LHH transformed GLDM large dependence low gray-level emphasis (LDLGLE)


三、影像组学分类器的建立及评价


"

影像组学分类器的构建方法:
① 训练集样本分为正常骨和骨转移骨,对选定的11个影像组学特征进行梯度提升决策树(Gradient Boosting Decision Tree,GBDT)机器学习算法
②模型调参:nround = 50,max _ deep = 3,eta = 0.4,γ = 0,colsample _ bytree = 0.8,min _ child _ weight = 1,subsample = 0.75
分类器的表现:
① 在测试集中采样留一法交叉验证检测模型的表现。经过训练的模型在测试集中的分类准确度为0.84(95% CI : 0.74-0.91,p < 0.001) ),灵敏度为78% ,特异性为90% (图4a)
②图4b表明某些模型过拟合。进一步的特征减少并没有导致模型的性能提升。

  

四、全文总结


"

本文建立了一个基于CT的影像组学分类器模型来区分人眼无法识别存在骨转移情况的前列腺癌患者的CT图像中,是否存在骨转移征象。以68Ga-PSMA PET/CT 作为参考标准,在选定的11个最重要的 CT 衍生的影像特征上训练的梯度增强树模型达到了90% 的诊断准确性,灵敏度为91% ,特异性为88% 。该分类器能够准确区分前列腺癌患者的有无骨转移情况,以减少漏诊,有希望作为前列腺癌骨转移的筛选方法。


优点


①临床意义:利用CT筛选前列腺癌骨转移患者, 解决 CT 中常常出现的转移性骨病的漏诊情况。
②预测结局:检测人眼无法判断有无骨转移的CT图像中是否存在骨转移现象,较为创新
③ 数据处理、特征筛选、模型构建的过程比较严谨
④患者的临床数据较为完善,模型表现较好

局限性


①单中心,样本量较小,缺乏样本量较大的外部验证;

②回顾性研究的一些固有缺陷,成像方案(如采集和重建参数)的标准化不足;

③缺乏足够的验证、统计 I类错误的存在阻碍了研究向临床转化的实现;

④没有68Ga-PSMA 摄取的骨盆骨和椎骨被认为是不受影响的、无转移的骨;

⑤数据增强处理,部分数据来自于同一患者的不同观察结果的配对数据,可能导致模型存在过拟合;

⑥没有结合临床参数构建模型。


END


撰文丨卡特
排版丨顶顶

 


【5月福利贴】领取最新SCI期刊-肿瘤方向资源包

2023-05-05

想做免疫检查点抑制剂治疗的影像组学研究没有思路?你想知道的都在这里!

2023-05-02


 

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
76例患者发顶刊,时序性分析:影像组学的新赛道救命!我以为影像组学都被别人发完了,没想到还有这种发1区的思路【宏观市场】如何看待财政与经济增长数据的背离?—评2023年1-2月财政数据仅需一点点深度学习的魔法配方,这篇影像组学文章竟发到了顶刊Radiology!直播预告:大模型在多维多组学MDMM靶点开发中的应用和生成式医学影像智能报告系统ReportGPTLA牙科诊所被盗!数百位患者信息或成暗网交易目标 与乘客发生争执 Uber司机遭枪杀七律 春情 真韵中国科学家领衔Science最新特刊!医学基因组学研究将进入AI时代长篇小说《如絮》第一百零一章 香港-1951年 3 相聚和离开影像组学+免疫治疗,小白可以看看这些ideaNature:剑桥大学徐宇/Michael Inouye构建出直接从基因型预测多组学数据的独特资源10万中国留学生涌入英国,英国正研究如何控制国际生数量...第二届锐捷大赛,“ICT数智人才”全国选拔赛启动双林奇案录第三部之天禅寺: 第三节茅台集团微生物研究团队顶刊发表“菌群识别技术”重要成果纵观SCI风云变幻,且看影像组学期刊“沉浮”加拿大研究:未接种疫苗的COVID-19患者死亡风险是接种疫苗者的15倍Bard是拿ChatGPT数据训练的?谷歌顶级科学家抗议无果,出走OpenAI生物谷上海免疫所联合主办 | 汤富酬、苏冰、曹罡等教授邀您参加第六届单细胞多组学研究与临床应用峰会!谷歌顶级AI专家加入OpenAI 曾警告谷歌不要用ChatGPT数据训练Bard20位嘉宾已确认!有没有你pick的那位?第六届单细胞多组学研究与临床应用峰会9月14日上海召开!谷歌Bard是拿ChatGPT数据训练的?BERT一作抗议无果,跳槽OpenAI...项目路演征集 · 投融资对接 | 2023(第六届)单细胞多组学研究与临床应用峰会研发投入回报率降至1.2%,临床研究如何才能降本增效?想做免疫检查点抑制剂治疗的影像组学研究没有思路?你想知道的都在这里!影像组学新思路:“多参数MRI+机器学习”助力前列腺癌精准治疗影像组学+外部验证?2区起步不是梦!外派故事 (23)- 第二次七年之痒只有83例患者的病理组学研究竟然发到nature大子刊!有奖注册 | 港大杨万岭教授、协和吴晨教授等开讲:复杂免疫疾病中的多组学研究蝴蝶农场的故事(2)PCR怎么跑才漂亮?师兄仅用6天给我展示了逆天实验结果!5+SCI稳了!谷歌Bard被曝直接抄ChatGPT数据,BERT一作投诉CEO后投奔OpenAI7 Papers & Radios | GPT-4学会反思;ChatGPT数据标注比人便宜20倍时序性影像组学分析的具体步骤
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。