影像组学+外部验证?2区起步不是梦!
01
整体感知
01
题目要素拆解
02
文章基本信息
03
核心要素
04
变量分析
05
研究背景
注:WHO/ISUP分级系统适用于透明细胞肾细胞癌和乳头状肾细胞癌,根据瘤细胞的形态及在不同倍数视野下核仁大小和明显程度将肿瘤分为4级:1级400倍镜下瘤细胞未见核仁或核仁不明显。2级是400倍下瘤细胞可见清晰核仁,但100倍下核仁不明显或不清晰。3级是100倍下可以看见清晰的核仁。4级是瘤细胞异型性明显,可伴有肉瘤的分化或瘤巨细胞。
02
模型构建
01
workflow展示
我们先来看一下流程图:
VOI分割(CT平扫图像、皮髓质期图像和肾造影期图像)
特征提取(一阶统计学特征、纹理特征、形态特征、小波特征)
特征选择(ICC值>0.75、独立分类信息最大化准则、RFECV)
模型构建与评价(随机森林分类器、ROC曲线)
02
纳入排除标准建立
①病理证实为ccRCC的患者;
②术前进行肾CT动态增强扫描的患者;
③病理报告中有核分级。
①术前1周以前进行CT扫描;
②CT图像的层厚非5mm。
年龄:见Table 1
性别:见Table 1
疾病状态:首诊初治
诊断标准:T分期——根据美国癌症联合委员会[AJCC]指南,由放射科医生通过CT图像确定;核分级——根据2016年WHO/ISUP分级系统,在100倍和400倍的病理图像上,分1、2、3、4级,由两名病理学家独立分析,发生歧义时由第三名病理学家解决
影像设备:中心A和中心B均使用德国西门子64层螺旋 CT(型号:中心A——SOMATOM Definition;中心B——SOMATOM Force)
扫描序列:平扫、皮髓质期(注射造影剂后30秒)、肾造影期(注射造影剂后70秒)
靶区:全瘤
影像检查时间点:术前一周以内
层厚:5mm
造影剂:使用非离子碘造影剂Loversol (320 mgI/mL),流速为3ml /s,用量为1.5 mL/kg,随后注射30ml生理盐水冲洗
最终纳入247名中心A(无锡人民医院)的ccRCC患者,并分为训练集(124名)和内部测试集(123名),并纳入中心B(常州第二人民医院)的73名患者作为外部验证集。
Table 1:训练集、内部测试集和外部验证集纳入ccRCC患者的临床基本信息
03
图像分割
肿瘤感兴趣体积(volume of interest ,VOI)由一名具有5年以上ccRCC诊断经验的放射科医生使用ITK-SNAP软件(版本3.6.0;http://www.itk snap.org)在CT平扫、皮髓质期、肾造影期图像上进行勾画,并由另一名放射科医生随机选取30例患者分割图像建立测试-再测试集(test-retest set)并计算组 间相关系数(interclass correlation coefficient ,ICC)。
04
特征提取+数据预处理
工具:Python
特征类型:在三维的VOI中提取四种类型的特征:(1)强度特征,即一阶统计特征;(2)纹理特征;(3)形状特征;(4)小波特征,即对原始图像进行小波分解得到的强度和纹理特征;此外还计算了不同CT相位之间的变化,也作为候选特征。
提取结果:每个相位提取647个特征,两两不同相位之间取647个变化特征,每个患者共提取3882个特征(三个相位,以及两两相位之间的变化,3882=6×647)。
数据预处理:对于所有提取的影像组学特征均进行标准化取其相对值。
05
特征选择
特征的一致性评价
使用独立分类信息最大化(maximizing independent classification information, MICI)准则函数来选择与核分级相关的特征。总共有46个特征被筛选出以便下一步的分类。
注:基于互信息(mutual information)的特征选择方法大致可以分为两类。一是最小化特征冗余,二是最大化所选特征给目标特征子集带来的新的分类信息。独立分类信息是新提出的信息术语,它可以将新加的信息和已保存的信息组合起来并与冗余信息进行负相关修正。该方法有助于发现提供大量新信息且冗余少的理想特征,且该法的最大化可以获得较高的全局判别性能,即优化分类表现。(Ref:doi:10.1109/tkde.2017.2650906.;https://www.jianshu.com/p/c7683806ccdb)
使用交叉验证的递归特征消除法(recursive feature elimination with cross-validation, RFECV)以及随机森林(random forest,RF)分类器来寻找核分级的最佳影像组学特征。
最终筛选出11个有效的影像组学特征,具体情况见FIG.3。
06
模型建立
将筛选出的影像组学特征与临床特征相结合以建立最终融合模型。此外,同时建立了临床模型(仅含临床特征)和影像组学模型(仅含影像组学特征)方便进行比较。临床模型包括性别、年龄、T分期、高血压、主诉(血尿、腰椎不适和其他)和尿潜血。
03
模型评价
预测模型评价:
03
模型评价
结果显示:
04
全文总结
这项多中心研究通过提取ccRCC患者术前CT平扫、皮髓质期和肾造影期图像的影像组学特征并研究其与核分级之间的关系,同时建立临床模型、影像组学模型核临床-影像组学融合模型,发现融合模型预测核分级的效能最佳。
Annals of Surgical Oncology 是一本在肿瘤学和外科领域受到同行好评的领先期刊,其收入文章主要涵盖了各专业癌症外科医生在肿瘤学方面的最新进展。虽然本文发表于2020年,其套路框架较为简单,仍然值得我们借鉴和学习。
优点
局限性
本研究基于影像组学可无创预测ccRCC核分级的科学假说展开,具有临床意义。研究整体流程简单易懂,笔者认为本文最重要的特点还是在于纳入了多中心的数据并进行了外部验证。此外,对不同期相的影像组学特征进行两两相减(思路等同于之前推文提及的Delta影像组学),所构建的影像组学模型包含更多信息也是其一大特色。针对于较难取得的多中心数据,我们可以结合自身情况使用单中心数据加上更完善的模型评价方法,再增加不同期相间的影像组学变化特征,可能又是一篇2区佳作啦!
好啦,本期的文献分享到这里,希望本篇文献对于追求2区的小伙伴有一定的启发!继续跟紧君莲数据库的平鑫而论专栏,我们下期见吧~~
影像组学列线图预测局部晚期鼻咽癌诱导化疗应答——跟着7+文章学套路
微信扫码关注该文公众号作者