小白入门必看!带你走进影像组学的前世今生
大家好,我是鑫仔。今天我们对影像组学(Radiomics)进行一下多维度(空间维度+时间维度)的理解。主要帮大家解答“我是谁?我从哪里来?”的问题。
Radiomics = Radiology(医学影像) + Omics(组学);
医学影像包括:x线,CT,US,MR,PET,介入等;
组学:是对分析对象进行集体的的识别(identify)、表征(characterize)和量化(quantify),从而用数据表示出个体与个体间的关系;
我们来类比一下,方便大家理解:
基因组学(Genomics)就是研究这些基因以及这些基因间的关系
按照上面的拆解模式,基因组学的研究对象是“基因”,采用的研究方法不再是最早单独研究某个基因片段的作用,而是将所有的基因构成综合起来进行系统化的分析和考虑
基因组学的对象是基因,影像组学的对象就是影像组学特征
因此影像组学就是从医学影像中获取高通量的定量特征并将其转换为可挖掘的数据进行分析,从而进行诊断或预后的相关性的研究。
我总结了一下,影像组学发展的诱因主要包括以下两点
技术与方法的发展与进步
- 医疗影像:高质量多模态的医疗影像得以保存
- 数据挖掘:图像批量转化为数据的质量(可靠性、可重复性)得到保障
- 机器学习(深度学习):模型建立的预测能力得到提高
临床的需要 → 影像组学能解决的临床问题
- 背景:肿瘤具有高异质性(空间、时间)
- 能解决的三大临床问题:精准诊断(辅助诊断)、疗效评估(近期疗效,毒副反应评估)、预后预测(远期疗效)
- 影像表型:更进一步可以将影像组学signature与临床信息、基因组学、蛋白质组学、病理组学相关联得到影像组学biomarker,非侵入性、客观且更为全面的(病理切片不一定能取到想要分析的区域)得到大量信息。多组学研究涉及到对影像组学的生物学意义的探索,我在讲习营的后半段还会分享。
- 举个例子方便大家理解:
医生:影像→影像征象→经验→决策
计算机:数据→定量特征提取→影像组学模型→辅助决策
进阶:计算机能从宏观影像中获取高维信息从而分析微观表征(病理、基因、蛋白),这种通过宏观知微观的愿景是影像组学很吸引人的地方。
感觉这有些类似我国中医辩证论治的思想,建好的泛化能力强的模型就好像古代的神医,通过“证”(图像→数据),挖掘到我们医生肉眼看不到的结果;
影像组学研究的根本原因?
为什么要在这里特别强调一下这个问题?
这是检索影像组学词条后度娘跳出频率很高的一个网页,相信很多人都有这个疑问,研究影像组学到底有什么用?就是用来水文章嘛?——下面回答逻辑大同小异:不是用来水文章,但做的规范能发高分文章(相当于没回答);
方法的诞生是为了解决临床问题,而癌症诊疗一直都有一个未被解决的挑战:肿瘤具有异质性,包括:
- 时空异质性(例如不同部位、不同器官、不同疾病进程)
- 转移异质性(例如骨转移、肺转移、肝转移、脑转移)
肿瘤异质性内在因素(例如基因表达、肿瘤微环境)
而影像学方法的优势在于他可以从宏观(个体)跨越到微观(分子),从而较好的解决区分肿瘤异质性的问题,并且还是一种无创的检测方法,发展潜力就很大;
同时,技术的变革也再次引领了影像组学研究的进步;
要聊影像组学的历史进程,首先我们来看看医学影像学的历史进程,下面这个图就能很清晰的表示:
自1895年X-rays被发现,随着医学成像技术的快速发展,126年以来,X-Rays到在现代临床实践中使用CT、MRI及正电子发射断层扫描(PET)等技术,医学成像技术已得到显着扩展。
我们看到,除了核医学涉及代谢活性可以一定程度上进行定量分析外,之前的影像学主要以受过训练的观察者对影像结果进行直接观察和解读(对位置、形状、清晰度和强度进行定性表征)为主。
但这其中存在两个问题:
1.结果受主观性影响较强
2.对于同一影像结果解读,观察者间差异大。
受益于计算机技术及硬件的不断发展,基于影像进行定量分析的纹理分析和 Radiomics也分别在1973年和2012年应运而生。
直到2012年,Radiomics概念首次被提出。下面鑫仔为大家总结了影像组学的发展进程,以便大家对影像组学有一个时间维度的理解:
时间轴解读:
影像组学于2012年由荷兰学者Lambin等率先提出,其基本概念是高通量地从放射影像图像中提取大量的影像学特征,采用自动或半自动分析方法将影像学数据转化为具有高分辨率的、可挖掘的空间数据;
同年,Kumar等将影像组学的概念进一步扩展为:从 CT、正电子发射计算机断层扫描(PET)或MR等医学影像图像中高通量地提取并分析大量高级的定量影像学特征;
2014年Aerts等通过融合影像、基因和病理学特征建立影像组学标签,对肺癌、头颈癌预后进行预测,这标志着影像组学从基础研究走向临床应用;
2016年 Gillie等人提出定量特征除了影像特征,也包括临床和基因信息,目前影像组学研究最有代表性的综述;
2017年,Lambin等人提出了影像组学研究的质控标准,是目前衡量一篇影像组学研究可靠性的主要评价方式;
2020年,Alex等人提出了IBSI指南,是对影像组学研究的又一次规范化;
2021年 Gillie等人提出了对影像组学生物学意义的进一步探索方法,
同时,随着2015年深度学习的迅猛发展,自2016年起,深度学习结合影像组学的文章开始涌现
总结这个时间轴,主要有两个目的:
首先,是技术的革新推动了影像组学的发展,我们要了解现在做影像组学研究处于一个什么样的时间节点,这样无论在读文献还是在写文章,我们都能对这篇文章有一个定位;
其次,就是认识世界级影像组学大佬,如果想做的深入,可以跟踪他们的研究,预测他们的预测;
我还要补充的一点是,我国影像组学研究同样走在世界前列,我国影像组学研究的大佬有中国科学院的田捷教授、广东省人民医院刘再毅主任等。
通过对时间轴的理解,进一步的,我将影像组学的发展总结为5个时代
萌芽 影像组学1.0 影像学由主观的定性分析转变为定量分析 | 定性到定量的转变(影像学本身的发展以及计算机技术)
语义特征;纹理特征
诞生 影像组学2.0 常规影像组学的诞生;高通量定量提取特征 | 机器学习
计算机特征
发展 影像组学3.0 无人工干预自动提取特征;数据量的提升 | 深度学习 & 大数据
规范 影像组学 4.0 研究流程的标准化、临床应用 | 质控评分、IBSI
意义 影像组学 5.0 可解释性、生物学意义、生境、临床应用 | 组学检测技术的进步(单细胞,三代测序,病理组学)
好了,到这里,对于发展的时间线和意义我就介绍完毕了。
接下来,我们再来看下目前影像组学论文发表情况:
我这里主要参考了小糕老师这个月直播课展示的文献调研数据
我们可以看到,目前CT和MRI在影像组学占统治地位。
2021年全年1957篇
2022年至7月末1406篇
发文量也是逐年增加的。
不过如果想不做实验发文章,相对于生信文章来说,影像组学目前还是绝对的蓝海,仅仅2021年,就有48696篇生信文章被发表,是目前所有已发表的影像组学文章的9倍,更是同期影像组学文章发表数量的25倍!
还有就是大家比较关心的非肿瘤能不能做影像组学的问题了,我这里可以很负责任的告诉大家,对于非肿瘤的大多数疾病来说,做影像组学是完全可以的,目前已经有超过1000篇的非肿瘤影像组学文章被发表。
除此之外,这个表总结了一些大家比较关心的文献调研的具体参数问题,包括研究目的、样本量、研究设备、机器学习算法等等。数据于2020年发表在欧洲放射学杂志上(PMID: 32334372)。
年代是比较久远了,不过也能看出来大体的趋势,同时也提醒大家,如果按这篇文章的套路对如今的影像组学发展进行一下综述,不是又是一篇欧放嘛!
好了,第一部分从空间和时间维度为大家解答了“我是谁,我从哪里来“的问题,希望通过我的讲解,大家能对影像组学有一个初步的且较为透彻的理解。
下一篇推文将解答”要到哪里去“的问题。为大家详细介绍影像组学文章框架!不见不散哦~(●’◡’●)
微信扫码关注该文公众号作者