一次用AI“死磕”癌症的实验 | 甲子光年
“想让癌症患者活得更长久、更体面。”
编辑 | 九月
今天的故事主角,是一名41岁的“业余”程序员姜浩。
姜浩本科在南京大学物理系,硕博就读于美国密歇根大学的核工程和放射科学系,毕业后,曾在布鲁克、西门子担任影像部门研发总监。2018年,家住威斯康星州的他,自掏腰包,在朋友中餐厅地下室研发了一个AI检测乳腺癌平台,从数据到算法模型训练,再到硬件配置,都由他一人完成。测试阶段还曾闹出一个乌龙,引得两名FBI上门搜查,误以为这是非法赌博网站。
3个月后平台建成,对乳腺癌症检测的准确率达90%,姜浩将网站发布在V2EX社区(一个主要由设计师、程序员等组成的网络社区)供大家免费试用。出于对隐私的保护,姜浩并未设置后台保留影像数据,但他看到每天来自世界各地的上百个IP访问,有不少人也曾给他留言,用这个系统检测出了乳腺肿瘤。
姜浩(coolwulf)在V2EX社区发的关于AI乳腺癌检测的帖子
“我感觉所做的一切正在起作用。”姜浩对「甲子光年」说。而这只是一个开始,今年,他又开始尝试利用AI辅助放射治疗脑癌。
事实上,AI+医疗影像不算是一个新鲜话题。
自2016年AlphaGo战胜李世石后,AI在科技圈掀起创业热潮,创业者尝试将AI渗透在多个行业。其中,医疗影像是最重要的领域之一,基于深度学习框架的人工智能图像感知技术,可以实现对病灶的识别与标注、靶区的自动勾画与自适应放疗以及影像三维重建。
科技公司们也瞄准了医疗影像市场。比如,2018年,Google研发过一套用于乳腺癌诊断的AI系统,可快速分析大量的病理组织显微图像,肿瘤检出率高达92.4%;国内AI四小龙之一的依图科技曾推出AI癌症筛查工具,用以减轻放射科医生的工作量,提高诊断能力。据报道,2020年,中国AI医疗影像公司有55家,占AI医疗类公司的42%。
但直到今天,AI医疗影像照进现实的进程并非坦途。烧钱、医院难认可、数据隐私问题……这个领域同样面临着和其他AI商业化落地场景相似的困境。先前的一些明星企业也开始“断臂求生”,如IBM在兜售人工智能医疗诊断先驱Watson Health业务;依图为谋取上市,出售医疗业务等。
对更多普通人而言,绕了一大圈,用AI干预癌症治疗依然停留在科幻故事中。AI医疗被困在十字路口。
姜浩的AI医疗检测平台并不完美,但他自建平台和落地实践的过程是一个窗口,让我们可以了解一个AI医疗影像应用是如何诞生的、它的优势和局限是什么,以及这个技术又离真实生活有多远。
以下是姜浩的自述——
1.一个“老程序员”想用代码帮助癌症患者
2017年,我的一位南京大学学妹被查出罹患乳腺癌。由于发现时已是晚期,短短数月后,她留下一个4岁的孩子便撒手人寰,年仅34岁。
这并不是我第一次送别同龄友人。2014年,另一位好友因一种罕见的癌症——软组织肉瘤去世。作为医学物理师的他,在发觉腿部有肿块后迅速做了检查。但还是为时已晚,当时癌细胞已经转移到了肺部。软组织肉瘤折磨了他整整5年。癌症“吸食”着他身上的养分,他瘦得如同枯木。在人生的最后,他需要时时在身体后侧贴着胶带,因为皮肤会脱落,有时甚至会直接露出里面的骨头。
而癌症的痛苦不仅限于肉体,更在精神。最后一次和他见面时,他强撑着力气坐起来,和我挥手致意,像安慰,也像告别,曾经神采熠熠的脸庞挂满了憔悴。到今天,他挥手的样子仍时常冲击着我。
两位友人皆因癌英年早逝,让我十分痛心。这些情绪在我心里埋下了一颗种子,我想为他们、为千千万的癌症患者做些什么。
但我能做些什么?思考许久后,我决定从“本专业”和“非专业”入手。
我的专业是医学影像。我本科毕业于南京大学的物理系,博士毕业于密歇根大学核工程和放射科学系(Department of Nuclear Engineering and Radiological Sciences)。
2006年,姜浩在密西根大学做助教
进入密西根大学时还有一个小插曲。最早我在申请读博时,想从事医学物理方向的研究。但很不巧,我错过了物理系的申请截止日期。当时物理系的Fred Becchetti教授便建议我申请还未截止报名的核工系。博士毕业后,我进入密西根大学的放射肿瘤学系(Department of radiation oncology)工作了很多年。
直到21世纪初期,医院还在用感光胶片为患者拍X光片。后来,我的导师Larry Antonuk发明了医学平板探测器,现在大家到医院拍X光片,只需站在平板探测器前面照一下,电脑屏幕上便可及时显示结果。目前,这个设备已在世界各地的医院都有普及。
跟着Larry Antonuk教授从事医学平板探测器研究的我,也自此与癌症的检测与治疗结下不解之缘。
但在编程方面,我觉得自己是“非专业”的,因为我并不是计算机专业的科班出身。小时候太调皮,时不时就被老师请家长。于是我父母就合计着给“坐不住”的我培养个爱好,恰好我又对计算机很感兴趣。于是,9岁时我便加入了编程的兴趣班。
记得接触的第一台电脑是苹果II型电脑,我对眼前的“大方块”好奇极了。当时的电脑系统还是Basic语言系统,也没有互联网。我学习编程全靠刊登在计算机纸质杂志上的代码,一页一页地翻看,再一行一行地敲进电脑。如果想玩会游戏,也要“自食其力”,通常花上几个小时才能玩5分钟。所以,我算是一个起步很早的“老程序员”了。
其实报考大学时,我填写的第一志愿是计算机系。虽未能如愿进入,但本科四年间我选修了许多关于编程的课程。而后到2002年,互联网逐步普及。当时我已出国深造,在一个叫做安娜堡的城市。那里的冬天寒冷又漫长,闲来无事的我就想捣鼓一些开源软件。我还加入了Mozila Foundation的开源项目,和一群志同道合的网友相互学习、交流。其中,我们写过的、较为人熟知的项目有K-Meleon浏览器和火狐浏览器前身Pheonix等。
思考清楚这些后,“我能做什么”便逐渐有了轮廓。
因为学妹的离世,我专门搜集了乳腺癌的多方资料做研究。来自世界卫生组织的资料让我感到震惊和心痛:乳腺癌是全球发病率最高的恶性肿瘤。而且患者越年轻,病情越凶险,也越容易复发。如果在1期、2期时能及时发现乳腺癌,5年存活率可以达到99%;如果到3期和4期才发现,此时的治疗有效率仅为10%-30%。尤其在中国国内,乳腺癌的早期发现率不足20%,通过筛查发现的比例不足5% 。”
世界卫生组织国际癌症研究机构(IARC)发布的2020年全球癌症新增病例
而且不少乳腺癌患者是由于缺乏检测途径,耽搁了最佳救治时期。于是我脑海中诞生了一个想法,建立一个帮助人们自行筛查用乳腺癌的系统——“AI看X光片”,即AI乳腺癌检测系统。
2.FBI登门调查“地下”服务器
2017年,这类项目基本上还没有个人在做,一切都需要从零开始。我计划用业余时间完成这项工作,从数据到模型训练再到硬件配置,前后花了三个月左右。有时忙不过来了,我就睡在办公室里。
虽然只有我自己在做,但整体过程还算顺利。我先列了一个to do list,然后一步一个脚印地攻克掉。最开始我每天都在读论文,相关领域的文章基本读遍了。从2017年底和2018年初,我尝试过许多不同的模型,对比之后,最终定下了基于何恺明RetinaNet修改的模型。
RetinaNet是一种One-Stage RCNN类型的检测网络,基本结构由一个Backbone、多个子网及NMS后处理组成。该算法源自2018年何恺明的论文《Focal Loss for Dense Object Detection》。这篇论文曾获得ICCV 2017的最佳学生论文奖(Best Student Paper Award)。
充足的数据和强大的算力,是训练一个好的的深度学习( deep learning)模型的基础。
幸运的是,我从佛罗里达大学获得了由自美国放射学委员会认证的放射科专家标注过的胸部医疗影像,只是这些数据因为年代久远,影像资料还都是胶片翻拍的,于是我先写了个程序将它们一张一张地转为AI可用形态。通过大量标注数据训练的深度学习模型,对医学影像的理解可达到人类专家的水平。
为了可以有更充分的数据训练模型,我还曾写邮件联系巴塞罗那大学的非公开资源——乳腺癌数据集,请求使用许可。
数据到位了,接下来就要解决算力问题。但普通电脑无法满足算力所需,而在乳腺癌检测项目启动的2017年底,市面上几乎没有GPU云端服务,所以我决定自掏腰包购买硬件设备。
当时正值虚拟币“挖矿”大火,一块几百美元的显卡被炒到1100美元,而且有价无货。为了不被显卡商家的网站“ban”(禁止),亲友都被我动员了起来,我们用多张信用卡,不停地蹲点、刷新网站,最终凑齐了50张1080Ti显卡。为了省钱,我和朋友自己还当起了木工,将用10美金收来的木料家具改成了机箱。这些花销加起来大约有5、6万美金。我很感谢我的妻子,从做网站到后期的维护等,时常需要高额的花销,但她一直都支持我的决定。
由于家庭的电路系统无法支撑50张显卡的电力,我找到一位开中餐馆的朋友,他听了我的想法后,二话没说答应把餐厅地下室借给我放置设备。改完电路后,我长舒一口气,AI乳腺癌检测网站的上线已经万事俱备了。
只是没想到这事闹出了“大乌龙”。一次来中餐厅检查卫生的工作人员无意间看到了服务器。几天后,四名警察和两名FBI工作人员便登门“造访”,认为我们有“违法开设地下赌博网站”之嫌。经过好一番解释后,我们才洗清了嫌疑。
姜浩(左一)与中餐厅朋友在自制服务器前的合影
早先在阅读资料时,我注意到,国内的一线城市并不缺乏AI检测癌症等项目的落地,相比之下,更迫切需要AI癌症检测技术的是缺乏医疗资源的偏远地区。为了方便不同圈层的人使用,我将系统的操作步骤设计得很简单——用户只需上传自己的X光片,AI便会快速给出乳腺癌病情的诊断建议。
2018年4月,我正式开放了AI检测乳腺癌网站,以供人们免费检测。
为了评估它的效果,我在欧洲的InBreast数据库上做了测试,准确度达到90%。2017年,美国肯塔基大学医院等曾拿我写的系统与在国际乳腺癌检测比赛中获奖的程序做对比,让它们在相同乳腺癌影像数据库上运行,结果后者显示漏了10个阳性案例,而再使用我的系统进行测试,只漏了一个阳性案例。
在此我想和各位读者强调一下——目前影像筛查不能替代医生。我写AI乳腺癌网站的出发点是希望可以帮助用户尽早地发现癌症病灶、及时就医。但它并不能100%准确地判断女性是否患有乳腺癌,具体结果还请以医生的诊断为主。
当时出于隐私保护的考虑,我并未保留后台影像数据。所以我并不清楚具体有多少人使用过。几年前相关技术还尚未普及,所以我的项目算是个启蒙。但我收到很多患者的感谢邮件,并且有用户真的用它测出了乳腺肿瘤。
AI乳腺癌检测网站也引起了业内的关注,复旦大学等国内外医疗机构也与我建立了联系。目前,每天仍有上百个IP在访问该网站。
2018年时复旦大学附属肿瘤研究所给姜浩发的邮件
有人问过我,为什么不将AI乳腺癌检测的网站商用,至少回个本,但我都婉拒了,因为商业化有违我的初衷。后来借着这股劲儿,我又开发了另一个完全免费的肺结节CT影像AI检测网站。
3.“能不能用AI辅助治疗癌症?”
在此之后,我心中又萌生了一个新想法:能不能用AI辅治疗癌症?
2018年,卢卫国找到我,希望可以合作成立AI辅助治疗癌症的公司。他是美国德克萨斯大学西南医院学中心的终身教授。这人很有个性,曾辞掉高管工作到医院做临床物理师。问及原因,他说“我做了一辈子的研究,却还没亲手治过一个患者”。这句话让我产生了共鸣,进大的医疗公司固然好,但能在一线救助病人是更有意义的事。
促成合作的另一个重要角色是我们共同的朋友——陈昱。
陈昱是我一生的挚友。他是我在密歇根大学的师兄,也是卢卫国是北京大学90级技术物理系的同学。陈昱主要从事癌症放射治疗的研究,对我而言他就像立在远处的标杆,激励着我前行。
姜浩(右一)与陈昱(左一)的合影
遗憾的是,2017年5月31日,陈昱师兄因意外去世。2018年时我与其他几位朋友共同设立了陈昱华任物理师最佳奉献奖,希望以此鼓励更多华人物理师参与到公益活动中。
陈昱生前就职于国际顶尖放疗公司TomoTherapy,主攻可以精准打击到每个肿瘤的立体定向放射外科治疗技术,从而减少放疗对正常组织的损伤。由他研发的TomoEdge系统正在世界各地救治病人。陈昱一直以救助病患为终生的奋斗目标,而我想帮他实现这个遗愿。
我最先关注的是脑瘤放射治疗。2021年,我一位同事的表哥罹患脑肿瘤,并接受了全脑放疗。但6个月后脑肿瘤再次复发,但此时他已无法承受任何治疗方式,最终遗憾过世。而且在生命的最后时期,同事的亲人过得非常痛苦。
这件事情再次触动了我。我想做的不仅仅是检测癌症,如果可以将AI运用到实际治疗中,就能让更多患者受益。除了延长病人的存活率,我更想改善的是病人的生活质量,让他们尽可能免受癌症的折磨。
当脑癌患者有5个或10个以上的脑瘤时,医生一般会采用全脑放疗手术来控制颅内肿瘤生长。
全脑放疗是对整个大脑进行放射治疗,也是如今最普遍的脑癌治疗方案。但这种“无差别攻击”的方式,也让脑部器官受到逼近极限的辐射量,所以患者基本只能做一次全脑放疗。如果脑瘤复发,医生便再无力回天了。在美国,每年有20万病人要做全脑放疗,在中国可能数量更多。
与“残酷”的全脑放疗相比,立体放疗的射线更集中,治疗效果更好。它能够精准切除病变组织,如赛博刀(CyberKnife)、伽玛刀(Gamma Knife)等。患者可接受多次治疗,生活质量也随着治疗时产生副作用的降低而提高。
但立体放疗工作量大且耗时长。如果医生想为患者进行立体放疗手术,首先需要在辐射剂量最优的情况下将它们分区照射,再由肿瘤医生手动对每个病灶进行标注和追踪,然后物理师再根据患者的个人情况,定制出精准的治疗方案。工作量巨大且耗时。因此,脑转移瘤患者通常无法获得足够资源帮助,这也令他们不得不铤而走险,选择全脑放疗。
于是,我和老卢开始了“让更多脑瘤患者用上立体定向放疗”的新征程。我们创立了一家针对癌症放疗和人工智能技术产品研发的公司。2019年,我们与美国西南医学中心和斯坦福大学展开了合作。目前,我们的平台主要有3种AI模型:
自动勾画/标记脑转移瘤病灶的模型
基于SVM-放射组学的快速减少假阳性的模型 基于优化辐射剂量图并快速分割多个病灶到不同治疗疗程的模型
END.
微信扫码关注该文公众号作者