Bringing medical advances from the lab to the clinic.以ChatGPT为代表的人工智能(AI)突破性进展,在科技圈持续发酵。
(点击上图,获得人工智能推文。)
2023年1月15日,早在2019年就出版了《Deep Medicine》一书来解释深度学习对医学变革的影响、且在医学领域成就位居最高之列的Eric Topol博士更新了他对人工智能的理解,题目是“When M.D. is a Machine Doctor” 【1】。Eric博士首先用一张图来展示AI在大型语言模型(LLM)方面取得的巨大进展,目前的AI训练计算量每个6个月就翻一番,而在6年前是每18-24个月翻一番。
2022年,谷歌的PalM已经使用5,400亿的参数;但到2023年,模型仍会扩大1万倍,英国的Graphcore将达到500万亿的参数规模。正如我们最近几周持续关注的,以ChatGPT为代表的大型语言模型在建立文本、创建图片、制作视频、撰写文章、编程、绘画和创作电影等方面获得真正的突破,并受到广泛关注。
Eric博士回顾了机器人医生考取执业医师执照的三个关键进展。
2017年,清华大型和iFlyTek公司合作创建了小医生,在训练了200万个病例和40万篇论文后,他在中国执业医师执照考试中取得了456分的及格分数。
但尽管小医生在知识记忆方面表现出色,却在患者病例诊治方面表现不佳。2022年12月,英国医学杂志(BMJ)报告Milvue公司研发的AI通过了英国皇家放射学院的专业测试。该AI通过了10项中的两项考试(通过的定义为90%及以上准确度),整体准确度为79.5%。
同样在2022年12月,arxiv预印版发布了PaLM参加美国执业医师执照考试(USMLE)的最新进展,显示PalM的准确率从50%跃升至67.6%。而在医生审核的MED-PaLM判断中,92.6%的医生认可MED-PaLM的判断;相对比,其他医生的正确率为92.9%。对此,谷歌和Deep Mind的研发者认为,基于这个模型的MED-PaLM表现令人鼓舞,但仍然不如立场医生。
特别值得注意的是,对于USMLE的三个考试部分,ChatGPT复制了MED-PaLM的表现。
尽管人工智能在嵌入到临床中已经有了很大的进步,但到目前为主,医疗领域的深度学习仍几乎完全是单峰的,也就是基于数据集的学习,一次解决一个认为。完成的人工智能也仅在执行训练和验证的地方有效。
也就是,深度学习到了什么,人工智能就会基于此输出什么。而人类则完全不同的是,具有创新性、适应性、交互性等。
但ChatGPT等新的人工智能正在改变之前的情况:能够执行从未接受过明确训练的任务,也就是具有创新性。
正是由于这一突破,人工智能开始能够集成数据源,并开始嵌入到涉及医生和患者层面的下游任务。也就有,有了如ChatGPT等基础模型,就可以在许多个方向快速前进。
Eric博士最后指出,这并不是一条清晰或快速的路径;但更新的人工智能已经有机会获得机器驱动的高级医学推理能力,这将在医学研究和临床诊治护理中派上用场,如生成高质量的诊治报告、为医生或患者提供临床决策支持、综合患者既往所有数据并生成报告等;尤其是数据采集和报告生成这些对于医护人员可能是极为繁重的任务,对于ChatGPT等却是独有的优势。
尽管目前看医学基础模型的人工智能发展还在早期阶段,但已经取得了突破,并且在在考核中人工智能开始通过医生资格考试的测试,并且不仅仅是对于图片的解释、而是开始有了医学推理能力。
这种能力很快会被医生或患者重视,并用于健康管理的咨询中。
尽管Eric坚持:机器医生,不会完全取代临床医生。但Eric也强调,基础模型的突破大幅提高了人工智能在医学诊治中的准确性和精确度,从而为患者提供了更多帮助、尤其是让患者有了更多主动权;并由此会彻底改变(恢复)最近几十年来受到侵蚀的医患关系。参考文献:
【1】https://erictopol.substack.com/p/when-md-is-a-machine-doctor
编辑:Henry,微信号:Healsan。
Hanson临床科研团队,由6位在美国的医生及医学科学家组成;目前在美国主要从事新药研发和临床科研。
作者简介:
Mark 博士,一直从事临床免疫研究。博士毕业于北京协和医学院,北京行医8年,美国新药研发4年,2016年起主要从事医学大数据分析。
(点击👆图片,进入自己感兴趣的专辑。或获得点击“资源”,浏览本公众号所有资源。)