NEJM:之于医疗,GPT-4 能在这三个领域提供帮助!但也隐藏着巨大的风险
ChatGPT的出现,使人工智能“突然”暴露在世人面前;其正在改写的工作方式,也已经开始影响到很多职业。
尽快了解和利用ChatGPT为代表的人工智能,才是摆脱潜在困境、甚至抓住新的机遇获得更好发展的关键。
2023年3月30日,新英格兰医学杂志(NEJM)发表了题为"Benefits, Limits, and Risks of GPT-4 as an AI Chatbot for Medicine"的特别报告【1】,讨论了人工智能聊天机器人GPT-4在医学领域的应用及其优势、局限和潜在风险。
Chat-GPT及GPT-4是由OpenAI公司开发的一款先进的人工智能系统,目前已经成为最广泛使用的聊天机器人。
GPT-4可以理解并回应用户用自然语言输入的提示,形成类似人际间对话的交流。
但与此同时,ChatGPT对问题的形式和用词非常敏感,用户需要精心设计和测试提示(prompt)以获得最佳效果。
所以有一次朋友开玩笑说“以后秘书要失业了”,我则回答说“不,精通ChatGPT提问的秘书不仅不会失业、反而会升职,而且还可以做很多兼职”。就是因为,提问的方式不同,得到的答案差别也会非常大。
精通于提问所涉及的专业、并通过反复摸索而整理出提示语的人会倍受青睐,甚至由此衍生出了“提示工程”(prompt engineering)的新概念。
另外,GPT-4在处理明确问题或请求时确实表现优秀,在回答无明确答案的问题时可能出现错误回答;但其逻辑和表达还非常严谨而认真,也就是被协和管教授称为的“一本正经地胡说八道”。
我们在使用ChatGPT过程中,上述两个问题经常一起出现的最常见例子是:在请ChatGPT做专业论文的翻译时,经常会因为提示语不准确、或者ChatGPT理解错误而出现错误的翻译。
翻译本属ChatGPT最擅长的项目,都会出现严重错误;在涉及医疗这一需要非常严谨的项目时,ChatGPT擅长做哪些事情、有哪些短板,就成了急需了解的重要问题。
(图源:Andrey Suslov / Shutterstock)
文章主要从三个方面评估了ChatGPT在医疗中的应用。
1,医学记录
GPT-4可以根据医生与病人的对话生成医学记录。GPT-4可以生成多种格式的记录,如SOAP(主观、客观、评估和计划)格式,并自动包含适当的计费代码。
2,医学知识
尽管GPT-4只接受了来自互联网的公开信息训练,但它在回答医疗问题方面表现出相当高的水平;甚至在美国执业医师考试(USMLE)中获得了正确率90%以上的成绩。GPT-4可以在短时间内提供病因、症状、诊断和治疗方案等方面的信息。
不过GPT-4的知识截止日期为2021年9月,因此在某些情况下,它的回答可能不是最新的。
3,医学咨询
ChatGPT可以在医学研究中提供帮助。
比如帮助研究人员检索与特定主题相关的文献,生成研究摘要,并提供研究设计和统计分析的建议。此外,GPT-4还可以在草拟研究报告时提供文本生成支持。
ChatGPT还能在医学教育中大显身手。
GPT-4可以作为医学生和医生的辅助学习工具,提供针对特定主题的教学材料,回答问题并提供反馈。
然而需要警惕的是,不管是用GPT-4在生成医疗记录、还是进行科研设计/医学教育,ChatGPT都有可能会出现错误或“一本正经地胡说八道”,需要通过仔细审核来检查和纠正。
以上述三个最常见的应用场景为代表的功能,ChatGPT确实给了我们(不管是患者、医生还是医学科研人员)极大的帮助,但我们也特别提醒用户在使用ChatGPT时特别需要注意的三个风险。
1,信息准确性
正如我们多次发现的,GPT-4在回答问题时可能会产生错误或虚构信息。
在医疗场景中,这种情况尤为危险,因为错误或虚假信息可能非常微妙,而且聊天机器人给出的答案往往非常令人信服。
因此,在使用GPT-4时,检查和验证其输出结果是非常重要的。
2,隐私保护
GPT-4在生成医学记录时可能会涉及到患者的隐私信息。因此,使用GPT-4时需要遵循相关法规和保护隐私的最基本要求。
3,法律责任
在医学领域,医生和其他医疗专业人员需要承担他们所提供的医疗建议和治疗的法律责任。
当使用GPT-4提供医学建议时,法律责任的归属问题可能会引发争议。
再比如,当患者拿着ChatGPT给出的治疗方案与医生做出的治疗方案不一致、而恰好医生的治疗效果恰好不理想时,对于这种情况也需要提前制定出处理流程和规则。
编者按:
GPT-4作为医学AI聊天机器人,具有显著的优势,如提供医学知识、辅助研究和教育等。然而,也存在一些风险。
为了在医学领域有效地利用GPT-4的能力,以下是一些建议:
A,验证信息:
在使用GPT-4生成的信息时,始终核实答案的准确性和时效性。在医学领域,错误的信息可能会导致严重的后果,因此务必谨慎对待。
B,辅助工具:
将GPT-4视为辅助工具,而不是完全依赖它来做出决策。不管是医学专业人员还是患者,都应将GPT-4的输出视为参考,而不是绝对的答案。
C,持续学习和更新:
随着医学知识的不断发展,保持对GPT-4的更新和学习至关重要。这将有助于确保它提供的信息是最新和最准确的。
D,不断总结提问方式,努力使自己给出的提示(prompt)更准确。
比如我常做的是,尽可能用英文提问、或者中文问题翻译成英文之后看看对不对再提问;对于想要专业回答的,一定加上“学术”、“医学专业”等限定词;可给出多种提问方式,从中选取更佳的回答。
本期编辑:Henry,微信号healsan。助理:ChatGPT
Hanson临床科研团队,在美国的七位生物医学科学家主持并担任独立理事。主要通过大数据分析,分享医学研究前沿、数据库建设、医学统计分析方面的进展;交流规范的课题设计与SCI论文撰写经验。
更多阅读:
(点击👆图片,进入自己感兴趣的专辑。或获得点击“资源”,浏览本公众号所有资源。)
微信扫码关注该文公众号作者