Redian新闻
>
关于医学多模态大模型,你需要来学习这些最新研究

关于医学多模态大模型,你需要来学习这些最新研究

公众号新闻


医疗数据复杂且众多,想要在其中窥探各种关联往往十分困难。要想将数据「穿针引线」,并且用专业的领域知识武装起来,这更是难上加难。这对于人类医生来说,需要多年的刻苦学习以及丰富的临床经验。那如果把这些数据交给机器,它们又能够有怎样的表现呢?


目前,多模态大模型在自然语言处理、计算机视觉上表现优异,这似乎能给医疗领域带来机遇。但现实是,由于医疗领域的专业性与复杂性,这些通用基础模型的效果并不理想。医疗大模型无法实现检查实体,这意味着它更加依赖于训练数据。但医疗数据具有多样性、稀缺性、隐私性以及复杂性,因此医疗大模型训练面临的挑战也是巨大的。无论是数据、模型,还是训练模式等多个维度都要接受严峻的考验。毕竟,当大模型应用在专业的医疗领域,这会切身影响着患者的治愈甚至是生命。


医疗诊断问题,用传统的标签学习的范式是无法够满足的。只有将涉及医疗的知识点相互关联,形成知识图谱,才能更让机器学习更加高效、精准,有利于帮助人类诊断疾病。


为了让大家更细致地了解医疗领域模型的进展,机器之心线上分享邀请到了上海交通大学未来媒体网络协同创新中心在读博士生、上海人工智能实验室智慧医疗研究中心见习研究员张小嫚,以《医学知识增强的多模态基础模型研究》为主题,为大家分享最新研究成果。


在此次线上分享中,大家可以跟随她的讲述,了解近期关于医学知识增强的多模态基础模型的相关研究,并展望基础模型能够从医学知识增强的角度出发,通过结合医学的强先验背景知识,提取适配医疗场景的多模态数据表征,降低数据依赖,开发出更适合医学领域的成果。



分享主题:医学知识增强的多模态基础模型研究


嘉宾简介:张小嫚,上海交通大学未来媒体网络协同创新中心在读博士生、上海人工智能实验室智慧医疗研究中心见习研究员,主要研究方向为医学知识增强的多模态基础模型研究。其导师是王延峰教授 ,张娅教授和谢伟迪教授,主要合作者是吴超逸见习研究员 。


  • 个人主页:https://xiaoman-zhang.github.io/

  • Github: https://github.com/xiaoman-zhang

分享摘要:本次报告中,张小嫚将介绍近期关于医学知识增强的多模态基础模型的相关研究。从数据、模型和下游任务三个角度展开,具体包括:大规模医疗图文数据集与视觉问答数据集的构建(PMC-OA,PMC-VQA);医疗语言基础模型及多模态基础模型(PMC-LLaMA,PMC-CLIP) 的训练;知识增强的胸部 X-ray 疾病诊断基础模型 KAD。


相关链接:


  • Knowledge-enhanced Visual-Language Pre-training on Chest Radiology Images

    https://arxiv.org/pdf/2302.14042.pdf

  • MedKLIP: Medical Knowledge Enhanced Language-Image Pre-Training in Radiology

    https://arxiv.org/pdf/2301.02228.pdf

  • K-Diag: Knowledge-enhanced Disease Diagnosis in Radiographic Imaging

    https://arxiv.org/pdf/2302.11557.pdf

  • PMC-CLIP: Contrastive Language-Image Pre-training using Biomedical Documents

    https://arxiv.org/pdf/2303.07240.pdf

  • PMC-LLaMA: Further Finetuning LLaMA on Medical Papers

    https://arxiv.org/pdf/2304.14454v1.pdf

  • PMC-VQA: Visual Instruction Tuning for Medical Visual Question Answering

    https://arxiv.org/abs/2305.10415

直播间:关注机器之心机动组视频号,立即预约直播。
交流群:本次直播设有 QA 环节,欢迎加入本次直播交流群探讨交流。


机器之心 · 机动组

机动组是机器之心发起的人工智能技术社区,聚焦于学术研究与技术实践主题内容,为社区用户带来技术线上公开课、学术分享、技术实践、走近顶尖实验室等系列内容。机动组也将不定期举办线下学术交流会与组织人才服务、产业技术对接等活动欢迎所有 AI 领域技术从业者加入

  • 点击阅读原文,访问机动组官网,观看往期回顾

  • 关注机动组服务号,获取每周直播预告

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
BLIP-2、InstructBLIP稳居前三!十二大模型,十六份榜单,全面测评「多模态大语言模型」独家 | 多模态大模型初创企业“智子引擎”,近日完成千万元天使轮融资VPGTrans: 10%的成本定制你自己的类GPT-4多模态大模型多模态大模型迸发,创业机会和挑战在哪?丨GAIR 2023思念,是对母亲唯一的回报独家 | 哈工深新跑出一家多模态大模型公司,聂礼强、张民等 AI 大牛加盟能「说」会「画」, VisCPM:SOTA 开源中文多模态大模型多模态大语言模型综述来啦!一文带你理清多模态关键技术高利率,低利率,总有一款镰刀可以收割韭菜多模态大一统、AI智能体将如何引领未来?阿里妈妈与人大高瓴学者探讨大模型趋势专访生数科技唐家渝:清华系团队拿到近亿融资,用Transformer来做多模态大模型开源多模态大模型哪家强?TOP12榜单来了,GitHub揽获2.2k+星清华系面壁智能开源中文多模态大模型VisCPM :支持对话文图双向生成,吟诗作画能力惊艳从感知到理解-融合语言模型的多模态大模型研究5071 血壮山河之武汉会战 黄广战役 3理解指向,说出坐标,Shikra开启多模态大模型参考对话新维度多模态大模型的下一站在哪里?专访生数科技唐家渝:清华系团队拿到上亿融资,用Transformer来做多模态大模型融资千万,结盟软通动力,人大多模态大模型元乘象正在圈地大B市场|甲子光年中科院发布多模态 ChatGPT,图片、语言、视频都可以 Chat ?中文多模态大模型力作LaVIN-lite:单张消费级显卡微调多模态大模型真相脑损伤实例分析普通话不“普通”!第26届推普周,一起来学习这些知识!中文版开源Llama 2同时有了语言、多模态大模型,完全可商用阿里达摩院大模型公开课上新!主讲中文个性化对话大模型ChatPLUG和模块化多模态大模型mPLUG-Owl更强更通用:智源「悟道3.0」Emu多模态大模型开源,在多模态序列中「补全一切」多模态大模型进展及应用 | 8月10日TF116报名多模态大模型向前,机器人领域的新机遇在哪里?独家 | 多模态大模型初创企业「智子引擎」,近日完成千万元天使轮融资训练开销骤减,10%成本定制专属类GPT-4多模态大模型训练成本不到1000元,直降90%!NUS、清华发布VPGTrans:轻松定制类GPT-4多模态大模型多模态大模型能力测评:Bard 是你需要的吗?中科大&字节提出UniDoc:统一的面向文字场景的多模态大模型多模态大模型的幻觉问题与评估
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。