云讲堂(今晚七点) | 俞声:数据驱动建造世界最大生物医学知识图谱
分享信息
统计之都云讲堂第 15 讲
主题:数据驱动建造世界最大生物医学知识图谱
嘉宾:俞声
地点:腾讯会议:349-191-159 (可以点击阅读原文加入)
时间:2023年01月07日(周六) 19:00
关注统计之都公众号,后台发送“云讲堂”即可获取往期会议信息
活动志愿者(如会议记录、资料整理)报名,请在后台发送“志愿者”
内容摘要
医学知识图谱是以医学概念及其术语名称作为节点、以医学关系作为边的有向图,可广泛支持医学数据标准化、自然语言处理、自动诊断、医学问答等人工智能模型的开发,是生物医学大数据与人工智能行业发展的关键基础设施。传统的由专家收集整理信息的建设方式消耗巨大的资金与时间,目前世界范围内的医学知识图谱在知识覆盖度和质量方面均难以满足应用的需要。中文医学术语建设更是严重落后于发达国家,严重制约我国医疗大数据技术的发展。为解决这一问题,我们建立了数据驱动自动建设多语言知识图谱的算法体系,以机器学习技术建立了在术语、概念、关系各个层面完全由算法生成的开放生物医学知识图谱Biomedical Informatics Ontology System(BIOS),目前包含约2700万生物医学概念、5400万中英文术语、7000万关系三元组,是目前世界最大的生物医学知识图谱。本报告将介绍BIOS的数据驱动的建造过程以及生物医学术语发现、同义术语聚合、自动翻译和关系挖掘等相关技术。
嘉宾简介
俞声,博士,清华大学统计学研究中心副教授,长期从事医学自然语言处理、人工智能与电子病历分析技术研究。俞声博士开发的电子病历自然语言处理系统被10个国家和地区的医学研究机构使用。俞声博士发明的高通量表型提取技术使i2b2疾病表型识别算法开发速度从每年1-2个疾病提高到每年超过1000个疾病,并应用于“Million Veteran Program”等美国国家级精准医学研究项目以及多家医院的生物样本库建设;该系列论文获评医学信息学顶刊JAMIA的编辑选择奖、国际医学信息学学会2019年年鉴最佳论文奖,并按标准化生物医学实验方法发表于Nature Protocols。归国后,俞声获得多项国家基金支持,带领团队围绕中文电子病历和智能诊疗发展了高通量知识图谱构建、电子病历分析、生物医学机器翻译、临床诊断决策支持等一系列技术,并与IDEA研究院合作,指导开发了大规模开放生物医学知识图谱BIOS,为医疗行业大数据处理与人工智能开发建立公共基础。
统计之都(Capital of Statistics,简称 COS)成立于 2006 年,是一个旨在推广与应用统计学、数据科学知识的公益性网站和社区。
统计之都以专业、人本、正直、团结的理念尝试推动统计和数据科学在中国的发展,促进各行业的创新和繁荣。
统计之都的数据科学云讲座是由统计之都发起,由全球志愿者共同组织的开放性公益活动。
如果您愿意奉献自己的力量(组织、宣传、编辑、翻译、剪辑等),欢迎关注微信公众号后发送"志愿者"、"云讲座"按指引进一步沟通!
微信扫码关注该文公众号作者