Redian新闻
>
谷歌最新论文:用AI通过咳嗽声来诊断疾病

谷歌最新论文:用AI通过咳嗽声来诊断疾病

公众号新闻

来源:生物世界

作者:王聪



最近,谷歌的研究人员在预印本平台 arXiv 发表了一篇题为:HeAR -- Health Acoustic Representations 的研究论文。他们开发了一种可以通过评估咳嗽和呼吸等声音来帮助检测和监测健康状况的人工智能工具。


这个人工智能(AI)系统在数百万个人类声音的音频剪辑样本上进行了训练,将来可能帮助医生用来诊断包括COVID-19和肺结核在内的肺部疾病,并评估一个人的肺功能。



实际上,这并不是第一次探索将声音作为疾病的生物标志物。在COVID-19大流行期间,南达科他大学的研究人员就曾在 PeerJ Computer Science 期刊发表综述论文【2】,提出可以通过一个人的咳嗽来检测呼吸道疾病。系统分析了通过人工智能工具分析咳嗽声音以进行COVID-19筛查的研究。


谷歌此次开发的这款AI系统名为HeARHealth Acoustic Representations),其新颖之处在于其训练所用的海量数据集,以及它可以被微调以执行多种不同任务。研究团队表示,现在判断HeAR是否会成为商业产品还为时过早。目前的计划是让感兴趣的研究人员访问该模型,以便他们可以在自己的研究中使用它。他们的目标是这款AI系统能够刺激这个新兴领域的创新。


如何训练模型?


在这个领域开发的大多数人工智能工具都是通过音频记录进行训练的,例如咳嗽的录音,这些录音与发出声音的人的健康信息配对。例如,这些录音片段可能会被标记为录音时这个人患有支气管炎。这些人工智能工具通过一个称为监督学习(Supervised Learning)的训练过程,将声音的特征与数据标签关联起来。


而在这项研究中,谷歌的研究人员使用了自监督学习(Self-supervised Learning),使用的是未标记的数据,通过一个自动化过程,从公开可用的YouTube视频中提取了超过3亿个咳嗽、呼吸、清喉咙和其他人类声音的短声音片段。每个片段被转换成声音的视觉表示——频谱图。然后研究团队封锁了频谱图的片段,以帮助模型学习预测缺失的部分。这类似于聊天机器人ChatGPT的大型语言模型在经过无数人类文本示例的训练后,学会预测句子中的下一个单词。使用这种方法,研究团队创建了一个基础模型,这个模型可以适应许多不同任务。


HeAR系统概述


高效的学习者


谷歌的研究人员将HeAR模型用于检测COVID-19、肺结核和个人是否吸烟等特征。由于该模型是在如此广泛的人声上进行训练的,要想对其进行微调,研究团队只需要向其提供非常有限的带有这些疾病和特征的数据集。


得分为0.5代表HeAR模型表现不优于随机预测,得分为1代表HeAR模型每次都能做出准确预测,HeAR在COVID-19检测方面的得分为0.645和0.710,这取决于测试的数据集,对于肺结核检测,得分为0.739。


由于HeAR模型的原始训练数据非常多样化,具有不同的音质和人类来源,这也意味着其训练结果具有普遍性和可靠性。


声学已经存在了几十年,健康声学(或叫做音频组学)很有前途,现在有了人工智能和机器学习,就有能力同时收集和分析大量数据。将声音作为追踪健康的生物标志物,这不仅在疾病诊断方面有巨大的潜力,而且在疾病筛查和监测方面也有巨大的潜力。因为我们不能每周都重复扫描或活检,因此,声音可以作为疾病监测的一个非常重要的生物标志物,而且它还具有非侵入性、成本低等优势。


论文链接

https://arxiv.org/abs/2403.02522

https://peerj.com/articles/cs-958/



微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
加州生物基公司新发论文:植物基微塑料7个月内可完全生物降解,已开发多种微藻基塑料产品今日arXiv最热NLP大模型论文:华东师大发布对话级大模型幻觉评价基准DiaHalu隔代亲今日arXiv最热NLP大模型论文:一文读懂大模型的prompt技术最新大模型论文合集!谷歌/微软/Meta/苹果/英伟达/阿里最新研究报告!突发!一华人工程师被捕!他用谷歌电脑偷了谷歌机密,还存到了谷歌账号???今日arXiv最热NLP大模型论文:微软:用大模型分析用户满意度,让智能系统更善解人意今日arXiv最热NLP大模型论文:大模型RAG新宠!浙江大学发布自反馈检索增强方法美国怪事 - 入 乡难,随俗不易回乡散记 九 探望表姐今日arXiv最热NLP大模型论文:COLING2024发布数据集揭示从莎士比亚时期开始的性别偏见这骂声来得迟,但不冤啊《泛血管疾病代谢异常管理中国专家共识》盛大发布,开启疾病管理新时代 | 2024 CCIF&CCPCC今日arXiv最热NLP大模型论文:IBM研究院提出Genie方法,自动生成高质量数据集关于中美关系、中国经济,习近平主席最新论述今日arXiv最热大模型论文:何恺明重提十年之争——模型表现好是源于能力提升还是捕获数据集偏见美味猪肉干与高贵林屠夫Cell:女性更易患自身免疫性疾病的谜底终于被揭开;快来验证你关注的疾病吧今日arXiv最热NLP大模型论文:斯坦福发布法律指令数据集LawInstruct,统一17个辖区24种语言大模型时代,南大周志华团队最新论文上线!刚刚,谷歌华人工程师被捕,他用谷歌电脑偷谷歌机密存到谷歌账号...今日arXiv最热NLP大模型论文:像人一样浏览网页执行任务,腾讯AI lab发布多模态端到端Agent今日arXiv最热NLP大模型论文:引入噪声,可提升RAG检索效果超30%??eBioMedicine | 线粒体DNA片段的缺失或能在疾病症状出现之前预测人类帕金森疾病的发生今日Arxiv最热NLP大模型论文:复旦大学最新研究,如何让大模型说出“我不知道”?大模型时代,南大周志华埋头做学件,最新论文上线今日arXiv最热NLP大模型论文:Github万星!北航发布零代码大模型微调平台LlamaFactory今日arXiv最热NLP大模型论文:微软提出SliceGPT,删除25%模型参数,性能几乎无损美股基本面 - 2024_01_29 * 晚报 * 收盘:道指与标普指数再创新高 市场关注科技股财报与联储会议。美国财政部把季女子早癌病变被漏诊,AI医生在X光中发现!谷歌最新AI听咳嗽就能检测新冠/结核罗氏诊断亮相2024 CACLP,以高品质原料应对分子诊断新挑战!谷歌最强开源大模型亮相!Gemini技术下放,笔记本就能跑,可商用今日arXiv最热大模型论文:清华把大模型用于城市规划,回龙观和大红门地区成研究对象今日arXiv最热NLP大模型论文:天津大学发布大模型数学能力细粒度评价基准FineMathKCL夏教授1v1科研-基于AI的疾病快速诊断方法研究|收获一作论文与导师推荐信!
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。