Redian新闻
>
AI会带来大量不可重复的研究结果吗?

AI会带来大量不可重复的研究结果吗?

科学

海归学者发起的公益学术平台

分享信息,整合资源

交流学术,偶尔风月

从生物医药到社会科学,科学界越来越依赖人工智能(AI)算法,通过机器学习工具来“干活儿”。通过购买AI工具服务,研究人员可以在几个小时内便获得实验结果预测,非常的高效。然而最近,普林斯顿大学研究人员发现,使用机器学习的这类工具给出的结果很可能不够严谨,导致结论无法复制、再现。


“很少有科学家意识到,他们在应用人工智能算法时遇到的问题其实是普遍性的。目前,学术界也没有禁止不可复制论文的机制。”对此,普林斯顿大学机器学习研究员萨亚什·卡普尔(Sayash Kapoor)和他的合著者阿尔文·纳拉亚南(Arvind Narayanan)在预印本上发表文章,希望帮助研究人员避开机器学习应用中的陷阱。此举也敲响了科学“再现性危机”的警钟。

 

图源:pixabay.com


什么是再现性?卡普尔他们对“计算再现性”的定义很宽泛:其他团队应该能够复制模型的结果的全部细节,包括数据、代码和条件等。如果研究人员在数据分析中出错,那么这个模型将被定义为不可复制的,这意味着该模型并不具有预测性。


有些研究人员认为卡普尔的说法太过绝对,对错误的判断太过主观。他们并不认为自己的研究结果存在缺陷。然而,卡普尔的观点仍然引起了学界共鸣。7月28日,超过1200人报名在线参加了卡普尔等人发起的“再现性”研讨会,希望能找出这一问题的解决方案。


数据科学家莫明·马利克(Momin Malik)支持卡普尔的观点。他提出,当算法应用于健康和司法等领域时,对机器学习的依赖会对研究结果造成实质伤害。他质疑机器学习的合法性,认为除非解决再现性危机,否则机器学习的声誉将会受到打击。

卡普尔和纳拉亚南认为,机器学习在很多学科应用中存在缺陷。他们分析了17个研究领域的20篇综述,统计了329篇研究论文。这些论文的结果由于机器学习的缺陷而无法完全复制。即便是纳拉亚南本人也不能幸免。2015年他参与撰写的一篇关于计算机安全的论文就是其中之一。他们认为,这些问题的出现不是研究人员的错。围绕人工智能的炒作和监管漏洞才是罪魁祸首。


研究团队强调,最突出问题是“数据污染”,比如“时间污染”——很多AI都被训练用于预测某些尚未发生的事,用来训练AI的数据是之前积累的历史数据,如用1-6月份的数据来预测7月会发生什么,但是如果“不小心”混入了6月30日之后的数据,那么这个所谓预测的结果还有意义吗?2011年的一篇模型论文声称可以通过分析Twitter用户的情绪来预测股市收盘价,准确率为87.6%。但是在他们用于训练的数据中出现了训练集之后的数据,等于让AI看到了“未来”。


还有数据范围狭窄问题。比如通过人工智能算法在X光片中查找肺炎。这种算法只针对老年人群体数据进行训练,放在年轻群体中也许就不适用了。还有通过算法在草地背景中识别奶牛的技术,放在其他背景中就无法成功识别。人们过于信任机器学习,这种问题也许是一种心理问题。这导致所谓的“预测”也许只是回顾性的检验,而与未来无关。


人体肺部肿瘤的CT扫描。研究人员正在试验人工智能算法,以发现疾病的早期迹象。

图源:K. H. Fung/SPL


研究团队提出,解决问题的方法是在研究中引入“证据”,证明模型不存着数据污染问题。还有一些研究领域尝试通过制定报告指南来进行监管。另外,行业领域内学科专家与机器学习的研究人员加强相互合作也对解决数据污染问题有积极作用。


机器学习在科研领域内发挥作用的时间并不长,如何用好、管好这项新技术是科学界迫切需要思考并解决的问题。卡普尔认为,必须避免历史上心理学复制危机之后的那种信心危机。毕竟拖得越久,问题就越大。

参考文献:
https://www.nature.com/articles/d41586-022-02035-w


点击下方知社人才广场,查看最新学术招聘

扩展阅读

 

不创新,毋宁死,那论文可重复性呢?
那些意义不明的论文,能否复现有什么意义呢?
专人专款历时八年,五十余篇高引用论文依然有一多半未能复现
征稿启事:可重复性和研究诚信
本文系网易新闻·网易号“各有态度”特色内容
媒体转载联系授权请看下方

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
雇佣兵是人道援助还是搅动战争静脉铁剂改善心衰患者住院及死亡率再获有力证据!IRONMAN研究结果在AHA上重磅发布!翻开新的一页,365天都会带来健康喜乐!平安夜想念女王了!查尔斯发表首个圣诞演讲!凯特会带来怎样的惊喜?NF-κB 研究2022丨涉及几乎所有疾病的通路,这12篇重要的前沿论文给出清晰的研究思路当100位科学家云聚会,会为我们这个社会带来什么?ORION-3试验4年研究结果公布,Incisiran可使LDL降低45%|AHA 2022AHA 2022|CTS-AMI研究结果重磅发布,开启中药治疗STEMI“心”篇章!可重复使用航天运载器发展历程美联储今年最后一次加息会带来哪些影响?“每天八杯水”科学吗?最新研究结果可能颠覆认知相信奔赴土耳其灾区的援助会带来奇迹!在名校“垫底”和二流学校“拔尖”,到底哪条路更容易成功?研究结果令人惊讶….姐弟恋真的能够修成正果吗?年下恋真的好甜!亚特兰大的凶杀案连续第三年上升 摄像头系统有效果吗?【广发策略|数据说】高速渗透期的高速扩产,会带来什么?错误的例子证明错误的结论:论“中国队大胜美国队与中国队大败美国队”你真的会做PPT阴影效果吗?AHA 2022即将开幕,近80项重磅研究结果等你来看,精彩内容不容错过!经济发展不好的内在原因“秒”要被重新定义了,潘建伟的研究功不可没目前最大的Paxlovid真实世界研究结果发布!张维迎:用三驾马车理论分析经济问题,基本上不会带来好日子墨尔本天气多变会增加患癌几率!莫纳什华人教授研究结果震惊了...讲座预告|关于国际法研究的研究Gut:六大研究队列近80万人研究结果表明:采用并保持健康生活方式或能预防高达60%的炎性肠病病例的发生快去!加拿大星巴克免费送红色限量环保杯!可重复使用~人丑就该多读书?研究结果扎心了:人如果不好看,发论文引用率都更低58岁女人为什么需要小情人?《悠悠岁月》(6)财报前瞻 | 谷歌:三大利好因素会带来上行空间?引发空前关注的3剂灭活病毒疫苗研究结果,到底是怎么回事?能用人工的尽量不用机械,能组织当地群众务工的尽量不用专业施工队伍......新修订的《国家以工代赈管理办法》3月1日起施行China’s open-door policy污名化资本,只会带来大灾难!当进博会遇上自贸区,会带来什么不一样的故事?
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。