Redian新闻
>
GPT-4的黑箱运作方式引科学家不满

GPT-4的黑箱运作方式引科学家不满

公众号新闻

原文作者:Katharine Sanderson


科研人员对这项AI技术充满期待,但对其底层技术的秘而不宣感到不满。


上周,人工智能公司OpenAI推出了GPT-4——驱动其热门对话机器人ChatGPT的大型语言模型的最新版本。这个语言模型能根据几乎任何提示创作有人类文笔的文本并生成图像和程序代码,而且表现十分惊艳。该公司表示,GPT-4在此基础上又有了很大的提升。研究人员认为这些能力有望推动科研变革,但也有人感到不满,因为他们还没有使用权限,也不了解它的底层代码或是训练方式。科学家认为,这种情况下,人们对该技术的安全性会有顾虑,其对科研的帮助也不如预想的这么大。


人工智能模型GPT-4尚未向所有用户开放。|Jaap Arriens / NurPhoto via Getty Images


3月14日公布的GPT-4有一个全新升级:它现在不仅可以处理文本,还可以处理图像。作为对其语言能力的演示,位于加州旧金山的OpenAI表示,GPT-4已经能通过美国律师资格考试,成绩位于第90百分位,而之前的ChatGPT版本只能进入第10百分位。不过,这项技术尚未向所有人开放,目前只有ChatGPT的付费用户可以使用


“现在需要在等位名单上排队,还不能立刻就用上。”阿姆斯特丹大学心理学家Evi-Anne van Dis说。不过,她已经见过GPT-4的demo。她说:“我们在视频里看过他们演示GPT-4的一些能力,简直超乎想象。”她记得,有一次演示用了一个网站的手绘插画,GPT-4能根据这些插画生成构建该网站的代码,证明它能将图像转化为输入信息的能力


不过,OpenAI对它的模型使用哪些数据训练、如何训练,以及它的运作方式讳莫如深,这令科研人员感到不满。“所有这些闭源模型可以说是科学界的死胡同,”开源AI社区HuggingFace的气候科学家Sasha Luccioni说,“他们【OpenAI】可以在他们的研究基础上越攀越高,但对整个科学界来说,这就是条死路。”


“红队”测试


美国罗切斯特大学的化学工程师Andrew White以“红队队员”(red-teamer)的身份优先体验了GPT-4。OpenAI付费邀请这些红队队员测试该平台,他们会尝试让GPT-4做些不好的事情。他说,他在过去6个月都可以使用GPT-4。“与之前几代相比,一开始它好像也没什么特别之处。”


他会询问这个机器人合成某个化合物需要哪些反应步骤,让它预测反应产物并选择催化剂。“起初我没觉得它有多强大,”White说,“令人惊讶的是它看起来特别像回事,但它会在这里幻想出一个原子,在那里跳过一个步骤。”不过,就在他按照他们红队的任务给GPT-4开放科研论文的权限后,情况急剧变化。“我们发现,这类模型独立存在时可能没什么厉害之处,但当你把它和互联网和逆合成设计功能(retrosynthesis planner)等工具,或是和计算器相连,突然之间,新的能力全部出现了。”


当然,这些能力也伴随着隐忧。比如,GPT-4会允许合成危险化学品吗?利用White等人的输入信息,OpenAI的工程师再把这些信息“投喂”给他们的模型,让GPT-4避免生成危险、非法、有害的内容,White说道。


捏造事实


不实信息是另一个问题。Luccioni表示,GPT-4一类模型的功能是预测一句话的下一个词,所以无法完全摆脱胡编乱造的问题,这种现象也成为“幻觉”(hallucinating)。她说:“你不能全信这些模型,因为它的幻觉太多了。”即使是最新版本也仍有这个问题,她说,尽管OpenAI表示已经提升了GPT-4的安全性。


如果不公开训练所使用的数据,OpenAI关于安全性的担保在Luccioni看来是不够的。她说:“你不知道它用了哪些数据,你就无法优化它。我的意思是,把科研工作教给这样一个模型肯定是不现实的。”


围绕GPT-4训练方式的谜团对van Dis在阿姆斯特丹大学的同事、心理学家Claudi Bockting来说也是一个担忧。“让人类对他无法监督的东西负责是很难的,”她说,“一个担忧是它们的偏见可能远远超过人类自己的偏见。” Luccioni解释道,如果无法获得GPT-4的底层代码,你就无法判断偏见是来自哪里,自然也就没法纠正了


伦理探讨


Bockting和van Dis还担心这些AI系统今后都会被大型科技公司收入麾下。他们希望这项技术能得到科学家的严格测试和验证。她说:“这里也有机遇,因为与科技巨头的合作能加快前进速度。”


van Dis、Bockting和同事在今年更早时指出,亟需建立一套“活”指南,指导AI和GPT-4等工具的使用和开发。他们担心关于AI技术的任何法规很难跟上AI发展的步伐。Bockting和van Dis已经组织4月11日在阿姆斯特丹大学召开研讨会,探讨上述问题,与会代表来自联合国教科文组织的科学伦理委员会、经济合作与发展组织、世界经济论坛等组织。


White认为,抛开种种顾虑,GPT-4及其未来迭代势必会重塑科学。他说:“我相信这将是科研基础架构的一次重大变革,堪比当初互联网带来的巨大震动。”它不会取代科学家,他说,但能协助科学家开展某些工作。“我认为我们将慢慢意识到,我们能把论文、数据程序、我们用的图书库与计算工作,甚至是机器人实验全部互联。


原文以GPT-4 is here: what scientists think标题发表在2023年3月16日《自然》的新闻版块上


© nature

doi: 10.1038/d41586-023-00816-5


版权声明:

本文由施普林格·自然上海办公室负责翻译。中文内容仅供参考,一切内容以英文原版为准。欢迎转发至朋友圈,如需转载,请邮件[email protected]。未经授权的翻译是侵权行为,版权方将保留追究法律责任的权利。


© 2023 Springer Nature Limited. All Rights Reserved


微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
如果说ChatGPT是个黑箱,那么人脑呢?| 深度书评ChatGPT升级版!GPT-4 能识图能算税,升级成考霸,华裔AI科学家点评:它可以自己考进斯坦福了「ChatGPT之母」最新采访:GPT-4离超级智能还很远,半年内不会训练GPT-5Gpt 4一出,谁与争锋硕士在读,入选全球高被引科学家!辞旧迎新,卯年吉祥高级!多大正式引入Bloomberg,留学生赢麻了韦神出的这道题火了,GPT强大而惊艳——发布19天后,直观感受一下GPT-4的写作能力关于GPT-4的产品化狂想重磅!基于GPT-4的全新智能编程助手 GitHub Copilot X 来了!李志飞:关于GPT-4的八点观察,多模态大模型竞赛开始GPTHow did Mao Zedong solve the opium addiction problem?海关总署回应“港口空箱”问题 上海航运交易所:出口集装箱运输市场出现企稳集成GPT-4的编程神器来了,GitHub发布Copilot X:编程30年,突然就不需要手敲代码了?!为什么所有公开的对 GPT-3 的复现都失败了?复现和使用 GPT-3/ChatGPT,你所应该知道的田渊栋:关于GPT-4的一点感想(后一篇)ChatGPT爆红出圈后,伦理学家、科学家都在反思即将到来的挑战和困境GPT-4的前世、今生和未来!用GPT打败GPT?AutoGPT将AI进程推向了新高度!|GGView集成ChatGPT后必应日活量首破亿!微软推出Azure OpenAI ChatGPT 服务,GPT-4下周发布微软大招!GPT-4 Office 全家桶发布,我们的工作方式将永远改变GPT-4的研究路径没有前途?Yann LeCun给自回归判了死刑微软研究院:人工通用智能的星星之火-GPT-4的早期实验(101页)ChatGPT讲座:ChatGPT并不神秘,但ChatGPT很神奇回忆往年过春节全球顶尖科学家排名发布:施一公,董晨,曹雪涛,蒲慕明,钟南山,高福等上榜!朱健康在中国华裔科学家中(生命科学)排名第一最航运 | 宁波出口集装箱运价指数周评GPT-4.0对战GPT-3.5:GPT-3.5简直弱爆了!!!AutoGPT与GPT-4的能力涌现|投资人播客分享最容易被ChatGPT抢饭碗的科学家,竟然真的是数学家???成功的经济学家不值得羡慕,只有一个到处碰壁的「失败者」才吸引我 | 梁捷「变革时代的经济学家」上线田渊栋:关于GPT-4的一些感想【南北碰碰胡】#17 北方 北京早餐《豆浆油条》+ 北京糖葫芦ChatGPT创始人:科学家很有创造性想法、更多资金应涌向基础科学品尝玫瑰的浪漫二年级选课,忽闻一夜 GPT 来,千课 万课 AI 开OpenAI创始人:GPT-4的研究起源和构建心法
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。