Redian新闻
>
最容易被ChatGPT抢饭碗的科学家,竟然真的是数学家???

最容易被ChatGPT抢饭碗的科学家,竟然真的是数学家???

公众号新闻


可用于 ChatGPT 的 11 个插件。图片来源:OpenAI

来源 | 科研圈(id:科研圈)

撰文 | 杜若云

编辑 | 吴兰、魏潇


北京时间 3 月 23 日,OpenAI 发布了第一批可接入 ChatGPT 的插件。这些插件由 11 个第三方提供,同时 OpenAI 官方也提供了两个官方插件 Browsing 和 Code Interpreter。


根据 OpenAI 官网的介绍[2],第三方的插件可以用来查询航班,订机票(Expedia,KAYAK),对比商品价格,购物(Klarna Shopping,Shop,Instacart),检索实时消息(FliscalNote),进行数学计算(Wolfram),学习语言(Speak)等等。在这些插件的加持下,ChatGPT 终于可以走出 2021 年之前的世界,与当下“联网”了。



Wolfram 加持,数学能力显著提高


第三方插件的接入使得 ChatGPT 更加强大。作为大型语言模型(LLM)神经网络,ChatGPT 强大的生成文本材料能力有目共睹,但它并不能去做复杂的计算推理工作,也无法系统地产生正确的(而不是“看上去正确”的)数据。但在接入计算功能强大的 Wolfram 插件后,ChatGPT 不仅可以做这些事情,在计算层面上“胡言乱语”的习惯也可以被改正


通过下面这道大学数学题,就能看出接入插件前后 ChatGPT 的不同表现。图 1 中的 Genie 来自代码编辑器 VScode,它是该软件的 ChatGPT 扩展,能够代表没有接入插件前的 ChatGPT。


图 1 没有接入计算插件 Wolfram 前,ChatGPT 的“胡言乱语”。来源:作者



图 2 接入插件的 ChatGPT 给出了正确的答案。来源:[1]


通过简单的检查我们发现,在没有接入 Wolfram 插件时,ChatGPT 给出了一个“看起来过程很完美”但是结果完全错误的回答,但是在接入 Wolfram 插件后的回答是完全正确的。那么,这个插件是如何避免 ChatGPT “胡说”的?解决方法听起来很简单:ChatGPT 会通过插件将问题发送给 WolfrmAlpha 进行计算,然后根据返回的结果来“决定”回答什么。同时用户可以点击“Used Wolfram”按钮来检查 ChatGPT 是否“编造”回答。这意味着,通过 Wolfrm 插件我们可以判断出哪些信息(计算相关)是正确的,哪些是“编造”的。


对于与现实世界有关的问题,ChatGPT 也可以靠这种方法给自己打上“补丁”。比如向无插件版 ChatGPT 提问土耳其的畜牧数量有多少时,它“郑重其事”地引用了土耳其统计局(Turkish Statistical Institute),并“编造”了一个看似合理的数据(图 3)。当使用接入Wolfram 插件的 ChatGPT 时(图 4),这个回答和 WolframAlpha(Wolfram 公司的一款软件,也是 Wolfram 插件背后的“回答者”)中给出的答案完全相同,这也从侧面验证了该插件的工作原理。


图 3 无插件的 ChatGPT 对土耳其畜牧业问题的编造回答。


图 4 有插件后 ChatGPT 能够给出正确答案。来源:[1]


目前,Wolfram 和 ChatGPT 的联动,仅限于 ChatGPT 将用户用自然语言询问的问题通过插件发送给 WolframAlpha。由于 WolfrmAlpha 的构建初衷就是处理各种“混乱”的类人自然语言并给出答案,因此它可以处理来自 ChatGPT 的用户询问,并通过插件返回答案[1],因此目前的 Wolfram 插件对于 ChatGPT 是一个简单版本,未来也许可以通过训练使 ChatGPT “搞懂”更复杂更强大的 Wolfram 语言,这对于 ChatGPT 的计算能力提高更为关键,对科研职业的作用也更为明显



数学家危险了?


那么这是否意味着,插件的接入会使 ChatGPT 的功能足够强大到影响以至于取代某些职业呢?


根据 OpenAI 最近发表在预印本网站 arXiv.org 上的研究论文[3],我们可以看到不同职业对于 GPT 的“暴露”程度。这里的“暴露”是指将完成任务的时间减少至少一半,即当“暴露”程度达到 100%,GPT 能至少帮你将完成任务的时间减少一半。不同职业的“暴露”程度有所不同,最令人惊讶的是,数学家的暴露程度超越了很多看似技术含量不太高的工作,达到了 100%。作为对比,财务经理和平面设计师的暴露程度为 13%,公关专家和创意作家的暴露程度分别为 67% 和 69%,而经常“被失业”的翻译和口译的暴露程度,也只有 77%。


图 5 OpenAI 关于 AI 对不同职业影响程度的研究结果 来源:[3]


从论文发表的时间来看,这些数据是 GPT-4 发布后和 ChatGPT 插件发布前的数据,但从插件的作用和机制来看,插件的引入或许导致这些职业的“暴露”程度更高,同时会减少用户检查 ChatGPT 是否在“胡说八道”的时间但这并不意味数学家将被取代,他们可以将大量繁琐的计算和代码工作交给 ChatGPT 来完成。这将大大提高科学家的工作效率,让他们有时间思考并进行原创性工作。如果 ChatGPT 可以帮助数学家和理论物理学家完成繁琐的计算,并得到大量结果,这也会对我们理解新科学大有帮助。


图 6 陶哲轩分享的 ChatGPT 使用心得 来源:[7]


著名数学家陶哲轩便经常在自己的博客[7]中分享自己如何在科研和教学中使用 ChatGPT。图 6 是他最近探索的几个小用法:他让 ChatGPT “阅读”已有的 arXiv 搜索 API 文档 ,并要求 ChatGPT 构建一个新的 arXiv 搜索查询,能够根据给定关键词和文章投递时间搜索论文如果将得到的结果复制粘贴到浏览器中,还可以得到一个 RSS 订阅,其中含有 10 篇包含关键词"Collatz"和投递时间处于 2011 年到 2016 年的文章(图 7)。在这个过程中,ChatGPT 扮演着阅读 API 文档,并生成符合条件的搜索查询的角色。科研人员无需再搞懂如何操作 API,只要将自己的需求直接告诉 ChatGPT 即可获得想要的论文(这是一个简单的示例,如何发掘出 ChatGPT 的潜力还需要各位读者发挥想象力。)


图 7 利用 ChatGPT 生成的 arXiv 论文检索结果的 RSS。来源:作者


除此之外,陶哲轩还会用 ChatGPT 帮自己备课,比如询问它在线性代数课堂中聪明的学生可能会提出的问题,来启发自己课程讲授以及布置作业的方向。在博客中他提到:“虽然这些 AI 工具无法直接帮助我完成核心任务——如尝试解决一个尚没有答案的数学问题,但是它们对于各种次要(但仍与工作相关)任务时非常有效(尽管之后需要一些手动调整)。”



隐私隐患如何解决


目前来看,这些职业是否会被 AI 取代,取决于后者的未来发展,但这毫无疑问会深刻改变我们的生活生产方式。OpenAI 公共政策主管 Anna Makanju 表示:“这项技术将深刻改变我们的生活方式。我们现在仍有时间来指导其发展轨迹、限制滥用并确保最广泛有益的结果。”[6]


除了职业安全问题,我们还需要关心一下自己的隐私。担心“聪明”的 ChatGPT “窃取”用户隐私是一个 AI 诞生起就如形随形的问题,而第三方插件的引入使得这个问题更加复杂——我们难以保证这些插件不会利用 ChatGPT 获得用户隐私来牟利。3 月 20 日,ChatGPT 出了一个几乎引发全网骚动的 bug,一些用户可以在自己的聊天页面里看到他人的聊天记录。OpenAI 不得不将 ChatGPT 强制下线修复[4],这令大批打工人叫苦不迭。更糟糕的是,ChatGPT 下线的几个小时里,一部分活跃用户的姓名、电子邮件地址、支付地址、信用卡号的最后四位和信用卡到期时间也被泄露,尽管 OpenAI 官方认为泄漏的数据量很少,但如何采取措施确保用户隐私安全将成为所有 AI 公司的首要任务。


如上所述,ChatGPT 这样的 AI 在未来肯定会深刻地影响目前社会的生产生活格局,改变人们的工作生活方式,因此如何确保新的“人+AI”模式顺利进行并对人类社会产生有益影响,对于政策制定者和 AI 公司有着极大的考验。


封面来源:pixabay
主要参考资料:
[1]https://writings.stephenwolfram.com/2023/03/chatgpt-gets-its-wolfram-superpowers/
[2]https://openai.com/blog/chatgpt-plugins
[3]https://arxiv.org/pdf/2303.10130.pdf
[4]https://twitter.com/OpenAI/status/1639297361729191936
[5]https://openai.com/blog/march-20-chatgpt-outage
[6]https://openai.com/safety
[7]https://mathstodon.xyz/@tao

本文经授权转载自公众号“科研圈”(ID:keyanquan)
凡本公众号转载、引用的文章 、图片、音频、视频文件等资料的版权归版权所有人所有,因此产生相关后果,由版权所有人、原始发布者和内容提供者承担,如有侵权请联系删除。


《环球科学》4月新刊正在热卖

各电商平台均有销售


点击【在看】,及时接收我们的内容更新 


微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
CG-21:这四个职业最容易被人工智能。ChatGPT给出解决方案!你以为AI是在画画吗?它画的是数学集成ChatGPT后必应日活量首破亿!微软推出Azure OpenAI ChatGPT 服务,GPT-4下周发布ChatGPT最容易颠覆哪些行业和领域?ChatGPT引爆澳洲裁员潮!大厂华人直接丢饭碗!10大最容易被替代职业发布啊?啥?不是吧????????豪斯曼:《诗歌外编》: 第五首:天上有七大行星电影里的双性人,竟然真的存在?ChatGPT带火AI芯片,赚翻了的英伟达发布新核弹:ChatGPT专用GPU,让推理提速10倍!徒步穿越 Los Cahorros 的悬索桥和峡谷ChatGPT升级版发布,十秒能做一个网站!学啥专业不容易被AI抢饭碗?李彦宏:AI不会跟我们抢饭碗,而是帮我们更好地端饭碗科学家也要失业了?AI成为主脑科学家,AI主导的科学革命已来GPT抢工作真的来了!知名4A公司蓝色光标带头改革西湖大学研究:AI可作为实验的主脑科学家,一场新的科学革命正在发生?米莱新书《这就是数学》:解决1~4年级娃概念、数量关系、思维转换的数学难题我不担心ChatGPT抢我饭碗,但我担心那件更要命的事电影人真的会被ChatGPT替代吗?印度会被ChatGPT冲击?大国要崛起可不是那么容易的抬头仰望美国塔霍湖(Lake Tahoe),山湖小船向松祚:90%以上的经济学家会被ChatGPT取代ChatGPT火了,我开始担心AI恋人跟我抢饭碗了……芝大教授何川获得Wolf科学大奖开始了!澳洲大量行业被ChatGPT抢活!各大科技公司裁员不断!这10个行业最危险当我问ChatGPT,最容易移民的国家是哪里?ChatGPT升级版!GPT-4 能识图能算税,升级成考霸,华裔AI科学家点评:它可以自己考进斯坦福了被ChatGPT“抢饭碗”的人停止内耗!Google和DeepMind被ChatGPT逼急了,决定合作打败GPT-4下一个十年,最不易被ChatGPT取代的职业是?“你的工作可能被ChatGPT取代。但你真的在乎吗?”AI抢饭碗成真!近500家美国企业用ChatGPT取代员工,有公司省下超10万美元很多人担心被ChatGPT取代,我们关心ChatGPT的歧视与遮蔽ChatGPT讲座:ChatGPT并不神秘,但ChatGPT很神奇ChatGPT取代480家美国企业员工职位,AI开始抢饭碗了!
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。