国际科技财经博客移民网络热点娱乐民生时事公众号

>

让ChatGPT长“手”！Meta爆火新论文，让语言模型学会自主使用工具

让ChatGPT长“手”！Meta爆火新论文，让语言模型学会自主使用工具

公众号新闻

2023-02-13 07:02

鱼羊 Pine 发自凹非寺
量子位 | 公众号 QbitAI

ChatGPT爆火，Meta也坐不住了。

微软和谷歌正在搜索引擎那边刺刀拼刺刀呢，谁想Meta冷不防抛出一篇新论文，顿时吸引全场目光：

瞄准ChatGPT的“软肋”，让大语言模型自行学会了使用工具！

简单来说，基于Meta的这个思路，ChatGPT这些大语言模型可以缺啥补啥：

不会算数，就自己掏出计算器计算；需要最新信息，就自己连接搜索引擎搜索……

是不是有点AI自己操作自己内味儿了？

论文一出，不少AI研究者就将其视作“过去几周里最重要的论文”。

这篇论文给人们打开了思路，让大语言模型未来可以成为所有事情的起点。

还有网友表示：我老婆原本不太关心AI，听说Meta这论文都惊了。普通人真的得好好想想这事儿了。

自学工具用法的大语言模型

这一回，Meta给这个会使工具的语言模型起名Toolformer。

Toolformer的内核逻辑，总结下来很简单，就是：

专业的任务交给专业的工具来做。

在生成文本的过程中，遇到特定的任务，Toolformer会直接调用所需工具的API。

比如说，在执行这个任务：1400名参与者，有400人通过了测试，占多大比例？（为了让ChatGPT掌握数学运算，OpenAI可没少折腾【加链接：ChatGPT连夜迭代：你老婆不好使了】）

Toolformer丝毫不慌，直接“掏出”计算器，现场计算得出结果：29%。

又或者说，想要备注个事情，只知道是周五，具体日期还不知道？

没关系，翻出日历查一下就好了。

甚至翻译任务也可以直接丢给它，各国语言都能够识别并翻译，直接省去了在软件切换语言的工夫。

除了这些工具之外，Toolformer还能够调用Q&A以及搜索引擎等工具。

这时，就已经有网友开始畅想未来了：

现在，ChatGPT版必应能帮你比较酒店价格，那未来有了Toolformer，预定性价比高的酒店岂不是也可以甩给AI去做了。

不过话说回来，Toolformer面对不同的任务都能行云流水般地调用对应的工具，它是怎么做到的呢？

一言以蔽之，Toolformer经过训练，能够在生成文本中插入API调用，直接将任务外包出去。

在这其中，训练的过程是以自监督的方式完成的。这意味着无需大量人类标注好的数据，Toolformer只需要少量演示就能学会调用API。

具体来说，先给Toolformer提供少量已经手动标注好的例子，然后让语言模型在实践中生成一个更大的包含示例的数据集。

这个过程主要分成三步：

首先是取样，通俗点讲就是看输入的文本提示中，哪个地方需要调用哪种工具，然后直接将“调用的API”插入到对应的地方；

其次是执行，执行上一步的“调用API”任务，将生成的文本直接插入进去；

最后是过滤，上一步中工具生成的文本如果对输入文本来说用处不大的话，就可以直接pass掉，保留对文本有用的地方。

这样一来，基于这些有用的数据集，Toolformer便可以对预先训练好的大语言模型进行微调。

讲了这么多，Toolformer的真实效果到底如何，有没有一个横向的数据对比？

论文将Toolformer和多个其他大语言模型，包括GPT-J，OPT（66B）以及GPT-3（175B）进行了对比，比较了它们在数学、Q&A以及机器翻译等方面的能力。

结果显示，在学习使用工具后，GPT-J的零样本学习性能的到了显著的提高。

△Toolformer：是在GPT- J上微调，并加强了CCNet子集中的API调用/ Toolformer （disabled）：同上，但解码期间禁用API调用

并且在大多数任务上性能都有明显提高，在一些下游任务中Toolformer甚至已经超过了GPT-3。

“未来大语言模型发展的重要分支”

说到这里，不知道你怎么看这件事儿。

有不少网友是已经按捺不住，想着去拔AI电源了。

而引发更多讨论的，是这样一种观点：Toolformer可能是未来LLM（大语言模型）发展的一个重要分支。

大语言模型进化出使用工具的能力，知道应该在何时、使用何种工具来实现需求，也就意味着许多在今天还需要人类和AI协作完成的工作，未来AI都能自己搞定了。

比如现在还多少有些“人工智障”的语音助手，如果背后有ChatGPT+Toolformer的技术能力支撑，那么从挑选符合需求的餐厅，到直接订座，这一系列动作都可以被丝滑地串联起来。

又比如微软的必应搜索接入ChatGPT。如果这些大语言模型能充分调用各种API、使用UI，那它不仅能帮人们完成搜索，还能完全改变人们操作网页的方式——一切输入都可以化简为自然语言。

甚至，ChatGPT这样的模型，借助各种API重写自己的代码，也将成为可能。

事实上，让AI掌握工具的使用方法这个研究方向，也并不只有Meta在做。

比如谷歌即将嵌入到搜索中的Bard，背后模型LaMDA就内置了一套工具箱，包括计算器、翻译器和访问搜索引擎获取外部信息的接口。

还有开源项目LangChain，也致力于将大语言模型与外部的计算、知识来源相结合，以开发真正可用的应用程序。

而现在，Meta又使大模型对工具的使用“熟练度”、“自主性”，更上一层楼。

不过，也有网友指出，Toolformer所展现出的“自学”能力，还是一个初级、“狭义”的版本。

这些模型本身仍然是纯粹的函数：给定相同的输入（包括采样时的随机值），它将总是产生相同的输出。
有点像是在说，一个大语言模型能学会将特定领域的语言作为其自然语言的一部分，以此纳入来自外部工具的知识。

One More Thing

Meta新论文炸场，还挑动了人类的“反思”神经。

这不，新鲜梗图已经出炉：

人类在沉迷，而机器在学习。

论文地址：
https://arxiv.org/abs/2302.04761
参考链接：
[1] https://twitter.com/timo_schick/status/1624058382142345216
[2] https://twitter.com/mathemagic1an/status/1624870248221663232
[3] https://twitter.com/Tisoga/status/1624543837745192960

— 完 —

《中国AIGC产业全景报告暨AIGC 50》调研启动

谁会是中国的“ChatGPT”？最有竞争力和潜力的AIGC力量位于何方？

量子位《中国AIGC产业全景报暨AIGC 50》正式启动对外征集，期待有更多优秀的机构、产品、案例与技术能够被大众看到。

点这里👇关注我，记得标星哦～

一键三连「分享」、「点赞」和「在看」

科技前沿进展日日相见 ~

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。

来源: qq

点击查看作者最近其他文章

相关阅读

ChatGPT爆火，LeCun心态崩了！称大语言模型是邪路，Meta模型3天惨遭下线 NLP大规模语言模型推理实战：大语言模型BLOOM推理工具测试实践与效果分析实录 AI大战升级！Meta推出先进大型语言模型，下一个ChatGPT不远了？一位论文作者火了，ChatGPT等大型语言模型何时能成为论文合著者？Meta发布首个「非参数化」掩码语言模型NPM：吊打500倍参数量的GPT-3 元语AI(ChatYuan): ChatGPT中文版尝试？功能型对话大语言模型.beta版 ChatGPT自己会选模型了！微软亚研院+浙大爆火新论文，HuggingGPT项目已开源新电影《匹诺曹》，谎话说的越多，鼻子变得越长 Meta版ChatGPT来了？小扎、LeCun官宣650亿参数SOTA大语言模型LLaMA 集成ChatGPT后必应日活量首破亿！微软推出Azure OpenAI ChatGPT 服务，GPT-4下周发布微信回应头像褪色，部分C刊不准隐瞒ChatGPT使用，微软推进裁员，Opera新版集成ChatGPT，这就是今天的其它大新闻！互联网变天：ChatGPT长出“操控”的手和脚，但这只是开始单卡就能跑的大模型等效GPT-3！Meta发布大语言模型LLaMA，大小从7B到65B不等 Meta最新语言模型LLaMA论文研读：小参数+大数据的开放、高效基础语言模型阅读笔记是什么让ChatGPT变得如此聪明？仍然未知的大语言模型“能力涌现”现象 |【经纬科创汇*AI】几岁开始玩儿攀岩合适 Meta发布全新大语言模型，号称比ChatGPT更强，单GPU上就能跑，后续或将开源叹一个”心口不一“的例子，说说争论的没意思 College Essay 系列 (二十九)：Hardly Essay (5) 宾大WL文书从LLM到MLLM，多模态大规模语言模型KOSMOS-1赋予了语言模型看见世界的能力 ChatGPT讲座：ChatGPT并不神秘，但ChatGPT很神奇第二次徒步圣路，750公里葡萄牙之路+英国之路:D15～以车代步 ICML 2023禁止使用大型语言模型写论文！LeCun转发：中小型模型可以用吗？7 Papers & Radios | Meta「分割一切」AI模型；从T5到GPT-4盘点大语言模型剽窃、作弊，ChatGPT竟偷偷生成了12篇署名论文！Marcus炮轰Ta变成CheatGPT 重新审视Prompt优化问题，预测偏差让语言模型上下文学习更强 FastTrack Universität 2023莱比锡大学公立语言项目招生简章全网爆火的ChatGPT可代写论文，论文还要亲手写吗？ChatGPT 为啥那么牛？语言模型足够大就会涌现出新能力写IB作业和论文，可以使用ChatGPT吗？IBO官方回复来了！一个严肃的问题：让ChatGPT撰写的学术论文能发表吗，如何避免学术不端？语言模型自己学会用搜索引擎了？Meta AI提出API调用自监督学习方法Toolformer ChatGPT带火AI芯片，赚翻了的英伟达发布新核弹：ChatGPT专用GPU，让推理提速10倍！马斯克AI实验室名字敲定/ Win11任务栏添加ChatGPT搜索/ 沃尔玛限制员工使用ChatGPT…今日更多新鲜事在此人工智能大PK！Meta挑战ChatGPT，推出语音模型LLaMA...

热点事件追踪