Redian新闻
>
刘知远等众多机构提出ToolLLM:促进大型语言模型掌握16000+真实世界的APIs

刘知远等众多机构提出ToolLLM:促进大型语言模型掌握16000+真实世界的APIs

公众号新闻

进NLP群—>加入NLP交流群

为了促进开源LLMs的工具使用能力,作者引入了 ToolLLM,这是一个数据构建、模型训练和评估的通用工具使用框架。

论文:ToolLLM: Facilitating Large Language Models to Master 16000+ Real-world APIs
地址:https://arxiv.org/abs/2307.16789
项目:https://github.com/OpenBMB/ToolBench
单位:清华、人大、耶鲁、微信、腾讯、知乎

尽管开源大语言模型 (LLM) 及其变体(例如 LLaMA 和 Vicuna)取得了进步,但它们在执行更高级别的任务方面仍然受到很大限制,例如遵循人类指令使用外部工具 (API)。

这是因为当前的指令调优主要集中在基本语言任务而不是工具使用领域。

这与最先进 (SOTA) 的LLMs(例如 ChatGPT)形成鲜明对比,后者展示了出色的工具使用能力,但不幸的是闭源的。

为了促进开源LLMs的工具使用能力,我们引入了 ToolLLM,这是一个数据构建、模型训练和评估的通用工具使用框架。

我们首先介绍 ToolBench,这是一个供工具使用的指令调整数据集,它是使用 ChatGPT 自动创建的。

具体来说,我们从 RapidAPI Hub 收集了 16,464 个真实世界的 RESTful API,涵盖 49 个类别,然后提示 ChatGPT 生成涉及这些 API 的各种人工指令,涵盖单工具和多工具场景。

最后,我们使用 ChatGPT 为每条指令搜索有效的解决方案路径(API 调用链)。

为了使搜索过程更加高效,我们开发了一种新颖的基于深度优先搜索的决策树(DFSDT),使LLMs能够评估多个推理轨迹并扩展搜索空间。我们证明 DFSDT 显着增强了LLMs的规划和推理能力。

为了有效评估工具使用情况,我们开发了一个自动评估器:ToolEval

我们在ToolBench上微调LLaMA并获得ToolLLaMA

我们的 ToolEval 表明 ToolLLaMA 表现出执行复杂指令和泛化到未见过的 API 的卓越能力,并且表现出与 ChatGPT 相当的性能。

为了使管道更加实用,我们设计了一个神经 API 检索器来为每条指令推荐合适的 API,从而无需手动选择 API。


进NLP群—>加入NLP交流群

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
LLM+模仿学习,解决真实世界中的复杂任务:AI2提出SwiftSage龚俊——逐日狂欢超越 GPT-4!加州大学伯克利分校与微软研究院合作开源大型语言模型 Gorilla字节李航等发表最新《可信赖的大型语言模型》综述,提出七大维度佐治亚理工提出polyBERT化学语言模型,促进聚合物空间高通量筛选关于大型语言模型的争论和局限ICCV 2023 | 基于预训练视觉语言模型和大语言模型的零样本图像到文本生成美军笔下的八路军,新四军,游击队,伪军和日军When RS Meets LLM:推荐系统如何从大语言模型中取长补短?面向应用视角的全面综述银行业专用大型语言模型落地懂3D的语言模型来了!UCLA、上交、MIT等联合提出3D-LLM:性能大涨9%Falcon-7B大型语言模型在心理健康对话数据集上使用QLoRA进行微调聚焦慢病真实世界数据,以循证诊疗推动慢病患者获益——第二届“真实世界研究与慢病论坛暨瞰见论坛”重磅来袭!吴恩达力赞!哈佛、MIT学者用下棋证明:大型语言模型确实「理解」了世界龚俊和迪丽热巴获得芭莎“年度人气ICON' 荣誉如何更好地蒸馏ChatGPT模型能力:Lion闭源大型语言模型的对抗性蒸馏模型原理及实验工作介绍邀请您参加IEEE网络技术论坛:基于大型语言模型的组合推理SafetyBench:通过单选题评估大型语言模型安全性【保姆级】深入解析大型语言模型核心技术清华提出开源工具学习框架,接入真实世界 16000+API, 效果达 ChatGPT大模型掌握16000+真实世界API了,清华等机构ToolLLM的工具使用能力不输ChatGPT大型语言模型与知识图谱:机遇与挑战解密大型语言模型:从相关性中发现因果关系?当李大海遇上刘知远:知乎和面壁的「大模型」故事刘知远团队提出:如何通过扩大高质量指导性对话数据集,来提高模型的性能和效率【限时】10场大型语言模型前沿技术分享DreamLLM:多功能多模态大型语言模型,你的DreamLLM~为期五年,Ginkgo牵手谷歌开发新型大型语言模型,助力药物发现和生物安全领域龚俊芭莎视频最新综述!当大型语言模型(LLM)遇上知识图谱:两大技术优势互补大型语言模型专场上线!四位AI新青年直播讲解MiniGPT-4、LLaVA、Gorilla以及大型语言模型Token危机以 LLM 为核心 LLM@Core:程序员的大语言模型技术指南故国神游,我的家乡天津大型语言模型训练加速专场在线研讨会上线,三位专家将主讲AI服务器、训练框架和云上高性能存储架构大型语言模型与知识图谱协同研究综述:两大技术优势互补
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。