任意场景,动嘴就能创建专属AI智能体小队的AutoAgents来了
机器之心专栏
机器之心编辑部
AutoAgents 的出现让 AI 智能体技术距离落地又更近了一步,仅需一行命令,自动为你创建合适的 AI 智能体小队,写游戏、谣言验证、写书、写报告都不在话下。
近日,GitHub 上线了一个新的 AI 智能体项目:AutoAgents,该项目是由 Llama2 大模型发布第二天就发布了中文版模型下载 [1] 的 LinkSoul.AI 团队牵头,北大、港科大、智源、滑铁卢大学共同发起。相比 AutoGPT [2]、MetaGPT [3] 这些使用门槛较高、使用场景受限的方案,AutoAgents 致力于将 AI 智能体应用于任意场景,自动针对目标场景设计合理的智能体组合,将复杂任务解构为角色、任务,实现合适的角色解决匹配的任务。
项目链接:https://github.com/LinkSoul-AI/AutoAgents
在线体验:https://huggingface.co/spaces/LinkSoul/AutoAgents
任意场景,自动规划合理的智能体组合
AutoAgents 致力于提供任意场景的通用解决方案,只需输入用户的一句话需求,就能针对目标场景快速组建合理的智能体小队,自动解构复杂的任务,并由合适的智能体分工协作完成对应的任务。
编写小说
比如,输入
「写一本关于人工智能觉醒的小说(Write a novel about the awakening of artificial intelligence)」
AutoAgents 会启动一个 「项目经理」(Planner)来设计完成当前任务所需的其他角色和各角色完成任务所需要的具体动作。
为了完成这个任务,Planner 设计需要的几位专家:一名研究人员(Researcher)收集有关人工智能及其潜在觉醒的信息,一名故事策划者(Story Planner)概述小说,以及一名角色开发人员创造引人入胜的角色,最后,需要一名作家负责撰写叙事。
这些不同领域专家均由 AI 智能体扮演,并依据计划执行自己的任务。例如,故事策划者利用研究人员提供的检索信息编写了故事的起承转合,既有高潮也有转折,使得故事更加引人入胜。
最后,由作家完成故事的撰写。通过各个角色智能体的分工合作,高效完成了小说撰写任务。
小游戏快速实现
有了 AutoAgents,任何人都能够轻松地以极低成本构建一个小游戏开发团队,AutoAgents 会帮你「招募」项目经理、程序员、测试员等角色。不同于已有的常见方案,包括 ChatGPT,我们需要手动编写提示词(Prompt),在不断和程序交互过程中自行确认要使用的编程语言、项目规划、设计游戏角色等等一系列麻烦事,在 AutoAgents 里,我们只需要明确我们的任务目标即可,非常简单,就像下面这样:
写一段命令行贪吃蛇小游戏的代码(Show me a code snippet for a cli snake game)
随后,AutoAgents 会为你创建需要的角色,并为角色赋予职责和能力,确定每个角色能使用的外部工具列表。之后,各角色根据规划开始有序执行任务,互相协作,并最终实现目标。
谣言验证
不只是软件或游戏开发场景,具有极强的场景适应能力的 AutoAgents,可以为任何新的场景,自动设计合理的「新智能体组合」,来解决你的问题。日常生活中,你或许也会被谣言所困扰。我们可以求助于 AutoAgents ,AutoAgents 会自动创建领域专家和语言专家实现谣言的验证。以最近爆火的 LK-99 超导事件为例,我们只需要向 AutoAgents 提出需求:
LK-99 真的是室温超导材料吗?(Is LK-99 really a room temperature superconducting material?)
AutoAgents 便会自动创建材料科学家和语言专家,并自动在互联网整理已知资料,确认 LK-99 的状态。
以上只是 AutoAgents 技术的简单尝试,实际上,其应用的可能性只受限于我们的想象。不论是哪一个场景,AutoAgents 都能够创建出最适合的角色,完成分工,帮助我们高效地完成任务。
朝着太阳前进的年轻团队
上周末(8 月 26 日),LinkSoul.AI 创始人兼 CEO 史业民博士在机器之心举办的 「Llama 2 大模型算法与应用实践」活动 [7] 上分享了 LinkSoul.AI 发布的多模态大模型技术,并接受了机器之心的采访。
史业民本科及博士毕业于北京大学,师从黄铁军教授,从 2013 年便开始进行深度学习及预训练模型的研究,作为智源研究院创新应用实验室负责人参与了悟道 3.0 的研发,是最大可商用中文指令数据集 COIG、COIG-PC 的发起者和组织者之一,曾获 CAMEO 蛋白质结构预测年度第一名,主导了第一个中文 Llama 2 模型 Chinese Llama 2 7B [4] 的开发,开源了中英图文多模态模型 Chinese LLaVA [5] 和第一个支持中英双语语音 - 文本多模态对话模型 LLaSM [6]。
机器之心:可以简单介绍一下你们团队背景吗?
感谢机器之心的采访,我们是一家初创公司,叫做 LinkSoul.AI,含义是希望实现人与 AI、AI 与 AI 的心灵连接,朴素点说就是希望 AI 服务人可以服务到心坎里。我们的目前团队还比较初期,人不多,团队成员主要来自北京大学、智源研究院、华为、字节跳动等头部顶尖的企业、高校、研究院所,是国内少有的完整经历算子开发、集群搭建、大模型预训练、指令微调、多模态大模型训练、产品研发与上线的团队,具备大模型研发、改进、上线能力。
机器之心:LinkSoul.AI 选择快速开源多个模型,如今又开源 AutoAgents 技术,是基于什么考虑?会浪费团队时间吗?
我们并无意将 LinkSoul.AI 打造成一家以开源项目为主的公司。中文 Llama 2 模型是团队业余时间进行的尝试,当时恰逢 Llama 2 发布,所以顺手进行了训练和开源。而团队选择开源图像、语音多模态模型则是希望社区可以多关注多模态模型及其技术应用,团队认为多模态模型将会扮演越来越重要的角色,并在游戏、社交、AR/VR/MR 等领域发挥越来越重要的作用。如今开源 AutoAgents 也是希望团队在 AI 智能体方向的长期积累可以为开源社区做出贡献。LinkSoul.AI 可以快速发布新成果主要是基于团队前期的研究积累,是日常工作的延续,且大量依靠跟高校、研究院所、企业的联合研发,不会分散团队的精力。
机器之心:现在 Llama 等开源模型进展迅速,会如何影响国内大模型尤其是 foundation 模型的发展路线?大家自己训模型是否已成为历史?
我认为开源和闭源都是很重要的分支,尤其是开源模型很难在超大规模模型上进行尝试,而闭源模型很难进行二次开发和训练。另一方面,Llama 系模型目前主要是以英文为主,对于中文的支持仍然不够好,现有对于 Llama 进行的汉化尝试都很难说成功。因此,即使只考虑中文大模型的需求,国内进行大模型训练也仍然很有价值。
机器之心:你们这次开源的 AutoAgents 技术有哪些创新?
现有基于大型语言模型的多智能体系统大部分依赖于预定义的智能体来完成任务,但这些预定义的智能体限制了对不同场景的适应性。AutoAgents 则根据不同任务自适应地创建 AI 智能体小队来适应不同任务场景,并基于生成的 AI 智能体组合为当前任务规划解决方案。通过自动规划多个智能体的相互协作,高效地完成任务。同时,执行环境中存在观察员根据执行结果动态改进执行计划,从而生成更准确的解决方案。AutoAgents 突出了在团队合作中为不同任务分配不同角色的重要性,为处理复杂任务提供了全新视角。
机器之心:AutoAgents 对于 LinkSoul.AI 有何价值?
LinkSoul.AI 致力于提供服务于所有人的 AI,希望通过构建人与 AI、AI 与 AI 的沟通中间件使得调用 AI 的能力不再是某些人的特权。而 AutoAgents 是团队在 AI 与 AI 沟通方向的一次尝试,希望能将调用 AI 智能体的门槛降低到人人可用。现阶段的 AutoAgents 仍依赖于收费的大模型 API 服务,未来团队会尝试通过开发专用的智能体生成模型、智能体调度模型等实现对于 API 的替代。同时,LinkSoul.AI 还会在更多人与 AI、AI 与 AI 方向进行尝试,希望能为人们带来最极致的 AI 体验。
AutoAgents 本地部署
最后,本地部署 AutoAgents 也十分便捷。按照如下步骤即可轻松在本地完成 AutoAgents 部署。
步骤 1:下载项目仓库
git clone https://github.com/LinkSoul-AI/AutoAgents
cd AutoAgents
步骤 2:创建 Docker 镜像
IMAGE="linksoul.ai/autoagents"
VERSION=1.0
docker build -f docker/Dockerfile -t "${IMAGE}:${VERSION}" .
步骤 3:启动 Docker 容器
docker run -it --rm -p 7860:7860 "${IMAGE}:${VERSION}"
在这三个步骤执行成功后,即可在浏览器打开链接 http://127.0.0.1:7860 开启你的 AutoAgents 之旅。
总结
AutoAgents 作为一个刚刚发起的项目,目前还处于非常早期,非常欢迎开源社区和开源爱好者积极参与贡献。AI 智能体技术作为目前大模型最重要的发展方向,未来必将在社交、游戏等领域发挥重大作用。期待更多像 LinkSoul.AI 一样的团队出现,推动人工智能技术服务于所有人,实现 AI 平权。
参考文献:
[1] https://mp.weixin.qq.com/s/_TbBKKRhqMv66GGyyW74XQ
[2] https://github.com/Significant-Gravitas/Auto-GPT
[3] https://github.com/geekan/MetaGPT
[4] https://github.com/LinkSoul-AI/Chinese-Llama-2-7b
[5] https://github.com/LinkSoul-AI/Chinese-LLaVA
[6] https://github.com/LinkSoul-AI/LLaSM
[7] https://mp.weixin.qq.com/s/-b6z5vvBQVyQRVJiKyDRRw
大模型时代,来外滩大会解锁图智能前沿技术!
当前,数据规模和复杂性挑战正在加剧,图计算技术能够有效处理这些复杂的关系数据,被认为是具有重要前景和影响力的科技之一。身处大模型时代的你急需了解这项技术!
9月7日,来外滩大会图智能论坛,读懂「图智能技术」——
聆听领军企业和专家学者前瞻洞见
共享前沿研究和创新成果
探讨技术深度融合发展
抢鲜见证「大型图模型新概念」等多项首发
……
点击阅读原文,免费申领专业观众席位,现场解锁新一代数据底座!
© THE END
转载请联系本公众号获得授权
投稿或寻求报道:[email protected]
微信扫码关注该文公众号作者