Redian新闻
>
只需四步就能构建自己的Agent!达摩院新开源框架小白也能用

只需四步就能构建自己的Agent!达摩院新开源框架小白也能用

公众号新闻
李晨亮 投稿
量子位 | 公众号 QbitAI

现在,小白也可以打造专属的智能体了!

达摩院最新出品Agent框架ModelScope-Agent,直接可用可定制。

比如,可以同时执行多个工具的规划、调度。

写一篇关于Vision Pro VR眼镜的20字宣传文案,并用女声读出来,同时生成个视频看看。

也能在多轮对话中持续不同的工具。

光集成的工具就有这么多,比如NLP、语音、视觉、多模态等多种模型,以及默认集成知识检索、API检索等方案。

在GitHub上还专门提供了详细教程,这就来看看究竟如何构建?

四步构建自己的Agent

1、首先拉取ModelScope-Agent代码并安装相关依赖。


2、配置config文件,ModelScope token和构建API工具检索引擎。

3、中枢大模型启动。

4、Agent构建和使用,依赖之前构建好的大模型,工具list,工具检索和记忆模块。

构建完毕后,还可以注册新工具。GitHub上同样有食用教程。

开发者们可以参考上述教程很容易搭建属于自己的智能体,ModelScope-Agent 依托魔搭社区,未来会适配更多新增的开源大模型,推出更多应用。

如客户服务Agent、个人助理Agent、Story Agent、Motion Agent、multi-Agent(多模态 Agent)等等。

框架如何设计的?

作为一个通用的、可定制的Agent框架,ModelScope-Agent主要有以下特点:

  • 可定制且功能全面的框架:提供可定制的引擎设计,涵盖了数据收集、工具检索、工具注册、存储管理、定制模型训练和实际应用等功能,可用于快速实现实际场景中的应用。

  • 开源LLMs作为核心组件:支持在 ModelScope 社区的多个开源LLMs上进行模型训练,并开源了配套的中英文工具指令数据集 MSAgent-Bench,用于增强开源大模型作为Agent中枢的规划调度能力。

  • 多样化且全面的API,支持API检索:以统一的方式实现与模型API和常见的功能API进行无缝集成,默认提供开源API检索方案。

它主要包括这些模块,以开源大语言模型 (LLMs) 为核心,以及记忆控制、工具使用等模块。

开源 LLM 主要负责任务规划、调度以及回复生成;记忆控制模块,主要包含知识检索以及 prompt (提示词)管理;工具使用模块,包含工具库以及工具检索和工具可定制化。


在执行任务时,它会将其拆分成更小的任务,然后一项一项完成。

以写一个简短故事,并用女声朗读,同时配个视频”为例。

ModelScope-Agent 会展示整个任务规划过程,先通过工具检索检索相关的语音合成工具,然后由开源 LLM 进行规划调度——

首先生成一段故事,然后调用对应语音生成模型,生成语音并用女声念出,展示给用户,最后再调用视频生成模型,针对生成的故事内容生成一段视频.

这里全程不需要用户配置当前请求可能需要调用到的工具.

除此之外,他们还提出了新的工具指令微调训练方法:Weighted LM,通过对工具指令调用部分token进行loss加权,提升开源大模型工具指令调用能力。

基于该训练方法和配套的开源中英文工具指令调用数据集MSAgent-Bench,基于Qwen-7B优化训练了MSAgent-Qwen-7B模型,相关数据集和模型都已开源。

论文链接:
https://arxiv.org/abs/2309.00986

代码链接:
https://github.com/modelscope/modelscope-agent

ModelScope体验地址:
https://modelscope.cn/studios/damo/ModelScopeGPT/summary

「AIGC+垂直领域社群」

招募中!

欢迎关注AIGC的伙伴们加入AIGC+垂直领域社群,一起学习、探索、创新AIGC!

请备注您想加入的垂直领域「教育」或「广告营销」,加入AIGC人才社群请备注「人才」&「姓名-公司-职位」。


点这里👇关注我,记得标星哦~

一键三连「分享」、「点赞」和「在看」

科技前沿进展日日相见 ~ 

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
「新智元大模型」上岗!0代码搞定,只需四步精调,写文超6大疆 Mini 4 Pro 体验:这个升级,让小白也能拍出大师镜头如何基于Llama 2搭建自己的大模型?8月26日,4位技术大牛手把手教你用 C++构建自己的 GPT 文档工具漫画说中国系列,爆笑又涨知识!小白也能一看就懂!面食神器集合!智能省力、好吃筋道,小白也能当大厨~连续两年最佳论文!达摩院NLP引领检索增强和实体识别技术,U-RaNER荣膺9项评测冠军有了ModelScope-Agent,小白也能打造专属智能体,附保姆级教程遭遇骗局金丝肉松饼干,口感酥香颜值高,烘焙小白也能做!斗鱼证实CEO陈少杰失联近三周;美团否认停止向45岁以上骑手派单;OpenAI发布允许用户构建自定义版本的ChatGPT丨邦早报北京/杭州内推 | 阿里达摩院视觉技术实验室招聘计算机视觉算法工程师/实习生直降$37 | 红点控温、双倍不粘,小白也能完美驾驭的不粘锅用 Rust 编写,已有 10 万行代码:顶级黑客组织出手,将推出新的反数据收集开源框架 VeilidAdobe推新Firefly Image 2,让小白也能用图生文软件开源框架 NanUI 作者转行卖钢材!项目暂停开发。面试官:如何使用Dockerfile去构建自定义的Docker镜像?问倒一堆古诗词随想(二)超精美月饼DIY模具!小白也能在家做出完美月饼糕点,超简单食谱来了!小白也能看懂的小红书品牌投放全流程精忠保国顶级黑客组织出手,将推出新的反数据收集开源框架Veilid:用Rust编写,已有10万行代码Because I'm Stupid - Kim Huyn Joong拒吃涂层,不惧铁铲!有了它小白也能爆炒硬菜了大模型剑指AI Agents,达摩院推出Dialogue Agents新基SpokenWOZ胜利大会师 – 除了玩就是吃呗之非米其林们 (上)面试官:如何使用 Dockerfile 去构建自定义的 Docker 镜像?问倒一大片。。。开源框架NanUI作者转行卖钢材,项目暂停开发厨渣救星!用好这10款神仙厨房好物,小白也能变大神~最全精编分子生物学实验方法集锦出炉,0基础小白也能秒变实验高手!博道基金杨梦:每个人都在构建自己的多因子模型GitHub 1.1万星,模拟软件开发流程,开源框架MetaGPT爆火日本发明的「咖啡机」太太太好用了!一键萃取,轻松打泡,小白也能轻松驾驭!疫情期间被裁,开源框架程序员转行卖钢材…直降$26 | 红点控温、双倍不粘,小白也能完美驾驭的不粘锅
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。