Redian新闻
>
吴恩达:AI智能体工作流今年将有巨大进展,可能超过下一代基础模型

吴恩达:AI智能体工作流今年将有巨大进展,可能超过下一代基础模型

公众号新闻
机器之心报道

编辑:小舟

下一步是智能体?

随着 ChatGPT、GPT-4、Sora 的陆续问世,人工智能的发展趋势引起了广泛关注,特别是 Sora 让生成式 AI 模型在多模态方面取得显著进展。人们不禁会问:人工智能领域下一个突破方向将会是什么?


今天,人工智能著名学者、斯坦福大学教授吴恩达指出:AI 智能体工作流将在今年推动人工智能取得巨大进步,甚至可能超过下一代基础模型。他呼吁所有从事人工智能工作的人都关注 AI 智能体工作流,并撰写一篇博客简单阐述了原因。



我们对博客内容进行了不改变原意的编译、整理,以下是博客内容:


当前,我们主要在零样本模式下使用 LLM,提供 prompt,逐个 token 地生成最终输出,没有进行调整。


这类似于要求某人从头到尾写一篇文章,直接打字,不允许退格,并期望得到高质量的结果。尽管有困难,LLM 在这项任务上仍然表现得非常好!


然而,通过智能体工作流,我们可以要求 LLM 多次迭代文档。例如,它可能需要执行一系列步骤:


  • 规划大纲;

  • 决定需要进行哪些网络搜索(如果需要),来收集更多信息;

  • 写初稿;

  • 通读初稿,找出不合理的论点或无关信息;

  • 修改草稿;

  • ......


这个迭代过程对于大多数人类作家写出好的文本至关重要。对于人工智能来说,这种迭代工作流会比单次编写产生更好的结果。


Cognition AI 团队发布的首个 AI 软件工程师 Devin 最近在社交媒体上引起了广泛关注。吴恩达的团队一直密切关注 AI 编写代码的发展,并分析了多个研究团队的结果,重点关注算法在广泛使用的 HumanEval 编码基准上的表现。


如下图所示,吴恩达的团队发现:GPT-3.5(零样本)的正确率为 48.1%,GPT-4(零样本)的表现更好,为 67.0%。然而,相比于迭代智能体工作流,从 GPT-3.5 到 GPT-4 的改进不大。事实上,在智能体循环(agent loop)中,GPT-3.5 的正确率高达 95.1%。



开源智能体工具和有关智能体的学术文献正在激增。这是一个令人兴奋的时刻,也是一个令人困惑的时刻。为了帮助人们正确看待这项工作,吴恩达分享了一个对构建智能体的设计模式进行分类的框架。


简单来说,这个框架包括:


  • 反思:LLM 检查自己的工作,以提出改进方法。

  • 工具使用:LLM 拥有网络搜索、代码执行或任何其他功能来帮助其收集信息、采取行动或处理数据。

  • 规划:LLM 提出并执行一个多步骤计划来实现目标(例如,撰写论文大纲,然后进行在线研究,然后撰写草稿......)。

  • 多智能体协作:多个 AI 智能体一起工作,分配任务并讨论和辩论想法,以提出比单个智能体更好的解决方案。


吴恩达表示 AI Fund 已在许多应用程序中成功使用这些模式,后续他将详细阐述这些设计模式。


参考链接:

https://twitter.com/AndrewYNg/status/1770897666702233815

https://www.deeplearning.ai/the-batch/issue-241/




© THE END 

转载请联系本公众号获得授权

投稿或寻求报道:[email protected]

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
下一次“暴富”的船票,就在这些 GPTs 智能体里!他们几乎同时访华!“今年将有更多”SK海力士与台积电签署谅解备忘录,合作开发HBM4和下一代封装技术;均普智能预计下半年发布二代人形机器人“贾维斯”丨智能制造日报婚介所;头难剃,男多女少;去父留子;去母留子复工!查尔斯抗癌症取得重大进展,将重回公众视野2B参数性能超Mistral-7B:面壁智能多模态端侧模型开源黑色素瘤患者的福音来了!澳洲处方药津贴计划成效卓著,今年将有更多药物被纳入补贴吴恩达:别光盯着GPT-5,用GPT-4做个智能体可能提前达到GPT-5的效果H-1B改革重大进展:“一人一抽”有望2月生效,今年3月抽签实施!1人83抽将不再可能,“平等抽签时代”有望到来!IRS通知太长看不懂?今年将有这项新改变​从产品主义迈向智能主义,安全智能体做对了什么?倦侣2:商学院/美术学院/宋庄开源AGI智能体人人可养成:AGI对齐新思路,让智能体在人类世界中接受训练斯坦福15张图揭示最新AI 动态:开源风评又“被害”,谷歌、OpenAI争当基础模型“劳模”大模型在开放智能体场景中能意识到风险威胁吗?上海交大发布R-Judge安全评测CVPR 2024 | 字节提出视觉基础模型:ViTamin,实现多项SOTA!吴恩达:AI 智能体的未来|Z Talk百度文心一言用户破 2 亿,李彦宏:文心大模型已成中国最领先的 AI 基础模型AI播客工具2年超百万用户,吴恩达投了3轮AI时代新风口!吴恩达亲授智能体四大设计模式华人注意!波士顿今年将有六项开放街道活动《又到佳节》&《心若莲花》基础模型、长文本、数据库、应用落地……一篇文章读懂今天大模型行业的关键问题丨2024 GDC面壁智能低调开源大模型“理科状元”!LeetCode 周赛超越80%人类选手,推理性能超 Llama3-70B首个全开源时序预测基础模型:Zero-shot预测能力比肩从零训练最优模型无证客竟然通过下水道越境!20岁男子因协助移民偷渡获罪!【首发】引正基因完成新一轮融资,专注下一代基因编辑工具OpenAI掌门人最新演讲内容要点:下一代AI模型更强大,不需担心超级智能字节发布视觉基础模型ViTamin,多项任务实现SOTA,入选CVPR2024随笔7028 血壮山河之枣宜会战 “扑朔迷离”南瓜店 5吴恩达:多智能体协作是新关键,软件开发等任务将更高效英伟达:下一代GPU细节曝光具身智能超级对话:人工智能如何引领机器人革命亚马逊向人工智能初创公司Anthropic追加27.5亿美元投资;钉钉AI升级多模态,新增图片理解、工作流等丨AIGC日报
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。