Redian新闻
>
吴恩达:四个步骤,让大模型变得更好

吴恩达:四个步骤,让大模型变得更好

公众号新闻

机器之心报道

编辑:小舟


本周,生成式 AI 的竞争达到了新的高潮。


前有 OpenAI 抢先发布 GPT-4o,后有谷歌在 I/O 开发者大会上发布一系列生成式人工智能模型与产品。


自 2022 年 11 月 OpenAI 推出 ChatGPT,至今已有 18 个月。学界、业界为了提升生成式 AI 模型的能力,做出了诸多努力。


今天,著名人工智能学者、斯坦福大学教授吴恩达高度总结了提升生成式 AI 模型能力的方式,主要包括:1)提升模型的推理能力;2)扩展上下文窗口,并撰写一篇博客阐述了一套通用且高效的 prompt 策略。



我们对博客内容进行了不改变原意的编译、整理,以下是博客内容:


本周,谷歌宣布将 Gemini Pro 1.5 的输入上下文窗口扩大一倍,从 100 万 token 扩展到 200 万 token;OpenAI 发布了 GPT-4o,它的生成速度是 GPT-4 Turbo 的 2 倍,而且便宜 50%,原生支持输入、生成多模态 token。这是 18 个月以来的最新进展。


自 2022 年 11 月 ChatGPT 推出以来,随着 GPT-4、Gemini 1.5 Pro、Claude 3 Opus 和 Llama 3-70B 的发布等重要里程碑的到来,许多模型提供商通过两个重要方式提高了自己的能力:


  • 提升模型的推理能力,使 LLM 能够思考复杂的概念并遵循复杂的指令; 

  • 更长的输入上下文窗口。


GPT-4 和其他高级模型的推理能力使它们非常擅长解释带有详细说明的复杂 prompt。许多人习惯向 LLM 快速提出 1 - 2 句话的查询。相比之下,在构建应用程序时,我看到经验丰富的团队经常编写可能长达 1 - 2 页的 prompt(我的团队称其为「mega-prompt」),这些 prompt 提供复杂的指令来详细说明我们希望 LLM 如何执行一个任务。我仍然认为团队在编写详细指令方面做得不够好。有关中等长度 prompt 的示例,请查看 Claude 3 的系统 prompt,详细且为 Claude 应该如何执行任务提供了明确的指导。



这是一种与我们通常在 LLM 网络用户界面中使用的非常不同的 prompt 方式。在这种方式中,我们可能会快速进行查询,如果响应不满意,则通过与聊天机器人反复对话来表述清楚我们想要什么。


此外,输入上下文窗口长度的增加为开发人员的工具箱添加了另一种技术。GPT-3 激发了关于小样本上下文学习的大量研究。例如,如果您使用 LLM 进行文本分类,您可能会提供一些(例如 1 - 5 个)文本片段及其类别标签的样本,以便它可以泛化到其他文本。


GPT-4o 接受 128000 个输入 token,Claude 3 Opus 200000 个 token,Gemini 1.5 Pro 100 万个 token(200 万个 token 目前仅适用于预览版)。然而,随着输入上下文窗口变得越来越长,人们发现 LLM 并不局限于少数样本。通过多样本(many-shot)学习,开发人员可以在 prompt 中给出数十个甚至数百个样本,这比少样本(few-shot)学习效果更好。


在构建复杂的工作流时,我看到开发人员通过如下过程获得了良好的结果:


  1. 编写快速、简单的 prompt,看看效果如何。

  2. 根据输出不足的地方,迭代地充实 prompt。这通常会导致更长、更详细的 prompt,甚至可能是「mega-prompt」。

  3. 如果这仍然不够,请考虑少样本或多样本学习(如果适用),或者不太频繁地进行微调。

  4. 如果仍然不能产生您需要的结果,请将任务分解为子任务并应用智能体工作流


我希望这个过程能够帮助大家更轻松地构建应用程序。如果您有兴趣更深入地研究 prompt 策略,我推荐 Medprompt 论文,其中列出了一组复杂的 prompt 策略,可以带来非常好的结果。


Medprompt 论文,链接:https://arxiv.org/pdf/2311.16452


参考链接:

https://twitter.com/AndrewYNg/status/1791134037178020308

https://www.deeplearning.ai/the-batch/issue-249/


机器之心将于2024年6月1日举办「CVPR 2024 线上论文分享会」,将设置 Keynote、 论文分享、企业招聘等环节,就业内关注的 CV 热门主题邀请顶级专家、论文作者与观众做学术交流。

© THE END 

转载请联系本公众号获得授权

投稿或寻求报道:[email protected]

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
吴恩达:AI智能体工作流今年将有巨大进展,可能超过下一代基础模型特别策划 | 大模型落地应用,让技术变得更有价值弱智吧:大模型变聪明,有我一份贡献ICLR 2024 Spotlight | 无惧中间步骤,MUSTARD可生成高质量数学推理数据狗引儿【长篇】(六十三)吴恩达团队新作:多模态多样本上下文学习,无需微调快速适应新任务用神经架构搜索给LLM瘦身,模型变小,准确度有时反而更高大模型的“瘦身”革命:巨头逐鹿轻量化大模型 | 大模型一周大事今日arXiv最热大模型论文:大模型都能怎么用?中南大学最新综述:大模型时代的自然语言处理吴恩达:别光盯着GPT-5,用GPT-4做个智能体可能提前达到GPT-5的效果246篇文献!参数高效微调最新综述发布,让大模型不再「巨无霸」不会用AI写论文?这6个关键步骤,让你20分钟完成一篇SCI!(免费送提示词模版)吴恩达:多智能体协作是新关键,软件开发等任务将更高效必看!孟德尔随机化的完成步骤,5分钟全面了解川普没钱了/马克隆发飙给大模型装上眼睛,李学龙团队提出Any2Point,让大模型具备3D视觉理解能力别让谷歌地图泄漏了你家信息!5个步骤教你将自家房子模糊掉!AI播客工具2年超百万用户,吴恩达投了3轮从邯郸三恶少说起关注 | IFRS17下的保险业务参考模型变革今日arXiv最热NLP大模型论文:微软:用大模型分析用户满意度,让智能系统更善解人意2024春假伦敦邮轮行之一让大模型不再「巨无霸」,这是一份最新的大模型参数高效微调综述2024如何变得更好——混沌年度创业福利课,重新理解创业!AI时代新风口!吴恩达亲授智能体四大设计模式改变传统,吴恩达开源了一个机器翻译智能体项目帝国终有落幕时!美国彻底衰落,世界真的会变得更好吗?霸权的丧钟正在敲响......三个步骤,打开刘恋的「潮」极「电」生活用这条丝巾来点缀穿搭,瞬间就能让整套平淡的造型变得时髦高级!在堪培拉,留学生竟然也可以办理本地身份证明?!出门再也不用带护照了!超简单领取步骤,8刀轻松解决~独立开发8年的软件,开源并让大家“白嫖”,我赚得更多了吴恩达团队新作ManyICL:多样本上下文学习显著提高多模态基础模型性能!别让谷歌地图泄漏了你家信息!5个步骤教你将自家房子模糊掉吴恩达:AI 智能体的未来|Z Talk制裁下的俄罗斯
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。