Redian新闻
>
被GPT带飞的In-Context Learning发展现状如何?这篇综述梳理明白了

被GPT带飞的In-Context Learning发展现状如何?这篇综述梳理明白了

公众号新闻

机器之心报道

编辑:小舟

来自北京大学、上海 AI Lab 和加州大学圣巴巴拉分校的十位研究者近期发布了一篇关于 in-context learning 的综述论文。


随着语言模型和语料库规模的逐渐扩大,大型语言模型(LLM)展现出更多的潜力。近来一些研究表明,LLM 可以使用 in-context learning(ICL)执行一系列复杂任务,例如解决数学推理问题。


来自北京大学、上海 AI Lab 和加州大学圣巴巴拉分校的十位研究者近期发布了一篇关于 in-context learning 的综述论文,详细梳理了 ICL 研究的当前进展。



论文地址:https://arxiv.org/pdf/2301.00234v1.pdf


in-context learning 的核心思路是类比学习,下图描述了语言模型如何使用 ICL 进行决策。



首先,ICL 需要一些样例来形成演示语境,这些样例通常用自然语言模板编写。然后,ICL 将查询问题和演示语境相联系,形成 prompt,并且将其输入语言模型进行预测。与监督学习需要使用反向梯度更新模型参数的训练阶段不同,ICL 不需要参数更新即可使预训练语言模型直接执行预测任务,并且模型有望学习演示样例中隐藏的模式,并据此做出正确的预测。


作为一种新的范式,ICL 有很多吸引人的优势。首先,演示样例用自然语言格式编写,这为与大语言模型关联提供了一个可解释的接口。通过改变演示样例和模板(Liu et al., 2022; Lu et al., 2022; Wu et al., 2022; Wei et al., 2022c),这种范式使将人类知识纳入语言模型变得更加容易。第二,in-context learning 类似于人类通过类比学习的决策过程。第三,与监督式训练相比,ICL 是一个无需训练的学习框架。这不仅可以大大降低模型适应新任务的计算成本,而且还可以使语言模型即服务(LMaaS,Sun et al., 2022)成为可能,并轻松应用于大规模的现实任务。


尽管 ICL 有着大好的前景,但仍存在许多值得探究的问题,包括它的性能。例如原始的 GPT-3 模型就具备一定的 ICL 能力,但一些研究发现,通过预训练期间的适应,这种能力还可以获得显著的提升。此外,ICL 的性能对特定的设置很敏锐,包括 prompt 模板、语境样例的选择和样例顺序等。此外,ICL 的工作机制虽然看似合理,但仍不够清晰明了,能够初步解释其工作机制的研究也不多。


本篇综述论文总结道,ICL 的强大性能依赖于两个阶段:


  • 培养大型语言模型 ICL 能力的训练阶段;

  • 大型语言模型根据特定任务演示进行预测的推理阶段。


在训练阶段,语言模型直接按照语言建模目标进行训练,例如从左到右的生成。尽管这些模型并没有专门针对 in-context learning 进行优化,但 ICL 的能力依旧令人惊喜。现有的 ICL 研究基本以训练良好的语言模型为主干。


在推理阶段,由于输入和输出的 label 都是用可解释的自然语言模板表征的,因此 ICL 性能可以从多个角度得到优化。该综述论文进行了详细的描述和比较,并选择合适的例子进行演示,针对不同的任务设计具体的评分方法。


这篇综述论文的大致内容和结构如下图所示,包括:ICL 的正式定义 (§3)、warmup 方法 (§4)、prompt 设计策略 (§5) 和评分函数 (§6)。



此外,§7 深入阐述了当前为揭开 ICL 背后工作原理所做的探索。§8 进一步为 ICL 提供了有用的评估与资源,§9 介绍了能显示出 ICL 有效性的潜在应用场景。最后,§10 总结了 ICL 领域存在的挑战和潜在的方向,为该领域的进一步发展提供参考。


感兴趣的读者可以阅读论文原文,了解更多研究细节。



© THE END 

转载请联系本公众号获得授权

投稿或寻求报道:[email protected]

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
16岁少女因拒绝"官二代"追求,被泼汽油毁容:十年后,她的现状如何?In-Context Learning玩法大全"𝙇𝙚𝙖𝙙 𝙏𝙝𝙚 𝘾𝙝𝙖𝙧𝙜𝙚"广告#创译挑战NeurIPS 2022 | 重振PointNet++雄风!PointNeXt:改进模型训练和缩放策略审视PointNet++ChatGPT引领AIGC!Lehigh最新《AI生成内容》全面综述,44页详述GAN到ChatGPT发展历程否定狭义相对论给年轻学子们带来的好处。。。。从BERT到ChatGPT,百页综述梳理预训练大模型演变史把Transformer当通用计算机用,还能执行in-context learning算法,这项研究脑洞大开苹果将颠覆的血糖监测市场,现状如何?i-Refill | 被ChatGPT带飞的AIGC,能为垂直产业做些什么?脑洞大开!把Transformer当通用计算机用,还能执行in-context learning算法个保法施行后App监管现状如何?企业有哪些变化?专家热议ChatGPT带飞英伟达股价/ 爱奇艺首次实现全年盈利/ AI作图被判无版权…今日更多新鲜事在此被ChatGPT带飞的AIGC如何在中国落地?量子位邀你共同参与中国AIGC产业峰会因2013年赴美产子,“央视名嘴”柴静遭全网谩骂,十年已过,现状如何?“央视名嘴”张泉灵为何嫁大18岁李铁,现状如何?5年前被马斯克送上太空 特斯拉跑车现状如何?7年前,那个眼看妈妈被辱,提刀捅人被判无期的小伙,已出狱2年,现状如何?潮流 | Alexander Wang发布秋冬系列;麦当劳推出Cardi B夫妻限定套餐12月1日,细颈瓶有大动作内资八大|BDO International Tax Intern招聘已开启!熟练使用办公软件者优先考虑被GPT带飞的In-Context Learning为什么起作用?模型在秘密执行梯度下降【爱在深秋】--抢跑 《读你》芭蕾背后的故事什么是In-Context Learning(上下文学习)?ECMAScript Async Context 提案介绍ECMAScript 双月报告:Async Context 提案成功进入到 Stage 1被师兄爆赞的综述教程,看完我反手发表了一篇综述……被ChatGPT带飞的AIGC,能为垂直产业做些什么?上海小夫妻低欲望生活,4人挤49平小屋,计划用130万躺平20年,现状如何?启功:有此楼兰神物,王羲之就不再神秘了德国躺平快一年了,现状如何?超算行业:全球及中国市场现状如何?未来空间和竞争格局
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。