Redian新闻
>
爆火!谷歌、微软全All in的Prompt学习

爆火!谷歌、微软全All in的Prompt学习

公众号新闻

作为最先进的AI学习方法,提示学习和指示学习(instruction learning)代表了目前NLP方向的新趋势,能够让AI系统对齐人类的意图,大大提高大语言模型的学习能力。


由于所涉及的检索和推断方法多种多样,提示学习的实施十分复杂,特别是训练一个属于自己NLP任务的Pre-training LM。


这次我综合整理了20G的语言训练资料,包含点评、社区互动、维基百科等,这些数据已经处理好了,可以直接二进制读取然后进行训练。


扫码回复“提示学习

获取训练合集


这次我邀请了在阿里和微软亚洲研究院等公司进行NLP相关的项目的John老师在1月25日晚20:00来分享提示学习的学习策略,此次课程的主题是—《Introduction to the Prompt Learning 》


课程大纲:

1. Prompt基本概念描述
2. Prompt基本方法介绍
3. Prompt相关工具
4. 总结与学习路径

0.01元解锁

《Introduction to the Prompt Learning 》

  


另外John老师还做了《提示学习前沿论文解读课》,课程将从instruction tuning、Self-Instruct以及Black-box Prompt Learning三项技术入手,通过理论(3篇论文解读)+实战(LORA微调大模型)的方式,5节课全方位带大家深度掌握大型语言模型提示学习系列知识。


0.01元解锁

《提示学习前沿论文解读课》

  


课程大纲


第一节课:Prompt Learning 概述

  • 介绍prompt的基本概念

  • 介绍衍生的instruction learning以及两者区别


第二节课:论文解读1

paper1:Finetuned Language Models are Zero-Shot Learners

论文会议:ICLR 2022

本文提出了一个新的概念 instruction tuning,就是将很多数据集都表示成指令的形式,来进行fine-tune,从而大大提高了unseen 任务上的零样本性能。

通过学习这篇论文,我们可以了解在一组task上微调模型是否会提高模型在unseen task上的性能,以及通用模型的未来研究方向。


第三节课:论文解读2

paper2:Self-Instruct: Aligning Language Model with Self Generated Instructions

论文会议:ACL 2023

大型“指令调优”的语言模型已经证明了其在新任务上卓越的zero-shot能力。但是人工编写指令数据集仍然存在一些挑战。

本文首次提出自动构造instruction数据的方法,通过LLM生成指令来指导自身微调。提出的框架Self-Instruct可以使用最少的人工标注,生成大量的用于 instruct-  tuning 的数据。


第四节课:代码实践LoRA微调

  • LORA微调实战

  • 基于论文解读2自动构造的数据上进行大模型的微调


第五节课:论文解读3


paper3:Black-Box Prompt Optimization: Aligning Large Language Models without Model Training

现有的对齐方法主要侧重于对LLM进行进一步的训练,然而这些对齐方法在效率、可访问性、可解释性方面仍存在缺陷。

清华团队提出了一种黑盒提示优化(BPO)来执行对齐,通过优化用户Prompt以适应LLM对输入的理解来对齐大语言模型和人类的意图。


0.01元解锁

《提示学习前沿论文解读课》

  


老师介绍


微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
自动生成prompt:Automatic prompt engineeringDiving Controversy Prompts Sports Fandom Criticism文末送书 | Prompt超实用宝典:精准提问,显著提升ChatGPT输出质量硅谷最爱美国大学排名流出!谷歌、微软...偏爱这些毕业生!被Sora抢了风头的谷歌“杀”回来了!谷歌的一群“书呆子”卷出了最强开放模型Gemma硬核观察 #1257 Mozilla 指责谷歌、微软、苹果妨碍公平竞争谷歌跌超4%!谷歌AI人物成像新功能“离大谱”,美国国父大变黑人,拟下线几周美中关系谈不上对等之二----世界的一大麻烦是中国以为能够超越美国GPT-4准确率最高飙升64%!斯坦福OpenAI重磅研究:全新Meta-Prompting方法让LLM当老板刚刚,谷歌华人工程师被捕,他用谷歌电脑偷谷歌机密存到谷歌账号...谷歌发布Prompt Expansion框架,让文生图更轻松!Mesos 时代彻底消亡:10 年创业挣扎、微软谷歌收购未果,这家公司还是倒闭了Meta官方的Prompt工程指南:Llama 2这样用更高效曾经火出圈的提示工程要死了吗?危!大模型能自己优化Prompt了2023 ACM Fellow颁给图灵三巨头!清华马维英、微软高剑峰、上交大陈海波等14位华人当选2023 中国行:广告真没白做OpenAI、斯坦福大学提出Meta-Prompting,有效提升语言模型的性能画个圈就能搜索!谷歌Gemini Pro植入旗舰,开启手机AI大战大模型RAG问答技术架构及核心模块回顾:从Embedding、prompt-embedding到RerankerLLM准确率飙升27%!DeepMind提出全新「后退一步」Prompt技术财富自由之塔山阻击战首个!上交&ETH提出PromptSR:基于文本提示扩散的图像超分辨率浙大发布Agent学习框架,13B 模型达到 ChatGPT 水平!斯坦福和OpenAI提出meta-prompting,最强零样本prompting技术诞生了VCE真题:概率与统计大题,是最近几年出现频率最高的对于sample proportion的出题方法LLM排行榜更新!谷歌Bard超过GPT-4,中国玩家未进前十童年的记忆今日最佳NLP论文推荐:颠覆性Prompt-tuning新法《魅羽活佛》第359章 天煞孤星被 Sora 抢了风头的谷歌“杀”回来了!谷歌的一群“书呆子”卷出了最强开放模型 Gemma重磅更新!谷歌Chrome加持AI,重量级功能×3,Windows、Mac均可用打造出色的Prometheus监控系统,你会吗开年第一裁!谷歌、亚马逊先后解雇数百名员工!直播平台也减员35%MIT学姐坦白局:有时候不愿承认自己是MIT学生,原因竟是……斯坦福华人团队炒菜机器人爆火:成本仅3万美元,滑蛋虾仁、干贝烧鸡轻松做!谷歌家务机器人拿放物品越来越溜,解放双手的时代真的来了?
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。