国际科技财经博客移民网络热点娱乐民生时事公众号

>

爆火！谷歌、微软全All in的Prompt学习

爆火！谷歌、微软全All in的Prompt学习

公众号新闻

2024-01-24 05:01

作为最先进的AI学习方法，提示学习和指示学习（instruction learning）代表了目前NLP方向的新趋势，能够让AI系统对齐人类的意图，大大提高大语言模型的学习能力。

由于所涉及的检索和推断方法多种多样，提示学习的实施十分复杂，特别是训练一个属于自己NLP任务的Pre-training LM。

这次我综合整理了20G的语言训练资料，包含点评、社区互动、维基百科等，这些数据已经处理好了，可以直接二进制读取然后进行训练。

扫码回复“提示学习”

获取训练合集

这次我邀请了在阿里和微软亚洲研究院等公司进行NLP相关的项目的John老师在1月25日晚20：00来分享提示学习的学习策略，此次课程的主题是—《Introduction to the Prompt Learning 》

课程大纲：

1. Prompt基本概念描述
2. Prompt基本方法介绍
3. Prompt相关工具
4. 总结与学习路径

0.01元解锁

《Introduction to the Prompt Learning 》

另外John老师还做了《提示学习前沿论文解读课》，课程将从instruction tuning、Self-Instruct以及Black-box Prompt Learning三项技术入手，通过理论（3篇论文解读）+实战（LORA微调大模型）的方式，5节课全方位带大家深度掌握大型语言模型提示学习系列知识。

0.01元解锁

《提示学习前沿论文解读课》

课程大纲

第一节课：Prompt Learning 概述

介绍prompt的基本概念
介绍衍生的instruction learning以及两者区别

第二节课：论文解读1

paper1：Finetuned Language Models are Zero-Shot Learners

❝

论文会议：ICLR 2022

本文提出了一个新的概念 instruction tuning，就是将很多数据集都表示成指令的形式，来进行fine-tune，从而大大提高了unseen 任务上的零样本性能。

通过学习这篇论文，我们可以了解在一组task上微调模型是否会提高模型在unseen task上的性能，以及通用模型的未来研究方向。

第三节课：论文解读2

paper2：Self-Instruct: Aligning Language Model with Self Generated Instructions

❝

论文会议：ACL 2023

大型“指令调优”的语言模型已经证明了其在新任务上卓越的zero-shot能力。但是人工编写指令数据集仍然存在一些挑战。

本文首次提出自动构造instruction数据的方法，通过LLM生成指令来指导自身微调。提出的框架Self-Instruct可以使用最少的人工标注，生成大量的用于 instruct- tuning 的数据。

第四节课：代码实践LoRA微调

LORA微调实战
基于论文解读2自动构造的数据上进行大模型的微调

第五节课：论文解读3

paper3：Black-Box Prompt Optimization: Aligning Large Language Models without Model Training

❝

现有的对齐方法主要侧重于对LLM进行进一步的训练，然而这些对齐方法在效率、可访问性、可解释性方面仍存在缺陷。

清华团队提出了一种黑盒提示优化（BPO）来执行对齐，通过优化用户Prompt以适应LLM对输入的理解来对齐大语言模型和人类的意图。

0.01元解锁

《提示学习前沿论文解读课》

老师介绍

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。

来源: qq

点击查看作者最近其他文章

相关阅读

自动生成prompt：Automatic prompt engineering Diving Controversy Prompts Sports Fandom Criticism 文末送书 | Prompt超实用宝典：精准提问，显著提升ChatGPT输出质量硅谷最爱美国大学排名流出！谷歌、微软...偏爱这些毕业生！被Sora抢了风头的谷歌“杀”回来了！谷歌的一群“书呆子”卷出了最强开放模型Gemma 硬核观察 #1257 Mozilla 指责谷歌、微软、苹果妨碍公平竞争谷歌跌超4%！谷歌AI人物成像新功能“离大谱”，美国国父大变黑人，拟下线几周美中关系谈不上对等之二----世界的一大麻烦是中国以为能够超越美国 GPT-4准确率最高飙升64%！斯坦福OpenAI重磅研究：全新Meta-Prompting方法让LLM当老板刚刚，谷歌华人工程师被捕，他用谷歌电脑偷谷歌机密存到谷歌账号...谷歌发布Prompt Expansion框架，让文生图更轻松！Mesos 时代彻底消亡：10 年创业挣扎、微软谷歌收购未果，这家公司还是倒闭了 Meta官方的Prompt工程指南：Llama 2这样用更高效曾经火出圈的提示工程要死了吗？危！大模型能自己优化Prompt了 2023 ACM Fellow颁给图灵三巨头！清华马维英、微软高剑峰、上交大陈海波等14位华人当选 2023 中国行：广告真没白做 OpenAI、斯坦福大学提出Meta-Prompting，有效提升语言模型的性能画个圈就能搜索！谷歌Gemini Pro植入旗舰，开启手机AI大战大模型RAG问答技术架构及核心模块回顾：从Embedding、prompt-embedding到Reranker LLM准确率飙升27%！DeepMind提出全新「后退一步」Prompt技术财富自由之塔山阻击战首个！上交&ETH提出PromptSR：基于文本提示扩散的图像超分辨率浙大发布Agent学习框架，13B 模型达到 ChatGPT 水平！斯坦福和OpenAI提出meta-prompting，最强零样本prompting技术诞生了 VCE真题：概率与统计大题，是最近几年出现频率最高的对于sample proportion的出题方法 LLM排行榜更新！谷歌Bard超过GPT-4，中国玩家未进前十童年的记忆今日最佳NLP论文推荐：颠覆性Prompt-tuning新法《魅羽活佛》第359章天煞孤星被 Sora 抢了风头的谷歌“杀”回来了！谷歌的一群“书呆子”卷出了最强开放模型 Gemma 重磅更新！谷歌Chrome加持AI，重量级功能×3，Windows、Mac均可用打造出色的Prometheus监控系统,你会吗开年第一裁！谷歌、亚马逊先后解雇数百名员工！直播平台也减员35%MIT学姐坦白局：有时候不愿承认自己是MIT学生，原因竟是……斯坦福华人团队炒菜机器人爆火：成本仅3万美元，滑蛋虾仁、干贝烧鸡轻松做！谷歌家务机器人拿放物品越来越溜，解放双手的时代真的来了？

热点事件追踪