阿里达摩院大模型公开课上新！主讲中文个性化对话大模型ChatPLUG和模块化多模态大模型mPLUG-Owl

2023-05-17 12:05

去年12月，智东西公开课联合达摩院自然语言智能实验室全新策划推出了「阿里达摩院大模型公开课」，并邀请到了阿里巴巴达摩院高级算法工程师李晨亮和NLP 高级算法专家严明，分别就主题《达摩院通义 AliceMind 预训练大模型在 AIGC 文本创作的探索》、《达摩院通义 mPLUG 多模态预训练技术演进及应用实践》进行了深度讲解。想要回看的朋友可以点击文章底部“阅读原文”进行回看！

5月18日，「阿里达摩院大模型公开课」第3讲上线开讲。阿里巴巴达摩院算法专家、ChatPLUG 核心贡献者田俊峰和阿里巴巴达摩院算法工程师、mPLUG 核心贡献者叶晴昊将参与主讲。两位主讲人将对 ChatPLUG 和 mPLUG-Owl 背后的技术细节进行深入剖析。

ChatPLUG 是基于 PLUG 的一个中文对话大模型，使用亿级互联网社交数据、百科数据预训练和百万级高质量对话数据，并采用 FID（Fuse-in-Decoder）架构进行 instruction 微调得到。该模型支持高效的输入多段外部知识、人设信息等文本进行知识增强。

在与最新的开源中文对话大模型 BELLE-7M-2B 和 ChatGLM-6B 进行了多任务泛化性的人工对比评测后发现：

1）ChatPLUG-3.7B 取得了比 BELLE-7B-2M 更好的效果（ Rating-A 更多，Rating-C 更少），同时对比 ChatGLM-6B 也取得了 comparable 的效果，表明了 ChatPLUG 具备良好的多任务泛化能力；

2）当将模型的 size 扩大到 13B，ChatPLUG-13B 在所有模型中取得了最优效果。

mPLUG-Owl 是一款类似于 miniGPT-4 和 LLaVA 的多模态对话生成模型，由视觉基础模型、视觉抽象模块以及预训练语言模型组成，并且具备单模态和多模态多轮对话能力。

本次公开课，田俊峰将以《中文个性化对话大模型ChatPLUG》为主题首先带来直播讲解。他的讲解将主要从个性化大模型研究、搜索增强指令微调对话大模型，以及对话大模型的评估和开源三方面展开。

之后，叶晴昊将围绕《模块化多模态大模型mPLUG-Owl》这一主题进行讲解。他将介绍多模态大模型研究的变化趋势，并对mPLUG模块化多模态模型系列，以及mPLUG-Owl及训练新范式进行深入解读。

第3讲

主题一

《中文个性化对话大模型ChatPLUG》

提纲

1、个性化大模型研究概述

2、搜索增强指令微调对话大模型

3、对话大模型的评估和开源

主讲人

田俊峰，阿里巴巴达摩院算法专家、ChatPLUG核心贡献者；研究方向为对话大模型和多模态大模型，在国际顶级会议ACL、EMNLP、CVPR、AAAI等发表多篇文章。

主题二

《模块化多模态大模型mPLUG-Owl》

提纲

1、多模态大模型研究的变化趋势

2、mPLUG模块化多模态模型系列概述

3、mPLUG-Owl及训练新范式解析

主讲人

叶晴昊，阿里巴巴达摩院算法工程师、mPLUG核心贡献者；研究方向为多模态模块化大模型，在国际顶级会议ICCV、ICML、ACL等发表多篇文章。

报名方式

对「阿里达摩院大模型公开课」第3讲感兴趣的朋友，可以扫描下方二维码添加小助手小双进行报名。已添加过小双的老朋友，可以给小双私信，发送“ PLUG ”即可报名。

同时为了便于交流，针对「阿里达摩院大模型公开课」第3讲还将设置专属交流群，并邀请主讲人入群。想要加入交流群与主讲人认识的朋友，也可以添加小双进行申请。

点个“在看”和大家一起聊聊

👇👇👇

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。

来源: qq

点击查看作者最近其他文章