Redian新闻
>
阿里达摩院大模型公开课上新!主讲中文个性化对话大模型ChatPLUG和模块化多模态大模型mPLUG-Owl

阿里达摩院大模型公开课上新!主讲中文个性化对话大模型ChatPLUG和模块化多模态大模型mPLUG-Owl

公众号新闻


去年12月,智东西公开课联合达摩院自然语言智能实验室全新策划推出了「阿里达摩院大模型公开课」,并邀请到了阿里巴巴达摩院高级算法工程师李晨亮和NLP 高级算法专家严明,分别就主题《达摩院通义 AliceMind 预训练大模型在 AIGC 文本创作的探索》、《达摩院通义 mPLUG 多模态预训练技术演进及应用实践》进行了深度讲解。想要回看的朋友可以点击文章底部“阅读原文”进行回看!


5月18日,「阿里达摩院大模型公开课」第3讲上线开讲。阿里巴巴达摩院算法专家、ChatPLUG 核心贡献者田俊峰和阿里巴巴达摩院算法工程师、mPLUG 核心贡献者叶晴昊将参与主讲。两位主讲人将对 ChatPLUG 和 mPLUG-Owl 背后的技术细节进行深入剖析。


ChatPLUG 是基于 PLUG 的一个中文对话大模型,使用亿级互联网社交数据、百科数据预训练和百万级高质量对话数据,并采用 FID(Fuse-in-Decoder)架构进行 instruction 微调得到。该模型支持高效的输入多段外部知识、人设信息等文本进行知识增强。


在与最新的开源中文对话大模型 BELLE-7M-2B 和 ChatGLM-6B 进行了多任务泛化性的人工对比评测后发现:


1)ChatPLUG-3.7B 取得了比 BELLE-7B-2M 更好的效果( Rating-A 更多,Rating-C 更少),同时对比 ChatGLM-6B 也取得了 comparable 的效果,表明了 ChatPLUG 具备良好的多任务泛化能力;


2)当将模型的 size 扩大到 13B,ChatPLUG-13B 在所有模型中取得了最优效果。


mPLUG-Owl 是一款类似于 miniGPT-4 和 LLaVA 的多模态对话生成模型,由视觉基础模型 、视觉抽象模块以及预训练语言模型组成,并且具备单模态和多模态多轮对话能力。


本次公开课,田俊峰将以《中文个性化对话大模型ChatPLUG》为主题首先带来直播讲解。他的讲解将主要从个性化大模型研究、搜索增强指令微调对话大模型,以及对话大模型的评估和开源三方面展开。


之后,叶晴昊将围绕《模块化多模态大模型mPLUG-Owl》这一主题进行讲解。他将介绍多模态大模型研究的变化趋势,并对mPLUG模块化多模态模型系列,以及mPLUG-Owl及训练新范式进行深入解读。



第3讲


 主题一 

《中文个性化对话大模型ChatPLUG》

 提 纲 


1、个性化大模型研究概述

2、搜索增强指令微调对话大模型

3、对话大模型的评估和开源

 主讲人 


田俊峰,阿里巴巴达摩院算法专家、ChatPLUG核心贡献者;研究方向为对话大模型和多模态大模型,在国际顶级会议ACL、EMNLP、CVPR、AAAI等发表多篇文章。


 主 题 二 


《模块化多模态大模型mPLUG-Owl》

 提 纲 


1、多模态大模型研究的变化趋势

2、mPLUG模块化多模态模型系列概述

3、mPLUG-Owl及训练新范式解析

 主讲人 


叶晴昊,阿里巴巴达摩院算法工程师、mPLUG核心贡献者;研究方向为多模态模块化大模型,在国际顶级会议ICCV、ICML、ACL等发表多篇文章。


报名方式


对「阿里达摩院大模型公开课」第3讲感兴趣的朋友,可以扫描下方二维码添加小助手小双进行报名。已添加过小双的老朋友,可以给小双私信,发送“ PLUG ”即可报名。


同时为了便于交流,针对「阿里达摩院大模型公开课」第3讲还将设置专属交流群,并邀请主讲人入群。想要加入交流群与主讲人认识的朋友,也可以添加小双进行申请。


点个“在看”和大家一起聊聊

👇👇👇

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
清华系面壁智能开源中文多模态大模型VisCPM :支持对话文图双向生成,吟诗作画能力惊艳阿里达摩院:GPT-4替代年薪60万的数据分析师只要几千块,论文已发阿里达摩院杭州DI-Lab诚招博士后独家 | 原达摩院大牛金榕系因阿里大模型纷争离职,近日加入 Meta多模态如何自监督?爱丁堡等最新「自监督多模态学习」综述:目标函数、数据对齐和模型架构YouKu-mPLUG最大中文视频数据集和Benchmark,助力多模态大型模型发展中科院发布多模态 ChatGPT,图片、语言、视频都可以 Chat ?中文多模态大模型力作大厂掉头!阿里达摩院调整自动驾驶研发,团队归入菜鸟巴黎市长将重修Châtelet 广场以方便行人ZT:2021年6月19日《山河令》制片马韬repoDapr和Rainbond集成,实现云原生BaaS和模块化微服务开发失而复得的宝贵住宿阿里达摩院发布“通义千问”,首席首测,学问如何?大牛动态:阿里达摩院认知智能大牛跳槽字节:加入AI Lab汇报副总裁杨震原ICML 2023 | 基于模块化思想,阿里达摩院提出多模态基础模型mPLUG-2年薪60万的数据分析师工作保不住了?!阿里达摩院研究发现,改用GPT-4成本只需几千元达摩院猫头鹰mPLUG-Owl亮相:模块化多模态大模型,追赶GPT-4多模态能力听过的歌【城事】巴黎市长将重修Châtelet 广场以方便行人更强更通用:智源「悟道3.0」Emu多模态大模型开源,在多模态序列中「补全一切」GPT-4取代数据分析师,成本仅3000!阿里达摩院&NTU论文引热议多模态大语言模型综述来啦!一文带你理清多模态关键技术阿里达摩院:GPT-4替代年薪60万数据分析师只要几千块博后招募 | 阿里达摩院决策智能实验室招募时间序列方向博士后中国士大夫阶层的老姑娘传统音盲赏乐ICLR 2023 | 阿里达摩院开源人脸检测新框架DamoFD当LLM遇到Database:阿里达摩院联合HKU推出Text-to-SQL新基准​钟南山:全国大概85%的人感染过新冠;笑果文化已被立案调查;阿里达摩院回应约70%员工被裁;梁稳根不再任三一集团董事长...DPU与智能网卡技术公开课上新!三位技术大牛主讲开源DPU、内生安全智能网卡与DPU云化裸金属杭州/北京内推 | 阿里达摩院生物医学信息处理团队招聘24届春招实习生原达摩院大模型 M6 带头人杨红霞加入字节,语言生成大模型再迎新玩家8点1氪:iPhone 15将搭载堆叠式摄像头;阿里达摩院自动驾驶业务裁员70%?回应:不实消息;王者荣耀女装定价超千元北京内推 | 阿里达摩院招聘大型语言模型(LLM)应用方向实习生在线可玩:阿里开源多模态大模型mPLUG-Owl,电影问答、梗图理解、多轮聊天……
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。