Redian新闻
>
阿里达摩院大模型公开课上新!主讲中文个性化对话大模型ChatPLUG和模块化多模态大模型mPLUG-Owl

阿里达摩院大模型公开课上新!主讲中文个性化对话大模型ChatPLUG和模块化多模态大模型mPLUG-Owl

公众号新闻


去年12月,智东西公开课联合达摩院自然语言智能实验室全新策划推出了「阿里达摩院大模型公开课」,并邀请到了阿里巴巴达摩院高级算法工程师李晨亮和NLP 高级算法专家严明,分别就主题《达摩院通义 AliceMind 预训练大模型在 AIGC 文本创作的探索》、《达摩院通义 mPLUG 多模态预训练技术演进及应用实践》进行了深度讲解。想要回看的朋友可以点击文章底部“阅读原文”进行回看!


5月18日,「阿里达摩院大模型公开课」第3讲上线开讲。阿里巴巴达摩院算法专家、ChatPLUG 核心贡献者田俊峰和阿里巴巴达摩院算法工程师、mPLUG 核心贡献者叶晴昊将参与主讲。两位主讲人将对 ChatPLUG 和 mPLUG-Owl 背后的技术细节进行深入剖析。


ChatPLUG 是基于 PLUG 的一个中文对话大模型,使用亿级互联网社交数据、百科数据预训练和百万级高质量对话数据,并采用 FID(Fuse-in-Decoder)架构进行 instruction 微调得到。该模型支持高效的输入多段外部知识、人设信息等文本进行知识增强。


在与最新的开源中文对话大模型 BELLE-7M-2B 和 ChatGLM-6B 进行了多任务泛化性的人工对比评测后发现:


1)ChatPLUG-3.7B 取得了比 BELLE-7B-2M 更好的效果( Rating-A 更多,Rating-C 更少),同时对比 ChatGLM-6B 也取得了 comparable 的效果,表明了 ChatPLUG 具备良好的多任务泛化能力;


2)当将模型的 size 扩大到 13B,ChatPLUG-13B 在所有模型中取得了最优效果。


mPLUG-Owl 是一款类似于 miniGPT-4 和 LLaVA 的多模态对话生成模型,由视觉基础模型 、视觉抽象模块以及预训练语言模型组成,并且具备单模态和多模态多轮对话能力。


本次公开课,田俊峰将以《中文个性化对话大模型ChatPLUG》为主题首先带来直播讲解。他的讲解将主要从个性化大模型研究、搜索增强指令微调对话大模型,以及对话大模型的评估和开源三方面展开。


之后,叶晴昊将围绕《模块化多模态大模型mPLUG-Owl》这一主题进行讲解。他将介绍多模态大模型研究的变化趋势,并对mPLUG模块化多模态模型系列,以及mPLUG-Owl及训练新范式进行深入解读。



第3讲


 主题一 

《中文个性化对话大模型ChatPLUG》

 提 纲 


1、个性化大模型研究概述

2、搜索增强指令微调对话大模型

3、对话大模型的评估和开源

 主讲人 


田俊峰,阿里巴巴达摩院算法专家、ChatPLUG核心贡献者;研究方向为对话大模型和多模态大模型,在国际顶级会议ACL、EMNLP、CVPR、AAAI等发表多篇文章。


 主 题 二 


《模块化多模态大模型mPLUG-Owl》

 提 纲 


1、多模态大模型研究的变化趋势

2、mPLUG模块化多模态模型系列概述

3、mPLUG-Owl及训练新范式解析

 主讲人 


叶晴昊,阿里巴巴达摩院算法工程师、mPLUG核心贡献者;研究方向为多模态模块化大模型,在国际顶级会议ICCV、ICML、ACL等发表多篇文章。


报名方式


对「阿里达摩院大模型公开课」第3讲感兴趣的朋友,可以扫描下方二维码添加小助手小双进行报名。已添加过小双的老朋友,可以给小双私信,发送“ PLUG ”即可报名。


同时为了便于交流,针对「阿里达摩院大模型公开课」第3讲还将设置专属交流群,并邀请主讲人入群。想要加入交流群与主讲人认识的朋友,也可以添加小双进行申请。


点个“在看”和大家一起聊聊

👇👇👇

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
中科院发布多模态 ChatGPT,图片、语言、视频都可以 Chat ?中文多模态大模型力作中国士大夫阶层的老姑娘传统更强更通用:智源「悟道3.0」Emu多模态大模型开源,在多模态序列中「补全一切」博后招募 | 阿里达摩院决策智能实验室招募时间序列方向博士后北京内推 | 阿里达摩院招聘大型语言模型(LLM)应用方向实习生YouKu-mPLUG最大中文视频数据集和Benchmark,助力多模态大型模型发展钟南山:全国大概85%的人感染过新冠;笑果文化已被立案调查;阿里达摩院回应约70%员工被裁;梁稳根不再任三一集团董事长...阿里达摩院:GPT-4替代年薪60万的数据分析师只要几千块,论文已发GPT-4取代数据分析师,成本仅3000!阿里达摩院&NTU论文引热议巴黎市长将重修Châtelet 广场以方便行人在线可玩:阿里开源多模态大模型mPLUG-Owl,电影问答、梗图理解、多轮聊天……清华系面壁智能开源中文多模态大模型VisCPM :支持对话文图双向生成,吟诗作画能力惊艳达摩院猫头鹰mPLUG-Owl亮相:模块化多模态大模型,追赶GPT-4多模态能力多模态如何自监督?爱丁堡等最新「自监督多模态学习」综述:目标函数、数据对齐和模型架构8点1氪:iPhone 15将搭载堆叠式摄像头;阿里达摩院自动驾驶业务裁员70%?回应:不实消息;王者荣耀女装定价超千元听过的歌Dapr和Rainbond集成,实现云原生BaaS和模块化微服务开发年薪60万的数据分析师工作保不住了?!阿里达摩院研究发现,改用GPT-4成本只需几千元DPU与智能网卡技术公开课上新!三位技术大牛主讲开源DPU、内生安全智能网卡与DPU云化裸金属ICLR 2023 | 阿里达摩院开源人脸检测新框架DamoFD大厂掉头!阿里达摩院调整自动驾驶研发,团队归入菜鸟失而复得的宝贵住宿阿里达摩院:GPT-4替代年薪60万数据分析师只要几千块独家 | 原达摩院大牛金榕系因阿里大模型纷争离职,近日加入 Meta大牛动态:阿里达摩院认知智能大牛跳槽字节:加入AI Lab汇报副总裁杨震原当LLM遇到Database:阿里达摩院联合HKU推出Text-to-SQL新基准​杭州/北京内推 | 阿里达摩院生物医学信息处理团队招聘24届春招实习生ICML 2023 | 基于模块化思想,阿里达摩院提出多模态基础模型mPLUG-2多模态大语言模型综述来啦!一文带你理清多模态关键技术【城事】巴黎市长将重修Châtelet 广场以方便行人ZT:2021年6月19日《山河令》制片马韬repo原达摩院大模型 M6 带头人杨红霞加入字节,语言生成大模型再迎新玩家阿里达摩院发布“通义千问”,首席首测,学问如何?音盲赏乐阿里达摩院杭州DI-Lab诚招博士后
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。