Redian新闻
>
“生成式大语言模型技术分享”系列直播即将启幕

“生成式大语言模型技术分享”系列直播即将启幕

公众号新闻
近几年,以Transformer架构为基础的大语言模型(LLM)在NLP各类任务上都展现出了巨大的潜力。比如,在2022年底引起轰动的ChatGPT,几乎可以高质量地完成NLP中的大多数任务。自ChatGPT发布后,生成式AI逐渐成为新的技术范式,引起一场巨大的科技史变革。考虑到大语言模型技术的快速发展与裂变,为了使从业者紧跟技术发展的步伐,本系列讲座将对大语言模型的相关技术进行讲解。

本系列讲座主要包括基础技术关键技术两个模块

基础技术
Transformer基础技术
Transformer与语言模型
预训练基础:编码模型
预训练基础:生成模型
关键技术
大语言模型发展与现状
大语言模型技术概述
指令微调与上下文学习
基于人类反馈的强化学习
长序列建模技术
模型压缩与高效神经网络
分布式训练技术大语言模型的多语言能力
大语言模型的多模态能力
大语言模型的对抗检测真实性验证

本系列讲座由东北大学自然语言处理实验室、小牛雅智、小牛翻译联合推出,将在视频号、微博、哔哩哔哩、抖音、知乎、机器翻译学堂开启同步直播,欢迎每一位关注自然语言处理的伙伴。此外,登录小牛翻译云平台官方网站获取最新直播地址和回放,关注小牛翻译云平台各大平台官方账号了解系列直播的相关信息。

"生成式大语言模型技术分享”系列直播计划

本系列直播将在4月27日正式启动,首期讲座为《Transformer基础技术》,带领大家系统地学习Transformer基础架构,了解其关键技术,并探讨它因何成为大型语言模型的基石。

生成式大语言模型技术分享-第一期《Transformer基础技术》


报告时间 

2023年4月27日(周四晚)  18:30


分享嘉宾

李北


报告背景

随着大语言模型的快速崛起,人们对自然语言处理技术的关注度也在不断提升。近年来,BERT、GPT等语言模型各显神通,其模型结构均可溯源至Transformer。自2017年提出以来,Transformer已经迅速占据了整个自然语言处理领域,甚至在图像处理和语音处理领域也开始发挥作用。目前火热的ChatGPT也是基于Transformer decoder结构的模型之一,其出色的表现广受好评。掌握Transformer基础知识已成为学术界和从业者的必修课程。

报告内容

Transformer的整体框架、输入及位置编码、注意力机制、残差网络与层归一化、前馈神经网络等关键技术。通过本次报告,您将能够对Transformer基础有更加全面和深入的了解与思考。


直播地址

视频号(ID:小牛翻译云平台)
微博(ID:小牛翻译)
哔哩哔哩(ID:小牛翻译NiuTrans)
抖音(ID:小牛翻译)
知乎(ID:小牛翻译云平台)
机器翻译学堂(https://school.niutrans.com/live)

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
上海樱花节即将启幕,怎么坐车?哪里停车?这份出行、赏樱攻略拿走不谢→《2023 大语言模型综合能力测评报告》出炉:以文心一言为代表的国内产品即将冲出重围大语言模型技术进展及应用 | 5月25日TF105报名厦门·法国电影大师展 | 今日12点开票!特吕弗作品展映即将启幕MIGA项目原作解读:基于生成式预训练语言模型T5的Text-to-SQL模型SpikeGPT项目原作解读:使用脉冲神经网络的生成式语言模型“美好生活拼出来”系列直播泉州首播,超两千万网友围观拼购【嘛嘛档炒面】Mee Mamak以 LLM 为核心 LLM@Core:程序员的大语言模型技术指南我们做了一个大模型测试集「Z-Bench」,300个问题全方位考察大语言模型能力夫妻团圆,又分离20年聆思科技徐燕松:生成式大模型潮流下,智能家居端侧智能化涌现变革中国大模型时代新Linux初显!FlagOpen大模型技术开源体系发布【重磅活动】第二届最佳国资基金管理人颁奖典礼暨2022国资基金(广西•来宾)高峰论坛即将启幕法国电影大师展 |正式开票!特吕弗作品展映即将启幕Firefly(流萤): 中文对话式大语言模型剑桥、腾讯AI Lab等提出大语言模型PandaGPT:一个模型统一六种模态硬核科普:大语言模型,都是如何生成内容的7 Papers & Radios | Meta「分割一切」AI模型;从T5到GPT-4盘点大语言模型大型语言模型技术公开课上线4讲!直播讲解ChatGPT开源平替、类GPT4低成本定制以及GPT4Tools“感受” 到底是个什么鬼?会议预告|第二届中国数字碳中和高峰论坛即将启幕 数字碳中和区域发展分论坛同期召开招募 | “力求改变的创业峰会”即将启幕,哥大全球中心赋能青少年社会创新梦想首届“光明科学城论坛”即将启幕中欧四国自驾游: 信息和体验总汇单卡就能跑的大模型等效GPT-3!Meta发布大语言模型LLaMA,大小从7B到65B不等活动预告|奥雅股份粤港澳大湾区元宇宙论坛暨元宇宙三十人深圳分论坛即将启幕从LLM到MLLM,多模态大规模语言模型KOSMOS-1赋予了语言模型看见世界的能力自动驾驶生成式大模型 DriveGPT 来了:基于 4000 万公里量产车驾驶数据训练,参数规模 1200 亿NLP大规模语言模型推理实战:大语言模型BLOOM推理工具测试实践与效果分析实录空天信息大会4.0即将启幕:空天互联的数实大融合中国第一个真正实现智能涌现的国产大语言模型,内测即将开启Meta最新语言模型LLaMA论文研读:小参数+大数据的开放、高效基础语言模型阅读笔记大语言模型的多语言机器翻译能力分析什么样的人最自由?
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。