Redian新闻
>
直播预告 | 阿里达摩院算法研究员黄斐:又快又好的非自回归文本生成

直播预告 | 阿里达摩院算法研究员黄斐:又快又好的非自回归文本生成

公众号新闻





 学术直播间 第 5 期 


论文原作解读✔️

在线实时Q&A✔️


 直播主题 


又快又好的非自回归文本生成:
有向无环图上的Transformer与预训练

 直播嘉宾 


黄斐
阿里达摩院通义千问大模型算法研究员

 直播时间 


2023年9月19日(周二)
20:30-21:00

 观看方式 


扫码下方二维码

进入直播间观看



 报告介绍 


当前的主流语言模型均采用了从左到右逐词生成的自回归生成方式,但这种方式依赖于迭代的预测过程,显著拖慢了生成速度。近年来,一种新的生成范式,非自回归生成模型,受到了学界的广泛关注。这类模型采用并行预测整个句子的方式,大幅加速了生成过程。本论文基于一种有向无环图的非自回归生成方式进行了预训练,所得到的模型能实现又快又好的文本生成效果。实验表明,在下游微调后,该模型在多个文本生成任务中均超越了等参数量的自回归生成模型,并取得了17倍的生成速度提升。



 嘉宾介绍 

黄斐

阿里达摩院通义千问大模型算法研究员


黄斐,阿里达摩院通义千问大模型算法研究员,清华大学计算机系交互式人工智能CoAI实验室博士毕业。2013年获全国高中生信息学奥林匹克竞赛(NOI)金牌,并在次年保送进入清华大学计算机系,本科毕业后直博,师从黄民烈老师。2023年博士毕业后加入阿里达摩院通义千问团队。主要研究方向为自然语言生成,非自回归文本生成。主要成果包括:以第一作者、共同一作身份在ICML、ACL、EMNLP、TACL等顶级国际会议或期刊上发表论文6篇,包括3篇CCF-A类论文,2篇CCF-B类论文;申请专利2项,与导师合作著有《现代自然语言生成》一书。博士期间的主要工作DA-Transformer能在保持文本生成质量不变的同时,大幅加速文本生成速度,被微软亚研院等多家团队列为非自回归生成领域的代表性工作,获得了大量关注。


扫码下方二维码

进入直播间观看



🔍


现在,在「知乎」也能找到我们了

进入知乎首页搜索「PaperWeekly」

点击「关注」订阅我们的专栏吧


·
·

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
板栗如何去壳去皮又快又好?分享8个小妙招,总有一个适合你!精忠保国胜利大会师 – 除了玩就是吃呗之非米其林们 (上)AI 助手 30 美元 1 个月,微软的「AI 镰刀」又快又稳中国科学院深圳先进技术研究院丁峰研究员/王晓副研究员团队诚聘计算材料学博士后AI算法成不孕不育救星!识别问题精子、筛选胚胎又快又准港中文李教授:人工智能垃圾分类算法研究|收获一作论文与导师推荐信!ICCV 2023 | 基于预训练视觉语言模型和大语言模型的零样本图像到文本生成达摩院加入AI抢人大战;薇娅公司发布AI数字人直播业务;中国电信正深研通用大模型丨AIGC大事日报达摩院「悬壶」,顶尖实验室带你领略医疗AI「圣手」终于!温哥华市中心能坐船往返温哥华岛了!又快又便宜班次还多!北京/杭州内推 | 阿里达摩院对话智能团队招聘大语言模型方向算法专家古诗词随想(二)年终总结用这25套PPT模板,半小时就能做得又快又好!北京/杭州内推 | 阿里达摩院视觉技术实验室招聘计算机视觉算法工程师/实习生直播预告:今晚7点,揭秘纳博科夫藏在《洛丽塔》里的文本游戏NeurIPS 2023 | PointGPT:点云和GPT大碰撞!点云的自回归生成预训练华为诺亚方舟实验室招聘视觉感知算法研究实习生经典文本中的以色列地与巴以冲突 | 直播预告通过循环训练实现忠实的低资源数据文本生成阿里达摩院发布业内首个遥感AI大模型;拼多多今日启动11.11大促;微博CEO率先测试前台实名制……被离婚之后杭州/北京内推 | 阿里云人工智能平台深度学习团队招聘算法研究实习生NeurIPS 2023 | MSRA、清华、复旦等联合提出AR-Diffusion:基于自回归扩散的文本生成又快又卷的时代,我家孩子“慢”就有错吗?!招聘 | 华东师范大学生命科学学院细胞信号转导与新药研发课题组招聘副研究员、专任副研究员及博士后华东师范大学生命科学学院细胞信号转导与新药研发课题组招聘副研究员、专任副研究员及博士后连发2篇Science,去年刚评上研究员,今年获国家杰青资助!复旦大学桑庆研究员研究成果集锦!Because I'm Stupid - Kim Huyn JoongVIVO影像算法研究部招聘算法实习生(技术预研&发表论文)给大模型生成文本发身份证:针对大模型生成文本的可编码水印技术早财经丨北京的自来水变凉了?官方回应;阿里达摩院校招,近6成岗位要求博士学历;台积电在德国合资建厂,总投资近350亿欧元直播预告 | 阿里巴巴NLP算法专家王潇斌:开箱即用的文本理解大模型阿里达摩院免费开放100件AI专利;字节推出大模型MBTI测试结果;ChatGPT自定义功能扩展免费丨AIGC大事日报科研上新 | 第2期:可驱动3D肖像生成;阅读文本密集图像的大模型;文本控制音色;基于大模型的推荐智能体
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。