Redian新闻
>
黄毅翀@哈尔滨工业大学 - 多语言机器翻译中的收敛一致性研究

黄毅翀@哈尔滨工业大学 - 多语言机器翻译中的收敛一致性研究

公众号新闻

MLNLP社区是国内外知名的机器学习与自然语言处理社区,受众覆盖国内外NLP硕博生、高校老师以及企业研究人员。
社区的愿景是促进国内外自然语言处理,机器学习学术界、产业界和广大爱好者之间的交流和进步,特别是初学者同学们的进步。
MLNLP Paper ReadingMLNLP社区举办的学术交流活动,旨在邀请一线青年学者领读优质论文,期待大家从论文中受益。
本期我们选取了一篇EMNLP2022的发表工作。该工作由哈尔滨工业大学完成,秦兵教授、冯骁副教授指导,论文第一作者黄毅翀博士生进行录制。

1

作者信息



Yichong Huang (Harbin Institute of Technology), Xiaocheng Feng (Harbin Institute of Technology), Xinwei Geng (Harbin Institute of Technology), Bing Qin (Harbin Institute of Technology)


2

论文摘要


多语言机器翻译 (Multilingual Neural Machine Translation) 旨在通过一个统一的模型来完成多种语言对的翻译任务,因其优越的部署效率和可靠的低资源翻译性能而受到广泛关注。尽管目前多语言机器翻译已经取得了十分不错的进展,但是仍面临着收敛不一致问题,即不同语言对的翻译性能在不同的轮数上达到最优。这种收敛不一致性使得最终训练出的模型往往过拟合了低资源而欠拟合了高资源。因此,本文提出一种新的训练策略,语言特定自蒸馏 (Language-Specific Self-Distillation) ,来缓解多语言收敛不一致性。具体而言,我们将语言特定最优检查点作为教师模型去蒸馏当前模型。此外,我们还系统探索了我们方法的三种改进,分别采取静态的、有选择性的、自适应的三种蒸馏模式。

3

论文贡献


1.本文首次提出关注到多语言机器翻译中的收敛不一致性问题,并说明了该问题对最终模型的翻译性能影响。

2. 通过提出一种语言特定自蒸馏策略,来极大地缓解了收敛不一致性问题。本文进一步地设计了三种样本级别知识迁移改进。

3. 本文在三个多语言机器翻译数据集上取得了明显提升。



4

一句话论文简介


本论文通过为每个语言对的翻译维护一个语言特定最优检查点并蒸馏当前模型,显著缓解了多语言机器翻译中的收敛不一致性问题。

5

论文信息与链接


Yichong Huang Xiaocheng Feng Xinwei Geng Bing Qin. Unifying the Convergences in Multilingual Neural Machine Translation. EMNLP 2022.

文章链接:https://arxiv.org/abs/2205.01620

代码链接:https://github.com/orangeinsouth/lssd

B站观看链接:https://www.bilibili.com/video/av903394725/

视频号观看入口:


6

视频讲者介绍


黄毅翀,哈尔滨工业大学社会计算与信息检索研究中心二年级博士生,师从秦兵教授和冯骁骋副教授。研究兴趣为机器翻译,自然语言处理。曾在EMNLP会议上发表相关论文,曾获国家奖学金。个人主页是https://ychuang.netlify.app/

关于我们

MLNLP 社区是由国内外机器学习与自然语言处理学者联合构建的民间学术社区,目前已经发展为国内外知名的机器学习与自然语言处理社区,旨在促进机器学习,自然语言处理学术界、产业界和广大爱好者之间的进步。
社区可以为相关从业者的深造、就业及研究等方面提供开放交流平台。欢迎大家关注和加入我们。

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
博士后申请 | 西湖大学张岳课题组招收基础自然语言处理、机器翻译、机器学习等方向的博士后巨星陨落!哈尔滨工业大学讣告月光黯淡(二十二)WMT 2022 国际机器翻译大赛发榜,微信翻译获对话翻译和生物医学领域翻译共三项冠军关于调整哈尔滨市哈尔滨市香坊区、南岗区风险等级的通告邓菲研究组和合作单位在极地病毒多样性研究中获进展FlowSeq、mBART、BERT-fused、mRASP、mRASP2...你都掌握了吗?一文总结机器翻译必备经典模型(三)有轿车开进哈尔滨中央大街?!司机还在拍照炫耀!网友喊话哈尔滨交警哈尔滨工业大学(深圳)热电材料与器件研究团队诚招博士后(长期有效)招20人, 多语种交传/陪同翻译兼职Why do Tibetans think they are Chinese?谈谈基金收益率的一致性瑞士:多语言国家的典范 | 经济学人文化COLING 2022 | 小米AI实验室:更有效的鲁棒性神经机器翻译训练方法OpenAI 宣布开源多语言语音识别系统 Whisper,英文识别能力接近人类水平哈尔滨工业大学2023年高水平运动队篮球项目招生简章KRAS研究解析2022丨21%论文发在9+SCI;年度双子星对肿瘤展示了良好的疗效,KRAS抑制剂的耐药性研究热度依旧RNNsearch、Multi-task、attention-model...你都掌握了吗?一文总结机器翻译必备经典模型(一)线上! 多语种翻译兼职合集韩国高尔夫美女多,美国诺贝尔经奖多清华CodeGeeX项目原作解读:大规模多语言代码生成模型【E诗配画】登鹳雀楼黄毅被提起公诉!CCF-NLP走进高校之“走进哈尔滨工业大学(深圳)”这部韩剧好看 《非常律师禹英隅》哈尔滨工业大学复合材料与结构研究所诚聘多学科高端人才工业机器人企业数量全国第一,江苏省工业机器人产业盘点丨智造者线上! 多语言游戏LQA兼职Mango Market黑客事件与预言机的局限性「多语言图像描述」最强评估基准XM3600来了!涵盖36种语言【2023投资风向标】对话夏尔巴投资:保持投资策略一致性,持续做创业者的向导新DP规范来了!DP 2.1发布,加强不同规格接口的一致性[干货] 翻译中的“无奈”...事业编! 苏州市外事翻译中心招聘Unsupervised NMT、PBSMT、coarse-to-fine...你都掌握了吗?一文总结机器翻译必备经典模型(二)
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。