ACL 2023 | TemplateGEC: 通过检测模板改进语法错误纠正
论文标题:
TemplateGEC: Improving Grammatical Error Correction with Detection Template
ACL 2023 Main Conference (Oral)
https://aclanthology.org/2023.acl-long.380/
https://github.com/li-aolong/TemplateGEC
1.1 检测模板的构建
检测前缀由错误部分和相应的有序特殊标记连接而成,错误部分是标记为 I 的连续标记。源句子可能包含多个错误部分,每个错误部分包含不同数量的单词。根据检测标签提取源句的所有错误部分 ,检测前缀可以由下式给出:
1.2 真实标签辅助的一致性学习
实验
2.2.2 模型
2.2.3 主要结果
3.1 人在回路GEC的潜力
除了提出的 TemplateGEC 之外,我们还认为我们的方法具有应用于开发人机循环 GEC 系统的潜力。我们设想这样一种场景,用户输入需要纠正或细化的句子,并且我们的 GEC 模型支持识别用户识别错误或不确定的句子中的特定范围。在这种情况下,TemplateGEC 系统可以将识别的错误范围转换为本文提出的模板格式,从而使 GEC 模型在校正过程中更加重视这些特定区域。将用户交互纳入 TemplateGEC 系统中,允许利用用户注释的范围作为错误检测标签的黄金标准,从而提高纠错能力并提高效率。
对于第二个示例,仅模板模型仍然修改了模板指示的相应位置,但其中一个被错误地纠正,这是被预测标签误导的。然而,我们惊讶地发现 TemplateGEC 忽略了这种误导并成功纠正了整个源句子。这一结果强烈表明,即使先验信息错误,我们的模型也可以做出正确的修正,这充分证明了我们方法的可靠性和鲁棒性。
本文提出了一种新的 GEC 方法,称为 TemplateGEC,它集成了 Seq2Edit 和 Seq2Seq 框架,利用了它们在错误检测和纠正方面的优势。TemplateGEC 将原始错误句子转换为一种新颖的模板格式,其中包含由 Seq2Edit 模型生成的预测和真实的错误检测标签。此外,TemplateGEC 还结合了真实标签辅助一致性学习,通过使用 Seq2Seq 模型最大限度地提高预测模板和真实模板的预测之间的一致性,从而提高性能。
参考文献
[1] Zheng Yuan, Shiva Taslimipoor, Christopher Davis, and Christopher Bryant. 2021. Multi-class grammatical error detection for correction: A tale of two systems. In Proceedings of the 2021 Conference on Empirical Methods in Natural Language Processing , pages 8722–8736, Online and Punta Cana, Dominican Republic. Association for Computational Linguistics.
[2] Christopher Bryant, Mariano Felice, and Ted Briscoe. 2017b. Automatic annotation and evaluation of error types for grammatical error correction. In Proceedings of the 55th Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers), pages 793–805, Vancouver, Canada. Association for Computational Linguistics.
更多阅读
#投 稿 通 道#
让你的文字被更多人看到
如何才能让更多的优质内容以更短路径到达读者群体,缩短读者寻找优质内容的成本呢?答案就是:你不认识的人。
总有一些你不认识的人,知道你想知道的东西。PaperWeekly 或许可以成为一座桥梁,促使不同背景、不同方向的学者和学术灵感相互碰撞,迸发出更多的可能性。
PaperWeekly 鼓励高校实验室或个人,在我们的平台上分享各类优质内容,可以是最新论文解读,也可以是学术热点剖析、科研心得或竞赛经验讲解等。我们的目的只有一个,让知识真正流动起来。
📝 稿件基本要求:
• 文章确系个人原创作品,未曾在公开渠道发表,如为其他平台已发表或待发表的文章,请明确标注
• 稿件建议以 markdown 格式撰写,文中配图以附件形式发送,要求图片清晰,无版权问题
• PaperWeekly 尊重原作者署名权,并将为每篇被采纳的原创首发稿件,提供业内具有竞争力稿酬,具体依据文章阅读量和文章质量阶梯制结算
📬 投稿通道:
• 投稿邮箱:[email protected]
• 来稿请备注即时联系方式(微信),以便我们在稿件选用的第一时间联系作者
• 您也可以直接添加小编微信(pwbot02)快速投稿,备注:姓名-投稿
△长按添加PaperWeekly小编
🔍
现在,在「知乎」也能找到我们了
进入知乎首页搜索「PaperWeekly」
点击「关注」订阅我们的专栏吧
微信扫码关注该文公众号作者