直播预告 | SemEval 2023最佳论文:针对命名实体识别的统一检索增强方法
报告介绍
本论文为全球最大的语义评测大会SemEval 2023的最佳论文。为了解决多语言命名实体识别中的语义歧义和低上下文问题,现有方法普遍融合使用了知识库或白名单,但仍然存在知识不足、上下文长度有限、单一检索策略等问题。本文中,我们提出了一种统一的检索增强方法(U-RaNER)用于细粒度多语言 NER。为了增强检索上下文,我们结合多源异构知识库作为检索源,并探索了各种搜索策略,提高了检索知识的质量。另一方面,我们提出了知识注入方法高效利用检索信息,扩大模型的输入上下文规模。MultiCoNER II 评测吸引了60多只队伍参加,我们的方法在其中获得了 9 个赛道的冠军。
黄申
阿里达摩院高级算法工程师
黄申,阿里达摩院高级算法工程师,北京大学计算语言所硕士毕业。主要研究方向为信息抽取和检索增强,曾在ACL、AAAI、ACMM、COLING等国际顶级会议上以一作、共一身份发表多篇文章,在SemEval 2023、NLPCC 2022信息抽取国际比赛摘取11个子赛道的冠军,并获得SemEval 2023最佳系统论文奖。
扫码下方二维码
进入直播间观看
🔍
现在,在「知乎」也能找到我们了
进入知乎首页搜索「PaperWeekly」
点击「关注」订阅我们的专栏吧
微信扫码关注该文公众号作者
戳这里提交新闻线索和高质量文章给我们。
来源: qq
点击查看作者最近其他文章