Redian新闻
>
​系好安全带,这个RE模型非常快!

​系好安全带,这个RE模型非常快!

科技


©PaperWeekly 原创 · 作者 | 宁金忠

单位 | 大连理工大学

研究方向 | 信息抽取




论文标题:

FastRE: Towards Fast Relation Extraction with Convolutional Encoder and Improved Cascade Binary Tagging Framework

论文来源:

IJCAI 2022

论文链接:

https://arxiv.org/pdf/2205.02490.pdf

论文代码地址:

https://github.com/seukgcode/FastRE




Motivation

本文的研究任务为实体-关系三元组抽取任务。例如在金融领域中,从业者需要从海量的实时文本中快速构建知识图谱用来辅助金融决策。该领域对模型的效率有较高要求。但是目前已有的方法没有在模型的表现和性能之间取得较好的权衡。

最近几年的实体-关系三元组抽取领域的一些工作专注于性能的提升而忽略了模型的效率。目前性能较好的方法依赖于 BERT 等预训练语言模型带来的强大表达能力。然而,预训练模型的巨大参数量成为了影响该任务模型性能的主要因素,这严重影响了模型的训练速度和推理速度。




Contribution

作者摒弃了预训练语言模型中堆叠出现的 Transformer 结构,设计了一套全卷积的结构来提升模型的效率。与此同时,作者采用了膨胀卷积(dilated convolution)来提高模型的长距离依赖建模能力。另外,为了避免模型在层数变深时的梯度消失,作者在模型中添加了参加连接。

为了避免 cascade binary tagging framework 中的关系抽取冗余问题,作者在模型中利用了头实体的类别信息,采用预先定义的头实体的类型和其可能对应的关系构成了许多头实体-关系映射对(作者文中称为 type-relation 映射机制)。

为了提高 cascade binary tagging framework 的泛化性能,作者提出了一种位置独立的自适应阈值策略(position-dependent adaptive thresholding strategy)。




Method


3.1 Convolutional Encoder

对于输入文本,作者使用静态词向量 和可学习的位置向量 相加得到文本的词汇表示,然后将其输入到堆叠的 Convolutional Encoder 中做 encode。相比 BERT 中的堆叠 Transformer 结构,堆叠的 Convolutional Encoder 可以显著提升运算效率。Convolutional Encoder 由多个相同的结构堆叠而成:



每个 Convolutional Encoder 见模型结构图中左侧。其中包含两个膨胀卷积,门控机制以及残差连接结构:


3.2 Improved Cascade Binary Tagger

FastRE 首先标注所有的头实体(span 以及实体类型)。然后标注其对应的关系和尾实体。对于 Convolutional Encoder 编码的输出 ,作者使用多头自注意力机制和残差连接的方式得到用于头实体和尾实体标注的表示:

3.3 loss函

以头实体的 start tagging 为例,其表示形式如下:


损失函数的前半部分的使得每个正例的位置的得分相比动态阈值的得分等尽可能的大。损失函数的后半部分使得每个位置的动态阈值得分尽可能比负例的得分要大。

对于头实体的 end tagging 损失函数和公式(11)中的形式类似,两者相加表示头实体的 start 和 end 总体损失函数:

对于模型整体的损失函数,模型只考虑了所有检测出来的头实体,以及根据关系映射筛选出来的关系和尾实体,减少了较多的关系冗余:




Experiments

由于本文的方法依赖于实体类型的识别,三元组抽取中常用的 webnlg 数据集中没有实体类型,因此作者选用了 NYT10,NYT11,NYT24。

本文的主试验结果如上图所示,可以发现 FastRE 和对比方法相比,训练速度和推理速度均取得了最佳表现。同时性能方面也具有非常大的竞争力。

▲ Comparison of inference efficiency

由上图可以看出,FastRE 仅仅用了 1/100 的参数量,就实现了和 SOTA 模型相比拟的抽取性能和最佳的效率。




总结与展望

以往的关系三元组抽取模型重点关注三元组抽取性能而忽略了模型的效率。本文的作者另辟蹊径,专注于模型效率的提升。在保证模型三元组抽取性能尚可的情况下,作者采用近乎全卷积的结构,大大提升了模型的效率。这对于模型的落地应用具有重要意义。笔者在实测过程中,将 batch size 设置为 32 时,模型仅占用 1G 左右的显存,且 30epoch 以内,模型即可收敛。

FastRE 需要依赖于实体类别和关系的映射组成的 schemas 来解决关系冗余问题。当实体类别信息未提供时(例如 webNLG 数据集中的情况),如何提高关系三元组抽取的效率成为另外一个需要解决的问题。

更多阅读




#投 稿 通 道#

 让你的文字被更多人看到 



如何才能让更多的优质内容以更短路径到达读者群体,缩短读者寻找优质内容的成本呢?答案就是:你不认识的人。


总有一些你不认识的人,知道你想知道的东西。PaperWeekly 或许可以成为一座桥梁,促使不同背景、不同方向的学者和学术灵感相互碰撞,迸发出更多的可能性。 


PaperWeekly 鼓励高校实验室或个人,在我们的平台上分享各类优质内容,可以是最新论文解读,也可以是学术热点剖析科研心得竞赛经验讲解等。我们的目的只有一个,让知识真正流动起来。


📝 稿件基本要求:

• 文章确系个人原创作品,未曾在公开渠道发表,如为其他平台已发表或待发表的文章,请明确标注 

• 稿件建议以 markdown 格式撰写,文中配图以附件形式发送,要求图片清晰,无版权问题

• PaperWeekly 尊重原作者署名权,并将为每篇被采纳的原创首发稿件,提供业内具有竞争力稿酬,具体依据文章阅读量和文章质量阶梯制结算


📬 投稿通道:

• 投稿邮箱:[email protected] 

• 来稿请备注即时联系方式(微信),以便我们在稿件选用的第一时间联系作者

• 您也可以直接添加小编微信(pwbot02)快速投稿,备注:姓名-投稿


△长按添加PaperWeekly小编




🔍


现在,在「知乎」也能找到我们了

进入知乎首页搜索「PaperWeekly」

点击「关注」订阅我们的专栏吧



·

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
3个信号暗示娃到了猛长期!多吃这些,营养足长的快!周末给你安排好啦!就去洛杉矶最大嘉年华玩个痛快!突发! 波音737万丈高空速降, 如坠百层高楼! 安全带断裂, 乘客头破血流, 2人进ICU别被Meta的暴涨蒙眼:前方道路依然颠簸,乘客请系好安全带Chase Sapphire Preferred (CSP) 信用卡:80k 开卡奖励即将过期!澳孩童因吃了这个热卖糖果,舌头被烧出个大洞!专家警告:非常危险!【80k 开卡奖励即将过期】Chase Sapphire Preferred (CSP) 信用卡42秒KO!从打工妹到金腰带,张伟丽的每记重拳都在告诉世界:“我们女性可以!”又出事了!波音737万丈高空失灵,乘客似从100层楼急坠!17人头破血流,安全带被冲击波扯断!一拳夺冠!从打工妹到金腰带,张伟丽的每记重拳都在激励女孩“我们可以!”养了只小牛让狗子带,结果…收获一只睡沙发、会开门的300斤大狗牛哈哈哈!蒙特利尔哪个REM轻轨站附近房价最高? 一张地图带你看!仿真枪的故事夫妻关系好不好,这件小事很重要Shenzhen Funeral Home Requires COVID Test Result for Dead苹果花了几十亿的自研基带,可能翻车了。。。台北天母水管路野字源考德州小学枪击案已造成21死! 今夏费城或将迎来更多飓风! 安全带有炸裂风险, 现代在全美召回23.9万辆汽车终于知道专业shi玫瑰园如何让玫瑰过冬的她意外流产后用小刀割断脐带,却被控"杀害婴儿",被判50年?!莫里森透露卸任后计划!被拍到化身司机接送爱女,开玩笑称要开Uber赚外快!美国有的是钱!援助乌克兰加码至398亿美金!要快!Nature:挑战常规!新研究发现大多数同义突变是非常有害的处理好居家隔离与集中隔离的意见分歧,这非常重要莫里森薪水减半连夜搬家,称要开Uber赚外快!推特账号被举报“冒充”总理,想回归“安静澳人生活”,但不会离开政坛...国产片,倒带,循环新加坡挂国旗非常有讲究,这些事不能做...里尔克诗译: 西班牙舞者 - The Spanish Dancer你的SU模型太low了,这才是高质量模型库!Eventually, China’s Borders Will Reopen. Will Foreigners Return?法国总统马克龙最爱小众顶级领带,千元价格品味不俗,商务男必入!家有倔孩子,天天唱反调?这是好事啊!建议这样带,长大更有出息控制高血压不光是吃药,这些辅助方法也非常重要!一口藕带,开启武汉的清脆夏天
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。