Redian新闻
>
陈丹琦重新定义了文本相似性问题,提出C-STS,GPT-4也不能很好解决

陈丹琦重新定义了文本相似性问题,提出C-STS,GPT-4也不能很好解决

公众号新闻

陈丹琦的这个工作不错,之前的文本相似度基本只是一个分数,而其实可以分为很多不同视角下的相似情况,这里相当于重新定义了任务。另外,数据构建也是通过模型生成,一切都很方便快捷。最后实验也表明GPT4也时而会出错,这个开拓的方向可以继续深入研究个探讨。

下面站在作者角度具体了解下吧。

论文:C-STS: Conditional Semantic Textual Similarity
地址:https://arxiv.org/abs/2305.15093
单位:Princeton、Allen AI等

进NLP群—>加入NLP交流群

语义文本相似性(STS)一直是NLP中的一项基石任务,它测量一对句子之间的相似程度,在信息检索,问答和嵌入方法中得到了应用。

然而,这是一项固有的模棱两可的任务,句子相似性取决于感兴趣的特定方面。

我们通过提出一项称为条件STSC-STS)的新任务来解决这种歧义,该任务以自然语言阐明的方面(此处为条件)来衡量相似性。

例如,句子“NBA球员投三分球”和“一个人将网球抛向空中发球”之间的相似性对于“球的运动”条件更高(向上)。和较低的“球的大小”(一大一小)。

C-STS具有双重优势:(1)它降低了STS的主观性和模糊性, (2)可以使用不同的条件进行细粒度的相似性评估。

数据的智能构建过程

C-STS 包含来自不同领域的近 20,000 个实例,我们评估了几个最先进的模型,以证明即使是性能最高的微调和上下文学习模型(GPT-4、Flan、SimCSE)也发现它具有挑战性,Spearman 相关分数为 <50。

我们鼓励社区在 C-STS 上评估他们的模型,以提供更全面的语义相似性和自然语言理解视图。

实验与分析


进NLP群—>加入NLP交流群

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
重新定义中小网络,“一机一网”解决方案重磅来袭Caton Media Xstream: 重新定义实时内容交付服务Windows Copilot抢先上手!GPT-4全线接入Win11,重新定义操作系统【尘封档案】系列之165:“投名状”之谜(上)结合符号性记忆,清华等提出ChatDB,提升大模型的复杂推理能力豆瓣9.6《海妖的呼唤》,重新定义什么是女综!卡梅隆震惊:两起灾难有“相似性”这24个“靓女”,重新定义什么是女综!小思考 |重新定义“浪费时间”大模型惨遭人类大范围攻击!国内各领域专家组团投毒,GPT-4也Hold不住瑞士人造块手表,重新定义了奢华!重新定义了电动自行车,这就是两个轮的特斯拉!GPT-4也难逃“反转诅咒”!新研究发现:大模型存在推理缺陷,知道“A是B”推不出“B是A”陈丹琦ACL学术报告来了!详解大模型「外挂」数据库7大方向3大挑战,3小时干货满满在贵州榕江,重新定义中国足球微信视觉团队斩获CVPR 2023视频相似性大赛双赛道冠军!陈丹琦 ACL'23 Tutorial - 基于检索的大语言模型 学习笔记肿瘤患者有高血压糖尿病等基础病,营养问题还能很好的解决吗?里斯本庞巴尔侯爵广场(Marquis of Pombal Square),著名广场瑞士人造辆电车,重新定义了皮卡!股东争议、公司治理失灵、资本战略失败…这些难题其实很好解决在6/4的今天,纪念才去世的他芥芥的生日愿望ICCV 2023 | 上交提出CCD:基于自监督字符到字符蒸馏的文本识别AI重新定义职场!麦肯锡:未来超一半工作会被AI接管卡梅隆震惊!“两起事故有相似性”女性荷尔蒙爆棚!重新定义女综天花板!四照花,明亮光芒5人遇难!卡梅隆震惊:“两起事故有相似性”他是可可香奈儿的挚友,氛围感拍摄鼻祖,重新定义了优雅"有人说中国经济陷入严重系统性问题,我并不认同"出道就被吐槽长得丑,却一步步逆袭成“顶流”,37岁的她靠实力重新定义了美比五菱MINI还小,电池可自己拆装!西班牙人重新定义了代步车感觉很好!状态很好!身体很好!无一生还!卡梅隆对泰坦号事故表达震惊:“两起悲剧有相似性”
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。