国际科技财经博客移民网络热点娱乐民生时事公众号

>

陈丹琦重新定义了文本相似性问题，提出C-STS，GPT-4也不能很好解决

陈丹琦重新定义了文本相似性问题，提出C-STS，GPT-4也不能很好解决

公众号新闻

2023-08-02 14:08

陈丹琦的这个工作不错，之前的文本相似度基本只是一个分数，而其实可以分为很多不同视角下的相似情况，这里相当于重新定义了任务。另外，数据构建也是通过模型生成，一切都很方便快捷。最后实验也表明GPT4也时而会出错，这个开拓的方向可以继续深入研究个探讨。

下面站在作者角度具体了解下吧。

论文：C-STS: Conditional Semantic Textual Similarity
地址：https://arxiv.org/abs/2305.15093
单位：Princeton、Allen AI等
进NLP群—>加入NLP交流群

语义文本相似性（STS）一直是NLP中的一项基石任务，它测量一对句子之间的相似程度，在信息检索，问答和嵌入方法中得到了应用。

然而，这是一项固有的模棱两可的任务，句子相似性取决于感兴趣的特定方面。

我们通过提出一项称为条件STS（C-STS）的新任务来解决这种歧义，该任务以自然语言阐明的方面（此处为条件）来衡量相似性。

例如，句子“NBA球员投三分球”和“一个人将网球抛向空中发球”之间的相似性对于“球的运动”条件更高（向上）。和较低的“球的大小”（一大一小）。

C-STS具有双重优势：（1）它降低了STS的主观性和模糊性，（2）可以使用不同的条件进行细粒度的相似性评估。

数据的智能构建过程

C-STS 包含来自不同领域的近 20，000 个实例，我们评估了几个最先进的模型，以证明即使是性能最高的微调和上下文学习模型（GPT-4、Flan、SimCSE）也发现它具有挑战性，Spearman 相关分数为 <50。

我们鼓励社区在 C-STS 上评估他们的模型，以提供更全面的语义相似性和自然语言理解视图。

实验与分析

进NLP群—>加入NLP交流群

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。

来源: qq

点击查看作者最近其他文章

相关阅读

重新定义中小网络，“一机一网”解决方案重磅来袭 Caton Media Xstream: 重新定义实时内容交付服务 Windows Copilot抢先上手！GPT-4全线接入Win11，重新定义操作系统【尘封档案】系列之165：“投名状”之谜（上）结合符号性记忆，清华等提出ChatDB，提升大模型的复杂推理能力豆瓣9.6《海妖的呼唤》，重新定义什么是女综！卡梅隆震惊：两起灾难有“相似性”这24个“靓女”，重新定义什么是女综！小思考｜重新定义“浪费时间”大模型惨遭人类大范围攻击！国内各领域专家组团投毒，GPT-4也Hold不住瑞士人造块手表，重新定义了奢华！重新定义了电动自行车，这就是两个轮的特斯拉！GPT-4也难逃“反转诅咒”！新研究发现：大模型存在推理缺陷，知道“A是B”推不出“B是A”陈丹琦ACL学术报告来了！详解大模型「外挂」数据库7大方向3大挑战，3小时干货满满在贵州榕江，重新定义中国足球微信视觉团队斩获CVPR 2023视频相似性大赛双赛道冠军！陈丹琦 ACL'23 Tutorial - 基于检索的大语言模型学习笔记肿瘤患者有高血压糖尿病等基础病，营养问题还能很好的解决吗？里斯本庞巴尔侯爵广场(Marquis of Pombal Square)，著名广场瑞士人造辆电车，重新定义了皮卡！股东争议、公司治理失灵、资本战略失败…这些难题其实很好解决在6/4的今天，纪念才去世的他芥芥的生日愿望 ICCV 2023 | 上交提出CCD：基于自监督字符到字符蒸馏的文本识别 AI重新定义职场！麦肯锡：未来超一半工作会被AI接管卡梅隆震惊！“两起事故有相似性”女性荷尔蒙爆棚！重新定义女综天花板！四照花，明亮光芒 5人遇难！卡梅隆震惊：“两起事故有相似性”他是可可香奈儿的挚友，氛围感拍摄鼻祖，重新定义了优雅 "有人说中国经济陷入严重系统性问题，我并不认同"出道就被吐槽长得丑，却一步步逆袭成“顶流”，37岁的她靠实力重新定义了美比五菱MINI还小，电池可自己拆装！西班牙人重新定义了代步车感觉很好！状态很好！身体很好！无一生还！卡梅隆对泰坦号事故表达震惊：“两起悲剧有相似性”

热点事件追踪