Redian新闻
>
EMNLP2023 | 计算语言揭秘认知扭曲:SCIR推出C2D2中文数据集

EMNLP2023 | 计算语言揭秘认知扭曲:SCIR推出C2D2中文数据集

公众号新闻

论文:C2D2 Dataset: A Resource for Analyzing Cognitive Distortions and Its Impact on Mental Health

作者:王毕陈,赵妍妍,秦兵

链接:https://github.com/bcwangavailable/C2D2-Cognitive-Distortion

出处:哈工大SCIR

->辅导界的小米带你冲刺ACL2024

1. 背景

在过去,研究者主要关注情绪健康,深度研究情绪如何对我们的日常生活和整体幸福感产生深远影响。然而,随着时间的流逝,我们开始认识到,就如同一棵树在倒塌之前,其内部可能已被蛀虫严重损害,尽管这并不从外部明显可见。为了真正实现心理健康,我们必须更多地关注内在的思维模式,而不仅是表面的情绪。
认知心理学向我们展示,认知扭曲往往是众多心理健康问题的根源,它使人们对世界有了一种不真实的认知。心理学家已经识别出许多常见的思维偏差,即“认知扭曲”,它们可能在我们描述自身或周围环境时出现。这些扭曲不仅仅是逻辑上的失误,而是在我们感知外部世界时的无意识偏见。更重要的是,这些认知扭曲往往与人类普遍价值观发生冲突。例如,如果一个人持有“我必须被所有人喜欢”这样的认知扭曲,这与人类普遍的价值观念,即“每个人都有被尊重和理解的权利”,是相悖的。通过研究和纠正这些认知扭曲,我们不仅可以促进心理健康,还可以更加深入地理解和珍视人类价值观。
图1:认知扭曲对个人的影响。认知扭曲在这个强化循环中不断强化,导致抑郁、创伤后应激障碍和焦虑等精神障碍的发展。

2.认知扭曲类别

心理学家已经确定了个人思想中经常表现出的各种类别的认知扭曲。我们采取贝克最初提出的7种认知扭曲理论,每种认知扭曲的定义和例子如下:

表1: 7种常见的认知扭曲与定义
可以看出认知扭曲本身虽然往往和负面情绪相关,但其更多是强调不合理的负面情绪,这些负面情绪的形成和加强都和认知扭曲相关。认知扭曲更是不合理的负面情绪的放大器和加重者。尽管以往的研究更多关注负面情绪,但我们的C2D2数据集旨在关注和研究这些认知扭曲。

3. C2D2数据集

C2D2是第一个面向公众开放的中文认知扭曲数据集,我们的数据注释任务涵盖了七种典型的认知扭曲,志愿者根据给定的情景撰写可能的认知扭曲思维。每个场景会提供给志愿者,他们需要根据场景描述产生符合指定认知扭曲类型的思维。不同类型的认知扭曲并不严格独立出现,但为了简化注释过程,我们将其视为单标签任务。志愿者的目标是生成代表一种认知扭曲的实例。在多个认知扭曲同时出现的情况下,我们要求志愿者选择占主导地位的认知扭曲。
图2: 数据集构建过程,由专家与志愿者联合培训完成。包括志愿者招募,数据标注,专家评审等过程。
通过我们严苛的数据标注过程,我们在专家验证后,保留了7500条包含了认知扭曲思维的文本,围绕着300个不同的负面事件与情景。数据集统计结果如下所示。
表2: C2D2数据集统计情况,包含了7类认知扭曲与一些正常思维

4.实际应用

C2D2数据集不仅为研究者提供了宝贵的资源,还为心理健康领域的专家提供了实际的应用方法。例如,心理医生可以使用我们的模型来分析病人的日记或社交媒体帖子,以便更好地了解他们的思维模式和可能的认知扭曲。
表3: C2D2 任务的基线模型的性能。所有指标均使用宏观平均计算。
此外,C2D2也是一个宝贵的学术研究工具。与心理学传统的小样本分析相比,现在我们可以通过基于C2D2构建的模型直接从大量用户生成的文本中进行用户认知扭曲计算分析,得到更具普遍性和可靠性的结论。
图3:抑郁症患者与正常用户社交媒体发言中的认知扭曲对比,抑郁症患者的社交媒体发言反应了更多认知扭曲。

5. 仓库链接

  • C2D2中文认知扭曲数据集详情请见论文《C2D2 Dataset: A Resource for Analyzing Cognitive Distortions and Its Impact on Mental Health》,该论文已被EMNLP-2023收录为Findings 论文。

  • C2D2中文认知扭曲数据集下载请见https://github.com/bcwangavailable/C2D2-Cognitive-Distortion。

  • 数据集研发人员:
    王毕陈 ([email protected]),鹏飞

  • 指导教师:赵妍妍,秦兵

6. 总结

认知扭曲在我们的日常生活中无处不在,它们可能对我们的心理健康和生活质量产生深远的影响。通过C2D2数据集,我们为研究者和心理健康专家提供了一个强大的工具,帮助他们更好地理解和应对这些扭曲。我们希望这个数据集能够促进心理学与计算科学结合发展,为更多的人带来帮助。

本期责任编辑:赵妍妍

本期编辑:杨   昕



备注:昵称-学校/公司-方向/会议(eg.ACL),进入技术/投稿群


id:DLNLPer,记得备注呦


微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
MetaMath:新数学推理数据集揭秘,让大语言模型突破逆转诅咒COLING/EMNLP/NAACL/NLPCC群,快来~EMNLP 2023录用结果公布,高分仍然被拒?评审内幕公开EMNLP 2023 | 解决LLaMA、BERT等部署难题:首个4-bit浮点量化LLM来了我没有能力管教好孩子 | 如何面对认知扭曲的来访者?EMNLP2023 | LLMs也许不擅长少样本信息提取,但可以为候选答案重新排序!EMNLP 2023 | 通过化学知识和自然语言关联以增强生物领域的跨模态学习NLP年终盘点!2023年顶会论文合集(含ACL、EMNLP、NAACL、AAAI等)EMNLP 2023评审内幕公开Falcon-7B大型语言模型在心理健康对话数据集上使用QLoRA进行微调蓝色的蒙古高原EMNLP 2023 | 大模型对话系统的内功与外功生活啊,我该如何打开你EMNLP 2023 | 用于开放域多跳推理的大语言模型的自我提示思想链北非后花园丨寻找三毛梦中的撒哈拉沙漠 摩洛哥 卡萨布兰卡+上帝故乡马拉喀什+瓦尔扎扎特+非斯+舍夫沙万 9天7晚游CMNCMN9华文教育席卷全球香椿鸡蛋发面饼--不用揉,不用擀,趁热吃外酥内软,凉着吃,同样松软,香椿味更浓。(视频+图文)早报 | 德国勃肯鞋正式申请IPO估值80亿美元;Dior推出天价口红;传郑志刚将投资Givenchy创意总监个人品牌顶刊TMM 2023!中科院提出CLIP-VG:基于自步课程学习实现CLIP在视觉语言理解与定位任务上的无监督迁移研究学术成果 | EMNLP2023:MMEdit——如何编辑多模态大语言模型?​EMNLP 2023 findings | 生成式框架下解决输入扰动槽填充任务退货方便多了!Uber推出新上门取件服务,不用自己跑邮局退货了!大语言模型(LLM)预训练数据集调研分析EMNLP 2023 | 基于知识图谱嵌入的关系感知集成学习算法当心!!!银行偷偷减低了我的CD 利息 APY超越同级7B模型! 中国团队开源大规模高质量图文数据集ShareGPT4V,大幅提升多模态性能【范德堡ED2录取专访】决定ED2, 我只用了不到1小时廉航Flair推出多伦多出发新航线 单程低至39元!EMNLP 2023 Best Paper公布啦!EMNLP2023 | LLM作用下的成分句法分析基础研究刚刚开源!中科大提出利用GPT4-V构建大规模高质量图文数据集ShareGPT4V,助力模型霸榜多项多模态榜单!​EMNLP 2023 | Explore-Instruct: 通过LLM的主动探索提高特定领域指令多样性EMNLP 2023 | MMEdit——如何编辑多模态大语言模型?EMNLP 2023 | 阅读顺序很重要:蚂蚁联合复旦提出全新多模态文档信息抽取模型ICCV 2023|南洋理工大学开源大规模语言视频分割数据集MeViS
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。