Redian新闻
>
NAACL'22 Findings | 社交媒体上的抱怨强度分析

NAACL'22 Findings | 社交媒体上的抱怨强度分析

公众号新闻

每天给你送来NLP技术干货!



来自:南大NLP

01

研究动机


抱怨是一种表达现实和人类期望之间不一致的言语行为[1]。人们会根据情况的严重性和紧迫性,用抱怨来表达他们的担忧或不满。轻微的抱怨可以达到发泄情绪以促进心理健康的目的,但严重的抱怨可能会导致仇恨甚至欺凌行为[2]。之前的研究主要集中在识别抱怨是否存在或其类型上,但是分析抱怨强度尤其重要,因为一定程度的抱怨可能会对公司或组织造成严重的负面后果。   

1 Jin数据集中同类别抱怨博文

在计算语言学中,先前的研究主要集中在建立自动分类模型来识别抱怨是否存在。Jin提供了一个数据集,基于语用学注释了不同严重程度的抱怨博文,分别为没有明确的指责反对指责指控责备”[3]。在这些研究中,我们注意到一个缺失的部分是测量抱怨的强度。为了说明这一点,我们展示了Jin最新数据集中的四个例子,如图1所示:我能向你抱怨我刚刚收到的咖啡吗?维珍媒体如往常一样充满谎言谎言谎言!!!,这两句话被分为同一类型指控,但显然它们在抱怨的程度上是不同的。另一个例子是,完全不酷请尽快回复我的消息!!!,这两句都被归类为反对,然而,后者明显提出了更强烈的抱怨。

分析不同的抱怨水平是有利的。公司需要定期监控来自用户的反馈,因为某些抱怨可能会严重影响其产品的声誉。组织或政府需要监控民众的抱怨,以了解他们的迫切需求。

02

贡献

1、我们提出一个新颖的工作:即自动捕捉文本中抱怨强度

2、我们展示了第一个中文抱怨强度数据集,包含来自微博平台的3103条数据。

3、通过一系列分析实验进一步证明研究抱怨强度的必要性和重要性,以及一些有趣的实证发现。

4、我们展示了我们的数据集如何帮助预测社交媒体上博文的流行度。

03

数据标注

在这项工作中,我们使用Louviere and Woodworth1991)提出的最佳最差比例法(Best-Worst Scaling, BWS[4]注释了抱怨强度。这种方法通过相互比较,可以比直接评分产生更稳定和细粒度的分数。类似的方法也被广泛应用于计算语言学的各种任务中,例如测量攻击性,亲密度等等。我们通过简单的计数百分比统计最终为每个博文分配抱怨强度评分,范围从-1(最不抱怨)到1(最抱怨)。部分标注结果如图2所示:

部分数据标注结果

04

主实验


我们建立计算模型来预测一个给定博文的抱怨强度,使用SVR,Bidirectional LSTM, BERT, RoBERTa等预训练模型。我们在两种情况下评估模型的性能:(1)混合话题(Mix Hashtag),我们将来自不同话题的微博博文组合在一起;(2)交叉话题(Cross Hashtag),其中训练、开发和测试集的博文与不同的话题分开。我们使用皮尔逊相关性和MSE(均方误差)作为我们所有实验的度量标准。实验结果如图3所示:

用于评估预测抱怨强度的 Pearson系数的和均方误差 (MSE)

05

分析实验


抱怨和情绪之间的差异

我们注意到更强烈的抱怨似乎与消极词汇有关。先前的研究也指出,抱怨可以被视为一个有影响的情感维度[2].我们展示在标准情绪数据集上训练的模型在我们的抱怨强度预测任务中表现情况,如图4所示,使用来自情绪模型的概率分数在我们的抱怨强度预测任务中表现出不错的表现,这表明了抱怨和情绪之间的明确联系。同时在我们的标注语料库上训练的模型优于情绪模型,这证明了我们的工作的必要性。

抱怨强度预测任务中情绪模型和抱怨模型的表现

抱怨可以加强情感分析任务

我们将抱怨分数作为一个附加的特性输入被添加到模型中。从图5中,我们观察到具有抱怨特征的模型比原始模型表现得更好。表明一个简单的附加组件可以提高非神经模型和传统神经模型的情绪分类预测精度,分析抱怨可以有助于二元情感分析任务。

二元情绪预测的结果(显著性测试p-vlaue < 0.01, t-test

06

跨语言分析


我们最新收集的抱怨强度数据集是中文的,而当前现有的数据集包含英文推文。这为我们提供了一个机会来了解在社交媒体上使用中文和英语的人在抱怨上的语言差异。

1)直接和间接抱怨:中文博文中80%为间接抱怨;相反,英文推文91%的都是直接抱怨。

2)策略:图6显示了不同语言的策略有所不同。我们发现,中文使用者更倾向于不补偿策略,而英文使用者最常用的策略是补偿策略。

跨语言分析中不同策略所占百分比。

3)讽刺:10%的中文数据包含讽刺,26%的英文数据包含讽刺。图7展示了词性分析,中文讽刺表达中名词比例最高,其次是动词;而在英文讽刺表达中,动词最多,其次是名词。此外,英语中的形容词和副词比中文的要多。

跨语言分析的POS标签的百分比

07

预测博文流行度


我们设想将抱怨强度分数纳入现有的社交媒体监控系统中,以提高它们的预测准确性,证明了来自我们的计算模型的抱怨强度得分可以帮助估计社交媒体上的帖子流行度。,我们遵循Szabo的流行度计算方法[5],使用早期流行度进行预测的基线,为了显示我们的抱怨分数的有效性,我们添加了抱怨强度作为一个新的术语来估计最终的对数流行度,公式如下所示:

8显示,我们结合了抱怨密度的方法优于基线方法。

8 RMSEMAE的流行度预测

我们还展示了随时间变化的单一话题下的流行度预测,如图9所示。我们观察到,增加了抱怨分数有助于更好地估计发布后的流行度,特别是在早期阶段。这可能是因为抱怨可能会吸引用户的注意力,以便参与讨论,从而提高活动的流行度。

比较实际的博文流行度和对单一话题的流行度预测

08

总结


我们提出了第一个测量文本抱怨强度的研究。我们构建了一个包含3103篇关于抱怨的中国微博文章的语料库,并使用BWS方法标注了抱怨强度评分。然后,我们证明了我们的语料库支持自动计算模型的发展,以准确的抱怨强度预测。此外,我们还研究了抱怨与情绪之间的联系,并对中文和英文之间的抱怨表达进行了跨语言比较。我们最终证明,我们的抱怨强度得分有助于更好地估计社交媒体上的博文的流行度。

09

参考文献


[1]E Olshtain and L Weinbach. 1985. Complaints: A study of speech act behavior among native and non-native speakers of hebrew. the pragmatic perspective.

[2]OO Iyiola and OS Ibidunni. 2013. The relationship between complaints, emotion, anger, and subsequent behavior of customers. IOSR Journal of Humanities and Social Sciences, 17(6):34-41.

[3]Mali Jin and Nikolaos Aletras. 2021. Modeling the severity of complaints in social media. In Proceedings of the 2021 Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies, pages 2264–2274, Online. Association for Computational Linguistics.

[4]Jordan J Louviere and George G Woodworth. 1991. Best-worst scaling: A model for the largest difference judgments. Technical report, Working paper.

[5]Gabor Szabo and Bernardo A Huberman. 2010. Predicting the popularity of online content. Communications of the ACM, 53(8):80–88.



📝论文解读投稿,让你的文章被更多不同背景、不同方向的人看到,不被石沉大海,或许还能增加不少引用的呦~ 投稿加下面微信备注“投稿”即可。

最近文章

COLING'22 | SelfMix:针对带噪数据集的半监督学习方法

ACMMM 2022 | 首个针对跨语言跨模态检索的噪声鲁棒研究工作

ACM MM 2022 Oral  | PRVR: 新的文本到视频跨模态检索子任务




投稿或交流学习,备注:昵称-学校(公司)-方向,进入DL&NLP交流群。
方向有很多:机器学习、深度学习,python,情感分析、意见挖掘、句法分析、机器翻译、人机对话、知识图谱、语音识别等
记得备注~

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
媒体上的美国崩溃论,真能把美国整崩溃?14岁少女看抑郁短视频自杀,英国官方认定:是"社交媒体"杀死了她...比尔盖茨的宝贝女儿晒豪宅和命贵男友,惹社交媒体激烈争吵……没电比死还难受每日原则:区别苍白的抱怨和有助于改进工作的诉求撕开言论管制铁幕后,真正「自由」的社交媒体,会从他的手上诞生吗?澳洲一房主拒绝过万圣节在社交媒体上引发热议!网友:这里不是美国!“我们的祖先到底是谁?为何智人胜出?”丨2022诺奖深入回答了这些问题。附Svante Pääbo趣闻研究发现:爱玩社交媒体的人,离婚风险更大巴黎世家遭“全网炮轰”!广告涉嫌宣扬儿童色情!清空社交媒体后道歉!网友扒出更可怕的事...[电脑] bequiet!SILENT WINGS 4和SILENT WINGS PRO 4风扇开箱测试公众号和社交媒体之外,酒店为什么还要印刷杂志?各种提案接踵而至!TikTok或在美停止运营?未成年人也将被禁用社交媒体,原来 TikTok上的挑战这么危险!《隐入尘烟》的艺术特色及所反映的三农问题EMNLP'22 Findings | 用于多标签少样本方面类别检测的标签驱动去噪框架“床上教学、教吸毒、给学生发5500条色情短信…”纽约变态女教师点燃社交媒体2022 Luxury Listings · Hurun Outstanding American Real EstateDeath of Queen Elizabeth II announced at Buckingham Palace面向社交媒体的多模态属性级情感分析研究周星驰开通首个社交媒体账号,招募Web3人才,并将亲自挑选LG 22'' Class Full HD LED Monitor (21.5'' diagonal)畅游法国(15)-城堡的王冠悲痛|14岁少女被社交媒体杀死!世界首例被官方认定的网络谋杀案!引网络众怒:底线在哪!晨读|端个水槽进推特,马斯克到底要用社交媒体来做什么?古人类DNA与重症新冠有关?2022诺奖得主Pääbo,竟是前诺奖得主私生子校园枪击、阴谋论、逃避约束的社交媒体--十亿美元赔偿金背后的美国悲剧终于出手了!未成年或将禁用社交媒体!中国最新分析:华文社交媒体用户持续增长,但评论量降低过期的年龄 -- 是谁让我忘记了自己的年龄?[干货] 水军、控评、限流...这波社交媒体词语英语咋说?Spotify将推HiFi音频套餐,Kanye收购社交媒体服务Parler,游戏音乐厂商或被AI取代?【小心】社交媒体上散布加拿大移民签证骗局 千万别上当!维州选战加剧,社交媒体成拉票关键!这两大墨尔本华人区,自由党都下了大力气终于出手了!美国未成年或将禁用社交媒体!“第二N号房”事件主犯在澳大利亚被捕;泽连斯基罕见公开批评基辅市长;研究显示美国警察机构社交媒体帖子充斥种族偏见 | 每日大新闻
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。