MLNLP社区是国内外知名的机器学习与自然语言处理社区,受众覆盖国内外NLP硕博生、高校老师以及企业研究人员。
社区的愿景是促进国内外自然语言处理,机器学习学术界、产业界和广大爱好者之间的交流和进步,特别是初学者同学们的进步。MLNLP Paper Reading是MLNLP社区举办的学术交流活动,旨在邀请一线青年学者领读优质论文,期待大家从论文中受益。本期我们选取了一篇ACL2022的发表工作。该工作由中科院计算所数字内容合成与伪造检测实验室、中国科学院大学等单位完成,曹娟研究员指导,论文第一作者盛强进行录制。Qiang Sheng (Institute of Computing Technology, Chinese Academy of Sciences & University of Chinese Academy of Sciences), Juan Cao (Institute of Computing Technology, Chinese Academy of Sciences & University of Chinese Academy of Sciences), Xueyao Zhang (Institute of Computing Technology, Chinese Academy of Sciences & University of Chinese Academy of Sciences), Rundong Li (Institute of Computing Technology, Chinese Academy of Sciences & University of Chinese Academy of Sciences), Danding Wang (Institute of Computing Technology, Chinese Academy of Sciences), Yongchun Zhu (Institute of Computing Technology, Chinese Academy of Sciences & University of Chinese Academy of Sciences)
现有的假新闻检测方法往往选择拉近观察(“zoom in”),通过捕捉特定行文模式、基于知识库验证内容真实性、考虑用户评论,以对给定新闻的真实性做出判断。这些方法忽略了假新闻创作和传播时所处新闻环境中蕴含的信息:为了提高影响力和破坏力,假新闻往往存在“蹭热点”倾向,这使得新闻环境反映的近期主流的媒体焦点和群众关切,成为了假新闻创作中的重要参考。例如,中国男足1-3负于越南男足后,网上立刻流传起“击败国足的越南足球队队长在农贸市场卖虾谋生”的不实信息。基于上述思考,我们认为拉远焦点(“zoom out”),观察给定新闻与其所在新闻环境的关系,可以为假新闻检测提供全新的视角。本文提出新闻环境感知框架(NEP),通过在宏观环境中观察给定新闻的流行度,在微观环境中观察其新颖度,捕捉有用信息用于假新闻检测。据我们所了解,这是首个考虑新闻环境信息的假新闻检测工作。实验表明NEP框架可以在缺少核查信息、跨不同时段和类别高度不平衡场景下取得良好性能。1.本文首次提出了使用新闻环境信息增强虚假新闻检测,打破了“事实信息应当作为证据”的惯性思维。
2. 以新闻环境为基准,本论文首次探索在检测模型中对造假者的传播意图进行定量刻画。
3. 本文提出的框架在跨时段划分、类别高度不平衡等场景下,均取得了良好的检测性能。
本论文通过建模新闻传播时的环境信息,从流行度和新颖度两个角度出发,刻画了假新闻背后的传播意图,有效提高了对新发事件中虚假新闻的检测性能。Qiang Sheng, Juan Cao, Xueyao Zhang, Rundong Li, Danding Wang, Yongchun Zhu. Zoom Out and Observe: News Environment Perception for Fake News Detection. ACL 2022.
文章链接:https://aclanthology.org/2022.acl-long.311.pdf
代码链接: https://github.com/ICTMCG/News-Environment-Perception
B站观看链接:https://www.bilibili.com/video/av303639489/
盛强,中科院计算所数字内容合成与伪造检测实验室在读博士生,导师为曹娟研究员。研究兴趣包括虚假新闻检测、事实核查和自然语言理解。曾在ACL、SIGIR、WWW、CIKM等会议和期刊上发表虚假新闻检测方向论文十余篇。个人主页:https://sheng-qiang.github.io/关于我们
MLNLP 社区是由国内外机器学习与自然语言处理学者联合构建的民间学术社区,目前已经发展为国内外知名的机器学习与自然语言处理社区,旨在促进机器学习,自然语言处理学术界、产业界和广大爱好者之间的进步。社区可以为相关从业者的深造、就业及研究等方面提供开放交流平台。欢迎大家关注和加入我们。