话媒视点(78)|算法推荐问题及其伦理反思
新闻传播伦理与法规课程的教学实践活动
01
算法推荐概述
关于“算法推荐”,下面将从政策界定、内容分发、内在逻辑三个视角来解释。
1.1 政策界定
国家相关部门出台的一些政策法规对算法推荐进行了定义,以2021年12月31日出台的《互联网信息服务算法推荐管理规定》(第一章第二条)[1]为例:
算法推荐服务:应用算法推荐技术提供互联网信息服务。
算法推荐技术:是指利用生成合成类、个性化推送类、排序精选类、检索过滤类、调度决策类等算法技术向用户提供信息。
(《互联网信息服务算法推荐管理规定》第一章第二条规定:在中华人民共和国境内应用算法推荐技术提供互联网信息服务(以下简称算法推荐服务),适用本规定。法律、行政法规另有规定的,依照其规定。前款所称应用算法推荐技术,是指利用生成合成类、个性化推送类、排序精选类、检索过滤类、调度决策类等算法技术向用户提供信息。)
1.2 内容分发
“算法推荐”也是一种内容分发模式。内容分发的模式经历了以下三个阶段的发展[2]:
编辑分发模式———即传统媒体通过人工编辑来对新闻进行专业判断与把关。
社交分发模式———即社交媒体兴起背景下,基于用户所嵌入的社会关系网络来实现资讯的分发与传播。
算法分发模式———即运用算法技术,基于每个用户内容消费的行为数据(用户在app上的浏览、点击、停留时长、转发、评论,以及订阅、搜索等)、个体属性数据(用户性别、年龄、手机型号等)与社交关系数据(用户社交媒体账号所关注的对象、所参与的话题和发表的内容等)进行大数据计算与分析,实现精准的用户“画像”,进而推送“懂你”的信息。
从内容分发的视角来看,我们所说的“算法推荐”指的就是“算法分发模式”。
1.3 内在逻辑
在内容分发这一环节,算法分发模式运用的是“算法技术”,也就是推荐算法。推荐算法,是利用用户的一些行为,通过一些数学算法,推测出用户可能喜欢的东西。根据设计理念的不同,推荐算法可以分为以下几类:[3]
基于内容的推荐算法:
关注内容的相似度;
基于协同过滤的推荐算法:
对用户进行分类,把同类用户感兴趣的内容推给对应用户;
基于关联规则的推荐算法:
常用于商品销售,买了东西后推荐用户还可能需要的东西,例如买了牛奶就可能给用户推荐面包,买了婴儿奶粉就可能给用户推荐纸尿裤;
基于效用的推荐算法:
考察用户使用项目的效用情况,其核心问题是怎样为每一个用户创建一个效用函数,用户资料模型很大程度上是由系统所采用的效用函数决定的;
基于知识的推荐算法:
可以看作是一种推理技术,需要以知识结构为基础。
由于各种推荐方法都有优缺点,所以在实际应用中,组合推荐算法最常被采用,内容推荐算法和协同过滤推荐算法又是最受欢迎的组合。
02
算法推荐的研究现状
虽然大众对“算法推荐”已经耳熟能详,但这个词汇的使用历史仅有十年。
“算法推荐”这个词汇的使用与“今日头条”APP是有关的。“今日头条”在2012年上线,而国内与“算法推荐”有关的研究从2013年才多起来。今日头条是国内较早使用算法推荐来提供资讯服务的应用。在此之前,腾讯新闻等资讯应用是固定内容列表的,刷新的时候只是检索有没有新发布的内容;而现在用户使用的新闻APP的信息流设计都类似于今日头条,每次刷新都有根据用户的喜好推荐的新内容。
比“算法推荐”的研究出现得更早的,是“推荐算法”。早在2000年,便已有不少推荐算法方面的研究,并随着互联网技术的发展不断增长。这些研究关注的是“算法”本身,也就是计算机科学方向的研究。[4]但在2013年,随着今日头条爆火,推荐算法被广泛应用,其带来的各种问题也就进入了研究者和社会公众的视野。“推荐算法”的概念被延伸到“算法推荐”,推荐成为中心词,向社会科学领域延伸。与“算法推荐”一同被提及的还有“信息茧房”等词。
总的来说,推荐算法的研究最早关注的是算法问题,和计算机科学有关;算法推荐则是推荐算法被应用后才出现的词汇,关注的是推荐的问题,主要用于社会科学领域。
有趣的是,新闻传播学类的学者较其他社会科学领域的学者更为关注“算法推荐”话题。算法推荐相关发文量较高的机构中,清华大学新闻与传播学院高居榜首。
算法推荐流程中涉及到的技术细节很多,而且不同应用有不同的算法,采用的流程模式也不完全一致。今日头条发布的视频阐释了其推荐算法规则与流程,也有对今日头条推荐算法更详细的介绍。
https://mp.weixin.qq.com/s/h6Mt1POW30rdvcwhIuqrVA(视频)
03
算法推荐引发的伦理问题
3.1 算法工程师未能充分考量传播伦理问题
在大数据时代,算法无论如何应用,在其被设计出来的那一刻起,就已经具备了控制偏向。这种控制偏向表现为算法没有向用户提供无限的选择,它窄化了可供用户选择的范围。技术承载着人的价值观念,算法工程师在某种程度上预设了算法的价值走向,从而影响着整个社会的资讯传播生态,他们成为算法价值的决定者和伦理责任承担者,并掌握着“黑箱”的关键钥匙,有机会行善或作恶,甚至影响他人行善或作恶[5]。
作为引领算法价值走向的关键人物,算法工程师并没有对算法在新闻传播领域引发的伦理问题有太多深入了解。对改进算法以解决算法伦理问题,算法工程师也没有非常高的积极性。不少算法工程师并不认为现阶段的算法引发了严重的伦理道德问题,这与当下各界对算法的反思氛围不相符。从某种程度上来说,虽然算法工程师已经进入到了新闻业务之中,成为促动新闻传媒业改革的关键人物,但是却未能进行准确的自我定位,职业角色上仍游离于新闻传播领域之外[6]。
3.2 算法成为传播规则引发的低质量内容泛滥
算法推荐倒逼内容生产者去适应算法,从而导致新闻生产准则的变化。新闻生产的准则不再是新闻道德等的约束,而是算法机制,从而导致“算法/流量至上”问题的出现,新闻工作者所生产的内容的新闻性弱化,倾向算法喜好,不可避免地造成新闻价值和公共道德上的“滑坡”。
在作为规则的算法的影响下,深度报道和优质内容的生存空间被不断挤压。算法推荐抓住用户情绪宣泄的心理,不断推送迎合用户的信息,优先提供或重点推送特定来源、特定立场甚至虚假伪造的内容,导致人们接收到的是局部、片面甚至失实的信息[7],这无疑鼓励了低质量内容的生产;此外,标题党问题也变得更加严重。在经济利益的驱使下,为吸引用户的点击,内容生产主体会以算法的工作机制作为参考,在内容中加入热点词汇,使内容更符合算法的判断标准,更易被推送给更多的用户[8]。一些报道充分利用用户的猎奇心理,用各种夸张、失实甚至是惊悚的标题来换取流量和点击量,导致新闻价值导向的偏离。
例:
下面是我们在互联网上搜集到的标题党案例。
第一篇文章的标题声称解决了三个问题便可以彻底解决台湾问题,给读者一种解决台湾问题易如反掌的感觉,吸引读者点击阅读。
第二篇文章的标题的表意不明,构建了“二次感染”与张文宏医生间利益关系的隐喻,而事实却并非如此。这种标题不仅不尊重事实,也涉嫌侵犯公众人物的名誉权。
第三篇文章的标题使用“紧急提醒”“当心”等词语,营造焦虑不安的情绪氛围,吸引读者点击阅读;但实际上这篇文章所谓的“当心”是指当心今天要下雨,记得带伞。
3.3 算法推荐下的假信息问题
虚假新闻会被当作事实来源,通过算法推荐给可能对该新闻感兴趣的用户,并会使新闻失实的影响进一步扩大。
例如,2019年6月,今日头条上认证为“龙视新闻法制频道”的“中国车视”账号发布内容《「中国车视」通告|公安部最新通告:8月 1日起车牌绑定驾照,消分“实名制”》。其称:为治理消分乱象,有关部门推出了新的消分规则。这一内容在今日头条上被大量推送并被腾讯网等媒体平台转载,引起了广大网友的关注。但很快,公安部交通管理局就辟谣称:此消息为假新闻。
当前失实新闻广泛传播的事件可能会因新闻客户端应用算法推荐而变得更加频繁。这是由于算法是基于概率的相关性来做出决策的,与人类擅长的因果决策模式在逻辑上并不相同。为了打击假信息,Facebook与一些媒体机构合作,包括国际事实核查网络组织等。同时,Facebook也声称,他们进一步更新了算法,设计了一套“实施审核”算法,可以标注出可疑消息并对消息进行降权处理。然而,有学者认为,观点和假新闻之间的界限是相对模糊的,如果仅用算法进行简单粗暴的过滤,很可能会伤害言论自由。Facebook的举措是一次布莱恩阿瑟所描述的“技术的自我循环”,因为有未解决的老问题,所以才研发新技术去克服弊端,而新技术的出现又引起了新问题,那么新问题的解决又要诉诸于更新的技术,以此循环,陷入黑洞。[9]
3.4 算法推荐侵害用户的隐私安全
“不伤害”原则作为伦理学领域的底线伦理原则,要求人们在做出行为时要考虑其行为对他人的伤害以及避免自身行为为他人带来伤害的后果。为了能够向用户提供个性化的新闻推送,新闻客户端需要不断获取用户数据,但这使得用户的隐私安全在一定程度上受到侵害。例如,2019年6月,就有用户因隐私权被侵犯而对今日头条提起了诉讼;2019年9月,今日头条又因涉嫌过度收集用户隐私被国家计算机病毒中心点名。在算法推荐的背后,新闻客户端会掌握用户在各种媒介上对信息的每一次浏览、评论等行为的数据,并将其用来塑造用户的个人标签。[10]
机器学习和人工智能的发展,使算法技术能更便捷地收集来自个体的“信息碎片”,形成关于个人特征和行为倾向的量化评估。这些生成性信息的分析、评价乃至预测,会描画出个体某个方面的记录及行为可能性,比如是否具有暴力倾向,是否容易罹患某种疾病。[11]这些与隐私高度相关的敏感数据,又可能存在诸多不当处置,使用户容易被人追踪搜寻、被人控制,成为广告商和政治组织猎取的对象。
3.5 算法推荐带来的歧视与偏见问题
除了信息安全问题,算法给用户带来的还有歧视与偏见的加剧。很多算法问题不是由程序和代码带来的,而是来自其设计思路所带有的结构性的偏见与歧视。归其本质,还是由数字媒体的经济与商业模式决定的。[12]每个人所接受到的信息都被赋予了不同的权重,在算法技术构造的“信息茧房”中,有些信息总能看到,而另一些则永远也看不到。个性化推送将用户置于一个“回音室”中,使原本固有的、熟悉的声音不断得到强化和重复,而更多元的信息则被过滤泡过滤,阻隔于用户的推荐页以外。由此,用户的视野不断被狭窄化,同质化,甚至被引导向极端的偏激,也就是“群体的极化”。
04
结语
算法推荐所引发的争议性问题,需要我们认真对待。算法设计者应对算法技术执行过程中可能出现的问题提供应急方案,使得算法在产生问题时可以被及时纠偏,从而实现算法推荐下新闻价值的回归。新闻工作者应该培育正确的道德观念、行为规范和道德品质,在新闻生产中主动承担其应负有的社会责任和义务,生产出符合新闻要求的高质量内容。
算法作为一种规则还有待完善,在考察内容时不能只进行单向度的考察,而应该综合多个指标进行评判,指向社会共同认可的公序良俗、公共道德。平台应该提升算法的透明性。算法作为各大互联网平台的核心竞争力,诚然具有巨大的商业价值,是平台的核心资产;但是算法又具有公共意义,调节着信息内容的分发,其应该对公众足够透明。具体而言,算法的一些指标应该是清晰明了的,平台应该根据用户的理解能力解释算法的规则;社会公众可以对算法的调整提出建议,并且起到监督作用。
《算法推荐问题及其伦理反思》是华中科技大学新闻与信息传播学院刘彦宏、马妍、钟颖、张娴芸四位同学在《新闻传播伦理与法制》任课老师牛静的指导下完成的话题探讨。《新闻传播伦理与法制》这门课程由牛静、周婷婷、王昀、徐迪、刘锐五位老师组成的教师组共同讲授。这是华中科技大学校级本科专题教学研究项目《基于本科生创新思维培养的教学方法研究——以新闻传播理论课的改革为实践对象》的教学实践成果。
参考文献
[1]互联网信息服务算法推荐管理规定.[EB/OL]. https://www.samr.gov.cn/xw/mtjj/202201/t20220104_338828.html,摘录于2023年4月。
[2]张志安,汤敏.论算法推荐对主流意识形态传播的影响[J].社会科学战线, 2018, (10): 174-182+2.
[3]科普中国.推荐算法[EB/OL].
https://www.kepuchina.cn/article/articleinfo?business_type=100&classify=1&ar_id=362313,摘录于2023年4月。
[4]百度学术.[EB/OL]https://xueshu.baidu.com/,摘录于2023年4月。
[5]袁帆,严三九.模糊的算法伦理水平——基于传媒业269名算法工程师的实证研究[J].新闻大学,2020,No.169(05):112-124+129.
[6]严三九,袁帆.局内的外人:新闻传播领域算法工程师的伦理责任考察[J].现代传播(中国传媒大学学报),2019,41(09):1-5+12.
[7]徐明华,魏子瑶.算法伦理的治理新范式:算法审计的兴起、发展与未来[J].当代传播,2023,No.228(01):80-86.
[8]周依儒.算法“把关”机制下新闻价值要素的变化[J].声屏世界,2021,No.485(08):21-22.
[9]陈昌凤,霍婕.权力迁移与人本精神:算法式新闻分发的技术伦理[J].新闻与写作,2018(01):63-66.
[10]刘斌.新闻客户端算法推荐的伦理困境及解决思路——以今日头条为例[J].新闻传播,2022(16):34-36+39.
[11]莫雅娴.算法推荐新闻与个人信息保护的冲突和平衡[J].编辑学刊,2019,(5): 40-45
[12]赵双阁,岳梦怡.新闻的“量化转型”:算法推荐对媒介伦理的挑战与应对[J].当代传播,2018,(4): 52-56
撰文:刘彦宏、马妍、钟颖、张娴芸
排版:李早
审校:牛静、李早
微信扫码关注该文公众号作者