Redian新闻
>
AI,正在污染中文互联网

AI,正在污染中文互联网

公众号新闻
6.21
知识分子
The Intellectual

图源:pixabay.com

撰文 | 金磊 尚恩 

文章转自:量子位


污染中文互联网,AI成了“罪魁祸首”之一。


事情是这样的。


最近大家不是都热衷于向AI咨询嘛,有位网友就问了Bing这么一个问题:


象鼻山是否有缆车?


Bing也是有问必答,给出了看似挺靠谱的答案:



在给出肯定的答复之后,Bing还贴心地附带上了票价、营业时间等细节信息。


不过这位网友并没有直接采纳答案,而是顺藤摸瓜点开了下方的“参考链接”。



此时网友察觉到了一丝丝的不对劲——这人的回答怎么“机里机气”的。

于是他点开了这位叫“百变人生”的用户主页,猛然发觉,介是个AI啊!



因为这位用户回答问题速度可以说是极快,差不多每1、2分钟就能搞定一个问题。


甚至能在1分钟之内回答2个问题。


在这位网友更为细心的观察之下,发现这些回答的内容都是没经过核实的那种……



并且他认为,这就是导致Bing输出错误答案的原因:


这个AI疯狂地污染中文互联网。


“AI污染源”,不止这一个


那么被网友发现的这位AI用户,现在怎么样了?


从目前结果来看,他已经被被知乎“判处”为禁言状态。



但尽管如此,也有其他网友直言不讳地表示:


不止一个。


若是点开知乎的“等你回答”这个栏目,随机找一个问题,往下拉一拉,确实是能碰到不少“机言机语”的回答。


例如我们在“AI在生活中的应用场景有哪些?”的回答中便找到了一个:



不仅是回答的语言“机言机语”,甚至回答直接打上了“包含AI辅助创作”的标签。


然后如果我们把问题丢给ChatGPT,那么得到回答……嗯,挺换汤不换药的。



事实上,诸如此类的“AI污染源”不止是在这一个平台上有。


就连简单的科普配图这事上,AI也是屡屡犯错。



网友们看完这事也是蚌埠住了:“好家伙,没有一个配图是河蚌”。



甚至各类AI生成的假新闻也是屡见不鲜。


例如前一段时间,便有一则耸人听闻的消息在网上疯传,标题是《郑州鸡排店惊现血案,男子用砖头砸死女子!》。



但事实上,这则新闻是江西男子陈某为吸粉引流,利用ChatGPT生成的。


无独有偶,广东深圳的洪某弟也是通过AI技术,发布过《今晨,甘肃一火车撞上修路工人, 致9人死亡》假新闻。


具体而言,他在全网搜索近几年的社会热点新闻,并使用AI软件对新闻时间、地点等进行修改编辑后,在某些平台赚取关注和流量进行非法牟利。


当然,警方均已对他们采取了刑事强制措施。



但其实这种“AI污染源”的现象不仅仅是在国内存在,在国外亦是如此。程序员问答社区Stack Overflow便是一个例子。


早在去年年底ChatGPT刚火起来的时候,Stack Overflow便突然宣布“临时禁用”。


当时官方给出来的理由是这样的:


(这样做)的目的是减缓使用ChatGPT创建的大量答案流入社区。

因为从ChatGPT得到错误答案的概率太高了!



Stack Overflow进一步阐述了这种现象。


他们认为以前用户回答的问题,都是会有专业知识背景的其他用户浏览,并给出正确与否,相当于是核实过。


但自打ChatGPT出现之后,涌现了大量让人觉得“很对”的答案;而有专业知识背景的用户数量是有限,没法把这些生成的答案都看个遍。


加之ChatGPT回答这些个专业性问题,它的错误率是实实在在摆在那里的;因此Stack Overflow才选择了禁用。


一言蔽之,AI污染了社区环境。


而且像在美版贴吧Reddit上,也是充斥着较多的ChatGPT板块、话题:



许多用户在这种栏目之下会提出各式各样的问题,ChatGPT bot也是有问必答。


不过,还是老问题,答案的准确性如何,就不得而知了。


但这种现象背后,其实还隐藏着更大的隐患。


滥用AI,也毁了AI


AI模型获得大量互联网数据,却无法很好地辨别信息的真实性和可信度。

结果就是,我们不得不面对一大堆快速生成的低质量内容,让人眼花缭乱,头晕目眩。


很难想象ChatGPT这些大模型如果用这种数据训练,结果会是啥样……



而如此滥用AI,反过来也是一种自噬。


最近,英国和加拿大的研究人员在arXiv上发表了一篇题目为《The Curse of Recursion: Training on Generated Data Makes Models Forget》的论文。



探讨了现在AI生成内容污染互联网的现状,然后公布了一项令人担忧的发现,使用模型生成的内容训练其他模型,会导致结果模型出现不可逆的缺陷。


这种AI生成数据的“污染”会导致模型对现实的认知产生扭曲,未来通过抓取互联网数据来训练模型会变得更加困难。


论文作者,剑桥大学和爱丁堡大学安全工程教授Ross Anderson毫不避讳的直言:


正如我们用塑料垃圾布满了海洋,用二氧化碳填满了大气层,我们即将用废话填满互联网。


对于虚假信息满天飞的情况,Google Brain的高级研究科学家达芙妮 · 伊波利托(Daphne Ippolito)表示:想在未来找到高质量且未被AI训练的数据,将难上加难。



假如满屏都是这种无营养的劣质信息,如此循环往复,那以后AI就没有数据训练,输出的结果还有啥意义呢。



基于这种状况,大胆设想一下。一个成长于垃圾、虚假数据环境中的AI,在进化成人前,可能就先被拟合成一个“智障机器人”、一个心理扭曲的心理智障。



就像1996年的科幻喜剧电影《丈夫一箩筐》,影片讲述了一个普通人克隆自己,然后又克隆克隆人,每一次克隆都导致克隆人的智力水平呈指数下降,愚蠢程度增加。


那个时候,我们可能将不得不面临一个荒谬困境:人类创造了具有惊人能力的AI,而它却塞满了无聊愚蠢的信息。


如果AI被喂进的只是虚假的垃圾数据,我们又能期待它们创造出什么样的内容呢?


假如时间到那个时候,我们大概都会怀念过去,向那些真正的人类智慧致敬吧。


话虽如此,但也不全坏消息。比如部分内容平台已开始关注AI生成低劣内容的问题,并推出相关规定加以限制。


一些个AI公司也开始搞能鉴别AI生成内容的技术,以减少AI虚假、垃圾信息的爆炸。



(本文经量子位(公众号 ID: QbitAI)授权转载,转载请联系出处。)


参考链接:
[1]https://www.v2ex.com/t/948487

[2]https://twitter.com/oran_ge/status/1669160826186633219
[3]https://www.qbitai.com/2022/12/40167.html
[4]https://arxiv.org/abs/2305.17493v2
[5]https://albertoromgar.medium.com/generative-ai-could-pollute-the-internet-to-death-fb84befac250
[6]https://futurism.com/ai-generates-fake-news


微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
天涯不再是天涯,互联网也不再是互联网她是性饥渴:就要躺平任人看让韩国人沉沦的MBTI,已经快统治中文互联网了《梦里花》“疯狂污染中文互联网”的,并不是AI体验了联网+插件大升级后的ChatGPT,我找到了未来互联网的新入口苏州设立互联网法庭,实行互联网案件集中管辖牛文文:中国正在加速形成互联网3.0创新生态让韩国人沉沦的MBTI,已经快统治中文互联网了。让韩国人沉沦的MBTI,已经快统治中文互联网了……去海边玩注意高污染警告标志!受粪便细菌污染 加州10大最脏海滩 5个在圣马刁县马萨诸塞州本周第四次发布空气污染警报!这样的污染要持续多久?【2023数智产业系列榜单】中国工业互联网领军企业榜发布!搭上工业互联网高速列车,加速推进转型升级日本核废水,57天污染半个太平洋,10年后将污染全球海域!相互给力 携手互联 ——牛顿中文学校支教团队参加话剧《互联》莱镇演出是谁在污名化“人民群众”?硬核观察 #1045 人工智能正在扼杀旧互联网没有互联网时代,只有时代中的互联网打造产业互联网高地 | 2023年琶洲产业互联网峰会圆满落幕北极光纤切断阿拉斯加部分地区后 卫星互联网正在发展天涯社区,关于中文互联网的一段传奇AI,正在疯狂污染中文互联网纽约华人小心!加拿大山火浓烟吹向美国,今天污染最严重,13个州发出空气污染警告传说中的塑料污染终结者,可能会造成更严重的污染加国野火复发 出动军队! 美国8州发空气污染警报!雾霾天又来......污染指数超100!西方“最强”物联网模组商出售车联网业务、高通投资模组创业企业,海外蜂窝物联网模组市场又有新的变动工信部重磅,5G工厂要来了!工业互联网处快速成长期,5G+工业互联网概念股名单出炉疯狂污染互联网,人类比 AI 擅长多了紧急召回!华人别再买!可能存在污染!会导致流产和死产工业互联网平台疯狂内卷?生成式AI在工业遇冷?一文看懂2023年中国工业互联网产业最新洞察《背叛情歌》互联网问诊祛魅,AI正在模仿世界上最好的医生(英譯)普洛米修士受难的一日 - 林昭为了你走遍草原 第九章工业互联网标识建设是星火燎原的工程【智次方产业专访|工业互联网篇】
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。