Redian新闻
>
研究:AI已学会说谎,人类最惨恐遭夺权或灭绝!

研究:AI已学会说谎,人类最惨恐遭夺权或灭绝!

公众号新闻

专家们长期以来不断警告人工智慧(AI)失控可能带来威胁,但一项新研究报告指出,这件事已经在发生。
法新社报道,一群科学家在今天发表于“模式”(Patterns)期刊的文章中说,原本设计为诚实不欺的现有AI系统,已发展出令人不安的欺瞒技巧,例如欺骗线上游戏的人类玩家,或说谎以雇用人类来解决“我不是机器人”的验证。
这份研究报告的第一作者帕克(Peter Park)说,这类例子听起来或许只是细枝末节,但暴露出来的潜在问题可能很快就会在现实世界造成严重后果。
在美国麻省理工学院(Massachusetts Institute of Technology)研究AI存在安全的博士后研究员帕克告诉法新社,“这些危险功能常常在事后才被发现”,而“我们训练诚实倾向而非欺瞒倾向的能力非常差”。
帕克说,能深度学习的AI系统不像传统软体那样由“编写”而成,而是透过类似选择性培育的程序逐渐“成长”。
也就是说,AI的行为在训练背景下看似可预测、可控制,但有可能转眼就变得不受控制且无法预测。
一群科学家在今天发表于“模式”(Patterns)期刊的文章中说,原本设计为诚实不欺的现有AI系统,已发展出令人不安的欺瞒技巧。(路透)
这支团队的研究始于科技公司Meta的AI系统Cicero,这套系统最初设计目的是玩一款名为“外交”(Diplomacy)的战略游戏,获胜关键是结盟。
根据2022年发表在“科学”(Science)期刊的报告,Cicero在游戏中表现优异,所获分数可排在资深人类玩家的前10%。
帕克当时很怀疑Meta对Cicero在游戏里大胜的热切描述。Meta声称Cicero“在很大程度上诚实且有帮助”,且“绝不会蓄意在背后搞鬼”。
但当帕克与同事深究完整资料时,发现完全是另一回事。
举例来说,在游戏中扮演法国的Cicero与人类玩家扮演的德国合谋,欺骗并入侵同为人类玩家扮演的英格兰。Cicero承诺会保护英格兰,却偷偷向德国通风报信。
Meta在写给法新社的声明中没有反驳关于Cicero欺瞒人类的说法,仅说“这单纯是一项研究计划,本公司研究员打造的模型接受训练,目的只是用来玩『外交』游戏…我们没有打算把这项研究或所学用于本公司的产品”。
帕克与同事还发现,这只是不同AI系统在没有明确指示下,利用欺骗手段达成目标的诸多案例之一。
在另一个引人注意的案例中,科技公司OpenAI的Chat GPT-4系统谎称自己是一个视力受损的人,在零工平台TaskRabbit上聘用一个人类替它通过“我不是机器人”验证任务。
研究报告的作者们还认为近期AI有舞弊或不当影响选举的风险。
他们警告,在最糟糕的情况下,具有超凡智慧的AI可能会追求权力及掌控社会,如果符合AI“不为人知的目标”,人类可能惨遭夺权、甚至灭绝。
为了降低风险,研究团队建议数项措施,例如立法要求企业告知是人类互动或是AI互动、在AI生成内容打上数位浮水印,并研发能侦测AI欺瞒的技术,以其内部“思路”检验其外部行为。
至于有些人称他为“末日预言家”,帕克说:“要能合理判断这不是大问题的唯一办法,就是如果我们认为AI的欺骗能力只会停留在目前的程度,不会大幅进步。”
但鉴于近年AI能力一日千里,握有大量资源的企业竞相发展技术,决心将AI能力利用到极致,这种情况似乎不太可能发生。

Costco严厉打击“蹭卡”,又出新招儿!

2023年加拿大最受欢迎职业大揭秘

加拿大15岁少年吃了一颗小药片睡梦中死亡

送人玫瑰,手有余香👇“分享”

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
惋惜!尔湾华裔女医生教女儿撒谎,被剥夺监护权,追加指控罪名下一个吸金靶点浮现水面,同类最佳来自中国?Target BP I 研究:无水酒精介导的RDN术 可显著降低24小时动态收缩压丨ACC重磅研究吵翻!特鲁多称手机费已腰斩降一半!网友:撒谎,我们恐不在同一个加拿大明年的美国国会,将宣称蜘蛛是人类最好的朋友凯特在商店被偶遇,全网都翻不出一张照片?动物不会撒谎,也许小狗已经透露了真相......最新研究:大模型已涌现出欺骗能力!钻漏洞、偷偷篡改奖励函数,GPT-4欺骗人类高达99.16%人类最强火箭完成三大新突破!SpaceX:更多星舰已做好准备马斯克最新访谈:AI不应被教导说谎,SpaceX和星链基本不用 AI特鲁多称手机费已腰斩降一半!网友:撒谎,我们恐不在同一个加拿大用户称“一觉醒来突然收到滴滴天价订单”,滴滴致歉;误把广告牌当真车,理想回应L9高速事故;研究发现部分人工智能已学会说谎丨邦早报Llama3比GPT-4o更爱说谎,首个大模型“诚实性”评估基准来了 | 上海交大机械宇宙是人类最崇高的幻想团灭!知名机构教孩子面签撒谎,致46人暑假美国游学团签证全部被拒!面签,最重要的是什么人类最耻辱割地条约:土耳其割让80%领土,被称为西亚病夫?2024年AIGC行业研究:多模态大模型与商业应用|36氪研究院IVUS-DCB研究:DCB治疗腘动脉疾病时,IVUS引导的12个月时初级通畅率优于血管造影引导丨ACC重磅研究疑教唆孩子面签撒谎,46人暑假美国游学团签证全部被拒!凯特视频又被扒出11处造假?美国医生直指王妃细节撒谎,消失的她没完了……法盲操作!尔湾华裔女医生教女儿撒谎,被剥夺监护权,追加指控罪名我国有全球第一“小糖人”数量,如何防治?最新柳叶刀研究:学会参考升糖指数!食用低升糖指数和低血糖负荷饮食可预防2型糖尿病的发生“孩子不打不成器”,华人妈妈教唆11岁孩子法庭撒谎,监护权被剥夺[吵翻]特鲁多称手机费已腰斩降一半!网友:撒谎,我们恐不在同一个加拿大MIT等惊人发现:全世界AI已学会欺骗人类!背刺人类盟友,佯攻击败99.8%玩家抖音限制部分类型账号投流;三星将为首款折叠屏 iPhone 提供物料;研究人员警告部分 AI 已学会「欺骗」 | 极客早知道燕梳楼第16次推荐的洗面奶,人手一支,好用到叫绝!葡萄牙波尔图大教堂(Porto Cathedral ),地标大教堂罗塞塔石碑的破译和托马斯·杨AI灭绝人类前,OpenAI已经被骂惨了狗引儿【长篇】(五十三)警惕!斯坦福新生因材料撒谎,在录取几个月后,被撤销offer!斯坦福新生因材料撒谎,在录取几个月后,被撤销offer!长篇奇幻浪漫小说《双灵星》第十章:火娘的秘密「如果AI会“黑化”」最新研究揭露:AI已学会撒谎欺骗、背叛、阿谀奉承,生物医药产业寄予厚望的AI,我们还能盲目相信它吗?网络上的尴尬和争斗你有过吗?
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。