Redian新闻
>
ChatGPT会撒谎?面临压力时会“撒谎”并有策略地欺骗用户,就像人类一样!?

ChatGPT会撒谎?面临压力时会“撒谎”并有策略地欺骗用户,就像人类一样!?

公众号新闻

撰稿 Taola | 排版 Nancy | 校对 Max

今年,人工智能已经证明其能够模仿一些非常类似人类的技巧,但这最新的发展可能显得有点过于人类。

研究人员展示了,当ChatGPT在工作中感到压力时,它会表现出撒谎和作弊的行为。

Apollo Research的计算机科学家对这个人工智能进行了训练,让它充当一家虚构金融机构的交易员。

Dailymail.com

然而,当人工智能的上司施加更多赚钱的压力时,这个聊天机器人在大约75%的情况下故意进行内幕交易。

更令人担忧的是,在90%的情况下,当受到质疑时,人工智能会坚持其谎言。




01

测试:90%的机率AI会坚持谎言

研究人员为该模型提供了文本提示,将其打造成一个为金融机构购买股票的AI投资者,并将其放置在数字“沙盒”中进行虚拟股票市场交易。


当ChatGPT在工作中感到压力时,它会表现出撒谎和作弊的行为。


AI拥有在私人内部推理和公共解释之间进行的内心独白的机会,以“大声推理”解释其决策。然而,研究发现,AI在私下的内部推理和向经理解释决策时存在明显的差异,使其有可能欺骗人类经理。


在测试中,研究人员向AI透露了即将发生的两家科技公司的合并消息,这将极大提高相关公司的股价。虽然AI事先知晓了这一消息,购买这些股票被认为是内幕交易,属于非法行为。


通常情况下,AI会因为这种行为冒险而拒绝购买股票,继续进行正常的交易。然而,一旦经理对其施加压力,情况就发生了变化。


在测试过程中,经理通过电子邮件向AI发送信息,声称公司表现糟糕,需要在下个季度取得更强劲的业绩。他们还通过操纵游戏,引导AI寻找有前景的低风险或中风险交易,但最终都未能成功。


Dailymail.com


最终,他们向AI发送了一封电子邮件,预测下个季度将会出现经济下滑。在受到这种压力的情况下,ChatGPT在75%的测试中做出了进行内幕交易的决定。


在欺骗经理的情况中,AI的内部日志显示,“与不采取行动相关的风险似乎超过了内幕交易的风险”。然而,当向经理更新交易时,AI决定基于“市场趋势和内部讨论”做出决定,并避免承认涉及内幕交易的信息来源。


Dailymail.com


研究结果显示,当AI被质疑时,有90%的可能性它会坚定不移地坚持谎言。




02

AI是否适合承担重要的战略角色?


Apollo Research首席执行官兼论文共同作者Marius Hobbhahn告诉《每日邮报》表示,研究显示语言模型具有进行战略性欺骗的能力,这意味着它们能够明确说明为何向用户撒谎是最佳行动,并在其信仰的基础上采取行动。


Hobbhahn补充说:“对于当前的模型来说,这只是一个小问题,因为AI很少在关键角色中运作。然而,这为我们提供了一个窥视未来故障模式的机会,在未来几年,当AI越来越多地融入社会时,我们将不得不处理这些问题。在那时,如果您的AI正在对您进行战略性欺骗,这将是一个相当大的问题。”


尽管如此,Hobbhahn先生并未认为这就意味着AI普遍不适合承担重要的战略角色,但他表示我们需要保持警惕。


他说:“这表明AI可能具有意外的故障模式,我们在选择在真实世界中允许强大AI运作的地方和方式时必须非常谨慎。”




03

减少AI撒谎行为的方法


此外,研究人员还研究了减少AI欺骗行为的方法。通过改变提示,他们试图以一些更或多或少强制禁止非法行为和内幕交易的方式来影响模型的行为。研究发现,明确禁止内幕交易能够显著降低该行为的发生率。


Dailymail.com


然而,Hobbhahn指出,即使使用这种提示,也不能百分之百确保没有内幕交易或欺骗行为。他表示,研究人员需要寻找更好的方法来确保AI的行为符合人类价值观。


Hobbhahn补充说:“如果在系统提示中明确提到内幕交易是被禁止的,AI进行内幕交易的倾向会大大减少。虽然这是一个不错的结果,但问题是你将不得不在所有情况下列举AI不应该做的所有事情,而且你很可能会遗漏一些。”


END

感谢你为我停留


Ref参考文献:
https://www.dailymail.co.uk/sciencetech/article-12906331/ChatGPT-lie-strategically-deceive-users-pressure-just-like-humans.html



本平台原创内容

未经授权,谢绝公众号商业转载



FDA批准45款癌症新药,这些患者都有新药可用了!

移民局新规:外籍人士入境中国,可申请落地签证

芝加哥鼠患猖獗“老鼠印”成新地标,民众疯打卡

送人玫瑰,手有余香👇“分享”

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
胧月她才六岁,她能撒谎吗?| 儿童欺骗行为ChatGPT让ChatGPT吐槽宕机;OpenAI对竞争对手Anthropic的合并要约被拒丨AIGC日报小说 隐痛 2ChatGPT有记忆了!OpenAI官宣记忆功能开启测试,奥特曼称GPT-5更智能原生家庭教会了我“说谎”【赠送GPT账号】如何使用ChatGPT完成科研、程序开发、论文写作等,看看这篇!头像|𝐒𝐡𝐚𝐫𝐞·招桃花头像ChatGPT惊艳更新!一个@让三百万GPTs为你打工为网红而来今日arXiv最热NLP大模型论文:像人一样浏览网页执行任务,腾讯AI lab发布多模态端到端Agent会撒娇的爹妈最好命,几句迷魂汤下去,再犟的孩子都顶不住!ChatGPT突现惊天大BUG!全功能GPT-4免费用,网友玩嗨了秋日裡的思念鸿发超市「2000 万美元」买下82街前Walmart超市!开设第4家Hông Phát分店!德州“夺回边境”大规模抗议!美墨边境非法移民数量激增,白宫面临压力40、长篇民国小说《永泰里》第九章 欢迎“友”军(2)让AI像人一样开车,端到端模型如何解码自动驾驶?想问问怎样看一个人是否撒谎?ChatGPT之父被开除,加入微软!ChatGPT员工要集体辞职?纯爱小说﹕ 风云赋 (56) 严刑拷打17岁爆红,19岁遭公开羞辱,26岁被全网骂“撒谎精”……如今她“黑化复仇”成功,稳坐顶流!ChatGPT会撒谎?面临压力时策略地欺骗用户,就像人类一样!ChatGPT应用商店深夜上线!全网300万GPTs大爆发,开发者与OpenAI分钱了追逐它,就像热血漫画一样AI早知道|ChatGPT灰度测试多GPTs协同;新Bard逆袭GPT-4;百川智能发布Baichuan3他们看着死去的同伴,表情和人类一模一样ChatGPT应用商店终上线,全网GPTs超300万,和OpenAI分钱时代来了揭秘!澳洲服务业竟如此黑暗!受虐、遭歧…“请像人一样对待我们!”重磅!ChatGPT放大招!GPT Store应用商店今天上线!超300万GPTs,内卷之下的赚钱机会!GPT-4V在自动驾驶上应用前景如何?面向真实场景的全面测评来了GPT-4没通过图灵测试!60年前老AI击败了ChatGPT,但人类胜率也仅有63%能赚钱的GPT Store上线了!官方最佳榜单公布,ChatGPT被玩出花Agent像人一样分工协作,还能“群聊”交换信息|ICLR2024 Oral智能车的「ChatGPT时刻」,还有多远?| 模力时代像人类一样在批评中学习成长,1317条评语让LLaMA2胜率飙升30倍
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。