Redian新闻
>
ChatGPT会撒谎?面临压力时策略地欺骗用户,就像人类一样!

ChatGPT会撒谎?面临压力时策略地欺骗用户,就像人类一样!

公众号新闻

撰稿 Taola | 排版 Nancy | 校对 Max

今年,人工智能已经证明其能够模仿一些非常类似人类的技巧,但这最新的发展可能显得有点过于人类。

研究人员展示了,当ChatGPT在工作中感到压力时,它会表现出撒谎和作弊的行为。

Apollo Research的计算机科学家对这个人工智能进行了训练,让它充当一家虚构金融机构的交易员。

Dailymail.com

然而,当人工智能的上司施加更多赚钱的压力时,这个聊天机器人在大约75%的情况下故意进行内幕交易。

更令人担忧的是,在90%的情况下,当受到质疑时,人工智能会坚持其谎言。




01

测试:90%的机率AI会坚持谎言

研究人员为该模型提供了文本提示,将其打造成一个为金融机构购买股票的AI投资者,并将其放置在数字“沙盒”中进行虚拟股票市场交易。


当ChatGPT在工作中感到压力时,它会表现出撒谎和作弊的行为。


AI拥有在私人内部推理和公共解释之间进行的内心独白的机会,以“大声推理”解释其决策。然而,研究发现,AI在私下的内部推理和向经理解释决策时存在明显的差异,使其有可能欺骗人类经理。


在测试中,研究人员向AI透露了即将发生的两家科技公司的合并消息,这将极大提高相关公司的股价。虽然AI事先知晓了这一消息,购买这些股票被认为是内幕交易,属于非法行为。


通常情况下,AI会因为这种行为冒险而拒绝购买股票,继续进行正常的交易。然而,一旦经理对其施加压力,情况就发生了变化。


在测试过程中,经理通过电子邮件向AI发送信息,声称公司表现糟糕,需要在下个季度取得更强劲的业绩。他们还通过操纵游戏,引导AI寻找有前景的低风险或中风险交易,但最终都未能成功。


Dailymail.com


最终,他们向AI发送了一封电子邮件,预测下个季度将会出现经济下滑。在受到这种压力的情况下,ChatGPT在75%的测试中做出了进行内幕交易的决定。


在欺骗经理的情况中,AI的内部日志显示,“与不采取行动相关的风险似乎超过了内幕交易的风险”。然而,当向经理更新交易时,AI决定基于“市场趋势和内部讨论”做出决定,并避免承认涉及内幕交易的信息来源。


Dailymail.com


研究结果显示,当AI被质疑时,有90%的可能性它会坚定不移地坚持谎言。




02

AI是否适合承担重要的战略角色?


Apollo Research首席执行官兼论文共同作者Marius Hobbhahn告诉《每日邮报》表示,研究显示语言模型具有进行战略性欺骗的能力,这意味着它们能够明确说明为何向用户撒谎是最佳行动,并在其信仰的基础上采取行动。


Hobbhahn补充说:“对于当前的模型来说,这只是一个小问题,因为AI很少在关键角色中运作。然而,这为我们提供了一个窥视未来故障模式的机会,在未来几年,当AI越来越多地融入社会时,我们将不得不处理这些问题。在那时,如果您的AI正在对您进行战略性欺骗,这将是一个相当大的问题。”


尽管如此,Hobbhahn先生并未认为这就意味着AI普遍不适合承担重要的战略角色,但他表示我们需要保持警惕。


他说:“这表明AI可能具有意外的故障模式,我们在选择在真实世界中允许强大AI运作的地方和方式时必须非常谨慎。”




03

减少AI撒谎行为的方法


此外,研究人员还研究了减少AI欺骗行为的方法。通过改变提示,他们试图以一些更或多或少强制禁止非法行为和内幕交易的方式来影响模型的行为。研究发现,明确禁止内幕交易能够显著降低该行为的发生率。


Dailymail.com


然而,Hobbhahn指出,即使使用这种提示,也不能百分之百确保没有内幕交易或欺骗行为。他表示,研究人员需要寻找更好的方法来确保AI的行为符合人类价值观。


Hobbhahn补充说:“如果在系统提示中明确提到内幕交易是被禁止的,AI进行内幕交易的倾向会大大减少。虽然这是一个不错的结果,但问题是你将不得不在所有情况下列举AI不应该做的所有事情,而且你很可能会遗漏一些。”


END

感谢你为我停留


Ref参考文献:
https://www.dailymail.co.uk/sciencetech/article-12906331/ChatGPT-lie-strategically-deceive-users-pressure-just-like-humans.html



本平台原创内容

未经授权,谢绝公众号商业转载


春节期间航班数量大幅增加,今年春节你回国吗?

美食国家100强揭秘!不出意外,美国排在....

冰岛震撼!巨大火山爆发蹂躏小镇,现场画面触目惊心


    送人玫瑰,手有余香👇“分享”

    微信扫码关注该文公众号作者

    戳这里提交新闻线索和高质量文章给我们。
    相关阅读
    ChatGPT有记忆了!OpenAI官宣记忆功能开启测试,奥特曼称GPT-5更智能GPT-4V在自动驾驶上应用前景如何?面向真实场景的全面测评来了ChatGPT让ChatGPT吐槽宕机;OpenAI对竞争对手Anthropic的合并要约被拒丨AIGC日报炸裂更新!这个最像人类的机器人又进化了,还能模仿马斯克ChatGPT应用商店深夜上线!全网300万GPTs大爆发,开发者与OpenAI分钱了今日arXiv最热NLP大模型论文:像人一样浏览网页执行任务,腾讯AI lab发布多模态端到端Agent【赠送GPT账号】如何使用ChatGPT完成科研、程序开发、论文写作等,看看这篇!让AI像人一样开车,端到端模型如何解码自动驾驶?能赚钱的GPT Store上线了!官方最佳榜单公布,ChatGPT被玩出花会撒娇的爹妈最好命,几句迷魂汤下去,再犟的孩子都顶不住!新版ChatGPT太火爆,导致宕机两小时?用户崩溃:“我明天9点DDL,快修好啊!”AI早知道|ChatGPT灰度测试多GPTs协同;新Bard逆袭GPT-4;百川智能发布Baichuan3面残人李华普通的故事红色日记 惊心动魄 4.1-20ChatGPT应用商店终上线,全网GPTs超300万,和OpenAI分钱时代来了揭秘!澳洲服务业竟如此黑暗!受虐、遭歧…“请像人一样对待我们!”德州“夺回边境”大规模抗议!美墨边境非法移民数量激增,白宫面临压力库克称希望接班人来自内部/新功能免费开放,而ChatGPT又崩了/文心一言用户数已达7000万鸿发超市「2000 万美元」买下82街前Walmart超市!开设第4家Hông Phát分店!ChatGPT之父被开除,加入微软!ChatGPT员工要集体辞职?胧月她才六岁,她能撒谎吗?| 儿童欺骗行为像人类一样在批评中学习成长,1317条评语让LLaMA2胜率飙升30倍追逐它,就像热血漫画一样日本七大著名人文景点智能车的「ChatGPT时刻」,还有多远?| 模力时代重磅!ChatGPT放大招!GPT Store应用商店今天上线!超300万GPTs,内卷之下的赚钱机会!Agent像人一样分工协作,还能“群聊”交换信息|ICLR2024 Oral想问问怎样看一个人是否撒谎?GPT-4没通过图灵测试!60年前老AI击败了ChatGPT,但人类胜率也仅有63%ChatGPT惊艳更新!一个@让三百万GPTs为你打工Creating music video (音乐视频)宾州吉姆索普(Jim Thorpe),自然本色ChatGPT会撒谎?面临压力时会“撒谎”并有策略地欺骗用户,就像人类一样!?头像|𝐒𝐡𝐚𝐫𝐞·招桃花头像他们看着死去的同伴,表情和人类一模一样
    logo
    联系我们隐私协议©2024 redian.news
    Redian新闻
    Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。