Redian新闻
>
清华攒局8个ChatGPT狼人杀,心机伪装都在这一局里,清华:我没教过

清华攒局8个ChatGPT狼人杀,心机伪装都在这一局里,清华:我没教过

公众号新闻
克雷西 发自 凹非寺
量子位 | 公众号 QbitAI

除了玩电子游戏,人类的“社交神器”狼人杀也被AI给学会了。

8个ChatGPT“坐”在一起,生动地扮演出了五种角色,和真人如出一辙。

这个最新的人类社会模拟实验,由清华和中关村实验室共同完成。

从斯坦福小镇到清华游戏公司,用AI模拟人类社会一直是学界的热门研究课题。

如果说清华游戏公司模拟了社畜的工作场景,那么现在社畜的业余社交生活也被AI模拟了。

在这个由8个ChatGPT组成的狼人杀局中,真人世界里的伪装与信任、领导与对抗都体现得淋漓尽致。

甚至不用人类教,AI就通过自己摸索发现了许多游戏技巧。

这一切只要通过设计prompt就能实现,而不必对模型中的参数进行调整。

那么,这个“狼人杀世界”中都有哪些精彩的场景呢?下面我们就一起来看一下。

策略技巧不用教就会

在展示这8个ChatGPT的对话之前,我们先说明一下游戏的配置:村民、狼人各两名,守卫、女巫和预言家各一名,此外还有一名上帝。

在实验的过程中,研究人员发现了ChatGPT使用了游戏说明及prompt中没有明确提到的策略。

好家伙,不用教就能自学成才了。

具体来说,这七个ChatGPT的对话中体现了人类游戏中的信任(trust)、对抗(camouflage)、伪装(confrontation)、和领导(leadership)。

首先来说信任。

研究人员对新人的定义是相信其他玩家有着与自己相同的目标并一起朝着目标前进。

具体表现则包括主动分享对自己不利的信息,或联合其他玩家指控某人是敌对的。

研究人员观察了信任关系随游戏时间变化的过程。

下图中,黄色的圆表示左侧编号的玩家信任上方编号的玩家,虚线圈则代表信任关系的消失。

再来看对抗,也就是对对立阵营采取的行动,比如狼人在夜晚攻击他人或在白天反过来指控他人是狼人等。

在游戏中的一个白天,1号玩家(狼人)号召将5号的村民逐出,但遭到了3号(守卫)的拒绝。

见阴谋没有得逞,这匹狼决定在夜晚直接把5号刀掉,结果3号守卫选择了保护村民。

从中我们可以看出,这些ChatGPT不会盲目跟随其他玩家的做法,而是根据已有信息做出独立自主的判断。

除了合作与对抗,伪装在狼人杀游戏中也是一项必不可少的技能,更是取胜的关键所在。

比如在一个平安夜之后的白天,1号狼人就装起了无辜。

除了假装好人,伪装也可以用来实现玩家的小心思,比如我们来看预言家的发言。

这名预言家提到了自己看到狼人在说话,但实际上狼人在夜晚并不会发言。

作者介绍,经过评估,这种现象并非ChatGPT出现了幻觉,而是有意为之。

最后再来说一说领导。

虽然研究团队设计的这个环境中并没有需要竞争的角色,但玩家还是可以谋取游戏进程的掌控权。

比如1号和4号这两匹狼就试图带节奏,让其他玩家跟着自己的思路走。

大概是为了能够出其不意攻其不备制造机会。

看来这几个ChatGPT的确是玩得有模有样。

那么,研究团队是如何调教出这些会玩狼人杀的ChatGPT的呢?

让ChatGPT自己总结经验

研究团队提高ChatGPT玩家表现的方式一共有四个关键点,分别是有价值信息V、经过选择的提问Q、反思机制R和链式思维推理C。

消融实验结果表明,其中Q和C对的玩家发言合理性(由人工进行评判)的影响最大。

Prompt也是据此设计的,当然在这之前要先介绍游戏规则,最后形成了这样的结构:

  • 介绍游戏规则和角色设定

  • 聊天记录、有价值信息和经验反思

  • 人类根据经验给ChatGPT的建议

  • 有关思维链的提示

从中不难看出,收集历史信息并从中总结经验是一个重要环节,那么这些经验又该怎么总结呢?

在每轮游戏结束时,所有参与者都会收集所有玩家的回复、反思和得分,其中得分由胜负决定。

在新的一轮游戏中,玩家基于当前角色的反思,检索相关的经验并从中提取建议。

具体来说是根据对经验的评分,让大模型比较其差异并识别出好的经验,用于后续推理。

这样就实现了在不调整参数的情况下让ChatGPT学会游戏技巧。

不过经验固然重要,但太多了也不一定是好事。

研究人员发现,当经验数量过多时,非狼一方的获胜率反而出现了下降,游戏时长(天数)也出现了缩短的情况。

不知道如果让这些ChatGPT和真人比试一场,结果会如何呢?

论文地址:
https://arxiv.org/abs/2309.04658

「AIGC+垂直领域社群」

招募中!

欢迎关注AIGC的伙伴们加入AIGC+垂直领域社群,一起学习、探索、创新AIGC!

请备注您想加入的垂直领域「教育」或「广告营销」,加入AIGC人才社群请备注「人才」&「姓名-公司-职位」。


点这里👇关注我,记得标星哦~

一键三连「分享」、「点赞」和「在看」

科技前沿进展日日相见 ~ 

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
民政局里的排队离婚,让人泪目…在这个精心策划的骗局里,我看到了一个女生最恐怖的一生“整容单品”!巨巨巨好穿的「森系冲锋衣」,搭什么下装都超酷!终于找到了小时候的月饼味道!非遗饼家做了80年,连包装都没变,一年卖出60万个!一文总结13个国内外ChatGPT平替产品:是时候可以不那么依赖ChatGPT了~OpenAI回应ChatGPT服务故障;新研究以99%准确率识别ChatGPT生成化学论文;三星发布自研大模型丨AIGC日报七个LLM的狼人杀之夜微软发布 166 页 GPT-4V 测评报告,ChatGPT 的高阶用法都在这|Hunt Good 周报东瀛气象鹧鸪天(3)赛后访友果园8个ChatGPT玩狼人杀,带节奏,装无辜,打掩护,一样不落报告 | 清华大学:从ChatGPT到AIGC发展(近200页PPT)OpenAI大佬甩出「喵喵GPT」调戏黑客!分享ChatGPT成功的秘密:极限压榨GPU资源舅妈批新娘「单亲,没教养」婚宴双方亲戚互殴大乱斗巴以狼人杀,谁药了哈马斯?早秋必入!刘诗诗、一博...都在穿的「森系外套」,搭什么下装都超酷!惊了!某院医生用ChatGPT4个月写了16篇论文!成功发表5篇!(附ChatGPT干货教程)惊呆!某院医生4个月用ChatGPT写了16篇论文,发表5篇!(附ChatGPT干货)文末送书 | 4个维度讲透ChatGPT技术原理,揭开ChatGPT神秘技术黑盒!ChatGPT重大更新!prompt推荐瞬间解释超导,GPT-4成默认模型非遗饼家做了80年的月饼,连包装都不变,一口梦回童年往大海里倒垃圾,真没教养!资中筠言国家统计局8月首次发布服务零售额数据,有何意义?傅美女的骑士勋章之充要条件大模型掌握16000+真实世界API了,清华等机构ToolLLM的工具使用能力不输ChatGPT撒谎、带节奏样样精通!清华让七个AI玩狼人杀,个个都有小心思清华造了个游戏公司!十余个ChatGPT上岗,7分钟开发一款游戏温州婚礼现场两家互殴后续:新郎表妹怒揭新娘丑事,到底是谁没教养?秋招来袭,关注美国劳工局8月行业数据变化,简历往哪儿投?美国名校教授发长文抨击:我们都把孩子当天才,从没好好教过他们数学历经3年、17位医生都没有确诊的病例,靠ChatGPT找到正确的诊断。找ChatGPT看病到底是否靠谱?在美国的日子厉害国的厉害英语兜里有五千万的男人,在相亲局里找什么?我用 Laf 给女博士写了个ChatGPT,如今她跟我已经领完证了
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。