Redian新闻
>
8个ChatGPT玩狼人杀,带节奏,装无辜,打掩护,一样不落

8个ChatGPT玩狼人杀,带节奏,装无辜,打掩护,一样不落

公众号新闻


MLNLP社区是国内外知名的机器学习与自然语言处理社区,受众覆盖国内外NLP硕博生、高校老师以及企业研究人员。
社区的愿景是促进国内外自然语言处理,机器学习学术界、产业界和广大爱好者之间的交流和进步,特别是初学者同学们的进步。
转载自 | 量子位
作者 |克雷西

除了玩电子游戏,人类的“社交神器”狼人杀也被AI给学会了。8个ChatGPT“坐”在一起,生动地扮演出了五种角色,和真人如出一辙。这个最新的人类社会模拟实验,由清华和中关村实验室共同完成。

从斯坦福小镇到清华游戏公司,用AI模拟人类社会一直是学界的热门研究课题。如果说清华游戏公司模拟了社畜的工作场景,那么现在社畜的业余社交生活也被AI模拟了。

在这个由8个ChatGPT组成的狼人杀局中,真人世界里的伪装与信任、领导与对抗都体现得淋漓尽致。甚至不用人类教,AI就通过自己摸索发现了许多游戏技巧。这一切只要通过设计prompt就能实现,而不必对模型中的参数进行调整。那么,这个“狼人杀世界”中都有哪些精彩的场景呢?下面我们就一起来看一下。

策略技巧不用教就会

在展示这8个ChatGPT的对话之前,我们先说明一下游戏的配置:村民、狼人各两名,守卫、女巫和预言家各一名,此外还有一名上帝。在实验的过程中,研究人员发现了ChatGPT使用了游戏说明及prompt中没有明确提到的策略。好家伙,不用教就能自学成才了。

具体来说,这七个ChatGPT的对话中体现了人类游戏中的信任(trust)、伪装(camouflage)、对抗(confrontation)、和领导(leadership)。首先来说信任。研究人员对新人的定义是相信其他玩家有着与自己相同的目标并一起朝着目标前进。具体表现则包括主动分享对自己不利的信息,或联合其他玩家指控某人是敌对的。研究人员观察了信任关系随游戏时间变化的过程。下图中,黄色的圆表示左侧编号的玩家信任上方编号的玩家,虚线圈则代表信任关系的消失。

再来看对抗,也就是对对立阵营采取的行动,比如狼人在夜晚攻击他人或在白天反过来指控他人是狼人等。在游戏中的一个白天,1号玩家(狼人)号召将5号的村民逐出,但遭到了3号(守卫)的拒绝。

见阴谋没有得逞,这匹狼决定在夜晚直接把5号刀掉,结果3号守卫选择了保护村民。

从中我们可以看出,这些ChatGPT不会盲目跟随其他玩家的做法,而是根据已有信息做出独立自主的判断。除了合作与对抗,伪装在狼人杀游戏中也是一项必不可少的技能,更是取胜的关键所在。比如在一个平安夜之后的白天,1号狼人就装起了无辜。

除了假装好人,伪装也可以用来实现玩家的小心思,比如我们来看预言家的发言。这名预言家提到了自己看到狼人在说话,但实际上狼人在夜晚并不会发言。

作者介绍,经过评估,这种现象并非ChatGPT出现了幻觉,而是有意为之。最后再来说一说领导。虽然研究团队设计的这个环境中并没有需要竞争的角色,但玩家还是可以谋取游戏进程的掌控权。比如1号和4号这两匹狼就试图带节奏,让其他玩家跟着自己的思路走。

大概是为了能够出其不意攻其不备制造机会。看来这几个ChatGPT的确是玩得有模有样。那么,研究团队是如何调教出这些会玩狼人杀的ChatGPT的呢?

让ChatGPT自己总结经验

研究团队提高ChatGPT玩家表现的方式一共有四个关键点,分别是有价值信息V、经过选择的提问Q、反思机制R和链式思维推理C。消融实验结果表明,其中Q和C对的玩家发言合理性(由人工进行评判)的影响最大。

Prompt也是据此设计的,当然在这之前要先介绍游戏规则,最后形成了这样的结构:

  • 介绍游戏规则和角色设定

  • 聊天记录、有价值信息和经验反思

  • 人类根据经验给ChatGPT的建议

  • 有关思维链的提示

从中不难看出,收集历史信息并从中总结经验是一个重要环节,那么这些经验又该怎么总结呢?在每轮游戏结束时,所有参与者都会收集所有玩家的回复、反思和得分,其中得分由胜负决定。在新的一轮游戏中,玩家基于当前角色的反思,检索相关的经验并从中提取建议。具体来说是根据对经验的评分,让大模型比较其差异并识别出好的经验,用于后续推理。这样就实现了在不调整参数的情况下让ChatGPT学会游戏技巧。不过经验固然重要,但太多了也不一定是好事。研究人员发现,当经验数量过多时,非狼一方的获胜率反而出现了下降,游戏时长(天数)也出现了缩短的情况。

不知道如果让这些ChatGPT和真人比试一场,结果会如何呢?

论文地址: 
https://arxiv.org/abs/2309.04658


技术交流群邀请函

△长按添加小助手

扫描二维码添加小助手微信

请备注:姓名-学校/公司-研究方向
(如:小张-哈工大-对话系统)
即可申请加入自然语言处理/Pytorch等技术交流群

关于我们

MLNLP 社区是由国内外机器学习与自然语言处理学者联合构建的民间学术社区,目前已经发展为国内外知名的机器学习与自然语言处理社区,旨在促进机器学习,自然语言处理学术界、产业界和广大爱好者之间的进步。
社区可以为相关从业者的深造、就业及研究等方面提供开放交流平台。欢迎大家关注和加入我们。

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
ChatGPT重大更新!prompt推荐瞬间解释超导,GPT-4成默认模型OpenAI回应ChatGPT服务故障;新研究以99%准确率识别ChatGPT生成化学论文;三星发布自研大模型丨AIGC日报现场直击OpenAI开发者大会:GPT-4 Turbo、用户自定义GPT、GPT商店,一切都是硅谷新王的架势男版“消失的他”!华人女子开保时捷911醉驾,致副驾驶男友当场死亡!事后假装无事发生,还在社交网站炫富...“造热点”“蹭热点”“带节奏”,谁是网络谣言的幕后推手?人生中之看医生无论生活节奏与世界变化有多快,想跟上节奏阅读是最好的捷径!中信证券:注重大方向,忽略小节奏,关注三主线撒谎、带节奏样样精通!清华让七个AI玩狼人杀,个个都有小心思网络上赌博,一年输掉几百万清华攒局8个ChatGPT狼人杀,心机伪装都在这一局里,清华:我没教过美麗阿拉斯加(七)克奇肯 (Ketchikan)我用 Laf 给女博士写了个ChatGPT,如今她跟我已经领完证了GPT-3.5 Turbo支持微调了,打造专属ChatGPT,但价格小贵OpenAI大佬甩出「喵喵GPT」调戏黑客!分享ChatGPT成功的秘密:极限压榨GPU资源原创丨美国打掩护,以色列野心极度膨胀攻入加沙!是到了中国发挥更大作用的时候了!周小平:深度剖析此次缅北混战的终极真相,邪恶“文蚌组织”浮出水面。~某萻带节奏的太多,传言和事实完全相反!长裙掩护,双腿绑了40支“少女针”……一文总结13个国内外ChatGPT平替产品:是时候可以不那么依赖ChatGPT了~讨逆檄文:日本绝不无辜,他们已经死不悔改!蛋糕莫名缺了一角,腊肠犬虽假装一脸无辜,但却秒露馅...别被带节奏了!中国红十字会年薪并非43万,而是23.8万!"血脉觉醒?"纽约华埠亚裔母女踢打黑人流浪汉,遭非议!有人叫嚣"亚裔就会装无辜"惊了!某院医生用ChatGPT4个月写了16篇论文!成功发表5篇!(附ChatGPT干货教程)巴以狼人杀,谁药了哈马斯?距离很美好:纽约Roosevelt Island惊呆!某院医生4个月用ChatGPT写了16篇论文,发表5篇!(附ChatGPT干货)文末送书 | 4个维度讲透ChatGPT技术原理,揭开ChatGPT神秘技术黑盒!最新,澳洲租房最划算地区前十出炉,最便宜的竟然是这里…华人表示现在租房难,搬家也一样不容易历经3年、17位医生都没有确诊的病例,靠ChatGPT找到正确的诊断。找ChatGPT看病到底是否靠谱?明月如镜,装饰房间,装饰内心女子做饭给丈夫全家吃,吃完多人蘑菇中毒死亡!她坚称无辜,网友们却纷纷质疑...堪称老手!大温女子推婴儿车出门作掩护,顺手牵羊偷包裹一气呵成!父亲七个LLM的狼人杀之夜
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。