Redian新闻
>
用ChatGPT控制NPC,行动逼真到像正常人!斯坦福谷歌新研究炸场,赋予大模型准确记忆力

用ChatGPT控制NPC,行动逼真到像正常人!斯坦福谷歌新研究炸场,赋予大模型准确记忆力

公众号新闻
萧箫 发自 凹非寺
量子位 | 公众号 QbitAI

放任25个AI共同生活,他们竟然模拟起了人类的行动!

不仅像人一样起床、刷牙、吃饭、睡觉,还会被迫“出门打工”,甚至在闲暇时分一起庆祝节日。

这一切,来自斯坦福和谷歌的一项新研究——

他们做了一个很新的实验,创造了25个AI NPC,每个NPC都有不同的身份和行动决策,并让它们在一个沙盒环境中共同生活,背后依靠ChatGPT大模型来完成行动决策。

结果发现,这些AI NPC不仅会像人一样生活,如作家就去写作、店主就去经营商店,而且他们彼此之间还会发生交互,甚至产生对话:

研究一po出就爆火,宾大沃顿商学院教授Ethan Mollick表示:

这些行动相比“角色扮演”,更像是正常人类会做出来的行动。

OpenAI科学家Andrej Karpathy更是直呼“这让开放世界游戏相形见绌”:

所以,这个研究究竟构建了一个怎样的“AI社会”?

当AI玩起模拟人生

从Demo展示来看,这25个AI有着不同的身份、性格和年龄:

他们会在一个共同社区中生活,这些社区的构造非常详细,包括居住区、大学、公园、咖啡厅等:

可以看见,每个AI都有自己的基础行程,包括起床、洗漱、吃饭、睡觉等,根据不同的身份设定,又会做出不同的行动,共同维持社区的运转。

其中,Demo中的emoji简单代表了AI正在进行的操作,如收发信件和吃饭:

但在这其中,也会有交互行为产生:

用的也不是AI的语言,而是人类说话的方式:

不仅如此,这些相互之间可以产生互动的AI,甚至还能听取人类玩家的要求,并采取对应的行动。

例如论文作者提到,他们以人类的身份告诉其中一个AI NPC,希望在社区举办一个“情人节派对”的活动。

没想到,这位AI NPC不仅热情地答应了作者们的请求,自发开始组织起这场活动,包括时间地点和到场人物等:

看到这里,已经有网友表示“太疯狂了”——

对于玩家来说,相比遵循步骤,以后在游戏中可能真的需要去说服NPC或思考并采取行动,才能完成任务。

还有脑洞大开的网友想到了更加“邪恶”的玩法:

想象你杀死了一个NPC,然后坐车回到城市,看着他们为他举办葬礼……

那么,这些AI究竟是如何自发行动,构建起一个自运转的AI互动社会的呢?

用大模型控制行动决策

具体来说,斯坦福和谷歌分两步让AI们采取行动、与其他AI发生交互。

第一步,是构建各种各样的AI“人设”,并让他们做出符合设定的日常行动来。

这里我们以其中一个AI角色John Lin为例,在Demo中可以找到他的设定列表。

可以看见,他的设定非常详细,包括基础信息(姓名、年龄、位置、时间),注意力设定(视野范围等),个人情况(性格、家庭背景、工作等)

以此为参照,这位名叫John Lin的AI就能形成每天固定的生活习惯,包括早起例行洗漱,然后上班,最后回家睡觉。

但在他的生活过程中,必定会与其他AI沟通、或是遇到新人,于是——

第二步,就是要让AI人设对外界环境和其他人的行动做出反应,产生交互

于是,这项研究构建了一种赋予AI记忆力、检索记忆、感知、反馈和交互等能力的架构。

从架构图来看,AI会首先感知周遭环境,并将一定视野(注意力)范围内发生的事件记录下来,加进自己的记忆流(memory stream)中;

随后,无论是AI计划要做的事(plan)、还是对外界发生的事情给出反馈(reflect),都会受到这个记忆流的影响,具体方式是通过从记忆中检索对应的事件,并依靠大模型ChatGPT来进行决策

(当然,无论是计划还是反馈,对应的事件也会加入记忆流中,成为新的记忆)

最后,这些决策的结果将被转变为具体的方案,促使AI思考并做出具体的行动。

研究提到,之所以采用大模型+记忆架构的方式,是因为大模型虽然已经具备非常好的行动逻辑性,但无论是GPT-4还是其他大模型,长期规划和保持清晰的记忆仍然是一种挑战。

基于此,需要一套记忆系统作为大模型的“参照物”,让它在采取决策的时候有清晰的事件列表可以回溯。

不过,这项研究也提出了一些关于AI安全的问题。

包括如何防止它对社会产生的影响,同时被有心之人用于生成Deepfake和“定制版”AI诈骗等——

例如,以后和你聊天的AI卖茶小妹,可能不仅会记得你说过的每一件事情、每一个生日,甚至还能以此为参照,生成更加“贴心”的回答,让“她”看起来更像一个人……

One More Thing

值得一提的是,此前国内也已经有名叫超参数科技的公司做出了类似的AI NPC系统GAEA

和斯坦福谷歌这项研究一样,GAEA同样具备记忆系统,并依靠大语言模型来帮助NPC做出行动决策。

不过,二者促使AI产生行动的激励机制有一些差异。相比这项研究依靠大模型来完成行动决策:

GAEA中的AI还会额外依靠更具体的数值,进一步影响NPC的行动决策(饥饿值、心情值等)

对于这类AI NPC技术,你还想到了什么脑洞大开的玩法?

试玩地址:
https://reverie.herokuapp.com/arXiv_Demo/#

论文地址:
https://arxiv.org/abs/2304.03442

参考链接:
[1]https://twitter.com/emollick/status/1645499660402925576
[2]https://twitter.com/karpathy/status/1645485475996790784

【AIGC 技术探索与应用创新】

4月13日「掘金城市沙龙·北京站」

限量免费参会!

ChatGPT 看,AI 模型服务化趋势是怎样的?AIGC 新时代下,文本智能创作面临什么样的变革?如何轻松训练 AIGC 大模型?基于大模型的 AIGC 工作原理和应用场景是什么样?

畅聊「AIGC 技术探索与应用创新」字节跳动 NLP 算法工程师陈家泽、英特尔AI软件工程师杨亦诚、Google Cloud机器学习专家王顺、清华大学 KEG 知识工程实验室研究助理郑勤铠、九合创投 COO张少宇、稀土掘金江昪等多位业界专家已集结完毕!

4月13日下午北京大钟寺地铁站方恒时尚中心,邀你线下参会,更有多款稀土掘金原创周边等你来!

扫描下方二维码,抢线下免费参会票!


微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
能自主唠嗑的NPC,AI作曲的口水歌和四头大象重的GPU……黄仁勋:没有我就没有AI(作者:ChatGPT)罗志祥“变性”重新出道,疯得不像正常人「终结者」走入现实?微软的野心:用ChatGPT控制机器人!Bill Bryson 《Thunderbolt Kid》用ChatGPT「指挥」数百个模型,HuggingGPT让专业模型干专业事爸爸82岁交往小49岁女友,儿子陷11岁姐弟恋,神奇的一家人比Adam快2倍!斯坦福提出Sophia:大模型预训练新优化器,成本减半!斯坦福最新研究显示,ChatGPT背后模型具有人类心智!这一天终于来了火焰的雕像大模型的思想钢印:如何让ChatGPT相信水是有毒的?​中文信息处理实验室最新研究揭示虚假信息在大模型中的扩散机制ChatGPT在律所:聪明人已经在用ChatGPT吊打同事了!斯坦福5.5万人研究:30年,男人长(cháng)了3厘米,但并非好事问ChatGPT:不会用ChatGPT怎么办?ChatGPT讲座:ChatGPT并不神秘,但ChatGPT很神奇地球,瞬间烟花集成ChatGPT后必应日活量首破亿!微软推出Azure OpenAI ChatGPT 服务,GPT-4下周发布GPT-4偷袭发布!ChatGPT能识图和逻辑推理,靠自己考上斯坦福【附发布会中英文字幕版】延字源考老黄手捧ChatGPT专用“核弹”炸场,英伟达H100至尊版速度提10倍!斯坦福新研究炸了!ChatGPT背后模型被证实具有人类心智?知名学者:“这一天终于来了”...ChatGPT 核心技术大起底——InstructGPT:研究人类反馈数据比加大模型规模更重要!真·从零复刻ChatGPT!斯坦福等开启「红睡衣」计划,先开源1.2万亿token训练集谷歌顶级AI专家加入OpenAI 曾警告谷歌不要用ChatGPT数据训练BardChatGPT之父反驳马斯克/高考生喊话取消调休/刘慈欣也用ChatGPT写稿|灵感周报记忆力衰退,工作学习没效率?送你一套科学用脑法,改善记忆力,大脑越用越灵活!游戏版《西部世界》来了!NPC全由AI操控,行动自如有理想和记忆,基于最新GAEA技术系统打造300美元平替ChatGPT!斯坦福130亿参数「小羊驼」诞生,暴杀「草泥马」ChatGPT升级版!GPT-4 能识图能算税,升级成考霸,华裔AI科学家点评:它可以自己考进斯坦福了大羊驼、羊驼、小羊驼和ChatGPT比差在哪儿?CMU副教授测评了7个类ChatGPT大模型用ChatGPT赚钱的秘诀是,教别人怎么用ChatGPT赚钱马斯克AI实验室名字敲定/ Win11任务栏添加ChatGPT搜索/ 沃尔玛限制员工使用ChatGPT…今日更多新鲜事在此老黄手捧ChatGPT专用「核弹」炸场,英伟达H100至尊版速度提10倍!ChatGPT火出圈!斯坦福&宾大学霸揭秘美本STEM申请如何破局?炸了!斯坦福新研究:ChatGPT背后模型被证实具有人类心智!知名学者:“这一天终于来了”高效记忆训练营正式开放,世界记忆大师带孩子挑战4天改善记忆力,提升学习效率
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。