AI 赋能元宇宙游戏的畅想与实践
这几年,元宇宙概念十分火热。在很多业内人士眼中,元宇宙 + 游戏是一个富有想象力的好故事。近年来,VR/XR、AI 等技术的发展令元宇宙游戏开发不断提速,爆火的 AIGC 也迎来诸多技术创新,进一步释放了游戏行业的创新活力。
本期 InfoQ《极客有约》,我们邀请到了元宇宙创业公司 MultiMetaverse CEO,七创社董事长许怡然,来给我们分享“AI 赋能元宇宙游戏的畅想”。
以下是对话全文,InfoQ 在不改变原意的情况下做了编辑。
InfoQ:2 月《极客有约》主题是 AIGC,即生成式人工智能。首期直播的主题是“ AI 赋能元宇宙游戏的畅想”。首先,请许怡然老师简单介绍一下自己,也许怡然 InfoQ 的读者不太熟悉 MultiMetaverse 公司,还想请您介绍一下公司的主要业务。
许怡然: 大家好,我是许怡然,在游戏圈做了将近 30 年,是中国最早做游戏的那批人之一。我们公司是在香港上市公司乐游被腾讯收购后新成立的。目前,我们收购了上海的动画公司七创社,旗下有著名动漫 IP《凹凸世界》。我们正在为《凹凸世界》制作游戏,最新的《凹凸世界》手游《寻光之旅》刚刚上线。MultiMetaverse 公司是七创社的母公司,最近在美国纳斯达克成功上市。
我们正在准备收购淘米公司,从而进一步增加虚拟 IP 的数量。我们计划推出一些游戏和动漫相关的周边商品,这是一个全球化的产业,我们的初始目标是在中国市场展开,而长期目标是成为一家全球化的虚拟 IP 运营公司。
InfoQ:过去这两年,元宇宙是火遍全网的顶流概念之一,全球很多公司都在入局元宇宙。但是到目前为止,元宇宙似乎还没有一个广泛达成共识的定义。如果请您用通俗的语言描述下这个概念,您会如何描述?
许怡然: 大家普遍接受的是,元宇宙的概念最早出现在《雪崩》这本书中,它认为现实世界的人在虚拟世界中生活就可称为元宇宙。后来又出现了像电影《头号玩家》这样的作品,它们描述的主要是现实世界的人使用虚拟化身在虚拟世界中生活,认为这就是元宇宙。
但我个人认为,只有当虚拟世界与现实世界发生交集时,才可以称之为元宇宙。纯现实世界和元宇宙没啥关系,大家同意,但我认为纯虚拟世界也不是和元宇宙无关,这是我的观点与大家不同的地方。
InfoQ:现阶段,元宇宙最受关注的细分赛道除了 VR 外,就是游戏了。您如何看待元宇宙在游戏场景下的应用,元宇宙能为游戏带来什么改变?
许怡然:元宇宙与游戏之间有很深的关系,因为元宇宙这个词,本身就来源于虚拟世界与现实世界之间的交集,比如戴上 AR 眼镜后,我们看到的现实世界中不仅有现实世界本身的事物,还融入了虚拟世界的元素。
我认为,理想中的元宇宙应该是指虚拟世界通过技术手段进入到现实世界中,这些技术包括 3D 显示 技术、虚拟角色建模、世界建模,在虚拟世界中与虚拟角色互动的技术等等。电子游戏行业在这个领域已经研究了 50 年,一直以来,我们都是通过数字化的方式来制作虚拟世界,积累了大量的经验和技术。这些技术对元宇宙的发展起着基础建设的作用。我们现在在元宇宙中所使用的所有虚拟世界搭建技术都是由游戏引擎实现的,这些技术都是游戏产业推动实现的。
游戏是一项追求盈利的产业,为了获得更多利润,游戏的开发者必须制作更好、更多、更先进的游戏,这样,游戏的画面和虚拟世界的构建能力就会得到提升。游戏技术实际上引领了虚拟世界的构建技术的发展。我认为游戏是元宇宙的核心,是元宇宙发展的先锋。
InfoQ:一款元宇宙游戏,通常具备哪些特征?
许怡然: 在我看来,只有一款成功的游戏是典型的元宇宙游戏,那就是 《Pokemon Go》。这是因为在玩家拿起手机拍照时,现实世界与虚拟世界产生了交集,手机里呈现出了许多叠加的虚拟元素。
在我的定义中,元宇宙游戏的范围非常狭窄。虽然有人认为所有的 VR 游戏都属于元宇宙游戏,但我不太认同。我认为 VR 游戏只是游戏的一种高级形态,本质上还是游戏。当你戴上 VR 眼镜后,你完全沉浸在虚拟世界中,玩游戏的时候并不需要看到现实世界,但这并不能称之为元宇宙。
InfoQ:您认为游戏和元宇宙结合后,会有一些新概念出来吗
许怡然:由于元宇宙的出现,许多人将 Web3、加密货币等概念引入了元宇宙。Web1.0 是只读的,Web2.0 是可读可写的,而 Web3.0 的理念是,每个人都应该分享到他们为这个内容做出的贡献,这样才能建立一个“理想社会”。
“理想社会”意味着每个人只要对内容做出贡献,就能分享收益。例如,作为一个粉丝,在 B 站上观看 PGC 内容的视频并发弹幕,这可以让下一个观看该视频的人获得更好的体验。那么,发弹幕的人也是 UGC 创作者中的一员,为这个作品的受欢迎程度作出了贡献。有些粉丝会转发喜欢视频,让更多的人知道它,这样其实也参与了内容的传播,难道不应该分享收益吗?
我非常赞同上述理念,但我对其中一个问题表示怀疑,那就是这一切是否一定要借助区块链技术才能实现。我认为,中心化的方法也能够实现,只是有人担心这种方法不够安全。实话说,有国家机器、法律、警察和军队来保护我,我觉得这比乌托邦更安全。在一个完全自组织的、没有权威机构的 Web3 世界中,如果我的作品被侵犯了,我无法得到权威机构的保护,把复杂的人类世界的社会关系的一切都交给自动运行的程序是不太靠谱的。所以,我并不完全同意将去中心化区块链等技术全部引入元宇宙的想法,但我非常认同 UGC 的理念,即让那些参与内容创作的用户能够分享到相应的收益。我愿意推广这个理念,将其应用到传统的内容创作生态中。但我认为把区块链、Web3.0、VR 等概念与元宇宙混为一谈有些牵强附会,不太合适。Web3 是一个挺好的理念,但反过来如果你把这个理念搁在一边,你会发现你专谈元宇宙的时候其实还是有很多可以聊的。
元宇宙游戏,我们现在只看到一个《Pokemon GO》,如果应用在非常严肃的工业的生产里,可以是戴一个 AR 眼镜,就能看到面前的机器的内部结构,甚至可以远程搞一些维修工作。未来也有可能实现远程手术、教育和购物等。例如,在购物时,我可以在商品标签上看到许多包装上没有印刷的信息,比如商品成分,消费者评价等。这些信息可以在 AR 眼镜中叠加显示,这些应用都能为线下的很多场景提供赋能,比游戏要有更多的想象空间。
我认为游戏是帮助元宇宙的,而不是相反。今天讨论的另一个重要主题是 AI。但是,你不能说 AI 是元宇宙的必备元素。虽然有 AI 的帮助肯定更好,但是没有 AI 也能实现元宇宙的构建。因此,不要让 Web3 或者区块链来“绑架”元宇宙,也不要用元宇宙去限制 AI 的应用。我认为元宇宙应该是一个开放的概念,不应该被绑架。
InfoQ:与传统的游戏开发相比,元宇宙游戏的开发有何不同?需要掌握哪些技术?
许怡然: 我认为元宇宙对游戏世界的影响主要体现在 AR 眼镜上。如果 AR 眼镜成为普及消费品,我们可能会戴上它一整天。我们现在用手机的时间已经很长了,每天可能会花费 5-6 个小时, 但如果用轻便的 AR 眼镜取代手机,每天进入虚拟世界的时间可能会增加 3 倍,达到 16 个小时甚至更长。
那时,我就可以随时进入一个“半游戏”世界,而我喜欢的游戏可以融入到我的日常生活中。比如我去超市购物的时候,如果我喜欢变形金刚,可能旁边就会站着一个擎天柱跟我一起买东西。因为这是我喜欢的,所以我希望它们时时刻刻都能陪伴着我。
仅从游戏和娱乐方面来看,增加了使用时间,那么就可以出现更多新类型的游戏。也许不止是《Pokemon Go》,而是许多种结合现实世界场景的游戏。
InfoQ:最近一年,AIGC 特别火热,您是如何理解 AIGC 的?AIGC 在元宇宙游戏的开发中能够起到什么作用?
许怡然: 最近 AIGC 领域中 ChatGPT 非常火。我们走了另外一条与小冰的合作路线,我们认为,纯聊天场景的应用场景还是相对有限的。ChatGPT 目前主要针对文字,或者与文字接口的使用场景。相比之下,文字、普通图像和视频等相对容易处理,因为网络上有大量的数据可以用来训练 AI,即使生成 AI 具有一定的自我训练能力,但也需要大量的数据集才能让它学习。现在,AI 在处理这些数据集场景上已非常普遍,比如处理文字、图片等。这可能是游戏目前最早可以应用上 AI 的地方。
小冰在语音方面也取得了很多领先的成果。例如,小冰的人声模拟非常自然,就像真人唱歌一样会有呼吸和情感的波动,而不是简单的电子声音模拟。
我们与小冰合作的游戏 AI,不是帮助用户打游戏,而是在情感上为用户提供更多帮助。在与 ChatGPT 的聊天中,你可能觉得它有点冷冰冰的,因为它学习的主要是互联网上的文章,而不是真正的情感交流。所以,虽然它可以写一首诗,但要让它像一个贴心的伴侣一样与用户谈恋爱可能还有一些困难。
我们现在更看重的是,AI 是否能替代真人陪我一起玩游戏,而不是是否能打败我。现在有很多公司在研究如何通过 AI 让 NPC 更加生动,让它们像真人一样,但我认为这样的价值很有限。因为在游戏中,我会有意识地设计 NPC 的功能和作用,只有这些 NPC 老老实实的实现设计给他的功能,游戏才能保证好玩。比如 武器店老板必须 24x7 在店里上班,Boss 必须待在山洞里等待玩家前来挑战,如果 Boss 跑掉了或被“开小差”的武器店老板“打死”了,你千辛万苦来到山洞,发现 Boss 不见了,那这个游戏也就失去意义了。所以我认为把 NPC“ 做活”这件事是一个伪命题。
相反,游戏中的虚拟玩家应该更像真正的 MMO 玩家,它可以和你一起组队,交朋友。在真实的游戏世界里,周围都是真人,你怎么可能期望每个玩家都围绕着你,让你开心呢?在虚拟世界里,我们应该是为了享受游戏和快乐,而不是去承受和面对现实世界中的问题。
在虚拟世界中,如果有一批虚拟玩家能够陪伴你,让你感到开心,那就很不错了。比如,你告诉他明天晚上 8 点有空,他就保证来陪你;你告诉他明天凌晨 3 点要去打副本,他也能保证到岗,这样你才会感到开心。虽然你知道他只是个虚拟角色,但你希望它越真实越好,因为这样你才会喜欢它。小冰的技术在这方面做得非常好,我们正在深入合作。
我认为 AI 技术在游戏中有很多应用场景,比如有些人打游戏只是为了“杀敌”,有些人则需要情感陪伴。比如最近有人在游戏中制作了一个 Mod,可以将 ChatGPT 接入游戏,这样 NPC 可以成为你的攻略伙伴,告诉你如何玩这个游戏。
要研究 AI 赋能,需要专注于游戏所需要的场景。现在有 AI 专门研究自动测试。AI 可以模拟真人在游戏中不断操作上千次,帮助找到游戏中的 bug。现在有些公司正在自动生成游戏的角色和场景,并自动画图。这些细分的公司现在正在向垂直方向发展,但游戏是一个综合的作品。游戏包含的内容很多,比如数值设定、测试,陪玩、NPC、场景、角色、动作、模型、贴图、语音、音乐和音效等。AI 如果将所有这些方面结合起来,就是我期待的未来。
未来我希望只需要说一句话,比如:“做一个《凹凸世界》版本的马里奥”,AI 就能帮我自动创作游戏。AI 可以搜索《凹凸世界》的动画片,研究《马里奥》游戏,并将《凹凸世界》中的形象融入《马里奥》世界中。当然,我也需要叮嘱 AI 不能纯粹抄袭《马里奥》游戏,而是要运用《马里奥》游戏设计的精髓来设计一个横版过关的游戏,它就能照样做出来。这是最理想的结果,而未来 5 年或 10 年也有可能实现这一点。
InfoQ:您刚才说的 AI NPC 能展开说说吗?
许怡然: NPC 指的是非玩家操控角色(None Playable Character),但实际上我们不只是要做出 NPC,我们希望这些角色更加活灵活现。小冰管他们叫做“AI Beijing”是为了告诉你,这个角色不一定是虚拟的人类,而可以是一个由 AI 控制的任何角色。它可以是一只 AI 猫、 AI 狗,甚至一个 AI Boss 也可以被视为 AI Being,只要它具有生命力。
例如,在任天堂的《动物森友会》中,有一些角色是固定的,必须永远坐在那里,因为你需要跟他们进行公务交流和购买商品,这些是不能太活的功能 NPC。而其他有一些小动物在别的岛屿上,你可以邀请他们过来,他们也可能不满意并离开。这些小动物其实更像真的玩家,他们代表了我们心目中的 AI 角色。在设计这个游戏的时候,动森团队已经意识到这些小动物其实就是 AI 角色。只是他们当时没有使用像小冰那样高级的 AI 技术。我相信在未来的版本中,这些角色将变得更加智能,这将会使得游戏更加有趣。
为了创造这种 AI Being,首先我们需要进行人工建模,以创建与 IP 形象相符的模型。接着我们需要将 AI 生成的动作和语音与模型结合起来,借助 AI 引擎提供的功能使其活起来,这还要包括面部表情、举止言谈、动作、语音和语调等方面,比 chatgpt 要复杂得多。
角色不仅能与你进行聊天,而且在聊天过程中还要表现得自然,而不是僵硬的文本堆砌。为了实现这一点,模型中的肌肉、骨骼、动作等都需要与后台的 AI 引擎连接起来,这是创造 AI Being 的基础。
此外,我们还需要寻找声优为角色配音,这可能需要数小时的录音和演唱来训练,使未来 AI 角色摆脱声优的限制。我们为其提供 AI 生成的文稿甚至乐谱,它就能够自如地表达情感,这些 AI Being 可以互相之间社交,也可以与人类社交。
InfoQ:在元宇宙里面,AI being NPC 互相之间如何进行社交?
许怡然: 小冰设计的虚拟男友和虚拟女友拥有虚拟朋友圈,里面既有真人也有虚拟角色,形成了一个复杂的社交网络。在这个网络里,自发产生了一些有趣的事情。例如,有真人和虚拟角色谈恋爱,虚拟角色还会与其他虚拟角色谈恋爱,这些事情很有趣,但并非完全是小冰有意设计的,因为 AI 有可能自己学会了这些行为。虚拟角色之间也会有互动,这让这个世界变得更加有趣和生动。
InfoQ:那 AI Being NPC 的规则如何制定?
许怡然: 实际上小冰的大量时间都花在了规则制定上。就像 ChatGPT,在 GPT-3 和 GPT-4 两个版本的差异中,最大的进步之一就是能够设置更多的边界,让 AI 不会回答一些错误或者危险的问题。因此,做 AI 的公司都在这方面下了巨大的功夫。
InfoQ:去年 6 月,MultiMetaverse 与 AIGC 的代表公司小冰成立的 ICEGamer 游戏工作室达成合作,双方将围绕 AI Being NPC 与七创社《凹凸世界》IP,开发一款开放世界手游。双方的合作点主要在什么地方?请您介绍下这款开放世界手游的特性,应用的核心技术,目前的研发进展等情况。
许怡然:我们与小冰合作的这款游戏是一个跨平台游戏,不完全是手游,可能会在 PC、手机和未来的游戏机上推出。这款游戏也是使用 Unreal 擎制作的,品质很高,几乎可以被视为 3A 级游戏。
我们最早可能要等到 2024 年才能推出,因为一个 3A 级大作需要充分打磨才能达到最佳品质,一旦完成将非常优秀,值得期待。
游戏目前还没有正式的名字,但我们一定会利用《凹凸世界》的 IP 元素,将大家熟知和喜爱的角色通过 AI 技术呈现出来。但要注意的是,AI 技术的应用并不简单,每个特定的场景都需要进行特定的处理,例如在动画制作中,除了编剧之外还需要绘制分镜,这是一项非常繁琐的工作。我们也尝试利用 AI 技术来协助绘制分镜头,但要想做到真正高效且优质,需要投入大量的时间和人力。因此我们将持续努力,以确保游戏能够在最佳状态下呈现给玩家们。
InfoQ:大家认为现在 AI 生成的质量不太好,在游戏开发中,不知目前 AI 的准确率到什么程度了?如果未来 AI 生成的准确率不断提高,是否能在游戏开发中节约成本,毕竟游戏开发确实需要大量资金。
许怡然:是的,具体要看你是指哪个方面,是原画、动作、角色、场景、音乐音效、关卡还是测试,因为每个方向都是不同的。现在已经有许多公司在各个方向上进行开发了。我认为,通过大数据的训练,在每个方向上都可以实现巨大的成本节约,每个方向节约 10 倍的成本,乘起来就可能节约上万倍的效率提升。
很快,AI 编程也将成为可能。你不需要自己编写程序,只需告诉 AI 你的要求,通过简单的文字描述,AI 就能够帮助你编写实现复杂功能的程序。
InfoQ:在游戏开发中,AI 生成的准确度和质量如何?
许怡然: 需要具体看哪一块。举个例子,以前 AI 作画可能会出现不太准确的情况,比如画马时后背上多了一个鼓包,或者缺少一条腿,或者画不好人脸或手指头,这些问题最近已经都解决了,但是 AI 目前仍然无法画出让 IP 监修方满意的针对某一个 IP 的高品质的定向的输出。针对一些可以有精确反馈的场景,比如明确能判断输赢和有明确规则的打游戏、游戏测试等,准确度更高。
InfoQ:目前,元宇宙游戏到底发展到什么阶段了?
许怡然:AR 眼镜目前还没有普及。我认为这种设备的价格应该至少降到一两百美金,最贵也不应该超过三百美金。而且眼镜佩戴舒适度也很重要,就像戴普通眼镜一样,我一天可以佩戴十个小时甚至更久,要保证佩戴的舒适度,我认为这还有很长的路要走。
元宇宙游戏虽然有一些小型的应用程序问世,例如我之前提到的《Pokemon GO》,或者利用 AI 去开发一些中心化的游戏等等,但我认为, 它们还没有破圈。
因此,无论从哪个角度来定义元宇宙游戏,我仍认为它们都处于非常早期的阶段。面向大众的 VR 游戏、AR 游戏以及 AI 自动生成的游戏也都离我们很远。
InfoQ:根据您的判断,元宇宙游戏在 2023 年将呈现什么样的发展趋势?
许怡然: 我认为 UGC ,或者在 AI 辅助下的 UGC 会很快流行起来。例如,《凹凸世界》之所以能够大火,最初是因为设计人员在设计人物形象时将草稿放在网上,吸引了大量粉丝提出了许多宝贵的意见和建议,这些意见和建议促进了游戏的改进和发展,这种共同创作的案例值得我们借鉴。我们可以将更多的内容开放给玩家,让玩家参与到内容的创作中来。
MultiMetaverse 公司的方向是将我们收购的所有 IP 中能够开放的部分都尽可能地开放出来,让更多的玩家参与到内容创作中来,并让他们分享到我们的收益。将 AIGC 和 UGC 相结合,再加上官方的 PGC,这个三角如果结合在一起的话,我认为未来会创造一个非常好的内容创作环境。总的来说,未来三五年,我认为会有越来越多的游戏和娱乐产品将玩家和 AI 纳入内容创作的过程中,这种类型的产品会越来越多。
举个例子,我们公司现在做了一个叫“脑洞”的即时通讯工具,它利用了一些 AI 算法,能够将文字聊天自动转化成漫画或动画片。在聊天框上面会出现聊天者的虚拟角色形象,它们会自动演绎用户间的聊天内容,上面是漫画,下面是文字。通过聊天的方式,用户可以非常容易的制造出一个漫画或动画。比如你可以选一个《凹凸世界》的角色,你的朋友也可以选一个,然后你们俩聊天,这两个《凹凸世界》的角色就在上面,屏幕的上半部分就变成了漫画,就像在玩角色扮演。
我们将这个工具与 ChatGPT 对接后,发现出现了一个非常有趣的现象。你可以与 ChatGPT 代表的角色聊天,聊天内容就会非常不同。甚至我们可以让两个 AI 互相聊天,但你需要让粉丝中懂《凹凸世界》的人来训练 AI,让它能够用《凹凸世界》角色的身份去说话,不能是一个普通的 ChatGPT 去说话,那样没意思。
这个过程还是需要人工参与。我们需要用很多《凹凸世界》的粉丝来帮助我们与 AI 聊天,然后教会 AI《凹凸世界》中的角色怎么说话,哪个角色的剧情是怎么样的。最终训练出来的 AI 就能够与粉丝进行更有趣的对话。所以这是 UGC、AIGC 和 PGC 结合的一个案例。
目前,我们公司内部已有编剧,借助我们的产品来制作漫画。虽然我们的漫画部门的创作非常辛苦,但是我们已经通过创新方法缩短了 PGC 漫画的创作周期。将来,我们可甚至以利用 AI 自动生成无限的剧情结局,让每个人粉丝玩的结局都不一样。这可能是游戏动漫的未来,甚至可能非常快就会出现。
当然,现在的问题是编剧瓶颈,因为编剧是一项创造性的工作。但未来,也许 AI 可以帮我读完所有《凹凸世界》的情节,尝试协助我编写。即使它编写的 100 个情节中有 99 个不好,总比我自己费尽心思想不出一个要好。
InfoQ:2023 年,AIGC 在游戏设计创作领域的应用将呈现出怎样的趋势?国内外用到这个技术的公司多吗?
许怡然: 虽然现在使用人工智能技术的应用场景还不是很多,但是我身边有越来越多的人开始使用它了。例如,在动画制作中,以前必须进行动作捕捉,即需要让真人穿上服装,跳到动作捕捉机器上。现在,我们可以通过普通的摄像头进行捕捉,或者使用 AI 来自动生成动画。
我还看到越来越多的公司已经开始使用 AI 测试和陪玩等应用。在游戏美术制作方面,也可以使用人工智能技术。例如,我们可以通过语音命令,让 AI 自动生成山、瀑布、河流等场景,然后在场景中种植树木、放上草地、石头等元素。这样,未来制作游戏,美术的过程将变得更加简单和快捷。
我认为,未来人工智能技术的应用将呈现爆发性增长。很多需要耗费数千人力和数年时间才能完成的任务,现在只需要三到五个人半年时间就能完成。
许怡然,MultiMetaverse CEO,七创社董事长。25年游戏娱乐/互联网行业经验,7年自主创业经验,2002年开始涉足风险投资,2003年起担任上市公司高管。曾任360游戏事业部总裁,完美世界CBO,巨人网络投资总监,EA亚太外包经理,搜狐新业务发展主管乐游科技控股CEO等职。曾创办中国早期的独立游戏工作室之一,参与及负责多家游戏公司的投资并购,包括17173,美国Cryptic Studio,Runic Studio,Unknown Worlds,Certain Affinity,日本SNK,加拿大DigitalExtremes等案例。2016年12月,被评为2016年度中国游戏产业十大影响力人物。
你也「在看」吗? 👇
微信扫码关注该文公众号作者