Redian新闻
>
拿摄像机对自己一通拍,就能做出一个跟你自由对话的AI NPC?英伟达已经这么强了么

拿摄像机对自己一通拍,就能做出一个跟你自由对话的AI NPC?英伟达已经这么强了么

公众号新闻

数字生命听说过吗?先别急着回答,看看下面的视频。
视频中展示的两个虚拟角色,他们的对话都是由人工智能生成的,而且每次对话的内容也都是不重复的。这个项目叫做Kairos,是Convai使用英伟达ACE(Avatar Cloud Engine)制作而成的。简单来讲,ACE是一种人工智能定制服务,可通过人工智能驱动的自然语言交互,为NPC带来智能,使其拥有自主性,从而改变游戏。
其中使用最多的是ACE里面的Omniverse Audio2Face,就和他的名字一样,这是一个将声音转到3D角色面部的软件。Audio2Face的本质是3D角色面部特征进行动画处理,以匹配任何配音轨道,下面视频是游戏《潜行者2》的一段演示,游戏中的NPC“游民”和“可儿舒诺夫”面朝镜头向玩家说话,角色的面部表情和说话时嘴型的变化都如同真实的人一样。

放在过去,想要实现这种角色面部五官能配合角色说话的动画,需要把角色的面部分解成不同的点,每一帧每一帧地调整这些点,使其能对应上角色的口型变化。哪怕是过去画面特别好的游戏,角色在说话时面部表情也都是非常僵硬的,原因就在这里。整个动画制作过程是非常繁琐复杂的,短短半分钟的对话,需要耗费将近两个礼拜的时间来制作。
但是有了Audio2Face后,情况就不一样了。你只需要像视频里一样,找个摄像机拍下你念台词时的面部表情。最后导入进Audio2Face就完成了,角色的面部表情变化就会跟你一样了。甚至连那些非现实人类外观的角色,也能适配Audio2Face。
一些离我们比较近的游戏厂商,比如米哈游、腾讯和网易,也都在使用ACE进行游戏开发。腾讯在2023年TGA上公开了旗下光子工作室游戏《Last Sentinel》的预告片,采用的就是英伟达ACE提供的解决办法。
事实上早在2023年中期就已经有使用ACE进行开发的产品了,就拿上文提到的Kairos来说。2023年5月的时候,Convai发布了产品演示视频,通过ACE和生成式人工智能创建的NPC。只不过当时产品里只有一个NPC,2024年CES上展示的是有两个NPC,两个NPC之间还可以对话。
《潜行者2》此前的预告片里也能看出端倪,早期预告片中为了展示ACE带来的效率提升,特意加入了一些角色之间语气强烈的对话内容。在上文提到的最新版预告片里,则是干脆直接把角色正脸甩到镜头前,让玩家好好看,仔细看,ACE做出来的角色到底有多牛!


ACE是怎么实现的?

难道你就不好奇吗?英伟达ACE为什么能把工作量那么庞大的3D动画给安排的明明白白的
ACE本身由4个部分组成,分别为动画人工智能、语音和翻译人工智能、生成式人工智能和通用场景描述(也就是图里的OpenUSD)。刚才提到的Audio2Face,就属于动画人工智能这块。
ACE的本体叫做统一计算架构(UCF,Unified Compute Framework)。这是一个比较典型的低代码架构,专门用于开发云原生、实时和多模态人工智能应用程序。它具有用于微服务和应用程序的低代码设计工具,以及一系列优化的微服务和示例应用程序。通过采用微服务架构方法,统一计算框架使开发者能够将微服务组合成云原生应用程序或服务,以满足交互式人工智能用例的实时需求。
请注意,在计算机领域的微服务,和现实世界的微服务压根不是一回事。这里的微服务是一种架构风格,它将一个大型应用程序划分为一系列小型、松散耦合的服务。每个微服务都围绕着特定的功能或业务能力构建,运行在自己的进程中,并通常通过轻量级的机制与其他服务进行通信。这些服务可以独立于彼此部署、升级、扩展和维护,从而提高了整个应用程序的灵活性和可维护性。如果把整个架构比喻成一台机器,微服务就是齿轮传动装置。
UCF中的每个微服务都有一个限定的域上下文(如视觉人工智能、对话人工智能、动画人工智能与渲染、数据分析等),并且可以在应用程序内独立部署、管理和扩展。从应用程序中抽象出每个域减少了对低层次域和平台知识的需求。利用UCF,开发人员可以在极短时间内就创建好需要的应用。这是低代码架构的优势,可以把过去需要几个月时间写的代码,仅仅只对UCF输入一段话,描述代码想要实现的功能,就能生成相应的应用程序。
所以从构成的角度来看,ACE的各种功能就是UCF上的各种微服务。不过微服务只是实现的方式,大量的3D图形计算光靠方式上的创新是绝不可能实现的。这里就要提到ACE的“靠山”了,那就是英伟达Omniverse。
光看名字,是否能看出一些门道呢?不错,Omniverse就是英伟达的元宇宙。Omniverse是一个可以精确模拟物理规则的3D场景工具,允许用户在Omniverse共享虚拟空间中进行实时协作。包括光线追踪和DLSS在内,只要是英伟达有的技术,Omniverse上面都有。2021年宝马的数字孪生(digital twin)就是在Omniverse上开发的。懂赛车的朋友可以把Omniverse想像成虚拟世界的风洞试验,只不过它运行的速度是现实中风洞试验的数万倍。
最重要的,Omniverse提供了英伟达对人工智能算法的优化以及算力支持,这就使得ACE可以依靠人工智能来实现传统3D动画领域没办法实现的功能。
举个简单的例子,腾讯的Vtuber星瞳,她是通过动作捕捉技术和Unity 5来实现的。Unity 5用的是企业版,服务器承载没有限制,一个月合人民币1000块钱出头。动作捕捉设备一套没20几万下不来,同时因为要进行实况直播,实时渲染对计算资源的需求非常大,服务器费用合计下来每个月也要1万多块钱。再加上这些技术都需要相关专业人士,星瞳每场直播的成本是非常高的。
然而在有了ACE后,人人都可以是星瞳,甚至画面表现力要超过星瞳,且成本价格远远低于她。
自英伟达ACE出现的那天开始,就有可能颠覆整个3D动画产业。如果给英伟达一到三年的时间来运营和优化ACE,未来的3D动画产业从业人员就变成两种:一种是会用人工智能的,一种是不会用人工智能的。


欢迎加入这个星球,见证硅基时代发展↓

点个在看,再走吧👀

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
「唤醒」NPC,这家融资过亿的国内创企在做一种很新的游戏《我的世界》化身AI小镇,NPC居民角色扮演如同真人高情商的NPC来了,刚伸出手,它就做好了要配合下一步动作的准备当NPC开始独立思考,这世界还是草台班子吗?Costco新规:进门要刷卡了?!Issaquah已经这么做了!致2024|已经这样了,放过自己吧奔驰总裁找李冰冰代言,李冰冰羞答答说让总裁送自己一辆,没想到脸丢到家了解密PC的AI进化:AI大模型如何“压”进PC?以为大哥是误入滑道原来是NPC!美国Top级综合大学,艺术专业也这么强?台湾“蓝白”合谈成了,开创台湾新纪元!随记阿里巴巴的新模型AnyText:动动嘴就能1分钟做出一张电商大促海报再传“抖音与阿里巴巴洽谈收购饿了么”,饿了么、抖音回应在那个充满大话的年代,他们做出了真正的技术革新——汤卡罗教授访谈录像Docker一样编排大模型应用程序:这支十余人的年轻创业团队如何在2个月做出一个LLMOps平台?英伟达也在下一盘AIPC的大棋快餐式的情欲上班之后代入不了小说的原因...我们NPC的命也是命啊英伟达的美国对手们已经开始拿中国攻击英伟达了AI何以重塑PC?英伟达新对话QA模型准确度超GPT-4,却遭吐槽:无权重代码意义不大不逼自己一把,就是降低自己患抑郁的风险英伟达CES三款芯片连发,市值暴涨超6%,AI PC时代来临经验大放送 | 人要朝前看,在这里写下我一战985应统失败的总结,算是给自己一个交代,也分享给学弟学妹!苹果的M3芯片这么强,难道Mac真的可以打游戏了?咀外文嚼汉字(293)药草; 香草;“巴吉尔”,“罗勒”又被震惊到了,哈马斯背后的大哥,势力这么强大?手机性能都这么强了,为什么还有人在搞安卓掌机?台湾国民万能卤味包! 做卤料还能这么简单,超方便就能做出好吃的味道黄小姐装修记||50岁前,给自己一个满满登登、又舒适且很美的南洋风独居小公寓渡十娘|对自己满意和爱自己,区别是什么?2024新的一年,给自己一个新的可能英伟达的VoxFormer太强了!6049 血壮山河 卢沟桥之变 18
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。