Redian新闻
>
一键实景转动画,清华系初创公司全球首发4D骨骼动画框架,还能生成个性化角色

一键实景转动画,清华系初创公司全球首发4D骨骼动画框架,还能生成个性化角色

公众号新闻
机器之心专栏
机器之心编辑部


前几日,苹果宣布首款虚拟头显设备 Vision Pro 将于 2 月 2 日正式发售,XR 设备作为下一代终端预计将迎来快速发展。未来随着虚拟显示设备的普及,数字交互将从平面走向立体,立体模型、立体动画将成为未来主流的内容形态,虚实融合下的多维沉浸式交互也将成为潮流。


但从数据规模看,现阶段内容产业的数据积累仍以 2D 图像、平面视频为主,3D 模型、4D 动画等数据基础较为薄弱。其中,4D 动画是在传统 3D 模型的基础上引入时间序列,即随时间变化的 3D 模型,可以呈现出动态立体效果,在游戏动画、电影特效、虚拟现实等领域具有广泛的应用,但也是目前内容生态开发中最困难的环节。


因此,面向即将到来的多维沉浸式体验,构建立体化的数字内容将成为重要的基础性工作。


面向该前沿领域,清华系创业团队生数科技开展了系列研究和产品研发,于近期联合清华大学、同济大学等高校推出全球首个基于「骨骼动画」的 4D 动画生成框架「AnimatableDreamer」,能够直接将 2D 视频素材一键转成动态立体模型(即 4D 动画),支持自动提取骨骼动作、一键转换动画效果并可通过文字输入进行个性化角色生成。



  • 论文地址:https://arxiv.org/pdf/2312.03795.pdf

  • 项目地址:https://animatabledreamer.github.io/

  • 论文标题:AnimatableDreamer: Text-Guided Non-rigid 3D Model Generation and Reconstruction with Canonical Score Distillation


大家可以看以下Demo视频。


全新内容生产方式

颠覆立体动画开发流程


过往业界制作立体动画,需要经过 3D 建模、贴图渲染、骨骼绑定、动画制作等复杂流程,需要建模师、动画师等专业人员参与才能完成,效率低、成本高。据统计,单一个静态 3D 模型建模的生产周期就在数小时到几天时间,成本可高达上千美元,再进行动态化处理成本投入将更高。


从官方发布的 demo 视频可以看到,上传一段松鼠的 2D 实景视频,通过输入「A squirrel with red sweater」(穿红色毛衣的松鼠)的文本描述,原本实景的松鼠一键转成动画风格,而且完美保留了动作姿势,同步还可生成 360 度视角下的立体动态模型,通过切换文字描述,可以自定义角色,将松鼠任意切换为狐狸、杰尼龟等不同的卡通形象。


「AnimatableDreamer」可自动提取视频中目标对象(人物、动物等)的骨骼动作,再通过文本描述将该对象转换为任意的带骨骼动画模型。整个过程不受模版限制,支持任意视频长度和任意类型动作,具备高度的时间一致性和多视角一致性,并且导出的动态立体模型,能够在任意 3D 环境中进行渲染。


面向影视动漫等领域的后期制作,通常需要针对动画做更多编辑,「AnimatableDreamer」也支持针对已经完成骨骼绑定的模型进行更换或编辑动画文件,实现更高的自由度。未来相关技术逐渐落地后,游戏开发、影视动画等场景的 3D 建模、动画制作流程,有望变得更加高效。


面向未来

有望形成全新的内容生态


在实现原理上,研究团队创新性地提出了规范得分蒸馏策略(Canonical Score Distillation,简称 CSD),在随时间变化的相机空间中对不同帧及不同视角的 3D 模型进行渲染及降噪,并统一将梯度回传至不同相机空间共享的规范空间中进行蒸馏,将 4D 生成降维至 3D,即将 4D 生成问题简化为 3D 空间上的生成。


「AnimatableDreamer」能直接从视频中提取关节动作,通过解耦物体的模型与运动,生成的模型具备高度的时间一致性和几何合理性,不受视频长度限制,而且能有效地消除如形状断裂、闪烁和多视角不一致等问题。



在有限视角和大幅度运动的场景中,由于引入了 Diffusion 模型的先验知识,即便输入的视频未覆盖完整物体,「AnimatableDreamer」也能自动补全画面信息,实现较好的生成质量。



可以说,「AnimatableDreamer」的提出直接打通文本到 4D 骨骼动画的生成,建模、贴图、骨骼绑定、动作驱动一气呵成!输入自然语言描述,自动输出立体动画视频,无需专业知识,普通人也能直接上手,轻松定制动画内容。


以「AnimatableDreamer」为基础的工作将大大降低 3D、4D 数字内容的生产难度,将交互体验丰富化,让每个人都能进行创意内容的生成和编辑,将催生出 3D 时代下全新的内容娱乐与内容消费模式。


畅想一下,在未来的虚拟世界中,用户可以快速搭建自定义的数字空间,打造个性化的交互体验。例如:


  • 数字空间下的每个人物形象可以任意个性化的生成,比如给小朋友穿上超人的衣服、万圣节随意切换节日主题服装等;

  • 养宠物的用户可以将自家宠物卡通化,例如将其生成虚拟的米老鼠形象。宠物日常就如卡通片一样,主人跟宠物的日常互动将变得趣味横生;

  • 人与人的互动方式也变得更丰富,随时随地可以来上一场主题派对,实时生成想要的派对环境、人物装扮等等。


作为一家成立不到一年的初创公司,生数科技团队长期致力于图像、3D、视频等多模态大模型领域,在 9 月份发布了 3D 资产创建工具 VoxCraft,在 Discord 正式上线,支持文图引导、分钟级创建 3D 模型、3D 贴图自定义更换等功能,赋能游戏开发、影视动画等场景的 3D 建模流程。此次推出的 4D 骨骼动画生成是生数科技的又一项全新探索工作,未来将在 VoxCraft 的产品中进行集成。


VoxCraft 工具地址:https://voxcraft.ai/


苹果 Vision Pro 的来临不仅仅是硬件设备层面的重要革新,同时也将开启一场内容和体验革命的序幕。4D 动画生成等生成式 AI 的创新能力,除了带来更好的视觉呈现,还将以全新方式打开多维数字体验,为下一代人机交互带来更多可能。



© THE END 

转载请联系本公众号获得授权

投稿或寻求报道:[email protected]

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
榜单预热丨胡润百富即将联合环球首发发布《2023环球首发·胡润中国食品行业百强榜》爆款图像工具Magnific背后:两个人的初创公司【资讯】新型服务兴起,巴黎初创公司帮你清除网络痕迹数百家初创公司,没撑过AI爆发式增长的2023年谁是 2023 年不列颠哥伦比亚省最具影响力的计算机初创公司?【行业日报】美国岗位缺口创新低!AI学习初创公司获巨额融资!Adobe收购 AI 视频初创公司;淘宝推出全新特色店铺与商品体系;Redmi K70系列发布会定档;斗鱼称开展清朗行动...新型服务兴起,巴黎初创公司帮你清除网络痕迹芯片初创公司,要部署100万颗AI芯片中美言和,美一众跟班尴尬了提供因客而变的个性化顾问服务 中欧财富私享家上线谁是 2023 年加拿大数据可视化初创公司中的领先影响力驱动者?能源革命:谁是温哥华最具影响力的绿色初创公司?储朝晖:聚焦个性化成长的全称教育学理探索冷却的不止季节(124)— 任是无情也动人(完结篇)何小鹏和余承东论战AEB背后,初创公司围攻传统Tier 1巨头你正在找工作? 2024年加国最佳初创公司出炉NeurIPS 2023 | 从分布鲁棒优化角度理解对比学习的鲁棒性和温度系数的意义女人不坏,男人不爱加拿大哪些工业工程初创公司正在崛起?前阿里员工抄袭YC初创公司并开源,老外:反正官司打不赢,不费那个劲了谁是 2023 年魁北克最具影响力的软件初创公司?法国初创公司SilMach的基于MEMS的技术或可彻底改变制表业大模型驱动AI Agent,个性化应用成为可能编码数据集生成框架 UnitGen 0.4.0:代码文档生成、测试代码生成AI角色扮演再进化,清华提出CharacterGLM,支持AI角色高度定制化5年级前从没想过“三公”,孩子1年后进了上外附?牛娃妈:太舍得下功夫做个性化教育了!Airbnb入局ADU,这些科技盖房初创公司纷纷融大钱揭秘硅谷巨头AI初创公司投资布局!英伟达ALL IN,微软-OpenAI式关系引反垄断调查「文生图」再升级!学习个性化参照,无限生成多样图片,轻松设计玩具建筑6052 血壮山河 卢沟桥之变 21【周末综艺会10期】— 汤汤水水【行业日报】七大科技股2024迎来惨淡开局!AI搜索初创公司获5.2亿美元融资!艾伯塔省卡尔加里的哪些石油和天然气初创公司在2023 年脱颖而出?科技国潮 | 莲花健康李涛:个性化定制时代即将到来
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。