Redian新闻
>
李飞飞团队实现“隔空建模”,透过遮挡物还原完整3D人体模型

李飞飞团队实现“隔空建模”,透过遮挡物还原完整3D人体模型

公众号新闻
克雷西 发自 凹非寺
量子位 | 公众号 QbitAI

注意看,这个男人搬着一个长长的柜子,画面中半个人都被遮挡住了。

但即使有这样的遮挡,男人的整个身体在AI面前依然是无所遁形。

哪怕是蹲在椅子背后只露出头,依然可以被模型完整还原。

从遮挡物背后把人“揪”出来的,是李飞飞团队推出的人体建模新工具Wild2Avatar(本文简称W2A)

只要一段4秒左右的的单角度视频,就能构建出完整的3D模型,有遮挡也不怕。

相比此前的SOTA方法,Wild2Avatar在人体建模上可谓是实现了质的飞跃

建模效果完胜Vid2Avatar

从下面的对比图中(从左到右依次为带遮挡原图、Vid2Avatar提取结果和W2A提取结果)可以看到,作为baseline的Vid2Avatar方法只能大概描绘出人的轮廓,遮挡物直接被“拍扁”到了人物身上,而且轮廓看上去也不够准确。

而W2A提取出的任务不仅轮廓更加精确,看上去也更具立体感,关键是遮挡物被完美地去除,显现出了完整的人物结构。

对遮挡物的去除,W2A操作得也更为彻底,没有留下多余的痕迹。

而baseline中部分结构缺失的现象,在W2A中也没有发生,人物的结构十分完整。

而且,W2A的人物建模是动态的,视频画面中,就算整个人都藏在椅子后面,依然可以输出人物模型。

和另一baseline OccNeRF相比,W2A只需100帧的训练视频就能复原出完整干净的结构,但后者用了500帧的系列视频后不仅结构缺陷极大,还存在许多“鬼影”。

测试数据也表明,对于陌生场景,W2A的提取质量和完整性(comp.)都比V2A有所提升,特别是对遮挡(llm)部分,合成质量得分接近翻番

和OccNeRF相比,W2A与500帧训练数据的OccNeRF整体成绩接近,但遮挡部分仍然是有明显增强。

那么,Wild2Avatar是如何实现的呢?

人物与遮挡分层处理

工作过程中,W2A将整个场景分成了遮挡物、人物本体和背景三部分

这三个部分由独立的NeRF网络分别预测特征,渲染图像时再将三个部分的输出拼合。

这种做法的主要目的是为了避免遮挡被误当成人体的一部分,出现Video2Avatar那样把遮挡物合成进人物的情况。

具体来说,李飞飞团队将图像映射到一个球空间,背景位于球外,人物和遮挡物则分别位于球空间内部的不同位置。

遮挡空间是通过内部采样点的坐标和距离来构造的。用于遮挡部分的生成网络与背景共享,可以预测遮挡空间样本点的颜色和密度值。

而人体部分的处理则是使用SMPL的参数化方式,通过正向和反向皮肤拟合,先将人体变形到一个姿态不变的坐标空间,再输入神经网络进行学习。

为了增强任务模型的完整性,李飞飞团队还设计了新的损失计算方式

首先利用现成的分割模型输出人体的二值分割掩码,并掩码取反得到“非人体”区域的掩码,即为可能的遮挡区域。

同时,从W2A渲染的三个部分中遮挡部分的密度图,然后根据提取结果再分离出人体部分。

其中人体部分与前面得到的“非人体”掩码进行与非运算,得到的结果再和遮挡部分的密度图做二值交叉熵运算,就得到了遮挡解耦损失Locc。

Locc会与像素重构损失、场景分解损失等其他损失参数一并纳入到整个网络的端到端训练过程,用于优化更新网络参数。

论文地址:
https://arxiv.org/abs/2401.00431

—  —

点这里👇关注我,记得标星哦~

一键三连「分享」、「点赞」和「在看」

科技前沿进展日日相见 ~ 

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
李飞飞团队新作:AI透视眼,穿越障碍看清你,渲染遮挡人体有新突破了Molecular Cell | 北京大学魏文胜团队实现人类蛋白质组中赖氨酸位点的功能解码几何纹理重建新SOTA!浙大提出SIFU:单图即可重建高质量3D人体模型AI「脑补」画面太强了!李飞飞团队新作ZeroNVS,单个视图360度全场景生成《大炮、病菌和一场春梦》 (10) 那一年的记忆,除了战争和瘟疫,还有我做的春梦2023,报复性旅游之伦敦我行我素的傻子李飞飞、吴恩达对谈:这一次,AI 冬天不会到来梗里找游戏?《国足奇侠传:非法足球》公开!艾什莉体模在《如龙8》自我攻略!Transformer变革3D建模!MeshGPT来了!效果惊动专业建模师。。。完整还原英国网红钢琴师冲突事件周迅人体模特画曝光,18岁为艺术献身,成名后,画作值千万引无数土豪大佬争抢!弥合2D和3D生成之间的次元壁!X-Dreamer:高质量的文本到3D生成模型从洗碗工到斯坦福教授,“AI女神”李飞飞谈逆袭:找到自己的“北极星”最重要透过“荣昌式跃迁”,看到中国医药产业的确定性浦创智能,技术创新助力HUD人机交互体验升级|年会展商自家海景被棕榈树遮挡,悉尼女子与邻居闹上法庭,请求砍伐被驳Transformer变革3D建模,MeshGPT生成效果惊动专业建模师,网友:革命性idea让3D编辑像PS一样简单!GaussianEditor:在几分钟内完成3D场景增删改!Mol Cell|北京大学魏文胜团队实现人类蛋白质组中赖氨酸位点的功能解码李飞飞团队新作:脑控机器人做家务,让脑机接口具备少样本学习能力字节让达芬奇和蒙娜丽莎“隔空吵架”,只需一张图、一段音频、一个情感片段GPU短缺、Agent兴起、虚假信息扩散,李飞飞&斯坦福HAI对24年的AI预测李飞飞、吴恩达开年对话:AI 寒冬、2024新突破、智能体、企业AI红色日记 骑车外调 5.16-23GauHuman开源:基于Gaussian Splatting,高质量3D人体快速重建和实时渲染框架ICLR 2024 | 高分工作!Uni3D:3D基础大模型,刷新多个SOTA!美女车祸和汽车安全碰撞试验李飞飞团队新作:AI透视眼!渲染遮挡人体有了新突破!意念操纵机器人成真!李飞飞团队打造,做家务玩游戏样样能行周迅人体模特画曝光,18岁为艺术献身华为与小鹏汽车互怼?两位大佬朋友圈“隔空回应”重塑3D生成核心理论:VAST、港大、清华用「零」训练数据生成了3D模型10名孩子惨遭“隔空猥亵”!大多数不到8岁!这些话要尽早对娃说李飞飞新书《我看到的世界》正式发售!忧心斯坦福没有训练ChatGPT算力,自称不是AI毁灭派
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。