Redian新闻
>
小鹏公然AI“造假”,啧啧啧

小鹏公然AI“造假”,啧啧啧

科技
金磊 发自 凹非寺
量子位 | 公众号 QbitAI

家人们,我们先来看一段视频,你能否发现其中有什么异样?

如果说,在这段视频里,有一个物件是假的,是被合成进去的,你能发现吗?

不卖关子,现在就来揭晓答案。

“造假”的物体,正是这个出现在不该出现位置的红绿灯。

我们再来玩一把“大家来找茬”,请看题目:

答案是:放在置物架上的这个设备。

这就是来自小鹏汽车最新的一项研究——Anything in Any Scene

主打一个往真实环境里毫无违和感地“塞”进去任何东西。

并且研究团队给予这个通用框架的评价是:

它的应用远远超出了视频数据增强的范围,在虚拟现实、视频编辑和其他各种以视频为中心的应用中显示出巨大的潜力。

甚至有网友在看完效果之后直呼:

再见了视频证据~这个技术插入视频的物体可以保持与原始素材相同的真实感。

那么这项AI技术更多效果如何,我们继续往下看。

Anything in Any Scene

先从室外场景来看下效果。

在视频中合成某个物体的时候,往往不逼真的原因,可以总结为位置放置错误、无阴影、无HDR和无样式迁移等原因。

正如下面几个错误案例所示:

而小鹏团队的效果,是这样的:

相比刚才缺少各种因素的情况而言,效果显然是相对逼真的。

再与其它已有的算法和框架做比较,例如DoveNet、StyTR2和PHDiffusion,它们在室外场景中合成物体的效果是这样的:

小鹏的Anything in Any Scene从效果上来看,依旧是相对更为逼真。

同样的,在室内环境中,不论是包包还是鞋子,小鹏新AI技术所生成的效果可以说是真假难辨的那种了。

更多的效果展示如下图所示:

除了视觉效果之外,小鹏团队在CODA数据集的原始图像上,将训练的YOLOX模型的性能与Anything in Any Scene框架在原始和增强图像的组合上训练时的性能进行了比较。

从整体精度上来看也有了不小的提高。

怎么做到的?

从此次提出的框架上来看,Anything in Any Scene主要由三个关键部分组成。

首先是物体放置和稳定化的过程。

团队先确定相机在场景中的世界坐标系位置,并将其作为物体插入的参考点;使用相机的内参矩阵和姿态(旋转矩阵和位移向量)将世界坐标系中的点投影到像素坐标系中,以确定物体在视频帧中的放置位置。

为了避免与场景中其他物体的遮挡,团队还使用语义分割模型估计每个帧的分割掩模,并确保物体放置在未被遮挡的区域。

在物体稳定化方面,团队在连续帧之间估计光流,以跟踪物体的运动轨迹;并通过优化相机姿态(旋转矩阵和位移向量),最小化物体在连续帧中的3D到2D投影误差,确保物体在视频中的稳定运动。

其次,是光照估计和阴影生成

针对HDR全景图像重建,团队使用图像修复网络推断全景视图的光照分布,然后通过天空HDR重建网络将全景图像转换为HDR图像;并结合使用GAN训练编码器-解码器网络来模拟太阳和天空的亮度分布。

在环境HDR图像重建方面,研究人员则是收集了场景的多视角LDR图像,并通过现有模型恢复为HDR图像,以学习连续曝光值表示。

在物体阴影生成上,团队则是使用3D图形应用(如Vulkan)和光线追踪技术,根据估计的主要光源位置生成插入物体的阴影。

最后的步骤,则是照片风格迁移

框架对插入物体的外观进行微调,使其风格与背景视频完美融合,进一步提升了视频的逼真度。

这便是小鹏Anything in Any Scene在真实环境中生成物体较为逼真的原因了。

而与小鹏此次研究类似的效果,其实早在之前便有了许多工作。

例如名为GAIA-1的多模态生成式世界模型,便可以从头到脚的打造逼真的自动驾驶视频:

这里的每一帧都是由AI生成,甚至就连不同的路况和天气等等,都是可以做到以假乱真。

就连LeCun看了都惊叹不已:

不过这些AI效果虽真实,但也有网友提出了担忧之处,那便是网上虚假、生成的信息越发的逼真;因此,以后辨别信息的真假需要更加警惕。

目前,这个项目已经在GitHub中开源,感兴趣的小伙伴可以了解一下了~

参考链接:
[1]
https://anythinginanyscene.github.io/
[2]https://arxiv.org/abs/2401.17509

—  —

点这里👇关注我,记得标星哦~

一键三连「分享」、「点赞」和「在看」

科技前沿进展日日相见 ~ 

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
双林奇案录第三部之鹤鼎莲方壶: 第二十四节小夫妻地下车库“造娃现场”被偷拍,网友:这基因也太强大了哈哈哈房子卖得不错,这些开发商春节给员工放“超级长假”:最多的20天!“放6个月长假”?“停卡停工”?捷荣技术员工质疑遭变相裁员AMC又又又出事!考试27分钟强制交卷!国内某高中曾“集体作假”几十个AMC12满分?官方回应……《细雨长歌》&《推开世界的门》顶尖211一课题组11位硕士、博士生成员实名联合举报导师学术造假!校方最新回应:存在学术造假35.98万元起!小鹏X9上市,何小鹏:希望它能跳出MPV品类啧啧,还能再次塌房啊?停课已六天!麻州亚裔聚居市教师罢工,11600多名学生“被迫放假”开眼了,这些老牌国货全是“假”,90%的人都上过当!联合腾讯网易等大厂登陆27省,看华为游戏中心如何“造节”短剧新势力爆发,AI“造剧”你会追吗?《星级男人通鉴》第52章 福建人的媳妇又上热搜!胖东来新增10天“不开心假”,管理层必须批,不批就违规!创始人:谁都会有不开心的时候萌宠 | 我也许是版上家养“造粪机”最多的人了3月两起命案:男孩遭杀害、女医生刎颈,让我想起20年前的“真假”女同学注意!Centrelink将在澳洲日“休假”,付款日期受影响,服务中心关闭大模型“造车”,这家企业初尝甜头盒马上线宠物商品;住范儿获一亿元战略投资;太二酸菜鱼愚人节宣布“造车”... | 刀法品牌热讯走吧,乘着火车转南疆(上)震撼!幼师、小学老师两对夫妻交叉贴A4海报令人啧啧称奇![啧啧]加拿大建筑工人惊爆!已没人买房!大批人失业、破产跑路出国!行业地震!从王局看日本居留的难度小红书的上海千金们“互撕打假”:真正的豪门从来不靠炫......啧啧,吃完红利就翻脸不认人了?娄乃鸣:央视最能“造星”的导演,抗癌24年,至今丈夫不离不弃“统计造假”被纳入党纪处分范畴,国家统计局答记者问高管大换血!总裁王凤英丈夫入职小鹏,频换高管真的能救小鹏吗?公然“造假”,却被央视吹爆!毁三观的AI产品,凭啥价值千亿?富二代小学生竟然送我一辆车?!啧啧啧大开眼界了...知名女星被曝“造假”,妈妈们却狠狠共情了?网友:原来当妈后大家都一样河南方城一学校火灾致13人遇难,“这周刚好不放假”[啧啧]留不住人,加拿大新移民回流人数急剧上升,原因或是这个建立“造车”联盟后,华为的充电“野心”也藏不住了?
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。