Redian新闻
>
用A4纸当屏幕「播放」宫崎骏动画,随意抖动都毫无破绽

用A4纸当屏幕「播放」宫崎骏动画,随意抖动都毫无破绽

公众号新闻
Alex 发自 凹非寺
量子位 | 公众号 QbitAI

你有什么端菜小妙招吗?怎么晃都不撒的那种!

如果没有的话,不妨看看这个:无论怎么动,盘子和食物都安然无恙。

Emmm……其实细看的话应该还是能发现,这并不是什么端菜妙招(对不起~),这个盘子和热狗也没有被粘起来,而是后期合成的

这群把AI合成图像玩出花来的研究者们,分别来自香港中文大学、浙江大学,和英伟达。

除了“空降”一盘热狗,他们还把宫崎骏的《龙猫》搬到了一张白纸上,而且任意弯折、移动都不影响播放。

而这张白纸其实并没有经过特殊处理,我们看到的“画中画”也是AI合成的。

不过——“众所周知,视频不能P,所以这是真的!”(手动狗头)

此外,这些人还给哔哩哔哩小电视的眼睛和嘴巴换了个色儿。

现在,相关论文已被图形学顶会SIGGRAPH Asia 2022收录。

下面就来看看他们具体是如何实现这些神操作的。

用神经网络实现在纸上放视频

要弄清楚怎么在纸上放连续动画,不妨先从简单点儿的一张图说起:

如何将抖动纸张上的一幅画换成另一幅画,并且让人基本看不出P图痕迹?

第一步是收集各种素材。就拿梵高的《星空》来举例子,首先要在不同的角度、光照条件、抖动情况下拍摄这幅图。

然后就到了关键一步:需要一个AI来预测《星空》在各视频画面中的光流,并将其替换成其他的图片。

这里简单说下光流是个什么东西:在计算机视觉中,光流就是个关于物体运动的概念,可表示为连续两帧图像中,代表同一目标的像素点的位移量

为了达到丝滑逼真的视觉效果,研究者们提出了一个新框架NeuralMarker,来捕捉标志物到参考图像的密集对应关系

从这个框架名字里的Neural就可以看出,它和神经网络有一定关系。

此前,其他AI模型大都是通过特征匹配和指定图像来建立稀疏的对应关系。不过这些稀疏的特征标记只能支持平面中的简单变化,而当图片动起来后,这些标记就无法识别了。

比如说,把动态的《星空》变成日本名画《神奈川冲浪里》,就是酱紫的:

这里面,只有NeuralMarker成功了,而这个模型成功的关键因素在于它的两个组件和一个标记评估方法

1、FlyingMarkers捕捉几何变化

其一,要处理好像素点级别的密集对应关系,运动调节器(motion regressor)就得能够实时捕捉各种几何变化。

研究者以拍摄的素材、一些人为标记,以及合成的参考图像作为数据集,训练出一个叫FlyingMarkers的工具。

在FlyingMarkers的辅助下,运动调节器就能可以为各种形变编码,从了捕捉到绝大多数几何变化了。

2、SED+SfM捕捉亮度色彩变化

除了几何变化外,颜色和亮度变化也是至关重要的。

研究者指出,在训练模型的数据集中,连续的动画外观变化并不算大;而最终是要求把一张图换成另一张图,这是外观差异就很明显了。

所以,他们提出了一个对称极距损失 (Symmetric Epipolar Distance ,SED)的概念,并结合运动结构(Structure-from-Motion,SfM)技术,根据相机的拍摄角度来约束密集对应关系的预测。

这样,即使原图是在较暗光线下拍摄的,也可以有不错的生成效果。(虽然还达不到环境光渐变的效果)

3、DVL-Markers评估

此外,研究人员还提出了一种新的标记对应评估方法:DVL-Markers,用来评估真实拍摄图片中的像素块与模型包含的标记之间的对应关系。

并从几何形变、相机视角,和光照三个方向进行评估。

研究者们测试后发现,有了DVL-Markers,这个AI模型的图像质量评估指标:SSIM(结构相似性)和PSNR(峰值信噪比)表现都优于同类模型,并且任务成功率达到了100%

有了这些工具的加持,NeuralMarker也可以搞定在纸上播放视频这种事了。

(话说,既然都能在纸上放视频了,那之后投影仪对不准的问题是不是也有望解决了?)

看到这里,大伙儿应该觉得这个AI挺溜了吧,不过这还没完——

前文提到的“端盘子妙招”,其实是这群研究者把NeuralMarker和NeRF结合起来了,直接在二维的图片上加了一个三维物体。

当然,研究人员也坦言,NeuralMarker还有一些局限性和发展空间,比如图片前面有遮挡物时,这个AI就不再这么智能了。

对此,他们表示,将在训练的数据集中随机加入遮挡物,来让这个AI变得更聪明。

论文地址:
https://arxiv.org/abs/2209.08896
参考链接:

[1]https://drinkingcoder.github.io/publication/neuralmarker/
[2]https://drinkingcoder.github.io/publication/life/
[3]https://nanonets.com/blog/optical-flow/

「2022人工智能年度评选」火热报名中

现在,量子位「2022人工智能年度评选」已经正式启幕,评选将从企业、人物、产品/解决方案三大维度设置5类奖项。

更多关于评选标准、榜单报名欢迎扫描下方二维码~


点这里关注我 👇 记得标星噢 ~


一键三连「分享」、「点赞」和「在看」

科技前沿进展日日相见 ~  




微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
「吉卜力公园」走进宫崎骏的童话世界,好还原!路的尽头就是海,比三亚治愈的小城,悄悄美成了宫崎骏漫画「开放」这件事,抖音越来越重视了全球首家吉卜力公园开园!宫崎骏史上最大手笔,没有过山车却不输迪士尼乐园家庭欢聚酿命案:帅小伙死于特工准岳父家,在场五名家人证词破绽百出美国年度音乐音频播放量首次破万亿,Bad Bunny蝉联Spotify播放量最高艺人,Triller正式下架三大唱片曲库2022,「A4纸」也有了新AI!什么咖啡最好喝?众说纷纭呀!宫崎骏深受此书影响!这本书不读,绝对是童年遗憾...喜讯!澳洲政府计划整顿航空业,随意取消延误,乘客可索赔!随便画,随便雕,随便可爱~对话「梦想绽放」科技CEO熊文:VR行业正在逐步过渡到VR+AR的MR时代|36氪专访宫崎骏出笔刷了??​[ 第298期 ]华人谨防!洛杉矶华人女子遇网络诈骗!聊天钓鱼却破绽百出,被华人女子一眼识破!宫崎骏主题公园开园!340亿日元还原龙猫、幽灵公主、移动城堡......最近做的家常饭西雅圖華人超市見聞机会难得, 蒙特利尔本月有一场宫崎骏烛光音乐会! 童话般梦幻浪漫~越夜越精彩,时下最炫墨尔本晚间活动都在这里!刚上线就破100万播放!这部国产动画为什么让我们如此共鸣?99元任选5件!大希地美食专场,随意搭配,有你想要的免费干货 | 关掉垃圾动画!看看这4000多集英语分级动画,让孩子英语从启蒙到精通!当明星穿越进油画,端庄卡姐,贵妇蕾哈娜,这画风,毫无违和感哇“毫无底线” 的 “毫无底线”!26岁萌妹纸当上了瑞典的新部长!上任45天的英国首相特拉斯辞职了!Costco 的红油抄手,Aldi的美味青口和几款小菜挖到一部小众科普动画,耳目一新,好看!宫崎骏为什么总能让你感动?拜登特赦:所有「非法持有大麻」的罪犯「无罪释放」大麻合法化再进一步!教育随笔(105)高考文言文备考之六屏幕后的音乐工作者,与屏幕前的线上Live时代太随意!推特新管理层讨论裁员聊天被全公司看到了,随意确定将解雇谁29日停止A4纸销售? 晨光文具回应![收藏]大温今年的圣诞庆典活动都在这儿了!免费干货| 关掉垃圾动画!看看这4000多集英语分级动画,让孩子英语从启蒙到精通!
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。