Redian新闻
>
Animate Anything来了!照片秒变视频,涂哪里就动哪里!

Animate Anything来了!照片秒变视频,涂哪里就动哪里!

公众号新闻

点击下方卡片,关注“CVer”公众号

AI/CV重磅干货,第一时间送达

点击进入—>【AIGC】微信交流群

扫码加入CVer知识星球可以最快学习到最新顶会顶刊上的论文ideaCV从入门到精通资料,以及最前沿项目和应用!发论文,强烈推荐!

在CVer微信公众号后台回复:动起来,即可下载论文pdf和代码链接!快学起来!

对着一张照片随手一刷,就能让戴珍珠耳环的少女朝你微笑,让猩红女巫操纵混沌魔法,让清明上河图动起来,逼真程度不亚于电影大片!近期阿里提出Animate Anything算法,只需要你对画面中的任意对象“涂”一下,再提供一个文本指令,就能让他们根据你的想法动起来,更重要的是,该算法已开源!

人人皆可成为马良,开源代码链接:

https://github.com/alibaba/animate-anything

Animate Anything效果展示

Animate Anything方法介绍

与Runway,Pika,Stable Video Diffusion不同,Animate Anything主打细粒度控制,作者团队致力于如何在保持照片细节的基础上,让照片根据文本指令在指定区域“随心所欲”动起来。

如上图所示,Animate Anything在基础video diffusion模型上引入了motion brush的概念,只有被其圈中的区域才会根据文本指令呈现动态效果。为了实现这样的功能,作者团队基于真实视频合成了大量只含有局部区域变化的视频,在模型训练时将运动区域对应的mask叠加在每帧图像的latent code上来引导模型学习区域控制能力。同时作者团队发现,这种做法的潜在好处是支持一张图像在多个区域的动画合成,从而让一张图像能够组合各式各样的动画效果。为了更好地刻画目标区域的运动速度,Animate Anything设计了motion strength来衡量目标物体在不同时刻的位置差异,作者团队将motion strength编码为向量,作为条件控制注入UNet的残差模块中,在训练时通过帧间差异来使模型具备运动速度的控制能力。

在训练数据上,作者团队对HD-VILA-100M数据集进行镜头切分,清洗过滤出20万个视频片段,通过blip算法为每个片段生成文本描述内容。在模型训练时,保留每一个视频的第一帧的clean latent, 对后续帧的latent上加入噪声,让网络预测出完整视频。更多demo,实现细节及源码可以查看项目主页

https://animationai.github.io/AnimateAnything/

Animate Anything效果对比

与Gen-2,Videocomposer,VideoCraft等方法对比,Animate Anything在保持参考图像的一致性以及运动控制的准确性上展示出了更明显的优势。

具体细节可以查看论文:AnymateAnything: Fine-Grained Open Domain Image Animation with Motion Guidance.

在CVer微信公众号后台回复:动起来,即可下载论文pdf和代码链接!快学起来!

CVPR / ICCV 2023论文和代码下载
后台回复:CVPR2023,即可下载CVPR 2023论文和代码开源的论文合集

后台回复:ICCV2023,即可下载ICCV 2023论文和代码开源的论文合集

AIGC 交流群成立


扫描下方二维码,或者添加微信:CVer444,即可添加CVer小助手微信,便可申请加入CVer-AIGC 微信交流群。另外其他垂直方向已涵盖:目标检测、图像分割、目标跟踪、人脸检测&识别、OCR、姿态估计、超分辨率、SLAM、医疗影像、Re-ID、GAN、NAS、深度估计、自动驾驶、强化学习、车道线检测、模型剪枝&压缩、去噪、去雾、去雨、风格迁移、遥感图像、行为识别、视频理解、图像融合、图像检索、论文投稿&交流、PyTorch、TensorFlow和Transformer、NeRF等。


一定要备注:研究方向+地点+学校/公司+昵称(如AIGC +上海+上交+卡卡),根据格式备注,可更快被通过且邀请进群

▲扫码或加微信号: CVer444,进交流群


CVer计算机视觉(知识星球)来了!想要了解最新最快最好的CV/DL/AI论文速递、优质实战项目、AI行业前沿、从入门到精通学习教程等资料,欢迎扫描下方二维码,加入CVer计算机视觉(知识星球),已汇集近万人!


扫码加入星球学习


▲点击上方卡片,关注CVer公众号

整理不易,请点赞和在看

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
百元不到享受戚薇同款香薰!点燃艺术感,面霜级成分,涂抹身体融香入肌!美众议院起草“作战授权法”:伊朗同伙若参战美军就动武Python实战 | 使用 Python 和 TensorFlow 构建卷积神经网络(CNN)进行人脸识别波提切利:追求诗意、梦幻、美丽境界的伟大画家鸿发超市「2000 万美元」买下82街前Walmart超市!开设第4家Hông Phát分店!第十四章 现代文明的历史演变 (1)图像涂哪就动哪!Gen-2新功能“神笔马良”爆火,网友:急急急广州空姐厕所事件曝光!照片全网疯传:欲望失去控制,太疯狂了...hé bàng?hé bèng?纪念碑谷式错觉图像都被「看穿」,港大、TikTok的Depth Anything火了“哪里有人民,哪里就该有学校。”乡村小规模学校,未来有哪些可能?法国61岁男律师在女实习生裙下拍视频,手机居然放这里!“毛躁狮子头”看过来!这罐发膜开挂啦,涂上3s,头发柔顺似丝绸,省下千元护理钱~golang string和[]byte的对比“毛躁狮子头”看过来!这罐发膜开挂啦,涂上头发柔顺似丝绸,省下千元护理钱~吵翻!中国女留学生穿奢侈品扮流浪汉:体验生活!照片传遍全网被骂作秀!明学昌、明国平、明菊兰、明珍珍,被公开通缉!照片公布Runway新功能「运动笔刷」再次惊艳AI圈:随手一涂,图片就动起来了双11刚过,刘强东就动刀了城管局副局长与小学女老师车内中毒身亡!照片流出,大量隐情被扒……媲美Gen-2,Meta多模态创AI生图新里程碑!破文生视频历史难题,静图秒变视频逼真到炸裂一篇文章带你了解Python常用自动化测试框架——Pytest中国女留学生穿奢侈品扮流浪汉:体验生活!照片传遍全网被骂作秀!罗马最负盛名的古迹中国河南出英雄阿里巴巴的新模型AnyText:动动嘴就能1分钟做出一张电商大促海报内蒙古一大学领导酒后打死妻子!照片流出,身份被扒,一细节可怕你走到哪里,哪里就有国家安全!河南一学校突发火灾13死!照片流出,负责人被扒干燥、脱皮、深唇纹.……再不救救你的嘴,涂1000块的口红还是丑!AI新风口,图片秒变视频,离谱!感谢Google和T-Mobile中美AI最美女孩出炉,你最心动哪一个?Preparing for the 2023 Tax Year: Ensuring a Strong Tax Saving?「think step by step」还不够,让模型「think more steps」更有用
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。