Redian新闻
>
真人视频秒变高清动漫脸,数十种“滤镜”可选,无需注册在线可玩|SIGGRAPH Asia 2022

真人视频秒变高清动漫脸,数十种“滤镜”可选,无需注册在线可玩|SIGGRAPH Asia 2022

公众号新闻
羿阁 Pine 发自 凹非寺
量子位 | 公众号 QbitAI

自拍的视频也能转换成高清动漫脸,这个AI能够在线玩了!

多达数十种肖像风格,并且支持高分辨率,生成的视频是酱婶的~

比如想生成“迪士尼”卡通风格:

又或者想生成游戏里的角色风格:

这是生成的皮克斯动画风格的效果:

这是南洋理工大学开源的一个叫VToonify的框架,目前在Huggingface和Colab上都可以运行,一作还是北大博士。

看完上面的示例,是不是心痒痒了,下面有详细教程手把手教你怎么玩,还不快学起来!

在线可玩

VToonify的操作可以说非常简单易上手了。

首先,选取你喜欢的卡通风格,公主风、肌肉风、大眼特效……还有5种插图风供你选择。

其次,上传包含正脸的视频(或图像),点击一键缩放,这一步是为了避免CPU/GPU过载,不过不用担心,不会对最后生成视频的质量有影响。

除此之外,还可以对上传视频的尺寸进行裁剪或填充。

接下来,只需等待十几秒,即可得到最终的高清版卡通肖像。

而且,如果对“美颜程度”不满意,还可以后期调整。

那么,如此神奇的效果,背后的原理是什么呢?

集成两种框架

要讲明白VToonify风格转移的原理,就不得不提到StyleGAN,很多图像风格迁移框架都是以这个模型为基础的。

基于StyleGAN的方法也被称作图片卡通化,它将人脸编码到潜在空间中,然后再将生成的代码应用到被艺术肖像数据集调整后的StyleGAN,最终生成不同风格的肖像图。

重要的是,它可以生成1024*1024高分辨率的图像。

但StyleGAN在调整肖像的风格时,需要在固定的尺寸下进行,而且不完整的面孔以及一些奇怪的手势都会对它的效果产生影响,因此StyleGAN对动态肖像是不太友好的。

这时,就需要再介绍另外一种图像转换框架了——采用卷积网络的图像转换框架,它能够很好地忽略在测试阶段图像大小和人脸位置的限制 (与StyleGAN完全互补了)

说回VToonify,它集两个框架的大成于一身,成为一个全新的混合框架。

研究人员删除了StyleGAN固定大小的输入特性和低分辨率层,然后创建了创建了一个完全卷积的编码器生成器架构

具体来说,就是将StyleGAN模型集成到生成器中,将模型和数据结合起来,从而它的样式修改特性由VToonify继承。

并且,作为生成器的StyleGAN对编码器进行训练,可以大大减少训练时间和难度

值得一提的是,该研究团队在今年3月就曾开发过一款图像风格转移AI:模仿大师(Pastiche Master),基于DualStyleGAN的框架,能够灵活控制风格并修改风格度。

而这次研究团队推出VToonify,不仅继承了DualStyleGAN的优点,并且通过修改DualStyleGAN的风格控制模块将这些特性进一步扩展到视频

研究团队

VToonify的研究团队全部来自南洋理工大学。

论文一作杨帅,是南洋理工大学的研究员,主要研究方向是图像生成和图像编辑,本科和博士均就读于北京大学。

通讯作者吕健勤,是南洋理工大学计算机科学与工程学院的副教授,也是香港中文大学客座副教授,其研究方向主要为计算机视觉和深度学习。

以下是VToonify在线试玩链接,感兴趣的小伙伴们自己动手试试吧~

在线可玩:
[1]
https://huggingface.co/spaces/PKUWilliamYang/VToonify?continueFlag=4b9ae61e5c13076ecd7ba4f70434f863
[2]https://colab.research.google.com/github/williamyang1991/VToonify/blob/master/notebooks/inference_playground.ipynb

论文原文:
https://arxiv.org/abs/2209.11224

参考链接:
[1]
https://www.reddit.com/r/MachineLearning/comments/xyxe8w/r_vtoonify_controllable_highresolution_portrait/
[2]https://huggingface.co/PKUWilliamYang/VToonify?continueFlag=4b9ae61e5c13076ecd7ba4f70434f863
[3]https://twitter.com/ShuaiYang1991/status/1576937439528042499


MEET 2023 大会启动

邀你共论智能产业穿越周期之道

今年12月,MEET2023智能未来大会将再度邀请智能科技产业、科研、投资领域大咖嘉宾,共同探讨人工智能行业破局之道。

欢迎智能科技企业参会,分享突破性成果,交流时代级变革,共襄盛会!点击链接或下方图片查看大会详情:

量子位「MEET 2023智能未来大会」启动,邀你共论智能产业穿越周期之道


点这里关注我 👇 记得标星噢 ~


一键三连「分享」、「点赞」和「在看」

科技前沿进展日日相见 ~ 



微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
SIGGRAPH Asia 2022 | 人脸神经辐射场的掩码编辑方法—NeRFFaceEditing希腊圣岛-1:行走在蓝白世界(住/行信息)八月的故事,母女爱恨难解难分去玩|相约希腊,畅游爱琴海,在神话中探访欧洲文明的起源ChatGPT与搜索引擎合体,谷歌都不香了,LeCun转发|在线可玩宋志平:过去做企业拿“望远镜”,现在做企业要拿“放大镜”超高清视频铺开文旅产业新画卷 | 超高清视频应用扮靓美好生活边熬夜边运动?这种“养生”可别学!你和吴彦祖只差一个下巴?上科大提出SCULPTOR:从骨头开始捏脸更靠谱|SIGGRAPH Asia 2022稀疏化80%!Graphcore携手Aleph Alpha解锁人工智能计算效率新突破自导自演皮克斯动画不再是梦,这个工具实现了高分辨率、高度可控的真人视频转动画比真人还“抢镜”,虚拟数字人会是流量明星的对手吗? | GGV投资笔记第135期北大刘利斌团队斩获 SIGGRAPH Asia 2022 最佳论文奖:用语音和文字驱动数字人打手势发现有人不喜欢你,无需翻脸,默念这四句话,你就赢了便携厕所这样设计,野外露营秒变高级!SIGGRAPH Asia 2022|告别手Key!上科大提出实时面捕,精细到微表情去玩|温哥华圣诞市场开始啦~ 今年规模超大!36,000多盏灯,还有90多个摊位逛!超高清技术描绘智能交通新蓝图 | 超高清视频应用扮靓美好生活【租房】12.21短租到5.10|家具齐全|South Boston高级公寓|studio|租金2565比真人还“抢镜”,虚拟数字人会是流量明星的对手吗?上科大最新工作!实时面捕天花板,微表情像素级一致,AI让你告别手Key|SIGGRAPH Asia 2022本周必buy | Hype DC大促3折+,数十种运动潮牌低至$14.99起,​Platypus Shoes潮鞋5折+美国男子球场下跪求婚!长发妹见“求婚戒”秒变脸,飙粗口赏巴掌(图)超高清视频为社会撑起“安全伞” | 超高清视频应用扮靓美好生活IKEA x OBEGRÄNSAD联名!宜家22年最受瞩目系列开售!我们绝不上“两个中国”的贼船《意林·小国学》来啦!中小学推荐期刊,趣味+国学+新知,一册在手,语文无忧双11福袋!59元3个盲盒,各种正版动漫游戏周边,数量有限先到先得!数十家GGV Family成员入选「WISE2022 新经济之王 年度企业」榜单|GGVictory平价买到高级感!IKEA全新 OBEGRÄNSAD系列,全系列都好看!超高清直播打造“第二现场” | 超高清视频应用扮靓美好生活我们老中说秃噜嘴的那些英文!用一个动作拥有全世界(多图)快申请!安省政府招聘中,无需学历,无需经验,待遇不错!
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。