Redian新闻
>
比阿里EMO抢先开源!蔡徐坤“复出”唱RAP,腾讯AniPortrait让照片变视频,鬼畜区UP狂喜!看看哪家效果好

比阿里EMO抢先开源!蔡徐坤“复出”唱RAP,腾讯AniPortrait让照片变视频,鬼畜区UP狂喜!看看哪家效果好

科技

夕小瑶科技说 原创
作者 | Zicy
3月26号,腾讯放了个大招,开源了Audio2Video大模型AniPortrait,话不多说,先看效果!

不得不说,从肌肉运动到连贯程度,效果都是相当惊艳的。可以预见,以后的视频网站的鬼畜区又有新工具了


下面我们先来看看,这个模型究竟是个啥东西?

Audio2Video大模型的较量

早在2月27号的时候,阿里就宣布要开源自己的图生视频大模型:EMO,还把论文挂到了Arxiv上面

https://arxiv.org/abs/2402.17485

EMO的效果也是相当的炸裂,你只需要提供一张照片和一段任意音频文件,EMO即可生成会说话唱歌的 AI 视频,以及实现无缝对接的动态小视频,最长时间可达1分30秒左右。表情非常到位,任意语音、任意语速、任意图像都可以一一对应。


但现在,EMO的“开源”仓库是这样的

只有一个Readme文件,这波开源属于是开了个寂寞。有网友调侃道

好好好,没有人比你更懂开源。

阿里本来是靠EMO赚足了噱头,但这回让腾讯抢先一步,EMO可能是真要emo了。

AniPortrait是什么

总地来说,框架分为两个阶段。首先,从音频中提取3D面部网格和头部姿态,然后将这两个元素投影到2D的面部标志序列中。在第二阶段,再利用扩散模型将2D的面部标志序列转换为人像视频。想了解更详细技术参数的小伙伴可以参考原始论文:

论文链接
https://arxiv.org/abs/2403.17694

我们主要来看一看模型的惊艳效果,AniPortrait的主要功能有三个:

1、音频驱动的动画合成:用户可以提供一个音频文件和一张参考的肖像图片,AniPortrait将根据音频中的语音和声音的节奏来动态地生成说话或表情变化的肖像动画,比如文章开头和下面这个动画。

2、面部再现:如用户可以提供一段视频,实现在新的肖像上复现视频中人物的面部表情和动作。这项技术可以用于创造逼真的虚拟角色动画,使其复现真人的表情和动作。

3、头部姿势控制:用户可以指定头部姿势,或者选择预设的姿势配置,来控制生成动画中的头部动作,使动画效果更加自然和多样化。

B站鬼畜区的UP主狂喜!

开源界没有永远的领头羊

总地来说,因为AniPortrait目前还没有给出定量的性能指标,所以我们无法把它和EMO做一个具体的比较,但从demo上看性能应该相差不大。

在这场AI领域的较量中,一个靠着AniPortrait技术大放异彩,一个则是拿着EMO的论文在圈内掀起了波澜。不过,阿里巴巴的EMO虽然声势浩大,但在开源这场比赛中,却让腾讯的AniPortrait抢先一步,不仅抢得先机,还顺便在技术社区里种下了自己的旗帜。

在这个技术迭代飞速的时代,能让技术脱颖而出的,绝不仅仅是技术本身,更是那份大大方方、毫不保留的开源精神。开源界,没有永远的领头羊,只有永远的追赶者。

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
Vision Pro大卖50亿小扎狂喜!Meta烧光500亿,VR复兴的希望来了【七絕】趕集不挣钱还做自媒体吗?B站什锦区UP主LKs的创作思考华人狂喜!加航推出国内往返套票,直飞低至749!还可锁定票价12个月,随时都能走!和米小圈学大语文,比死记硬背效果好太多了!一套搞定字词句诗文参战万亿MoE模型!上海大模型独角兽出手,腾讯阿里米哈游参投dá àn jiē xiǎo 🥳带房私 | 伦敦男生已经工作, 求China Town附近隔音效果好的Studio预算£800,3月入住《希望》&《遇见》(陕西话版)95分钟写下58页意见,40年后把烂片变成影史经典惊喜!Lululemon发布巴黎奥运会加拿大队服!看看长啥样!Champ首发开源:人体视频生成新SOTA,5天斩获1k星,demo可玩英媒曝光“绝密复出”计划!“威廉和凯特已认可”吕洪来:中共政权垮台后,需要“国际共管”来度过社会转型期被LP狂夸!雪山公路比新西兰还美!五一这么走人人都要夸你会玩Sora不开源,微软给你开源!全球最接近Sora视频模型诞生,12秒生成效果逼真炸裂开放开源!蚂蚁集团浙江大学联合发布开源大模型知识抽取框架OneKE钱几乎不用花,但效果好极了丨春天变美大法Stability AI开源上新:3D生成引入视频扩散模型,质量一致性up,4090可玩hé bàng?hé bèng?2024第一个千亿IPO要来了,张一鸣曾想收购,腾讯、红杉与富达为股东出版一本书别等OpenAI了,全球首个类Sora抢先开源!所有训练细节/模型权重全公开,成本仅1万美元老师我可以用AI降重吗?AI降重的效果好吗?老师:可以是可以,就是……马斯克打脸OpenAI,全球最大巨无霸模型Grok-1开源!3140亿参数8个MoE,GitHub狂揽6k星冬雨周末华人狂喜!终于回归!奥克兰元宵灯会时隔4年即将开启!新场地在这,千万别错过!效果好,还省钱,这货磨破嘴皮也值了AI的风终于吹到音乐圈,“宫保鸡丁”唱起来外企社招丨Dräger德尔格,行业全球领导者,15薪,六险一金,多样福利,偏爱留学生新加坡全岛奢华五星级酒店亲身测评,看看哪家才是No.1东京下大雪,小两口瑟瑟发抖拍婚纱照,最后这效果好绝微软刚刚发布了VASA-1:单张照片生成超现实真人视频,还没开源但是性能SOTA这才是小燕子“复出”的真相开源日报 | 华为腾讯相爱相杀;Redis不再 “开源”;老黄集齐Transformer论文七大作者;“中国大模型第一城”争夺战
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。