Redian新闻
>
比阿里EMO抢先开源!蔡徐坤“复出”唱RAP,腾讯AniPortrait让照片变视频,鬼畜区UP狂喜!看看哪家效果好

比阿里EMO抢先开源!蔡徐坤“复出”唱RAP,腾讯AniPortrait让照片变视频,鬼畜区UP狂喜!看看哪家效果好

科技

夕小瑶科技说 原创
作者 | Zicy
3月26号,腾讯放了个大招,开源了Audio2Video大模型AniPortrait,话不多说,先看效果!

不得不说,从肌肉运动到连贯程度,效果都是相当惊艳的。可以预见,以后的视频网站的鬼畜区又有新工具了


下面我们先来看看,这个模型究竟是个啥东西?

Audio2Video大模型的较量

早在2月27号的时候,阿里就宣布要开源自己的图生视频大模型:EMO,还把论文挂到了Arxiv上面

https://arxiv.org/abs/2402.17485

EMO的效果也是相当的炸裂,你只需要提供一张照片和一段任意音频文件,EMO即可生成会说话唱歌的 AI 视频,以及实现无缝对接的动态小视频,最长时间可达1分30秒左右。表情非常到位,任意语音、任意语速、任意图像都可以一一对应。


但现在,EMO的“开源”仓库是这样的

只有一个Readme文件,这波开源属于是开了个寂寞。有网友调侃道

好好好,没有人比你更懂开源。

阿里本来是靠EMO赚足了噱头,但这回让腾讯抢先一步,EMO可能是真要emo了。

AniPortrait是什么

总地来说,框架分为两个阶段。首先,从音频中提取3D面部网格和头部姿态,然后将这两个元素投影到2D的面部标志序列中。在第二阶段,再利用扩散模型将2D的面部标志序列转换为人像视频。想了解更详细技术参数的小伙伴可以参考原始论文:

论文链接
https://arxiv.org/abs/2403.17694

我们主要来看一看模型的惊艳效果,AniPortrait的主要功能有三个:

1、音频驱动的动画合成:用户可以提供一个音频文件和一张参考的肖像图片,AniPortrait将根据音频中的语音和声音的节奏来动态地生成说话或表情变化的肖像动画,比如文章开头和下面这个动画。

2、面部再现:如用户可以提供一段视频,实现在新的肖像上复现视频中人物的面部表情和动作。这项技术可以用于创造逼真的虚拟角色动画,使其复现真人的表情和动作。

3、头部姿势控制:用户可以指定头部姿势,或者选择预设的姿势配置,来控制生成动画中的头部动作,使动画效果更加自然和多样化。

B站鬼畜区的UP主狂喜!

开源界没有永远的领头羊

总地来说,因为AniPortrait目前还没有给出定量的性能指标,所以我们无法把它和EMO做一个具体的比较,但从demo上看性能应该相差不大。

在这场AI领域的较量中,一个靠着AniPortrait技术大放异彩,一个则是拿着EMO的论文在圈内掀起了波澜。不过,阿里巴巴的EMO虽然声势浩大,但在开源这场比赛中,却让腾讯的AniPortrait抢先一步,不仅抢得先机,还顺便在技术社区里种下了自己的旗帜。

在这个技术迭代飞速的时代,能让技术脱颖而出的,绝不仅仅是技术本身,更是那份大大方方、毫不保留的开源精神。开源界,没有永远的领头羊,只有永远的追赶者。

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
腾讯混元文生图大模型全面开源!Sora同架构,更懂中文,免费商用阿里智能体“组装工厂”开源!0经验搞定上万Agent并发别等OpenAI了,全球首个类Sora抢先开源!所有训练细节/模型权重全公开,成本仅1万美元【求职战报】全球金融交易平台Deutsche Börse Systems销售运营面试邀约!出版一本书惊喜!Lululemon发布巴黎奥运会加拿大队服!看看长啥样!吕洪来:中共政权垮台后,需要“国际共管”来度过社会转型期外企社招丨Dräger德尔格,行业全球领导者,15薪,六险一金,多样福利,偏爱留学生这能说凯特要“复出”?英媒集体说她仍在幕后工作,但...还是没真人啊!参战万亿MoE模型!上海大模型独角兽出手,腾讯阿里米哈游参投被LP狂夸!雪山公路比新西兰还美!五一这么走人人都要夸你会玩男医生看病效果好还是女医生好?研究结果可能令你惊讶这些“老壁灯”设计,让照明充满情调人物照片+文字 = 定制化视频,腾讯光子开源ID-Animator钱几乎不用花,但效果好极了丨春天变美大法效果好,还省钱,这货磨破嘴皮也值了带房私 | 伦敦男生已经工作, 求China Town附近隔音效果好的Studio预算£800,3月入住和米小圈学大语文,比死记硬背效果好太多了!一套搞定字词句诗文新加坡全岛奢华五星级酒店亲身测评,看看哪家才是No.1山姆-奥特曼怒喷谷歌,GPT-4o抢了Gemini风头【七絕】趕集这才是小燕子“复出”的真相冬雨周末​晚点财经丨拼多多现在比阿里更会赚钱;快手要拿1/4资金回购AI的风终于吹到音乐圈,“宫保鸡丁”唱起来不挣钱还做自媒体吗?B站什锦区UP主LKs的创作思考老师我可以用AI降重吗?AI降重的效果好吗?老师:可以是可以,就是……《希望》&《遇见》(陕西话版)拼多多现在比阿里更会赚钱Sora不开源,微软给你开源!全球最接近Sora视频模型诞生,12秒生成效果逼真炸裂电商小二一年9200万,比阿里高管还能贪东京下大雪,小两口瑟瑟发抖拍婚纱照,最后这效果好绝微软刚刚发布了VASA-1:单张照片生成超现实真人视频,还没开源但是性能SOTAStability AI开源上新:3D生成引入视频扩散模型,质量一致性up,4090可玩开放开源!蚂蚁集团浙江大学联合发布开源大模型知识抽取框架OneKE
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。