Redian新闻
>
Stable Video Diffusion问世!3D合成功能引关注,网友:进步太快

Stable Video Diffusion问世!3D合成功能引关注,网友:进步太快

公众号新闻
西风 发自 凹非寺
量子位 | 公众号 QbitAI

Stable Diffusion官方终于对视频下手了——

发布生成式视频模型Stable Video Diffusion(SVD)

Stability AI官方博客显示,全新SVD支持文本到视频、图像到视频生成:

并且还支持物体从单一视角到多视角的转化,也就是3D合成

根据外部评估,官方宣称SVD甚至比runway和Pika的视频生成AI更受用户欢迎。

虽然目前只发布了基础模型,但官方透露“正计划继续扩展,建立类似于Stable Diffusion的生态系统”。

目前论文代码权重已上线。

最近视频生成领域不断出现新玩法,这次轮到Stable Diffusion下场,以至于网友们的第一反应就是“快”,进步太快!

但仅从Demo效果来说,更多网友们表示并没有感到很惊喜。

虽然我喜欢SD,而且这些Demo也很棒……但也存在一些缺陷,光影不对、而且整体不连贯(视频帧与帧之间闪烁)

总归来说这是个开始,网友对SVD的3D合成功能还满是看好:

我敢打赌,很快就会有更好的东西出来,到时候只要描述一下,就会得到一个完整的3D场景。

SD视频官方版来袭

除了上面展示的,官方还发布了更多Demo,先来看一波:

太空漫步也安排上:

背景不动,只让两只鸟动也可以:

SVD的研究论文目前也已发布,据介绍SVD基于Stable Diffusion 2.1,用约6亿个样本的视频数据集预训练了基础模型。

可轻松适应各种下游任务,包括通过对多视图数据集进行微调从单个图像进行多视图合成。

微调后,官方公布的是两种图像到视频模型,可以以每秒3到30帧之间的自定义帧速率生成14(SVD)和25帧(SVD-XT)的视频:

之后又微调了多视角视频生成模型,叫做SVD-MV:

根据测试结果,在GSO数据集上,SVD-MV得分优于多视角生成模型Zero123、Zero123XL、SyncDreamer:

值得一提的是,Stability AI表示SVD目前仅限于研究,不适用于实际或商业应用。SVD目前也不是所有人都可以使用,但已开放用户候补名单注册。

视频生成大爆发

最近视频生成领域呈现出一种“混战”的局面。

前有PikaLabs开发的文生视频AI:

后又有号称“史上最强大的视频生成AIMoonvalley推出:

最近Gen-2的“运动笔刷”功能也正式上线,指哪画哪:

这不现在SVD又出现了,又有要卷3D视频生成的可能。

但文本到3D生成方面好像还没有太多进展,网友对这一现象也很是困惑。

有人认为数据是阻碍发展的瓶颈:

还有网友表示原因在于强化学习还不够强:

家人们对这方面的最新进展有了解吗?欢迎评论区分享~

论文链接:https://static1.squarespace.com/static/6213c340453c3f502425776e/t/655ce779b9d47d342a93c890/1700587395994/stable_video_diffusion.pdf

参考链接:
[1]https://stability.ai/news/stable-video-diffusion-open-ai-video-model

[2]https://news.ycombinator.com/item?id=38368287

MEET 2024大会定档!

首批嘉宾阵容公布

量子位「MEET2024智能未来大会」正式定档12月14日!点击报名线下参会

李培根院士、360集团梁志辉、小冰李笛、浪潮刘军、昆仑万维方汉商汤科技王晓刚DeepWay田山、千挂科技廖若雪、潞晨科技尤洋、小米集团栾剑、蚂蚁集团杨铭、星动纪元陈建宇等嘉宾已确认出席。

点击“预约”按钮,一键直达大会直播现场!


点这里👇关注我,记得标星噢

一键三连「分享」、「点赞」和「在看」

科技前沿进展日日相见 ~ 

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
0.6秒出图!手机跑Stable Diffusion创下最快速度,而这仅仅是开始4K画质3D合成视频不再卡成幻灯片,新方法将渲染速度提高了30多倍“科兴新冠疫苗停产”引关注,中科院院士解读50张图给Stable Diffusion"下毒"!汽车和牛都分不清了!模拟人眼、拯救糊图、兼容主流AI芯片,最小事件视觉传感器问世!对话Prophesee CEOOpenAI救了Stable Diffusion!开源Dall·E3同款解码器,来自Ilya宋飏等工作着是美丽的吗?280刀JBL Pulse 5 Portable Bluetooth Speaker (Black)“小伙化身高铁判官”引关注,经过还原→50张图“毒倒”Stable Diffusion,汽车和牛都分不清了“打工人嘴替”视频引关注,回应来了又一场AI“宫斗”要上演?盈利困难、投资人开撕CEO,Stable Diffusion背后公司被曝正寻求收购小说:兰欣与乌茶 33上海青浦大观园首个石墨烯制成的功能半导体问世!这些概念股获机构关注Has the ‘Double Eleven’ Shopping Festival Lost its Luster?nǚ hóng?nǚ gōng[旅游] 旅行第15季085城 - 冰岛Keflavík小镇 蓝湖温泉 地热发电站旅美散记(21):韩国大学生球友BrandonStable Video Diffusion来了,代码权重已上线CNN video suggests Gaza hospital blast not caused by IsraelIMCA Video学生模仿领导“视察”拍视频引关注,校方回应又一场 AI“宫斗”要上演?盈利困难、投资人开撕 CEO,Stable Diffusion 背后公司被曝正寻求收购进步太大了!Stable Diffusion快无敌了?继图片/音频之后,发布短视频AIGC功能USB 启动盘制作工具 Rufus 4.3 版发布:添加 expert 功能、改进 Slax Linux 支持[旅游] 旅行第15季088城 冰岛首都 Reykjavík 的冬天音乐节失窃引关注,女主持人含泪控诉"地域黑"支持二次编辑、导入虚拟引擎5,Stable Diffusion进化出3D生成功能4K画质3D合成视频,渲染速度提升30多倍,论文作者带你解读新研究Erich Segal [love story], why famous?NeurIPS 2023 Spotlight|高质量多视角图像生成,完美复刻场景材质!SFU等提出MVDiffusion[9月26日]科学历史上的今天——金·赫尔尼(Jean Amédée Hoerni)澳洲单元房吸引数十人看房,排队数百米!住房危机引发关注,网友建议:摆脱住房危机的替代方案很多……TUM、LMU食堂纷纷罢工!泼天的富贵这次轮到Döner店了?快消外企社招 | Lagardère拉格代尔,世界三大旅行零售商之一,百年外企,平均月薪17.2k,0经验可投,留学生有优势
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。