国际科技财经博客移民网络热点娱乐民生时事公众号

>

一句话拍大片，导演末日来了！Gen-2震撼发布，科幻日系二次元统统拿捏

一句话拍大片，导演末日来了！Gen-2震撼发布，科幻日系二次元统统拿捏

公众号新闻

2023-03-21 05:03

新智元报道

编辑：Aeneas 好困

【新智元导读】Runway的Gen-1还没内测完，Gen-2就以迅雷不及掩耳之势发布了。这次的效果更加炸裂，AI大导离淘汰人类，又近了一步。

昨天，Midjourney生成的完美情侣刷爆网络，大家纷纷在留言区里畅想，下一步，就是演员被淘汰，人人都能升级大导，一键生成大电影了。

巧得很，今天，会做视频的AI模型不就来了嘛。

刚刚，仿佛一声惊雷炸响，Runway发布了文字生成视频模型Gen-2。

宣传词也是非常炸裂——「say it，see it」，只要你说得出来，它就能给你做出来。科幻小说里的超能力成真了！

可以说，有了Runway Gen-2，你就能用任意的图像、视频或文本，生成一段酷炫大片，想要啥风格，就有啥风格。

这个速度简直让人目瞪口呆：Gen-1的内测都还没拿到呢，Gen-2就来了！

一句话，一张图，三秒视频无中生有

此前，Runway在文本到图像领域就曾经大放异彩，大名鼎鼎的Stable Diffusion，就是Runway开发的。

在今年2月，Runway就提出了首个AI编辑模型Gen-1。

顾名思义，Gen-1可以在原视频的基础上，编辑出咱们想要的视频。无论是粗糙的3D动画，还是用手机拍出来的摇摇晃晃的视频，Gen-1都可以升级出一个不可思议的效果。

论文地址：https://arxiv.org/abs/2302.03011

比如用几个包装盒，Gen-1就可以生成一个工厂的视频，化腐朽为神奇，就是这么简单。

而相比Gen-1，Gen-2获得了史诗级的升级——可以从头开始生成视频。

目前，这个模型还未开放，预计在几周内会公开。

而根据目前的演示片段看来，Gen-2的效果似乎暂时比不上Gen-1，没有那么逼真。

但是，这毕竟是AI文生视频0到1的第一步。AI导演做到这一步，已经够人类颤抖的了。

网友实测，效果炸裂

而获得内测资格的幸运网友，已经开始动手生成自己的电影了。

可以看出，无论是宫崎骏风格的日系动画，还是写实风格的镜头特写，或者魔幻特效的电影大片，Gen-2都不在话下。

虽然目前的画质可能还不够细腻，但毕竟是从0生成的视频，一旦日后优化好，大导们的饭碗怕是捧不稳了。

Gen-2的八大「魔法」

Mode 01：Text to Video（文字生成视频）

一个文本提示，就能合成出任意风格的视频，不怕它生不出来，只怕你想不到。

提示：

在纽约市的一间阁楼里，傍晚的阳光透过窗户温柔地洒进屋内。

输出：

Mode 02：Text + Image to Video（文字+图像生成视频）

输入一幅图，再加一句prompt，直接就给你变成了视频。

输入图像：

驱动提示：

在一个低角度拍摄的画面中，男子正沿着街道行走，周围酒吧的霓虹灯照亮了他的身影。

输出：

Mode 03：Image to Video（图像生成视频）

这个不用解释了，你给它一张图片，它给你秒变一段视频。多种风格，随你选择。

美图一秒变电影，这也太梦幻了吧。

输入图像：

输出：

Mode 04：Stylization（风格化）

如果你有一段原视频，但是效果不够炸裂，怎么办？

只需要把你想要叠加的风格用图片或者文字叠加上去，多魔幻的风格都立马生成，秒变好莱坞大片。

原始视频：

驱动图像：

输出：

Mode 05：Storyboard（故事版）

将模拟的场景一拉，就变成了风格化和动画化的渲染图，前期制作一键简化。

输出&输出对比：

Mode 06：Mask（掩码）

在你的视频中分离出特定的对象，然后通过prompt，想怎么改就怎么改，比如下图中，金毛秒变斑点狗。

输入视频：

驱动提示：

一只身上有黑色斑点的白毛狗。

输出：

Mode 07：Render（渲染）

只要输入图像或提示，无纹理的渲染立马变成现实的输出，深度和真实感震撼人心。

输入视频：

输出：

Mode 08：Customization（个性化）

通过自定义，让原视频个性化大变身，保真度还超高。

点击就看外国小哥秒变海龟人。

输入&输出对比：

训练图像：

从生成结果来看，Gen-2的前景，实在是太令人着迷了。（Gen-1的内测申请在这里，http://t.cn/A6Cu1cdy）。

虽然Meta和谷歌也有类似的文本到视频模型（Make-a-Video和Phenaki），生成的剪辑更长、更连贯。

但这些体量更大的公司并没有投入多大的资源，相比之下，Runway的团队只有区区45人。

其实，Runway自2018年以来，就一直专注于研究AI工具，并在去年年底筹集了5000万美元。

有趣的是，Stable Diffusion的初始版本，就有Runway的贡献。只不过后来被Stability AI普及，并有了更进一步的发展。

而这也告诉我们，初创公司在生成式AI上的潜力，是多么惊人。

一大波展示

提示：一只眼睛的特写镜头

提示：无人机拍摄的沙漠景观

参考资料：

https://research.runwayml.com/gen2

https://www.theverge.com/2023/3/20/23648113/text-to-video-generative-ai-runway-ml-gen-2-model-access

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。

来源: qq

点击查看作者最近其他文章

相关阅读

硅谷银行一夜倒闭，海量创业公司遭殃，工资房租统统拿不出一台iPhone就能拍大片，摄影和建模师又要被卷了。特斯拉叫停与比亚迪合作？马斯克回应；中国一公司从硅谷银行取回6亿存款；GPT-4震撼发布；海底捞禁止单点清水锅丨邦早报流浪地球正版周边到！2800+零件还原装甲车，科幻迷沸腾了！Stable Diffusion又出大招！「文生动画」震撼发布淘汰导演，DC英雄一秒变身 GPT-4震撼发布：会颠覆和改变什么？2023版号井喷、二次元扎堆发布前，小米游戏如何助力SLG新作爆发？[电脑] 次元之魅力，13490F+华硕B760天选+4080打造的二次元主机分享 GPT4震撼发布！最大变革在「一切数据Token化」最新！GPT-4震撼发布! 【强智能时代】就业巨变，学生该如何应对…几行代码，GPT-3变ChatGPT！吴恩达高徒、华人CEO震撼发布Lamini引擎一天2震，“床和窗都在摇”，广州深圳震感明显！专家：广东进入地震活动相对活跃时段 GPT-4震撼发布：多模态大模型，升级ChatGPT和必应，开放API，太太太强了！一句话就能魔改视频主角，谷歌新「AI导演」惊呆网友：这画质也太赞了 | GGView 单枪匹马也能拍大片？这次又让大疆给拿捏了。GPT4震撼发布，但想体验的人可以再等等！一句话就能魔改视频主角，谷歌新「AI导演」惊呆网友：这画质也太赞了日本人要搞二次元老婆版ChatGPT，感觉AI成人娃娃也快来了人手一个ChatGPT！微软DeepSpeed Chat震撼发布，一键RLHF训练千亿级大模型 GPT-4震撼发布：多模态大模型，直接升级ChatGPT、必应，开放API，游戏终结了？2023 GAIDC 大会 "十大亮点" 震撼发布流浪地球周边到！2800+零件还原装甲车，科幻迷沸腾了！最大民营妇儿医院暴雷，创始人为“莆田系二代”用手机拍大片的秘诀，终于有人总结了零失败年菜，Costco年货（多图）雅典表震撼发新！为什么这块“三无”腕表，能领先时代20年？GPT-4震撼发布！碾压ChatGPT，强大到没对手？重访西班牙(4)－直布罗陀的悲歌 GPT-4 震撼发布，能读图，考高分，训练更高效 85年春晚邀请邓丽君参加一事的资料腊月二十八做花样面食 GPT4震撼发布！哈佛教授：程序员职业3年内将被终结历史时刻！SpaceX震撼发射！星辰大海，虽远必到二次重返的爱情与婚姻【纽约打卡图鉴】爱丽丝梦游仙境照进现实，童话拍照展馆

热点事件追踪