可灵 AI 生成视频越来越火，一线人士却在用另一款「神器」

公众号新闻

2024-07-27 23:07

▲ 点击订阅，手把手教你掌握先进科技

最近，AI 生成视频技术火爆全网。复活逝去亲人、与童年自己跨越时空互动、让历史人物「活」起来讲述自己的故事……各种充满创意的应用，仿佛打开了通往奇幻世界的大门，AI 复活术俨然成为一种潮流，引发了人们的强烈情感共鸣和无限遐想。

在各种视频网站，搜索「AI 复活」，你会看到：老照片中的人物重现笑容，与亲人跨越时空相聚；AI 唤醒后的晚清格格，秒变现代明星；「清朝十二帝」不仅「活」起来，还用 AI 配音讲述自己的故事……

然而，在 AI 赋予这些人物鲜活生命力的同时，一些问题也随之而来。比如，这些视频用哪些工作制作？制作的过程有什么秘诀？AI视频背后是什么产业趋势？

今晚，前哨AI小课最新一期直播，Tina老师就会教你如何用AI复活老照片、花朵跳舞、创意设计等，以下就是她制作的AI视频。

如果你也想学会AI视频制作，欢迎观看今晚的直播，直播前我们一起梳理下创意AI视频背后的产业趋势。

1.AI「复活术」为何如此强大？

这股热潮的背后，是 AI 生成技术的飞速发展和产品化。从功能强大的 Runway Gen-3、Luma Dream Machine，到主打中文市场的可灵 AI，这些工具让普通人也能轻松创作出令人惊叹的视频作品。

深度学习：AI 创作的魔法棒

无论是让老照片中的人物重现笑容，还是复原历史人物的音容笑貌，AI 复活术的「魔法」都离不开一项核心技术——深度学习。

我们可以把深度学习想象成 AI 的「大脑」，通过观察海量的照片和视频数据，AI 就像一个勤奋的学生，不断学习和掌握人物的样貌、表情、动作、服饰等特征。

基于这些学习到的知识，AI 就能「想象」并创造出照片中人物可能的面貌、表情和动作，最终生成栩栩如生的视频。

技术局限：当魔法遇上历史

然而，AI 的「魔法」并非万能。

在复原历史人物时，由于史料记载的局限性和历史资料的缺失，AI 往往难以准确把握特定历史时期的服饰、发型、妆容等细节，导致生成的人物形象与真实历史存在偏差。

例如，一些 AI 复原的历史人物视频中，人物的服饰、发型、妆容等细节经常出现与史实不符的情况。

这是因为 AI 模型通常是基于大量的现代图像数据进行训练，从而导致生成的历史人物形象带有现代审美的痕迹。

2.AI 生成技术产品化

技术快速发展只是AI视频热的基础，功能强大的产品和工具才是趋势落地的根本动力。

年初Sora让所有人看到了AI视频的上线，也让大量开发者看到了巨大的市场机遇，于是我们看到各种新的AI视频工具涌现。

Runway Gen-3 Alpha: 高保真度、可控性强

Runway Gen-3 Alpha 是 Runway 公司推出的第三代 AI 视频生成模型，它在视频质量、一致性和动作捕捉方面相较于前代产品有了显著提升。

早在 2019 年，Runway 就发布了第一代 AI 视频生成模型，并推出了 RunwayML 平台，为用户提供基于云端的 AI 视频创作工具。

Luma Dream Machine: 快速生成逼真视频

Luma Dream Machine 是一款由 Luma AI 公司开发的 AI 视频生成工具，它能够理解和模拟现实世界的物理规则，生成带有流畅动作、电影级运镜和自然人物交互的视频。

Luma AI 公司成立于 2021 年，专注于开发基于 NeRF（Neural Radiance Fields，神经辐射场）技术的 3D 场景重建和 AI 视频生成工具。

不久前，Luma突然发布Dream Machine产品，一经发布便引发了业界的广泛关注，成为AI视频的顶级玩家之一。

可灵 AI: 中文市场的后起之秀

可灵 AI 是快手公司于 2024 年 5 月推出的 AI 视频生成工具，刚开始主打中文市场，如今也推出海外版本。

可灵基于快手平台积累的海量视频数据和强大的 AI 技术，可以根据用户输入的中文文本或图片，快速生成符合中文语境和审美习惯的视频。

可灵 AI 的发布，标志着快手正式进军 AI 生成视频领域。凭借着其在短视频领域的丰富经验和技术积累，可灵 AI 有望在中文市场取得成功。

3.专业人士的选择：ComfyUI

然而，在 AI 生成视频领域，除了这些备受瞩目的明星产品，还隐藏着另一款「神器」—— ComfyUI，它不像前者那样简单易用，却凭借着强大的功能和高度的自由度，成为了专业人士和技术爱好者的首选工具。

ComfyUI: 从默默无闻到一鸣惊人

ComfyUI 的发展历程颇具传奇色彩。它最初由一位名叫 Joshua Bardwell 的开发者个人开发，作为 Stable Diffusion 的一个插件发布。

由于其强大的功能和灵活的扩展性，ComfyUI 迅速在 AI 艺术家和开发者群体中流行起来。

模块化设计：像乐高一样搭建你的「视频工厂」

ComfyUI 的最大特点在于其模块化的节点工作流设计。用户可以通过自由组合不同的功能节点，像搭建乐高积木一样，构建出个性化的视频生成流程。

修复老旧照片、将真人照片转换为动漫风格、制作带有特效的短视频等等，已有的AI视频功能，你都可以使用 ComfyUI 组合不同AI模型实现。

开源免费：社区驱动，快速迭代

更重要的是，ComfyUI 是开源和免费的。这意味着任何人都可以免费使用、学习和改进它。

这种开放的社区生态，也为 ComfyUI 的快速发展和功能完善提供了源源不断的动力。

4.ComfyUI 背后的 GUI 趋势

ComfyUI 之所以受到专业人士的青睐，在于它顺应了 AI 生成领域的一个重要趋势——图形用户界面（GUI）普及。

传统的 AI 工具通常需要用户具备一定的编程基础，才能进行操作和使用。而 GUI 的出现，则将 AI 工具的使用门槛大大降低，让即使没有编程经验的用户也能轻松上手。

GUI 趋势：降低门槛，释放创造力

ComfyUI 就很好地体现了 GUI 趋势。它为用户提供了一个直观的图形界面，用户可以通过拖拽和连接不同的功能节点，来构建自己的视频生成流程，而无需编写任何代码。

这种可视化的操作方式，不仅降低了用户的学习成本，也让用户可以更加专注于创意本身，从而释放出更大的创作潜力。

Stable Diffusion GUI 生态：百花齐放

事实上，ComfyUI 只是 Stable Diffusion GUI 生态中的一员。

近年来，随着 Stable Diffusion 的流行，各种基于其开发的 GUI 工具层出不穷，例如 AUTOMATIC1111 WebUI、InvokeAI 等等。

这些工具都致力于为用户提供更加便捷、高效的 AI 创作体验。

5.人人都是艺术家的时代

AI 生成视频技术的兴起，不仅仅是技术的进步，更预示着一场新的数字技术商业化浪潮的到来。

如果说过去几十年，互联网和移动互联网的快速发展，催生了一批像腾讯、阿里、字节跳动这样的「巨鲸」公司。

在 AI 的浪潮中，「巨鲸」式的商业模式有望再次出现，只是在「巨鲸」之前，有一片为广泛的AI细分应用，AI创意成果容身的巨大市场。

AI 生成视频：从专业走向大众

AI 生成视频技术就是其中一片肥沃的土地，它为无数中小企业和个人创作者提供了新的发展机遇。

各种基于 AI 生成视频技术的应用和服务将会层出不穷，一个更加丰富多彩的创意生态正在形成。

人人都是艺术家：梦想照进现实

正如照相机的发明让人人都是画家，计算机和网络的普及让人人都是作家， AI 生成视频技术的出现，正在将我们带入一个「人人都是艺术家」的时代。

德国艺术家约瑟夫·博伊斯在 1967 年提出了「人人都是艺术家」的概念，而 AI 正在让这一概念成为现实。

在这个时代，创意的门槛将被极大地降低，每个人都可以用 AI 来实现自己的创造力和艺术表达。

未来，将会涌现出更多像可灵、ComfyUI 这样功能强大、易于使用、价格亲民的 AI 生成视频工具，它们将帮助我们打破想象力的边界，创造出更加精彩纷呈的视频世界。

然而，当视频内容创作的门槛越来越低，当 AI 可以帮助我们轻松地将任何想法变成现实，我们是否会面临一个内容过剩、创意枯竭的「无趣」未来？

这或许是 AI 生成时代给我们带来的另一个值得深思的问题。

如果你也想探索这些问题的答案，看懂AI前沿的趋势，欢迎加入前哨AI小课，成为站在科技前沿的人。

文章撰写：邢晓翠

文章编辑：刘世宇洋

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。

来源: qq

点击查看作者最近其他文章