可灵 AI 生成视频越来越火,一线人士却在用另一款「神器」
最近,AI 生成视频技术火爆全网。复活逝去亲人、与童年自己跨越时空互动、让历史人物「活」起来讲述自己的故事……各种充满创意的应用,仿佛打开了通往奇幻世界的大门,AI 复活术俨然成为一种潮流,引发了人们的强烈情感共鸣和无限遐想。
在各种视频网站,搜索「AI 复活」,你会看到:老照片中的人物重现笑容,与亲人跨越时空相聚;AI 唤醒后的晚清格格,秒变现代明星;「清朝十二帝」不仅「活」起来,还用 AI 配音讲述自己的故事……
然而,在 AI 赋予这些人物鲜活生命力的同时,一些问题也随之而来。比如,这些视频用哪些工作制作?制作的过程有什么秘诀?AI视频背后是什么产业趋势?
今晚,前哨AI小课最新一期直播,Tina老师就会教你如何用AI复活老照片、花朵跳舞、创意设计等,以下就是她制作的AI视频。
如果你也想学会AI视频制作,欢迎观看今晚的直播,直播前我们一起梳理下创意AI视频背后的产业趋势。
1.AI「复活术」为何如此强大?
这股热潮的背后,是 AI 生成技术的飞速发展和产品化。从功能强大的 Runway Gen-3、Luma Dream Machine,到主打中文市场的可灵 AI,这些工具让普通人也能轻松创作出令人惊叹的视频作品。
深度学习:AI 创作的魔法棒
无论是让老照片中的人物重现笑容,还是复原历史人物的音容笑貌,AI 复活术的「魔法」都离不开一项核心技术——深度学习。
我们可以把深度学习想象成 AI 的「大脑」,通过观察海量的照片和视频数据,AI 就像一个勤奋的学生,不断学习和掌握人物的样貌、表情、动作、服饰等特征。
基于这些学习到的知识,AI 就能「想象」并创造出照片中人物可能的面貌、表情和动作,最终生成栩栩如生的视频。
技术局限:当魔法遇上历史
然而,AI 的「魔法」并非万能。
在复原历史人物时,由于史料记载的局限性和历史资料的缺失,AI 往往难以准确把握特定历史时期的服饰、发型、妆容等细节,导致生成的人物形象与真实历史存在偏差。
例如,一些 AI 复原的历史人物视频中,人物的服饰、发型、妆容等细节经常出现与史实不符的情况。
这是因为 AI 模型通常是基于大量的现代图像数据进行训练,从而导致生成的历史人物形象带有现代审美的痕迹。
2.AI 生成技术产品化
技术快速发展只是AI视频热的基础,功能强大的产品和工具才是趋势落地的根本动力。
年初Sora让所有人看到了AI视频的上线,也让大量开发者看到了巨大的市场机遇,于是我们看到各种新的AI视频工具涌现。
Runway Gen-3 Alpha: 高保真度、可控性强
Runway Gen-3 Alpha 是 Runway 公司推出的第三代 AI 视频生成模型,它在视频质量、一致性和动作捕捉方面相较于前代产品有了显著提升。
早在 2019 年,Runway 就发布了第一代 AI 视频生成模型,并推出了 RunwayML 平台,为用户提供基于云端的 AI 视频创作工具。
Luma Dream Machine: 快速生成逼真视频
Luma Dream Machine 是一款由 Luma AI 公司开发的 AI 视频生成工具,它能够理解和模拟现实世界的物理规则,生成带有流畅动作、电影级运镜和自然人物交互的视频。
Luma AI 公司成立于 2021 年,专注于开发基于 NeRF(Neural Radiance Fields,神经辐射场)技术的 3D 场景重建和 AI 视频生成工具。
不久前,Luma突然发布Dream Machine产品,一经发布便引发了业界的广泛关注,成为AI视频的顶级玩家之一。
可灵 AI: 中文市场的后起之秀
可灵 AI 是快手公司于 2024 年 5 月推出的 AI 视频生成工具,刚开始主打中文市场,如今也推出海外版本。
可灵基于快手平台积累的海量视频数据和强大的 AI 技术,可以根据用户输入的中文文本或图片,快速生成符合中文语境和审美习惯的视频。
可灵 AI 的发布,标志着快手正式进军 AI 生成视频领域。凭借着其在短视频领域的丰富经验和技术积累,可灵 AI 有望在中文市场取得成功。
3.专业人士的选择:ComfyUI
然而,在 AI 生成视频领域,除了这些备受瞩目的明星产品,还隐藏着另一款「神器」—— ComfyUI,它不像前者那样简单易用,却凭借着强大的功能和高度的自由度,成为了专业人士和技术爱好者的首选工具。
ComfyUI: 从默默无闻到一鸣惊人
ComfyUI 的发展历程颇具传奇色彩。它最初由一位名叫 Joshua Bardwell 的开发者个人开发,作为 Stable Diffusion 的一个插件发布。
由于其强大的功能和灵活的扩展性,ComfyUI 迅速在 AI 艺术家和开发者群体中流行起来。
模块化设计:像乐高一样搭建你的「视频工厂」
ComfyUI 的最大特点在于其模块化的节点工作流设计。用户可以通过自由组合不同的功能节点,像搭建乐高积木一样,构建出个性化的视频生成流程。
修复老旧照片、将真人照片转换为动漫风格、制作带有特效的短视频等等,已有的AI视频功能,你都可以使用 ComfyUI 组合不同AI模型实现。
开源免费:社区驱动,快速迭代
更重要的是,ComfyUI 是开源和免费的。这意味着任何人都可以免费使用、学习和改进它。
这种开放的社区生态,也为 ComfyUI 的快速发展和功能完善提供了源源不断的动力。
4.ComfyUI 背后的 GUI 趋势
ComfyUI 之所以受到专业人士的青睐,在于它顺应了 AI 生成领域的一个重要趋势——图形用户界面(GUI)普及。
传统的 AI 工具通常需要用户具备一定的编程基础,才能进行操作和使用。而 GUI 的出现,则将 AI 工具的使用门槛大大降低,让即使没有编程经验的用户也能轻松上手。
GUI 趋势:降低门槛,释放创造力
ComfyUI 就很好地体现了 GUI 趋势。它为用户提供了一个直观的图形界面,用户可以通过拖拽和连接不同的功能节点,来构建自己的视频生成流程,而无需编写任何代码。
这种可视化的操作方式,不仅降低了用户的学习成本,也让用户可以更加专注于创意本身,从而释放出更大的创作潜力。
Stable Diffusion GUI 生态:百花齐放
事实上,ComfyUI 只是 Stable Diffusion GUI 生态中的一员。
近年来,随着 Stable Diffusion 的流行,各种基于其开发的 GUI 工具层出不穷,例如 AUTOMATIC1111 WebUI、InvokeAI 等等。
这些工具都致力于为用户提供更加便捷、高效的 AI 创作体验。
5.人人都是艺术家的时代
AI 生成视频技术的兴起,不仅仅是技术的进步,更预示着一场新的数字技术商业化浪潮的到来。
如果说过去几十年,互联网和移动互联网的快速发展,催生了一批像腾讯、阿里、字节跳动这样的「巨鲸」公司。
在 AI 的浪潮中,「巨鲸」式的商业模式有望再次出现,只是在「巨鲸」之前,有一片为广泛的AI细分应用,AI创意成果容身的巨大市场。
AI 生成视频:从专业走向大众
AI 生成视频技术就是其中一片肥沃的土地,它为无数中小企业和个人创作者提供了新的发展机遇。
各种基于 AI 生成视频技术的应用和服务将会层出不穷,一个更加丰富多彩的创意生态正在形成。
人人都是艺术家:梦想照进现实
正如照相机的发明让人人都是画家,计算机和网络的普及让人人都是作家, AI 生成视频技术的出现,正在将我们带入一个「人人都是艺术家」的时代。
德国艺术家约瑟夫·博伊斯在 1967 年提出了「人人都是艺术家」的概念,而 AI 正在让这一概念成为现实。
在这个时代,创意的门槛将被极大地降低,每个人都可以用 AI 来实现自己的创造力和艺术表达。
未来,将会涌现出更多像可灵、ComfyUI 这样功能强大、易于使用、价格亲民的 AI 生成视频工具,它们将帮助我们打破想象力的边界,创造出更加精彩纷呈的视频世界。
然而,当视频内容创作的门槛越来越低,当 AI 可以帮助我们轻松地将任何想法变成现实,我们是否会面临一个内容过剩、创意枯竭的「无趣」未来?
这或许是 AI 生成时代给我们带来的另一个值得深思的问题。
如果你也想探索这些问题的答案,看懂AI前沿的趋势,欢迎加入前哨AI小课,成为站在科技前沿的人。
微信扫码关注该文公众号作者