Redian新闻
>
效果炸裂!OpenAI 发布首个视频生成模型,这就是 AI 视频的 GPT 时刻

效果炸裂!OpenAI 发布首个视频生成模型,这就是 AI 视频的 GPT 时刻

科技

春节假期还没结束,AIGC 已经开始了新一轮的疯狂,一觉醒来便是翻天覆地。
今天凌晨 OpenAI 突然发布了一款重磅模型,不是大家期待已久的 GPT-5,但它的意义不亚于一年前发布的 GPT-4。
这就是 OpenAI 的首个视频生成模型 Sora。虽然过去一年 AI 视频已经带给我们很多惊艳时刻,但后发先至的 OpenAI 依然带来了亿点点震撼。
对比 AI 视频里 Runway、Pika、Google 和 Meta 这些主流玩家, Sora 的特别之处在于:

能够生成具有多个角色、特定类型动作和主题背景的复杂视频,时长可达到 1 分钟

可以在单个生成的视频中创建多个镜头,模拟复杂的摄像机运镜,同时准确地保持角色和视觉风格。

最重要的是,它不仅理解用户在 prompt 中要求的内容,还能自己理解这些事物在现实世界中的存在方式。
比如下面这个案例:
Prompt: A Chinese Lunar New Year celebration video with Chinese Dragon.
提示:与中国龙一起庆祝中国农历新年的视频。

越简单的 Prompt,越体现出 Sora 模型对物理世界的运行规则理解有多深。
更多技术细节可通过官网了解:https://openai.com/sora
尽管不想再用这个有点被滥用的词,但我们也许不得不承认,这就是 AI 视频的「GPT 时刻」。
至于怎么能体验到 Sora,OpenAI 还没公布向所有用户开放的时间,目前只有部分视觉艺术家、设计师和电影制作受邀测试。
不过 OpenAI CEO Sam Altman 开启了「在线接单」模式,只要带上你的 Prompt 在 X 上 @ Sam Altman ,就有可能收到生成的视频。
下面我们先来欣赏一下 Sora 的一些生成视频案例(无后期),看完后或许你会开始理解,为什么大批影视行业从业者会彻夜难眠。

Prompt: A stylish woman walks down a Tokyo street filled with warm glowing neon and animated city signage. she wears a black leather jacket, a long red dress, and black boots, and carries a black purse. she wears sunglasses and red lipstick. she walks confidently and casually. the street is damp and reflective, creating a mirror effect of the colorful lights. many pedestrians walk about.」
提示词:一位时髦的女士走在东京的街头,街道充满了温暖的霓虹灯光和动感的城市标志。她穿着一件黑色皮夹克,一条长红裙和黑色靴子,手拿一个黑色手提包。她戴着太阳镜和红色口红。她走路既自信又随意。街道潮湿且能反射,形成了五彩灯光的镜面效果。许多行人在街上走动。

Prompt: A movie trailer featuring the adventures of the 30 year old space man wearing a red wool knitted motorcycle helmet, blue sky, salt desert, cinematic style, shot on 35mm film, vivid colors.
提示词:一部电影预告片,讲述 30 岁的太空人头戴红色羊毛针织摩托车头盔的冒险故事,蓝天、盐碱沙漠、电影风格、35 毫米胶片拍摄、色彩鲜明。

Prompt: Several giant wooly mammoths approach treading through a snowy meadow, their long wooly fur lightly blows in the wind as they walk, snow covered trees and dramatic snow capped mountains in the distance, mid afternoon light with wispy clouds and a sun high in the distance creates a warm glow, the low camera view is stunning capturing the large furry mammal with beautiful photography, depth of field.
提示词:几只巨大的毛象踏过雪地,它们长长的毛发在风中轻轻飘动,远处有被雪覆盖的树木和壮观的雪山,午后的光线伴着漂浮的云朵和远处高高挂起的太阳,营造出温暖的光晕,低机位拍摄的景色令人惊叹,捕捉到了大型毛茸茸的哺乳动物,摄影和景深都非常漂亮。

Prompt: Animated scene features a close-up of a short fluffy monster kneeling beside a melting red candle. the art style is 3d and realistic, with a focus on lighting and texture. the mood of the painting is one of wonder and curiosity, as the monster gazes at the flame with wide eyes and open mouth. its pose and expression convey a sense of innocence and playfulness, as if it is exploring the world around it for the first time. the use of warm colors and dramatic lighting further enhances the cozy atmosphere of the image.
提示词:动画场景特写,一个矮小蓬松的怪物跪在一根融化的红蜡烛旁。艺术风格为三维写实,注重光影和质感。这幅画的基调是惊奇和好奇,怪物睁大眼睛、张开嘴巴注视着火焰。它的姿势和表情传达出一种天真和俏皮的感觉,仿佛是第一次探索周围的世界。暖色调和戏剧性灯光的使用进一步增强了画面的温馨氛围。

Prompt: A gorgeously rendered papercraft world of a coral reef, rife with colorful fish and sea creatures.
提示词:一个华丽的珊瑚礁纸艺世界,到处都是五颜六色的鱼和海洋生物。

Prompt: Drone view of waves crashing against the rugged cliffs along Big Sur’s garay point beach. The crashing blue waters create white-tipped waves, while the golden light of the setting sun illuminates the rocky shore. A small island with a lighthouse sits in the distance, and green shrubbery covers the cliff’s edge. The steep drop from the road down to the beach is a dramatic feat, with the cliff’s edges jutting out over the sea. This is a view that captures the raw beauty of the coast and the rugged landscape of the Pacific Coast Highway.
提示词:无人机拍摄大苏尔加雷点海滩上海浪拍打崎岖悬崖的景象。湛蓝的海水拍打出白色的浪花,夕阳的金光照亮了岩石海岸。远处有一座小岛,岛上有一座灯塔,绿色的灌木丛覆盖着悬崖边缘。从公路到海滩的陡峭落差非常壮观,悬崖的边缘突出海面。这里的景色捕捉到了海岸的原始之美和太平洋海岸公路的崎岖地貌。

Prompt: This close-up shot of a Victoria crowned pigeon showcases its striking blue plumage and red chest. Its crest is made of delicate, lacy feathers, while its eye is a striking red color. The bird’s head is tilted slightly to the side, giving the impression of it looking regal and majestic. The background is blurred, drawing attention to the bird’s striking appearance.
提示词:这是一张维多利亚冠鸽的特写镜头,展示了它醒目的蓝色羽毛和红色胸膛。它的冠羽由精致的花边羽毛组成,眼睛则是醒目的红色。鸽子的头部略微偏向一侧,给人一种高贵威严的感觉。背景是模糊的,让人注意到这只鸟引人注目的外表

Prompt: Photorealistic closeup video of two pirate ships battling each other as they sail inside a cup of coffee.
提示词:两艘海盗船在一杯咖啡中航行时的逼真特写视频。
AI 视频的 GPT 时刻,AGI 的重要里程碑
过去一年 我们已经看过不少媲美专业级制作的 AI 生成视频,连迪士尼也开始用到影视制作中,但仍有不少掣肘。
而 Sora 又往前迈出了一大步,就像 OpenAI 研究员所说:
制作一部专业电影需要大量的昂贵设备,Sora 这个模型将让普通人在社交媒体上制作出高质量的视频内容成为可能。
但这不代表只靠 Sora 能马上制作出一部电影,研究人员也提到 仍存着一些缺点,比如可能无法理解特定的因果关系。例如给出提示词:一个人咬了一口饼干,但生成的饼干上可能没有咬痕。
回顾过去这一年 AI 视频的产品迭代,速度已经超出人们的想象。
去年年底,Runway Gen-2 迎来一波大更新,分辨率提升至 4K,视频生成效果的保真度和一致性迎来重大突破,一周后,又再次推出运动画笔功能,轻轻一刷,便能让静态事物动起来。
紧接着,Stability AI 也发布 Stable Video Diffusion,给 AI 视频生成领域再添一把旺火。
而 Pika 1.0 则凭借更简单的视频生成,浅显易懂的视频局部编辑,更高质量的视频生成,刚出道便获得一众硅谷大佬的青睐。从生成到后期,仅靠自己就能完成一条龙操作。
李飞飞团队和 Google 合作推出的 W.A.L.T 模型,也同样可以根据自然语言/图片提示,生成逼真的 2D/3D 视频或动画,生成效果更是媲美 Runway、Pika 等一众好手。
从上述这些产品,到今天 OpenAI 加入文生视频的大军,也仅仅过去了两个多月。
其实, Sora 最大的意义其实不在于生成的视频有多逼真,而是展现出能够理解和模拟现实世界的模型的雏形。OpenAI 认为,这将是实现 AGI 的重要里程碑。
Sam Altman 在不久前曾表示,GPT-5 将有指数级跃升,人类已经非常接近 AGI。我们很快就能见证。


微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
太可怕了!Tyler Perry 在见证 OpenAI 的 Sora 后,搁置了价值8亿美元的扩展计划最新!GPT-5已有客户上手体验:性能炸裂!或将在夏天发布OpenAI小规模开放语音生成模型,上海发放电脑家电补贴,搜狗发布硬件产品服务下线公告,这就是今天的其他大新闻!小红书开源「InstantID」效果炸裂,被Yann LeCun点赞,迅速蹿上Github热榜Sora不开源,微软给你开源!全球最接近Sora视频模型诞生,12秒生成效果逼真炸裂OpenAI发布首个由Sora制作的MV;DALL-E 3灰度测试局部重绘功能丨AIGC日报两首《万家灯火》吴恩达:别光盯着GPT-5,用GPT-4做个智能体可能提前达到GPT-5的效果AI早知道|Gemini推理能力强于GPT-3.5;美图AI视觉大模型将向公众开放;Meta推全新视频生成模型FlowVid《再见,布里诺斯艾利斯》2023虽然过的不尽人意但是也要总结一下!AI早知道|百度推出视频生成模型UniVG;Soul APP上线自研语言大模型;清华大学首个大模型 Debug百度腾讯推出视频生成模型;传美团AI视觉中心负责人离职;微软研究院回应关闭传言丨AIGC大事日报Yann LeCun:生成模型不适合处理视频,AI得在抽象空间中进行预测谷歌发布AI视频生成模型;传微软组建新GenAI团队;蚂蚁成立AI创新部门丨AIGC大事日报嫉妒的心灵不美丽GPT-4无法造出生物武器!OpenAI最新实验证明:大模型杀伤力几乎为0Suno v3音乐生成模型发布,几秒钟生成完整歌曲;富士通用生成式AI加速药物研发丨AIGC日报AI早知道|工信部发首个国内个人信息保护AI大模型;魅族发布首款开放式AI终端;微软发布金融版CopilotAI早知道|马斯克Grok大模型开源;荣耀正式发布首款AI PC;苹果谷歌和OpenAI商谈iPhone大模型使用曝小扎写信“挖角”DeepMind;我国10亿级参数大模型超百个;Stability AI开源代码生成模型丨AIGC大事日报说一个有关Open AI的Chat GPT 创投人和我家的小故事AI早知道|Stability AI推出最小模型;国内首个视频大模型通过备案;内蒙古首个AI大模型工业互联网平台发布OpenAI甩出AI模型Sora,做视频的我又要失业了……国产「GPTs」上线!全面对标 OpenAI 的智谱发布大模型,性能逼近 GPT-4Stability AI杀回来了:视频生成新Demo效果惊人,网友:一致性超群重磅!OpenAI 官宣上线 GPT Store!超300万个 GPTs 大爆发关于朱令铊中毒的一点讨论Pika、Gen-2、ModelScope、SEINE……AI视频生成哪家强?这个框架一测便知揭秘最强视频生成模型 Sora,OpenAI 是怎么实现 1 分钟一镜到底的?炸裂!妻子在浴室不经意发现老公藏一瓶东西,瞬间三观崩裂!阿尔特曼称GPT-5提升超想象;库克在中国首谈生成式AI;字节推出视频生成新模型丨AIGC大事日报ChatGPT有记忆了!OpenAI官宣记忆功能开启测试,奥特曼称GPT-5更智能效果超越Gen-2!字节最新视频生成模型,一句话让绿巨人戴上VR眼镜AI早知道|淘天集团自研大模型“淘宝星辰”上线;Gemini Pro1.5向所有人开放;Suno正式发布V3音乐生成模型直逼GPT-4开源模型大泄漏,AI社区炸锅!Mistral CEO自曝是旧模型,OpenAI再败一局?GPT谷歌发布视频生成大语言模型 VideoPoet
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。