Redian新闻
>
复盘与分析:Sora是如何成功的?

复盘与分析:Sora是如何成功的?

公众号新闻

本文来自“技术复盘与分析:Sora是如何成功的?”,报告深入分析了Sora的各项能力、采用的技术路线和创新性的工作。我们认为Sora是将之前的研究工作上进行了很好的综合,并在强大的算力、工程能力以及GPT和DALL·E模型技术积累下诞生的。

随着OpenAI将这种具有开创性的技术路径走通,国内模型和应用厂商有望快速迭代出类Sora的视频生成模型和应用产品。

Sora的突破可以概括为以下几点:

➢ 从生成效果看,突破此前视频生成模型的时长限制,能够生成60s时长、分辨率1080p的视频,可用性极高。

➢ 从技术路线看,依旧遵从LLM范式“大力出奇迹”,通过patches向量化与transformer架构结合,使得训练数据能够使用大小、尺寸、分辨率不同的视频,能够让模型学习到视频的规律乃至世界的规律;使用GPT生成prompt,在训练和推理过程中解决了模态之间的对齐问题,大大提升了生成效果。

➢ 从产业发展看,Sora通用性极强,有望统一视频生成生态;能够进一步赋能与促进下游应用发展,未来有望成为真正的“世界模拟器” 。

Sora的诞生无异是产业的里程碑,以其为代表的“多模型协同”方式是接近AGI的可行道路。与Gemini这样的多模态模型不同,Sora的核心能力依旧在视频生成领域,且在推理时需要调用GPT的能力重述prompt。这种方式可能不如Gemini符合直觉,但效果非常显著,大大加速了产业走向AGI的过程。

Sora代表LLM的通用和涌现范式在视频领域的成功复现,因此算力依旧是模型与应用厂商布局的关键。通过巧妙的patches嵌入方法,Sora能够运用高效的Transformer架构在海量的视频上进行训练,因此也涌现了模拟现实世界的能力。在其他技术路径的模型获得更好的效果之前,这种“大力出奇迹”的训练方式将依旧是产业的主流,算力需求将持续迎来更大的爆发。

Sora可能成为视频生成领域的Base Model,模型层的竞争格局可能走向收敛。相比其他轻应用,Sora的生成时长更长、质量更高,能够完全替代这些轻应用。因此在多数场景下,Sora都能取代其他的生成模型和应用,最终使视频模型格局走向收敛。
GPU技术篇

更新提醒:“存储系统基础知识全解(终极版)”和“服务器基础知识全解(终极版)”已经更新发布,还没有获取的读者,请在点击“原文链接”在微店留言获取PDF阅读版本)。


转载申明:转载本号文章请注明作者来源,本号发布文章若存在版权等问题,请留言联系处理,谢谢。

推荐阅读
更多架构相关技术知识总结请参考“架构师全店铺技术资料打包(全)”相关电子书(41本技术资料打包汇总详情可通过“阅读原文”获取)。

全店内容持续更新,现下单“架构师技术全店资料打包汇总(全)”一起发送“服务器基础知识全解(终极版)和“存储系统基础知识全解(终极版)pdf及ppt版本,后续可享全店内容更新“免费”赠阅,价格仅收249元(原总价439元)。


温馨提示:

扫描二维码关注公众号,点击阅读原文链接获取架构师技术全店资料打包汇总(全)电子书资料详情


微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
百万富翁、“马克龙男孩”,34岁的他是如何成为法国总理的?AI史上的第一个成功的商业产品是怎样诞生的?A股市场复盘与展望:跌宕起伏的2023和危机共存的2024|智氪大数据分析:特斯拉等电动车的事故率真的比燃油车多吗?a16z分析:测试发布为何对游戏很重要,怎么做最好?战功累累,他如何成为“LVMH集团成功的关键人物”?明日直播|BAT资深数据分析师为你讲解2024数据求职如何成功上岸!嫉妒的心灵不美丽新“国九条”发布,如何利好资本市场向上?——历次“国九条”复盘与本次对资本市场的影响外企社招丨Dräger德尔格,行业全球领导者,15薪,六险一金,多样福利,偏爱留学生深度分析:月收入破5亿,MAU破千万,点点《寒霜启示录》厉害在哪?抄作业 | 苹果APP隐私新政简介与分析2023虽然过的不尽人意但是也要总结一下!人大 Sora 思辩:Sora 到底懂不懂物理世界?低GPA挑战成功帝国理工!英本2:2,拿到帝国理工硕士offer,他是如何做到的?戏剧家的赴美之路,用文学之韵承出海之浪涛!恭喜L教授成功出海!中国戏剧家如何成功出海?Adobe 大更新:Sora 加入全家桶,真要变成「美图秀秀」了两大手游数据公司整合:Sensor Tower宣布收购Data.ai《再见,布里诺斯艾利斯》多角度深度分析:加州房价为什么这么贵?藤校录取近50%都是美高!SSAT最新数据分析:2350+是如何炼成的?易观分析:中国文娱业人工智能行业应用发展图谱2023关于朱令铊中毒的一点讨论马斯克是如何成为Meme教父的中国如何复刻Sora,华人团队长文解构!996 OpenAI研究员:Sora是视频GPT-2时刻[日签] ​每个成功者的后面都有很多不成功的岁月。两首《万家灯火》今年 Q1 “神仙打架”:Sora惊艳、马斯克“找茬”,微软谷歌接连翻车 |文末好礼同济大学章小清/刘玲/房玉江团队Cell Metabolism发现胞内pH-Smad5信号通路控制胰岛素加工与分泌新机制普林斯顿社会学教授深入分析:中国人为何迷信名牌大学?挑战极限:她是如何成为全美顶尖商学院一员?热爱多元文化的RAP少年又是如何赢得南加大录取的?美众议院通过 TikTok 强制剥离法案”;AI程序员上线,码农恐慌;OpenAI:Sora 短期内不会开放 | 极客早知道周鸿祎:Sora意味着实现通用人工智能可能从10年缩短至1年易观分析:2023年度跨境进口电商用户消费特征简析报告内卷与分槽:国人为什么活的这么累
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。