Sora颠覆的行业,远不只是影视制作
Sora借鉴transformer将文本信息转化为token的思路,训练时将大量不同画幅的视频素材划分成若干个tuplet,每个tuplet会变成一个带有空间和时间视频表征的时空patches,这才是它理解世界的关键。
目前智能驾驶仿真采用 NeRF+素材库排列组合+游戏引擎的技术路线,虽然保证了场景的真实性,但人工智能的泛化性不足;而Sora这一类世界模型能够理解物理世界运行规律、同时具备泛化到训练样本以外的能力,能够迅速生成非常真实和多样化的驾驶场景用于智能驾驶仿真。
来源 | 人神共奋(ID:tongyipaocha)
作者 | 思想钢印 ;编辑 | 荔枝
内容仅代表作者独立观点,不代表早读课立场
微信扫码关注该文公众号作者
戳这里提交新闻线索和高质量文章给我们。
来源: qq
点击查看作者最近其他文章