谢赛宁对话Sora 负责人:AI 视觉的基础是对压缩图像的学习
关键信息:
语言将是获得更智能系统的重要组成部分。 通过学习压缩图像,模型学会了视觉世界的基础结构,并最终获得了良好的图像表示。 现有的数据可能已经足够让我们走得很远。 当模型足够强大,能够成为自己的世界模拟器时,会发生很多有趣的事情。 发布强大的视频生成系统时最关心的是安全性及其对社会的影响。我们希望确保在发布 Sora 模型时,人们不会用它来传播虚假信息,并且模型的行为在预期范围内。
速记全文(中文):
问答环节
微信扫码关注该文公众号作者
戳这里提交新闻线索和高质量文章给我们。
来源: qq
点击查看作者最近其他文章