Redian新闻
>
Sora背后团队:应届博士带队,00后入列
avatar

Sora背后团队:应届博士带队,00后入列

Taisy66
楼主 (北美华人网)
现在世界上最受关注的技术团队是哪一支?
Sora团队,已经来到聚光灯中心。
不仅项目负责人评论区被挤爆,成了𝕏最红“景点”。

天才成员们的履历,也正在持续引爆关注。

大家伙发现,这支团队挺年轻:两位负责人都是在去年(2023年)刚刚博士毕业,团队里甚至还有00后选手……

但牛逼也是真的牛:
Tim Brooks,DALL-E 3作者之一,GitHub 5.7k型️项目InstructPix2Pix作者,2021-2022年在英伟达实习时,就是视频生成研究的项目负责人。
William (Bill) Peebles,和谢赛宁合作,搞出了Sora的技术基础之一DiT(扩散Transformer)。论文还曾入围CVPR 2022最佳论文候选。
……
这支团队到底什么来头,咱们今天一起仔细聊聊。
应届博士带队
包括Tim和Bill在内,Sora的主要负责人一共有三名(以下排名不分先后)。
Tim Brooks,也是DALL-E 3的作者,去年1月刚从加州大学伯克利分校博士毕业。

Tim本科就读于卡内基梅隆大学,主修逻辑与计算,辅修计算机科学,其间在Facebook软件工程部门实习了四个月。
2017年,本科毕业的Tim先到Google工作了近两年,在Pixel手机部门中研究AI相机,之后到了伯克利AI实验室攻读博士。
在伯克利读博期间,Tim的主要研究方向就是图片与视频生成,他还在英伟达实习并主导了一项关于视频生成的研究。
回到校园后,Tim与导师Alexei Efros教授和同组博士后Aleksander Holynski(现在谷歌)一起研制了AI图片编辑工具InstructPix2Pix,并入选CVPR 2023 Highlight。

去年一月,Tim顺利毕业并取得了博士学位,转而加入OpenAI,并相继参与了DALL-E 3和Sora的工作。 值得一提的是,Tim不仅在专业领域拥有高超的技术水平,还是个多才多艺的人。
据Tim自己介绍,他还喜欢摄影和音乐,高中时他拍摄的照片获得过National Geographic颁发的奖项,本人到过百老汇演出,还获得过B-box国际奖项……

而与Tim师出同门、晚毕业4个月的William Peebles,也是Sora的另一名负责人。
(Peebles在𝕏上用昵称Bill,在Linkedin上及论文署名时用大名William,下文一律用Bill指代。)
Bill本科就读于MIT,主修计算机科学,参加了GAN和text2video的研究,还在英伟达深度学习与自动驾驶团队实习,研究计算机视觉。
毕业后正式开始读博之前,他还参加了Adobe的暑期实习,研究的依然是GAN,该项目和(时任)卡内基梅隆大学华人学者朱俊彦(也是Efros教授学生,现在在MIT)组有合作,并成为CVPR 2022最佳论文候选。

之后,学期开始,Bill到了伯克利Efros教授课题组攻读博士,研究成果多次入选SIGGRAPH、ICCV、CVPR等学术会议。
2022年5月,Bill到Meta进行了为期半年的实习,和谢赛宁(Bill开始实习时还未离开Meta)合作发表了DiT模型,首次将Transformer与扩散模型结合到了一起。
该成果被ICCV 2023录用为Oral论文。值得一提的是,OpenAI此次发布的Sora,被认为正是基于DiT构建的。

去年5月,Bill也从伯克利毕业,并入职OpenAI。
除了这两位去年加入的研究者,Sora团队的另一位负责人Aditya Ramesh则是OpenAI的“老人”。

Aditya是DALL-E的创造者,主导了三代DALL-E的研究,三个版本的论文当中他都是共同一作。

而这样一位主导三代DALL-E,如今又领导Sora团队的大神,却只有本科学历。
据LeCun介绍,Aditya本科就读于纽约大学,并在他的实验室参与过一些项目。

其间,Aditya就已经在研究生成式模型,并和LeCun共同发表论文。
毕业之后,Aditya本想继续深造,但在OpenAI的暑期实习中被留了下来,成为了正式研究人员。
00后已加入
Sora团队的本科生,还不止Aditya Ramesh一位。
前文提到,这支团队中有一位“00后”Will DePue,就是2022年才刚从密西根大学计算机系本科毕业的。

这位小哥大四的时候创业搞了个市场咨询公司DeepResearch,这家公司后来被Commsor收购。
2023年7月,小哥加入OpenAI。根据他的领英信息,他是在今年1月才刚刚加入Sora项目组的。
另外,David Schnurr和Joe Taylor也都没有博士学位。前者毕业于加州大学圣塔芭芭拉分校,后者毕业于美国旧金山艺术大学。
而正如Aditya Ramesh自己所说,Sora团队的不少成员都是DALL-E 3的作者。

包括两位华人Li Jing和Yufei Guo。
Li Jing是DALL-E 3的共同一作,2014年本科毕业于北京大学物理系,2019年获得MIT物理学博士学位。在Meta做了2年多博士后之后,Li Jing于2022年加入OpenAI。
华人作者中还有Ricky Wang,今年一月刚刚从Meta/Instagram跳槽到OpenAI,另外两位Yufei Guo、Clarence Ng没有太多公开资料。
新跳槽来的还有Conner Holmes,他在微软工作时以外援形式参与了DALL·E 3的推理优化工作,后来干脆加入OpenAI了。
最后,来看一眼完整作者名单:

从团队的组建情况和研究基础来看,Sora应该是OpenAI近半年来的最新成果,而非网传“早已有之但憋着不发”。
不过,Sora炸场,顶级人才又持续星聚,还是惊得众人开始重新考量OpenAI的技术领先性。
就在今天,作者释出的Sora新作,连“同一场景”下的多机位视频都整出来了。

网友们的心情be like:
现在,是视频生成,下一个又会是什么
avatar
你信吗
2 楼
视频这个,等能让人自己玩来产生视频再说吧,背后不知道要多少computing power才能生成这么一段video
avatar
sorasky
3 楼
你信吗 发表于 2024-02-18 20:31
视频这个,等能让人自己玩来产生视频再说吧,背后不知道要多少computing power才能生成这么一段video

生成video的机理是什么?不就是之前生成photo的段时间大量累加吗?感觉没有什么本质的突破呀
avatar
hankzhang
4 楼
生成视频肯定要难一点。图片要连贯啊。 但是要想生成有意义的视频太难了。 更不用说根据导演的要求生成电影了。 我觉得这个还就是生成toy视频 的水平
avatar
mylifetouch
5 楼
现在的AI没有什么技术性的突破,全靠烧钱。所以不需要大牛,只需要背后有资本
avatar
loci
6 楼
mylifetouch 发表于 2024-02-18 22:10
现在的AI没有什么技术性的突破,全靠烧钱。所以不需要大牛,只需要背后有资本

那有巨大資本的中國怎麼沒辦法領先突破? 肯定有啥獨門技術
avatar
Summerxs
7 楼
都是金光闪闪的履历
avatar
huaren_2018
8 楼
avatar
mylifetouch
9 楼
loci 发表于 2024-02-18 22:13
那有巨大資本的中國怎麼沒辦法領先突破? 肯定有啥獨門技術

中国的AI 早都已经遥遥领先了
avatar
Wugelvshi
10 楼
回复 1楼 Taisy66 的帖子
我能说一句,你这个左下角的动图很诡异。
小汽车开过来了,可是后面的中巴好像找了个不存在的岔路,奇怪的跑掉了。
avatar
targeted
11 楼
有种说法 sora生成视频,不再是从建立场景建立模型打光的流程。 而是从人印象中场景的形式直接渲染产生的。 类似不是人人会电影制作建模,但每个人意识印象里都能展现完整的画面。
avatar
简单
12 楼
回复 10楼 Wugelvshi 的帖子
真的呀!
avatar
半个马和甲
13 楼
那有巨大資本的中國怎麼沒辦法領先突破? 肯定有啥獨門技術
loci 发表于 2024-02-18 22:13

中国AI的军事运用早就在科幻阶段(游戏)了。 GPT其实在真AI好像都不是什么老大。 也不知道美国军事是啥阶段的AI运用。
我瞎说的。别当真。
avatar
carbontt
14 楼
谢谢分享
相关阅读
揭秘Sora背后团队:4位华人,应届博士带队,还有00后版上炫富的是不是和抑郁的是同一批人?2024年2月1日历史上的今天2024年2月1日医疗晨报两首《万家灯火》第一批免签去新加坡的中国中产 已经破产了!给裸根兰花安家,一起新年快乐证监会对1家企业拟美国上市,出具备案补充材料要求(反馈意见)(2024年1月26日—2024年2月1日)打算欧洲游,意大利到底一个人能不能去?我为什么要让孩子去很卷的高中种草了这件DVF连衣裙,大家看看怎么样?德彪西的音乐图像:引言私董会的秘密:专割有钱人,“卖圈子”变现,00后入场当创业导师其实劝华人以后少参加万圣节的发糖活动万能华人请问发现同事数据造假该怎么办?关于朱令铊中毒的一点讨论这地名: Middlesex County in NJ越南“人间水蜜桃”ins爆红!我以为是AI造出来的,美的太不真实(图)《再见,布里诺斯艾利斯》演员李勤勤收养周海媚爱犬:一定照顾好她的毛孩子昨天晚上花时间做了回国攻略,还有一些疑问证监会对4家企业拟香港上市,出具备案补充材料要求(反馈意见)(2024年1月12日—2024年1月18日)我国人口是多少?40后、50后、60后、70后、80后、90后、00后的人口分别占多少?我不明白我的身高被分配去了那里…嫉妒的心灵不美丽今天早上做了个梦,我要take seriously 嘛?Sora幕后团队揭秘:4位华人,印度裔小哥“牵头”,还有高中就创业的00后..第55届博洛尼亚全球美妆展会 Cosmoprof 开幕在即,3000多家公司已确认参展《度华年》杀青特辑,赵今麦 张凌赫主演,期待早日播出!小学生适合用kindle吗?还是图书馆借书就好90后团队出海,用二次元滤镜霸榜日韩老邱被举报了,丢了工作。。。贾玲不过是靠视觉冲击力.....老公很会做饭娱乐圈最后一对真夫妻 张口就来的情话是基本操作作别流年看了速滑的兔子战术我的初中(二):安得广厦千万间美股基本面 - 2023_12_31 * 晨报 * 一入江湖岁月催!心中有基本,临危不慌张。新年快乐,来年再战。2023虽然过的不尽人意但是也要总结一下!
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。