Redian新闻
>
Ilya出走加剧OpenAI离职潮!RLHF作者Jan Leike同日辞职,超级对齐项目分崩离析

Ilya出走加剧OpenAI离职潮!RLHF作者Jan Leike同日辞职,超级对齐项目分崩离析

公众号新闻
梦晨 发自 凹非寺
量子位 | 公众号 QbitAI

Ilya Sutskever宣布退出OpenAI,震动整个AI圈。

数小时后,RLHF发明者之一Jan Leike也追随他的脚步一起离开,再次给OpenAI的前途蒙上了一层阴影。

两人共同领导的超级对齐团队成立还不到一年,已经分崩离析。

他甚至不留下一句客套话

Jan Leike在GPT-4项目上与Ryan Lowe共同领导了对齐工作,而后者也已于3月底离开OpenAI

所以说不止超级对齐团队,而是整个OpenAI安全研究方向的人才,都在持续动荡中

超级对齐成员之一William Saunders,以及参与过GPT-4对抗性测试的Daniel Kokotajlo,此前两人均已离开OpenAI。

其中Kokotajlo在Less Wrong论坛留下了自己的理由:

对OpenAI能否在AGI时代负责任的行动失去了信心。

按他的说法,当前的AI监管努力集中在“评估风险和采取缓解措施”的组合上,这种组合很容易被大型公司钻空子利用,最终导致“选择性暂停”,也就是最需要被监管的前沿大型AI实验室反而没被监管到

“幻灭了”,这是他用来形容辞职原因的说法,可能也代表了所有这些AI安全研究人员的心情。

对于这一系列事件,有网友表示:Ilya和Leike离开后,OpenAI可能不再是原来的OpenAI了。

还有人更悲观一些,失去两人以后,把对OpenAI能做好AGI的预期调整为零。

以及AI安全问题如此重要,让人们无法以看热闹的心态来看待这些“抓马”。

超级对齐团队或不复存在

为什么Jan Leike的离开引起这么大影响?

他早年在DeepMind工作,与OpenAI团队共同开发了人类反馈强化学习RLHF,后来成为ChatGPT的核心技术之一。

加入OpenAI后,从代码大模型Codex、ChatGPT的前身InstrucGPT,到ChatGPT、GPT-4他都是重要贡献者。

在去年11月的OpenAI董事会叛变风波中,Jan Leike也发挥了关键作用,可能是促成Ilya最终回心转意结束乱局的因素之一

2023年底,《时代》杂志将他列为人工智能领域100名最具影响力的人物之一。

2023年7月,Jan与Ilya发起了OpenAI超级对齐团队,拿出20%总算力,直接越级瞄准如何控制还不存在的超级智能。

对于不同时间尺度的AI风险,OpenAI有三个团队来分别应对,其中超级对齐负责遥远的未来。

超级对齐团队的第一个成果《Weak-to-Strong Generalization》,试图证明通过弱模型监管强模型是一条行之有效的路径

此外他们还开源了用于分析大模型可解释性的工具OpenAI Transformer Debugger。

这个工具结合了自动可解释性技术和稀疏自动编码器,支持神经元和注意力头干预,让研究者无需便携代码即可获得数据。

除了研究之外,超级对齐团队此前还有一系列资助AI安全研究的计划,第一期总计向学校、非营利组织和个人发放了1000万美元资金。

可能也就此成为绝唱。

One More Thing

在大量人才持续出走的同时,OpenAI也引进了一些新鲜血液。

最新消息,他们挖来了谷歌搜索广告业务的21年老将。

在商业化的路上不断加速,或许是AI安全团队选择分道扬镳的原因之一。

 

参考链接:
[1]
https://x.com/janleike/status/1790603862132596961
[2]https://openai.com/index/weak-to-strong-generalization/
[3]https://x.com/theinformation/status/1790467870545027186

量子位年度AI主题策划正在征集中!

欢迎投稿专题 一千零一个AI应365行AI落地方案

或与我们分享你在寻找的AI产品,或发现的AI新动向


点这里👇关注我,记得标星哦~

一键三连「分享」、「点赞」和「在看」

科技前沿进展日日相见 ~ 

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
全面解析RLHF,PPO,DPO,Flash Attention,增量学习等大模型算法OpenAI首席科学家宣布离职,曾参与驱逐CEO奥特曼;马斯克称OpenAI最新模型“慢得离谱”丨AIGC日报OpenAI“保卫人类”的团队分崩离析,Ilya与Altman内讧曝光:“OpenAI的人请庄重点”OpenAI联创:RLHF是超级智能的秘密武器《歌德堡变奏曲1552》陈丹琦团队新作:微调8B模型超越Claude3 Opus,背后是RLHF新平替迈克尔杰克逊家人们内斗不休,为争夺6亿美元巨额遗产分崩离析...OpenAI宫斗续集: 联合创始人 Ilya Sutskever 离职仅靠开源数据复刻出LLaMA3指令学习效果,在线迭代RLHF全流程解决方案来了Ilya官宣离职,超级对齐负责人Jan直接辞职,OpenAI还是走散了迈克尔杰克逊子女们内斗不休,为争夺6亿美元巨额遗产分崩离析...​突发!OpenAl超级对齐团队就地解散!【你的样子】听歌司美格鲁肽三项重磅研究发布,HFpEF合并肥胖患者综合获益再添力证! | ESC-HFA 2024《歌德堡变奏曲1551》突发!OpenAI超级对齐团队老大自曝离职原因!牵出管理内幕突发!OpenAI 创始人 Ilya 官宣离职,已有意义重大的下一步计划?回忆我的英文老师今日arXiv最热NLP大模型论文:清华大学提出IFT对齐算法,打破SFT与RLHF局限性ICML 2024 | 为什么我们应该做online RLHF/DPO?突发!OpenAI超级对齐团队负责人官宣离职!内部AGI或实现,全网陷大猜想华府消息|加拉格尔4月19日辞职 约翰逊将任命新的中国特别委员会主席AI初创集体跳槽OpenAI,Ilya出走后安全团队重整旗鼓!华为发布会造假?昇腾社区紧急回应;中国激光雷达制造商硬刚,正式起诉美国防部;OpenAI现离职潮:元老科学家们都跑光了丨AI周报紧跟Ilya,OpenAI超级对齐团队负责人官宣离职!内部AGI或实现,全网陷大猜想ICLR 2024 | RLHF有了通用平台和基准,天大开源,专攻现实决策场景不负春光(花朵美食图)OpenAI首席科学家Ilya离职,一个让马斯克与佩奇决裂的男人OpenAI 首席科学家Ilya Sutskever宣布即将离职,将致力于“对自己非常有意义”的新项目 | 环球科学要闻2024年大模型潜力方向:大浪淘沙后的SFT和RLHF剑桥提出RLHF平替方案:在SFT以外,我们还能拿SFT数据做什么?四大维度深度体验,GPT-4o为何被称作“最强”;OpenAI超级对齐团队“分崩离析”;脑机试验招募第二名患者|一周国际财经曝OpenAI超级对齐团队解散!英国私家小众包团4-7人9天7晚游:伦敦+剑桥+爱丁堡+格特纳格林+温德米尔+曼彻斯特+斯特拉福德+牛津大学 LHRLHR9V这个团队做了OpenAI没Open的技术,开源OpenRLHF让对齐大模型超简单
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。