Redian新闻
>
德扑AI之父转投OpenAI!Science封面研究大牛,顶会拿到手软

德扑AI之父转投OpenAI!Science封面研究大牛,顶会拿到手软

公众号新闻
西风 发自 凹非寺
量子位 | 公众号 QbitAI

OpenAI被爆最新人事动向:

前FAIR(Meta)研究科学家Noam Brown加盟!

这位大佬来头可不小,研究曾登上《Science》封面。

不仅如此,他此前的研究成果可谓相当炸裂,可以用一句话来总结:

NeurIPS、AAAI等众多顶会论文奖拿到手软!

就是这样一位传奇人物,加入OpenAI后他对自己要做的事放出狠话:

如果成功,我们或许会看到比GPT-4好1000倍的大语言模型。

所以,他之前拿下过什么成就,下一步又究竟要做什么?

德扑AI之父!拿奖拿到手软

Noam Brown与AI结缘,要从他的一篇博士论文说起。

三年前,Noam Brown从卡内基梅隆大学(CMU)以230页超硬核论文完成答辩,拿下计算机科学博士学位。

这篇论文,写的正是Noam Brown与其CMU导师Tuomas Sandholm一起创建的AI系统——称霸德州扑克赛场的赌神Libratus(冷扑大师)和Pluribus。

与围棋、国际象棋、跳棋等棋类游戏不同,这些游戏属于完美信息博弈,对战的双方,清楚每一时刻局面上的全部情况。

而相比之下,德州扑克存在大量的隐藏信息,包括:对手持有什么牌,对手是否在诈唬?

这也就决定了德扑的一个主要特征——不完美博弈

为此,Noam Brown创建的Libratus将三个负责开发扑克策略、实时优化策略、比赛结束后审查牌局的AI系统结合了起来。

2017年年初,在宾夕法尼亚州匹兹堡的Rivers赌场上,4名顶尖人类职业玩家和Libratus在为期 20 天的赛程里面对战12万手,Libratus一路以碾压的态势豪取胜利,赢得176万美元(虚拟货币)。

和AlphaGo不同,在人机大战之前Libratus没有研究过人类如何打德州扑克,也没有和人类职业玩家有过交手。

但Libratus对战四位人类高手还是拿下了大比分优势:14.7个大盲注/百手(14.7bb/h)。

“一般领先5-10bb/h就肯定是赢了”,Noam Brown表示。

德扑AI不仅取得了这场比赛的胜利,Pluribus还在那年登顶了《Science》封面。

与此相关的研究,目前也已有近700的引用量。

当然,Libratus不是凭空而生,2015年4月它的前身Claudico正是在同一个赌场里,和四位人类顶级玩家交锋8万手后,累积输掉73.2万美元(当然也是虚拟货币),败给了人类。

Noam Brown多年来在多步骤推理、自我对战和多智能体AI方面的研究,终于以Libratus的成功交上了一份满意的答卷,并在此之后,包揽众多大奖。

比赛胜利同年,他获得了NeurIPS 2017最佳论文奖。2019年又继续与导师合作,成功拿下AAAI 2019Honorable Mention奖

之后Noam Brown的一系列成果获得了《Science》2019年年度突破的亚军、马文·明斯基奖,还被评为《MIT科技评论》35岁以下35位创新者之一。

此前获得过这个称号的,就包括谷歌创始人Larry Page、Sergey Brin,Facebook创始人Mark Zuckerberg,Paypal及Slide创始人Max Levchin,还有著名人工智能科学家吴恩达等一众大佬。

但是不管Libratus距离扑克之神还有多远,Brown坦言他不会再对这个德扑AI进行优化了。

博士毕业后,Noam Brown加入了FAIR(Meta),成为其研究科学家。

在Meta,他曾参与共同开发出第一个在战略游戏Diplomacy中达到人类水平的AI——CICERO。

一切看起来顺风顺水,Noam Brown为什么突然要转战OpenAI,又究竟要做什么?

加入OpenAI后:用游戏中的方法提升大模型

Noam Brown给出了他的答案:

多年来,一直在研究扑克和Diplomacy等游戏中的AI自我对战和推理。现在,我将研究如何将这些方法真正通用化。

所以,下一个大模型难道将借鉴游戏中的方法?

其实,Noam Brown的灵感来自于当年Libratus成功击败了顶级人类选手时,他所观察到的一种现象。

而这种现象与2016年AlphaGo击败李世石极为相似。

回想AlphaGo击败李世石,其中的关键在于:

AI在每一步棋之前都能够进行约1分钟的“思考”

而就这一点对于AlphaGoZero来说,相当于将预训练的规模扩大了约10万倍(搜索后评分约为5200 Elo,不经搜索评分约为3000 Elo)。

Noam Brown在扑克中观察到了类似的现象,将其运用于Libratus,才有了后面的成功击败顶级人类选手。

除此之外,AnthropicAI的技术工程师Andy L. Jones,在Hex棋盘游戏中详细研究了训练时间和测试时间的计算权衡,也发现了类似的模式。

这项研究展示了如何在MCTS(Monte Carlo Tree Search,蒙特卡洛树搜索)的训练计算和推理计算之间进行权衡,而增加10倍的MCTS步骤几乎等同于增加10倍的训练:

Noam Brown认为:

现在所有这些方法都是针对特定的游戏而设计的。如果我们能够发现一个通用版本,那么增益将是巨大的。

虽然推理可能会慢1000倍,并且成本更高,但是与为了一种新的抗癌药物或者为了证明黎曼猜想一样,我们会为推理付出怎样的代价呢?

接着他又补充道:

提升能力总是存在风险的,但如果这项研究取得成功,它在安全研究方面也将具有重要价值。想象一下,如果我们能够花费100万美元的推理成本来预测一个更具能力的未来模型,这将给我们一个此前所没有的警示。

对于Noam Brown加入OpenAI这事儿,评论区赶来的大多是来道喜的。

比如说PyTorch联合创始人Soumith Chintala:

前同事Meta AI研究总监、佐治亚理工学院计算机科学家Dhruv Batra也发来了“贺电”:

参考链接:
[1]https://twitter.com/polynoamial/status/1676971503261454340

[2]https://noambrown.github.io/
[3]https://www.science.org/toc/science/365/6456

「AIGC+垂直领域社群」

招募中!

欢迎关注AIGC的伙伴们加入AIGC+垂直领域社群,一起学习、探索、创新AIGC!

请备注您想加入的垂直领域「教育」或「电商零售」,加入AIGC人才社群请备注「人才」&「姓名-公司-职位」。


点这里👇关注我,记得标星哦~

一键三连「分享」、「点赞」和「在看」

科技前沿进展日日相见 ~ 

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
普林斯顿国际数理学校-Princeton International School of Mathematics&SciencePopstar Jay Chou’s Fans Fume as Scalpers Cash in on Concert Hype英美顶尖名校offer拿到手软,还有数百万元奖学金?!新西兰艺术生竟然还能如此逆袭!Lisa被曝秘恋「首富儿子」,LV代言拿到手软!网友:这有点厉害!直到她去世孩子們才偷看奶奶的日記家庭隱私的邊界/麥迪遜縣的橋樑拿钱拿到手软!加拿大今夏将发放5笔福利金,四口之家一个月最多可拿20000!【九周年庆典】重磅来袭!周年盛会福利与折扣汇总,超多实惠拿到手软那个拿奖拿到手软的“顶流巧克力”,半价回归了!油画 桃林冲!Sephora大减价:$3.50买口红!Shoppers引进爆红品牌!攻克量子计算不可靠难题,IBM用误差缓解得到有用计算,登Nature封面融资拿到手软,估值超 40 亿美元,这家公司成 OpenAI 最大对手Lisa被曝巴黎约会首富儿子?LVHM代言拿到手软!王子公主照进现实!刺激,无人机竞速超越顶级人类玩家,强化学习再登Nature封面大温夏日胜地原来在The Met! 打卡这个全BC最大商场! 礼品卡+好礼拿到手软!秦岭金丝猴,上了Science封面AI机器识别突破登Nature封面,加速第四次工业革命,论文一作为浙大校友我国柔性电池登Nature封面;限氧或能延寿;人类冬眠不是梦…|WE科学周报打破校史!理工大学,登上Nature封面!Doris Day/Que sera, sera量子计算新里程碑登Nature封面!100+量子比特无需纠错,超越经典计算Nature封面:AI提高自动驾驶夜视能力,检测黑夜、雾天场景和白天一样idealism biggest driving forces through challenging times and he自动驾驶新方法登Nature封面:让黑夜如白昼般清晰,浙大博士一作618手机混战收官:小米“第一”拿到手软,华为4G继续卖爆Lisa被曝巴黎约会首富儿子?LVHM代言拿到手软!网友:王子公主照进现实...目标OpenAI!前谷歌CEO发起AI+Science登月计划官宣!德扑AI之父Noam Brown加盟OpenAI,下注AI智能体回家“大嫂”高叶大杀四方,资源拿到手软,网友:她的福气还在后头!泰酷辣!哈佛耶鲁斯坦福MIT还有牛剑等TOP录取拿到手软,数千专业顶级项目全部囊获!常青藤23Fall录取名场面一起来了解!算法操控2020美国总统大选登Science封面!Meta首次祭出4篇研究,自证清白,两极分化无解俄罗斯啤酒出手就是“王炸”!火遍全球75国,国际金奖拿到手软,价格低到让人疯抢泛素研究大数据解析-2023丨这个带来诺奖+上市药物+一系列突破性研究的领域,你现在有一个全新的机会参与!福利拿到手软!澳洲47亿补贴正在发放!覆盖生活方方面面!中澳航班最新计划表出炉!
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。