Redian新闻
>
奥数逼近金牌水平!谷歌最新AlphaGeometry模型登上Nature!菲尔兹奖得主点赞

奥数逼近金牌水平!谷歌最新AlphaGeometry模型登上Nature!菲尔兹奖得主点赞

科技

夕小瑶科技说 原创
作者 | 王二狗

大家好,我是二狗。

谷歌DeepMind 最新AI研究突破登上了《Nature》!

这篇《Solving olympiad geometry without human demonstrations》研究论文提出了AI系统 AlphaGeometry,能够以接近人类奥林匹克金牌得主的水平解决奥林匹克几何问题。

这是在迈向更先进和通用的人工智能系统的道路上发展深度数学推理的一个重要里程碑。

在对 30 道奥数几何题的基准测试中,AlphaGeometry 在标准奥数时限内成功解决了 25 道,正确率高达83%。 相比之下,之前最先进的AI系统仅解决了 10道,而人类金牌得主平均解决了 25.9 个问题。

另外值得一提的是,AlphaGeometry 在人类专家评估下解决了 2000 年和 2015 年奥林匹克竞赛中的所有几何问题,且与许多先前的方法不同,AlphaGeometry 生成的证明可读性很强。

谷歌DeepMind CEO 哈萨比斯对AlphaGeometry 团队取得的成就表示祝贺:

神经语言模型+符号推演引擎

AlphaGeometry 是一个由神经语言模型和符号推演引擎两个部分组成的神经符号系统,二者一起解决复杂几何定理的证明。类似于“思考,快和慢”的理念,一个系统提供快速、直观的想法,而另一个系统则提供更加深思熟虑、理性的决策。这其中:

  • 神经语言模型,可以预测有用的几何结构来解决问题;
  • 符号推演引擎,能够使用逻辑规则推导出结论;

而二者的结合能够扬长避短,AlphaGeometry系统中的语言模型引导符号推导引擎寻找几何问题的可能解决方案。

奥林匹克几何问题基于图表,需要添加如点、线或圆新的几何结构才能解决。AlphaGeometry 的语言模型可以从无数种可能性中预测添加哪些新结构最有用。这些线索有助于填补空白,并允许符号引擎对图表进行进一步推论并接近解决方案。

比如让AlphaGeometry 解决一个简单的问题:给定问题图及其定理前提(左),AlphaGeometry(中)首先使用符号引擎推导有关图的新陈述,直到找到解决方案或用尽新陈述。如果找不到解决方案,AlphaGeometry 的语言模型会添加一种可能有用的构造(蓝色),为符号引擎开辟新的推导路径。这个过程一直循环持续,直到找到解决方案为止(右)。

仅接受合成数据的训练(1 亿个

由于缺乏推理技能和训练数据,AI系统经常难以解决几何和数学中的复杂问题。AlphaGeometry 的系统将神经语言模型的预测能力与规则约束演绎引擎相结合,协同工作来寻找解决方案。

谷歌DeepMind 开发了一种“符号推演与回溯”方法生成了 1 亿个合成训练数据,打破了数据瓶颈,成功地在没有任何人类演示的情况下训练出来了 AlphaGeometry。

谷歌的“符号推演与回溯”合成数据生成方法使用高度并行计算,系统首先生成十亿个几何对象的随机图,并详尽地推导出每个图中点和线之间的所有关系。AlphaGeometry 找到了每个图表中包含的所有证明,然后向后回溯工作找出需要的附加构造来得出这些证明。

AGI数学推理的一个重要里程碑

AlphaGeometry展示了人工智能不断增长的逻辑推理能力以及发现和验证新知识的能力。

网友们纷纷表示祝贺:

谷歌DeepMind表示:

解决奥林匹克级别的几何问题是在迈向更先进和通用的人工智能系统的道路上发展深度数学推理的一个重要里程碑。

我们决定开源 AlphaGeometry 代码和模型,并希望与合成数据生成和训练中的其他工具和方法一起,帮助在数学、科学和人工智能领域开辟新的可能性。

菲尔兹奖得主和IMO金牌获得者NGÔ BẢO CHÂU表示:

现在我知道了为何AI领域的研究人员会首先尝试解决 IMO 几何问题,因为这里寻找的解决方案有点像国际象棋,系统在每一步中的合理动作数量都相当少。但我仍然对谷歌DeepMind 这项工作感到惊讶,这是一项令人印象深刻的成就。

参考资料

 [1]https://deepmind.google/discover/blog/alphageometry-an-olympiad-level-ai-system-for-geometry/

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
阿里全新Agent玩转手机:刷短视频自主点赞评论,还学会了跨应用操作视频里有前男友?谷歌最新AI视频生成器 Lumiere,轻松让他消失如何购买幸福?奥数能力金牌级:DeepMind几何推理模型登上Nature,代码开源,菲尔兹奖得主点赞今日Arxiv最热NLP大模型论文:Meta自我奖励模型超越人类反馈限制,刷新AlpacaEval 2.0排行榜数学领域的“AlphaGo”:DeepMind最新AI模型,打破奥数天花板谷歌最强开源大模型亮相!Gemini技术下放,笔记本就能跑,可商用优等生归来,谷歌最强大模型Gemini能否打败GPT4?|甲子光年医学顶刊Nature Medicine!上海交大盛斌团队提出DeepDR Plus:预测糖尿病视网膜病变进展时间的深度学习系统谷歌最强AI大模型Gemini 1.0发布;Touch ID发明人宣布退休;麦当劳中国APP启动鸿蒙原生应用开发|AIoT情报重磅!相隔1万公里,两个“异地”实验室成功合作,登上Nature子刊谷歌数学AI登Nature:IMO金牌几何水平,定理证明超越1978年吴文俊法踏秋达摩院医疗AI攻克胰腺癌早筛难题,成果登上顶级期刊《Nature Medicine》谷歌DeepMind科学家「被爆将离职创业」!曾参与AlphaGo、Alphafold工作,首轮融资或超2亿美元红色日记 朱总病逝 1976年 27岁 7.1-31马克谈天下(412) 聊聊中国最新房改的前景OpenAI一键调用GPTs功能上线;Alphabet CEO皮查伊:Gemini Ultra AI模型将很快面世丨AIGC日报打破奥数天花板!DeepMind最新AI数学大模型,能以人类金牌水平解决几何题Winter Break Nearing, China Targets Illegal Student Competitions被Sora抢了风头的谷歌“杀”回来了!谷歌的一群“书呆子”卷出了最强开放模型Gemma语言理解首超人类,谷歌最新大模型Gemini,碾压GPT-4长篇小说《谷雨立夏间》34 第一枪字节跳动Q2收入290亿美元,逼近Meta;机构:Temu和SHEIN美国用户逼近亚马逊|36氪出海·要闻回顾被 Sora 抢了风头的谷歌“杀”回来了!谷歌的一群“书呆子”卷出了最强开放模型 GemmaAI Agent自主设计全新蛋白质登Nature!威斯康星大学让机器人科学家做实验,无需人类帮助登上Nature,剑桥团队开发新型tRNA展示技术,有潜力合成多种新材料,已申请专利加入GourmetCarte!发帖点赞,$100礼品卡等你拿!数学界AlphaGo来了!攻破奥数难题登Nature,接近人类金牌水平性能逼近GPT-4,开源Mistral-Medium意外泄露?CEO最新回应来了医学顶刊Nature Medicine!达摩院提出:CT首次实现大规模胰腺癌筛查鸿发超市「2000 万美元」买下82街前Walmart超市!开设第4家Hông Phát分店!这本书是对菲尔兹奖得主陶哲轩数学天赋的高度展现!!豆瓣高达9.8分!一部iPhone实时渲染300平房间,精度达厘米级别!谷歌最新研究证明NeRF没死浙大发布Agent学习框架,13B 模型达到 ChatGPT 水平!
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。