国际科技财经博客移民网络热点娱乐民生时事公众号

>

数学领域的“AlphaGo”：DeepMind最新AI模型，打破奥数天花板

数学领域的“AlphaGo”：DeepMind最新AI模型，打破奥数天花板

公众号新闻

2024-01-19 10:01

来源：深究科学

作者：周晨

导读

今日，DeepMind再有新动作，这一次聚焦到奥林匹克竞赛领域。

DeepMind与纽约大学计算机科学系联手在《自然》（Nature）杂志上发布一项研究成果，研究团队研发了一款名为AlphaGeometry的人工智能（AI）系统。该AI模型成功解答了国际数学奥林匹克竞赛级别的几何问题，表现超越了以往最佳的自动化定理证明系统。

与以往不同的是，AlphaGeometry通过在不同复杂级别综合数百万个定理和证明，成功摆脱了对人类演示的依赖。

2016年，DeepMin的推出的AlphaGo打遍围棋界无敌手，这一次，AI能否再次在数学领域超越人类呢？

很多人认为，数学或许是验证人类逻辑思维能力的一个可靠参照模板。

在数学领域，证明数学定理一直是人类自动推理能力阈值的一大证明，而奥林匹克数学竞赛，则无疑是对于逻辑极限能力的挑战。

在过去，人类的高水平逻辑推理能力被认为是AI难以取代的，因为将人类逻辑证明的思路转化为机器可验证格式的成本一直很高。奥数水平的数学定理证明对逻辑推理和解题能力要求极高，而目前基于机器学习的AI系统在这方面仍然面临挑战，因为缺乏人类示范作为训练数据，特别是在几何学定理方面，机器学习的AI难以掌握这个领域。

1月18日，DeepMind联合纽约大学计算机科学系提出了一种名为AlphaGeometry的创新AI模型方法，使得AI模型能够在无需人类示范的情况下学习和解决复杂问题。

AlphaGeometry能够通过综合复杂程度各异的数百万条定理和证明，利用一个神经语言模型完成自我训练。这种方法结合符号演绎引擎（能搜索难题中的大量分支点），能让AI模型在无需人类直接输入的情况下学习并解开复杂问题。

AlphaGeometry合成数据生成流程

可以说，该模型通过在不同复杂性级别上综合数百万个定理和证明，成功地摆脱了对人类演示的依赖。

为了测试该模型的有效性，研究团队用国际数学奥林匹克竞赛（优等高中生参加的数学定理证明大赛）2000-2020年的30个问题测试了该系统。AlphaGeometry解出了其中25题，接近国际数学奥林匹克竞赛金牌选手的平均表现，而之前最优秀的方法只解出了10题。

AlphaGeometry将几何定理证明器的当前状态从低于人类水平提升到接近金牌水平。

值得一提的是，AlphaGeometry能生成人类可阅读的“证明步骤”，在人类专家的评估下，AlphaGeometry成功解决了IMO 2000和2015的所有几何问题，并且还发现了一个经过推广的IMO定理，这意味着，或许在不久的将来，该模型能够在数学领域刮起一阵让人为之震惊的风暴。

AlphaGeometry的概览，以及它是如何解决一个简单问题和IMO 2015问题3的

虽然目前AlphaGeometry仅限于几何学，但研究团队表示，这种方法或许也能在其他数学领域取得成功。

可以说，这项研究的成果标志着AI领域在解决复杂逻辑挑战方面迈出了重要一步，同时，也意味着未来AI数学研究将迎来全新的可能性。

参考资料

Solving olympiad geometry without human Demonstrations.Nature.

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。

来源: qq

点击查看作者最近其他文章

相关阅读

超越GPT-4！谷歌DeepMind重磅发布Gemini，史上最强最通用大模型！鸿发超市「2000 万美元」买下82街前Walmart超市！开设第4家Hông Phát分店！AI要从娃娃抓起！微软谷歌DeepMind推出AI入门课程，零基础进入AI行业 ChatGPT狂吐训练数据！还带个人信息！DeepMind发现大bug引争议。。。LLM准确率飙升27%！DeepMind提出全新「后退一步」Prompt技术加速知识检索：伯克利&DeepMind联合研究，RaLMSpec让语言模型服务飞速提升2-7倍！雜家皮草,專家奇點Javier Milei, John Keynes, Milton Friedman 谷歌DeepMind机器人成果三连发！两大能力全提升，数据收集系统可同时管理20个机器人今日arXiv最热NLP大模型论文：伯克利&DeepMind联合研究，RaLMSpec让检索增强LLM速度提升2-7倍！奥数逼近金牌水平！谷歌最新AlphaGeometry模型登上Nature！菲尔兹奖得主点赞在中国，新疆羊肉是天花板，而它是新疆羊肉的天花板！山情水趣话旅游（40）：加拿大之行:（4）硬核观察 #1239 DeepMind 推出 “机器人宪法”无题 AI无法颠覆化学？谷歌DeepMind论文被爆重大缺陷，伦敦大学教授建议撤回Nature 打破奥数天花板！DeepMind最新AI数学大模型，能以人类金牌水平解决几何题 LLM准确率飙升27%！谷歌DeepMind提出全新「后退一步」提示技术谷歌DeepMind最新研究：对抗性攻击对人类也有效，人类和AI都会把花瓶认成猫！红色日记主席逝世 9.9-15 性能直追GPT-4，5000个H100训成！DeepMind联创发全新一代大模型迷失的时间（8）--- 守护心的觉性规模小、效率高：DeepMind推出多模态解决方案Mirasol 3B ChatGPT狂吐训练数据，还带个人信息：DeepMind发现大bug引争议奥数能力金牌级：DeepMind几何推理模型登上Nature，代码开源，菲尔兹奖得主点赞数学界AlphaGo来了！攻破奥数难题登Nature，接近人类金牌水平快消外企社招 | Lagardère拉格代尔，世界三大旅行零售商之一，百年外企，平均月薪17.2k，0经验可投，留学生有优势 UC伯克利等发布多模态基础模型CoDi-2；谷歌DeepMind利用AI工具发现200万种新材料丨AIGC日报谷歌DeepMind科学家「被爆将离职创业」！曾参与AlphaGo、Alphafold工作，首轮融资或超2亿美元斯坦福机器人炒虾爆火网络，谷歌DeepMind发布机器人最新进展，2024智能机器人元年到来？Nature重磅！打破科研生涯天花板，药学领域在创新高！谷歌DeepMind爆火动画18秒解释LLM原理！全新开源AI代码工具诞生！超越谷歌DeepMind旗下AlphaCode AI抢攻人类奥赛金牌！DeepMind数学模型做对25道IMO几何题，GPT-4惨败得0分 AI颠覆材料学！DeepMind重磅研究登Nature，预测220万晶体结构赢人类800年谷歌DeepMind发布三项机器人研究成果；传苹果将在WWDC发布生成式AI版本Siri丨AIGC日报

热点事件追踪