Redian新闻
>
数学领域的“AlphaGo”:DeepMind最新AI模型,打破奥数天花板

数学领域的“AlphaGo”:DeepMind最新AI模型,打破奥数天花板

公众号新闻

来源:深究科学

作者:周晨


导读


今日,DeepMind再有新动作,这一次聚焦到奥林匹克竞赛领域。

          

DeepMind与纽约大学计算机科学系联手在《自然》(Nature)杂志上发布一项研究成果,研究团队研发了一款名为AlphaGeometry的人工智能(AI)系统。该AI模型成功解答了国际数学奥林匹克竞赛级别的几何问题,表现超越了以往最佳的自动化定理证明系统。

          

与以往不同的是,AlphaGeometry通过在不同复杂级别综合数百万个定理和证明,成功摆脱了对人类演示的依赖。

          

2016年,DeepMin的推出的AlphaGo打遍围棋界无敌手,这一次,AI能否再次在数学领域超越人类呢?

       

很多人认为,数学或许是验证人类逻辑思维能力的一个可靠参照模板。
          
在数学领域,证明数学定理一直是人类自动推理能力阈值的一大证明,而奥林匹克数学竞赛,则无疑是对于逻辑极限能力的挑战。
          
在过去,人类的高水平逻辑推理能力被认为是AI难以取代的,因为将人类逻辑证明的思路转化为机器可验证格式的成本一直很高。奥数水平的数学定理证明对逻辑推理和解题能力要求极高,而目前基于机器学习的AI系统在这方面仍然面临挑战,因为缺乏人类示范作为训练数据,特别是在几何学定理方面,机器学习的AI难以掌握这个领域。   
          

1月18日,DeepMind联合纽约大学计算机科学系提出了一种名为AlphaGeometry的创新AI模型方法,使得AI模型能够在无需人类示范的情况下学习和解决复杂问题。
          

AlphaGeometry能够通过综合复杂程度各异的数百万条定理和证明,利用一个神经语言模型完成自我训练。这种方法结合符号演绎引擎(能搜索难题中的大量分支点),能让AI模型在无需人类直接输入的情况下学习并解开复杂问题。
          
AlphaGeometry合成数据生成流程
          
可以说,该模型通过在不同复杂性级别上综合数百万个定理和证明,成功地摆脱了对人类演示的依赖。   
          
为了测试该模型的有效性,研究团队用国际数学奥林匹克竞赛(优等高中生参加的数学定理证明大赛)2000-2020年的30个问题测试了该系统。AlphaGeometry解出了其中25题,接近国际数学奥林匹克竞赛金牌选手的平均表现,而之前最优秀的方法只解出了10题。
          
AlphaGeometry将几何定理证明器的当前状态从低于人类水平提升到接近金牌水平。
          
值得一提的是,AlphaGeometry能生成人类可阅读的“证明步骤”,在人类专家的评估下,AlphaGeometry成功解决了IMO 2000和2015的所有几何问题,并且还发现了一个经过推广的IMO定理,这意味着,或许在不久的将来,该模型能够在数学领域刮起一阵让人为之震惊的风暴。
              
AlphaGeometry的概览,以及它是如何解决一个简单问题和IMO 2015问题3的
          
虽然目前AlphaGeometry仅限于几何学,但研究团队表示,这种方法或许也能在其他数学领域取得成功。
          
可以说,这项研究的成果标志着AI领域在解决复杂逻辑挑战方面迈出了重要一步,同时,也意味着未来AI数学研究将迎来全新的可能性。
                  
参考资料
Solving olympiad geometry without human Demonstrations.Nature. 
   

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
打破奥数天花板!DeepMind最新AI数学大模型,能以人类金牌水平解决几何题在中国,新疆羊肉是天花板,而它是新疆羊肉的天花板!硬核观察 #1239 DeepMind 推出 “机器人宪法”AI颠覆材料学!DeepMind重磅研究登Nature,预测220万晶体结构赢人类800年超越GPT-4!谷歌DeepMind重磅发布Gemini,史上最强最通用大模型!谷歌DeepMind爆火动画18秒解释LLM原理!加速知识检索:伯克利&DeepMind联合研究,RaLMSpec让语言模型服务飞速提升2-7倍!无题雜家皮草,專家奇點Javier Milei, John Keynes, Milton Friedman斯坦福机器人炒虾爆火网络,谷歌DeepMind发布机器人最新进展,2024智能机器人元年到来?数学界AlphaGo来了!攻破奥数难题登Nature,接近人类金牌水平快消外企社招 | Lagardère拉格代尔,世界三大旅行零售商之一,百年外企,平均月薪17.2k,0经验可投,留学生有优势Nature重磅!打破科研生涯天花板,药学领域在创新高!UC伯克利等发布多模态基础模型CoDi-2;谷歌DeepMind利用AI工具发现200万种新材料丨AIGC日报性能直追GPT-4,5000个H100训成!DeepMind联创发全新一代大模型全新开源AI代码工具诞生!超越谷歌DeepMind旗下AlphaCode迷失的时间(8)--- 守护心的觉性谷歌DeepMind发布三项机器人研究成果;传苹果将在WWDC发布生成式AI版本Siri丨AIGC日报AI要从娃娃抓起!微软谷歌DeepMind推出AI入门课程,零基础进入AI行业规模小、效率高:DeepMind推出多模态解决方案Mirasol 3B山情水趣话旅游(40):加拿大之行:(4)红色日记 主席逝世 9.9-15奥数能力金牌级:DeepMind几何推理模型登上Nature,代码开源,菲尔兹奖得主点赞鸿发超市「2000 万美元」买下82街前Walmart超市!开设第4家Hông Phát分店!谷歌DeepMind最新研究:对抗性攻击对人类也有效,人类和AI都会把花瓶认成猫!LLM准确率飙升27%!DeepMind提出全新「后退一步」Prompt技术谷歌DeepMind机器人成果三连发!两大能力全提升,数据收集系统可同时管理20个机器人LLM准确率飙升27%!谷歌DeepMind提出全新「后退一步」提示技术AI抢攻人类奥赛金牌!DeepMind数学模型做对25道IMO几何题,GPT-4惨败得0分奥数逼近金牌水平!谷歌最新AlphaGeometry模型登上Nature!菲尔兹奖得主点赞AI无法颠覆化学?谷歌DeepMind论文被爆重大缺陷,伦敦大学教授建议撤回Nature今日arXiv最热NLP大模型论文:伯克利&DeepMind联合研究,RaLMSpec让检索增强LLM速度提升2-7倍!ChatGPT狂吐训练数据!还带个人信息!DeepMind发现大bug引争议。。。谷歌DeepMind科学家「被爆将离职创业」!曾参与AlphaGo、Alphafold工作,首轮融资或超2亿美元ChatGPT狂吐训练数据,还带个人信息:DeepMind发现大bug引争议
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。