Redian新闻
>
突破!GPT-4在97轮对话中探索世界难题,给出P≠NP结论!

突破!GPT-4在97轮对话中探索世界难题,给出P≠NP结论!

公众号新闻

点击下方卡片,关注“CVer”公众号

AI/CV重磅干货,第一时间送达

点击进入—>【目标检测和Transformer】交流群

转载自:机器之心 | 编辑:陈萍

这是对「LLM for Science」一次有希望的探索。
对于身处科研领域的人来说,或多或少的都听到过 P/NP 问题,该问题被克雷数学研究所收录在千禧年大奖难题中,里面有七大难题,大家熟知的庞加莱猜想、黎曼假设等都包含在内。而且这个组织还为能够攻克该问题的研究人员提供了上百万美元的奖金悬赏。

P/NP 问题最早在 1971 年由史提芬・古克(Stephen A. Cook)和列昂尼德・列文分别提出。多年以来,很多人都投入到该问题的研究中。但有人表示 P=NP 的解决保守估计可能还需要 100 年的时间。

近年来,不乏有人声称证明了 P 等于或者不等于 NP,但证明过程都存在错误。到目前为止,还没有人能够回答这个问题。

现在,随着 AI 技术的发展,尤其是这一年来大语言模型的快速迭代,有研究开始尝试使用 AI 技术来解决这些世界难题。

本文,来自微软研究院、北京大学、北航等机构的研究者提出使用大语言模型 (LLM) 来增强和加速对 P versus NP 问题的研究。 

具体来说,本文提出了一个能使 LLM 进行深入思考并解决复杂问题的通用框架:苏格拉底推理(Socratic reasoning)。基于该框架,LLM 可以进行递归地发现、解决并整合问题,同时还能进行自我评估和完善。

本文对 P vs. NP 问题的试点研究表明,GPT-4 成功地生成了一个证明模式,并在 97 轮对话回合中进行了严格的推理,得出「P≠ NP」的结论,这与(Xu 和 Zhou,2023)结论一致 。


论文地址:https://arxiv.org/pdf/2309.05689.pdf

本文的贡献可总结为:

  • 将 LLM 作为与人类一起协作的伙伴来应对复杂的科学挑战,并提出「LLM for Science(LLM4Science )」范式。
  • 引入一个名为「苏格拉底推理」的框架,鼓励 LLM 使用演绎、转换、分解等模式来激发批判性思维。
  • 使用 GPT-4 和苏格拉底推理框架进行试点研究,以解决理论计算机科学中的 P 与 NP 问题。
  • GPT-4 成功地生成了证明模式,并在 97 个对话回合中进行了严格的推理,得出了 P ≠ NP 的结论,与 Xu 和 Zhou (2023) 最近的工作一致。
  • 该研究展示了 GPT-4 等 LLM 推断新知识并与人类合作探索复杂专家级问题的潜在能力。
  • 本文强调了 LLM 是跨领域的通用创新领航者,这与之前为特定任务量身定制的专门 AI 模型不同。
  • LLM 流畅运用自然和数学语言的能力对于跨学科发现至关重要。
  • 这项工作揭示了如何利用 LLM 作为合作伙伴来增强和加速跨不同领域的科学研究进程。

文中表示,他们之所以将框架命名为「苏格拉底推理」,是受到了古希腊哲学家苏格拉底的启发。苏格拉底曾经说过:「我无法教给任何人任何东西。我只能让他们思考。」 而该框架整体设计思路也是这样的,这是一种通用的问题解决框架,允许 LLM 在广泛的解决方案空间中导航并有效地得出答案。

如表 1 所示,「苏格拉底推理」有五种提示模式:演绎(deduction)、变换(transformation)、分解(decomposition)、验证(verification)、融合(integration)。这些模式被用来发现新的见解和观点,将复杂的问题分解成子问题或小步骤,并通过挑战响应答案来进行自我改进。

在较小的问题(atomic problem)上,LLM 能够直接给出推理结果,这时采用演绎模式(例如提示语为让我们一步一步思考……)来指导 LLM 直接得出结论。

对于更加复杂的问题,本文首先要求 LLM 将问题转化成一个新问题或将其分解为几个子问题。然后递归地执行这些模式,直到达到原子 ji 问题。

当产生新的问题或得出新的结论时,采用验证模式并利用 LLM 的自我评判能力进行验证和完善。

最后,融合模式要求 LLM 根据子问题的结果综合结论。

激励 LLM 通过一系列对话递归地继续上述过程,直到解决目标问题。

在这项工作中,「苏格拉底推理」为具有挑战性的问题提供了系统的提示框架。

下图为「苏格拉底推理」中用于解决 P vs. NP 问题的对话示例。案例研究中使用了 GPT-4 API,此外,本文还根据轮次索引对流程进行排序。 

探索过程中,本文引入了五个不同的角色(例如,精通概率论的数学家)作为辅助证明者。完成这项实验总共进行了 97 轮对话,分为前 14 论对话和后 83 轮对话。

例如第一轮提示:你能找到 P!=NP 背后的根本问题吗?从哲学的角度,而不是从计算机理论的角度。

其他提示如下:

之后对话不断进行,最后一轮对话是这样的:最后给出结论 P≠ NP。

感兴趣的读者可以查看原论文,了解更多内容。
点击进入—>【目标检测和Transformer】交流群


ICCV / CVPR 2023论文和代码下载


后台回复:CVPR2023,即可下载CVPR 2023论文和代码开源的论文合集

后台回复:ICCV2023,即可下载ICCV 2023论文和代码开源的论文合集

目标检测和Transformer交流群成立


扫描下方二维码,或者添加微信:CVer333,即可添加CVer小助手微信,便可申请加入CVer-目标检测或者Transformer 微信交流群。另外其他垂直方向已涵盖:目标检测、图像分割、目标跟踪、人脸检测&识别、OCR、姿态估计、超分辨率、SLAM、医疗影像、Re-ID、GAN、NAS、深度估计、自动驾驶、强化学习、车道线检测、模型剪枝&压缩、去噪、去雾、去雨、风格迁移、遥感图像、行为识别、视频理解、图像融合、图像检索、论文投稿&交流、PyTorch、TensorFlow和Transformer、NeRF等。


一定要备注:研究方向+地点+学校/公司+昵称(如目标检测或者Transformer+上海+上交+卡卡),根据格式备注,可更快被通过且邀请进群


▲扫码或加微信号: CVer333,进交流群


CVer计算机视觉(知识星球)来了!想要了解最新最快最好的CV/DL/AI论文速递、优质实战项目、AI行业前沿、从入门到精通学习教程等资料,欢迎扫描下方二维码,加入CVer计算机视觉,已汇集数千人!


扫码进星球


▲点击上方卡片,关注CVer公众号

整理不易,请点赞和在看

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
GPT4在变笨,实锤了!GPT-4成功得出P≠NP,陶哲轩预言成真!97轮「苏格拉底式推理」对话破解世界数学难题MiniGPT-4升级到MiniGPT-v2了,不用GPT-4照样完成多模态任务澳洲女足晋级世界杯16强,州长宣布悉尼歌剧院将亮灯!中国队或成下轮对手GPT-4太烧钱,微软想甩掉OpenAI?曝出Plan B:千块GPU专训「小模型」,开启必应内测AI大模型背后的惊人数字:问ChatGPT 5个问题,耗水500毫升?训练一次GPT-3,碳排放量相当于开车往返月球?ChatGPT最近被微软内部禁用!GPTs新bug:数据只要两句提示词就能套走嘘!安省博物馆回应恐龙的"私处"问题:从中国化石得出结论!一套让孩子上瘾的科普绘本!带孩子探索世界的奥秘!GPT turbo 看了没?!这真是大批失业人员在路上。机器人ChatGPT来了!大模型进现实世界,DeepMind重量级突破!清华微软「LLM+推理智能体」超越GPT-4!攻克数理难题,斩获开源界MATH最佳成绩刚刚,超导低温得出结论!是乌龙?还是第四次工业革命?BaiChuan13B多轮对话微调范例纽约州莫霍克山屋(Mohonk Mountain House),难忘美景原创丨特大喜讯:华为芯片突破后,中国光刻机迎来重大突破!欧盟此时竟下场了!和孩子一起“周游列国”,让孩子在阅读中探索历史文化央视突然公开:全世界难以置信,中国却做到了!又一次把想象变成现实...关于GPT-4在变笨,有人写了篇论文证实了这一点以小见大是孩子探索世界的好方法离谱!多伦多妹子吐槽花$34在餐馆吃到发臭的色拉!网友哗然近半数已退出!社区支行十周年:在多维关系中探索多方向可能冬天脚冷这个世界难题,你们怎么解决的?OpenAI突发更新!GPT-3.5正式开放「微调」,人人可打造专属ChatGPT|附最全官方指南手套花,优雅含蓄00后牛娃想用政治经济学探索世界运转的逻辑,名校录取只是他的第一步时间的湾 1深夜重磅!GPT-4 Turbo 发布,更强更全能还更便宜,能赚钱的 GPT 商店也要开了希腊圣托里尼岛(Santorini),蓝天白屋GPT-4在97轮对话中探索世界难题,给出P≠NP结论自古就是礼仪之邦吗?对标GPT-4代码解释器!港中大让模型写代码解决数学难题,得分超越GPT-4GPT-4破防啦!用密码和GPT-4聊天,成功绕过了GPT-4的安全机制!港中大(深圳)告诉你方法在学习和实际中探索30倍增量的新职业|萌芽计划早鸟价正式开售ChatGPT/GPT-4/Llama电车难题大PK!小模型道德感反而更高?七律-记白天鹅宾馆茶聚深夜重磅!GPT-4 Turbo 发布,更强更全能还更便宜,GPT 商店要开了
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。