Nature 热议论文证明「语言不是思考工具」，LLM 可能要学不会推理了？

2024-06-30 11:06

机器之心PRO · 会员通讯 Week 26

---- 本周为您解读 ③ 个值得细品的 AI & Robotics 业内要事 ----

1. Nature 热议论文证明「语言不是思考工具」，LLM 可能要学不会推理了？

「语言≠思维」的论文引起了哪些讨论？论文观点和乔姆斯基唱衰 ChatGPT 有何关联？为什么研究语言和思维的关系很重要？哪些证据说明语言和思维关系不大？语言在人类沟通系统是什么角色？...

2. Super App 引发的迷思：在泡沫与难题中寻找大模型落地的答案

为何 Super App 仍没有出现？英伟达股价暴涨又暴跌，是人工智能泡沫还是人工智能硬件的泡沫？经典的 PMF 理论在大模型时代是否仍适用？大模型应用能否赚钱落地看哪些关键指标？AI 巨头们找到可行的商业模式了吗？大模型的潜力已经到顶了吗？面临哪些不得不解决的技术难题？...

3. 深度剖析：构建 10 万卡 GPU 集群需要知道哪些事？

构建 10万 H100 GPU 集群要多少钱？如何才能压榨GPU集群性能极限？GPU集群成本与性能如何平衡？用集群训AI模型如何保证稳定？GPU集群怎么保证可持续发展？...

...本期完整版通讯含 3 项专题解读 + 26 项本周 AI & Robotics 赛道要事速递，其中技术方面 9 项，国内方面 7 项，国外方面 10 项。

本期通讯总计 2638 字，可免费试读至 10%

消耗 99 微信豆即可兑换完3整本期解读（约合人民币 9.9 元）

要事解读① Nature 热议论文证明「语言不是思考工具」，LLM 可能要学不会推理了？

日期：6 月 24 日

事件：MIT 和 UC 伯克利的研究者近期发布的论文《Language is primarily a tool for communication rather than thought》指出「语言不是用于思考的工具」，引发了 AI 社区的大量关注和对 LLM 推理能力的热议。

论文都引起了哪些讨论？

语言是人类智能的一个决定性特征，但它所起的作用或多或少一直存在争议。《Language is primarily a tool for communication rather than thought》提供了神经科学等相关学科角度的最新证据，以论证现代人类的语言是一种交流工具，这与我们使用语言进行思考的流行观点相反。这一论点和此前 Yann LeCun 和乔姆斯基等人在唱衰 LLM 的理由似有相关，因而引发了大量讨论。

1、在论文发布前，业界关于 LLM 是否具备推理能力或拥有智能一直存在争议。以 Yann LeCun 为代表的一种声音认为，LLM 不具备理解、记忆、推理、规划这四项智能的基本特征，是通往 AGI 的一条歧路。[18]

① LeCun 曾在不同场合对自回归 LLM 进行批判，因为它们虽然表现惊人，但很多问题难以解决，包括事实错误、逻辑错误、推理有限、容易生成有害内容等，重要的是，这类模型并不了解这个世界底层的事实。

② 此外，LeCun 在近期的一场访谈中指出，语言是对现实的一种简化表示，人们在推理时并不像想象中那样频繁地使用语言。同时，人类大部分知识与语言无关，仅通过语言来构建智能系统是不足够的。

2、另一方面，美国哲学家、语言学家、认知科学家诺姆・乔姆斯基在 2023 年对大语言模型的批判文章同样引起了极大关注。[19]

① 乔姆斯基强调人类大脑与机器学习模型的根本区别。人类大脑是一个高效且优雅的系统，能够从有限的信息中运作；它不寻求推断数据点之间的直接相关性，而是寻求解释。

② ChatGPT 等机器学习模型虽然能够生成看似人性化的语言，但这些模型缺乏智能的关键能力。它们无法进行真正的因果解释，只能进行描述和预测。

3、MIT 的论文从脑神经研究的角度解释了语言和思维及推理能力无关。论文在发布后得到了大量转发分享，并在 AI 社区中引起热议，许多网友就论文的观点和当下大语言模型的发展情况展开讨论。

① 知名 AI 研究员 Hardmaru 在社交平台上转发分享了该论文，Yann LeCun 也转发分享，对思维不等于语言表示赞同。[20]

4、有网友认为 LLM 在处理和表达抽象思维方面具有潜力，但这种潜力尚未被充分探索和实现。[20]

① 抽象概念是人类长期拥有的，它构成了我们思维的高阶领域。

② 语言是一种交流工具，而 LLM 是在语言的基础上，通过书籍和文本训练所得，并不直接反映我们的思维。

③ 但 LLM 中的潜在空间代表了一种高级抽象形式，它能够将大量无序的文本信息进行压缩和矢量化存储，之后还可以进行解压缩，但很少有人深入研究 LLM 以解锁这种能力。

5、有网友认为语言是一种表达能力，不是直接的推理能力。但是，大量推理的表达堆积起来，他也形成了基于统计学的推理能力，所以应该说大模型不具备创建推理逻辑的能力，而不是没有推理能力。[21]

6、有网友指出，该论文和乔姆斯基、LeCun 的观点具有一致性。[21]

① 他表示，乔姆斯基脱胎于维根特斯坦的观点也认为语言的第一功能是思维。但他指的语言其实是帮助人们掌握具体语言的认知能力。

② LLM“掌握”语言的方式与人类完全不同，因此缺少了功能后没有推理能力。

论文为什么要研究语言和思维的关系？

1、该工作指出，尽管语言是人类的一个定义性特征，但语言的确切功能和起源的驱动因素一直是跨学科激烈讨论的话题。而目前主导了讨论的话题是两个并不互相排斥的假设：

① 一是语言主要服务于沟通功能，主要用于让人类彼此分享知识、思想和感受。

② 二是语言会调节思维和认知，这一假设又根据主张的强烈程度分为多个具体的观点。如最强烈的主张认为语言对所有形式的（至少是命题性）思维是必需；较弱的主张认为语言可能只是促进某些思维和推理的关键/部分因素。

2、从进化适应性的角度来看，语言的沟通和认知功能都可以提供适应优势。然而，论文强调关于认知特征的进化起源的假设是出了名的难以评估。

3、对于语言的功能和它在人类认知中的作用和重要性，研究者认为当下是一个展开讨论的成熟时机，具体原因有两个：

① 首先，过去二十年在解读语言的神经结构方面取得了重大进展，为评估语言处理机制在各种思维形式中的参与提供清晰的“目标（Target）”。

② 其次，大量不同语言的语料库和基于信息理论的强大计算工具的出现，为严格描述语言系统提供了可能。

论文从哪些维度评估得到「语言≠思维」的结论？

1、该工作回顾了过去二十年的研究工作，提供了神经科学等相关学科角度的最新证据，以论证现代人类的语言是一种交流工具，这与我们使用语言进行思考的流行观点相反。

2、就语言在思维中的作用，研究者聚焦于该问题中以往出现的不同观点的多样性和理论复杂性，而后通过不同的方法展开分析。就目前而言，有关语言在思维中作用的观点涉及四个维度：

① 第一个维度关注语言对思维的影响范围，其主张由强到弱涵盖：从声称所有的思维（至少所有命题性思维）都需要语言表征，到声称只有某些特定类型的思维需要语言。

② 第二个维度关注语言对思维的重要性程度，其主张由强到弱涵盖：从声称语言表征对思维是必需的（即没有这些表征的访问，思维就不可能发生），到声称它们只是增强或促进思维。

③ 第三个维度关注思维和所涉及语言表征的性质，一些理论强调所有自然语言共有的特征（如词汇和语法结构），其他理论关注特定语言独有的特征（如某些语言的特有的概念词汇和标记）

④ 第四个维度关注语言对思维影响的时效性，部分主张认为语言在认知能力发展中起到关键作用，尤其是在儿童时期，而成熟的大脑可能不再需要语言来支持思维。

3、就不同维度所涉及的主张，论文从个案研究、神经科学的研究和心理学实验等方式进行评估和验证。

① 论文指出，对于较为极端的主张，比如所有形式的思维都需要语言表征的说法最容易被证伪。

② 对于关注部分类型思维需要语言表征的主张，研究者通过明确定义相关思维的范围，让假设在经验上可以检验和评估。

③ 对于生成语言表征会促进思维发展的主张，研究者通过明确观察条件，并进一步描述该假设背后的神经学机制进行评估（目前的证据仍然复杂且有争议）。

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。

来源: qq

点击查看作者最近其他文章