Machine Psychology，解构 LLM 还是心理学更靠谱吗？

2024-08-18 05:08

机器之心PRO · 会员通讯 Week 33

---- 本周为您解读 ③ 个值得细品的 AI & Robotics 业内要事 ----

1. Machine Psychology，解构LLM还是心理学更靠谱吗？

什么是 Machine Psychology？为什么要做 Machine Psychology？做 Machine Psychology 有哪些路线？哪些心理学理论可以用于 LLMs 研究？Machine Psychology 要如何应用？Machine Psychology 下一步要怎么走？...

2. AI 程序员 Genie 爆火、Cursor 的公司估值 4 亿美元... AI coding 赛道为何在今年爆发？

Devin 之后，今年还冒出了哪些 AI Coding 应用？AI Coding 赛道爆火的背后原因有哪些？AI Coding 赛道情况如何？市面上的热门 AI Coding 应用/工具都有哪些？从 Copilot 到 Agent，实现编程自动化还需要多久？...

3. ALI 深度报告：基础模型评估离成熟还差很远？

ALI 的深度报告都讲了哪些内容？基础模型评估连术语都还没对齐吗？基础模型评估具体做些什么？基础模型评估对研究院、企业和政府都意味着什么？基础模型评估离成熟还差多远？有哪些因素制约着模型评估的发展？...

...本期完整版通讯含 3 项专题解读 + 29 项本周 AI & Robotics 赛道要事速递，其中技术方面 12 项，国内方面 7 项，国外方面 10 项。

本期通讯总计 25772 字，可免费试读至 14%

消耗 99 微信豆即可兑换完整本期解读（约合人民币 9.9 元）

要事解读① Machine Psychology，解构 LLM 还是心理学更靠谱吗？

日期：8 月 16 日

事件：大型语言模型（LLMs）在不断进步，其行为模式越来越复杂和新颖，人们对如何理解模型的行为和推理能力背后的逻辑，开发更有效的评估方法和改进的方案更加重视。近期有工作发现，可以将 LLMs 视为心理实验的参与者，通过心理学的理论和测试方法探索其行为模型，进而萌发了 Machine Psychology 的概念。

什么是 Machine Psychology？

1、Machine Psychology（机器心理学）一词最初由 Krichmar 等人提出，旨在研究动物行为过程中的大脑活动，通过对神经解剖学的详尽分析操作为未来智能机器的开发奠定基础。[1]

2、借用这一术语，现今机器心理学的应用领域较最初略有不同，类似于采用心理学研究人类认知的方式来研究人工智能和大模型。[2]

① 这种方法探究了模型如何从输入数据中提取信息、进行推理、生成回应，并在某种程度上模仿人类的思维模式。

② 诸如采用心理调查衡量 LLMs 的黑暗性和负面性，使用 LLMs 模拟人类参与者进行社会科学研究等模式均为机器心理学在新兴领域的应用。

3、以往探究大模型行为模式或模型能力的方法多采用机械论的解释，侧重于内部机制如何影响行为。而 Machine Psychology 采用功能学习心理学的视角，强调环境与行为之间的功能关系。

① 从近期角度来看，以 ChatGPT 为代表的 LLMs 正在被广泛整合到社会各领域，理解它们的行为和推理能力因此具有重要意义。Machine Psychology 从心理学的角度出发，让 LLMs 以往理解人类认知和行为的实验，从而为模型可解释性和能力评估等研究提供新的思路和视角。[3]

② 从远期目标出发，AGI 研究的一个主要挑战是缺乏连贯的理论框架，这导致了研究的分散和缺乏标准化的基准。Machine Psychology 提出了一项跨学科的方法，结合了心理学、认知科学、神经科学等学科来推进 AGI 研究。[4]

③ 从可操作性来看，Machine Psychology 的行为方法可以轻松地被更广泛的学术界应用于闭源的先进模型，探索这些模型未被披露的内部工作方式。[3]

4、相较于传统的机器学习评估框架主要依赖于基准数据集，心理学的实证传统通过外部观察行为来测量实验变量，设计刺激以映射不同的内部表征、能力或结构，因而 Machine Psychology 有机会评估出闭源模型

① 近期出现的基准（test-only benchmarks）总体分为两类，：一类侧重于标量性能指标（如智商）；另一类则侧重于表征行为，其问题设计的目标是希望引出揭示行为策略或底层结构的反应。Machine Psychology 更偏向后者。[3]

Machine psychology 目前有哪些研究路线？

1、就 Machine Psychology 的系统性研究，近期较有代表性的工作分别来自德国斯图加特大学的 Thilo Hagendorff，以及来自瑞典斯特哥尔摩大学的 Robert Johansson。

① Hagendorff 和 Robert Johansson 近期分别在论文中提出了 Machine Psychology 的概念，但在理论和实践方法上有所差异。

2、Thilo Hagendorff 在德国斯图加特大学担任独立研究小组组长，他最初在 2023 年 3 月于 arxiv 发表了一篇有关机器心理学的论文，探讨了将 LLMs 视为心理实验的参与者以探索其行为的概念，后在 2024 年 8 月更新了论文[5]

① Hagendorff 在 2023 年的论文《Machine Psychology: Investigating Emergent Capabilities and Behavior in Large Language Models Using Psychological Methods》中定义了机器心理学研究的方法论标准，并讨论了如何解释在 LLMs 中发现的行为模式。该工作的目标是发现传统基准测试无法检测到的 LLMs 中的新兴能力。

② Hagendorff 后续扩大了该项目，和 Google DeepMind、亥姆霍兹 HAI 和慕尼黑工业大学的研究者组建了作者团队，重写一篇全面的观点论文。新版论文于 2024 年 8 月 8 日更新于 arxiv。

③ Hagendorff 的工作提出了通过行为实验来研究 LLMs 的方法，其理论框架重点关注「启发式和偏见」「社会互动」「语言心理学」「学习」四种流行的心理学研究范式极其在 LLMs 领域的应用。[3]

3、Robert Johansson 是瑞典斯德哥尔摩大学心理系的副教授，他的主要研究领域是通用人工智能 AGI 和临床心理学。他在 2024 年 5 月底的论文中提出了 Machine Psychology 研究框架，用于解决 AGI 研究中的适应性问题。

① Johansson 提出的 Machine Psychology 框架，将操作性条件反射（Operant Conditioning）的原则与一种特定的人工智能模型（非公理推理系统，NARS）相结合，并提供了一种连贯且实验性的方法来研究和开发智能系统。

② Johansson 有关 Machine Psychology 的研究最初在 2021 年就有所提及，他当时在一场演讲中讨论了行为心理学如何为 AGI 研究提供路线图，特别是在需要将感官通道与语义知识和程序学习相结合的系统的实现方法。[6]

② Robert Johansson 在 2024 年秋季于斯德哥尔摩大学心理学系新开设了 Machine Psychology 的课程。该课程将于 2024 年 12 月初到 2025 年 1 月中旬以全日制线上课程提供。[7]

Machine Psychology 如何将心理学范式与 LLMs 结合？[3] [4]

Thilo Hagendorff 在论文中讨论了心理学行为科学中有关智能行为的不同实证范式，并选取了启发式和偏见、社会互动、语言心理学和学习这四个以语言为主要模态的研究领域在 LLM 中的应用潜力。Robert Johansson 提出机器心理学框架则结合了操作性条件作用的心理学原理和非公理推理系统（NARS）的理论与实践，强调适应性和从环境互动中学习来探索智能系统的开发。

1、启发式和偏见（Heuristics and Biases）是心理学的两个关键概念。该领域的研究会探索启发式如何帮助解释人类行为中的成功和偏差。

① 启发式是一种心理捷径，它允许人们在有限的时间和知识下快速做出决策或解决问题；偏见是一种系统性的认知偏差，它导致个体判断和决策中偏离理性或最优标准。

② 论文指出，由于 LLMs 会表现出与人类相似的启发性和偏见，因此该领域可以作为研究模型决策过程的可行视角。人类的启发式行为常用于适应日常互动中遇到的问题，而 LLMs 的行为则可能受到训练数据中类似问题的影响。

③ 以往（2023 年）有工作用该范式研究了 LLMs 的决策过程，发现 GPT-3 会表现出人类观察实验中相同的认知偏差，后续工作则发现新一代的 LLM 不再出现类似的偏见。

2、社会互动（Social interactions）指人与人之间在接触中相互影响、相互作用的过程和联系。这一概念涵盖了沟通、人际交往、助人行为以及侵犯行为等多个方面。

① 论文强调了社会智能或社会技能在人类发展中的重要性，并提出将这些研究范式应用于 LLMs，以评估它们在模拟人类交流者时的社会智能水平。论文还具体讨论了心理理论（Theory of Mind，ToM）测试在 LLMs 中的应用。

② 心理理论测试常用于评估儿童对他人心理状态的理解能力，也可用于评估 LLMs 是否能够理解和推断他人的心理状态，如信念、意图和情感。

③ 当前已有工作发现，像 GPT-3 时代的模型在解决类似任务时存在困难，但近期新出的模型在推断他人不可观察心理状态的能力上展现了更高的可靠性。

④ 通过将 LLMs 在 ToM 任务上的表现与儿童在不同发展阶段的表现进行比较，研究人员可以了解模型在理解心理状态方面的成熟度和潜在的局限性，从而改进模型，使其更好地适应复杂的社交环境，并与人类用户更自然地交互。

3、语言心理学（Psychology of language）结合了心理学和语言学的理论与方法，主要研究人类语言理解和生成的心理过程。

① 论文指出，早期的连接主义模型，例如简单的递归预测模型已经开始探索语言的语法结构，并试图理解大脑如何表示和处理语言信息。伴随模型逐渐演变为更复杂的系统，它们的核心目标仍然是揭示人类语言理解的基本原理。

② 现代的 LLMs 在 NLP 领域进展显著，但语言心理学中的度量方法和观察视角仍能帮助评估 LLMs 对复杂句法结构的理解，处理语义和语用推理的逻辑，乃至发现模型文本凝聚力、语言和可读性方面的不足，从而指导改进和优化。

4、学习（Psychology of Learning）主要研究个体如何获得和保持知识与技能，涵盖了个体从简单的行为习惯到复杂的认知策略的广泛变化。

① 论文指出，尽管 LLMs 使用的是已知且经过设计的算法进行训练，但它们展现的上下文学习（in-context learning）能力代表了研究者可以借鉴认知科学中的实验设计和分析方法，来比较 LLMs 的在上下文学习输出与假设学习算法的预测。

② 研究者还可以采用「Systematic Generalization」「Rule-based vs。 Exemplar-based Generalization」「Developmental Psychology」等心理学范式来评估 LLMs 的学习能力。

5、Robert Johansson 提出的 Machine Psychology 框架则假设适应性是生物和 AI 的核心，并且可以通过操作性条件作用的原理来理解。框架涉及了行为主义和操作性条件作用、功能学习心理学、关系框架理论等心理学领域的理论和实践。

① 行为主义和操作性条件作用（Behaviorism and Operant Conditioning）关注的是行为与其后果之间的关系，以及这些后果如何影响行为的频率。操作性条件作用的原理在论文中被用作指导 AI 系统学习，通过奖励和惩罚塑造系统行为。

② 功能学习心理学（Functional Learning Psychology）关注行为与环境之间的功能性关系，即行为如何作为对环境变化的适应。该理论是 Johansson 所提框架的主要研究视角。

③ 关系框架理论（Relational Frame Theory）是一种认知行为理论，它认为复杂的认知能力是通过与环境互动中形成的关系模式发展而来。该理论被用来指导人工智能系统如何通过学习和推理来发展复杂的行为模式。

④ 三段论（Three-Term Contingency）用于描述行为作为有机体与环境之间互动的关系，包括辨别刺激（Discriminative stimulus， Sd）、反应（Response， R）和结果刺激（Resultant stimulus， Sr），Johansson 的框架用三段论的概念来分析和设计实验中的学习和适应过程。

表：心理学中智能行为的研究范式[8] - [21]

Machine Psychology 具体要怎么用？

Thilo Hagendorff 和 Robert Johansson 在各自的论文中都分享了基于 Machine Psychology 如何实践的问题。其中，Hagendorff 讨论了如何设计和分析针对大型语言模型（LLMs）的行为实验，Johansson 则具体分享了针对 NARS 系统行为评估目的的实验和成果。

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。

来源: qq

点击查看作者最近其他文章