Redian新闻
>
AI海洋中的海妖之歌:腾讯AI Lab大模型幻觉问题综述

AI海洋中的海妖之歌:腾讯AI Lab大模型幻觉问题综述

公众号新闻

机器之心专栏

机器之心编辑部

在古希腊的神话中,有一种名为塞壬 (Serin) 的海妖,她们通过美丽的歌喉制造幻像,诱导往来的船只触礁沉没。


大规模语言模型在众多下游任务中展现了惊人的能力,但它们在使用中仍然暴露了一些问题。其中,幻觉是目前影响大模型落地的重要问题之一。ChatGPT 的发布使学术界和工业界关注大模型实际落地的潜能,大量关于幻觉的工作也开始涌现。

近期,腾讯 AI Lab 联合国内外多家学术机构发布了面向大模型幻觉工作的综述,对幻觉的评估、溯源、缓解等进行了全面的探讨。


  • 论文链接:https://arxiv.org/abs/2309.01219
  • Github 链接:https://github.com/HillZhang1999/llm-hallucination-survey


什么是大模型幻觉问题?

根据相关工作和平时对大模型的使用体验,研究人员总结了大模型常见的三类幻觉:

  1. 和用户输入冲突的幻觉 (Input-Conflicting Hallucination):大模型生成的回复违背了用户输入中的任务指示或者任务输入。
  2. 和已生成的上下文冲突的幻觉 (Context-Conflicting Hallucination):大模型生成的回复出现了自我矛盾。
  3. 和事实知识冲突的幻觉 (Fact-Confilicting Hallucination):大模型生成的回复与公认的事实知识出现了冲突。


在上述三类幻觉中,和事实知识冲突的幻觉是目前大模型幻觉研究的核心热点。研究人员认为是因为这一类幻觉研究的难度更大,对用户实际使用体验的干扰也最大。例如,大模型在生成医疗建议时可能会捏造错误的药品剂量,误导缺少专业医学知识的用户,产生风险。

大模型幻觉和传统幻觉的主要区别在哪里?

在大模型时代前 (以 ChatGPT 的发布为节点),幻觉问题在传统的自然语言生成任务中也有一定的研究积累。研究人员总结了大模型幻觉和传统幻觉研究的几点重要区别:

  1. 大模型使用海量训练数据:与传统任务不同,大模型需要在海量数据上进行大规模预训练。这些海量数据往往采集于互联网,可能包含大量伪造的、有偏见、过时的内容,从而导致幻觉。由于数据规模过大,上述问题内容也难以分析和筛除。
  2. 大模型的通用性:传统模型往往只面向单一的任务,而大模型则被应用于多任务、多语言、多领域的通用场景。大模型的通用性给幻觉的全面评估、消除带来了全新挑战。
  3. 大模型幻觉不易被察觉:由于大模型的强悍能力,大模型生成的幻觉看上去非常合理,有的时候甚至人类都很难发现。
  4. 其他区别:大模型的一些新特性,例如额外引入的基于人类反馈的强化学习 (RLHF) 过程、模糊的知识边界、以及潜在的黑盒属性,也给幻觉研究带来了新的挑战。

大模型幻觉如何评估

大模型幻觉问题的研究基石是可靠的评估基准。现有研究工作提出了多个针对性的评估基准,主要面向事实冲突类型的幻觉。研究人员从多个方面对这些基准进行了总结。


  1. 评估形式 (Evaluation):现有评估基准往往有两类方式评估大模型的幻觉,即生成式 (generation) 和判别式 (discrimination)。生成式的基准直接评估大模型生成回复中出现幻觉的倾向,而判别式的基准则评估大模型判断一段文本是否存在幻觉的能力。
  2. 应用任务 (Task Format):现有评估基准在不同的下游任务中评估大模型的幻觉现象,例如问答、指令遵循、文本续写等。
  3. 评测指标 (Metrics):现有评估基准各自设计了特殊的指标,用于判断大模型出现幻觉的程度,包括:1)人工评估;2) 基于模型的自动评估;3)基于规则的自动评估。

大模型幻觉来源于什么

研究人员也对大模型产生幻觉的原因进行了一些初步分析,例如:

  1. 大模型缺乏相关知识或者记忆错误知识:在大模型回答用户问题或者解决更复杂的下游任务时,如果缺少了所需要的知识或者从训练数据中记忆了错误的知识,则有可能出现幻觉。
  2. 大模型高估了自己的能力:一些工作发现,大模型往往无法准确地估计自己的能力边界。因此,大模型在回复超出自己能力的问题时,往往会高估自己,从而自信地编造幻觉回复。
  3. 对齐过程中引入幻觉:大模型在预训练阶段外,还需要进行对齐,包括指令微调和 RLHF。这些步骤可能误导大模型出现幻觉。例如不恰当的指令微调可能让大模型学会捏造自己不会的答案,RLHF 也可能让大模型学会为了讨好人类而编造内容。
  4. 生成过程中引入幻觉:一些工作认为,不恰当的生成策略也可能导致大模型出现幻觉。例如,基于采样的解码生成方式中引入的随机性被证明可能导致幻觉,而大模型常用的自回归生成方式也可能导致幻觉的累积传播现象。

有什么方法可以缓解大模型幻觉

为了尽可能减少大模型的幻觉现象,从而促进大模型的落地应用,近期出现了大量新的研究工作尝试缓解幻觉。针对缓解幻觉的方法贯穿了包括预训练、指令微调、强化学习以及推理在内的整个大模型生命周期,研究人员对此进行了如下总结:

预训练阶段的缓解

已有工作认为,大模型的知识主要来自基于海量文本的自监督预训练。考虑到错误和缺失的知识可能导致幻觉的产生,预训练阶段的幻觉缓解工作主要关注如何自动提高预训练语料质量。例如,Llama 2 在构建预训练语料时,特地对事实性更好的数据源 (如维基百科) 进行了上采样。

指令微调阶段的缓解

在微调阶段,现有工作也探讨了如何提高指令微调数据的质量,从而减少大模型的幻觉。与预训练阶段的一个不同点在于,指令微调数据的规模较小,可以人工进行清洗。


此外,OpenAI 也指出,指令微调阶段存在着因为行为克隆现象而导致幻觉的风险。这一现象代表:指令微调的数据中存在着超过大模型能力的样本,如果一味地强迫大模型学习这类样本,则有可能导致大模型学会对任何问题都以非常肯定的语气进行回复。那么反映到实际使用时,大模型就会对自己不会的问题捏造回复,从而导致幻觉。

强化学习阶段的缓解


针对行为克隆现象导致的幻觉,OpenAI 的强化学习负责人 John Schulman 在伯克利大学的演讲中分享了 OpenAI 在训练 ChatGPT 时缓解幻觉的一种方法。他们在强化学习时,给大模型不同语气回复的错误以不同的惩罚力度。这样做的目的是鼓励大模型表达不确定性、质疑问题、承认错误,从而缓解过度自信而出现幻觉。


虽然强化学习通过让模型学会拒绝回答问题一定程度上缓解了幻觉,但也带来了额外的问题。由于强化学习主要依赖奖励模型提供监督信号,然而奖励模型并不能达到 100% 的准确率,导致生成模型可能被过优化 (over-optimization)。这种情况下,大模型会过度保守,拒绝回答一些它本可以回答正确的问题。

推理阶段的缓解

由于在推理阶段幻觉最为灵活,许多现有工作集中于此方向。代表性的做法有:

1. 改进解码策略:研究人员尝试通过设计更好的解码策略来缓解幻觉,例如 Inference-Time-Intervention 方法在解码时通过让模型激活值在和事实性更为相关的注意力头上传播,从而缓解幻觉。

2. 借助外部知识:通过在模型解码时,检索和用户问题相关的知识,让模型在回复时予以参考,可以显著解决幻觉问题。这里的知识源可以是无结构文本、结构化文本 (网页或数据库),甚至是各类工具。


检索到相关知识后,一类做法是直接在模型生成回复时提供给模型。另一类做法是在模型生成回复后,提供给模型,让模型自我纠正先前回复中存在的幻觉。


3. 度量不确定性:通过衡量大模型输出回复时的不确定度 (uncertainty),可以使用户了解到回复中哪些部分是不能信任的。常见的不确定度度量方法有:1)基于输出分数的;2) 基于描述的;3)基于一致性的。


此外,还有更多的缓解方案,如多智能体交互、指令设计、人在回路、分析模型内部状态等,都在论文中有着更详细的介绍。

总结和挑战

该综述系统性地探讨了大模型幻觉问题的评估、解释和缓解策略,希望能给后续的研究人员以启发。此外,大模型幻觉问题的研究也有着一些新的研究方向和挑战,如:

1. 可靠评估:大模型的幻觉问题的评估仍然留有大量挑战,比如怎样设计健壮的、和人类偏好对齐的自动指标,以及判别式和生成式评估方式的取舍和关系等。

2. 多语言和跨语言幻觉:大模型往往可被用于多语言和跨语言场景,但研究人员发现,在英文上表现良好的大模型,在其他语言上可能出现幻觉。


3. 多模态幻觉:大语言模型的到来使研究者们开始研究多模态大模型,如语言和图像、视频、语音的结合。在这些多模态场景下,幻觉问题的研究迎来了新的定义和挑战。


4. 模型编辑:模型编辑技术通过直接编辑大模型参数,来改变它蕴含的知识,从而改变其行为。模型编辑可能是缓解幻觉的一种有潜力的方法。

5. 面向幻觉的攻防:尽管现有的商业大模型,如 GPT4,已经在面向事实性问题时展现了良好的可靠性,但已有研究表明可以通过一些方式来绕过大模型的安全策略。面向幻觉的攻防也可能是一个有趣的研究方向。


© THE END 

转载请联系本公众号获得授权

投稿或寻求报道:[email protected]

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
海洋中的鱼类正在变小; 遭遇高温,约6小时后可能致死 | 环球科学要闻当 Apache Doris 遇上大模型:探秘腾讯音乐如何基于大模型 + OLAP 构建智能数据服务平台我是不是一个很绝情的人?腾讯混元大模型亮相:全链路自研,聚焦应用死磕“幻觉”哈工大发布大模型思维链推理综述:200+文献全面解析大语言模型思维链推理最新进展多模态大模型的幻觉问题与评估一手实测腾讯混元大模型:重逻辑降幻觉,鹅厂自家应用已加持谷歌:大模型不仅有涌现能力,训练时间长了还有「领悟」能力长文本信息准确率超过ChatGPT,Meta提出降低大模型幻觉新方法致命幻觉问题、开发GPU替代品,大模型还面临这10大挑战多模态物体幻觉下降23%!UNC斯坦福等推出通用修正器LURE:兼容任意LVLM,专攻三大幻觉成因全面拥抱大模型!腾讯正式开放全自研通用大模型:参数规模超千亿、预训练语料超 2 万亿 tokens通用大模型转向行业大模型:腾讯云、华为云们的下一个战场北大团队:诱导大模型“幻觉”只需一串乱码!大小羊驼全中招大模型落地最后一公里:111页全面综述大模型评测李开复零一万物发布首款大模型;马斯克xAI发布首个大模型;360、美团、昆仑万维等最新消息;vivo发布蓝心AI大模型大模型RLHF不必非得靠人,谷歌:AI反馈效果一样好多模态大模型幻觉降低30%!中科大等提出首个幻觉修正架构「Woodpecker」啄木鸟人面樱花”君莫愁多模态LLM幻觉问题降低30%!业内首个“啄木鸟”免重训方法诞生|中科大分割的海洋和危机的海洋NUS、NTU团队发布医疗大模型综述,全面介绍大模型在医疗领域的最新研究进展《百年》&《生死契阔》长篇小说《如絮》第一百五十九章 旧金山-1967年 避难所腾讯混元大模型开放文生图;微软AI投资重心或转向应用和业务;国产大模型10月榜单公布丨AIGC大事日报天工大模型登顶多模态榜单!解决幻觉、跨语言两大难题北京理工大学发布双语轻量级语言模型,明德大模型—MindLLM,看小模型如何比肩大模型Erklärung zur Zusammenarbeit小模型如何比肩大模型,北理工发布明德大模型MindLLM,小模型潜力巨大涅槃 x 23toys 古生物小手办:7款远古海洋中的明星物种!太平洋中心的夏威夷,怎么就成了美国的?幻觉降低30%!首个多模态大模型幻觉修正工作Woodpecker腾讯控股财报:腾讯云MaaS开始为合作伙伴提供服务,已接入20多个主流模型一定要养盆这么美的吊钟海棠综述 | 多模态大模型最全综述来了!
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。