大模型现存的10个问题和挑战

公众号新闻

2023-09-05 09:09

本文转发自Coggle数据科学、人工智能学家

进NLP群—>加入NLP交流群

大模型现存的问题和挑战

这篇文章介绍了关于大型语言模型（LLMs）研究中的十个主要方向和问题：

1. 减少和度量幻觉：幻觉指的是AI模型虚构信息的情况，可能是创意应用的一个特点，但在其他应用中可能是一个问题。这个方向涉及减少幻觉和开发衡量幻觉的度量标准。

2. 优化上下文长度和构造：针对大多数问题，上下文信息是必需的，文章介绍了在RAG（Retrieval Augmented Generation）架构中优化上下文长度和构造的重要性。

3. 整合其他数据形式：多模态是强大且被低估的领域，文章探讨了多模态数据的重要性和潜在应用，如医疗预测、产品元数据分析等。

4. 使LLMs更快、更便宜：讨论了如何使LLMs更高效、更节约资源，例如通过模型量化、模型压缩等方法。

5. 设计新的模型架构：介绍了开发新的模型架构以取代Transformer的尝试，以及挑战和优势。

6. 开发GPU替代方案：讨论了针对深度学习的新硬件技术，如TPUs、IPUs、量子计算、光子芯片等。

7. 使代理人更易用：探讨了训练能够执行动作的LLMs，即代理人，以及其在社会研究和其他领域的应用。

8. 提高从人类偏好中学习的效率：讨论了从人类偏好中训练LLMs的方法和挑战。

9. 改进聊天界面的效率：讨论了聊天界面在任务处理中的适用性和改进方法，包括多消息、多模态输入、引入生成AI等。

10. 为非英语语言构建LLMs：介绍了将LLMs扩展到非英语语言的挑战和必要性。

1. 减少和衡量幻觉

幻觉是一个广受关注的话题，指的是当AI模型编造信息时发生的情况。在许多创造性的应用场景中，幻觉是一种特性。然而，在大多数其他用例中，幻觉是一个缺陷。一些大型企业近期在关于大型语言模型的面板上表示，影响企业采用LLMs的主要障碍是幻觉问题。

减轻幻觉问题并开发用于衡量幻觉的度量标准是一个蓬勃发展的研究课题。有许多初创公司专注于解决这个问题。还有一些降低幻觉的方法，例如在提示中添加更多的上下文、思维链、自我一致性，或要求模型在回答中保持简洁。

要了解更多关于幻觉的信息，可以参考以下文献：

Survey of Hallucination in Natural Language Generation (Ji et al., 2022)

How Language Model Hallucinations Can Snowball (Zhang et al., 2023)
A Multitask, Multilingual, Multimodal Evaluation of ChatGPT on Reasoning, Hallucination, and Interactivity (Bang et al., 2023)
Contrastive Learning Reduces Hallucination in Conversations (Sun et al., 2022)
Self-Consistency Improves Chain of Thought Reasoning in Language Models (Wang et al., 2022)
SelfCheckGPT: Zero-Resource Black-Box Hallucination Detection for Generative Large Language Models (Manakul et al., 2023)
NVIDIA’s NeMo-Guardrails中关于事实核查和幻觉的简单示例

2. 优化上下文长度限制

大部分问题需要上下文信息。例如，如果我们询问ChatGPT：“哪家越南餐厅最好？”，所需的上下文将是“在哪里”，因为越南在越南和美国的最佳越南餐厅不同。

在这篇论文中提到，许多信息寻求性的问题都有依赖于上下文的答案，例如Natural Questions NQ-Open数据集中约占16.5%。对于企业用例，这个比例可能会更高。例如，如果一家公司为客户支持构建了一个聊天机器人，为了回答客户关于任何产品的问题，所需的上下文可能是该客户的历史或该产品的信息。

由于模型“学习”来自提供给它的上下文，这个过程也被称为上下文学习。

3. 合并其他数据模态

多模态是非常强大但常常被低估的概念。它具有许多优点：

首先，许多用例需要多模态数据，特别是在涉及多种数据模态的行业，如医疗保健、机器人、电子商务、零售、游戏、娱乐等。例如，医学预测常常需要文本（如医生的笔记、患者的问卷）和图像（如CT、X射线、MRI扫描）。