一位数据科学家利用人工智能克隆了他最好朋友的群聊

2023-04-20 08:04

点击蓝字关注我们

SUBSCRIBE to US

Image: The Verge

正如数据科学家Izzy Miller所说，无论是在iMessage、WhatsApp还是Discord上，群聊都是你和好朋友们闲聊、分享生活最新消息的地方，这些事情或琐碎或重大。在这样一个大家越来越孤独的世界里，我们至少可以在群聊中抱怨一下近况有多糟糕。“我的群聊是一条生命线，是一种安慰，是一个连接点，”Miller告诉The Verge。

Miller使用与微软的Bing和OpenAI的ChatGPT等聊天机器人相同的技术，创建了他和好朋友们群聊的克隆——自从他和五个朋友在大学第一次聚在一起以来，在过去的七年里，群聊对话几乎每天都在展开。他说，这项工作出奇地容易：这是只需要花费几个周末的工作时间和一百美元来完成的项目。但最终的结果是不可思议的。

Miller说：“我真的很惊讶，这个模型从本质上了解了我们是谁，而不仅仅是我们说话的方式。它知道我们在和谁约会，我们在哪里上学，我们住的房子的名字等等。”

而且，在一个聊天机器人越来越普遍、越来越令人信服的世界里，人工智能群聊的体验可能很快就会被我们分享。

Image: Izzy Miller

人工智能的最新发展使本项目成为可能，但这仍然不是任何人都能完成的。Miller是一名数据科学家，他已经在这类技术上“玩”了一段时间——“我了解一些相关的信息和技术，”Miller现在在一家名为Hex的初创公司工作，该公司恰好提供有助于这类项目的工具。Miller在一篇博客文章中描述了复制这项工作所需的所有技术步骤，他在文章中介绍了人工智能群聊，并将其命名为“robo boys”。

然而，robo boys的创造遵循着一条熟悉的道路。它从一个大型语言模型（LLM）开始，LLM是一个根据从网络和其他来源抓取的大量文本进行训练的系统，具有广泛但原始的语言技能。然后对该模型进行了“微调”，这意味着为其提供一个更专注的数据集，以便复制特定的任务，比如回答医学问题或用特定作者的风格写短篇小说。

在这种情况下，Miller对从他的群组iMessage下载的50万条消息进行了人工智能系统微调。他按作者对信息进行分类，并促使模型复制每个成员的个性，包括：Harvey、Henry、Wyatt、Kiebs、Luke和Miller本人。

有趣的是，Miller用来创建虚假聊天的语言模型是由Facebook所有者Meta制作的。这个名为LLaMA的系统与OpenAI的GPT-3模型一样强大，今年它在发布一周后在网上泄露，成为了争议的主题。一些专家警告说，此次泄露将允许恶意行为者滥用该软件进行垃圾邮件传播和其他目的，但没有人猜测它还会被用于此目的。

正如Miller所说，这个项目展示了建造这种人工智能系统变得多么容易。“与两三年前相比，现在做这件事的工具已经完全不同了。”

Image: Izzy Miller

在过去，创建一个具有六种不同个性且令人信服的群聊克隆可能需要花费大学团队几个月的时间才能完成。现在，只要一点专业知识和一点预算，一个人即可完成。

Miller对这个系统模仿他和朋友习惯的能力印象深刻。他说，有些对话感觉非常真实，比如关于谁喝了Henry的啤酒的争论，以至于他也不得不去搜索了群聊的历史记录，以检查模型是否只是从训练数据中复制了文本。（这在人工智能世界中被称为“过度拟合（overfitting）”，是一种可能导致聊天机器人抄袭其来源的机制。）

Miller在他的博客文章中写道：“这种完美地捕捉真是太令人愉快了。这并不是怀旧，因为这些对话从未发生过，但这是一种类似的喜悦感……”

不过，该系统仍然存在问题。Miller指出，群聊中六种不同性格之间的区别可能会模糊，一个主要限制是人工智能模型没有年代感——它无法可靠地区分过去和现在的事件（这个问题在某种程度上影响到所有聊天机器人）。例如，过去的女朋友可能被称为现在的伴侣；以前的工作和房子也是如此。

系统对事实的感知并不是基于对聊天的整体理解，而是基于消息的数量。换句话说，人们谈论的东西越多，机器人就越有可能提及它。一个意想不到的结果是，人工智能克隆人往往表现得像还在上大学一样，因为那是群聊曾经最活跃的时候。

该项目展示了人工智能聊天机器人日益强大的力量，尤其是它们复制特定个人的习惯和知识的能力。尽管这项技术仍处于初级阶段，但我们已经看到了这些系统所能发挥的力量。

显然，人工智能聊天机器人有能力影响我们，就像真人一样，无论是娱乐、教育还是其他方面，都可能在我们的生活中发挥越来越重要的作用。

当Miller的项目在Hacker News上被分享时，该网站上的评论人士猜测，这些系统的未来的结局将如何？有人建议，像谷歌这样拥有大量个人数据的科技巨头可以利用这些数据来构建用户的数字副本。然后，这些人可能会代替他们接受面试，可能会被潜在的雇主甚至警察面试。其他人认为，人工智能机器人的传播可能会加剧社会孤立：在网络世界里，提供更可靠、更不具挑战性的友谊形式。

Miller说，这种猜测当然很有趣。正如他所解释的，这个项目之所以成功，是因为它是对真实事物的模仿。正是最初真实存在的群聊让整件事变得有趣。

换句话说，人工智能克隆可以复制真实的人类，但不能取代他们。