当 AI “读光” 了所有东西后会发生什么

2023-02-08 04:02

如果人工智能没有高质量的散文可供摄取，那么人工智能的梦想可能永远不会成为现实。而现在，高质量的散文已经没有多少了。

根据国外的一项研究，像 ChatGPT 这样的程序，将在 2027 年耗尽高质量的阅读材料。

和大家分享一篇文章：当 AI “读光”了所有东西后会发生什么？这是我在我的知识星球里推出的新栏目“大阅读”中的第一篇。以下是我的翻译简写。

近年来，人工智能已经证明自己是一个快速的学习者，尽管其教育方式让最残忍的校长也感到羞愧。

人工智能被锁在密不透风的博尔赫斯式的图书馆里数月，没有上厕所的时间，也没有睡觉时间。它们被告知：在完成人类文化的自学速成课程前不能出来。教学大纲上的内容是：我们人类曾产生过的所有现存文本中的相当一部分。

当人工智能从这些史诗般的学习课程中浮出水面时，已经拥有了令人惊讶的新能力。他们是拥有最灵活语言思维的人——超级多面手——可以可靠地在十几种语言间来回翻转；AI 现在可以实时翻译 100 多种语言；可以模仿各种文学风格写出合格的押韵诗。DeepMind 的 Ithaca 人工智能可以看一眼刻在大理石上的希腊字母，就猜出几千年前被破坏者凿掉的文字。

所有这些成功表明：人工智能的发展方向是有希望的。只要把越来越多人类创造的文本塞进它嘴里，然后，等待奇妙的新技能显现。有了足够数据，这种方法甚至可能产生一种更流畅的智能，或者类似于那些萦绕在我们几乎所有未来神话中的人类人工头脑。

但问题是，就像任何高端的人类文化产品一样，好的散文是已知宇宙中最难生产的东西之一。它不是无限供应的，而且对于人工智能，不是任何旧的文本都能够做到。

对书籍进行训练的大型语言模型，质量要比对大量社交媒体帖子进行训练的模型好得多。但当我们计算还有多少结构良好的句子可以被人工智能吸收时，数字并不令人鼓舞。

由 Epoch AI 的 Pablo Villalobos 领导的一个研究小组最近预测，像 ChatGPT 这样的程序，将在 2027 年耗尽高质量的阅读材料。如果没有新的文本进行训练，人工智能最近的热度可能会过早地结束。

……

本文剩余内容的主要摘要如下：

1，也许到最后，大数据的回报会越来越少。到时，就文本而言，该领域数据驱动的进展可能会大大放缓，使人工智能和所有其他东西都无法达到。

2，与此同时，人工智能中的视觉学习者，同样面临有一天训练数据可能会短缺的问题。

3，那么该如何为人工智能增加人类的文化生产呢？一种令人不安的方法是：在我们每个人的脖子上都戴上一种加密装置，以记录我们每个人的每一个语言行为。

说明：因为各种各样的原因，我在微信公号写的东西和我在知识星球写的不太一样，关心美国创投圈的专业读者，请移步到我的知识星球。如下扫码登录（老星球用户续费请见底下那个二维码）