当 AI “读光” 了所有东西后会发生什么
近年来,人工智能已经证明自己是一个快速的学习者,尽管其教育方式让最残忍的校长也感到羞愧。
人工智能被锁在密不透风的博尔赫斯式的图书馆里数月,没有上厕所的时间,也没有睡觉时间。它们被告知:在完成人类文化的自学速成课程前不能出来。教学大纲上的内容是:我们人类曾产生过的所有现存文本中的相当一部分。
当人工智能从这些史诗般的学习课程中浮出水面时,已经拥有了令人惊讶的新能力。他们是拥有最灵活语言思维的人——超级多面手——可以可靠地在十几种语言间来回翻转;AI 现在可以实时翻译 100 多种语言;可以模仿各种文学风格写出合格的押韵诗。DeepMind 的 Ithaca 人工智能可以看一眼刻在大理石上的希腊字母,就猜出几千年前被破坏者凿掉的文字。
所有这些成功表明:人工智能的发展方向是有希望的。只要把越来越多人类创造的文本塞进它嘴里,然后,等待奇妙的新技能显现。有了足够数据,这种方法甚至可能产生一种更流畅的智能,或者类似于那些萦绕在我们几乎所有未来神话中的人类人工头脑。
但问题是,就像任何高端的人类文化产品一样,好的散文是已知宇宙中最难生产的东西之一。它不是无限供应的,而且对于人工智能,不是任何旧的文本都能够做到。
对书籍进行训练的大型语言模型,质量要比对大量社交媒体帖子进行训练的模型好得多。但当我们计算还有多少结构良好的句子可以被人工智能吸收时,数字并不令人鼓舞。
由 Epoch AI 的 Pablo Villalobos 领导的一个研究小组最近预测,像 ChatGPT 这样的程序,将在 2027 年耗尽高质量的阅读材料。如果没有新的文本进行训练,人工智能最近的热度可能会过早地结束。
……
本文剩余内容的主要摘要如下:
1,也许到最后,大数据的回报会越来越少。到时,就文本而言,该领域数据驱动的进展可能会大大放缓,使人工智能和所有其他东西都无法达到。
2,与此同时,人工智能中的视觉学习者,同样面临有一天训练数据可能会短缺的问题。
3,那么该如何为人工智能增加人类的文化生产呢?一种令人不安的方法是:在我们每个人的脖子上都戴上一种加密装置,以记录我们每个人的每一个语言行为。
微信扫码关注该文公众号作者