为什么ChatGPT的中国文学水平那么差？

2023-02-11 00:02

这些天全世界的人都在谈ChatGPT，但不同的人对它的评价差别很大。说它好话的就不提了，这几天看到一些吐槽文，好几篇都是说它不懂中国文学，比如把柳宗元说成是唐朝人，不知道金瓶梅的作者是谁，等等。

我是ChatGPT的铁粉，读了这些文章，也上ChatGPT试了试，果真，曹雪芹改成施耐庵，贾宝玉爱上王熙凤，还“最终他的心始终只属于王熙凤”，笑话闹得太大。

古典文学不行，那么在西方热门的现代文学是不是更懂呢？也不行。前几天我正好考过它几个关于《三体》的问题，它也回答得不怎么样。

记得ChatGPT刚出来的时候，我正好读完托马·斯哈代的《还乡》（The Return of the Native）。当时也是作为对它的一个测试，我要它写一篇五段分析文章，它一眨眼就写了出来。

虽然没有什么洞见，但语言流畅，条理清晰，主要人物、突出主题都提到了，都说得很到位。如果高中生把这篇文章作为家庭作业交给英文老师，及格是肯定的，甚至可能得个优秀。

正好今天又在网上读到一篇文章，作者提到他要ChatGPT用鲍勃·迪伦的口气写一首讲述Luke 和 Leia （都是星球大战中的人物）之间爱情的诗，ChatGPT一会儿就写了出来。作者说写得很像。我对鲍勃·迪伦熟悉程度不够，不敢乱说，但这首诗歌读起来是很酷。

ChatGPT回答过很多问题，网上流传的关于它的故事也很多。我个人的经历肯定只是一点皮毛，沧海一粟，但从这些经历或许可以推测，ChatGPT的中国文学水平比英文文学水平要差。

但这是否说明ChatGPT不行呢？不是。从它能做的那些令人惊艳的事情，我们已经可以看出来，它潜力惊人，绝顶聪明。但它是用来自互联网的大量文本数据，特别是来自网页、书籍和其他文本源的文本数据训练出来的。它的中国文学水平这么低，连《红楼梦》都没有掌握，只能说明用来训练它的中文数据或数量太少，或质量很差。

优质数据的产生，需要有网民进行高质量交流的开放社区。互联网本来是一个网民们发挥聪明才智，八仙过海，各显神通的地方。但如果这些在网上发言的个体行为受到各种限制，好端端的干货满满的发言还一会儿就不见了，要有高质量的海量数据只能是痴人说梦。

一个社会的全民素质教育水平，也影响到它的互联网上的数据质量。

而且，因为大环境的原因，现在训练ChatGPT数据质的团队，估计也没有多重视用中文数据训练它。ChatGPT之所以能进行不错的中文对话，还在很大程度上得益于它的翻译能力，这让它可以借用英文学来的知识。

这是一个很难解决的问题。都知道技术的发展造成了贫富悬殊问题的日趋严重，其实技术的发展也会造成知识上的贫富悬殊。

越是拥有优质知识库的社会，就越有可能产生优质的人工智能，而优质的人工智能又会促进更优质的知识的产生。反之亦然，恶性循环，于是二者之间的差距越来越大。

但提高我们社会的知识库的质量，谈何容易。

* * *

顺便再谈谈ChatGPT是否有创造性的问题。现在经常听到的一个说法就是，ChatGPT是很好玩，但它并没有创造力。这个说法我不同意。

创造力简言之就是造出一个以前没有过的东西的能力。作为一个生成式（Generative，GPT的G）的人工智能，它跟我们对话的内容都是它综合自己以前学到的东西生成出来的，不是从哪里复制黏贴来的，这本身就是一种创造。

它创造的东西是否有高的质量，是否有前人没有说过的有趣的说法，发表前人没有发表过的新颖的观点，这当然是另一个问题。

首先这个要求很高，如果用这个标准，我们这些写公众号的百分之八十都达不到要求。

其次，从它已经产生的那些内容来看，它写过的很多东西都很有趣。