为什么ChatGPT的中国文学水平那么差?其他2023-02-11 00:02这些天全世界的人都在谈ChatGPT,但不同的人对它的评价差别很大。说它好话的就不提了,这几天看到一些吐槽文,好几篇都是说它不懂中国文学,比如把柳宗元说成是唐朝人,不知道金瓶梅的作者是谁,等等。我是ChatGPT的铁粉,读了这些文章,也上ChatGPT试了试,果真,曹雪芹改成施耐庵,贾宝玉爱上王熙凤,还“最终他的心始终只属于王熙凤”,笑话闹得太大。古典文学不行,那么在西方热门的现代文学是不是更懂呢?也不行。前几天我正好考过它几个关于《三体》的问题,它也回答得不怎么样。记得ChatGPT刚出来的时候,我正好读完托马·斯哈代的《还乡》(The Return of the Native)。当时也是作为对它的一个测试,我要它写一篇五段分析文章,它一眨眼就写了出来。虽然没有什么洞见,但语言流畅,条理清晰,主要人物、突出主题都提到了,都说得很到位。如果高中生把这篇文章作为家庭作业交给英文老师,及格是肯定的,甚至可能得个优秀。正好今天又在网上读到一篇文章,作者提到他要ChatGPT用鲍勃·迪伦的口气写一首讲述Luke 和 Leia (都是星球大战中的人物)之间爱情的诗,ChatGPT一会儿就写了出来。作者说写得很像。我对鲍勃·迪伦熟悉程度不够,不敢乱说,但这首诗歌读起来是很酷。ChatGPT回答过很多问题,网上流传的关于它的故事也很多。我个人的经历肯定只是一点皮毛,沧海一粟,但从这些经历或许可以推测,ChatGPT的中国文学水平比英文文学水平要差。但这是否说明ChatGPT不行呢?不是。从它能做的那些令人惊艳的事情,我们已经可以看出来,它潜力惊人,绝顶聪明。但它是用来自互联网的大量文本数据,特别是来自网页、书籍和其他文本源的文本数据训练出来的。它的中国文学水平这么低,连《红楼梦》都没有掌握,只能说明用来训练它的中文数据或数量太少,或质量很差。优质数据的产生,需要有网民进行高质量交流的开放社区。互联网本来是一个网民们发挥聪明才智,八仙过海,各显神通的地方。但如果这些在网上发言的个体行为受到各种限制,好端端的干货满满的发言还一会儿就不见了,要有高质量的海量数据只能是痴人说梦。一个社会的全民素质教育水平,也影响到它的互联网上的数据质量。而且,因为大环境的原因,现在训练ChatGPT数据质的团队,估计也没有多重视用中文数据训练它。ChatGPT之所以能进行不错的中文对话,还在很大程度上得益于它的翻译能力,这让它可以借用英文学来的知识。这是一个很难解决的问题。都知道技术的发展造成了贫富悬殊问题的日趋严重,其实技术的发展也会造成知识上的贫富悬殊。越是拥有优质知识库的社会,就越有可能产生优质的人工智能,而优质的人工智能又会促进更优质的知识的产生。反之亦然,恶性循环,于是二者之间的差距越来越大。但提高我们社会的知识库的质量,谈何容易。* * *顺便再谈谈ChatGPT是否有创造性的问题。现在经常听到的一个说法就是,ChatGPT是很好玩,但它并没有创造力。这个说法我不同意。创造力简言之就是造出一个以前没有过的东西的能力。作为一个生成式(Generative,GPT的G)的人工智能,它跟我们对话的内容都是它综合自己以前学到的东西生成出来的,不是从哪里复制黏贴来的,这本身就是一种创造。它创造的东西是否有高的质量,是否有前人没有说过的有趣的说法,发表前人没有发表过的新颖的观点,这当然是另一个问题。首先这个要求很高,如果用这个标准,我们这些写公众号的百分之八十都达不到要求。其次,从它已经产生的那些内容来看,它写过的很多东西都很有趣。当它懂得的东西足够多,综合的时候它很有可能产生之前没有人产生过的想法。你可以说这不是独创性的,不是“洞见”,但我们人类的创造力也是在知识积累的基础上产生的。一个好主意到底是什么,怎么产生出来,我们自己其实也不清楚。在写作和聊天中,这可以是冒出一个很妙的词,一个好句子,或者很酷的构思。而这些ChatGPT都可以做到。尤其是ChatGPT有超强大脑,学习能力惊人,谁知道它以后还会有什么惊天动地的举动。ChatGPT产生想法的方式跟人脑不同,因为它是计算机,不是生物体。但它的外在行为看起来跟人很像,就是在创造。ChatGPT 可以写诗、写大学申请文书,写程序。 如果这些都不是创造性活动,什么是创造性活动呢?难道一个人要写诗写得像莎士比亚才能算有创造性吗?需要注意的一点是,ChatGPT是个通才。它不是一个专精某个行业的机器人。我们知道,有些人工智能,在从事下围棋这种高度智性的活动时,已经超出了人类。我们希望它写诗有莎士比亚的水准,编程有谷歌程序员的水准,谈哲学有柏拉图的水平,既能侃法律,又能做翻译。所有这些期望,放在任何一个人身上都是不可思议的,再厉害的虎妈狼爸也不敢对自己的孩子有这么高的要求。而我们居然敢这样要求ChatGPT。如果它有像我们人类一样的虚荣心,真可能会不可一世,自高自大。而且说不定哪一天,这些期望就已经全部达到。至于那些抱怨它的错误,嘲笑它废话连篇(fluent bullshit),或者煞有介事地指出这项技术还很不成熟,还要过十年才能真正有用的人,醒醒吧!ChatGPT已经很棒了。它已经很有用了。它已经比我们任何人都聪明了。ChatGTP 不是脸书,抖音,也不是区块链,元宇宙。它不是炒作,不是一个浪费我们时间的垃圾网站,也不是一张画出来的虚无缥缈的大饼。它是已经降临的未来。它的潜力超出我们的想象,它将改变世界。_____点击阅读相关文章中国人口出现负增长是好事而不是坏事张益唐到冯诺伊曼家做客一个有世界上最好工作的人,为何不留恋这个世界如果你喜欢我们的文章,请选择下面行动中的一项:A. 分享到朋友圈B. 转发至相关微信群C. 关注“硅谷生活家”公众号D. 以上全选(正确答案:D)微信扫码关注该文公众号作者戳这里提交新闻线索和高质量文章给我们。来源: qq点击查看作者最近其他文章