Redian新闻
>
为什么ChatGPT的中国文学水平那么差?

为什么ChatGPT的中国文学水平那么差?

其他

这些天全世界的人都在谈ChatGPT,但不同的人对它的评价差别很大。说它好话的就不提了,这几天看到一些吐槽文,好几篇都是说它不懂中国文学,比如把柳宗元说成是唐朝人,不知道金瓶梅的作者是谁,等等。
我是ChatGPT的铁粉,读了这些文章,也上ChatGPT试了试,果真,曹雪芹改成施耐庵,贾宝玉爱上王熙凤,还“最终他的心始终只属于王熙凤”,笑话闹得太大

古典文学不行,那么在西方热门的现代文学是不是更懂呢?也不行。前几天我正好考过它几个关于《三体》的问题,它也回答得不怎么样。

记得ChatGPT刚出来的时候,我正好读完托马·斯哈代的《还乡》(The Return of the Native)。当时也是作为对它的一个测试,我要它写一篇五段分析文章,它一眨眼就写了出来。
虽然没有什么洞见,但语言流畅,条理清晰,主要人物、突出主题都提到了,都说得很到位。如果高中生把这篇文章作为家庭作业交给英文老师,及格是肯定的,甚至可能得个优秀。
正好今天又在网上读到一篇文章,作者提到他要ChatGPT用鲍勃·迪伦的口气写一首讲述Luke Leia (都是星球大战中的人物)之间爱情的诗,ChatGPT一会儿就写了出来。作者说写得很像。我对鲍勃·迪伦熟悉程度不够,不敢乱说,但这首诗歌读起来是很酷。
ChatGPT回答过很多问题,网上流传的关于它的故事也很多。我个人的经历肯定只是一点皮毛,沧海一粟,但从这些经历或许可以推测,ChatGPT的中国文学水平比英文文学水平要差。
但这是否说明ChatGPT不行呢?不是。从它能做的那些令人惊艳的事情,我们已经可以看出来,它潜力惊人,绝顶聪明。但它是用来自互联网的大量文本数据,特别是来自网页、书籍和其他文本源的文本数据训练出来的。它的中国文学水平这么低,连《红楼梦》都没有掌握,只能说明用来训练它的中文数据或数量太少,或质量很差。
优质数据的产生,需要有网民进行高质量交流的开放社区。互联网本来是一个网民们发挥聪明才智,八仙过海,各显神通的地方。但如果这些在网上发言的个体行为受到各种限制,好端端的干货满满的发言还一会儿就不见了,要有高质量的海量数据只能是痴人说梦。
一个社会的全民素质教育水平,也影响到它的互联网上的数据质量。
而且,因为大环境的原因,现在训练ChatGPT据质的团队,估计也没有多重视用中文数据训练它。ChatGPT之所以能进行不错的中文对话,还在很大程度上得益于它的翻译能力,这让它可以借用英文学来的知识。
这是一个很难解决的问题。都知道技术的发展造成了贫富悬殊问题的日趋严重,其实技术的发展也会造成知识上的贫富悬殊。
越是拥有优质知识库的社会,就越有可能产生优质的人工智能,而优质的人工智能又会促进更优质的知识的产生。反之亦然,恶性循环,于是二者之间的差距越来越大。
但提高我们社会的知识库的质量,谈何容易。
*    *    *
顺便再谈谈ChatGPT是否有创造性的问题。现在经常听到的一个说法就是,ChatGPT是很好玩,但它并没有创造力。这个说法我不同意。
创造力简言之就是造出一个以前没有过的东西的能力。作为一个生成式(GenerativeGPTG)的人工智能,它跟我们对话的内容都是它综合自己以前学到的东西生成出来的,不是从哪里复制黏贴来的,这本身就是一种创造。
它创造的东西是否有高的质量,是否有前人没有说过的有趣的说法,发表前人没有发表过的新颖的观点,这当然是另一个问题。
首先这个要求很高,如果用这个标准,我们这些写公众号的百分之八十都达不到要求。
其次,从它已经产生的那些内容来看,它写过的很多东西都很有趣。
当它懂得的东西足够多,综合的时候它很有可能产生之前没有人产生过的想法。你可以说这不是独创性的,不是“洞见”,但我们人类的创造力也是在知识积累的基础上产生的。
一个好主意到底是什么,怎么产生出来,我们自己其实也不清楚。在写作和聊天中,这可以是冒出一个很妙的词,一个好句子,或者很酷的构思。而这些ChatGPT都可以做到。
尤其是ChatGPT有超强大脑,学习能力惊人,谁知道它以后还会有什么惊天动地的举动。
ChatGPT产生想法的方式跟人脑不同,因为它是计算机,不是生物体。但它的外在行为看起来跟人很像,就是在创造。
ChatGPT 可以写诗、写大学申请文书,写程序。 如果这些都不是创造性活动,什么是创造性活动呢?难道一个人要写诗写得像莎士比亚才能算有创造性吗?
需要注意的一点是,ChatGPT是个通才。它不是一个专精某个行业的机器人。我们知道,有些人工智能,在从事下围棋这种高度智性的活动时,已经超出了人类。
我们希望它写诗有莎士比亚的水准,编程有谷歌程序员的水准,谈哲学有柏拉图的水平,既能侃法律,又能做翻译。所有这些期望,放在任何一个人身上都是不可思议的,再厉害的虎妈狼爸也不敢对自己的孩子有这么高的要求。
而我们居然敢这样要求ChatGPT。如果它有像我们人类一样的虚荣心,真可能会不可一世,自高自大。
而且说不定哪一天,这些期望就已经全部达到。
至于那些抱怨它的错误,嘲笑它废话连篇(fluent bullshit),或者煞有介事地指出这项技术还很不成熟,还要过十年才能真正有用的人,醒醒吧!
ChatGPT已经很棒了。它已经很有用了。它已经比我们任何人都聪明了。
ChatGTP 不是脸书,抖音,也不是区块链,元宇宙。它不是炒作,不是一个浪费我们时间的垃圾网站,也不是一张画出来的虚无缥缈的大饼。它是已经降临的未来。它的潜力超出我们的想象,它将改变世界。
_____
点击阅读相关文章


中国人口出现负增长是好事而不是坏事


张益唐到冯诺伊曼家做客

一个有世界上最好工作的人,为何不留恋这个世界


如果你喜欢我们的文章,请选择下面行动中的一项:

A. 分享到朋友圈
B. 转发至相关微信群
C. 关注“硅谷生活家”公众号
D. 以上全选

(正确答案:D)

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
反击!Google 版 ChatGPT 首次亮相,有一个功能「碾压」ChatGPT剽窃、作弊,ChatGPT竟偷偷生成了12篇署名论文!Marcus炮轰Ta变成CheatGPT味感才是真“中国文学不要太在乎拿诺贝尔文学奖”日本啊,日本(五)枯山水ChatGPT讲座:ChatGPT并不神秘,但ChatGPT很神奇为什么所有公开的对 GPT-3 的复现都失败了?复现和使用 GPT-3/ChatGPT,你所应该知道的为什么ChatGPT诞生了在美国?最根本的原因是什么?人类“3.0”意识形态战场——ChatGPT的政治化终局ChatGPT的价值观及立场(四)下载量暴增10倍!微软必应集成ChatGPT后需求大爆发;4省份上调最低工资标准;淘宝已屏蔽ChatGPT关键词丨邦早报百度版ChatGPT确定为“文心一言”/ 戴尔裁员5%/ 苹果要开会应对ChatGPT…今日更多新鲜事在此华尔街交易员为何不担心ChatGPT抢饭碗?ChatGPT:我预测不了市场雪人集成ChatGPT后必应日活量首破亿!微软推出Azure OpenAI ChatGPT 服务,GPT-4下周发布再识加州重磅!微软发布 ChatGPT 版搜索引擎,用上了比 ChatGPT 更强大的技术华男上班差点没命但因祸得福申请绿卡,妹子住酒店遭陌生男狂捅到死!美国治安这么差?对话清华教授梁正:为什么ChatGPT创新没发生在中国?ChatGPT带火AI芯片,赚翻了的英伟达发布新核弹:ChatGPT专用GPU,让推理提速10倍!ChatGPT通过谷歌程序员面试,薪资达18.3万美元!ChatGPT通过谷歌程序员面试,薪资达18.3万美元!猎豹傅盛:为什么ChatGPT是生产力革命(2023)为什么ChatGPT这么强?—— 一文读懂ChatGPT原理!儿子的玩伴成为硅谷弄潮儿,兼谈孕育ChatGPT的美国文化ChatGPT能有意识吗:关于ChatGPT的误解与夸大ChatGPT因访问量激增崩了;抖音否认3月1日上线外卖服务;百度将于3月推出ChatGPT产品丨邦早报ChatGPT到底有多聪明?我测试了ChatGPT的数学能力闷声小发明紧急提醒!ChatGPT成神器!但这些“ChatGPT”是假的,小心被骗!ChatGPT的数学水平到底如何??Chatgpt的克星来了!澳洲留学生再用GPT写作业,98%概率会被抓!数学水平能遗传吗?能,甚至还有“代数基因”和“几何基因”|环球科学要闻2000元训练比肩ChatGPT的开源大模型!GPT-4亲自盖章认证,模型权重均可下载金融民工会因为ChatGPT下岗吗?刚刚,我问了ChatGPT 24个金融圈灵魂问题实测最像ChatGPT的中文产品:能解释三体、懂弱智吧的梗,内测开启人人都能试!孟晚舟将首次出任华为轮值董事长/ 百度All in类ChatGPT项目/ 知乎因ChatGPT大涨50%…今日更多新鲜事在此
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。