人工智能、“知”与“我”(上)
在20多万年前智人产生之后,人类以其智能逐渐成为这个星球的霸主。“知”与“智”是人类战胜其他动物、开发利用自然资源的原因,也是人类对自身的定义,而人工智能将对人类发起挑战。
近来爆红的ChatGPT能够综合它所学的知识,用人类的语言,回答人类的提问。人们现在可以轻松指出它的许多不足,但人工智能在快速发展,在不久的将来会在众多方面超越人类。实际上,多年前人工智能的出现已经引起人对自身安全的担忧。这向人类提出一系列哲学问题:人智与人工智能将如何相处?人工智能是否将取代人智,乃至最终取代人类?人类的出路在哪里?
ChatGPT分别表示什么?
Chat是聊天——人工智能用人类的语言与人聊天。这个过程需要大量的预先训练才能做到正确,回答还需要回避政治的、道德的不正确。
P是预训练(Pre-trained),在反复训练中排除错误。语言能力与知识不可分。ChatGPT的训练使用大型语言模型(LLM),有组织人类语言(自然语言)的能力。
G(generative),生成的。通过反复训练机器的语言能力,使之能够生成正确的自然语言,以及上下文、意图的连贯。这使它的语句很难分别于人类的语句。
T(transformer),变换器。计算机有自己的语言。变换器把计算机语言变换或转换为自然语言(人类的各种语言)。
ChatGPT与人类学习语言的方式相近。在上世纪中期,美国语言学家诺姆·乔姆斯基提出“转换生成语法”。乔姆斯基相信,人类具有先天的语言能力。父母遗传给子女的是先天的语言能力,而不是具体说某一语言的能力,这种先天能力使不同语言的学习同样简单。例如,被收养的婴儿,其亲生父母说一种语言,养父母说另一种语言,这些婴儿的母语是养父母的语言。他们学习语言的能力不会因为婴儿时期语言环境的改变而减少。这就是语言先天能力的“转换生成”。“转换生成”(Transformational Generative)的两个首字母颠倒,即Chat-GPT中的G、T。ChatGPT的先天语言能力是大型语言模型,可以生成许多种语言。它在大量预训练中提高语言能力,掌握语言中的知识,回避各种不正确。用户看到的是它的预训练结果。
孔子区分“生而知之者”、“学而知之者”,以前者为上,后者为次(《论语·季氏》)。前者的“知”是天赋,后者的“知”来自经验。孔子说:“我非生而知之者。”(《论语·述而》)因此他重视“学”。其实并没有“生而知之者”,每个人都需要“学”——远不只是读书。但每个人获取“知”的能力有很大差别,创造新“知”的能力差别更大。这种差别有显著的先天因素。ChatGPT通过大量预训练获得语言能力,获得知识,它自己暂时还不能创造知识。
各国的创造能力有差别,而国界线又往往以语言为划分依据。ChatGPT能够突破语言的隔阂,人工智能将不再受到语言的限制。知识是用语言表达的,语言问题也是认识问题。面对现代科技的挑战,人们需要改变语言以及由语言承载的认知方式,使之适应不断变化的现代社会。改变语言并不是很难。在过去一百多年,汉语表达现代之知的能力已有大幅提升,十九世纪的进士们如果来到今天,会被当作半文盲。汉语还将继续改变。难的是改变认知方式,这还需要语言之外的更多改变。ChatGPT的开发者或许没有受到乔姆斯基的语言学启发,但他们都继承从古希腊已探索的“知”从何处来的问题。这是一个古老的哲学问题。
古希腊德尔菲神庙有三句铭文:“认识你自己”、“凡事勿过度”、“妄立誓则祸近。”第一句最为根本。认识世界从认识自我开始。认识自我,包括认识自我的愚蠢,而不只是潜在的聪明才智。认识自我,则知可知与不可知、可为与不可为;能做到这一点的人,行为不会过度,不会信誓旦旦预言未来。幻想与现实之间有巨大鸿沟。立誓建立乌托邦者都已失败,原因在他们不能认识自己。幻想的乌托邦已给人类带来无尽的灾祸,不再是“祸近”。在铭文之外,德尔菲神庙给的神谕是模糊的,需要解释。解释者必然有知。
柏拉图《理想国》第七卷有一个“洞穴”比喻,在苏格拉底与格劳孔的对话中。苏格拉底说:“有一些人从小就住在这洞穴里,头颈和手脚都被绑着,不能走动也不能转头。”苏格拉底称这些人是“囚徒”,陷入认知困境的囚徒。这些囚徒背对洞口,只能看到洞穴的后壁。洞外有火,有人在火光与洞口之间举起木偶,并不说话。一道矮墙挡住这些玩木偶者,洞中人只能见到木偶的阴影,不见操纵者;他们一生所见的“真实”是一场又一场的皮影戏表演。
苏格拉底用这个比喻讲述“知”的虚假与真实、黑暗与光明。洞穴、绳索与矮墙是洞中人的认知障碍。洞中这些人是认知的囚徒。格劳孔问苏格拉底:“如果他们一辈子头颈被限制了不能转动,他们又怎样能看到别的东西呢?”苏格拉底没有明确说谁囚禁了他们,但那些障碍是他人的设置。囚徒被那些在洞外玩弄木偶的人囚禁、捆绑,然后又习惯于自我囚禁。
在柏拉图记载的苏格拉底的比喻中,洞中囚徒只能见到火光的阴影,不能见到太阳的光辉。《庄子·逍遥游》有一个寓言:尧欲让位于许由。尧说:“日月出矣,而爝火不息,其于光也,不亦难乎。”尧自比于火炬,其光不能与日月(比喻许由)之光相比。许由拒绝尧的禅让。这是一个政治寓言。火炬之光是圣人之治,日月之光是道家之治。庄子追求无用,不求居于高位;庄子崇尚无为,以不治理为最高治理。道家希望回到朴素的远古时代,但他们没有主张设置障碍,阻碍民的知。
洞穴中的人近似“井鼃”。“鼃”,音、义同“蛙”。《庄子·秋水》说:“井鼃不可以语于海者,拘于虚也;夏虫不可以语于冰者,笃于时也;曲士不可以语于道者,束于教也。”“虚”,同“墟”,所居故地。“井鼃(蛙)”与“夏虫”分别受到地点、季节的限制而不知有海、冰。这些小动物比喻“曲士”,偏执于所受之教而不能知“道”者。欧洲的认知史是一部试图走出“洞穴”的历史。他们并不是没有经历过黑暗时期,但黑暗中仍有摸索。他们在中世纪之后重新走出“洞穴”,继续质疑与反驳。拘束知与思的权力越持久,走出“井”就会越艰难。
“知”有真假。如果“学”只是学古,而且这个“古”是臆想的,甚至是现代的伪造,“学”者只能是皮影戏的观众,必将受到现实的惩罚。同样,伪学的预训练也不能给ChatGPT或其他人工智能带来真知——或被称为“真理”。“真”是实在之物,“理”是人对“真”做出的解释。“真”不作为“理”而存在,“理”于“真”必有误差,还可能是对“真”的刻意扭曲。
“知”被分为众多门类,仿佛各不相关,其实不然。人各有所长,但获得各种“知”的能力需要相同的外部条件,正如语言能力的获得需要语言环境。欧洲有中世纪教权时代,中国有两千多年皇权时代。那时的权力所有者以“知”为威胁,把“知”限定在他们允许的范围内,对其他“知”的探索进行压制。在位者还可以只选择发展对他们实用的技术。如果摆脱“教”的思想束缚,曲士将由鼃(蛙)与虫变成得道者,不仅能获得世界、新的时代,也可以得到精神的解放。
每个人获取“知”的能力有差别,但获取的方式却是相通的。乔姆斯基的语言之源问题来自欧洲哲学的知识论传统,可以上溯到古希腊时期。英国哲学家阿尔弗雷德·怀特海说:一部西方哲学史只不过是柏拉图的注脚。这句话也大致适用于中国哲学史,也可以说:一部中国哲学史不过是老子、孔子的注脚。当然,在各哲学传统中,脚注之中都有创造。注脚说揭示:人类的根本问题在轴心期已经提出,后人以此为基础继续探索。ChatGPT与人工智能是当代技术,却至少已有数百年的积累,是思想创造的古老传统的延续。每个人都是观念的奴隶,但观念有大小。古人努力走出洞穴或井,后人又有回去的,坐井望天,发出蛙鸣一片。
知识的来源
人工智能是人类之知的一个新产品。人的知从哪里来?对这个问题的回答将决定人如何寻求知。知识论是哲学的一个分支。哲学在古代是知识大全,陆续分出现代所知的各学科。
古希腊奠定西方哲学的基础。在教权的中世纪,教会是知的来源。在中世纪之后,欧洲人需要重新认识知识的来源。他们不只是回到古希腊哲学。英国哲学家弗朗西斯·培根蔑视当时大学传授的知识,而钟情于亚里斯多德的著作。后来,他出版《新工具》(1620年)。书名中的“新”是对亚里斯多德的《工具论》而言。《新工具》强调感官的验证,经验与实验,曰:“人作为自然界的臣仆和解释者,他所能做、所能懂的只是如他在事实中或思想中对自然进程已观察到的那样多,也仅仅那样多;在此之外,他既无所知,亦不能有所作为。”
《新工具》出版不久,1637年,法国哲学家勒内·笛卡尔发表他的第一部著作《谈谈方法》。什么方法?解释在这本书的全名:《谈谈正确运用自己的理性在各门学问里寻求真理的方法》。笛卡尔在这本书中提出他寻求的哲学的第一条原理:“我思,故我在。”“我”是个人、“思”的主体。没有“我”,就没有“思”;没有“思”,也就没有“我”。“我在”的“在”指存在,在欧洲语言中是常用字“是”,“我”之所以是“我”。“我”因为“思”而存在。“存在”是一个古希腊哲学用词,可上溯到巴门尼德。汉语没有这样用法的“是”。很多时候,哲学只是一场语言游戏。语言是思考与交流的工具,无言的思考也用语言。语言也是历史与文明的分界线。
人工智能有学与逻辑,或者有经验与理性,其学的能力是人赋——相当于人的天赋。这两种认知方法可以相容。胡适也认为“我思”定义“我”。1956年,他在一封来信中批注:“除了思想之外,什么是‘我’?”此语显然用笛卡尔的思想,虽然胡适自称是一位经验主义者。
英国约翰·洛克《人类理解论》(1690年),强调经验,反对知的天赋。德国哲学家莱布尼茨为反驳洛克,撰《人类理智新论》,力证天赋说。莱布尼茨等待洛克增补的《人类理解论》的法文新译本,然后相应修改自己的书。1704年,在莱布尼茨此书初稿完成之时,洛克去世。莱布尼茨不愿反驳一位逝者,因此《人类理智新论》在他去世五十年之后才出版。
以上四位欧洲哲学家确定了英伦哲学与欧陆哲学的区别。这个区别大致是:前者依靠经验,后者依靠理性。经验是有限的,理性却可以无限延伸——乃至失去理性。黑格尔以及他之后的德国哲学虽有智慧,却陷入形而上的构筑。这种方法用于科学探索是有用的,因为科学需要狂想,也能够容错;却不适用于现实政治,因为政治的证伪需要付出血的代价,而人类不应该成为实验用的小白鼠。然而,宏大设想的教训却难以被接受。欧陆哲学有走偏的嫌疑,成为智者在象牙塔中的游戏。德国哲学家海德格尔接受纳粹,与他的哲学并非没有关系。经济学家哈耶克、哲学家维特根斯坦予以这样的哲学致命一击——这两人都来自德语国家。
哲学,如同诗歌,依赖语言,在翻译中失去很多。在不同语言之间,同一语言的不同时代之间,同一语言的不同使用者之间,一个字或一个词的意义都会有很大差异,有时甚至截然相反,因为字词的意义是由行为赋予的。语言的隔离产生知识的隔离。但是,大略而言,古哲人的思考相近。如果说中国先秦哲学有欠缺,那是因为墨家的消失——因为权力不能容忍他们。墨家多工匠,精通技术,以技术对抗侵略战争。墨家注重经验与逻辑,有科学发现。
孔子说:“知之为知之,不知为不知,是知也。”(《论语·为政》)孔子强调对“知”的诚实态度。苏格拉底则说,他唯一知道的事情是自己一无所知。每个人的“知”都是极其有限的。苏格拉底知其无知。庄子说:“吾生也有涯,而知也无涯。以有涯随无涯,殆已!”(《庄子·养生主》)庄子不是放弃寻求知而甘于无知。他在寻求万物的共同之理,即道家的“道”。
知识来自学与思。孔子说:“学而不思则罔,思而不学则殆。”(《论语·为政》)孔子认为,学与思不可分,分则两伤。孔子的“学”不只是学古,也有经验与反思,其中都有理性。孔子曰:“三人行,必有我师焉。择其善者而从之,其不善者而改之。”(《论语·述而》)“从之”增加对善的知,“改之”则是反思的结果。孔子的“知”体现于人,而不是对世界的更广泛的知。孔子更侧重学。他说:“吾尝终日不食,终夜不寝,以思,无益,不如学也。”(《论语·卫灵公》)孔子的社会理想以古圣王为模式,“学”比“思”更能满足孔子的追求目标。
其实,圣王之迹有孔子的解释。英国历史哲学家罗宾·科林伍德说:“思想史,并且因此一切历史,都是在历史学家自己的心灵中重演过去的思想。”与其说圣王传说培育了孔子,不如说孔子再造了圣王传说。《礼记·中庸》载孔子说:“道不远人。人之为道而远人,不可以为道。”“不远”指空间距离近,也暗含圣王之道并不只在古代,其产生的现实条件就在他的时代——这是孔子几乎穷尽一生以图实现其理想的原因。孔子弟子子夏曰:“博学而笃志,切问而近思,仁在其中矣。”(《论语·子张》)“博学”,不限于学古。“近思”,思己身所能及之事,而不是遥想古代。子夏“思”他的经验,也是在他的时代,其实与“道不远人”相近。
人工智能与“做题家”
记忆是获得知识的第一步,知识是智慧的基础。有知者也是智者。良好的记忆力是在古代成为优秀学者的必备条件,在今天已经变得不那么重要。因为互联网的搜索功能,在学术研究中,对照相般记忆能力的需求已经不及以往,而更强调思考的能力、创造的能力。ChatGPT甚至使用户省去搜索与综合,能够直接提供答案。人工智能必将导致简单劳动者大量失业。
今后一段时间,还不能被取代的是创新工作。在任何时候,有创造能力的人都是少数,但这不是在教育中毁灭创新能力的理由。“小镇做题家”指那些能够记住“正确答案”的学生,善于考试。这个名称有大城市人对来自小地方人的歧视。其实,“小镇”二字是多余的,每一个考试高手都是“做题家”,无论他们来自何处。“做题”所能获得的知识是零碎的、僵死的,而且其中还有很多伪知识。在今天,“做题”的危害更加凸显,因为人工智能比做题家做得更好——无论掌握的知识的真伪。
应试教育把人变成储存“正确答案”的机器,一个物件。这些物件在与人工智能的竞争中毫无获胜的希望。人工智能可以记忆人的全部知识(真实的和虚假的)。即使全体人类的记忆相加,也远远比不上人工智能——其能力还在快速发展中。
人的记忆有助于知识的融会贯通。搜索引擎能找到原来是隐藏的知识,使一些没有知识的人也显得很有知识。ChatGPT还不能理解它的知识,更不能帮助用户加深对知识的理解。但ChatGPT标志人工智能开始进入大众生活,必将带来深刻的改变。在当前,ChatGPT还与一些“科研”论文有相似之处。很多“科研”论文是无用的,既没有增加知识,更没有改变知识。搜索引擎没有阻止这样的“科研”,ChatGPT也不会,反而使论文“灌水”更为便捷。如果没有论文“灌水”,现有科研与大学的评价(也是一种有正确答案的考试)的结果将发生很大变化,虚幻的繁荣将破灭。改变这一现状需要人的努力,而不是智能机器的运行。
人工智能储存知识的能力远远超过人类,人们已经在谈论ChatGPT这样的人工智能工具将取代哪些工种。从较长期的角度看,快速发展的人工智能可能将在所有方面都超越人类。
技术的发展总会出人意料。现在展望人工智能的未来,即使专业人士也会出错,或者很快落后。ChatGPT仍有各种不足,但互联网在其初期也经历许多失败。与乌托邦相反,生成式AI现在还是跳蚤,但它代表的技术方向终将成为腾空而飞的龙。人工智能是软件,还需要芯片等硬件支持的更高算力。软硬件的高水平开发条件苛刻。而与软件相比,硬件造假更难。
GPT的一次训练费用可高达几百万美元,成本不是一般公司能够承担。每一种语言储存的知识量有极大差别,每一个国家开发人工智能的能力也有极大差别。开发ChatGPT的公司是OpenAI,GPT-4不是开源的,此外还有国家间的封锁与封闭。当更强大的人工智能时代到来时,会不会产生国家间智能的巨大差别?
在不久的未来,这种国家间竞争必定会有一个结果。另外的问题将更持久:什么是可以知,可以思的?这有关人如何成为人。当然,有时候这个问题会有改变:什么是被允许思的?人工智能(或者一个强人)无所不知,超越人的思考,或代替人的思考,这时人何以为人?
哲学问题:我从何处来?到何处去?我是谁?这是对人的“存在”的通俗总结,却也不无道理。这三个问题以另一个问题为前提:什么是“我”?“我”可以指个人,也可以指人类。人工智能的知已经超过人类的知——虽然其知来自人类。人工智能或许还将超过人类的思。人类可以因此放弃他们渺小的知与思吗?如果没有知,没有思,何以为“我”?“我”从何处来的问题仍将有争论。更大的问题是“我”是谁?将往何处去?人工智能的未来不可限量。如果机器可以代替人的思,人如何为人?下一篇将更多讨论中国传统思想与人工智能。
微信扫码关注该文公众号作者