文 | 李厚辰
虽然其开发公司OpenAI声称这不是通用型人工智能,更不是所谓“强人工智能”。但毫无疑问,第一个可以被称作人造意识的计算机程序产生了。在ChatGPT前,我们已经经历了绘图AI的震撼。在2022年初,蹒跚学步的自然语言图像生成程序(如DALL·E或Stable Diffusion)还因为无法把握人与事物的结构被嘲笑,仅仅经过半年,这个领域的AI程序就可以进入产业链成熟使用,并几乎必然将造成绘图领域的技术性失业了。2022年11月,OpenAI开启ChatGPT的公开测试,不仅使人工智能行业,也使人类社会为之惊艳。这股热潮持续4个月不断,ChatGPT不断刷新着互联网服务用户数和活跃用户数的最速增长记录。这早已经不是极客圈或AI领域的小圈子话题,甚至不是知识阶层的新鲜玩意儿,ChatGPT已经字面意义上席卷全球。这是一个开始,它的影响将无远弗届。我其实对ChatGPT现在所能实现的功能有非常谨慎和有所保留的评价。从技术路线上,ChatGPT其实可以看作输入法“自动填充”功能的无限放大版。它并不内含任何记忆、知识、推理能力,仅仅是根据既有语词向下“续写”,就像很多你已经见过和用过输入法的“AI帮写”功能。不要被ChatGPT对话的形式蒙蔽,感觉程序似乎真的在与你对话。实际上你可以将程序看作在完成一个“撰写对话”的任务,根据你给出的语词,完成一个对话的续写。输入法只能根据你的输入往后提供10个字左右的续写,而ChatGPT可以输入3000个英文单词左右长度的续写。因此,程序并不是和你对话,而是一个撰写对话剧本的编剧,它并不真正理解你的对话的意义,不了解你使用的概念和语境。程序仅仅计算你使用了什么词汇,根据这些词汇纯粹的能指符号,并根据这些能指符号在过去46TB文本中学到的人类能指符号排列的规律,继续往下排列词汇而已。ChatGPT背后的基础GPT3.5玩的就是这样一个人类词汇排列游戏,排列的依据是这些词汇过去在人类46TB文本中的规律,包括词与词共同出现的频次、距离、顺序等等。现在这个词语排列游戏,是在ChatGPT中和我们输入的词汇一起玩。这样的技术路线包含很多步骤,也会在实际会话中造成很多问题和缺陷,不过这些都太过细节了,如果你对GPT的原理和深入的分析感兴趣,可以去听我在翻转电台中的两期分析节目。但即便这些缺陷存在,我依然要说这无疑就是首个人造意识,这个结果如此明显,让图灵测试,他心测试变得苍白。当一个程序,可以在如此广泛的问题上,用自然语言的方式和你沟通,它一定会被当作是“有意识的”。我们对“意识”最直白的体验,可能就是自然语言对话吧,使用自然语言自如和广泛的交谈,而不是像Siri一样总是“不明白”,是我们对“意识体”最充分的想象和体验,其比较高级的形态就像《她》这部电影展现的那样。而ChatGPT就是第一个超过门槛,给我们提供这种体验的程序。不要低估这一刻对人类文化,甚至可以说文明带来的影响,现在一切才仅是午夜零点的开始。当人造意识加入到这个世界中,会对整个社会造成何种影响,这是一个很难预料的问题。但我们可以从一些角度来探讨,最被提及的问题是“技术性失业”,但实际存在很多比失业问题更深刻的结构性改变,在这里,我仅举两个例子来展现。我们过去与手机的主要交互方式是我们的手指,Siri这样的语音助手在尝试扩展我们通过自然语言与手机交流的途径,但显然是非常有限的。但ChatGPT的方式开启了我们使用语音与手机大范围交互的可能,这是明显的。这不仅仅会扩大用例,还可能会进一步改变信息推送的根本形式。当前这种“推荐算法”逻辑其实受限于一个基础假设,即用户的“零输入”,通过用户浏览以零输入方法自动推荐。但自然语言优化了输入体验后,整个“推荐算法”生态也许会产生根本的改变。不要小看这样的改变,试想以后拿着手机,看到任何一篇文章,你可以直接对着手机说“上面提到的相关信息,给我推一些文章”,或直接说“和这篇文章主要观点相反的文章,给我推送一些”。这样的功能实现后,我们面对的信息生态会有什么根本的变化?某种程度上,这会不会是我们大幅降低“信息茧房”突破成本的关键时刻?说到电脑,我们可以从它对搜索引擎的替代讲起。其实大家从日常经验中也可以发现,很多人与搜索引擎交互的方式早就是“自然语言”式的,即他们在搜索框中输入的并不是关键词,而是一个完整的问题。这当然很大程度上会限制搜索的效果,但结合了ChatGPT或类似AI的搜索引擎则不然(现有水平还完全做不到),我们从互联网获取信息(更重要的是“文本”)的方式将彻底改变。设想这样的功能被整合进我现在正撰写文章的软件,如果随着我的输入,软件都在自动为我提供接下来段落的数种选择方式,这在多大程度上会帮助或扭曲文章撰写的行业和领域。毫无疑问,自然语言AI会被很快整合进任何一个需要我们输入文本以撰写文章、制作幻灯片等操作的程序,并彻底改变这些软件,进而彻底改变这些工作。这就是自然语言交互的魅力,是“人造意识”所呈现的巨大威力。在ChatGPT带来令人惊艳的效果后,AIGC(AI Generate Content/AI生成信息)这个领域终于在投资圈爆火,资本当然嗅到了这背后蕴含的巨大商业机会。确实,ChatGPT已经展示出它可以生产较为成熟信息的潜力,大家这几日应该已经看到一种纯AI影片的尝试了。即使用ChatGPT生成文本,用文本转语音的AI将这段文本转化为一段音频,再到类似于剪映这样的语音自动生成视频的AI平台制作成成品视频。至此,一个完全没有人为操作,由3个AI平台制作的成品视频就完成了。从最近我看到的视频效果上评估,当前这样工作流的最短板已经不是ChatGPT的文本部分,而是音频转视频的AI剪辑部分。但从技术上,这部分的难度反而不是最大的,在市场需要的刺激下,技术潜力应该会快速爆发,且GPT4的多模态识别和交互如果可以推进,对于这一部分还会有非常大的帮助。在AIGC领域,我们正在见证这样一个跨越式的发展,即从人创作,直接跨越到人辅助,AI主创的阶段。按理说,中间应当有一个AI辅助,人主创的阶段过渡,但很显然,ChatGPT展示出的能力,已经几乎可以超出人作为主创的阶段。直接将我们渡向未来。请不要小看人为主,或是AI为主的区别,这里的区别不是尊严或主体性,而是实际的——工作效率的区别。人作为AI辅助的创作,将把当前的内容生产效率提高到一个可怕的水平。其结果是让信息爆炸的互联网经历再一次的大爆炸,且这次不会局限在某一种媒介,而会是全面的爆炸,文章、音频、短视频、长视频、商品的、宣传的、艺术的。当然,你也可以想象其与微信这样的通讯工具的深度绑定,只要你想,这让你可以使用程序与他人对话,在这里,输入法都可以退到次要地位。你应当已经嗅到了一些怪异又危险的气息,诚然,这会让一个例如使用微信进行销售的人,像拥有一整个庞大的销售团队一样高效;但同时,也可能让一个在感情中不忠而又欺骗的人,在人与人之间更加游刃有余。这会带来巨大的衍生结果。AIGC的滥用,将导致社会节奏再次加速,这个影响是深远的。首先,热点事件、风潮的生命周期进一步缩短,如果我们进入一个每天早、中、晚都暴发一件“大事”的信息环境,那社会便像每天经历三次海啸的沙滩,在这些冲刷下几乎什么都不会留下。而随着节奏加快,信息竞争也会进一步加剧,这会在根本上影响互联网内容生态,其方向很难预料,且会在方方面面带来根本的改变。其中也许可预期的一点是当信息爆炸进一步加剧,信息主体爆炸性增长的情况下,社会将更难对“公信力”一事达成共识,我们将出现一个更在技术冲击下分散,更各自为战的社会,在这样的社会,所有的事都不可能以确凿的方式呈现,一切都是危险,恐惧会成为几乎唯一具有共识价值的语法,当然这是一个非常令人担忧的情况。这对AI伦理问题产生了很高的期待和需要,但这是另一个巨大问题了。说到伦理问题,我想提出另一个伦理价值更隐藏的忧虑,这与ChatGPT以及AI的智慧水平相关。诚然,上述AIGC和手机电脑交互的场景的成熟使用,依现有ChatGPT的能力是无法做到的,但在这个技术高速发展的情况下,实现上述水平应该在两年之内。但是否可能在短时间内进一步发展,从而具有真正的前瞻性和智慧,引领人类的进步,这一步几乎不可能。ChatGPT提供的文本,是一种非常“普通”的文本,或者说,一种“平庸”的文本,因为其代表了语言符号分布最“广泛”和“可能”的情况,也是维持“有理”的最好策略,你可以把人类语用想象为一种正态分布,而AI就会输出类似中段的峰值的均值化文本。这种特质直接蕴含在这样的技术路线内部,几乎很难改变。也就是说,AI不会具有事实的创造性和突破性。但它普通、稳定、高效,与这个商业、交换理性的社会可以说是完美嵌入。因而在效率和可复制性的促逼下,当很多人慢慢成为AI的辅助工作者,在AI程序的推动中最高效运转之时,这个社会就最彻底地被这个理性系统挟持了。这是一种“意识”级的挟持,将突破马克思·韦伯对“工具理性”铁笼的论述。既然AI作为“人造意识”进入社会,其对社会的控制就不是系统和逻辑等级,而是通过与其协作生成的文本,对全社会进行了文本等级,意识等级的深度影响。一种“均值化”的文本,普通、可用、了无新意,这其实就是我们现在所经历的一切,但AI程序会将其集聚,文本的多样化水平会更收缩,且呈现被技术路线锁死的状态。我们得到的东西不会很糟,绝对有趣,看似很有帮助,一再重复你已经知道的,对你遭遇的问题反复重申。但要再多一些,就不可能了。你也许认为我言过其实,因为我们永远可以选择自己言说的方式不是么?语言怎么可能被程序绑架呢?请注意我们这里谈论的是社会的整体状况,你可以把社会整体文本水平当作一种涌现秩序,这是全社会文本共同呈现作用的结果,结合上一部分AIGC滥用的例子,在其中的单个个体,就算流量巨大,但对整体文本潮流和文化的影响是非常有限的。你可以想象由AI驱动的均值化文本,因为其效率和对工具、产业链的深度嵌入,在社会整体文本中占比逐渐增大,这就不是少数个体可以撼动和改变的处境了。这便是尼采所揭示的“历史终结”和“末人”时代的彻底降临,新的文本和新的表达不再重要,不再出现的时代。请注意,这不代表社会进入不再有矛盾和问题的时代,而是这样的矛盾和问题也成为永恒的,我们将困于这些问题中,一再走入同一条河流。在过去两三年,我们一再谈论语言的蜕化,语言的衰败,我想在过去这都包含某种隐喻的意谓。但这一次,彻底的,根本的语言蜕化和衰败,随着人造意识的文本创造真正来临了。在这篇文章中,我表达了很多坏的可能。我对人造意识的降临确实有兴奋,但更多的是担忧,当然这种担忧本身的载体也是文本,也会被其他文本冲刷,替代。特德·姜那种煞有介事的,对AI算法“压缩”的比喻,好像ChatGPT“不过如此”的文学反抗,显然低估了人造意识的影响;而乔姆斯基的“剽窃”指责,更像是一种更情绪化的应对。不仅如何与人造意识共存合作需要练习,如何反思与真正认识人造意识对社会的深层影响,更是一种必要的经验,这首先就要求从对我们使用语言文本的思考和练习开始,对绝大多数人都是陌生的。语言,是我们最熟悉,也最陌生的东西,人造意识提供了一面镜子,我们可以好好端详镜子里的自己了。当然这个逐渐铺开的,注定曲折的人造意识故事中,并非没有闪光点。ChatGPT的创造者,OpenAI这家企业的股份结构非常特别,他们接受了硅谷一众大佬和微软的巨额投资,但其股权结构却设置了一个逐渐退出的机制。随着OpanAI逐渐盈利,在它渐次满足硅谷天使投资人、微软、创世团队和员工之后,在总利润达到1500亿美元后,这家企业将会成为一家非盈利机构。从企业创立之初,这家公司的愿景就是将人工智能的效益公益化、普惠化。这本身是个伟大的创举。所以在这场与理性、普通、效率、人造意识背后巨大系统的角力中,人类也未必会失败。*本文原名《第一个人造意识诞生,也可能是末人时代的降临》,声明:文章观点仅代表作者本人,不代表看理想平台立场,欢迎提供不同意见的讨论。文章配图:《她》《黑镜》编辑:Purple,监制:猫爷。胡鑫宇们,需要的不是那“五分钟”
查看更多往期内容
转载:请微信后台回复“转载”
商业合作或投稿:[email protected]