人机对话的场景革命
导读
《Impromptu》(即兴)是第一本人与GPT-4合作撰写的书,全书至少有三分之一的篇幅是作者里德·霍夫曼与“合作者”GPT-4的对话,其中既有GPT给出的书稿提纲,也有GPT帮助霍夫曼准备播客对话的问题列表,还有GPT根据霍夫曼的提示写出的剧本……
恰如书名,“即兴”点出了GPT的特点。它的反馈是即兴的,既迅捷,又具备一定的广度,而且时不时还能给人意想不到的惊喜。“即兴”同时也是霍夫曼的行事方式,突然有一个好的想法,马上就去做,如和机器一起去写一本研究AI应用和未来的书。当然,“即兴”也凸显了这一波生成式AI的来势凶猛。在AIGC的冲击之下,许多领域会发生剧变,而理解乃至前瞻这种剧变,需要运用“解构”的思维方式。
《Impromptu》解构了我们所理解的书的形态,是一种基于人机互动的解构。
首先是动态的书的出现,书会不断处于更新状态。霍夫曼在书中让GPT-4写了一篇AI如何改变未来的大纲,很详细,也很实用。在技术进化如此迅捷的世界,这会是一个演进中的议题,书自然需要不断更新,因为GPT-4自身的认知会在互动中升级,而作者也会在互动中不断碰撞出新的想法。
其次它展示出互动阅读的全新场景。因为书本质上是开源的,GPT可以调用全球出版过的各种书籍,其搜索能力、整合能力和涉猎的广度都是惊人的。如果在阅读的过程中加入人与GPT引擎的互动,比如人机一问一答的形式,会让阅读在双向互动的过程中变得越来越深入。在这种互动的解构中,书的使用方式将会发生改变。比如“拆书”就会变成一种读者主导的AI服务,而“30分钟帮你读懂一本书”的商业模式则会消亡。
第一种场景让可更新版电子书成为常态,第二种场景则会完全重构出版业的生态。两个场景之间又会产生互动。未来出书将不再是一次性的,而是一种进行时,读者阅读书籍的互动也随之会发生本质的改变。
从这一解构的思路出发,我们可以再进一步开脑洞延伸,想象一下两大行业可能被颠覆的形式。
首先是阅读商业场景的进化。微信读书是最近几年出现的订阅式阅读服务,只要支付年费,就能畅读书库里的书,出版商也会因为某本书的阅读量获得一定程度的分润(虽然并不可观)。类似订阅制的读书服务未来将被重塑。阅读的起始点将不再是首页上推荐的某本畅销书,而是读者的一个困惑或者一个想法。在与AI小助手的互动过程中,读者可以就一个话题越挖越深,让GPT概括一些书的观点,或者推荐某本书的特定章节。从这一意义来讲,GPT会扮演强大的“守门人”(Gate-Keeper)角色,读者与特定书的关联会更弱,读者与整合的知识的关联会更强。
这种变化优劣互现。优势在于,阅读变成了一个可以不断深入的启发式的过程,一个问题会衍生出十个问题,甚至更多,在这一过程中,电子书库中的长尾——一些不大为人问津的书——会被挖掘,而不是像现在因为“流量逻辑”的霸权,只有畅销书才可能被展现在大多数读者面前。因为流量掌握在平台、KOL(Key Opinion Leader,意见领袖)和KOC(Key Opinion Consumer,意见消费者)手中,书籍的马太效应明显。劣势则是书会被拆解为观点,读者与书的关联度、与作者的关联度可能会进一步弱化,出版本身的商业模式也需要重新探讨。
沿着同样的思路也可以畅想一下图书馆的进化。图书馆与支付年费的付费在线书库有两大区别:第一,它的藏书更丰富,涵盖的领域更广,藏书的长尾也更长;第二,因为公益性质,它的学习和研究导向更明确。GPT可以成为互动高效的图书馆员。它不仅能帮助读者找到所需要的书,在互动过程中精准推荐与读者研究方向相关的书籍,还能充分调用图书馆的图书资源,帮助读者深入一个领域内的学习,或者强化一个领域内的研究。当然,现代论文的引经据典、检索服务也可以由GPT来完成。
未来被解构的不仅仅是书、出版业或者图书馆,还有许多行业也可能被解构,比如新闻业。本质而言,新闻与出版是同一件事,为消费者提供优质的内容。人机互动的场景给新闻业带来的改变会与出版业类似,这也是霍夫曼在《Impromptu》中开的比较大的一个脑洞。
首先,记者和编辑的岗位不会改变,甚至需要加强,因为他们是重要的资讯产出者。理由很简单,GPT还无法完成现场报道,或从事深入调查的工作。
其次,记者的产出将成为GPT与读者互动的基础,有公信力的旧闻数据库会成为GPT不断挖掘的金矿,与图书的长尾效应类似。
第三,新闻作为产品将经历与一种全新的解构和重组。前数字时代,报纸和杂志是以捆绑销售(Bundle)的形式呈现的,即使读者只感兴趣某几个特定版面,仍然需要订阅整本杂志/报纸,换句话说,他可能在为一份报纸涵盖数十个版面买单。
数字时代的做法是去捆绑,千人千面,根据读者阅读的喜好推荐更多类似的文章。数字订阅也可以阶梯定价,按照阅读量来收费。显然,去捆绑比捆绑销售要亲民得多,读者不用补贴不感兴趣的内容,好的推荐也能让读者更快看到自己感兴趣的内容。
当然去捆绑也带来了一系列的问题:捆绑销售中所隐含的对内容创作的补贴没有了,新闻机构可调用的内部资源相应变少;而定制化的内容也局限了读者的视野。内容捆绑的一个很少被人提及的假设是人的需求会随着时间和场景的变化而变化,捆绑而不是精准推荐可以让用户有机会发现自己惯常视野之外的内容,前数字时代翻阅报纸和杂志的动作本身就创造了这种偶遇新知的机会。
数字时代的定制把推荐的主动权交给了算法,而AI时代则会把主动权再次交回给读者,因为读者阅读新闻的场景会以互动式为主。比如一个场景是节约时间,用户可以让GPT将报纸的头条内容做一个简单总结。另一个场景则是不断挖掘式的,比如用户会提出一连串的问题:硅谷银行为什么暴雷?第一共和银行暴雷与硅谷银行有什么关联?与最近几年美国对小银行的监管改革有关系么?与美联储最近一年快速加息的关系是什么?对全球金融市场会产生什么影响?读者在问问题互动的过程中会不断加深对特定问题的理解。当然这种互动一方面会训练GPT,另一方面也会将读者感兴趣的话题、读者的好问题整理传递到编辑室,推动“参与经济”的发展。
解构的同时也会有建构,建构全新的人机互动的场景。比如,可以让GPT仔细阅读一位KOL的作品,无论是文字、音频还是视频,然后形成定制化的数字分身。作为KOL的延伸,这个数字分身可以在虚拟世界与粉丝互动,在一定范围内替代KOL回答粉丝的问题。
前媒体时代,KOL通过著书立说成为有影响力的人。传媒时代,报纸、杂志、广播和电视的出现,让KOL有更多的载体和媒介去展示自己,也让更多人可以成为KOL。
进入数字经济时代,社交媒体成为KOL最重要的传播阵地。从博客(社区)到微博,从脸书到推特,再到最近播客(音频)和视频(长视频和短视频)的兴起,都为KOL提供了影响粉丝的新工具。这些平台和工具更加具有及时性和互动性,KOL通过不同载体展现自己的想法、价值观、个性和创造力。
当一个人的粉丝快速增长之后,与粉丝的互动、需要回答的问题也会呈现几何级的增长。生成式AI会把这种问题转换成为KOL的优势,进一步赋能。KOL的数字分身可以传达KOL的想法,同时搜集用户的问题和兴趣点。
对话将不仅会发生在数字分身和粉丝之间,也可能发生在数字分身之间,甚至穿越时空,构成一幅新时代“关公战秦琼”的场景。
对话能产生更多的互动价值,顺着这一思路延展,我们也可以创造出一系列全新的对话形式。其实无论是东方还是西方,语录体都是古代哲人记录思考最重要的方式,而语录体的根本就是对话,两个人哲人之间的对谈,或是弟子记录与老师沟通交流的文字。
训练有素的GPT可以做到清晰和深入地理解每一位重要作者的著作,梳理他们的观点,了解他们说话和写作的习惯和特点,知道他们生平中的主要事迹和各种奇闻逸事。在对这些数据梳理的基础上,我们可以做出每个历史上和现代的思想者的数字分身,然后让这些数字分身之间展开对谈。
在梳理历史的时候,我们经常会问某某两个同时代的人之间是否有交集,我们没有证据证明两人见面,但我们推测或许他们的人生曲线上有过碰撞,在他们的著作中留下了蛛丝马迹。在阅读的时候,我们也常常会引古人为挚友,相见恨晚,却无从进一步沟通交流。而不同时代的思想者的碰撞不仅会满足我们的好奇心,也可能碰撞出新的火花。
霍夫曼在《Impromptu》的最后篇章中已经开启了一些“关公战秦琼”式的跨越古今的对话,未来只可能会更精彩。
人机对话背后所展现的
人与机器的本质区别
从一系列人机对话的场景革命中不难看出人与机器的三大本质区别——
首先,人擅长问问题——人机对话的发起者通常是人类,而机器可以很好地把问题延展开。未来,对人而言,需要训练的是如何问出好问题,这就需要从小培养好奇心、创造力和质疑精神。
其次,生成式AI所基于的大语言模型依赖的是历史积累下来的大数据训练库,人与机器的区别在于人可以更快学习和探索新的技能,形成新的洞察。数据库是过去时,而人需要面向未来,拥抱未来,探索新知。机器替代不了探索、实验和发现,人要花更多时间和精力去探索和实验。
第三,相比机器,人有更强的行动力。人的优势是将想法和洞见付诸实践,这就需要培养判断力、沟通力和领导力。
在新书《5000天后的世界》中,凯文·凯利(KK)同样指出,人和机器最大的区别是人会不断提问。KK认为,不断提问必然会成为人类最基本也最有价值的行为之一。可以马上得到答案的问题应该扔给机器,人的价值在于在面对不知道答案的问题(未知的未知)时,可以不断思考,不断提问。学会提问题,问好问题,最切实的做法是质疑人们习以为常的事情,学会推翻常理进行思考。
我们也可以从解放生产力的角度来理解人和机器的区别,其实这是创意与效率的区别。未来,机器将去完成那些提升效率的事情,而人则会专注于创意这样多元而低效、很多时候充满不确定的事情。科学和创新这些很难标准化、需要不断寻求突破的活动,恰恰是效率低下的,也是需要充分发挥人的想象力的领域。
当然我们也不能忽略现阶段生成式AI带来的问题:一方面会出现大量平庸的产品,对原创的、高质量的创作产生冲击;另一方面则可能出现大量同质化的作品。改变这两点需要更有创意的人机互动,因为人仍然掌握着巨大的主动权。
霍夫曼提出了当下人机互动的两个信条:第一,将它视为在读大学阶段的研究助理,霍夫曼建议换位思考,想象一下大学生的状态,就能摆正自己与机器互动时的期待值,同时不断强调检验事实的重要性;其次,将自己定位为导演/指挥,把握方向,但给机器一定的延展空间,这样会不时遇到惊喜。
展望未来的姿势——
倾听科技,前瞻“二阶效应”
对于AI的高歌猛进,KK和霍夫曼都是乐观主义者。KK还据此创造出一个新词进托邦(Protopia)。他认为技术的正面效应与负面冲击分别占51%和49%,因此在5000天(超过13年)这样长时间尺度,根据复利原则,技术的正面效应仍然会带来持续不断的进步。我们所要做的是学会“倾听科技”,同时要努力对新技术带来的“二阶效应”做出预判。
科幻作家克拉克这样解读“二阶效应”,巨大变化发生之后,你很难预知它的影响会波及哪里。重大改变之后可能产生意想不到的场景,想象马车进化到汽车比较容易,但想象汽车大规模出现后的堵车则很难。
比如预测无人驾驶的未来,KK最担心人类驾驶员和机器抢夺道路上优势地位所带来的混乱。他畅想到了2040年,当人和机器同时在街上开车时可能是最为混乱的,因为道路的改变正在从人类驾驶员的视角转换到机器的视角,同时他也担心机器堵车时会出现死机、宕机,或者狂飙的场景。
GPT可能带来哪些“二阶效应”呢?霍夫曼在书中对此并没有开出巨大脑洞,他询问GPT怎么解决从新手到熟手的转变,换句话说,如果机器将取代大多数入门级的白领工作,年轻人又将如何积累经验?GPT的解答中规中矩:以咨询业为例,虽然机器会替代刚入行的分析师,但AI可以创建出更加真实的虚拟场景为年轻的分析师提供培训。
显然,GPT还没有能够理解什么是“二阶效应”,技术带来的真正深远的改变会在技术之外。以咨询业为例,如果其商业模式是依靠品牌价值,著名咨询公司的品牌积累了大量价值,这些公司还可以扮演“好念经的外来和尚”,技术可以让他们把工作做得更快更好,暂时不会颠覆他们的商业本质;但如果其商业模式是“合伙人打单,年轻的分析师996干活,赚取中间的工资差价”,那么机器的高效率就会带来彻底的颠覆。
面对变革,KK提出阿米什人评判科技的标准值得我们思考。作为定居在美国中西部德裔居民的后代,阿米什人以拒绝使用新科技、坚持传统农耕做法著称。但实际上,他们并不是完全拒绝新科技,他们衡量哪些科技可以使用基于两大标准:第一,新科技是否可以让生活变得更轻松,让他们有更多时间陪伴家人;第二他们以社区和社群作为整体,强调科技服务社区。
或许这也可以成为我们在人机对话的未来可以畅想的场景:如果可以让我们有更多时间陪伴家人,凝聚社区和社群的力量,机器就是美好的。
(作者为《经济学人·商论》执行总编辑)
微信扫码关注该文公众号作者