四个参数创生一头大象,对人工智能有何启示?
希望在人造机器上发展出超越纯运算层次的人工智能,是上世纪开始出现的概念,到五十年代也有了“人工智能”名词。近百年来,这个领域确实发展出不同层次的所谓“智能”,一些已经用在不同的生活或技术领域,但是什么样水准的“人工智能”才达到仿人智力的能力,一直引起争论。近期建立在大语言模型上的ChatGPT,由于能模仿人类对话,在多种不同形式沟通中展现某种“智能”,造成社会相当大的冲击。
人工智能发展牵涉许多计算机运算,历多年发展而累成,一般人自难窥其详,简单说来,就是以电子结构模仿人类脑神经结构,这些专家的思维,当下的人工智能系统类似于人脑中的结构,是由电子软件的人造神经网络建构起来。这些人工智能系统规模庞大,譬如2020年发表的GPT-3,电子神经网络连结就用了一千七百五十亿个参数,数以千计的特殊晶片,需要数周时间进行智能学习,仔细探究数以千亿的字句内容,花费至少在四百六十万美元之谱。
为了扩大学习内容,新人工智能系统发展的趋向,就是追求更大的规模,譬如今年3月发表的GPT-4,用的参数是GPT-3的六倍,大概有一兆个之多, GPT-4的开发公司声称花了一亿美元。研究人工智能发展趋势的公司估计,训练最先进形式人工智能的运算能力,六到十个月就要加倍。如果按这个趋势继续发展新款人工智能,三年后用于训练运算能力的费用将超过十亿美元。
人工智能“大就是美”的发展方向,满足的是对于炫奇智能效果的市场需索,与当下网络文化的盲目从众大趋势是一丘之貉,但学习过多所谓的“知识”内容,造就出功能价值失衡的人工智能,并不符合驱动人工智能发展背后的利益至上原则,因此当下人工智能开发者已经改弦更张,从过去追求愈大愈好,转为更有效能,也就是使用更少参数,训练智能具有更多的“知识”内容。2022年DeepMind公司研究者,只利用七百亿参数训练一个大语言模型,认知了一兆四千亿的语料库,这个人工智能已超越利用一千七百五十亿参数认知三千亿语料库的GPT-3。
当然目前不计其数的人工智能技术专家,都在绞尽脑汁想设计利用更少参数,认知更多“知识”内容的新型人工智能,其方法包括更好的运算结构,更简易的电脑沟通咒语,甚至开发自我人工智能系统专用硬体晶片,这其中充满无可预期的技术挑战,同时也蕴藏无可衡量的市场价值,活端端就是新世代高科技资本主义市场的一棵新摇钱树。
这个在电脑算则中利用参数来完成许多虚拟作为的技术,其实早已经在不计其数的现代科学运算、工程模拟、统计预测计算中,上天入地地渗透入我们如何认知物质宇宙世界,支撑着我们对于现代工程文明可靠性的信心,甚至引领我们去预测一些其实在我们认知能力之外的现象;由物质生命的本质,到环境生态的承受限度,甚至直究无垠宇宙结构的奥秘。我们倚恃着过往少数参数带来的信心,成为一种由无垠大计算所赋予无限能力的“超人智能生物”。
在物理科学上关于参数的应用,有一个传述较广的故事。主角是上期文章中提到的戴森(Freeman Dyson)(见往期文章:科学的探索与诗意,丰富了人的生命)。
戴森在爱因斯坦晚年停伫的普林斯顿高等研究院超过六十年,跨足理论物理和数学领域,俱成就过人,在美国学术界深受推崇,一般认为他应该与费曼等叁人共享1965年的诺贝尔奖,另外他常年在文化知识领域发表深刻论述,也让他成为美国少数足堪称为“文艺复兴人”的全才人物。2004年戴森在英国科学期刊《自然》上写了一篇短文“与费米的一次会面”,谈的正是参数问题。
留心二十世纪物理科学的人都会知道,费米(Enrico Fermi)是二十世界贡献卓越的大物理学家,他的学生之一杨振宁说,“费米是最后一个既能深刻了解实验,也能深刻了解理论的物理学家。”戴森在短文中说起他上世纪五十年代,在康奈尔大学带学生做介子-质子散射的理论计算,以便能与费米在芝加哥大学利用质子回旋加速器做出的头一个介子散射精确测量实验,进行比对。
当时探究质子的强作用力还没有完备的理论,戴森先用探究电子与光子的量子电动力学做计算,发觉实验与理论非常一致。于是1953年他们就利用当时探究强作用力的赝标量介子理论,来做介子-质子散射计算,发现结果与费米的测量高度吻合。因此约好时间,到芝加哥大学与费米见面。
费米对戴森的那项理论工作评价不高,他说做理论物理计算有两个方法,一是计算要有清楚的物理图像,另一是有准确自洽的数学结构。费米认为戴森用的赝标量介子理论,两者均缺。
戴森再强调他们理论计算与实验的高度吻合,费米问他,在计算时用了几个参数,戴森说四个。费米说,他记得他朋友冯·诺依曼常说,如果你给我四个参数,我可以创生一头大象,给我五个参数,我可以让它的鼻子摆动。
戴森说他虽然失望,但是那个工作的计算做的很好,学生也需要论文发表,后来还是写成论文发表在一流物理期刊《物理评论》上。戴森说,虽然费米在次年过世,没有看到强作用理论后来的发展,但是他的物理直觉让他看清问题的本质,也让戴森与他的学生没有误入绝途。
费米最好的学生杨振宁也说,主导二十世纪粒子物理发展的标准模型不可能是终极理论,因为它包含了几十个参数。
戴森和杨振宁谈论的是参数在理论物理中的运用,但是对于神迷于由万千参数所塑成“人工智能”真实先进世界的想望,依然有着深远的启示意义。
江才健,资深科学记者,著有《规范与对称之美——杨振宁传》、《吴健雄——物理科学的第一夫人》。
注:本文原标题为“人工智能与关于参数的那些事”,首发于2023年8月出版的《经典》杂志,《赛先生》获作者授权转载。
微信扫码关注该文公众号作者