安筱鹏:AI大模型技术的五个特征及五大启示
本文根据5月30号安筱鹏博士在北京AI论坛上的发言整理。
来源 | 安筱鹏
从IT时代、互联网+时代迈向智能时代
ChatGPT两个月内用户超过1亿,四个月用户超过10亿,成为历史上增长最快的互联网应用产品。
GPT-4的功能在GPT-3.5的基础上进一步迭代,实现了4个跨越:从“文本理解”到“图像理解”,从“普通生”到“尖子生”,从“文科生”到“理科生”,从“对话理解”到“全文理解”,从“意图理解”到“创意实现”。
ChatGPT开启了一个新时代:从IOE主导的IT时代,到计算机及智能移动终端普及驱动人类迈向互联网+时代,到今天万物互联、万物智能及AI大模型开创的智能时代。
智能算力的扩张是开启智能时代的风向标。5月25日英伟达市值暴涨2000亿美元,涨出一个AMD、两个英特尔。10年前英伟达市值相当于英特尔的1/6,今天相当于英特尔8倍,10年收益率超过100倍。5月30日英伟达市值超过1万亿美元。
新一轮AI技术所产生的革命性影响是有目共睹的,正如5月3日AI教父级人物杰弗里·辛顿(Geoffrey Hinton)从谷歌离职后所表达的核心观点:“AI的崛起对人类的生存构成了威胁,与核武器的使用不相上下”。5月16日OpenAI公司董事长Sam Altman在出席美国国会听证会时说,对待AI应该参考核武器的监管方式。
AI大模型技术的五个特征
从技术变革的历史和产业演进的全局视角来看,AI大模型技术有五个特征:
一是颠覆性:AI大模型具有颠覆性技术的潜质。GPT4编码能力已相当于谷歌年薪18万美元L3工程师;GPT4相当于中国月薪3万元的软件开发人员。未来,50%的软件代码将会被AI接管。今天的AI大模型像历史上的火药,正在从放烟花时代走向枪炮时代,实现从冷兵器到热兵器的跨越。
二是涌现性:模型参数超过临界值,人工智能能力会实现突变。
三是工程化:AI大模型一半是工程、一半是理论,AI大模型是工程化的重大创新,其核心技术壁垒是数据、算法、算力等要素资源的精巧组合。OpenAI不只是一群科学家,更是一群动手能力极强的工程师。
四是密集型:AI大模型是技术、资本、人才密集型产业。大算力、大数据、大模型决定了AI大模型竞争,这是一场大国的游戏、巨人的战场、工具的革命、生态进化的力量。
五是通用性:通用目的技术(GPT)是对人类经济社会产生巨大、深远而广泛影响的革命性技术,如轮子、印刷、内燃机、电力、计算机、互联网等。AGI可能是人类历史上最伟大的通用目的技术,是人类社会第25个通用目的技术。
这一轮的人工智能的突破,对于一个国家的数字技术创新有哪些启示?我认为有五个方面。
云计算不仅仅是一个商业的基础设施,更重要的是,它是一个创新的基础设施。
前一段时间,有人会问“为什么中国没有ChatGPT? ”我说要想真正找到答案,这个问题问错了,正确的提问姿势是“中国为什么没有OpenAI?中国为什么没有Snowflake? 中国为什么没有Palantir?”
OpenAI于2015成立,估值290亿美元。因为ChatGPT,人们都了解了这家公司。但美国类似的数字科技公司还有许多。
Snowflake是巴菲特50年来首次参加IPO的公司,2020年上市的时候,销售额只有3.5亿美元,但市值超过了700亿美元。它只做了一件事,就是把数据库这件事情在公共云上重新做了一遍。
帕兰迪尔(Palantir)是一家美国大公司数据,2004年成立,市值400亿美元。2023年1月《华盛顿邮报》有一篇文章说“俄乌冲突已演变为“算法之战”,算法公司已经成为一个新的军火商。帕兰迪尔 CEO说,战场算法的威力,相当于战术武器对付常规武器。
当ChatGPT成为聚光灯的焦点,需要关注美国数字创新生态
美国不仅有OpenAI、Snowflake、帕兰迪尔(Palantir),还有许多类似的创新公司,美国有100亿美元到1000亿美元的公司有几十家。市值加起来大概有2万亿美元,中国类似的创新公司市值在1000亿美元左右。
这些公司的规模可能还比较小,不能和微软、谷歌、亚马逊比,但他们可能是未来的微软、谷歌、亚马逊,成为引领和参与全球竞争主力军。
今天,我们把所有的聚光灯都聚焦在ChatGPT上。在我看来,ChatGPT只是美国创新森林里的一棵树上的两片叶子,今天我们把所有的聚光灯都聚焦在这片叶子上,把这片叶子都快烤黄了。我们需要思考的是:这棵树是什么样子?树根长成了什么样子?它有什么样的土壤?创新的森林生态是什么样子?只有我们把这片森林、这片土壤、这片树的规律都搞清楚了,我们才能找到这一轮数字技术创新的底层逻辑和规律。只有这样,我们政策才有针对性、前瞻性和可操作性。
为什么美国会有这么多数字创新企业?原因有很多,但在我看来,最重要的原因是美国有一个创新的基础设施,这个基础设施叫做公共云。今天人们更多认为公共云是一个商业基础,事实上,公共云是一个创新的基础设施,它在源源不断的孵化、孕育、催生一批创新的企业。
公共云是自由流动的大江大海,私有云是封闭孤立的小湖小泊
云计算是当下AI、软件、通信、大数据、芯片乃至自动化等新一代技术融合创新的大熔炉,是今天所有数字技术和自动化领域企业必须攻占的山头和技术形态演进的终极归宿,云计算是数字时代最重要的基础设施,中美在这一领域的差距巨大,并仍在扩大。中国的GDP 相当于美国的70%,但中国云产业只有美国的30%。中国的SaaS市场规模不到50亿,美国有1000亿。
更重要的是,今天我们都在讲“算力”,脱离大规模应用场景和需求、孤立讲“算力”会遮蔽我们对本质问题的理解,会误导我们对中美差距的认知。只讲“算力”基础设施,就像我们只讲“公路”基础设施一样,只讲一个国家的公路里程是几万公里是不够的,人们需要知道高速公里、一级公路、二级公路、乡村小道是多长;就像我们只讲“铁路”基础设施一样,人们需要知道350公里的高铁、60公里的绿皮车有多少公里。
公有云不仅有更高的算力资源输出和运行效率,更重要的是,它是第二次大航海时代的土地,是孕育新技术、新企业的摇篮。公有云对CPU的使用效率,大概可以相当于私有云的5-10倍。公共云是“350公里的高铁”、“高速公路”,私有云是“60公里的绿皮车”、“二级公路和乡间小道”。我们不仅要关注算力规模,还要关注算力以什么样的方式提供服务的。今天美国的算力有60%是以公有云的方式来提供,欧盟是50%,而中国只有28%。
有人说,我们家财大气粗,并不在乎算力的输出效率,不在乎资源利用效率,算力是“350公里的高铁”或是“60公里的绿皮车”并不重要,这对于一个单一企业也许是对的,但这种模式将国家统一算力市场碎片化,肢解了整个国家数字创新生态,遏制了数字技术创新步伐,削弱了国家数字生产力提升。
如果说公共云是自由流动的大江大海,那么私有云就是封闭孤立的小湖小泊。只有在一个庞大的公有云体系上,在“大江大海”这样有深度、有广度的水域中,才能够孵化出新的技术和新的企业,比如OpenAI、Snowflake、帕兰迪尔(Palantir)。即使中国有Snowflake公司的技术能力,这样的公司市值也非常有限,能整合的创新资源是有限的,因为“私有云”就是封闭孤立的小湖小泊,无法孕育Snowflake这样的鲨鱼、鲸鱼。
这个问题背后的核心是,我们要认识到这一轮的创新是“公有云+AI”技术体系的创新,公有云是一个创新的基础设施。技术创新生态在人类历史上从没有像今天这样如此重要。今天,新一轮大国竞争,很大程度上体现为各类技术平台及其生态系统所承载的创新体系之间的竞争。
这一轮的人工智能,对我们所有的从事创新事业的人来说,都要重新思考一个基本问题:什么叫做基础研究、什么叫做应用研究?基础研究跟应用研究之间是一个什么关系?当我们讲到这一轮的AGI,讲到AI大模型的时候,我们在思考一个问题:今天AI大模型的基础理论来自于哪里?
企业是AI大模型理论+工程化的主力军
1972年,美国工程院院士贾里尼克(Frederek Jelinek),在IBM 沃森实验室(IBM T.G.Watson Labs),领导了语音识别实验室,聚集了当年全球一批最优秀的科学家,提出了基于统计的语音识别的框架,这可能是我们今天讲的AI大模型的重要理论创新之一、源头之一。
今天讲的Transformer理论模型也是来自于谷歌这样的公司。今天我们看到有一些科研院所也在参与,但是主流的工程化模型主要还是来自于企业。企业不仅AI是产业化、工程化的主力军,也是基础理论创新的主力军。
伴随着AI大模型研究兴起、门槛提升,大学和研究所的主导作用不断弱化。在数字技术创新的特定领域,当企业成为发明-发现的主力军时,需要思考什么是“科技转化”?为什么要“科技转化”。
在新一轮AI创新体系,谷歌、Meta等这些科技企业,本身不需要去做传统的“科技转化”,因为在这些公司里,基础研究、应用研究和产品开发是一个有机的整体,是一个不断迭代的一个过程。
大型科技企业是基础研究的生力军,并具备孵化世界先进水平的潜力,而且无需“转化”。在云计算、人工智能、大数据、区块链等前沿数字技术领域,大型科技企业已经是数字科技创新的核心力量。
反思“基础研究-应用研究”二元分割认知
在数字时代,创新体系已经发生了变化。2021年5月,美国参议院通过了《无尽前沿法案》,这个法案的源头是1945年“曼哈顿工程”主管范内瓦·布什,他给时任总统罗斯福写一个报告《科学:无尽的前沿》。这份报告强调要将“基础研究”和“应用研究”分裂开来,强调“基础研究”的重要性。
这份报告直接促成了美国国家科学基金的建立,“基础-应用”这种二分框架,更是直接影响了二战后美国的科研项目设置和资助结构体系。此后“基础研究—应用研究—产品开发”成为全球科研的基本模式(“线性模式”)。
但实事上,这种观点和模式在误导我们对技术创新规律的认识。《发明与发现:反思无尽的前沿》认为,“基础研究”是为了发现新知识、揭示新客观规律;“应用研究”侧重于解决实际问题。基础研究(科学发现)依赖大学和研究所,应用研究(技术发明)依赖企业。这种传统分类观,违背了研究活动的客观规律,阻碍了国家的科学与技术进步。我们不断要追问,数字技术创新,谁是基础研究的主力军?
企业也是基础研究的生力军
科研工作者并不会天然地关注自己的工作是属于“基础研究”还是“应用研究”。“基础-应用”的二分法是基于政府科技管理的逻辑,而不是技术创新本身的规律。然而脱胎于“基础-应用”二分框架下的科技政策资助体系,迫使科研人员不得不按照政策的要求去组织自己的研究,这种二元分割,实质上是给研究工作戴上了“镣铐”,也导致“基础研究”与“工程应用”长期存在“两张皮”问题。
从信息和通信技术创新来看,双极型晶体管和晶体管效应、微波激射,半导体产业相关的量子霍尔效应、集成电路的发明和光纤技术的研发,既可能是发现,也可能是发明,这些研究本身可时同时归为“基础研究”和“应用研究”。
诺贝尔奖作为基础理论研究的标志,许多获奖者来自美国企业实验室。美国贝尔实验室就发明了晶体管、激光技术、电荷耦合器(CCD)、UNIX 操作系统、数字交换机、卫星通信等基础技术,贝尔实验室、IBM、GE、RCA等,不仅是新技术的摇篮,更在隧穿效应、核磁共震等理论研究方面取得重大突破,发明与发现是一枚就硬币的两面。
技术创新的规律是“发明-发现循环模式”,理论研究与实际应用、发明与发现之间是互相依存的关系。科学、技术与工程是平行发展的,并无绝对先后。基础研究和应用研究并不是一个线性的、分阶段的过程,而是一个螺旋式上升的过程。
平台型技术创新体系改变了“基础-应用”二元分割
谷歌的Transformer、OpenAI的GPT引发的新一轮人工智能创新,让我们重新审视基础研究与应用研究的有关系。在“基础研究—应用研究—产品开发”的线性科研模型,中国补充了“成果转化”的环节。“成果转化”不是技术发展的内在规律。
技术创新的“发明-发现循环模式”在平台型创新生态中更为突出。平台型技术创新体系基于数字技术平台,面向海量创新需求进行精准感知和洞察,通过对全球创新资源的广泛连接、高效匹配和动态优化,构建起多主体协作、多资源汇集、多机制联动的创新生态,进而形成新技术、新产品、新业态快速孵化、规模扩散、持续迭代的新创新体系。
今天数字科技企业是科技创新的主力军,也是基础研究的生力军,无所谓“科技成果转化”。这些企业精准感知市场需求和场景,基于数亿消费者、千万企业用户构建一个即时、在线、低门槛的新技术扩用市场,并推动构建一个创新生态。2021年中国研发投入规模前3强都是数字企业,研发投入规模相当于央企的3-5倍。
今天,OpenAI、Snowflake、帕兰迪尔(Palantir)等企业的产品创新,都是平台创新生态的结果。ChatGPT用户4个月超过10亿,每一个ChatGPT调用者既是用户,也是产品功能创新迭代的参与者。ChatGPT通过WEB、搜索、插件、API等多各种方式,改造驱动各类软件形态,并在全球大规模、快速普及推广,不到半年时间已积累了上万个应用交互。
ChatGPT通过自然语言交互,连接到第三方应用程序,运行计算,或使用其他服务,让开发者和用户自由地创建、发布和使用各种插件,功能覆盖实时信息检索、在线点餐、企业办公、流程优化、图文处理、知识问答、产品营销和推荐、行业垂直应用等领域,从而形成一个生态系统。
AI大模型的成功关键在于模型训练与商业化的闭环,形成技术与产业化的相互促进与迭代。
ChatGPT让我们去思考颠覆式创新企业具备什么样的特质。OpenAI的成功,在于它坚持了长期主义,有创新型的风险投资,小公司创新与大公司合作形成的商业闭环。
以OpenAI首席科学家Ilya Sutskever为代表的研发人员,具有什么样的特质呢?他们拥有一批技术天才+使命感+偏执狂的领军者;他们极强的技术信仰、方向感和战略定力定力,坚信通过大模型,通过大算力的这样的方式,一定能够找到AGI的发展道路和模式;他们有自己的一套完整的方法论和文化,他们不是把AI当成一种技术,而是要做成一种产品,AI产品化是他们的极致追求。
当面临困难、遇到挑战的时候,他们不为所动。2018、2019年当时GPT-1、GPT-2的测试效果,被谷歌Bert碾压式的超越时,他们没有对自己的技术路线丧失信心,坚定自己的技术路么,直到GPT3实现对谷歌的超越。
ChatGPT给我们的启示是:技术的差距只是一种表象,今天全球的技术创新、企业竞争的背后,是创新文化的差距、创新生态的差距、创新机制的差距。
从创新文化差距看:颠覆式创新需要质疑“技术权威”的文化,需要有不考虑短期商业变现的长期主义的科研投入,需要宽容的基础科研孵化与评价机制。
从创新生态差距看:我们说云计算是数字时代的一个创新基础设施,那么我们有没有真正地把云计算、把公共云作为千行百业创新的“底座”,并结合芯片、模型、风投、人才、场景等构建一个创新生态,这才是未来竞争关键。
从创新机制差距看:体现风险投资机制的迭代,AI大模型技术与商业的闭环,以的监管与创新的协同机制等等。
如果我们把时间尺度拉长,回顾人工智能创新道路上的重要里程碑,可以看到科学家和风险投资人创新的原动力。
2016年AlphaGo击败围棋世界冠军李世石,当年研发AlphaGo的Deepmind那批人,他们成立公司时候就怀揣一个梦想:就是实现通用人工智能(AGI)。
今天OpenAI的这批人,为什么能够聚集那么多的科学家?这些科学家中,很多人放弃了多出两倍、三倍的年薪,愿意加入到OpenAI,因为他们也怀揣AGI的梦想。
彼得·蒂尔(Peter Thiel)是DeepMind、OpenAI和Palantir的投资人,当年这些公司非常艰难、一直亏损的时候,他为什么愿意去投资?2011年彼得·蒂尔投资了DeepMind公司140万英镑,2014年被谷歌收购,但直到今天DeepMind仍然亏损。2015年彼得·蒂尔和马斯克、Sam Altman共同成立了OpenAI。
彼得·蒂尔等这批投资人,他们也有一个梦想,这个梦想就是对AGI的梦想,就像彼得·蒂尔在2009年所说的“对未来最大的恐惧不是‘机器人起义’,而是担心‘奇点’会拖得太久才到来,而世界需要新技术来抵御经济衰退”。
GPU的坎坷人生:从丫鬟到大小姐的成长之路
这一轮的人工智能浪潮,处于时代浪尖上的除了OpenAI,还有“GPU霸主”英伟达。但回望过去,GPU的成长道路并非顺风顺水,而是充满坎坷。
20世纪80年代个人计算机出现后,显示使用的是VGA控制器,将CPU的图像处理信号处理后输送到显示器。这个时候,CPU是“大小姐”,显示处理器只是端茶倒水的“丫鬟”。
英伟达1999年成立后,先是研发了真正意义上的GPU,2007年又推出了CUDA(Compute Unified Architecture,统一计算设备架构),实现直接用GPU编写并行程序,降低了开发成本和门槛,为后续的GPU生态建设奠定了坚实根基,也构建了足够宽的“护城河”。
2009年斯坦福大学吴恩达等人的论文发现,GPU凭借超过CPU 70倍的算力,将AI训练时间从几周缩短到了几小时。
2012年多伦多大学的Alex Krizhevsky和Ilya Sutskeverz用两张GTX 580显卡,AlexNet 顺利夺冠。GPU从此成为深度学习的必选项,并进入工业界。
此后推出的A100、H100等高性能GPU,成为AI大模型时代的“刚需品”,更是直接助推英伟达突破万亿市值。一路走来,从“丫鬟”到“小姐”成长的背后,我们能看到长期投入、坚持创新的力量。
最后一个启示是,我们已经到了一个新的时代,我们认识和改造世界的方法论发生了巨大的变化。人类社会认识客观世界的方法论已经历了四个阶段:
从牛顿、爱因斯坦的“理论推理阶段”,人们通过观察、抽象和数学认识这个世界;到爱迪生在一百多年前发明电灯泡,这是一个“实验验证阶段”,通过假设、实验、归纳总结来认识这个世界;然后再到了80年代进入到“模拟择优阶段”,大飞机的研发,高铁的研发,基于样本数据和机理模型,通过数字仿真的方式去认识和改造这个世界。
到今天,以人工智能为代表的大数据分析形成一种新的范式。如果说模拟择优是基于对机理模型的认知,那么今天对于大数据分析来说,很多的模型,我们其实搞不清楚为它什么会有涌现,为什么会有泛化。虽然我们还不能完全搞清楚,但可以肯定的是,新的认识和改造世界的方法论已经出现。
AI已成为重要的科研手段。近年来,AI4S(AI for Science)成为一种基本科学研究方法。1972年的诺贝尔奖获得者美国生物化学家Christian Anfinsen说:有一天,仅仅根据其氨基酸序列就可以预测任何蛋白质的3D结构。
过去几十年间,结构生物学家通过X射线晶体图学或者冷冻电镜等高科技手段,共得到十几万种蛋白质结构。今天,人工智能(AI)驱动的软件可以产生出成千上万种精确的蛋白质结构,可以帮助研究人员发现疾病的发病机制,研发新药,甚至改造出更耐旱的植物。2022年7月28日,DeepMind公布了从细菌到人类的几乎所有已知(2亿多个)蛋白质的可能结构。
Google学术相关数据表明,近3年使用AI的论文数量增长率超3倍。像材料科学、生命科学、能源科学,近3年使用AI手段开展科研的比例超过34.5%。换句话说,人们认识和改造世界的方法论已经发生了重大变化。
这一轮的人工智能,对我们意味着什么?
第一,初心回归:技术是为了什么?是为了人的解放和全面发展。数字化就是为了人的解放和全面发展。马克思在一百多年前曾经说过,共产主义是什么呢?是上午去打鱼,下午去打猎,晚上思考哲学问题。这样的时代,随着技术的发展将会到来。
第二,竞争力重构:当通用目的技术大规模普及的时候,当技术可以替代更多体力和脑力劳动者的时候,什么是企业和个人的竞争力呢?想象力会成为第一生产力。
第三,AI鸿沟:今天,有人开着奥迪车,有人开着奥拓。未来,我们所有的APP里边都会装着一个叫大模型的引擎,这个大模型引擎有奥迪级的引擎,有奥拓级的引擎。这种差异会带来新的AI技术能力差异和鸿沟。
第四,企业选择:对于一个企业来说,有两种选择,成为颠覆者或者成为被颠覆者。
微信扫码关注该文公众号作者