总编对话 | 世纪互联陈升:大模型时代“算粒”汇成强大算力
编者按:ChatGPT迅速破圈,国内外大模型争先恐后密集发布……有数据预测,人工智能所需的算力每100天将会翻一番,未来五年内全球算力将较现在增长超100万倍。目前,三大电信运营商和大型互联网民营企业承担了我国大部分的关键信息基础设施建设和运营工作。而AI驱动算力呈指数级增长,让业界不得不重新思考,现有的数字基础设施是否足以应对这样的增长速度。
今年年初,中关村超互联新基建产业创新联盟(以下简称“超互联联盟”)提出了凝聚民间力量、专注大模型的新算力网络概念。上述概念如何融入“东数西算”工程?主导者都有谁?新生态应遵循怎样的规则?近日,中国电子报总编辑胡春民与中关村超互联新基建产业创新联盟理事长、世纪互联创始人陈升就上述问题展开了深度对话。
算力产业进入新一轮发展周期
胡春民:人工智能时代,智能计算领域将迎来哪些机遇和挑战?
陈 升:如果说碳基文明的拐点是人类诞生了自然语言,那么今天数字世界的发展拐点则是迎来了ChatGPT这样的通用人工智能新时代。
最近,之江实验室、中国工程院、浙江大学等12个国内外研究机构和院校首次对智能计算领域进行了全面调研,涵盖了理论基础,以及智能与计算的技术融合、重要应用、挑战和未来前景,给出了这样一则数据:通用人工智能所需的算力每100天将会翻一番,也就是说,预计在未来5年内,算力增长将超过100万倍。这一需求的增长需要GPU芯片供应的不断增加、智能网络的持续升级,意味着现有的数字基础设施供给与大模型发展需求之间的矛盾将越发突出。
胡春民:算力产业会迎来新的发展周期吗?将有哪些特点?哪些变量影响着中国算力企业的全球竞争力?
陈 升:中国算力产业正进入新一轮发展周期,主要有两个变量将影响中国企业的全球竞争力。一是有关算力产业的国家顶层设计蓝图,包括“东数西算”工程、“数据二十条”和《数字中国建设整体布局规划》等政策陆续出台;二是通用人工智能让算力需求呈现爆发式增长。今年3月以来,百度、阿里巴巴、科大讯飞等越来越多的国内大型科技企业扎堆入局类ChatGPT项目。这些都极大地驱动了算力基础设施等新一代数字基建产业发展。算力基础设施已成为智能时代的核心竞争力和彰显数字强国的重要标志。
新算力基础设施建设要“微巨并存”
胡春民:国家正在大力推进“东数西算”的八大枢纽和十大集群建设,超互联联盟提出了基于代码、智能合约、社会力量主导的新算力网络概念,新算力网络如何与国家算力网络协调发展、错位互补?
陈 升:在基础设施层面,根据《数字中国建设整体布局规划》,到2025年,我国将基本形成横向打通、纵向贯通、协调有力的一体化推进格局,数字中国建设取得重要进展。
目前中国移动、中国电信、中国联通三大运营商,阿里巴巴、腾讯、华为等大型互联网民营企业,以及世纪互联等中立第三方数据中心服务商几乎承担了我国90%的数字基础设施建设和运营工作。如果没有ChatGPT引发的通用人工智能浪潮,那么今天的数字基础设施产业结构是比较合理的。
通用人工智能所需的算力每100天将翻一番,这样的增长让业界不得不重新思考,现有的数字基础设施是否足以应对这样的增长速度。
在美国航天产业中,既有NASA(美国国家航空航天局)这样的举国体制、“不计成本”实现目标的“国家队”,也有SpaceX(太空探索公司)、Blueorigin(蓝色起源)等激进式和颠覆性创新的“民间力量”。芯片产业是另一个可以借鉴的案例。该产业已经呈现出一个产业分工结构,包括设计、封装、测试细分领域,每年都会冒出许多颇具活力的创业公司,微巨并存、协同创新、和谐发展。
迎接通用人工智能时代的新算力产业同样也需要举国创新体制与民间力量的联合,形成“微巨并存”的立体式产业发展格局。今年1月,由科创型数字新基建龙头企业世纪互联发起的超互联联盟正式获批成立,旨在打造以民间力量主导的新算力网络基础设施,充分挖掘社会投资的潜力,与“央企国家队”相互补充,让算力网有机体“经络通畅”、健康发展。
具体来看,国家队的“战场”是国家主干基础设施,而民间中小企业的“战场”则是百城、千县、万镇、亿户家庭的支线基础设施。这是两个不同的“战场”,但不是对立的,也不是竞争关系,是相互协调、相互贯通的一体化推进格局。
胡春民:那么,民间力量是怎样参与算力基础设施建设的?
陈 升:超互联联盟推动社会投资和民间力量积极参与国家算力基础设施建设,致力于实现新算力产业的激进式创新。我们从芯片产业的“芯粒”(Chiplet)概念中获得灵感,提出了“算粒”(Computinglet)这个原创性概念。
“芯粒”是指将不同工艺制程、不同功能,甚至不同材质的Chiplet,如同搭积木一样,通过先进封装技术集成在一起,从而形成一个系统级芯片(SoC),以平衡芯片计算性能与研制成本。“算粒”也是类似,引入分布式概念,将算力最小化,分布于城市与乡村、社区与家庭,然后将无数异构、异属、异地的“算粒”聚合协同,与超大规模IDC实现“微巨互联”、共同构建通用人工智能时代的新算力基础设施,推动超互联新算力产业创新发展。
大模型时代“算粒”形成强大算力供给
胡春民:新算力网络的运行机制是什么?要达到怎样的效果?
陈 升:“算粒”新概念的提出,意味着传统算力产业的计算架构、基础设施投资模型、客户交付和调度交易模式等都要进行创新。
新算力将通过基于非对称密钥和分布式计算的通证经济激励机制,让现有行业、企业和终端用户侧的“算粒”资源自主参与“算力交易”,形成强大的算力供给。这是具有全民普惠特征的数字新基建,通过人人参与、人人建设、人人经营、人人拥有的方式构建和运行。
胡春民:如果这一新算力理论落地实施,将会用在哪些应用场景?要将异构“算粒”汇集成新算力,需要哪些核心的技术支撑?
陈 升:新算力基础设施首先专注于通用大模型训练及相关应用场景,特别是面向实体经济、新型电力系统、未来城市的大模型。
让异构算粒实现互联,需要在传统光纤宽带的基础上进一步升级,投资建设“城市计算总线”,并基于RDMA(远程直接数据存取)协议的成果,原创定义和开发全新一代RDPA(远程直接参数访问)协议。
以城市为核心以家庭为最小单元
胡春民:新算力理论目前有没有启动实验?有具体案例吗?
陈 升:超互联联盟积极参与国家发改委主导的“城市算力网”数字新市政工程。在“东数西算”的八大枢纽和十大集群的基础上,一方面,以城市为突破口,打造一批城市算力网;另一方面,强化国家级算力枢纽节点“蓄水池”功能,带动省域和区域性算力网横向延伸,助力实现“算力入户”“算力入企”“算力入园”“算力入校”,旨在形成全国一体、多级联动、融合创新、自主可控、具有新型举国创新体制特征的国家算力网体系。
今年2月,超互联联盟与郑州市人民政府、河南投资集团有限公司签署战略合作协议,共建超互联联盟(郑州)超级节点,助力郑州建设数字经济时代城市“新市政”。郑州处于“东数西算”八大算力枢纽节点的中心位置,联盟在郑州市高新区率先部署了超级节点,可以打造非枢纽节点省份参与算力网络建设的“郑州样板”。如果把八大枢纽、十大集群看成算力网络的“大动脉”,那我们的工程就是“毛细血管”。
机遇总是伴随着挑战,创新就要承担风险。超互联联盟提出的新算力网络概念,就是民间“敢原创”、社会投资独立承担风险的创新实践。
胡春民:在你描绘的未来网络信息空间中,哪些机构和个人能成为“新一代数字原住民”?他们有哪些义务和权利?应遵循怎样的规则?
陈 升:未来,新算力基础设施将以城市算粒(Citylet)为核心,上通八大枢纽、十大集群的国家级算力节点,下接小算力节点——家庭算粒(Familylet)。在新算力基础设施形成的新生态中,软件部署和硬件产权将走向完全的解耦分离,改变软件总是服从于硬件(最终服从于硬件所有者)的传统模式。
技术的进步需要群体的智慧,开源世界运营这么多年来,靠的就是越来越多的开发者参与进来,共同探索,并不断完善规则。人工智能的发展也是如此,需要开放给更多主体,共同监督和矫正大模型的答案。
“家庭算粒”参与大模型训练中最重要的强化学习方法(RLHF),可以实现人机协同。家庭是新技术应用的重要载体,通过消费端的持续反馈,可以有效促进供给端持续改进。大模型发展的风险防范,需要全社会共同参与。家庭是社会的细胞,是社会的基本单元,也将是算粒的重要载体和数字基础设施最后百米的关键节点,建设好这个节点,可以有效地化解人工智能不确定性风险,分担技术探索的压力,让大模型规避更多发展风险、不断平稳迭代演进,让算力产业健康发展。
胡春民:你怎样描绘未来的算力产业?
陈 升:2022年三大电信运营商产业数字化营收规模在4000亿元左右,大模型时代,央企算力网络基础设施的“大动脉”与民间力量的新算力基础设施“毛细血管”协同创新,整个算力产业规模预计将达到三大运营商产业数字化现有营收规模的10倍以上,即4万亿元。我坚信,在年营收规模超过4万亿元的新算力产业中,将会诞生大量多姿多彩、“专精特新”、小而美的民营数字基建科创企业集群。
编辑丨刘晶
美编丨马利亚
微信扫码关注该文公众号作者