行业观察|“新型计算体系”,阿里云加码新底盘
新型计算体系,深层逻辑是降低计算成本,提升计算效率,进一步提升云计算的覆盖率
文 | 吴俊宇
编辑 | 谢丽容
11月3日,阿里云在年度云栖大会公布了自研算力体系新进展。
阿里云总裁张建锋宣布称,阿里云在2021年10月公布的自研CPU倚天710已经在数据中心大规模部署,成为中国首个云上大规模应用的自研CPU。搭载倚天710实例单位算力性价比可提升30%,功耗降低60%。未来两年,阿里云20%的新增算力将使用自研芯片替代。
另一个有关阿里云的重要信息也在当天被释放——核心软件产品全面Serverless(无服务器)化。目前,阿里云已经拥有超过20款Serverless产品,包括函数计算FC、Serverless应用引擎SAE、Serverless容器服务ASK、PolarDB数据库和AnalyticDB数仓等。有了这个系列的产品,云计算服务将变得更像“水电”使用方式,按计算调用次数付费。
从技术角度看,在硬件端定制芯片可以提高计算性能、降低计算成本。在软件端Serverless化可以降低客户使用门槛,扩大云计算的普及率。Serverless还会诞生更多PaaS服务,帮助阿里云提升毛利率。上述举措,可以让云的规模、成本、利润模型变得更经济。
阿里云目前是国内收入规模最大的云厂商,2022财年(自然年为2021年4月-2022年3月)营收746亿元。阿里财报显示,若计入阿里巴巴集团自营业务(如淘宝、天猫等)贡献,2021财年营收为1001亿元。从利润规模来看,阿里云2021财年经调整后的EBITA为11.4亿元,EBITA利润率为1.5%,是目前国内唯一盈利的云厂商。
阿里云为何会在当下提出构建“新型计算体系”?
张建锋对包括笔者在内的媒体解释,中国云市场过去几年通过“做项目”的方式扩大了营收。但这与云厂商的技术方向、运营成本不匹配。因此,阿里云今年确定了“Back to Basic”战略。也就是明确云计算服务商定位,做好平台和生态,回归云计算技术本质。
构建新型计算体系,是“Back to Basic”战略的延续。逻辑是降低计算成本、提升计算效率、扩大云计算的覆盖率。
构建新型计算体系带来了三方面变化。硬件方面,云重构IT硬件体系,数据中心、芯片、服务器等产业链在变革;软件方面,适应Serverless、低代码、AI大模型开源等趋势,大幅提升软件生产效率;云端方面,云和终端加速融合,VR设备、云电脑等更多新终端设备需要采用算力。
重塑硬件
云计算技术正在进入下一代技术架构突破期。2020年之后亚马逊AWS、微软Azure、谷歌云这类头部云厂商正在加速改造云计算基础设施,寻找更适合云计算架构的硬件。通用做法是,整合集群架构、改善算法与管理软件、定制芯片和硬件等。
这种做法的商业价值是提升计算性能,降低芯片、能耗等计算成本,进一步扩大毛利空间。
阿里云也采取了类似的做法。阿里云2020年后一直沿着“做深基础、做厚中台、做强生态、做好服务”的战略前行。“做深基础”的内涵是,做深云底座。以飞天操作系统向下延伸,定制芯片、数据库、路由器、交换机等硬件,基于阿里云的特点构建云基础设施。
近两年,阿里云的定制能力深入到了硬件底层。主要动作包括,落地倚天710服务器芯片,推出CIPU(Cloud Infrastructure Processing Units 数据中心专用处理器)。
自研芯片、服务器的价值在于,配套更适合云计算场景的硬件设备。
以倚天710为例,该芯片基于5nm工艺制造,内含128核CPU。张建锋解释,芯片研发、生产、使用,通常需要三四年。阿里云的倚天710上述流程只花了两年。为了性能持续优化,阿里云还要持续迭代新的倚天服务器芯片。
据了解,搭载倚天710的实例单位算力性价比可提升30%,功耗降低60%。未来两年,阿里云20%的新增算力将使用自研芯片替代。
过去云厂商服务器通常搭载的是x86架构芯片。不过,x86芯片诞生于传统IT阶段,并非完全基于云上负载设计。它的特点是单核性能强、兼容性好,安全计算能力高。但单核在云的弹性计算情况下性能损耗大,功耗、发热也相对更大。
因此,主流云厂商如亚马逊AWS、微软Azure、谷歌云以及阿里云都在自研基于ARM架构的芯片。ARM芯片虽然单核性能低于x86芯片,但通常具有体积小、能效比强,发热量低,且价格相对低廉的特点。ARM芯片核心数更多的特点也更符合云计算大规模、多线程、高并发的弹性计算需求。
以亚马逊为例,2018年亚马逊AWS开始使用基于ARM架构的自研服务器芯片Graviton。到2021年,Graviton芯片已经发展到第三代,该芯片可让计算成本降低20%-40%。根据某海外专业媒体的一个统计数据,亚马逊自研Graviton算力在2021年营收50亿美元。当年AWS全年营收622亿美元,也就是说,自研Graviton算力占AWS全年收入约9%。不过,上述收入数据未得到亚马逊方面的确认。
微软今年4月开始,也开始采用芯片厂商Ampere设计的Altra芯片服务器,该芯片基于ARM架构。微软方面称,该芯片与传统的通用x86芯片相比,每美元性能可提高50%。
倚天710芯片同样基于ARM架构,有128个核心,更适应云计算需求,容易发挥最佳性能。阿里云云原生应用平台负责人丁宇对笔者解释,倚天710在细分场景上性能提升可观,如音视频场景可以提升80%,数据库可提升30%,AI推理可提升70%。自研服务器芯片可以理解成为是投资,可提升阿里云的综合竞争力。
张建锋向笔者表示,50%的性能提升可以带来20%利润空间。自研服务器芯片既可以为阿里云创造更高的毛利,也可以为客户带来更低的用云成本。
今年4月阿里云发布了一款自研的云数据中心专用处理器,这款处理器被称为CIPU(Cloud Infrastructure Processing Units 数据中心专用处理器)。CIPU相对轻量级,并不是公众熟知的通用计算类芯片,而是专用于云计算数据中心的管控,可以综合调度CPU(Central Processing Unit,中央处理器)、GPU(Graphics Processing Unit ,图形处理器)、存储硬盘、交换机等硬件。
按照阿里云方面的说法,管理阿里云的飞天操作系统和CIPU组合后,可将云基础设施性能提升20%以上。
重构软件
构建“新型计算体系”在软件层面包括Serverless、低代码、AI大模型开源等一系列方式。
其中,Serverless、低代码的价值是提升云计算覆盖率,降低云计算的使用门槛、成本。AI大模型开源的价值是开拓需要大规模使用算力的新行业。
国内云计算技术目前使用率最高的仍是互联网行业。事实上,阿里云过去几年的高速增长也依赖于互联网行业的高速增长。降低云计算的使用门槛、成本的最佳方式是重构软件开发的方式和流程。
其中,低代码可以让更多缺少代码基础的人可以参与应用开发。上层应用快速扩张,生态持续繁荣下,可以带动PaaS、IaaS等公共云基础设施持续扩张,并利用规模效应摊薄云成本。
一位云厂商技术人士告诉笔者,企业过去使用云计算仍需要配备运维团队,管理服务器基础设施。运维人员需要为业务流量配备冗余的服务器设备。在业务流量扩张时需要手动调度管理。云计算的使用门槛、成本依旧相对较高。
Serverless的价值在于降低云计算的使用门槛和使用成本,运维人员无需管理服务器等基础设施。阿里云云原生应用平台负责人丁宇表示,过去云产品只是半托管,Serverless化后现可以通过云平台全托管。业务流量变大时自动扩容,业务流量变小时自动缩容。云产品变成了模块,可以自动弹性提供服务。企业的运维、开发成本都会大幅下降。
以世纪联华为例,将会员系统、交易系统、支付系统等迁移到阿里云函数计算上处理后,促销准备时间从周级缩短到小时级,研发运维提效30%,成本下降40%。
上述云厂商技术人士解释,云产品Serverless化事实上还能带来更高的毛利空间。因为采用Serverless产品的厂商通常需要配套购买一些PaaS层的配套服务,其中包括数据库、数据仓库等。云资源产品的毛利率通常只有30%,但是这些PaaS层配套产品的毛利率超过60%。云计算的附加值得以提升。
AI大模型开源适应了智能算力需求增长趋势。和传统算力不同,智能算力往往会带来更高计算量。云计算未来新增长点也诞生在这些领域。
云的本质是算力,哪些产业需要计算资源,云的增长点就在哪里。自动驾驶、高端制造、智慧城市、生物医疗等场景,需要大规模的数据标注、模型训练,即“智能算力”。中国信通院2021年公布的一组数据显示,通用算力在中国算力池中的比重由2016年的95%下降至2020年的57%,智能算力比重则由2016年的3%提升至2020年41%,预计到2023年智能算力的占比将提升至70%。
2022年,阿里云在河北张北、内蒙古乌兰察布启用了两座智算中心。目前小鹏汽车等国内新能源汽车厂商的自动驾驶深度学习便在阿里云的智算中心中完成,小鹏汽车为此还采购了阿里云的AI大模型开源平台。张建锋对笔者等媒体表示,由于新型算力需求的驱动,阿里云目前在汽车行业的增速超过100%。
东数西算的政策背景下,一批企业大规模建设数据中心,通过堆叠服务器的方式继续做大传统算力,这带来的影响会是,算力成本进一步下降,成本进一步下探。市场价格竞争也将变得更为激烈。但智算中心、AI大模型开源的模式,不仅可以探索云计算新的算力正在方向,还可以获得更高的产业高附加值。
近两年来,国内外云计算产业走到了新的十字路口。
从海外市场看,亚马逊AWS、微软Azure、英伟达、英特尔正在加速改造云计算基础设施设计方法。云计算正在迎来新一轮技术突破。
从国内市场看,云厂商不再单纯追逐营收规模。阿里云是国内最大的云计算厂商。它的选择是,继续建设新的架构,从最底层的数据中心核心部件到最上层云原生软件,形成完整的自研技术体系。提升技术底层能力的价值一方面在于提升基础设施能力,强化产品竞争力。另一边,还要于优化成本结构。在未来还可以持续研发高附加值且代表产业发展方向的产品。
阿里云布局新型计算体系核心意图是,试图在新的进展环境下强化技术投入,保持定力,确保战略主动权。阿里云在性价比、能耗比等方面都出现显著提升。
阿里云以云为核心的“体系化”硬件技术,将对传统单点的硬件技术产生冲击。
微信扫码关注该文公众号作者