中国算力进化史
中国算力进化史
算力正在像水、电一样成为基础设施,成为数字经济发展中的核心动能。如何更好地调用算力资源、如何像做好电力分配一样分配好算力,已成为当下社会各界关注的重点。相应地,数据中心的建设同样不容忽视,地位举足轻重。
围绕这个新世纪的技术革命,一场大幕早已拉开。
什么是算力
这几年,全民网购鲜少宕机,大型游戏不再卡顿,自动驾驶和机器人甚至得以逐步落地,背后都离不开一项能力的进步——算力。
算力,可以简单地理解为计算能力(Computer Power)。
原始时代,人们使用口算、心算等无工具辅助的计算方式,大脑就相当于一个算力引擎。后来,结绳计算、算盘等辅助计算工具的应用,让人们的计算能力进一步向前。
1946年,世界上第一台数字式电子计算机ENIAC诞生,标志着算力计算第一次步入电子时代。不过,由于当时的技术还不够发达,它由18000多个电子管组成,占地面积有几间教室那么大,每秒钟只可进行5000次计算。
直到半导体芯片技术的出现,算力有了新的承载物。英特尔创始人之一戈登·摩尔曾经针对半导体创新提出过一个理论,即芯片中集成的晶体管数量大约每24个月翻一番,同时价格下降为之前的一半。后来,这个周期被缩短至18个月。
这一定律被用来揭示信息技术进步的速度。很长一段时间内,依托于摩尔定律,计算机的计算能力以可预见的速度进步着。
就如人们所看到的,芯片制程工艺的进步,让计算机越造越小、越来越轻薄,算力也越来越强。如今,一台顶配的笔记本电脑,每秒运算次数已达到两亿五千万次到三亿五千万次。
迈入电子信息化时代后,数据呈指数级爆发,智能化与数字化的需求如大浪般袭来。
整个社会都在迎接强烈的算力需要。网购、追剧、打游戏,甚至是打车、吃饭,生活中的方方面面都需要算力的支撑。不仅如此,在工业制造、智慧金融、智慧医疗、智慧城市等领域,随着行业的数字化程度逐步提高,算力需求开始急速攀升。
当然,不同的需求背后,所需要的算力类型也有所不同。
按照规模,算力可分为基础算力(基于CPU芯片)、智能算力(基于GPU和NPU芯片)和超算算力。简单来说,满足网购、打游戏这类基础需求,基础算力就能够完成;智能算力,主要用于人工智能的训练和推理计算,常见如语音、图像和视频的处理;超算算力,通俗理解即超级计算机所提供的算力,一般用于行星模拟、基因分析等高科技研究领域。
人工智能的核心要素主要是算力、算法和数据。故而在具体应用中,普遍使用AI芯片进行计算,也就是GPU。随着人工智能、自动驾驶等超级应用的持续发展,我国的算力结构也发生了一定变化。其中,智能算力的增长规模远超通用算力。据中国信通院预测,到2023年,智能算力在总算力中的比重将超过70%,发挥核心拉动作用。
管理咨询公司罗兰贝格也提到,从2018年到2030年,自动驾驶对算力的需求将增加390倍,智慧工厂需求将增长110倍,主要国家人均算力需求将从今天的不足500 GFLOPS(Giga Floating-point Operations Per Second,即每秒10亿次的浮点运算数),增加20倍,到2035年将达到10000 GFLOPS。
爆发的需求背后是不断进击的算力基础设施。
工信部数据显示,截至2021年底,我国在用数据中心机架总规模达520万标准机架,在用数据中心服务器规模1900万台,算力总规模超过140 EFLOPS。全国在用超大型和大型数据中心超过450个,智算中心超过20个。
在2022中国算力大会上,工信部方面披露,当前我国算力产业规模快速增长,近五年平均增速超过30%,排名全球第二。中国工程院院士邬贺铨在接受采访中表示,中国数据量巨大,在智能算力方面全球优势突出,未来中国算力总规模或将成为世界第一。
算力上云与崛起中的科技样本
PC的诞生标志着IT算力走入千家万户,但计算机的单体算力始终存在一定局限性。2015年以来,摩尔定律失效的声音甚嚣尘上。如果说此前数十年间的算力进化史,是一部计算机进化简史,那么迈入21世纪后,算力的进化就同云计算平台与通信网络的发展密不可分。
早在21世纪初期,云计算就加入了算力发展的脉络之中。
作为分布式计算的新尝试,云计算可以把零散的算力打包汇聚。在云计算中,CPU(中央处理器)、内存、硬盘、GPU(显卡)这些资源被整合调用,以软件形式呈现,成为一个可以无限扩张的虚拟算力池。
2006年,基于消费旺季流量不断暴涨的情况,海外电商巨头亚马逊开始意识到,足够的存储空间与稳定的IT基础架构必不可少。
随即,以自身为实践,亚马逊正式推出S3(Simple Storage Service,
)和EC2(Elastic Cloud Computer,弹性云计算),面向企业提供IT基础架构服务。彼时,云计算服务作为一种新的商业模式,首次登上历史舞台。
在亚马逊将压力转化为动力、向云计算吹起探索号角之际,国内对云计算概念的理解还处在萌芽阶段。
在国内,阿里巴巴成为了第一位吃螃蟹的玩家,与亚马逊的境遇类似,激增的网购用户和随之而来的海量数据,给这家尚无自有算力系统、只能依赖于从国外购买的企业带来了不小的“脑力”危机。不买,服务器距离崩溃只有一步之遥;买,只怕会是一个填不满的无底洞。
阿里云就诞生在这样的背景下。据当时参与的工程师回忆,2009年春节后上班的第一天,一群工程师在北京上地七街汇众大厦的办公室里,敲出了国产云计算操作系统“飞天”的第一行代码,这正是中国云计算产业发展的开端。
彼时,刚成立的阿里云与阿里巴巴自身的业务绑定在一起成长,计算不够稳定、数据传输缓慢等意外层出不穷。负责具体项目的程序员不得不24小时盯紧系统,排除BUG与修改代码交替进行。那确实是一段煎熬的日子,直到经过多次的改进与版本升级,厚积薄发终于成真。
很快,腾讯也躬身入局。2011年中国IT领袖峰会上,马化腾表示, “通过云组织和云服务能帮助腾讯走向开放,通过云端强大的形态能让一个平台开放出来”。
技术更新、人才招聘、梯队建设、客户宣传......这几乎是所有云计算厂商成长过程中的必经之路。随着越来越多的互联网巨头盯上云计算这块蛋糕,价格战也演变得愈发激烈,包括阿里云和腾讯云等在内的云计算厂商都曾经宣布针对性地对云服务进行降价,算力提供成为了一项不折不扣的to B生意。
十年间的变化翻天覆地,国内云计算厂商愈见凶猛。
Gartner数据显示,2018年阿里云在亚太市场份额排名第一,并首次超过亚马逊和微软的总和。中国云厂商首次实现弯道超车。
中国信通院发布的《云计算白皮书(2022年)》显示,2021年中国云计算总体处于快速发展阶段,市场规模达3229亿元,较上一年增长54.4%。其中,公有云市场规模增长70.8%至2181亿元,有望成为未来几年中国云计算市场增长的主要动力;私有云市场则突破千亿元大关,同比增长28.7%至1048亿元。
这其中,既有以互联网和科技巨头为代表的阿里云、腾讯云、华为云、百度云等,也不乏以运营商为支撑的天翼云、移动云、联通云。它们各自扮演着不同的角色,搅动潮水,也成为潮水的一部分。
算力网络与东数西算践行
到今天来看,算力正在像水、电一样成为基础设施,是数字经济发展中的核心动能。就像“人工智能之父”约翰·麦卡锡六十年前曾设想的那样。
2022年3月17日,浪潮信息、国际数据公司(IDC)和清华大学联合推出的《2021-2022全球计算力指数评估报告》指出,国家计算力指数与GDP的走势呈现出显著的正相关。
15个重点国家的计算力指数平均每提高1点,国家的数字经济和GDP将分别增长3.5‰和1.8‰,预计该趋势在2021年至2025年将继续保持。
因此,如何更好地调用算力资源,如何像做好电力分配一样分配好算力,成为当下社会各界关注的重点。相应地,数据中心也升级为不容忽视的公共基础设施,地位举足轻重。
针对当前我国算力资源分布不均衡局面,2021年国家发改委等四部委联合发布了《全国一体化大数据中心协同创新体系算力枢纽实施方案》,明确提出在8个地区布局全国算力网络国家枢纽节点,启动实施“东数西算”工程,构建国家算力网络体系。
2022年2月17日,“东数西算”工程正式全面启动。“东数西算”能够优化现有数据中心布局,按需分配东西部枢纽资源,助力数据中心规模化、集约化、绿色化发展。
就像南水北调、西电东送、西气东输一样,东数西算,简单来说,就是将东部的数据输送到西部进行计算。
按照行业内的划分,数据存在冷热之分。IDC数据显示,人类历史上90%的数据都是在过去几年间产生的,50%是在短短两年内生成。
一般来说,最近产生的是热数据,经历一周或数月后将转为温或冷数据。例如你正在进行的微信聊天、正在观看的直播就是热数据,而几年前拍摄的、存在云端的照片就是冷数据,冷数据主要是存储,计算需求非常态。东、西部因此分别适合处理热和冷数据,东数西算实际上也可以被视作东数西存。
此外,数据一经传输,多少会产生时延,故而工业级的超级应用需求,如自动驾驶、智能制造等数据需求,也会选择就近的数据中心完成。
与此同时,东数西算工程背后牵扯出的另一个理念——算力网络,也变得愈发火热。换句话说,就是让算力流动起来,使得具备不同需求的人能够给获取不同的算力——满足日常所需,可以获得性价比更高的算力;在以自动驾驶为代表的创新应用中,可以获取更加智能的算力。
华为轮值董事长胡厚崑在今年9月召开的人工智能大会上曾表示,人工智能产业的下一步发展,关键在于建好、用好算力基础设施。“应该持续推进算力网络的建设,让算力中心从点走向面形成网。当前,全国各地的算力中心纷纷建成,我们不仅要将计算中心作为独立的系统发挥作用,还要逐步让其相互连接,形成全国范围的算力网络,发挥出更大的价值。”他说道。
事实上,这一网络的建设脚步已在加快。
2022年5月,西南地区最大的人工智能计算中心——成都智算中心正式上线。作为国家“东数西算”战略核心枢纽节点数据中心集群的重要组成部分,成都智算中心基于华为云Stack和昇腾AI基础软硬件的AI集群,助力成都建设国家一体化大数据中心成渝枢纽节点。
2022年8月,阿里云宣布正式启动张北超级智算中心,总建设规模为12 EFLOPS(每秒1200亿亿次浮点运算)AI算力,超过谷歌的9 EFLOPS和特斯拉的1.8 EFLOPS,成为全球最大的智算中心,可为AI大模型训练、自动驾驶、空间地理等人工智能探索应用提供智能算力服务。
同月,“东数西算”内蒙古枢纽节点上建成了中国最大的自动驾驶智算中心——“扶摇”。该智算中心由小鹏汽车与阿里云在乌兰察布合建,算力可达600 PFLOPS(每秒浮点运算60亿亿次),用于小鹏汽车的自动驾驶模型训练。这也是“草原云谷”乌兰察布迎来的首座智算中心。
2022年9月,百度智能云与江苏省盐南高新区携手共建的“百度智能云-昆仑芯(盐城)智算中心”正式揭牌上线。
如此种种,不胜枚举。
就像《中国移动算力网络白皮书》中提到的,水力发展离不开水网,电力发展离不开电网,算力发展离不开“算力网络”。算力网络,这个在全球范围尚内属创新的理念,中国的布局已经走在了前列。
在电子信息时代,当算力成为核心竞争力,这张十年织就的网络,即将迎来更大的爆发时刻。
更多精彩内容,点击下方关注
微信扫码关注该文公众号作者