Redian新闻
>
大模型引爆算力缺口,智算中心是正“途”

大模型引爆算力缺口,智算中心是正“途”

公众号新闻




中共中央、国务院印发的《数字中国建设整体布局规划》指出,要夯实数字中国建设基础,其中重要的一方面,就是系统优化算力基础设施布局,引导通用数据中心、超算中心、智能计算中心、边缘数据中心等合理梯次布局,加强传统基础设施数字化、智能化改造。

随着数字经济的蓬勃发展,特别是人工智能应用快速普及产生的强大算力需求,智算中心已经从最初的一个概念逐渐发展成为数智时代最具代表性的新型公共算力基础设施。

作为智算中心的先行者,百度智算中心聚焦人工智能应用场景,为政府和行业客户提供包括普惠算力、算法模型和数据服务在内的人工智能基础设施,夯实数字经济创新发展的数智底座。

算是目的 智是手段

进入2023年,ChatGPT的火爆掀起了人工智能的又一轮热潮。“目前,国内人工智能的发展主要受限于算力和数据。”百度云途腾总裁刘江涛一针见血地指出。


百度云途腾总裁刘江涛


仅就算力而言,OpenAI为了训练ChatGPT,构建了由近3万张英伟达V100显卡组成的庞大算力集群。如果按半精度FP16计算,这是一个将近4000P的算力集群。而目前国内500P以上的智算中心凤毛麟角。有消息称,GPT-4达到了100万亿的参数规模,其对应的算力需求同比大幅增加,未来可能E级规模的算力集群才能满足不断增加的训练所需。今天,投身大模型的公司如雨后春笋般涌现,仅国内就有20多家,如果再算上围绕大模型的人工智能生态和由此产生的用于推理的算力需求,未来的算力缺口将更加惊人。


巨大的算力缺口激发了智算中心的建设热潮。据不完全统计,目前国内有超过30个城市正在建设或提出建设智算中心。无疑,智算中心将为人工智能夯实“算力底座”

相比人们熟知的传统数据中心或云数据中心,以及超算中心,智算中心究竟有哪些不同呢?

在高性能计算领域,我国已处于国际领先水平,曾先后十次排名世界第一,并三获“戈登·贝尔奖”。但是客观地来看,我们的算力主要还是集中在超算,也就是科学计算方面,在智算层面,我们与国际相比确实还存在一定的差距。这也正是需要我们在未来实现赶超的地方。

智算中心与超算中心无所谓孰优孰劣,两者各有侧重。刘江涛从企业和工程的角度对两者进行了对比,其区别主要表现在以下三个方面:

首先,在技术架构层面,超算中心的核心计算能力依赖于高性能CPU,强调双精度的通用计算能力,追求数值计算的精确。CPU之所以被称为中央处理器,是因为它的设计初衷,就是用来做整体控制的,除计算之外,还负责任务管理和调度,角色类似于企业的CEO。而智算中心的核心计算能力更多依赖于GPU,注重单精度、半精度等多样化计算能力。GPU的设计初衷是做大量的重复计算,是计算专家,类似于企业的CTO。

其次,在服务对象层面,超算更多服务于科研类的国家重点大工程和大体系项目,而科学类的项目是必须严格把控精度的,但实际上很多民用的工程类项目是不需要太高精度的。因此,智算的服务对象更为宽泛,除了服务于科研和高校之外,还更多地服务于数字政府和产业数字化。从助力产业发展角度来看,智算服务的性价比更高,研发周期更短。

最后,在应用场景层面,超算广泛应用于新材料、新能源、生物制药、高端装备制造、航空航天飞行器设计等领域的研究。而智算更多地应用于自动驾驶、智慧医院、智慧城市、智能制造等人工智能和产业融合创新的领域与场景。

从传统的数据中心和云数据中心来看,它们更偏向于混合算力,以CPU为主,含部分GPU算力。云数据中心是传统数据中心的子集,在传统数据中心的基础之上,用云计算进行升级改造,提升了传统数据中心的运营效率和使用的便利性。而智算中心又是云数据中心的子集,在云数据中心的基础上,在硬件层面进一步增加GPU的占比,在软件层面强化对各类GPU的兼容性以及管理和调度能力,比如GPU切片和虚拟化,同时提升云数据中心在AI方面的PaaS能力。

刘江涛表示:“算是目的,智是手段。用‘智’来算,就是以GPU作为‘算’的运算载体,以AI PaaS作为‘算’的工具,最终完成数学求解。”

现有的数据中心与智算中心定位不同、功用不同,且各有所长。很多业务放在传统数据中心就可以轻松解决,其实没有必要都放到智算中心完成。

理性看待智算中心发展
迈好第一步

近两三年,智算中心的建设如火如荼。“东数西算”工程的启动,能够将东部算力需求有序引导到西部,从而优化数据中心建设布局,促进东西部协同联动。那么,“东数西算”对于智算中心的建设与发展会带来什么影响呢?

刘江涛分析指出,“东数”之所以能够“西算”,除宏观政策上的“双碳”目标实现和微观经营上的成本因素外,最需要考虑的还是场景,不是所有“东数”都适合“西算”。按数据处理的延迟划分,计算其实可以分为“实时计算”和“离线计算”。对于离线计算,也就是对于延迟和时效要求并不是太敏感的业务,“东数西算”是划算的。但是对于实时计算,比如智能驾驶、工业机器人、辅助医疗等对于延迟要求较高的行业,延迟需求是毫秒级甚至微秒级的,“西算”并不现实。

智算中心本身包含了训练和推理,其中有一部分训练任务确实可以“西算”,但推理通常还是要放在本地进行,同时还要考虑到数据安全性的问题。大模型或者称之为通用人工智能,主要是使用大量互联网数据(或者称之为开放数据)进行训练,但大模型并不是人工智能的全部。随着人工智能逐渐深入产业应用,企业需要用很多“私域”数据或者行业数据去训练模型。这些数据大多比较敏感,很多时候是需要留在本地进行训练的,不能传输或存储到第三方平台上。所以,东部的政府和行业在本地规划建设自己的智算中心,无可厚非。

无论政府还是企业,应理智看待智算中心的建设与应用,不能盲目跟风,过犹不及。

参照云数据中心的发展范式和IT行业的商业规律,刘江涛认为,智算中心的发展会经历三个阶段:第一个阶段是“产品阶段”,会出现众多围绕智算需求的新型云计算平台产品,且需求旺盛,呈现出明显的卖方市场特征;第二个阶段是“服务阶段”,即围绕产品提供配套的衍生服务,就像当年的云管平台和MSP服务之于云计算一样,逐步从通用化管理向精细化治理转变,进一步提升管理效率和服务体验,同时降低使用成本;第三个阶段是“生态阶段”,即围绕智算中心构建上下游的产业生态。在这个阶段,智算中心会进一步标准化,这也意味着同质化将加剧,智算中心的市场份额开始呈现“马太效应”,生态完整性成为比拼的焦点,而依托于智算中心开发的“AI原生”的垂类应用,甚至是在大模型基础上的各类小模型将大量涌现。

就目前情况而言,智算中心还处于发展的第一个阶段,市场上可以选择的成熟产品并不多,也市场成熟度不高,数字政府、公安、医疗、交通、金融、生物制药、科研等是智算中心主要的应用场景。

顺势而为
以差异化抢占智算先机

国家工业信息安全发展研究中心发布的《智能计算中心2.0时代展望报告》指出,智算中心作为主要的新型算力基础设施,正在从以“建”为主的1.0时代,走进以“用”为主的2.0时代,智算中心被赋予了“算力多元化、服务一体化、产业协同化、能耗低碳化、价格普惠化”等新内涵。

刘江涛十分赞同上述观点,并以百度智能云的实践为例进行了详细介绍:算力多元化,就是百度智能云一直在做的一云多芯和异构计算,以实现对各类CPU和GPU的兼容,包括基于此的穿透和虚拟化能力;而服务一体化,其实就是算力资源的统一管理,也就是百度智能云不遗余力投入打造的基于IaaS之上的AI PaaS和AI工具;产业协同化,与百度智能云一贯秉承的“云智一体,深入产业”策略有异曲同工之妙,人工智能只有服务于产业,才能产生更大的价值,科技与产业的跨界融合至少是未来十年的趋势;在能耗低碳化方面,基于数据中心方面的专利和技术,百度能够将智算中心的PUE做到1.08,达到国际领先水平;从价格普惠化来看,现阶段受客观条件所限,比较难实现,而且需要整个产业各方的协作。从百度来看,它拥有自己的GPU芯片公司,推出了“昆仑芯”,并陆续实现了对“昆仑芯”各种型号的支持,此外还通过与兄弟公司的合作,一直朝着价格普惠的方向努力。

随着进入智算中心市场的厂商越来越多,既有算力厂商,也有云厂商,还有大量基础设施厂商。百度云途腾在智算领域如何定位?又如何脱颖而出呢?

刘江涛表示:“云途腾是一家技术型的公司,提倡工程师文化。作为云计算赛道的老牌厂商,我们从2018年就参与了国家重点研发专项,作为工业机器人云平台的课题负责人,研究的就是与人工智能相关的国产替代。在被百度并购之后,我们作为百度智能云体系的重要组成部分,长期践行‘云智一体’的理念,依托百度在人工智能方面的强大实力,不断提升云平台的AI能力,并在GPU的支持和AI PaaS方面进行了重点的研发投入,实现了技术的升级迭代和产品的功能演进。在这个基础之上,我们提出了打造国内首家AI型私有云企业的战略目标。”

百度是人工智能的国家队,而百度云途腾是隶属于百度旗下的智能云板块,在国内市场上具有明显的技术优势。在业务层面,近几年,百度云途腾除了继续夯实和扩大交通、能源、党政、金融、工业五大优势行业的市场占有率外,还提前布局“区域下沉”,取得了较为理想的突破。

未来,百度云途腾将会逐步加大在南方市场的投入,通过“行业+区域”的双重业务布局,推动“双轮驱动、区域统筹、行业深化”,从以行业为主转变成以区域为主,进一步优化业务结构,更好地服务区域经济发展。刘江涛表示,区域产业的多样性和特殊性也决定了,百度云途腾在智算中心场景的落地和服务的配套方面必须走差异化的发展路线,只有这样才能充分发挥自身的优势,服务于产业数字化,加速推动企业的数智化转型。





微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
独家丨理想汽车智算中心进展:牵手火山引擎,定址山西灵丘,预计三季度建设完成腥风血雨里的南明短命王朝(九)全球首发多模态医疗大模型砭石,智慧眼迈向数字医疗新征途联邦新政!加拿大开设新移民通道,填补劳动力缺口!大模型引发新一轮技术变革, AI芯片公司迎来新挑战之江实验室图计算中心副主任陈红阳:生物制药 × Graph AI 大模型坚持做行业大模型,竹间智能给大模型造了一座「模型工厂」阿里达摩院大模型公开课上新!主讲中文个性化对话大模型ChatPLUG和模块化多模态大模型mPLUG-OwlH800国内首发!腾讯云推出大模型算力集群,集群算力提升3倍租在上海市中心是种怎么样的体验微软:中国无条件批准收购动视暴雪;国家超算中心发布中文大语言模型;JDG 登顶《英雄联盟》总决赛 | 极客早知道大模型赛道正“热”:卷场景、卷芯片、卷人才陈天奇等人新作引爆AI界!手机原生跑大模型,算力不是问题了广西一舞蹈演员自称是毛主席女儿,毛主席得知后下令:我想见她!ChatGPT热潮后的反思:我国应加速构建新型智能计算中心欧阳明高院士呼吁:将大模型引入动力电池全生命周期管理【案例分享】申请人有智力缺陷,如何成功免试、免费入美籍?大模型AI兴起:新一轮芯片、服务器、智算等浪潮来袭OpenAI被控窃取私人数据;荣耀要把大模型引入端侧;中兴推出GPT无线AR眼镜丨AIGC大事日报大模型变“小”:黑马天启开创AI模型“重度垂直”新思路,入选北京大模型行业应用典型案例中国团队自动驾驶大模型斩获CVPR最佳论文;Stability AI推出新文生图模型;京东大模型即将发布丨AIGC大事日报Pinecone:大模型引发爆发增长的向量数据库,AI Agent的海马体周鸿祎:大模型引领“新工业革命”,这波红利至少五到十年中国急眼; 美国放行数十家企业参编中国大模型标准;大模型创企获2.5亿美元投资;微软签署数十亿美元AI算力协议丨AIGC大事日报2023年超算、智算及数据中心报告揭秘智算中心网络建设新利器:LPO技术的出现侃爷把新妻子打扮成“黑色蚕蛹”出街?!诡异造型引网友担忧:被绑架了你就眨眨眼!只给大模型LeetCode编号,也能解题!大模型表现好是源于对训练数据的记忆吗?请不要迷信大模型李清照雨后向丈夫求欢,写下一首撩人宋词,撩得让人脸红心跳文心一言算力从哪来?自家最大智算中心:算力规模4EFLOPS,base李彦宏老家坐看人生刚刚!加拿大宣布开通一条新的移民通道!填补劳动力缺口!聆思科技徐燕松:生成式大模型潮流下,智能家居端侧智能化涌现变革腾讯云公布行业大模型进展;美图推出视觉大模型;华为高管称AI算力将增500倍丨AIGC大事日报
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。