Redian新闻
>
第一批做DPU芯片的厂商发展怎样了?

第一批做DPU芯片的厂商发展怎样了?

科技

DPU自2020年爆火至今已有2年,从目前行业的关注度来看,DPU带来的机遇已经基本形成共识。世界范围来看,DPU竞争激烈,国外大厂英伟达、AMD、英特尔、高通、博通一线厂商均开始在DPU方向发力,DPU已经成为很重要的一个赛道。最好的时代就在当下。


DPU火热两年,我们对其又有了新认识


首先让我们再来看看,DPU为何会在2020年左右火起来呢?此前的解释:摩尔定律的放缓与全球数据量的爆发这个正在迅速激化的矛盾通常被作为处理器专用化的大背景,但是该大背景虽然有一定的合理性,但是还是过于模糊,并没有更好的解释出DPU“横空出世”的原因。中科驭数发布的《专⽤数据处理器 (DPU)技术白皮书》中对这一原因做了另外的解释:通过比较网络带宽的增长趋势和通用CPU性能增长趋势,能发现一个有趣的现象:带宽性能增速比(RBP,Ratio of Bandwidth and Performance growth rate)失调



2010年前,网络的带宽年化增长大约是30%,到2015年微增到35%,然后在近年达到45%。相对应的,CPU的性能增长从10年前的23%,下降到12%,并在近年直接降低到3%。在这三个时间段内,RBP指标从1附近,上升到3,并在近年超过了10!如果在网络带宽增速与CPU性能增速近乎持平,RGR~1,IO压力尚未显现出来,那么当目前RBP达到10倍的情形下,CPU几乎已经无法直接应对网络带宽的增速。因此,带宽性能增速比的失调激化了对DPU的需求。


那么什么是DPU?关于DPU的定义很多,DPU是以数据为中心构造的专用处理器,采用软件定义技术路线支撑基础设施层资源虚拟化、存储、安全、服务质量管理等服务。DPU是下一代“算力网络”的核心支撑组件。


其实DPU是什么不重要,重要的是DPU能做什么。如果从功能角度来看DPU,英伟达认为DPU的功能是,用来把数据在正确的时间放到正确的位置。什么叫正确的时间放到正确的位置?正确的时间指的是必须延迟要满足要求,带宽要能达到数据量,自己的数据带宽要做到匹配;正确的位置指的是要把所有的远程资源都本地化,所有的跨节点访问都要做的跟访问本地的资源是一样的。


那么,DPU的市场价值是怎样的呢?很多人会认为DPU是一颗专用芯片,一旦专用化,就代表你需要很多定制化,定制化以后就会非标,一旦非标价值就很低,其实这是一个认知的误区。定制化、专用化、标准化这三者是完全不相关的概念:专用化强调的是应用场景,跟最后的价值高低没有直接关系;定制化是技术实现的路径选择;标准化是为了降低边际成本。那么DPU是否能标准化?中科驭数创始人兼CEO鄢贵海表示,我们觉得,DPU肯定是个好东西,标准化也能做成,但是有挑战


DPU特有的挑战,要求芯片厂商必须软硬兼施


任何一个新技术在做产业化的过程中,都会面临一些特定的挑战,DPU也不例外,而且其面临的挑战还不小。


DPU很大的一个应用挑战就是跨平台下的“适配”问题,DPU要与当下的CPU以及各种操作系统进行适配,这非常考验DPU厂商的技术实力。而且加之DPU本身特有的挑战主要有需求比较碎片化、软件生态不够成熟。当然DPU还有一些行业共性的挑战,比如芯片量产供应链的问题和高水平研发人员的短缺问题。


所以DPU必是一个软硬兼施的产业,“如果不做软件,DPU整个功能和性能都没法得到充分的释放,这就导致最后你要去兼容各种奇形怪状上层的系统,那些系统比应用还碎片化。”鄢贵海指出。


正因为如此,我们可以看到,英伟达为其BlueField DPU特意打造了DOCA软件框架,DOCA能将BlueField DPU提供的硬件能力做软件抽象和封装,以SDK Library的形式提供友好的可编程接口,提高应用开发的效率。


中科驭数从2018年就提出了“软件定义加速器“的发展路径,四年磨一剑,中科驭数自研的HADOS系统已经迭代到第三代,直接对标英伟达的DOCA。在中科驭数看来,HADOS是解决DPU众多挑战的最重要的一招棋。下图展示了DOCA、OneAPI和HADOS的比较。得益于中科驭数自研的软件开发平台HADOS,驭数产品灵活度高、稳定性强、兼容性好,全面适配国内外多种操作系统,大幅降低应用软件开发难度。


DOCA、OneAPI与HADOS比较分析(需要指明的是,OneAPI本身并不提供DPU设备,而是构建一个软件框架来整合业界现有的异构计算设备)(来源:2021《专用数据处理器(DPU)技术白皮书》)


第一批国内做DPU的厂商发展到哪一步了?


芯片算力的发展有三个要素:第一,性能必须要高;第二是生产率,主要看系统能不能做的更好用,学习成本更低,以及兼容性做到最广;第三是成本能不能尽量做到优势。


对一个初创公司来说,大抵都是从第一点开始做起,循序渐进。那第一批国内创业做DPU的厂商发展到哪一步了?拿中科驭数来说,目前大致处在第二阶段,不管是DPU的核心架构还是软件的频繁迭代,以及跟国产品牌适配等等,这些都是为了解决DPU产品能好用、易用的问题。


接下来就是解决第三个成本的问题,今天单颗DPU成本还比较高,主要原因是:大规模化还没起来,AMD认为10万颗以上才算上量,就服务端的CPU来看,确实还是一个比较不错的量。那么DPU能达到怎样的体量呢?鄢贵海表示:“DPU最后的量不会低于服务器的量,这就意味着我们还有很大的空间去通过规模效应降低我们产品的成本。这也是驭数从现阶段基本形成商业闭环,到发展成为产业比较重要位置的公司,要突破的最后一道屏障。”


中科驭数的DPU也是按照算力发展的三大要素这样的路径演化:其K1主要用于交易风控;K2开始进入了数据中心的一些场景,而且K2在功能和性能上都有了较大的提升,第二代DPU芯片K2预计近期回片,这也是国内目前功能定义相对较完整的首颗DPU芯片;到明年,K2的增强版主频提高到800MHz,功耗优化60%,面积优化75%等等,并进一步拓宽DPU的应用领域,完善DPU功能设置;K3设计方案已经完成,今年第四季度将启动研发K3有望对标甚至超越BF3、MtEvans。可以看出,中科驭数作为国内第一批研究DPU芯片的企业,其芯片迭代的节奏正在有条不紊的进行中


值得一提的是,中科驭数在落地场景的选择上,首先瞄准的是超低时延的金融场景。在金融场景,对于DPU来说,超低延迟网卡是刚需,必须要做到1.7μs才是超低时延。而在这个场景下,处于长期被国外厂商垄断的局面,直到去年,AMD占据90%以上的市场份额,剩下的几乎被英伟达占据,还有思科。中科驭数做了4年,才在这个场景跻身为行业第四个玩家,打破了国际厂商的垄断。接下来,中科驭数将发力更广阔的数据中心和5G边缘计算等云原生场景,预计到2022年底,中科驭数将成为国内DPU行业在云原生应用上首个大订单。


所以接下来的重头戏将是K2芯片。据中科驭数CTO卢文岩博士的总结,中科驭数的K2-DPU主要有五大优势:

1)技术先进:通过架构创新,首创KPU芯片架构,可集成数百异构处理器核;


2)功能完备:K2从指标和功能覆盖面来看,相比一线厂商相比是不弱的,K2-DPU可以覆盖虚拟化、网络、计算、存储、安全等全功能;


3)性能高:具体到各功能来看,其中在DPU中很关键的一个功能网络处理的引擎方面,中科驭数的K2可以直接对标业界领先的AMD方案,达到400Gbps,转发延迟小于5μs;再者,被认为是下一代数据中心互联核心的RDMA协议,目前能商用的RDMA的引擎只有英伟达,但是现在中科驭数RDMA引擎已经做到在链接数和延时等多方面功能和性能直接对标英伟达。此外,K2无论是性能还是时延方面远超FPGA智能网卡方案,


4)成熟度高:已达到量产标准,2023年全面量产;


5)生态完善:HADOS软件已经批量部署。


日前,中科驭数宣布完成超以往轮次融资规模的数亿元B轮融资,本轮融资将进一步加速驭数DPU芯片的研发迭代和产业布局,加速构建DPU芯片的生态体系,为数据中心下一代算力架构变革,提供纯国产核心级基础设施,继续保持DPU赛道的领跑地位。


写在最后


对于DPU乃至整个半导体产业而言,当下我们正处于百年未有之大变局。新基建、东数西算以及运营商的算力网络规划等给国产DPU行业带来了重要的机遇。在这样的背景下,国产DPU厂商应当利用好国产信创行业的发展机遇,扎实推进核心功能的自主研发,把产品做好;走开放的系统,与CPU、OS、网络等厂商,相互融合,共创繁荣。同时,构筑与国内其他类型DPU研发团队写作共赢的机制,早日将DPU发展成为行业新的生产力。

*免责声明:本文由作者原创。文章内容系作者个人观点,半导体行业观察仅为了传达一种不同的观点,不代表半导体行业观察对该观点赞同或支持,如果有任何异议,欢迎联系半导体行业观察。


今天是《半导体行业观察》为您分享的第3177期内容,欢迎关注。

推荐阅读


★ 芯片大厂,跌跌不休

★ 音频芯片出货超35亿颗,专注声学设计,AKM发力汽车市场

★ 蓄力加速跑,蓉矽半导体NovuSiC® MOSFET正式发布


半导体行业观察

半导体第一垂直媒体

实时 专业 原创 深度


识别二维码,回复下方关键词,阅读更多

晶圆|集成电路|设备|汽车芯片|存储|台积电|AI|封装

回复 投稿,看《如何成为“半导体行业观察”的一员 》

回复 搜索,还能轻松找到其他你感兴趣的文章!

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
佩洛西访台飞机起飞了!美中台准备好了吗?第一批被选为“超级人类”的小孩,后来怎样了?关于芯片大大的坏消息?不是,是《中国芯片的正道何在?》千方百计辞职央视的杜宪,如今怎样了?13岁孩子被香港大学录取:那些天才少年的命运都怎样了?大浪淘沙:一文看懂内存芯片的发展史北大才女远嫁西非,在战火中独自抱娃逃回北京卖盒饭,如今怎样了?那个宠妻狂魔男网红,出轨了!拿着老婆赚的钱劈腿女粉丝,抛妻弃子的他如今怎样了?误炸南使馆撞军机到佩洛西访台头顶的星星是思念的方向芯驰将向宁德时代供应百万MCU芯片,年底出货量达300万片|最前线总是把伤痛藏起来的人,后来都怎样了?第一批摆烂的旅游人,都怎么样了?苹果M2芯片全系剧透:最高48核CPU、152核GPU新DP规范来了!DP 2.1发布,加强不同规格接口的一致性热搜第一!第一批冷冻人现在怎么样了?全尸$23万!中澳都有人参与!“中国首善”陈光标,高调豪捐20亿,2016年被媒体扒皮后“消失”,他现在怎样了?什么是GPU?GPU和显卡的关系?GPU国产化布局?一个适用于苹果芯片的原生 Linux GPU 驱动程序几乎就绪! | Linux 中国AR厂商密集发新品,toB厂商加速toC转型 |焦点分析三千孤儿入内蒙!19岁未婚少女抚养28个上海孤儿!62年过去他们过得怎样了?《米德维奇布谷鸟》:杀人的孩子冷酷的心赚外国的钱,建中国的厂给渣男当牛做马七年却被分手,被嘲讽是“不合脚的鞋”,这个42岁女星如今怎样了?美女总裁卷走同胞1.5亿,跻身美国上流社会,后来怎样了?又走了一位老海归-张兴钤NVIDIA大会上秀肌肉,却让人想到断供的GPU芯片,国产还能打吗?Arm急了?高通爆料ARM架构SoC将不允许外部GPU等设计,三星联发科等芯片厂商“被连坐”5岁萌娃被患癌亲妈逼着天天煮饭做家务?14年过去,那个失去妈妈的小女孩如今怎样了?长三角人均GDP达11.7万元,七城GDP占区域一半AMD最强RDNA 3架构GPU发布,小芯片设计、支持DP2.1接口,899美元起24岁小学老师因强奸罪被判10年,当事女生却毫不知情?!喊冤56年后,他过得怎样了?那些离开大佬的女人,后来怎样了?创始人说|做DTC品牌最可怕的事,就是以为自己有护城河MAIA CEO王佳音:做DTC品牌最可怕的事,就是以为自己有护城河
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。