Redian新闻
>
首颗国产DPU芯片点亮背后,我们对DPU又有了更清晰的认识

首颗国产DPU芯片点亮背后,我们对DPU又有了更清晰的认识

科技

随着国际芯片大厂纷纷入局DPU,市场对DPU芯片的价值肯定进一步坐实。前有英伟达CTO表示“DPU是我们的重中之重”,后有英特尔收购Bearfoot、AMD收购DPU初创公司Pensando,最近Fungible又被微软收购,这些都间接地反映出DPU的核心价值。DPU作为继CPU和GPU之后的又一个重要的算力支柱,将卸载网络、存储、虚拟化、安全等基础负载,有效减轻CPU的负担。


作为国内第一批研究和开发DPU芯片的企业,近日,中科驭数宣布自主研发的第一颗DPU芯片K2成功点亮,这是业内首颗完成点亮的国产ASIC形态的DPU芯片,中科驭数也扛起了国内DPU发展的大旗。


K2是一颗怎样的DPU?功能完整、性能也不差


DPU芯片发展近3年,但关于DPU芯片,其行业标准还没有形成,在工艺和性能方面并没有很多可以对标的商品。那么K2芯片是一款怎样的产品呢?


(图源:中科驭数)


在K2芯片的定义和定位上,据中科驭数创始人、CEO鄢贵海告诉笔者,现阶段的DPU核心是进行功能定义,必须要先解决功能的问题,然后才能考虑更多的性能问题。所以在工艺方面,驭数科技选用的是28nm。28nm的选择又有几方面的考量:首先,28nm实现DPU芯片的功能没有问题;其次,从性价比来看,28nm的成本比较可接受;另外,这也与驭数科技在过往设计方面的积累有关,K2本来的规模比较大,用到的IP也比较丰富,而且大多数IP在28nm的工艺线上已经验证地比较充分。所以,综合考量来看,28nm是一个既安全、工艺又成熟、性价比较高、且能达到功能的诉求的选择


中科驭数创始人兼CEO鄢贵海(图源:中科驭数)


作为一颗功能型定位的DPU芯片,K2可以支持网络、存储、虚拟化等功能卸载,这也是目前国内首颗功能较完整的ASIC形态的DPU芯片


功能满足了,性能如何呢?


说到性能上的突破,鄢贵海表示,DPU首先要解决的是时延问题。DPU最早用于网络加速就是为了解决网络延迟的问题,例如在金融证券行业,超低延迟网卡是刚需,必须要做到1.7微秒才是超低时延,而在这个场景下,处于长期被国外厂商垄断的局面,到2021年为止,AMD仍占据90%以上的市场份额,剩下的几乎被英伟达和思科占据。正是因为抓住了行业这一大痛点,低时延成为驭数科技最先爆量的一个产品


K2芯片达到了1.2微秒超低时延的性能,并且可以支持最高200G网络带宽。驭数科技的K2芯片成功打破了国际厂商的垄断,至少是在金融场景下。


不过对于K2,驭数对其的厚望远远不是仅实现金融计算领域的国产替代这一目标,而是也瞄准了更广阔的数据中心场景。因此,驭数科技把预计未来1~2年能用到的功能都布进去,希望在接下来K2的应用过程中,不断完善软件等方面的支持,推动DPU芯片在数据中心的标准化。“我们很高兴在这个时点看到,现在的数据中心中的运营商对于DPU的需求正在逐渐走向一致,之前我们定义K2的时候,大部分已经预料到它核心的需求点,我们占了一定的先机。”鄢贵海指出。


DPU的路线之争:是FPGA还是ASIC


在DPU的发展路线方面,业界一直有关于是采用FPGA还是ASIC的路线探讨。譬如,全球行业的标杆英伟达采用的是ASIC路线,英特尔采用FPGA加速卡+ASIC的方式。


对此,鄢贵海认为,是选用FPGA还是ASIC,我觉得本身还是要看成本。当两者性能都可以满足一定要求的时候,就要看边际成本是不是够低,是不是可以做到一定的规模效应,保证它的生命周期。目前,业界的DPU运用FPGA的方式,我觉得也是一个阶段性的,DPU的应用场景相对比较多,对于一些特别细分的场景,尤其是那些对设备功耗要求没有那么高、功能也相对简单的场景来说,可能用FPGA就可以满足部分要求,而如果贸然用ASIC,虽然功耗降低了,但是整体的成本还是太高。


驭数科技从第一代芯片K1开始就采用自主研发的敏捷异构KPU芯片架构。鄢贵海指出,我们选择ASIC的路线本质上是ASIC的DPU是能产生规模化效应的,是能包含大量FPGA的方案覆盖不到的细分市场。ASIC芯片所能带来的优势它的边际成本比较低,性能优、功耗小。


ASIC是一条性能最好也是最困难的一条路,鄢贵海说道:“我觉得要把困难想在前面,一开始做的时候就得啃最硬的骨头,后面再做减法的时候才会游刃有余,不要开始就先专挑犄角旮旯去做,尤其在做对技术要求门槛比较高的创新性产品上。通过这种方式,才能让公司技术的积累有一个雏形,你的产品才会一代比一代完善,价值才会得到增加。如果反过来,你的积累看着多,光是积,但是累不起来,最后就会变得很散,散了以后产品就很难具有核心竞争力。”


什么时候做ASIC应该是每一家DPU厂商都会面临的一个问题。怎么选这个时间点?有两个方面的因素,一是内部因素,团队现在的技术积累是不是足以支撑做ASIC的产品;二是外部因素,芯片做出来用于什么场景中,企业必须准确地判断好外部条件的成熟度。


做一颗DPU不难,难的是跟上整个计算基础设施技术的演进


可能很多人看到,现在诸多的云厂商开始投入到DPU的研发中,云厂商能不能做好DPU?鄢贵海的观点是,答案不太好下定论,但我相信一点,DPU终将会成为一颗相对标准的芯片,会跟CPU、GPU一样,成为整个计算的基础设施里面的一部分。从这个角度来看,如果把DPU理解成一个应用型的芯片,那可能是应用厂商能做得好;而如果DPU的定位是在基础设施层的芯片,可能还是得由第三方来做。


从发展的眼光来看,对于一家DPU厂商而言,其实短时间内跟哪个厂商绑定的紧不紧,并没有那么重要。绑的紧并不代表它的方案就是最优的,可能绑的紧的目的就是为了短期拿个单子而已,这种思路不见得对DPU的发展具有生命力。鄢贵海认为,作为一家DPU厂商,要看到整个计算基础设施技术的演进,DPU的产品要随着这一技术的演变而发展,这才是让DPU最后真正变成核心的主流芯片的正确态度。


作为一个在DPU行业已经摸爬滚打了好几年的创业者,鄢贵海表示,DPU还是一个挺复杂的事情,虽然我们在这一块已经做了好几年,但我仍然觉得还有大量的技术难题需要攻克,绝对不是说铺500个工程师就能搞定的事情,需要随着整个应用的基础设施的改进而改进。做出一颗DPU本质上没有那么困难,但是要保证你的DPU的技术迭代跟上整个基础设施的演进步伐,这个是术业有专攻的。


据驭数科技的介绍,K2 DPU自2020年10月开始规划,到立项,再到完成代码、流片,前后投入小200人,历经差不多2年的时间,直到2022年12月,驭数科技这颗DPU芯片才成功完成点亮。


中科驭数联合创始人、高级副总裁(兼CTO)卢文岩也介绍道,整个K2项目进行了60余次方案评审,芯片前端进行了近40万行代码的开发;DPU是一个与应用密切相关的芯片,在研发阶段就要完成云原生、存储、金融计算、边缘计算等5大场景的应用的原型适配;在功能仿真和测试阶段要完成数千个验证和测试用例。 这还是在团队在芯片体系结构领域超过15年的技术积累,已经完成了第一代芯片K1,以及驭数在网络、存储、计算等领域积累的TOE、RDMA、NVMe-oF、大数据处理等功能核,技术积累的前提之下。


有望成为最快规模化落地应用的国产DPU芯片


芯片从设计到流片回来,成功点亮,接下来量产,这些都不能算是真正意义上的成功。一个芯片产品要最终变成商品、实现规模化落地,才能真正发挥其价值。


在鄢贵海看来,DPU要想形成规模化的应用,很重要的一点就是,DPU必须要跟云厂商、操作系统厂商,以及服务器厂商等建立良性的联系,大家相互开放、做兼容。之前市场上没有成形的产品,厂商之间仅限于初步的交流,所以兼容很难做到很深。要想真正把生态搭建起来,需要有芯片产品真正进入这些现实的硬件平台中,供第三方生态厂商在上面做开发、测试。


在应用场景上,K2可以广泛适用于金融计算、高性能计算、数据中心、云原生、5G边缘计算等场景。


譬如在数据中心场景中,通过DPU去卸载云原生,中科驭数在整个行业中可以说是走在前列的,即使是对比英特尔。国内更是如此,尤其是通过DPU卸载方案在金融中心的商业化落地方面。


除了数据中心,5G方面,驭数科技也进行了各种探索和合作,这不仅包括国内的大部分集成商、曙光、联想、浪潮,还有些新兴的服务器集成厂商等都有相关的合作。可以说DPU主打的通用市场,典型的客户都与驭数有很多合作。


“我们现在已经有了上量的条件,这将使得K2 DPU也有望成为最快规模化落地应用的国产DPU芯片。”鄢贵海谈道。


不容易形成垄断,DPU的生态是开放的


而规模化落地最大的挑战是应用,这就需要考验软件栈是不是成熟,兼容性是不是做的够好。对于DPU而言,DPU性能好不好取决于硬件,好不好用则是软件说了算。只要软件生态的兼容性做得好,很多上乘的应用都可以无缝迁移到上面,彻底打开DPU的应用窗口。


据张宇告诉笔者,跟GPU芯片不同,DPU面对的是不同的应用场景、不同的客户,从最终客户落地的应用场景来看,DPU不是一个垄断的行业,而是一个开放的、有事实标准的。DPU的生态更加开放。DPU的生态更多的是端,它的上端对接的是现在已有的各种开发平台,另外一端是真正对接到不同的DPU设备驱动层的东西。下面这一层是每家都自己做的,上面那一层开放的水平要比GPU清晰的多。只有开放,才能让更多的应用更方便地导入到DPU平台上面。


在软件方面,驭数科技于2022年12月8日发布了HADOS 2.0版本,这是国内第一个开放DPU软件栈,在系统适配性方面,HADOS完成了与十余个主流操作系统以及七种主流CPU架构的适配工作,为用户提供更多的自主选择权。驭数科技也正在与行业内的伙伴一起构建HADOS DPU生态的坚实基础,帮助开发者快速构建DPU应用和服务


HADOS全景视图(图源:中科驭数)


结语


中科驭数此次K2 DPU的成功点亮,是驭数DPU走向成熟的一大步,也是整个国产芯片又一重要的里程碑。K2将为行业提供一个比较完善的功能平台,对生态直接助力,也为接下来DPU生态扎根提供了一个很好的土壤。



*免责声明:本文由作者原创。文章内容系作者个人观点,半导体行业观察转载仅为了传达一种不同的观点,不代表半导体行业观察对该观点赞同或支持,如果有任何异议,欢迎联系半导体行业观察。


今天是《半导体行业观察》为您分享的第3268期内容,欢迎关注。

推荐阅读


★ 2nm?没那么简单!

★ 如何设计一个低功耗芯片?

★ 台湾半导体,没有弱点?


半导体行业观察

半导体第一垂直媒体

实时 专业 原创 深度


识别二维码,回复下方关键词,阅读更多

晶圆|集成电路|设备|汽车芯片|存储|台积电|AI|封装

回复 投稿,看《如何成为“半导体行业观察”的一员 》

回复 搜索,还能轻松找到其他你感兴趣的文章!

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
什么是GPU?GPU和显卡的关系?GPU国产化布局?“少爷和我”故事背后:我们对财富的渴慕,如何走向扭曲面对DAU下滑和营收增长停滞,今日头条换帅,原负责人转岗TikTok新负责人来自百度中国推进Web3的思路,更清晰了|焦点分析在这份音乐白皮书里,我们看到了人们对于音乐的热爱和信心文革中批判邓小平的红卫兵说啥温哥华风雪中,圣诞灯饰点亮漫漫长夜,也点亮了希望和快乐!张五常:邓公是中国200年来思路最清晰的领导人​让我们对“清零派”,别像他们曾对我们那般不宽容NF-κB 研究2022丨涉及几乎所有疾病的通路,这12篇重要的前沿论文给出清晰的研究思路看了《狂飙》大结局后,才发现我们对广东一无所知...除了焦虑,我们对变老的想象,还有什么?文字忒多的PPT,怎么做更清晰?化烦恼为菩提 | 三十二、什么更清楚就去看什么胡景涛被架走,其他全部被抓BCPA | 2023年二月讲座:张廷 ( 逸镜 )-- 照片点评 (线下 + 线上)喜报!又一家电企业用上自研MCU芯片「合体」20个月,卷出安卓最强野兽X90!这颗国产「V2」,又把发哥带飞了新州政府被指应对Delta疫情不足,保密要求导致决策延误!悉尼遭高传染性变种入侵,社区未及时得到支持!一加Ace 2支持100W超级闪充,全球首发OPPO首颗电源管理芯片MCU芯片又成香饽饽高通的PC CPU芯片有了进一步的消息深入解读Grace CPU芯片架构基于冷冻电镜解析发现,首个最清晰的LRP2蛋白结构亮相Cell,有望为阿尔茨海默病等提供新靶点2023年,停止人们对它的误解!打破翡翠行业的认知被揭!实业奔腾•科创新力量丨优博终端叶瑞权:国产系统赋能中国数字化经济,国产开源系统+国产芯片将变革产业2023年,我们对「社交」还有多少期待?【家族往事】姐姐的婚事这个世界会好吗。。。水墨《行万里》UDP 分片 与 丢包,UDP 真的比 TCP 高效吗?UDP 的应用场景当「酒店长租」成为新的生活方式,我们对话了3位真实过来人脑洞大开!“冰吸管”踢走塑料吸管,饮料更清凉还环保首颗国产DPU芯片K2成功点亮留学 │ 学习实习两不误 “线上留学”他们有了更多选择
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。