Redian新闻
>
不止华为,那些也在努力突破封锁的“中国芯”

不止华为,那些也在努力突破封锁的“中国芯”

财经

最近华为在芯片的突破让人振奋,也让社会和民众更加坚定了我们终将突破美国最后一道技术封锁的信心。当然,华为在手机芯片上的突破只是关键性的一步,前面还有更重要的关隘等着中国的研发和产业人员们攻克。当今IT领域最火的AI产业,AI算力用的GPU以及相关的训练软件仍然牢牢掌握在英伟达手中,未来如果在这一领域实现突破意义将非常重大。

今天分享一篇介绍除包括华为海思在内,国内在服务器级芯片领域的追赶者们的研发进度,文章由公众号 海兰云UDC 团队提供,对IT技术领域感兴趣的读者们可以帮忙关注下这个公众号。


由于AI算力需求暴涨,到2022年底,国内大型数据中心规模已达到540万台,在数据中心整体市场中占比高达81%。随着国内“千模大战”的展开,以及未来AI在社会各层面的广泛应用,可以预见未来中国将会成为全世界拥有大型数据中心最多的国家。

构建我们今天的信息社会的基础是服务器的算力,存力和互联能力,中国数量庞大的数据中心背后,是对各类芯片的海量需求。鉴于全球化的芯片产业链因为种种因素已变得不可靠,在芯片领域进行国产化替代成为当下社会各界关注程度最高的话题。

可以说,让我们海量的数据中心广泛安装上中国芯,是必然要走的一条道路。今天的文章就简要盘点当下主流的国产高性能芯片以及他们的发展脉络,看看目前我们已经做出了怎样的准备。


飞腾,脱下军装还是好汉



时间拨回2016年的hot chips 会议,第一个拿出64核心的大型ARM服务器芯片的,是一家具有解放军国防科技大学背景的芯片设计团队,今天ARM服务器风潮已风靡世界,有的时候不得不佩服这些前辈的前瞻性。

最早飞腾团队的工作主要集中在仿制X86架构芯片,后来又转向基于当时半开源的SPARC架构的设计工作。到2015年前后,又转向基于ARM架构设计服务器芯片。在这之后,他们就主要集中于ARM架构相关芯片的迭代与产业化推广工作。

2020年底,飞腾推出了集他们多年经验大成的SDE计划,把自家的芯片产品体系,分成了服务器芯片S系,桌面端芯片D系,嵌入式与边缘计算E系,并在当年推出了基于南京台积电16纳米工艺的S2500服务器芯片,以及使用中芯国际14纳米制程的D2000和E2000。

同时,飞腾还规划了性能大跃进的S5000系列和S6000系列,这两个系列都依赖台积电的先进制程。相比使用台积电16纳米工艺的S2500,原定使用7纳米制程,拥有80个核心的S5000,显然强大的不仅仅是规模和制程。而因为2021年下半半年之后的种种变故,台积电并没有能力完成这批芯片的流片。

不过,2021年之后,飞腾也没有停止对S5000高性能服务器CPU的复产的努力。变故之后,飞腾被迫拿出了B计划,重新打造“腾云5000C”(C可能代表China),制造工艺为中芯国际的14nm。腾云5000C的指令集架构仍然是ARMv8.2+,内核名称改为FTC862,最多核心数降低到64个(还有16/32核心),使用四个Die通过chiplet小芯片整合封装而成。目前这个方案已经进入量产阶段,性能相比S2500拥有2倍以上的提升。

与此同时,以京东为代表的一部分国内企业也开始采购S2500服务器芯片,并通过大批量使用解决了飞腾民用的适配性问题。

京东采购的数百台飞腾服务器,已经作为算力基座支撑起最近几次的618和双十一大促带来的海量订单,成功应对了大流量应用的挑战。相比其他重新自建架构的国产芯片,飞腾的自主性稍弱,但是他的适配性和可推广性更好,所以在营收方面也逐年攀升,从2017年的5000万营收,上涨到2022年的25亿元。

目前,飞腾芯片累计出货量已经达到625万片。在2023年7月,飞腾与华为鲲鹏宣布共建腾鹏生态,并通过飞腾派这个使用最低配飞腾E系列嵌入式CPU的方案,解决了开发者进入飞腾乃至腾鹏生态系统的门槛问题。

此外,飞腾团队正在与能源电力企业开展全方位合作,在发电、输电、变电、配电等领域加大产品研发力度,覆盖了发电(火电、水电、风电、核电)和电网等生产和管理重点环节,加快电力装备自主化进程。基于E系列嵌入式CPU的工业控制及信息化系统正在更广泛的能源电力应用领域落地,为“新基建”提供核心算力,也避免了特殊情况下,国内的基础设施控制体系受制于人,在遭到毁坏之后不能及时保障重新投运的问题。

而飞腾也不是脱下军装的唯一一家自主芯片设计公司,申威体系同样值得关注。


申威,冲刺百亿亿次



2023年的戈登贝尔奖当中,再次出现了来自中国团队的项目,而这次使用的超级计算机依然是来自申威自主方案的“海洋之光”百亿亿次超算系统。这是2016年以来国内先进计算领域的又一次秀肌肉,这套“海洋之光”系统相比鼎鼎大名的前辈,神威太湖之光,性能高出了10倍有余,历史性的达到了百亿亿次级别(E flops)。

申威架构的历史可以追溯到DEC公司的Alpha架构。这个代表20世纪90年代先进生产力的架构,被无锡江南计算所用来作为设计参考,2006年后进行了多次迭代。“太湖之光”上的申威26010这种拥有260个核心的特殊处理器,就是依托在2016年已经并不十分先进的国产28纳米工艺,达到了当时一度创纪录的3Tflops算力。

目前的申威选择了两条腿走路。一方面,在原有的260核心基础上拓展到390个核心,同时通过工艺升级至14纳米,将主频提高到2G以上。通过多项提升累积,在考察处理器计算能力的FP64算力上,新处理器达到了14-15T flops,而在考察处理器AI性能的FP16算力上,则达到了55-60T ops,相当于英伟达V100的水平;而他们的常规CPU 威鑫3231则通过了全新的C3B内核获得了更好的单核性能和全新的级联能力。

除了申威的CPU设计全面自主化之外,他们也构建了基于神威睿思系统的全套生态体系,而让“海洋之光”出名的,还得是清华、阿里等搞了个174万亿参数大模型,这篇文章让2021年的AI界第一次尝试利用人脑规模的大模型进行人工智能模拟。

但是申威和飞腾某种程度上都发力于服务器和超算端,他们在桌面端的性能还不够让人满意,相比之下,龙芯在桌面端的性能已经足以比肩英特尔了。


龙芯,100万起家至今



 龙芯作为中科院体系的芯片设计代表队,其诞生非常具有传奇色彩,其创始人胡伟武老师,在2001年的时候首先做出了的龙芯1号,当时胡老师全团队的科研经费只有100万人民币。

而经过了20多年的发展,龙芯的最新一代龙芯3号3A6000,在性能上已经与英特尔同是4核的10代酷睿I3相当。按照龙芯官方的说法:龙芯从2001年以来共开发了1号、2号、3号三个系列处理器和龙芯桥片系列,在政企、安全、金融、能源等应用场景得到了广泛的应用。

龙芯1号系列为32位低功耗、低成本处理器,主要面向低端嵌入式和专用应用领域;龙芯2号系列为64位低功耗单核或双核系列处理器,主要面向工控和终端等领域;龙芯3号系列为64位多核系列处理器, 主要面向桌面和服务器等领域。

2020年,龙芯中科基于二十年的CPU研制和生态建设积累推出了龙架构(LoongArch),包括基础架构部分和向量指令、虚拟化、二进制翻译等扩展部分总共近2000条指令。龙架构具有较好的自主性、先进性与兼容性。

龙架构从整个架构的顶层规划,到各部分的功能定义,再到细节上每条指令的编码、名称、含义,都在架构上进行自主重新设计,具有充分的自主性。同时,龙芯放弃了继续在法国意法半导体流片的计划,迁移回了台积电南京和中芯国际流片,并依托这两家公司的产能进行了规模化生产。

龙芯在生态和性能方面下了很多功夫,但是它的单片多核规模目前仅仅只有32核,和申威威鑫上一代相当,在目前追求机架核心数量密度的云计算时代,这个规模的可用性还有所欠缺。

不过诞生龙芯的中科院计算所,也诞生了另一家计算芯片巨头,寒武纪。


寒武纪,为深度学习而生



寒武纪公司脱胎于中科院计算所,于2016年发布了全球首款商用深度学习专用处理器——寒武纪1A处理器。同一时期,寒武纪通过和海思的交叉授权,成功将自己的IP搭载上了当时风头正盛的华为麒麟970。目前,寒武纪的主要产品包括终端智能处理器IP、云端智能芯片及加速卡、边缘智能芯片和加速卡,以及与上述产品配套的基础系统软件平台等。

上市时的招股书中也曾显示,2016年起寒武纪推出终端智能处理器产品,以处理器IP授权模式进行销售。2018年以来寒武纪推出思元100、思元270云端智能芯片及加速卡,以加速卡形式进行销售。2019 年11月,寒武纪推出思元220边缘智能芯片及加速卡,实现了终端、云端、边缘端产品的完整布局。目前,思元370和思元590的量产与应用也在加速推动中。特别是对于一些难以使用英伟达方案的场景,寒武纪已经成为了一个可以考虑的替代方案而存在。


海思,国产市占率之首



海思作为中国芯片设计的一面旗帜,在过去的20年当中做出了大量的探索性工作。今天他们已经构建了鲲鹏+昇腾的完整体系。在当下,虽然海思的AI计算芯片可能不是单片性能最强的那块,但是通过过去几年大规模建设AI集群的经验,海思已经将AI集群的规模提升到了原来的4倍。

目前,海思已经达到了单集群最大5E flops (FP 16)算力,这样的集群最多可以互联18000张高性能计算卡。而最小集群规模目前可以控制在100Pflops上,对于相对较大的模型,仅需要占用约8个标准液冷机柜就可以提供对应的算力基础设施。这种基于生态系统的完整解决方案是国内乃至全世界都少有供应商可以解决的。

2014年,海思发布了鲲鹏912处理器,2016年发布了鲲鹏916处理器。2019年1月,华为正式发布了鲲鹏920芯片,这是行业内首款7nm数据中心ARM处理器,专为大数据处理和分布式存储等应用而设计。目前在计算架构中,华为是业界唯一同时拥有“CPU、NPU、存储控制、网络互联、智能管理”5大关键芯片的厂商。而2023年的今天,新的鲲鹏和下一代昇腾也在紧锣密鼓地准备量产当中。

单单是北京门头沟区合作成立的的一座数据中心,未来2年内就要增加到4000张昇腾计算卡的规模。而目前国内的非自主制程已经推进到7纳米级别的情况下,量产一款单位密度在一亿晶体管每平方毫米的高性能AI计算卡,似乎也是可以期待的事情。那么相比现有14纳米工艺的昇腾910系列,后续进化出来的计算卡是不是有更多可以期待的地方呢?

据第三方统计表明,海思在国内市场的计算卡市占率约10%强,虽然远不及英伟达近80%的统治地位,但已经是剩下的玩家市占率之和。相较于算力充沛、高可用和普惠,昇腾面临的最大挑战还是基于国产、全栈自主可控算力系统的易用性。 现有基于其他系统研发的软件是否能容易地迁移到国产生态中,也是易用性的一个重要指标。



壁仞科技,壁立万仞



壁仞科技(Biren)这家公司,其大名在两三年前还不为人所知,取自武夷山的壁立万仞摩崖石刻;创始人没有技术背景,但是吸引了包括海思前骨干洪洲在内的一大批芯片老将。而他们的第一个芯片就是为期3年才量产,一下子技惊四座的BR100系列。

当然由于其过于先进,在实际量产之时不得不为了这样那样的原因,降低了一部分性能。但即便如此,降低后的BR100P,依然是国内现有条件下唯一可以在算力上对标H800的超高性能芯片,而且BR100P仅仅用到台积电7纳米制程,制程上相比H100/H800要落后整整一代。

壁仞研发的 OAM 服务器,首次实现单节点峰值浮点算力达到 8PFLOPS,搭载 8 个壁砺100P OAM模组,能够为广大应用场景提供超强的云端算力。同时还有以计算卡形式存在的BR104系列。

由于实力强劲,Biren也成为了2022年hot chips计算会议上四家主旨演讲企业当中唯一的一家中国企业,另外三家就是传统豪强英特尔,AMD,还有英伟达。

即便是不那么耀眼的BR104系列,在算力上也已经在350-500T flops范围,超过了英伟达的A100。自壁仞科技加入由飞桨发起的“硬件生态共创计划”后,双方已取得了一系列阶段性成果。壁仞科技BR104通用GPU与百度飞桨已完成II级兼容性测试。本次II级兼容性测试完成了涵盖自然语言处理、计算机视觉、智能推荐共计3个技术领域的18个模型的验证。经过双方联合严格测试表明,壁仞科技的BR104通用GPU在上述18个模型上的精度、速度等各方面表现满足要求,与飞桨的兼容性良好,整体运行稳定,达到了II级适配互认要求,可以满足用户的应用需求。


中国芯片的使命



2022年,我国计算产业规模达2.6万亿元,近六年累计出货超过2091万台通用服务器、82万台AI服务器,计算技术国内有效发明专利数量位列各行业分类第一。而国内大型数据中心数量的爆发性增长也为国产服务器和芯片提供了广阔市场。中国的数据中心与芯片在未来不仅能满足国内需求,也应当实现大规模出海,帮助所有后发国家打破西方的信息技术垄断。

在芯片制造之外的信息技术其他环节,我国也已经在不少方面实现了领先。比如,目前,在海南陵水已经出现了全球首个商用海底数据中心。这一新技术的出现为当下数据中心产业的诸多痛点提供了解决方案。

一方面,沉入浅海海底的数据机架密封集装箱模块可以通过内部填充惰性气体,整体延长机柜的维护周期。依靠浅海的海水提供冷却,每年节约了数以亿度计的电能和大量的冷却水,同时也解决了现有新建数据中心逐步开始远离大量需要算力的长三角和珠三角地区而带来的延迟困扰。在能源上,也可以直接和现有的浅海光伏系统以及海上风电,波浪能等能量系统进行综合利用。利用浅海海域发展算力,将形成对我国”双碳“以及”东数西算“大战略的有效支撑和补充。

像海底数据中心这样的新事物,只是当下中国正在发生的许许多多技术赶超和创新中的一个缩影。在各个行业领域内,有志于中国制造和产业升级的从业者们都在进行着不懈努力。

而芯片产业自主化,则是当下中国产业升级道路中最硬的一场攻坚战,打赢这场战役,中国的信息产业和信息安全就将实现”轻舟已过万重山“,我们的数据中心和安于其内的芯片,也应当随着人类命运共同体这一理想的建设而实现自己的技术使命。

本文由海兰云UDC团队提供,有空闲的读者可以帮忙关注下

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
菲律宾5船拟突破封锁,中国反制!第1079天,华为终于突破美国的封锁了!实验卫星突破封锁成功发射,用上中国星链还有多远?离婚时,好好说再见胭脂山上好风光今日聚焦:华为重大突破,宣告美国对中国封锁政策惨败!华为突破了封锁?打了美国的脸!高科技要起风了?看橱窗李强总理去了华为,任正非也在现场,发生了什么?从“剪图纸”到“卡流程”,那些年跨国公司是如何进行技术封锁的?不止是日本,中国也有两个地方也在“下沉”,或将会慢慢消失?那些年,那些引进的海外电视连续剧从谋女郎、金像奖影后到《热搜》,周冬雨仍在努力“突围”崔哥天天侃 | 八国联军联手封堵华为,14亿人齐心帮华为突围“中国正全方位突破美国封锁”丁辰灵:雷蒙多首次回应华为,孟晚舟提全面智能化,华为进军阿富汗黄仁勋点名华为,并表示要努力与中国企业竞争岂止华为!这两巨头也放大招,又要爆了?被以色列封锁的加沙地带,人们过得怎么样?冲破封印~“突围”1568天,华为凿出“中国芯” ​如何在努力工作中培养你的爱好从“剪图纸”到“卡流程”,那些年跨国公司是如何进行技术封锁的?|【经纬低调分享】加拿大金融圈,正在努力“讨好”大一大二留学生努力努力白努力别那么早退出赏枫大队!这4个省立公园的枫叶还在努力刷存在感!核污水让世界“破破烂烂”,还好有些专业在努力“缝缝补补”…【最新】全球高管看上海丨聚力突破,携手迈入高质量发展新时代来自美国养老院的故事北上广深,正在努力讨好24届海归《灵魂的哀伤吟游·克林姆特篇之四》中国芯片突破后,美妄图逮捕华为高管,孟晚舟不再沉默伟世通,“中国芯”SmartCore助力沉浸式座舱体验|年度好产品入围公示华为,重大突破!美媒拆了华为新机,确认是“中国芯”
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。