租不如买,买不如自己造
文 | 某肉食动物
2022年8月31号,正当笔者和朋友探讨国产GPGPU(通用图形处理器)的发展之时,突然得知了一条爆炸性的消息,美国有关部门宣布对中国禁运先进制程大规模GPGPU,涉及到的是英伟达的100系列和AMD的MI系列当中较为先进的型号,性能高于英伟达的A100的板卡,将会全部禁售。联想到前段时间刚刚讨论过的芯片法案,新的制裁就这么不声不响的到来了。
而这个消息也仅仅持续了2-3天,英伟达随后披露了制裁的详细文件,到2023年9月1日之前,中国本土地区(含港澳)的订单依然可以正常收发货,但是之后将会受到美国有关部门的管控。
为什么是它们?
与众所周知的GA102芯片不同一样的是,A100所使用的GA100芯片在设计规格上更大更激进,前者用的是三星的便宜货8纳米制程,面向的是消费级和基础工业级市场,存储接口预留的是相对性能尚可,价格也不算高的GDDR6/GDDR6X,最后成品也就是大家熟悉的3080/3090系列;
而后者是英伟达专门为高等级AI和科学计算准备的,制程上用的是台积电7纳米,面积上多了200平方毫米,接近一般芯片尺寸的上限850平方毫米,晶体管数更是达到了542亿之多;特别是存储接口选择了更贵,带宽也更大的HBM2e,最多可以在封装中集成80G的HBM2e显存,显存读写速度数以T计,两者之间的速度差距在2-3倍左右。当然1万多美元一块乞丐版A100的价格也让很多小伙伴不得不掂量下自己的钱袋子,比如笔者所在公司的人工智能相关项目经常就用3080和3090代替A系列专业卡,特别是A100的存在。
而名单上另一个名字,H100,则是英伟达还没正式发售的面向未来的千亿亿次AI超算的主要算力负载芯片,第一个在价格爆炸的台积电4纳米下再次挑战了一般芯片尺寸的上限的家伙,在814平方毫米的尺寸下,集成了整整800亿颗晶体管,完全体的参考功耗预计能轻松突破1马力,也就是735瓦。
至于另一家被大家戏称为农企的AMD,他们出现在禁运名单里的MI250X,第一个用户就是现在公开的美国E级超算Frontier,利用MI250X优异的性能,Frontier不但迈过了百亿亿次大关,同时还完成了成为了第一个跨过50T算力每千瓦功耗的超算;我们在2年以前讨论过的日本超算富岳,当时费劲心力,也仅仅是达到了16T算力每千瓦功耗的指标;同样是台积电7纳米制程,在同样的功耗,AMD能达到日本人三倍的性能,不得不说,AMD是有设计上的独到之处的。
目标是谁?
前段时间,我们谈到过美国本次芯片法案针对中国的不仅仅是芯片制造,还有2000亿美元投资是针对基础科学的重点进攻,其中AI和高性能科学计算方向是重点之一,双方将会在相关领域展开激烈的厮杀。至于这一轮的制裁目标,有的人说靶子是人工智能企业,也有人说目标是国家超算中心,这两个都只能说放在这里并不适当。
人工智能企业一般根据自身情况,会考虑少量采购辅助大量租赁相关板卡的方案,或者直接从云计算厂商租赁计算小时进行模型训练,如果自身用量较大,会选择类似特斯拉和谷歌那样,自研相关芯片用于生产实践,特斯拉的Dojo和谷歌的TPU,都是自研方案的代表,国内企业当中BATH也都有类似的自研方案投入了实际运用。
特别是在现在经济下行阶段,前几年购买的GP100和V100虽然慢了点,但也没到随便乱丢的时间点。而用于实际现场商用的模型推断的话,可选的方案就非常多了,各类边缘计算板卡,FPGA,NPU方案可以说是百花齐放,则并不一定要使用这么昂贵的方案。
而国家超算中心层面,上次大规模使用英伟达和AMD两家的GPU进行并行计算还得追溯到10多年前,天河1号上的HD4870X2和天河1号A上的M2050,和如今相比,天河1号系列的算力差了1000倍之多。在那之后,所有的国家超算中心,就直接被美方禁运了英伟达和英特尔方案的芯片。
所以说国家超算中心层面采购这三款板卡用于百亿亿次超算的使用,不得不说,没那个可能性,也没那个必要性。特别是去年清华大学和阿里达摩院曾在某海外刊物上发表过著名的人工智能超大模型的论文《如何在3700万核的系统上模拟人脑级别的人工智能模型预训练》,从侧面暗示了国产新一代自主百亿亿次级超算,除了FP64性能上处于绝对领先之外,在AI极大规模模型训练上也可以部分代替英伟达板卡实现相关功能。
尽管我们的最先进的大芯片制程仅仅只有受到美国人管制的中芯国际14纳米,尽管我们的超算可能相比对手的更耗电,但是我们依然可以说我们并不比竞争对手落后。芯片制程落后不代表我们不能利用美国人20年以前放弃的相关技术,独自魔改出足够和对手直接竞争的对等产品。
当然也有的老板会选择蹭热点,比如说小鹏汽车的创始人何小鹏说自己已经囤积了足够的相关板卡用于AI数据中心的建设投入。但一言蔽之说制裁和禁运会造成多么巨大的影响的也未免有点过于武断了些。所以分析下来看,其实美国这一轮出招下来,表态的意义大于实质,实际上美方也没想清楚禁运的目标到底是什么。
而一部分地区招商引进的人工智能云计算厂商,特别是建立在相关软件生态体系下的,可能反而是现在受影响最大的,他们过于依赖英伟达的全套方案,硬件和软件都是英伟达的,这就失去了退路。
美国人还有什么后手?
2013年美国人禁运了我们超算上的服务器芯片,2019年禁运了我们的EUV光刻机,2020年禁运扩大到整个相关设备,今年又扩大到A100和H100在中国本土地区的广泛使用,后续可能还会对ARM架构服务器和DPU进行禁运。同样,因为第一款GAA芯片是中国设计韩国三星3纳米制程生产的矿机芯片,美国人已经对设计GAA的相关软件进行了禁运,以限制中国企业在相关领域继续获得相应的设计能力。
后续可能会进一步扩展到对28纳米以上相关设备和耗材的禁运,还会针对现有的国产设备企业的国产化半导体生产设备进行定点打击,制裁里面的美国产零部件,同时禁运高等级的检验检测设备。总之在一个较长的时间之内,逐步逐步的通过文火闷炖的方式,一步一步绞杀我们的整个产业。
我们该怎么办?
现在制裁和禁运的大锤已经落下,我们不得不面对这些问题,只能采取一些必要的措施了:
1. 国内的先进制程开发不能断线,SW26010升级为26010P,工艺制程从28纳米升级到14纳米,性能提升了接近5倍,由此可见,架构迭代与制程进步带来的性能进化是巨大的,哪怕每代进步实际达到30-50%都是非常划算的。现有的国内先进制程的极限,如果能保证10-25%的大芯片良率,辅助以必要的缺陷管理,在商业上是足以成功的。我们不能保证我们的生产出来的芯片每一片都完美无缺,但是我们可以用设计和封测两个方向去屏蔽不良的工作区,这样就把本来不合格的芯片变为合格品了。
2. 加大对两个美国企业在华团队的支持,推动他们将核心开发团队放在中国本土,通过智力资源对相关业务进行锁定,让美国人不得不面对,美国企业研制的先进制程芯片,是在中国本土由中国工程师设计的。这次我们就看到了英伟达为中国团队申请了相关豁免,中国团队的工程师将会继续参与相关芯片的设计开发。
3. 继续扶持现有的创业公司,并支持他们做大做强,我们很幸运的看到国内已经出现了3-4家相关方向的企业已经开始进行相关研发,其中天数智芯和壁仞已经用台积电工艺做出了足够先进的方案,能够和英伟达们扳一下手腕了。我们也期待他们真正能在商业上成功,而不是仅仅依靠融资和资本市场上说故事来维持公司运营。
4. 在软件层面组建相关行业联盟,促进各家企业的解决方案在底层计算上使用原创性的公共接口,而不是现在这种,移植cuda部分代码加一点自己造的轮子就变成了自研软件平台了。
总之,一方面我们需要推动自己的方案能真正被高校学生和相关科研人员大规模用起来,另一个方面推动我们的制造能力能得到大幅度提升,芯片产业不同于两弹一星的最重要的一点是,需要我们的芯片在商业上是成功的,而我们每一个人,也都期待着,“租不如买,买不如自己造”的那一天。
总之还是如上篇文章《美国芯片法案来了,这次能锁死中国吗》中所说的,从18年贸易战以来,不断有声音质问中国何必什么都要自己造,为什么不老老实实用西方的东西。是我们非要什么都自己造吗?当然不是。现实是放弃自己制造的能力,就只能接受西方高昂的价格,以及各种附加的苛刻条件。目前我们能做的唯有放弃幻想,独立自强。
近期文章导读:
重庆山火救援中,英雄的人民从哪里来?
明星偶像宁有种乎?
苏联危楼最后的推墙手,戈尔巴乔夫死了‘
微信扫码关注该文公众号作者