突发!英伟达H800/A800禁令竟提前生效,但4090意外豁免!
点击下方卡片,关注“CVer”公众号
AI/CV重磅干货,第一时间送达
点击下方卡片,关注“CVer”公众号
AI/CV重磅干货,第一时间送达
AI/CV重磅干货,第一时间送达
转载自:新智元
转载自:新智元
【导读】芯片禁令竟提前24天生效了?美商务部表示,取消30天豁免期,从10月23日起,即日生效。与此同时,根据英伟达提交的最新文件,RTX 4090不再受到影响。
而根据钛媒体报道,腾讯、字节跳动等赶在禁令生效前大量采购的H800,至今尚未拿到现货。
根据英伟达向美国证券交易委员会(SEC)提交的文件,美国政府通知英伟达,芯片禁令变更为10月23日起立即生效,涉及的芯片为——H800、A800、H100、A100、L40S。
而RTX 4090不再受到影响。
扫码加入CVer知识星球,可以最快学习到最新顶会顶刊上的论文idea和CV从入门到精通资料,以及最前沿项目和应用!
生效期匆忙提前
目前美国商务部、AMD等都未对此发声。
事关国内AI大模型的算力训练,众多业内人士对此表示忧心忡忡。
如此严苛的禁令面前,我国可以采取哪些措施来规避?在出口管制方面,有哪些漏洞可以利用?
亦或,我国是否能取得革命性的算法创新?
昨天,著名半导体分析外媒SemiAnalysis给出了长文分析。
AI芯片「性能密度」是关键
美国政府摆明了一个态度——高端AI芯片必禁无疑,毫不含糊!
之前的测试标准是,总双向传输速率达到600 GB/s,以及总TOPS x 位长(bit length)达到4800或以上。
这就意味着,供应商可以通过降低芯片的总双向带宽来应对这一限制,同时还能在实际AI应用中提供不错的性能。
英伟达在H100和A100的基础上推出的「特供版」H800和A800,已经向中国市场出货了数十万块。
而此次全新的芯片禁令取消了带宽限制,相当于直接把英伟达的A800、H800,英特尔的Gaudi 2、Gaudi 3、AMD的MI250X和MI300等芯片,一口气全都给禁了。
除了限制芯片的总体性能外,美国政府把其他漏洞也补上了。
比如在AI超算中,可以通过设计让每个芯片在单独使用时不会超过性能阈值,但在高带宽互联在一起时可以超越这个限制。
所以,这次禁令新规中,还有一个新的性能密度阈值限制。绝对禁用值为5.92,许可值为3.2。
性能密度,即TPP(Total Processing Performance)除以芯片面积。
这就防止了那些尺寸较小、看起来绝对算力较低,但从计算角度看仍然属于密集/高效的芯片出货。
总之,这次的严苛程度,令人瞠目结舌。
英伟达的L40S也被波及(有的买家只看TFLOPS的规格,期待这款芯片能达到和A100类似的性能)。
根据「性能密度」的限制,诸如AMD MI210,英伟达RTX 4090、L40,甚至连性能羸弱的L4,都会受到新规的影响。
RTX 4090被禁,在坊间引起巨大的风波——连游戏都不能打了??
有业界人士分析,如果同时考虑FP8矩阵乘法+FP16累加的话,320 TFLOPS的算力甚至会让RTX 4080都在被禁之列。
但SemiAnalysis作者详细分析了禁令的字里行间,得出的结论是——4090应该可以获得出口许可证,不会被禁。
英伟达还能造「特供版」吗?
简单来说就是——不能!
即使采用全新的简化设计,英伟达也无法完全规避这些限制。
密度规则的限制下,英伟达只能被迫一路退回到2014年的12nm工艺V100。
他们也不可能靠塞进一堆空白硅片来绕过密度规则,因为新禁令已经把这条路堵死了。
这次的新禁令,从根本上禁止了开发高性能ASIC的可能,这也就意味着,在任何通过规定的硬件上,大规模Transformer模型都无法高效运行。
目前,整个行业都在追求在现有芯片(英伟达的GPU/谷歌的TPU)上研究AI技术,运行各类Transformer的变体。
另外还有一个思路,就是探索与全世界其他国家都不同的AI技术理念空间。
毕竟,大脑传播信号的规律,和当前的软/硬件架构也并不相同。
晶圆制造设备新限制
不过作者认为,与AI芯片相比,设备控制清单的变化影响要小得多。
美光D1 Beta是出货量最高的DRAM,它采用DUV SAQP工艺制造,长鑫存储的路线图上也标出了D1 Beta
新增的大部分内容与日本和荷兰的限制相一致。简而言之,这些工具包括:
用于锗硅的外延设备、用于三维结构的某些干法蚀刻设备、用于锗硅和三维结构的湿法蚀刻。
与互连相关的各种沉积设备、钴沉积、用于碳硬掩膜的某些工具、用于阻挡层、衬垫和钨互连的某些原子层沉积 (ALD) 设备。
与钼相关的沉积工具、掩膜制作工具、EUV小球以及某些DUV光刻工具。
2022年规定的受出口管制的蚀刻工具范围非常有限。根据旧规定,只有各向异性干蚀刻被包括在内。
各向异性是指只在单一方向(侧向)进行蚀刻,干蚀刻是指使用等离子体蚀刻剂去除材料。现在,新规定将蚀刻范围扩大到各向同性蚀刻(垂直)。
在湿蚀刻方面,增加了「硅锗与硅蚀刻选择性比至少为 100:1 」的湿蚀刻工具。具体来说,目标工艺是去除用于形成GAA晶体管纳米片的牺牲硅锗层(sacrificial SiGe layers)。
GAA栅极金属叠层工艺流程:步骤(b)和(g)必须具有高度选择性,也就是只去除SiGe,而不去除晶格中的Si
最大的新增内容当然是对DUV光刻限制的修改。
英国效仿荷兰的出口管制措施,增加了对指定载台套刻精度(Dedicated Chuck Overlay)的限制——目前荷兰的出口管制措施限制套刻精度低于1.5纳米的工具的出口。
光刻技术中的套刻精度是指在晶片上依次印刷的不同层或图案之间的对准精度。
多重图形(muti-patterning)需要良好的套刻精度,台积电和英特尔就是通过套刻精度实现7纳米工艺的。对荷兰的限制阻碍了2000i等工具的出口。
然而,美国的新规定更进一步,限制了套刻精度为2.4纳米及以下的工具的出口,其中包括ASML的1980i——台积电、英特尔和中芯国际的7纳米技术所使用的工具。
美国可以通过0%的最小阈值来限制这些叠加在1.5纳米和2.4纳米之间的工具,也就是说,如果某个工具的任何部分包含美国技术,该工具就必须满足许可证的要求。
总的来说,美国在这次出台的新规中加入了大量荷兰和日本上一轮出口管制的内容。甚至,部分规定是一字不差地复制了日本规定的译文……
相关企业:中国需求强劲
就在新规定发布的第二天,ASML于10月18日举行的财报电话会议上表示,新的出口管制措施会极大地限制向中国销售设备。而这些设备的价值,大约会占到全年对华总出货量的10-15%。
值得注意的是,ASML最近一个季度有46%的收入来自中国大量涌入的急单。然而在禁令出台之后,该季度的总收入中,会有5% - 7%受到影响。
ASML首席执行官Peter Wennink表示,中国有大量的半导体生产需求,而这正是他们研究中国客户扩张计划的时候,同时也正是中国在这些领域不断投入,加大产能的地方。
最大的蚀刻公司Lam Research的情况也类似。
公司表示,2023年9月季度营收环比反弹9%,部分原因是DRAM支出好于预期,特别是来自中国国内客户(CXMT)的支出。
此外,Lam Research还特别指出,中国DRAM抵消了非中国客户DRAM支出的疲软。来自中国的收入环比飙升102%,达到 16.71亿美元(同比增长9%,超过了此前21年9月季度16.08亿美元的高点)。
Lam Research的管理层预计,到2023年12月季度,对中国的销售仍将保持强劲势头,预计对中国的销售占收入的比例将保持在相近的水平,总收入预计将在季度中点增长6%,达到37亿美元。
说到2023年10月的限制规定变化所带来的影响,Lam Research预计不会对业务造成任何实质性影响,部分原因是他们对中国的部分设备销售已经受到了重大的限制。
纵观四家主要半导体公司过去七年的收入趋势,对华销售额合计已从2016年的平均每季度约12亿美元(占总收入的 17%)增长到2021年的平均每季度51亿美元(占总收入的28%)。
相比之下,2023年却大不相同——从第一季度的37亿美元低点,到第二季度的51亿美元(接近2021年第二季度的58亿美元高点)。
假设应用材料(Applied Materials)和东京电子(Tokyo Electron)第三季度对华销售额的比例与Lam Research和ASML相似(分别为 48% 和 46%),则第三季度对华合计销售额将达到87亿美元,比2021年第二季度的高点高出50%。
终端产品市场往往是全球性的,且是相互关联的。因此,中国国内和国外的半导体封装投资周期在很大程度上是同步的。
当前的半导体行业的低迷期(当然不包括与AI相关的芯片)已持续近两年。
虽然业内人士可能认为反弹指日可待,但迄今为止,实际投资并未出现任何明显地上升。
但中国除外——半导体相关的投资大幅反弹,远远领先于世界其他地区。
ICCV / CVPR 2023论文和代码下载
后台回复:CVPR2023,即可下载CVPR 2023论文和代码开源的论文合集
后台回复:ICCV2023,即可下载ICCV 2023论文和代码开源的论文合集
计算机视觉和Transformer交流群成立
扫描下方二维码,或者添加微信:CVer444,即可添加CVer小助手微信,便可申请加入CVer-计算机视觉或者Transformer 微信交流群。另外其他垂直方向已涵盖:目标检测、图像分割、目标跟踪、人脸检测&识别、OCR、姿态估计、超分辨率、SLAM、医疗影像、Re-ID、GAN、NAS、深度估计、自动驾驶、强化学习、车道线检测、模型剪枝&压缩、去噪、去雾、去雨、风格迁移、遥感图像、行为识别、视频理解、图像融合、图像检索、论文投稿&交流、PyTorch、TensorFlow和Transformer、NeRF等。
一定要备注:研究方向+地点+学校/公司+昵称(如目标检测或者Transformer+上海+上交+卡卡),根据格式备注,可更快被通过且邀请进群
▲扫码或加微信号: CVer444,进交流群
CVer计算机视觉(知识星球)来了!想要了解最新最快最好的CV/DL/AI论文速递、优质实战项目、AI行业前沿、从入门到精通学习教程等资料,欢迎扫描下方二维码,加入CVer计算机视觉(知识星球),已汇集近万人!
▲扫码加入星球学习
▲点击上方卡片,关注CVer公众号
整理不易,请点赞和在看
▲扫码或加微信号: CVer444,进交流群
CVer计算机视觉(知识星球)来了!想要了解最新最快最好的CV/DL/AI论文速递、优质实战项目、AI行业前沿、从入门到精通学习教程等资料,欢迎扫描下方二维码,加入CVer计算机视觉(知识星球),已汇集近万人!
▲扫码加入星球学习
整理不易,请点赞和在看▲点击上方卡片,关注CVer公众号
微信扫码关注该文公众号作者