英伟达RTX 4090禁运真相?实际零售影响有限,国内代工生产受阻科技2023-10-19 11:10图源:Dexerto新规为中国的AI计算产业设置重重阻碍。作者 | ZeR0编辑 | 漠影芯东西10月19日报道,在美国商务部工业和安全局(BIS)周二公布了先进计算芯片出口管制新规(美国升级AI芯片和半导体设备禁令,壁仞科技、摩尔线程被列入实体清单)后,英伟达RTX 4090显卡禁运风波闹得沸沸扬扬。根据英伟达发布的最新公告,临时最终规则对超过某些性能阈值的芯片出口到中国等地施加了额外的许可要求,包括但不限于A100、A800、H100、H800、L40、L40S、RTX 4090。英伟达DGX、HGX系统等任何包含一个或多个涵盖上述芯片的系统也适用于新的许可要求。此消息一出,游戏圈气氛刹时变得紧张起来。因为这次不仅是用在数据中心的AI计算芯片,就连英伟达的消费级旗舰显卡GeForce RTX 4090也在被限制之列。而如果后续限制规则不变或进一步升级,影响范畴可能扩大至更多英伟达下一代旗舰及高端消费级显卡。不知是被抢购一空还是囤货炒价,很快国内主流电商平台上的RTX 4090公版/非公版显卡已经奇货可居,绝大部分显示“缺货”状态。不过关于RTX 4090的“禁运”问题,影响还未一锤定音,目前看主要影响的不是零售,而是国内相关代工生产。根据出口新规,美国商务部工业和安全局(BIS)引入了一项豁免,允许出口用于消费应用的芯片。新规也对少量高端游戏芯片制定了“通报要求”,以提高出货量可见度。另据港媒HKEPC报道,美国商务部就出口管制文件作出澄清,关于RTX 4090禁令,出口消费级应用可申请作出豁免,因此RTX 4090可以在中国零售市场售卖,只是不能用作商用及生产,中国代工厂不能生产RTX 4090。但由于该消息并未标注明确来源,真实性尚待考证。01.更改受限芯片性能红线,影响英伟达/英特尔/AMD多款芯片出口为什么RTX 4090会受影响?这与先进计算芯片出口管制新规的调整有关。去年10月7日实施的出口管制版本,主要是限制“处理性能”和“互连带宽”,处理性能限制阈值是所有处理器单元的“位宽x算力(bits x TOPS)”总和≥4800,互连带宽的限制阈值是总双向传输速率达到或可编程到≥600Gb/s。为了合规,英伟达、英特尔都采取了向中国市场推出“降速版”AI芯片的措施:英伟达将对华销售的H800/A800互连带宽速度从H100/A100的600Gb/s降到400Gb/s,英特尔将对华销售的AI训练芯片Gaudi2集成以太网端口数量从国际版的24个降至21个。此次新规进一步收紧,不限制“互连带宽”了,改为限制“性能密度”,并用“总处理性能(TPP)”来取代之前的“位宽x算力”。根据ECCN 3A090修正,满足以下任一条件,就会受出口限制:1、3A090a:针对最高性能芯片(1)TPP≥4800。(2)TPP≥1600,且性能密度≥5.92。受限于这一区间的芯片预估包括:英伟达的H100、H800、A100、A800,英特尔的Max 1100、Max 1550、Gaudi2、Gaudi3,AMD的MI250、MI250X、MI300、MI300X、MI388等。2、3A090b:针对次高性能芯片(1)2400≤TPP<4800,且1.6≤性能密度<5.92。(2)TPP≥1600,且3.2≤性能密度<5.92。受限于这一区间的芯片预估包括:英伟达的L40、L40S、A30、RTX 4090,英特尔的Flex Series 170,AMD的MI210、MI220等。此外,一些性能略低于上述限制阈值的芯片出口,属于“灰色地带”,也要向美国政府通报,由美国政府决定本次出口是否需要申请许可证。任何包含≥500亿个晶体管并采用高带宽内存(HBM)的芯片或计算机,都需要先获得许可证,才能向中国等地出口。02.TPP、性能密度怎么算?根据注释,3A090规定的芯片类型包括图形处理器(GPU)、张量处理器(TPU)、神经处理器、存内处理器、视觉处理器、文本处理器、协处理器、自适应处理器、现场可编程逻辑器件(FPLD)、专用集成电路(ASIC)。具体计算方法为,“总处理性能(TPP)”是2 דMacTOPS”ד操作位长度”,在集成电路上的所有处理单元上相加。对于3A090规定的同时提供稀疏矩阵和密集矩阵处理的芯片,“TPP”值是处理密集矩阵(如无稀疏性)的值。“性能密度”即TPP除以“适用die面积”。“适用die面积”以mm²为单位测量,包括使用非平面晶体管架构的工艺节点制造的逻辑die的所有die面积。“MacTOPS”是用于乘法累加计算(D=AxB+C)的每秒Tera(10^12)操作的理论峰值数。“TPP”公式中的2基于将一次乘法累加计算(D=AxB+C)作为2次操作的行业惯例。因此,2 × MacTOPS可能对应于数据表上报告的TOPS或FLOPS。乘法累加计算的“操作位长度”是乘法操作输入的最大位长度。“MacTOPS”的比率应按理论上可能的最大值计算,被假定是制造商在年度或集成电路宣传册中宣称的最高值。例如,“TPP”阈值4800可通过8位600tera整数运算(或2×300MacTOPS)或16位300teraFLOPS(或2×150MacTOPS)来实现。如果芯片设计用于MAC计算,具有实现不同“TPP”值的多个位长度,则应根据3A090中的参数评估最高的“TPP”值。出口管制新规还为具有AI功能的消费级芯片增加了经通报的先进计算许可例外(NAC)。此许可例外适用于3A090.b和3A090.a规则下的芯片,即在收到向中国等地出口、再出口及转运的通报后,美国政府将决定是否可以适用该许可例外或需要许可证。03.结语:新规直冲AI大模型训练,短期内不会对芯片巨头业绩造成冲击《先进计算芯片规则(AC/S IFR)》将在1个月内的11月16日生效,公众评论的截止日期为规则公开展示之日起60天。而英伟达2024财年第三季度截至2023年10月29日。也就是说新规实施不会对英伟达最新第三季度的财务业绩产生影响。不排除英伟达重施故技,再度为中国市场设计“阉割版”芯片的可能性。新规进一步扩大对先进计算芯片出口管制范围的深度和广度,表面上说是为了“国家安全”,实际上是对中国的AI和高性能计算产业围追堵截、设置重重阻碍。新规还寻求涉及基于硬件的技术解决方案的额外豁免建议,以限制具有受关注能力的大型两用AI基础模型的训练。微信扫码关注该文公众号作者戳这里提交新闻线索和高质量文章给我们。来源: qq点击查看作者最近其他文章