Redian新闻
>
英伟达巅峰时刻!市值超3个茅台,但国产大模型根本不配

英伟达巅峰时刻!市值超3个茅台,但国产大模型根本不配

财经



原创首发 | 金角财经(ID: F-Jinjiao)
作者 | 林石

最近微信改版,有读者说找不到我们
大家记得把金角财经设为星标
不错过任何一篇精彩文章

5月30日注定是要被历史铭记的一天,在这一天英伟达突破万亿美元市值屹立世界之巅。


英伟达方面表示,目前订单都已经多到做不过来,接下来半年订单都会大超市场预期。该公司股价近期出现的飙升,这得益于AI处理器需求的推动。


5月25日,英伟达发布一季度财报,AI芯片所在数据中心业务的营收创历史新高,保持10%以上同比增速。就在业绩电话会期间,英伟达股价已经迅速上行,涨至390美元上方的历史最高水平,盘后涨幅超过28%。


摩根大通近日发布的一份报告就指出,英伟达今年将在整个AI产品市场占据60% 的份额。排在第二位的是博通,其专用集成电路(ASIC)预计将占到 13% 的收入份额。台积电排在第 17 位,其收入占比为 3%。英特尔和 AMD 则都低于 1%。


以ChatGPT为例,其训练和推理过程用到了超过1万枚英伟达A100 GPU芯片的AI计算集群。花旗集团分析师Atif Malik预估,ChatGPT可以为英伟达在一年内带来30亿美元至110亿美元的销售额。


对于国内蓬勃发展的大模型业务来说,由于美国方面的出口管制禁令存在,英伟达只能向中国客户提供A100 GPU芯片、H100 GPU芯片的平替版本,很难直接运用到最为先进的算力。


这意味着,国内大模型将很难直接参与到这场由英伟达掀起的技术与资本的盛宴。


与此同时,国产大模型算力落后,很有可能就此被拉开距离。时间,已经不多了。


点击下方名片,关注金角财经,我们将为你剖析更多社会热点,拆解经济事件背后的逻辑。


底层算力的落后


对于国产大模型而言,版本落后已然成为现实。


5月29日,英伟达CEO黄仁勋在COMPUTEX大会上宣布,搭载了256颗GH200 Grace Hopper超级芯片的新型DGX GH200人工智能超级计算机现已投入量产。


黄仁勋在演讲中说道,“我们已到达生成式AI引爆点。从此,全世界的每个角落,都会有算力需求。”而这一台被黄仁勋描述为世界上第一个具有巨大内存的加速计算处理器,也将成为AI时代的“算力杀器”。


类似ChatGPT的语言大模型,必不可少的三件套是算力、算法和参数。算法、参数主要取决于一家公司的技术水平和投入,算力往往取决于你手上有多少芯片。


用前不久也入局大模型的人工智能公司“出门问问”CE0李志飞的说法就是,做大模型的门槛至少需要5000万美元,其中的2000万美元都得用来购买算力。


令人遗憾的是,国产大模型现阶段难以染指。发布会上黄仁勋指出,谷歌云、Meta和微软将会是首批获得DGX GH200访问权的客户。


要想大模型变得更“聪明”,就必须适配最先进的GPU芯片。失去了英伟达的最新芯片,在大模型的底层架构上已经落后版本。


目前英伟达最主流的GPU芯片,是2020年5月公布的A100,按照当时黄仁勋在发布会上的说法,A100是“迄今为止人类制造出的最大 7nm制程芯片,集AI训练和推理于一身,并且其性能相比于前代产品提升了高达20倍。”


没想到的是仅仅两年后,英伟达就已经推出了性能全面升级的H100——晶体管数量接近翻倍,部分性能是A100的六倍,黄仁勋称其为“全球首个为生成式 AI 专门设计的计算机芯片”。


由于去年8,美国对英伟达生产的A100 GPU芯片、H100 GPU芯片实施了出口管制,而GH200 Grace Hopper超级芯片正是由H100 GPU芯片与其它产品组合而成,国产大模型短期内用上这个算力杀器几乎无望



国产大模型,退而求其次
 

在应对“芯片荒”的问题上,英伟达出于商业层面的考量,基本上与中国企业站在同一战线上。


毕竟去年8月的芯片禁令出台之初,英伟达就曾发布财报预警,将可能会失去到中国市场2022年第三季度约4亿美元的潜在销售。受此消息影响英伟达的股价连续暴跌,一度跌到139.37美元,对比历史高点下跌约 57.5%。


若非ChatGPT在今年年初直接引爆科技圈,英伟达很难通过硬核科技能力破局,黄仁勋表示:“我们看到了业界对NVIDIA计算平台的强大需求。”


面对政策方面的“卡脖子”,英伟达先是争取到了一个缓冲时间,可以在2023年3月前继续向美国客户出口(到中国)的产品提供A100,可以在2023年9月前继续履行A100和H100的订单。


在缓冲期内,黄仁勋着手准备“平替版本”来应对管制条款,仅仅一个多月后,英伟达就已经宣布,将向中国企业出口符合出口管制的A800 GPU——单卡大部分性能与A100GPU几乎相同,仅互联带宽从600GB/s降低到400GB/s,意味着同样数量GPU组成的集群算力下降。


今年3月,最新一代的H100芯片的“最佳替代产品”H800也投产发售,英伟达确认,阿里巴巴、腾讯和百度等中国厂商已经在用了。


黄仁勋已经铺好了路,国内研发大模型的企业们也就不约而同地开始了囤货。


网络流传的一份“阿里AI专家交流纪要”显示:阿里云上至少有上万片的A100,今年芯片采购量在1万枚左右,其中6000枚是H800;百度则在年初紧急下单了3000台由8张A800组成的服务器,共2.4万张卡,预计全年百度会有A800和H800共5万枚的需求。


腾讯云4月发布的新一代HCC高性能计算集群,则是明确搭载了英伟达的H800芯片,而且是国内首发。不过腾讯云并未透露具体使用了多少H800。


在国内企业疯狂下单的加持下,无论是原本的A100芯片还是专供版的A800、H800,出货周期都在大幅上升。据业内人士透露,目前的拿货周期已经从原本的一个月左右延长到了三个月或更长,部分新订单甚至“可能要到12月才能交付”。


供不应求的另一个结果,则是芯片价格的上升。


原本定价1万美元的A100,从去年12月开始上涨,截至今年4月上半月,其5个月价格累计涨幅达到37.5%。如今在国内的价格已经涨到了10万人民币以上一枚。专供中国的A800芯片,京东上标价是88999元,甚至已经高出了原版A100的定价。至于最新版的H800芯片,目前还没有大范围进入市场,对比H100的价格大约是25万元,估计售价也至少在20万以上。


按照训练一个ChatGPT用1万枚A100来算,恐怕算力就得花10亿元。



留给国产大模型的时间不多了


为了不被美国方面的政策原因“卡脖子”,不少国内科技巨头都在尝试自研芯片。


今年3月发布国内第一个大模型“文心一言”的百度,旗下就有自研的“昆仑芯”。2021年的时候,独立拆分并完成融资的昆仑芯,估值已经达到130亿元。先后在2018年、2021年推出了两代芯片,目前百度昆仑芯前两代的产品已有数万片的部署,第三代会在明年的年初上市。


根据百度CEO李彦宏的说法,昆仑芯片目前则在大模型的推理侧已经有了应用——“昆仑芯片现在适合做大模型推理,将来适合做训练,这件事百度做了10年以上,而之所以它能够用在大模型的推理上,是因为有反馈、有应用,当时做搜索时买别人芯片太贵,1万美元一片,我们自己做,2万元人民币就做下来了,所以逼着自己做出了芯片。”


阿里2018年成立的平头哥,则是在2019年的云栖大会上,推出了自研AI推理芯片含光800,当时号称部份性能比业界最好的AI芯片性能高4倍。不过该芯片目前应用在阿里云上,并未单独对外公开发售。


阿里云4月推出的大模型“通义千问”,就使用了自主研发的含光800芯片。“通义千问”自己的回答是,“在实际训练中,我使用了阿里巴巴达摩院自主研发的大规模分布式计算平台,包括含光800、云计算平台等。在硬件设备方面,我使用了自主研发的高性能计算芯片“含光800”,这款芯片能够满足我的训练需求。”


巨头之外,国产AI芯片企业也试图分一杯羹。


目前,国内的AI芯片企业包括海光信息、寒武纪、平头哥、华为昇腾、天数智芯、燧原科技、摩尔线程、壁仞科技、沐曦等公司。


但国产芯片离英伟达还有一大段距离。


目前大模型对算力的需求主要体现在训练和推理。简单打个比方,训练就是培养一个ChatGPT,推理就是让ChatGPT帮你生成图片、做ppt。


现阶段来看,国产AI芯片基本都还未拥有独立支撑起大模型训练所需的能力。如壁仞科技(通用GPU芯片BR100)、天数智芯(“智铠100”)、寒武纪(云端推理思元270),基本只能支持多媒体和图形处理的单精度浮点计算(FP32)。


作为高算力计算的硬性指标——双精度浮点计算能力(FP64),大多都并不具备。国内唯一支持FP64双精度浮点运算的海光DCU(协处理器),性能也只有A100的60%左右。


如果美国对英伟达的出口管制仍将继续存在,而国产AI芯片又难以突破的话,用于训练国产大模型的GPU芯片,最好的也不过是英伟达2022年推出产品的平替版本。


可以说,留给国产大模型的时间已经不多了。


参考资料:

硅基研习社:《英伟达帝国的一道裂缝》

集微网:《「芯历史」从“显卡大厂”到“AI霸主”,英伟达的版图没有边界?》

差评:《英伟达正在“垄断”AI产业,国内厂商准备好了吗?》

36氪的朋友们:《微软/谷歌/亚马逊展开AI“军备竞赛”:摆脱英伟达束缚,上马自研芯片》



作者介绍
Author


商务合作 | 加微信:JinjiaoBD

好看你就点一下











微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
热点 | 国产大模型“混战”:科技互联网巨头纷纷入局,商业场景出现“分流”国产大模型的出路找不到了?国产大模型,到底行不行?长篇小说《如絮》第一百零九章 西维吉尼亚-旧金山-1952-1955年 1 生根之处巅峰时退圈嫁“穷小子”,20年后婚姻过成了这样?网友:《浪姐4》不请她可惜了我和遐西(xiaxi)的网络缘分GPT-5根本不存在!OpenAI 表态;王小川讽刺李彦宏活在平行宇宙,百度肖阳回击;阿里、亚马逊等相继发布大模型产品|Q资讯英伟达市值超万亿美元 刚推出含256个GPU的AI超级计算机英伟达成为首家市值超万亿美元的芯片公司|首席资讯日报国产大模型进步有多快?我们用Z-Bench对10个模型进行了能力测评苏妈战老黄!官宣AMD大模型专用卡,对标英伟达H100,可跑更大模型英伟达市值超1万亿美元;百度10亿元基金投向大模型;出门问问递交上市申请丨AIGC大事日报德州众院一致通过永久夏令时,但国会还不允许360正式发布自研大模型,周鸿祎:国产大模型追赶GPT4的速度远超想象百度华为阿里等入选大模型“国家队”;盘古大模型3.0发布;阿里云推AI绘画大模型丨AIGC大事日报小米回应AI大模型;英伟达万亿市值在即;OpenAI关闭亿级创投基金丨AIGC大事日报双林奇案录第三部之天禅寺:第十三节腾讯出手,AI大模型研发商MiniMax完成超2.50亿美元A轮融资;航天环宇A股上市,最新市值超百亿丨投融资周报阿里达摩院大模型公开课上新!主讲中文个性化对话大模型ChatPLUG和模块化多模态大模型mPLUG-Owl国产大模型的100种可能只给大模型LeetCode编号,也能解题!大模型表现好是源于对训练数据的记忆吗?请不要迷信大模型Kindle跌落神坛,但国产阅读器却开始“内卷”18个问题,90个回答,国产大模型实用性横评Target与Kmart两大零售巨头将合并重组!市值超过100亿澳元,负责人称将“抓住市场机会”又一只大牛股!市值赶超茅台,股价大涨50%!这家公司问鼎A股第一!一个新的时代到来,李大霄:一场轰轰烈烈的大牛市或开始了…又一国产大模型来了,超对称联合复旦大学发布 120 亿参数语言模型 BBT-2, 已开源市值超350亿,数字城市解决方案提供商云天励飞IPO;硅片制造独角兽盛合晶微获投超3亿美元丨睿兽分析投融资周报苹果市值突破3万亿美元大关创历史新高,相当于10个茅台华语乐坛最可惜的节目,巅峰时惨遭停办,7年了,还有人求它复播国产大飞机 C919 商业首飞;天涯创始人回应关停:不会放弃;知乎大模型应用开启内测 | 极客早知道人渣!广东男子虐婴事件细节曝光!有些人根本不配做父母!微信、QQ 出现功能异常,腾讯处罚多位高管;三个国产大模型同日官宣;日本政府将考虑采用 ChatGPT | 极客早知道暴涨90%,市值超特斯拉!AI竞赛推高英伟达股价CIT VS CMU挣脱桎梏,放飞灵的自由
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。