Redian新闻
>
Meta第二代自研AI芯投产,摆脱英伟达依赖!为买H100小扎狂砸数百亿美元

Meta第二代自研AI芯投产,摆脱英伟达依赖!为买H100小扎狂砸数百亿美元

公众号新闻



  新智元报道  

编辑:编辑部
【新智元导读】Meta的第二代自研芯片正式投产!小扎计划今年部署Artemis AI芯片为AI提供算力,以减少对英伟达GPU的依赖。

Meta第二代自研AI芯片Artemis,今年正式投产!
据悉,新的芯片将被用于数据中心的推理(Inference)任务,并与英伟达等供应商的GPU一起协同工作。
对此,Meta的发言人表示:「我们认为,我们自主开发的加速器将与市面上的GPU相得益彰,为Meta的任务提供最佳的性能与效率平衡。」
除了更高效地运行的推荐模型外,Meta还需要为自家的生成式AI应用,以及正在训练的GPT-4开源竞品Llama 3提供算力。

Meta的AI贴纸功能,此前在Messenger、Instagram和WhatsApp上都处于测试阶段

OpenAI工程师Jason Wei在Meta的一次AI活动中听到,Meta现在有足够的算力来训练Llama 3和4。Llama 3计划达到GPT-4的性能水平,但仍将免费提供
不难看出,Meta的目标非常明确——在减少对英伟达芯片依赖的同时,尽可能控制AI任务的成本。

Meta成英伟达大客户

Meta CEO小扎最近宣布,他计划到今年年底部署35万颗英伟达H100 GPU,总共将有约60万颗GPU运行和训练AI系统。
这也让Meta成为了继微软之后,英伟达最大的已知客户。
小扎表示,目前Meta内部正在训练下一代模型Llama 3。
在35万块H100上训练的Llama 3,无法想象会有多大!
Omdia的研究数据显示,Meta在2023年H100的出货量为15万块,与微软持平,且是其他公司出货量的3倍。
小扎称,「如果算上英伟达A100和其他AI芯片,到2024年底,Meta将拥有近60万个GPU等效算力」。
性能更强、尺寸更大的模型,导致更高的AI工作负载,让成本直接螺旋式上升。
据《华尔街日报》的一位匿名人士称,今年头几个月,每有一个客户,微软每月在Github Copilot上的损失就超过20美元,甚至某些用户每月的损失高达80美元,尽管微软已经向用户收取每月10美元的费用。
之所以赔钱,是因为生成代码的AI模型运行成本高昂。如此高的成本,让大科技公司们不得不寻求别的出路。
除了Meta之外,OpenAI和微软也在试图打造自己专有的AI芯片以及更高效的模型,来打破螺旋式上升的成本。

此前外媒曾报道,Sam Altman正计划筹集数十亿美元,为OpenAI建起全球性的半导体晶圆厂网络,为此他已经在和中东投资者以及台积电谈判

专为大模型定制AI芯

去年5月,Meta首次展示了最新芯片系列——「Meta训练和推理加速器」(MTIA),旨在加快并降低运行神经网络的成本。
MTIA是一种ASIC,一种将不同电路组合在一块板上的芯片,允许对其进行编程,以并行执行一项或多项任务。
内部公告称,Met首款芯片将在2025年投入使用,同时数据中心开启测试。不过,据路透社报道,Artemis已经是MTIA的更高级版本。
其实,第一代的MITA早就从2020年开始了,当时MITA v1采用的是7nm工艺。
该芯片内部内存可以从128MB扩展到128GB,同时,在Meta设计的基准测试中,MITA在处理中低复杂度的AI模型时,效率要比GPU还高。
在芯片的内存和网络部分,Meta表示,依然有不少工作要做。
随着AI模型的规模越来越大,MITA也即将遇到瓶颈,因此需要将工作量分担到多个芯片上。
当时,Meta团队还设计了第一代MTIA加速器,同样采用台积电7nm,运行频率为800MHz,在INT8精度下提供102.4 TOPS,在FP16精度下提供51.2 TFLOPS。它的热设计功耗(TDP)为25W。
2022年1月,Meta还推出了超算RSC AI,并表示要为元宇宙铺路。RSC包含2000个英伟达DGX A100系统,16000个英伟达A100 GPU。
这款超算与Penguin Computing、英伟达和Pure Storage合作组装,目前已完成第二阶段的建设。
参考资料:
https://www.reuters.com/technology/meta-deploy-in-house-custom-chips-this-year-power-ai-drive-memo-2024-02-01/
https://the-decoder.com/meta-deploys-its-artemis-ai-chip-to-reduce-reliance-on-nvidia-gpus/




微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
AMD发布AI芯片挑战英伟达,微软Meta表态“捧场”一个月30万片H100,英伟达欲找英特尔造芯?只因CoWos产能太低厉害 ◇ 加拿大夫妻为买房拼了!为存钱住进校车!每天花18小时改造龙年Sora横空出世引爆行情,沪指8连阳重返3000点!英伟达净利润暴增700%,市值单日飙升2770亿美元|一周市场盘点好吃的清水生煎包 — 皮酥、面软,汁浓、肉香小扎砸数百亿美元猛攻开源AGI!狂掷60万块H100,爆50倍GPT-4算力英伟达的美国对手们已经开始拿中国攻击英伟达了章诒和:谁是文化界的告密者?疯抢AI人才!Meta免面试,CEO狂砸近2000000美金年薪!每周硅闻 | 突发!Meta AI新目标;YouTube重组;英伟达再创新高!AMD正面挑战英伟达,瞄准4000亿美元市场规模GPT-5被5万张H100卡脖子!Altman急筹数十亿美元,欲取代英伟达建起AI芯片帝国尴尬|近一半加拿大人渴望尽快选举,摆脱特鲁多!UCAS最新数据:英国现代大学招生下滑,决心减少对海外生源依赖!老牌大学热度依旧!证监会立案调查:国产芯片上市公司重大财务造假!股价一度爆炒到300元,声称自研芯片比肩英伟达!豪门二代搞艺术,精英二代学社科,中产二代当码农……小扎宣布进军AGI!Meta正在训练Llama 3,目标是60万块H100!模型仍会开源月薪两万,互联网大厂疯抢AI数据标注员;iPhone16或推出AIGC功能;AMD推出AI芯片,对标英伟达H100丨AI周报英伟达最强通用大模型Nemotron-4登场!15B击败62B,目标单张A100/H100可跑一位逝者生前写给自己的一封信Meta加速抛弃英伟达?今年将部署自研推理芯片,训练芯片也在路上一文读懂英伟达的“新GPU”:比H100快5倍?1200W的功耗?液冷?与MI300X比较又如何?业内人士:比亚迪智驾是全栈可控并非全栈自研;消息称三星已开始使用第二代3nm工艺生产芯片原型丨智能制造日报Meta牵头组建开源「AI复仇者联盟」,AMD等盟友800亿美元力战OpenAI英伟达AI早知道|Meta推出V-JEPA模型;英伟达首次公开超级计算机Eos油膩思維之分析批評英伟达首次跻身全球半导体营收第二;Scale AI洽谈新融资,估值将达130亿美元丨AIGC日报英伟达B200成本6000美金?卖40000美金?WHEN A ChILD IS BORN【行业日报】美国比特币ETF首日交易量达46亿美元!Q1财年美国政府赤字5000亿美元!小扎All in 开源AGI:正训练Llama 3,年底将有35万块H100“美国春晚”再砸数千万美元,“魔性广告”放六遍逼疯美国人,Temu又赢了?英伟达获5亿美元天价大单!印数据中心一口气买下16000块H100/GH200Vision Pro大卖50亿小扎狂喜!Meta烧光500亿,VR复兴的希望来了扎克伯格宣战AGI:Llama 3训练中,今年要囤35万块H100,砸近百亿美元
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。