Redian新闻
>
Cerebras推出2 Exaflops人工智能超级计算机

Cerebras推出2 Exaflops人工智能超级计算机

公众号新闻

点击蓝字 关注我们

SUBSCRIBE to US


CEREBRAS


“人工智能正在吞噬世界。”


硅谷人工智能计算机制造商Cerebras的首席执行官Andrew Feldman就是这样开始介绍他的公司的最新成就的:一台每秒能够进行20亿次运算(2亿次浮点运算)的人工智能超级计算机。该系统名为“Condor Galaxy 1”,有望在12周内将其规模扩大一倍。2024年初,将有另外两个规模加倍的系统加入。这家硅谷公司计划明年继续增加Condor Galaxy的安装,直到它运行一个由9台超级计算机组成的网络,总运算能力为36亿次。


如果大型语言模型和其他生成人工智能正在吞噬世界,Cerebras的计划是帮助他们消化它。加州森尼维尔的这家公司并不是唯一一家。其他专注于人工智能的计算机制造商正在围绕自己的专用处理器或英伟达最新的GPU H100构建大规模系统。虽然很难判断大多数系统的大小和功能,但Feldman声称Condor Galaxy 1已经是最大的系统之一。


Condor Galaxy 1在短短10天内组装并启动,由32台Cerebras CS-2计算机组成,并将扩展到64台。接下来的两个系统将在德克萨斯州奥斯汀和北卡罗来纳州阿什维尔建造,每个系统还将容纳64个CS-2。每台CS-2的核心是Waferscale Engine-2,这是一款人工智能专用处理器,由2.6万亿个晶体管和85万个全硅晶圆制成的人工智能核心。


CEREBRAS


Feldman说,Cerebras在建造大型人工智能超级计算机方面的最大优势之一是它能够简单地扩大资源规模。例如,如果你投入40倍以上的硬件资源,400亿参数网络可以在与10亿参数网络大致相同的时间内进行训练。重要的是,这种放大不需要额外的代码行。他说:“我们通过按键从1到32(CS-2s)线性缩放。”


Condor Galaxy系列由总部位于阿布扎比的G42公司所有,G42是一家控股公司,拥有九家基于人工智能的企业,其中包括中东最大的云计算提供商之一G42 Cloud。Feldman将这种关系描述为“深度战略伙伴关系”,他说,这是在短短18个月内完成36次EB失败所需要的。Feldman计划在今年晚些时候搬到阿联酋几个月,以帮助管理合作,他说,这将“大大增加人工智能计算的global inventory”。 Cerebras将为G42操作超级计算机,并可以租用其合作伙伴未用于内部工作的资源。


Feldman表示,对训练大型神经网络的需求激增。他说,用500亿或更多参数训练神经网络模型的公司数量从2021年的2家增加到今年的100多家。


显然,Cerebras并不是唯一一家追求需要训练真正大型神经网络的企业。亚马逊、谷歌、Meta和微软等大公司都有自己的产品。围绕英伟达GPU构建的计算机集群主导了这项业务的大部分,但其中一些公司已经为人工智能开发了自己的硅,例如谷歌的TPU系列和亚马逊的Trainium。Cerebras也有初创公司的竞争对手,他们生产自己的人工智能加速器和计算机,包括Habana(现在是英特尔的一部分)、Graphcore和Samba Nova。


例如,Meta使用6000多个Nvidia A100 GPU构建了其AI研究超级集群。计划中的第二阶段将使集群达到5个EB。谷歌构建了一个包含4096个TPU v4加速器的系统,总共1.1亿次。该系统在短短10多秒内就突破了比今天的LLM小得多的BERT自然语言处理器神经网络。谷歌还运行Compute Engine A3,该引擎围绕英伟达H100 GPU和英特尔制造的定制基础设施处理单元构建。云提供商CoreWeave与英伟达合作,测试了一个由3584个H100 GPU组成的系统,该系统在10多分钟内训练出了代表大型语言模型GPT-3的基准。2024年,Graphcore计划建造一个名为Good Computer的10 exaflop系统,该系统由8000多个Bow处理器组成。


你可以在这里访问Condor Galaxy(https://www.condorgalaxy.ai/)。


微信号|IEEE电气电子工程师

新浪微博|IEEE中国

 · IEEE电气电子工程师学会 · 


最新《期刊引证报告》发布,IEEE期刊持续引领电气电子工程、电信、计算机科学等领域

聊天机器人时代到来时,搜索领域的前景将如何发展?

一位可以穿在身上的机器人助手Calico

量子计算机即将到来,这对于网络安全意味着什么?

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
DevOps 是否已死?AI 和大语言模型给云计算和 DevOps 带来了哪些影响?|InfoQ 趋势报告九剑一魂 - 第24回 汉胡同源 九剑一魂(六)实习招聘 | Intel -「研究生实习-电气工程、计算机科学、计算机工程」招聘AIGC日报丨华为云发布盘古汽车大模型;英特尔将为Stability AI打造超级计算机;Midjourney将于年内升级苹果悄悄自研「果产GPT」;马斯克砸10亿美金开发超级计算机;宁德时代新成立航空公司 | AIoT情报微软公布路线图,称 10 年内将制造出量子超级计算机 |【经纬低调分享】硅谷人工智能创新之旅精彩回顾 | 与世界顶尖科技企业交流,探索人工智能创新之谜创业101学员对话录|FlowGPT:引爆人工智能'美元要破产'未来不再依赖英伟达?特斯拉首台“超级计算机”或在七月投产「简报」Shapiro 州长访问卡耐基梅隆大学——人工智能的诞生地,签署关于生成式人工智能的行政命令;拓展:以新方式建模神经元南加大将投入10亿美元新建计算机学院!人工智能、区块链全都有!特斯拉:超级计算机Dojo是“大饼”还是泡沫?Love最航运 | Flexport今天推出人工智能驱动的革命性全球贸易解决方案王慧文因「健康问题」离开美团董事会;特斯拉超级计算机 7 月投产;杭州亚运会「电竞运动员」曝光 | 极客早知道日线和小时线(续2)走向计算机视觉的通用人工智能:GPT和大语言模型带来的启发微软宣布重大突破!10 年内打造量子超级计算机,科技发展实现 10 倍速BB鸭 | 支付宝刷掌支付来了;B站取消播放量显示;​特斯拉超级计算机7月投产;林生斌关联公司被吊销硅谷人工智能创新之旅总回顾 | 与世界顶尖科技企业交流,探索人工智能创新之谜剑拔弩张的 Databricks 和Snowflake,连用个Apache Iceberg 都能掐架!人工智能立法提上日程:兼顾安全与发展,为人工智能治理打下框架性基础谷歌披露量子计算机新突破:比世界最快的超级计算机快“47年”一边是计算机就业哀鸿遍野,一边是高考生疯狂涌向计算机专业,太魔幻了!清华唐杰新作WebGLM:参数100亿、主打联网搜索,性能超OpenAI WebGPT马斯克2023年世界人工智能大会演讲:我相信,中国会有很强的人工智能能力!(附视频&演讲稿)魔幻!一边是计算机就业哀鸿遍野,一边是高考生疯狂涌向计算机专业Rescue Teams Struggle to Reach Isolated Areas in Flood-Hit Hebei特斯拉超算Dojo下月投产,24年末年算力可达 100 Exa-Flops | 最前线盒马鲜生回应11月将上市:不予置评;调休政策制定参与者称应重新考虑;特斯拉首台超级计算机或在七月投产……硬核观察 #1057 谷歌再次重申“量子霸权”,声称制造了 70 个量子比特的量子超级计算微软推出“智能副驾”(Copilot),您的人工智能日常助手美国移民,EB1、EB2、EB3、EB4、EB5到底都是什么?双林奇案录第三部之川黔连环案: 第十五节
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。