Redian新闻
>
16000颗H200超级芯片!最强云计算亚马逊云科技和英伟达“合体”了:推出云AI超级计算机

16000颗H200超级芯片!最强云计算亚马逊云科技和英伟达“合体”了:推出云AI超级计算机

公众号新闻
金磊 克雷西 发自 拉斯维加斯
量子位 | 公众号 QbitAI

最强云计算、最快GPU,联手出大招了!

就在刚刚,云计算霸主亚马逊云科技英伟达宣布:

推出首款云AI超级计算机,结合了英伟达H200 Grace Hopper超级芯片和亚马逊UltraCluster扩展功能。

据悉,该合作项目代号为Project Ceiba,而这个超级计算机是配备了H200 NVL32与Amazon EFA互连技术的大规模系统,将部署在亚马逊云科技之上。

它共计搭载了16384颗英伟达H200超级芯片,能够处理65 exaflops速度等级的AI运算。

为了这个合作项目,老黄也是亲自来到亚马逊云科技年度盛会re:Invent的现场站台,重视程度可见一斑。

左:亚马逊云科技 CEO:Adam Selipsky;右:英伟达CEO:黄仁勋

与此同时,亚马逊云科技也成为了英伟达H200 Grace Hopper超级芯片的第一个大客户。

而之所以两大巨头要这般合作,双方的目标也是非常明确——剑指生成式AI

亚马逊云科技CEO Adam Selipsky在现场表示:

我们与英伟达合作了13年,推出了最广泛的英伟达 GPU解决方案可用于各种工作负载,包括绘图、游戏、HPC高性能计算、机器学习,以及现在的生成式AI。

我们将会让亚马逊云科技成为运行GPU的最佳云端环境。

黄仁勋也对生成式AI与云计算发表了他的观点:

生成式AI正改变各种云端负载,为多元内容创作在底层注入加速计算动能。

我们共同目标是为每个客户提供具有成本效益、先进生成式AI,为此英伟达与亚马逊云科技在整个计算堆栈展开合作,横跨AI基础设施、加速库、基础模型以及生成式AI服务。

而这次强强联手的合作,也仅仅是亚马逊云科技 re:Invent活动中的一隅。

现在,我们就来一同看下更多的重磅发布。

亚马逊云科技升级AI芯片

除了与英伟达展开合作之外,亚马逊云科技自家的芯片也迎来了大升级。

首先便是发布了升级后的通用AI芯片——Graviton4

据了解,与上一代Graviton3相比,Graviton4的计算性能提高了30%,核心数量增加了50%,内存带宽增加了75%。

Graviton4带来的一个新转变之一,便是通过对所有快速物理硬件接口的全面加密,这就显著提升了它的安全性。

亚马逊云科技透露,这款芯片将被应用于内存优化型的Amazon EC2 R8g实例,帮助客户提升高性能数据库、内存缓存和大数据分析工作的效率。

而且,R8g实例的大小更大,其vCPU和内存容量比前一代的R7g实例最多增加了三倍。

搭载Graviton4的电脑预计在接下来的几个月内上市。

亚马逊云科技进一步表示:

自从大约五年前推出Graviton项目以来,他们已经生产了超过200万个Graviton处理器。

而且,亚马逊云科技 EC2的前100位用户都已经选择使用Graviton,这证明了其在市场上的受欢迎程度。

亚马逊云科技在大会中带来的第二款升级芯片,则是Trainum2

如其名,这款芯片的主要用途就是针对拥有超大参数模型的训练。

相比于上一代Trainium1,Trainum2在速度上快出了4倍,同时在能效方面也有2倍的提升。

在亚马逊云科技内部,Amazon EC2 Trn2实例将采用的正是Trainium2,每个实例内置16个Trainium芯片。

这些Trn2实例的目的是为了支持客户在下一代EC2 UltraCluster中大规模扩展,最多可达10万个Trainium2芯片,通过亚马逊云科技弹性织物适配器(EFA)的petabit级网络连接,能够提供高达65 exaflops的强大计算能力。

有了这种规模,客户就可以在数周而不是数月时间内训练3000亿参数的大语言模型!

正如Claude背后公司Anthropic的联合创始人Tom Brown所述:

我们正在与亚马逊云科技密切合作,使用Trainium芯片开发我们未来的基础模型。

Trainium2将帮助我们大规模构建和训练模型,我们预计它比第一代Trainium芯片快至少4倍,适用于我们的一些关键工作负载。

据悉,Trainium2将从明年开始用于支持新的服务。

Amazon Q:亚马逊工作版ChatGPT出道

在生成式AI方面,亚马逊云科技还发布了自家工作版的ChatGPT——Amazon Q,重新构想了未来的工作方式。

Amazon Q主要面向的是企业用户,它让员工可以利用公司的数据和专业知识获得答案、解决问题。

Amazon Q基于亚马逊云科技17年的知识来训练,所以很懂亚马逊云科技,于是在使用亚马逊云科技过程中,可以随时随地提供帮助。

Adam说,Amazon Q改变了开发人员在亚马逊云科技上构建、部署和操作应用程序的方式。

它可以通过提出问题来了解亚马逊云科技功能和工作原理,或者确定最佳服务。

Amazon Q不仅能介绍亚马逊云科技的各项功能,还可以根据用户需求,提供利用亚马逊云科技各项服务构建应用的方法。

在使用亚马逊云科技遇到问题和故障时,Amazon Q也可以一键分析原因并想办法解决。

在亚马逊云科技控制台之外,Amazon Q还可以在IDE中调用,实时帮助开发者生成或解释代码,并进行测试和优化。

更为精彩的是,Amazon Q可以完成从计划到代码,再到完成后的测试和用户文档的全流程自动开发

假如要给应用添加新功能,开发人员只需要用自然语言描述需求,然后检查Amazon Q给出的建议并进行必要调整就可以了。

不过,开发不是一劳永逸,程序的维护和升级也至关重要。

而如果这之中涉及到了编程语言的更新迭代,开发者可能需要花费几个月甚至几年对代码进行逐行调整。

而Amazon Q的代码转换功能,将这一时间缩短到了几分钟。

开发人员只需在 IDE 中打开他们想要转换的代码,然后要求Amazon Q对其进行“/transform”即可。

最近,5名开发人员用Amazon Q在短短两天内将1000个应用从Java 8升级到Java 17,平均每个用时还不到10分钟。

除了面向开发者的Builder版本, Amazon Q还有为商业从业者提供的Business版本。

可以在亚马逊QuickSight数据分析平台和亚马逊云科技 Connect中使用。

将Amazon Q连接到企业系统,还能得到定制版的Q,我们还可以看到Amazon Q帮助用户分析了下游客户的需求。

在此基础之上,Amazon Q更是可以直接充当使用者的客服代表,解决下游用户提出的问题。

做个总结的话,Business版本的Amazon Q一共拥有四重“专家”身份:

亚马逊云科技专家,对亚马逊云科技的每一个功能、模块都有充分的了解。
生意专家,能够分析行业状况下游客户的需求。
商业智能专家,能够对大量商业数据进行分析。
客服专家,对用户企业情况充分了解,可以充当智能客服工作。

价格方面,Business和Builder版本的价格分别是每用户每月20美元和25美元。

还有其它发布

与这些芯片和聊天机器人Amazon Q同时发布的,还有全新的云存储服务亚马逊云科技 S3 Express One Zone。

它的速度是标准版S3的10倍,可以在1分钟之内处理数百万次请求,请求成本和计算成本分别降低了50%和60%。

工具层面,生成式AI应用搭建平台Bedrock也值得关注。

Adam将其称作最简单的利用大模型搭建和扩展生成式AI的方式。

此外还有和Trainium芯片配套的ML优化SDK 亚马逊云科技 Neuron。

排行前100的ML模型中,亚马逊云科技 Neuron支持93种。

按照基础设施层、工具层和应用层这三个层级进行划分,此次发布中涉及生成式AI的产品都在下面这张图里了:

One More Thing

据说这届亚马逊云科技的re:Invent活动吸引了来自全球的5万多人。

来,感受一下Keynote结束后的人山人海……

参考链接:
[1]
https://press.aboutamazon.com/2023/11/aws-unveils-next-generation-aws-designed-chips
[2]https://press.aboutamazon.com/2023/11/aws-and-nvidia-announce-strategic-collaboration-to-offer-new-supercomputing-infrastructure-software-and-services-for-generative-ai

MEET 2024大会定档!

最新嘉宾阵容公布

12月14日,量子位「MEET2024智能未来大会」不容错过!点击报名线下现场

李培根院士、李开复博士及十余位AI各领域领先企业核心负责人已确认出席!戳此了解嘉宾详情:第二批嘉宾来袭!报名MEET2024的理由,今天又多了一个

< 左右滑动查看嘉宾海报 >

点击“预约”按钮,一键直达大会直播现场!


点这里👇关注我,记得标星噢

一键三连「分享」、「点赞」和「在看」

科技前沿进展日日相见 ~ 

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
2023年冰岛之旅 (三)囤H100的都成了大冤种!英伟达发布最新AI芯片H200:性能提升2倍,成本下降50%中秋的月囤 H100 的都成了大冤种!英伟达发布最新 AI 芯片 H200:性能提升 2 倍,成本下降 50%亚马逊云科技储瑞松:简化组织架构、贴近客户,迎接生成式AI企业应用的爆发亚马逊云科技的「Q」,到底是什么?英国发布最强超算,使用5448颗英伟达超级芯片谷歌面向商家推出生成式AI工具;领英为付费会员推出AI功能以提高求职竞争力;英国将投资3亿英镑建设两台超级计算机丨AIGC日报量子计算突破:IBM推出新型模块化系统,瞄准2033年超级计算机凯捷&亚马逊云科技:2023汽车可持续发展白皮书特斯拉在得州总部布局超级计算机;Unity 宣布 CEO 退休;漫威新剧因使用 AI 遭抵制|极客早知道亚马逊云科技中国换帅长江颂AIGC日报丨曝OpenAI拟自研AI芯片,计划收购公司;亚马逊云科技全托管生成式AI服务Amazon Bedrock正式可用联手 OpenAI 最强竞对展开生成式 AI 反击战:亚马逊云科技将 S3 写入速度提升 10 倍、推出全新三层技术栈全球云享狂欢,尊享特惠盛宴,亚马逊云科技双11也开始推活动了亚马逊云科技大中华区换帅,原百度副总裁接任以安全为支点,看亚马逊云科技如何撬动数据价值从开源模型到商业落地应用,亚马逊云科技构建实用路线图!没必要非得固守纯向量数据库!专访亚马逊云科技数据库负责人为生成式AI铺路筑基 亚马逊云科技用了哪些招儿?亚马逊云科技将关闭 Aurora Serverless v1 服务超级计算机和人工智能技术正在加速推进“年龄革命”英伟达H200突然发布!最强AI芯片!容量翻倍,带宽狂飙!华讯网络与亚马逊云科技双向奔赴,云上安全责任共担快速入局生成式AI,企业为什么选择携手亚马逊云科技?外媒:英伟达特供芯片H20推迟至明年一季度发布扶桑游记(一)【无人岛之行】长篇小说《谷雨立夏间》10记忆中的惊叹号印度买了16000颗H100和GH200芯片制造业转型进入深水区怎么做?亚马逊云科技与合作伙伴要做好“最后三公里”龙的崛起|将氢弹计算速度从40小时缩短到20秒,中美超级计算机的较量微信刷掌、华为Mate60 Pro、苹果Apple Vision Pro、英伟达GH200超级芯片获金字招牌创新典范奖亚马逊云科技重组和整合其 Well-Architected Framework英伟达发布最强AI芯片H200,性能狂飙/苹果将叫停摇一摇跳转广告/GPT-5 正在开发中
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。