Redian新闻
>
谷歌AI芯片大升级:瞄准大模型和生成式AI,还集成主流深度学习框架

谷歌AI芯片大升级:瞄准大模型和生成式AI,还集成主流深度学习框架

科技

机器之心报道

编辑:杜伟

更强的性能、效率,更低的成本,谷歌迎来了自家 AI 芯片的更新换代。

一直以来,谷歌已经构建了业界领先的 AI 能力,比如引领新一代人工智能发展的 Transformer 架构、利用 AI 进行优化的基础设施等。其中谷歌云则致力于提供先进的 AI 基础设施服务,包括 GPU 和 TPU。

当地时间 8 月 29 日,谷歌云举办了 Google Cloud Next ’23 年度大会,推出了全新的 TPU 产品 ——Cloud TPU v5e,它是 AI 优化的基础设施产品组合,并将成为迄今为止最具成本效益、多功能且可扩展的云 TPU。目前已经提供了预览版。

我们了解到, TPU v5e 能够与 Google Kubernetes Engine(GKE)、用于构建模型和 AI 应用的开发者工具 Vertex AI 以及 Pytorch、JAX、TensorFlow 等深度学习框架集成在一起,提供了易用和熟悉的界面,很容易上手。

谷歌云还推出了基于英伟达 H100 GPU 的 GPU 超级计算机 A3 VMs,为大规模 AI 大模型提供支持。这款产品将于 9 月份全面上市。

谷歌 CEO 皮查伊。

谷歌首席科学家、知名学者 Jeff Dean 的推文。

此外在活动上,谷歌还宣布将 Meta 和 Anthropic 等公司的 AI 工具(如 Llama 2 和 Claude 2)添加到其云平台上, 在云产品中集成强大的生成式 AI 能力。目前包括 Llama 2 和 Claude 2 在内,谷歌云客户可以使用 100 多个强大的 AI 模型和工具。

相较于 TPU v4,TPU v5e 在哪些方面升级了

谷歌云这次推出的 TPU v5e 性能和易用性到底如何呢?我们接着来看。

根据官方提供的数据,Cloud TPU v5e 为中型和大型训练和推理带来了高性能和成本效益。这代 TPU 可以说专为大语言模型和生成式 AI 模型打造,与前代 TPU v4 相比,每美元训练性能提升高达 2 倍、每美元推理性能提升高达 2.5 倍。并且 TPU v5e 的成本不到 TPU v4 的一半,使更多机构有机会训练和部署更大、更复杂的 AI 模型。

TPU v5e 芯片。

值得一提的是, 得益于技术上的创新,这些成本效益并不需要牺牲任何性能或灵活性。谷歌云利用 TPU v5e pods 来平衡性能、灵活性和效率,最多允许 256 个芯片互连,总带宽超过 400 Tb/s,INT8 性能达到 100 petaOps。

一个 TPU v5e 的 2D 切片细节。

TPU v5e 还具有很强的多功能性,支持八种不同的虚拟机配置,单片内芯片数量可以从一个到 256 个,允许客户选择合适的配置来支持不同规模的大语言模型和生成式 AI 模型。

除了更强功能和成本效益之外,TPU v5e 的易用性也达到了一个全新的高度。现在客户可以通过 Google Kubernetes Engine(GKE)来管理 TPU v5e 以及 TPU v4 上的大规模 AI 工作负载编排,进而提升 AI 开发效率。对于喜欢简单托管服务的机构而言,Vertex AI 现在支持使用 Cloud TPU 虚拟机来训练不同的框架和库了。

另外如前文提到的,Cloud TPU v5e 为 JAX、PyTorch 和 TensorFlow 等领先的 AI 框架以及流行开源工具(Huggingface 的 Transformers 和 Accelerate、PyTorch Lightning 和 Ray)提供了内置支持。即将推出的 PyTorch/XLA 2.1 版本将支持 TPU v5e 以及用于大规模模型训练的建模和数据并行等新功能。

最后为了更轻松地扩展训练工作,谷歌云在 TPU v5e 预览版中引入了 Multislice 技术,使用户轻松扩展 AI 模型,并且可以超出物理 TPU pods 的范围,最多可以容纳数万个 TPU v5e 或 TPU v4 芯片。

利用多个 TPU Podslices 实现性能线性扩展。

截至目前,使用 TPU 的训练工作仅限于单片 TPU 芯片,TPU v4 的最大切片数量为 3,072。借助 Multislice,开发人员可以利用单个 Pod 内的 ICI(芯片内互连)技术或者通过数据中心网络(DCN)上的多个 Pod,将工作负载扩展到数万个芯片。

这种多层切片技术为谷歌构建其最先进的 PaLM 模型提供了支持。现在谷歌云客户也能体验这一技术了。

此次升级的 TPU v5e 得到了客户的高度认可。AssemblyAI 技术副总裁 Domenic Donato 表示,当使用 TPU v5e 在他们的 ASR(自动语音识别)模型上运行推理时,每美元的性能始终是市场同类解决方案的 4 倍。这种强大的软硬件组合能够为他们的客户提供更经济高效的 AI 解决方案。

随着谷歌云不断升级 AI 基础设施,越来越多的客户将选择使用谷歌云服务。据此前谷歌母公司 Aplabet 的介绍,超过半数的生成式 AI 初创公司正在使用谷歌的云计算平台。

对于谷歌而言,此次 Cloud TPU v5e 拉开了进一步变革产品模式、赋能云客户的序幕。

参考链接:https://cloud.google.com/blog/products/compute/announcing-cloud-tpu-v5e-and-a3-gpus-in-ga

© THE END 

转载请联系本公众号获得授权

投稿或寻求报道:[email protected]

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
老黄发布最强AIGC芯片!内存容量暴增近50%,可运行任意大模型,“生成式AI的iPhone时刻已来”谷歌证实大模型能顿悟,特殊方法能让模型快速泛化,或将打破大模型黑箱凯捷:生成式AI的收获季节:各行业生成式AI的广泛应用清明之殇 ——谨以此文献给我的台湾大爷 冷明88VIP迎来大升级:不仅要省钱,更要好服务商汤日日新大模型90天大升级!CEO现场整活,主打突破想象力12种模态,一个学习框架,Meta-Transformer实现骨干网络大一统专访惟佑基因:瞄准「下一代」基因治疗,已开发7条眼科管线,预计明年首条管线进入IIT给大模型生成文本发身份证:针对大模型生成文本的可编码水印技术最高法院创建种族平等的里程碑谷歌 Bard 重磅升级:一张截图生成 iPhone 应用、还能转成代码…腾讯云 MaaS 最新升级:上架 20 多个主流模型,支持开发者一键调用GACS 2023 | IPU:赋能生成式AI,不止生成式AIApple GPT明年上iPhone!苹果被爆秘密研发Ajax框架,Siri大升级,市值几秒暴增千亿重磅课程再次升级,一次性搞定大模型多模态AIGC与强化学习 --《2023秋季AIGC大模型与强化学习前沿技术实战》 招生简章新闻第73期|又是芯片!欧盟《芯片法案》或将加剧“芯片大战”?专访阿思科力:瞄准「现货」CAR-NK,已开发5条管线,首发项目正处于临床申报阶段百度云MaaS升级:接入国内外33个大模型,进行二次性能增强|甲子光年谷歌Bard史上最大升级:中文、识图、存档导出能力都来了索赔1元的“大模型数据被盗第一案”和解;首个生成式AI监管文件正式施行;雷军:小爱同学已升级大模型丨AI周报中文在线宣布发布“逍遥”大模型,可一键生成万字小说;谷歌称将保护生成式人工智能用户免受版权索赔丨AIGC日报《塔里木的月亮》&《去有风的地方》中国人里面我最佩服福建人!!阿里首提前向训练框架:让大模型深度思考,可快速定制专属模型Adobe推出三个新的生成式AI模型;AMD收购AI软件公司Nod.ai;百度文心生物计算大模型登Nature子刊丨AIGC日报头显大升级,接入大模型,扎克伯格要脚踢苹果拳打OpenAI!Jupyter大升级:各种大模型都能连,聊天就能生成代码、错误修改OpenAI最新大模型曝光:剑指多模态,GPT-4之后最大升级ICCV 2023 | 基于预训练视觉语言模型和大语言模型的零样本图像到文本生成买东西不能让贪便宜的心态掌控生成式AI下的未来,娱乐型工作将成为主流?《生成式人工智能服务管理暂行办法》实施,8家备案模型生成内容真实性如何?小米宣布战略升级:围绕澎湃 OS 打造「人车家全生态;三季度华为手机销量增长 37%;腾讯大模型再升级 | 极客早知道清华提出开源工具学习框架,接入真实世界 16000+API, 效果达 ChatGPT苹果秘密项目曝光:明年 iPhone 或迎大升级,大模型格局酝酿巨变
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。