Redian新闻
>
英伟达NVLink技术深度分析

英伟达NVLink技术深度分析

公众号新闻

NVIDIA NVLink已成为高性能计算(HPC)和人工智能领域的关键技术。本文深入探讨了NVLink的复杂性,并介绍NVSwitch芯片、NVLink服务器和NVLink交换机,以揭示其在不断演进的先进计算领域中的重要性。

关于CPU、服务器和存储详细技术,请参考“服务器基础知识全解(终极版)”,“2023年服务器计算机CPU行业报告”、“2023年机架式服务器行业洞察”、“2023~2025服务器CPU路线图”、“2023服务器产业链及市场竞争格局”、“存储系统关键技术全解(终极版)”、“更新下载:存储系统基础知识全解(终极版)”、“存储芯片技术基础知识介绍(2023)”等等。

什么是NVIDIA NVLink

NVLink是一种解决服务器内GPU之间通信限制的协议。与传统的PCIe交换机不同,NVLink带宽有限,可以在服务器内的GPU之间实现高速直接互连。第四代NVLink提供更高的带宽,每条通道达到112Gbps,比PCIe Gen5通道速率快三倍。

NVLink旨在为GPU直接互连提供简化、高速、点对点的网络,相比传统网络减少了开销。通过在不同层次提供CUDA加速,NVLink减少了与通信相关的网络开销。NVLink随着GPU架构的演进不断发展,从P100的NVLink1到H100的NVLink4,如图所示。NVLink 1.0、NVLink 2.0、NVLink 3.0和NVLink 4.0之间的关键区别在于连接方式、带宽和性能。

NVSwitch芯片

NVSwitch芯片是一种物理芯片,类似于交换机ASIC,可通过高速的NVLink接口连接多个GPU,提高服务器内的通信和带宽。第三代NVIDIA NVSwitch可支持以900 GB/s的速率互连每对GPU。

NVSwitch3芯片具有64个NVLink4端口,提供总共12.8 Tbps的单向带宽或3.2 TB/s的双向带宽。NVSwitch3芯片的独特之处在于其集成了SHARP功能,对多个GPU单元的计算结果进行聚合和更新,减少网络数据包并提高计算性能。

NVLink服务器

NVLink服务器采用NVLink和NVSwitch技术连接GPU,通常可在英伟达(NVIDIA)的DGX系列服务器或具有类似架构的OEM HGX服务器中找到。这些服务器利用NVLink技术,提供出色的GPU互联性、可扩展性和高性能计算能力。2022年,英伟达(NVIDIA)宣布推出第四代NVIDIA® DGX™系统,这是世界上首个采用新的NVIDIA DGX H100服务器构建的AI平台。

因此,NVLink服务器在科学计算、人工智能、大数据处理和数据中心等关键领域已经变得不可或缺。通过提供强大的计算能力和高效的数据处理,NVLink服务器不仅满足了这些领域的严格要求,还推动了这些领域的进步和创新。

NVLink交换机

2022年,英伟达(NVIDIA)将NVSwitch芯片独立出来,并制作成NVLink交换机,用于连接主机之间的GPU设备。它采用了1U尺寸设计,具有32个OSFP端口;每个OSFP端口包含8个112G PAM4通道,每个交换机内置2个NVSwitch3芯片。

NVLink网络

NVSwitch物理交换机将多个NVLink GPU服务器连接成一个大型Fabric网络,即NVLink网络,解决了GPU之间的高速通信带宽和效率问题。每个服务器都有独立的地址空间,为NVLink网络中的GPU提供数据传输、隔离和安全保护。当系统启动时,NVLink网络通过软件API自动建立连接,并可以在运行过程中更改地址。

该图比较了NVLink网络与传统以太网网络,演示了如何创建独立于IP以太网并专用于GPU服务的NVLink网络。

InfiniBand网络 VS NVLink网络

InfiniBand网络和NVLink网络是在高性能计算和数据中心应用中使用的两种不同的网络技术。它们有以下区别:
架构和设计:InfiniBand网络是一种采用多通道、高速串行连接的开放标准网络技术,支持点对点和多播通信。NVLink网络是由英伟达(NVIDIA)开发的专有技术,旨在实现GPU之间的高速直连。
应用场景:InfiniBand网络广泛应用于高性能计算集群和大规模数据中心。NVLink网络主要用于大规模GPU集群、HPC、人工智能等领域。
带宽和延迟:InfiniBand网络提供高带宽和低延迟的通信,提供更高的吞吐量和更短的传输延迟。NVLink网络为GPU之间提供更高的带宽和更低的延迟,以支持快速数据交换和协同计算。以下是使用NVLink网络的H100和使用InfiniBand网络的A100之间的带宽比较。

结论

NVIDIA NVLink作为一项开创性的技术,彻底改变了高性能计算和人工智能领域。它能够增强GPU之间的通信,提高性能,并实现无缝的并行处理,成为众多高性能计算和人工智能应用中不可或缺的组成部分。随着先进计算领域的不断发展,NVLink的重要性和影响力将不断扩大,推动技术创新。
相关阅读:

转载申明:转载本号文章请注明作者来源,本号发布文章若存在版权等问题,请留言联系处理,谢谢。

推荐阅读
更多架构相关技术知识总结请参考“架构师全店铺技术资料打包(全)”相关电子书(41本技术资料打包汇总详情可通过“阅读原文”获取)。

全店内容持续更新,现下单“架构师技术全店资料打包汇总(全)”一起发送“服务器基础知识全解(终极版)和“存储系统基础知识全解(终极版)pdf及ppt版本,后续可享全店内容更新“免费”赠阅,价格仅收249元(原总价399元)。


温馨提示:

扫描二维码关注公众号,点击阅读原文链接获取架构师技术全店资料打包汇总(全)电子书资料详情


微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
英伟达CEO黄仁勋最新专访为AI“降温”:直接对芯片的无水液冷技术大幅降低能耗和成本,正适配英伟达GPU西雅图东区本土豪宅建商Murray Franklyn 入驻葡萄酒之乡Woodinville——23栋 全新占地一英亩定制大宅“修理奥克兰!”市长任期过半,他的成果如何?连任之路能否一帆风顺?深度分析来了!英伟达日进5.7亿,黄院士躺印钞机上了深度分析:月收入超12亿,三消冠军手游《Royal Match》厉害在哪?24届美本T20私校在上海的录取轮次与难度分析深度好文|英伟达中国员工自曝收入,再次超出社会认知!英伟达CEO黄仁勋:以后人人都能当程序员,别再学计算机了!下个黄金赛道是...【Malden高级公寓】下楼地铁,直达NEU/伯克利,省钱性价比首选,更有免中介费优惠英伟达一夜疯涨, 市值飙到1.75万亿!深度分析:月收入破5亿,MAU破千万,点点《寒霜启示录》厉害在哪?Nvidia AI芯片架构分析深度分析本次减半后的比特币走势《阴阳鱼》连载第26章:时间如刀,空间如砧板,而你我都不过是鱼肉舊文:「從蘇軾任『河北軍區司令』說開去」(關東行者)外企社招丨NVIDIA英伟达社招岗位上新,月薪20-80k,13薪,六险一金,生育友好,内购福利,留学生有优势《带节奏的英语课堂》I’m bored 1【首发】绪水互联完成数千万元A+轮融资,多年AIoT技术深耕,引领医院资产价值腾飞详解最强AI芯片架构:英伟达Blackwell GPU究竟牛在哪?现场对话技术高管大象坐上火箭,英伟达发布财报后股价再次大涨龙年Sora横空出世引爆行情,沪指8连阳重返3000点!英伟达净利润暴增700%,市值单日飙升2770亿美元|一周市场盘点英伟达杀疯了,净利润暴增769%!股价飙涨,你买了吗?!英伟达带动AI股上涨,哪些公司从中受益?黄仁勋谈中美 AI 竞争,英伟达首次将华为视为最大竞争对手 | Hunt Good 周报英伟达高管谈NVL72 机架的新设计AI早知道|Meta推出V-JEPA模型;英伟达首次公开超级计算机Eos英伟达首次透露:上季度 180 亿美元数据中心收入,AI 推理已高达四成全球低轨卫星通信产业研究:现状与产业发展、布局分析、典型等多维度分析英伟达值14万亿吗?英伟达将华为列为最大竞争对手/娃哈哈创始人宗庆后逝世/苹果将重新设计 iOS 18 的 UI39 项 Linux 基准测试:英伟达数据中心 CPU Grace 媲美 Threadripper 7000美股基本面 - 2024_02_16 * 晨报 * 部分热门中概股盘前走高,理想汽车涨超5%。Jupiter一个基金大增美债至UC 录取这么难,难在哪儿?| 加州大学申请深度分析敏感肌肤的护肤品
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。