Redian新闻
>
数据中心网络架构设计与挑战

数据中心网络架构设计与挑战

公众号新闻

一、数据中心网络架构设计原则
       网络是数据中心的最重要组成部分,主要由大量的二层接入设备和少量的三层设备组成的网络结构。以前,数据中心的网络规模普遍不大,网络通过数十台设备简单互连就可达到互联互通的目的。而现在,数据中心对网络的要求越来越高,为了满足各种应用,网络架构也需要及时调整,网络架构经历了多种多样的变化。在一个数据中心建设过程中,网络架构是重要部分,架构设计的好坏直接决定了数据中心数据转发效率和可靠性。
本文来自“数据中心的网络架构设计”,“华为负载分担技术专题”。
(1)可扩展性
       为适应业务的发展、需求的变化、先进技术的应用,数据中心网络必须具备足够的可扩展来满足发展的需要。如采用合理的模块化设计,尽量采用端口密度高的网络设备、尽量在网络各层上具备三层路由功能,使得整个数据中心网络具有极强的路由扩展能力。功能的可扩展性是数据中心网络随着发展提供增值业务的基础。
(2)可用性
       包括网络设备和网络本身的冗余。关键设备均采用电信级全冗余设计,采用冗余网络设计,每个层次均采用双机方式,层次与层次之间采用全冗余连接。提供多种冗余技术,在不同层次可提供增值冗余设计。
(3)灵活性
       灵活的目的是实现可根据数据中心不同用户的需求进行定制,网络/设备能够灵活提供各种常用网络接口、能够根据不同需求对网络模块进行合理搭配。
(4)安全性
       安全性是数据中心的用户最为关注的问题,也是数据中心建设的关键,它包括物理空间的安全控制及网络的安全控制。
二、数据中心网络组网设计
(1)Fabric网络
       随着云计算的发展,在数据中心网络中服务器虚拟化技术得到广泛应用,但服务器在迁移时,为了保证迁移时业务不中断,就要求不仅虚拟机的IP地址不变,而且虚拟机的运行状态也必须保持原状(例如TCP会话状态),所以虚拟机的动态迁移只能在同一个二层域中进行,而不能跨二层域迁移,这就要我的二层网络足够大。而传统的二层技术,不论是通过缩小二层域的范围和规模来控制广播风暴的影响范围或是阻塞掉冗余设备和链路来破环,网络中能够容纳的主机数量、收敛性能以及网络资源的带宽利用率对于数据中心网络而言是远远不够的。
       M-LAG(Multichassis Link Aggregation Group)即跨设备链路聚合组,是一种实现跨设备链路聚合的机制,将一台设备与另外两台设备进行跨设备链路聚合,从而把链路可靠性从单板级提高到了设备级。对二层来讲,可将M-LAG理解为一种横向虚拟化技术,将M-LAG的两台设备在逻辑上虚拟成一台设备,形成一个统一的二层逻辑节点。M-LAG提供了一个没有环路的二层拓扑同时实现冗余备份,不再需要繁琐的生成树协议配置,极大的简化了组网及配置。这种设计相对传统的xSTP破环保护,逻辑拓扑更加清晰、链路利用更加高效。

(2)Overlay网络

       Overlay在网络技术领域,指的是一种网络架构上叠加的虚拟化技术模式,其大体框架是对基础网络不进行大规模修改的条件下,实现应用在网络上的承载,并能与其它网络业务分离,并且以基于IP的基础网络技术为主。其实这种模式是以对传统技术的优化而形成的。
       针对前文提出的三大技术挑战,Overlay在很大程度上提供了全新的解决方式。
①针对虚机迁移范围受到网络架构限制的解决方式
       Overlay是一种封装在IP报文之上的新的数据格式,因此,这种数据可以通过路由的方式在网络中分发,而路由网络本身并无特殊网络结构限制,具备良性大规模扩展能力,并且对设备本身无特殊要求,以高性能路由转发为佳,且路由网络本身具备很强的的故障自愈能力、负载均衡能力。
②针对虚机规模受网络规格限制的解决方式
       虚拟机数据封装在IP数据包中后,对网络只表现为封装后的的网络参数,即隧道端点的地址,因此,对于承载网络(特别是接入交换机),MAC地址规格需求极大降低,最低规格也就是几十个(每个端口一台物理服务器的隧道端点MAC)。
③针对网络隔离/分离能力限制的解决方式
       针对VLAN数量4000以内的限制,在Overlay技术中引入了类似12比特VLAN ID的用户标识,支持千万级以上的用户标识,并且在Overlay中沿袭了云计算“租户”的概念,称之为Tenant ID(租户标识),用24或64比特表示。针对VLAN技术下网络的TRUANK ALL(VLAN穿透所有设备)的问题,Overlay对网络的VLAN配置无要求,可以避免网络本身的无效流量带宽浪费,同时Overlay的二层连通基于虚机业务需求创建,在云的环境中全局可控。
(3)Spine+Leaf网络
       Spine+Leaf两层设备的扁平化网络架构来源于CLOS网络,CLOS网络以贝尔实验室的研究人员Charles Clos命名,他在1952年提出了这个模型,作为克服电话网络中使用的机电开关的性能和成本相关挑战的一种方法。Clos用数学理论来证明,如果交换机按层次结构组织,在交换阵列(现在称为结构)中实现非阻塞性能是可行的,主要是通过组网来形成非常大规模的网络结构,本质是希望无阻塞。在此之前,要实现“无阻塞的架构”,只能采用NxN的Cross-bar方式。接入连接的数量仍然等于折叠后的三层CLOS网络架构的Spine与Leaf之间的连接数,流量可以分布在所有可用的链接上,不用担心过载问题。随着更多的连接被接入到Leaf交换设备,我们的链路带宽收敛比将增加,可以通过增加Spine和Leaf设备间的链路带宽降低链路收敛比。
Spine+Leaf网络架构的另一个好处就是,它提供了更为可靠的组网连接,因为Spine层面与Leaf层面是全交叉连接,任一层中的单交换机故障都不会影响整个网络结构。因此,任一层中的一个交换机的故障都不会使整个结构失效。
(4)BGP EVPN
       EVPN是基于BGP协议的技术,需要部署在网络交换机上。这意味着网络交换机需要作为VTEP节点,进行VXLAN封装。服务器通过接口或VLAN接入网络交换机。这些接口或VLAN会映射到对应的广播域BD,同时BD也会绑定一个EVPN实例,通过EVPN实例间路由的传递实现VXLAN隧道的建立、MAC学习。通过BGP EVPN在两个数据中心内部各建立一段VXLAN隧道,数据中心之间再建立一段VXLAN隧道,可以实现数据中心互联。
三、数据中心网络的发展趋势
       数据的集中处理、存储、传输、交换和管理无一不是在构建数字经济的基础设施。网络技术驱动数据中心网络从以“数据”为中心发展到了以“算力”为中心。相较传统的数据中心网络,现代大规模数据中心网络在架构、技术上和运维都发生了巨大变革,主要表现在:
(1)网络带宽加速发展,构建高性能网络
       网络支撑业务的底层连接,将网络设备上从管理平面、控制平面和数据平面进行分离,软件定义网络,用软件集中管理设备简化数据平面,让网络更智能,更简单。用先进的网络架构,实现在线和离线对业务网络的互联互通,灵活调度网络流量满足个性化业务需求,构建高带宽、低时延高性能网络才能满足日新月异的互联网业务要求。
(2)高密度异构计算集群,大规模弹性扩展
       数据中心网络将从交换机网络趋向以数据互联I/O为中心的架构,通过技术和规模弹性给用户提供低成本,高可靠的网络资源。提供更加安全,稳定的网络基础设施,根据业务需要弹性扩展,用更加简单的方式降本提效是下一代数据中心网络发展的指导原则。
(3)降本提效,实现智能可视化运维
       网络成本的优化,是很多互联网业务发展必不可少的一环。相比传统网络架构,大规模数据中心网络架构通过使用单芯片box设备进行构建数据中心网络,降低能耗,解决能耗瓶颈,同时在电力、散热、空间成本上进行降本提效。同时,随着网络规模不断扩大,人工运维不再现实,自动化运维部署,软件功能自动升级及故障自动告警,恢复等成为很多厂商设备建设数据中心努力的方向。

相关阅读:


转载申明:转载本号文章请注明作者来源,本号发布文章若存在版权等问题,请留言联系处理,谢谢。

推荐阅读
更多架构相关技术知识总结请参考“架构师全店铺技术资料打包(全)”相关电子书(41本技术资料打包汇总详情可通过“阅读原文”获取)。

全店内容持续更新,现下单“架构师技术全店资料打包汇总(全)”一起发送“服务器基础知识全解(终极版)和“存储系统基础知识全解(终极版)pdf及ppt版本,后续可享全店内容更新“免费”赠阅,价格仅收249元(原总价399元)。


温馨提示:

扫描二维码关注公众号,点击阅读原文链接获取架构师技术全店资料打包汇总(全)电子书资料详情


微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
经期运动新零售SaaS架构:线上商城系统架构设计可爱妈妈厉害了!阿里云提出新一代AI网络架构HPN7.0苹果被曝出严重BUG:已出售的二手设备可显示原机主照片;雷军直播开车2千万人围观;特斯拉被曝将在中国建立自动驾驶数据中心丨邦早报美股基本面 - 2024_03_14 * 晨报 * 微博公布2023年第四季度及财年未经审计财务业绩及股息。鸿海第四季度净利润订单中心架构设计与实践MLP一夜被干掉,全新神经网络架构KAN破纪录!MIT华人一作,轻松复现Nature封面AI数学研究新零售SaaS架构:开放平台架构设计“最先进”不一定“最佳”——配电通信网需要安全灵活智能的网络架构全新神经网络架构KAN一夜爆火!200参数顶30万,MIT华人一作,轻松复现Nature封面AI数学研究网络架构如何支持超万卡的大规模 AI 训练?AI 2.0时代,戴尔科技携手英特尔为数据中心“降温”新零售SaaS架构:客户管理系统架构设计(万字图文总结)AI 数据中心的能源困境断舍离进行中顶刊TPAMI 2024!北大林宙辰团队提出具有万有逼近性质的神经网络架构的设计方法智领全栈 模力全开|锐捷网络携智算中心网络方案亮相2024GIDC百亿美元只是开胃菜!科技大厂天量撒钱狂升数据中心:英伟达「铲子梦」还能做多久?数据中心芯片市场,争什么?AI数据中心网络架构需求:400/800G光模块图解Transformer架构设计图解:多租户系统架构设计一阶优化算法启发,北大林宙辰团队提出具有万有逼近性质的神经网络架构设计方法离别车站摩根士丹利:AI数据中心就是“吞铜兽”,今年铜价或再涨18%GPU服务器AI网络架构设计(上)实践总结|前端架构设计的一点考究企业级消息推送架构设计,太强了!AI在用 | 一个超级提示,用Claude 3生成神经网络架构动画干掉MLP!KAN:全新神经网络架构爆火!网友:发论文"新坑"来了CVPR 2024 | 擅长处理复杂场景和语言表达,清华&博世提出全新实例分割网络架构MagNet证券核心交易系统的平台架构设计InfiniBand与RoCE对比分析:AI数据中心网络选择指南GPU服务器AI网络架构设计(下)
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。