高性能负载均衡-分类和算法
高性能集群之所以复杂,主要原因是增加了任务分配器,以及为任务选择合适的分配算法。负载均衡器就是任务分配器,负载均衡这个名称已经成为事实标准,但负载均衡不只是为了计算单元的负载达到均衡状态。
分类及架构
常见的负载均衡分三种:DNS负载、硬件负载、软件负载
1、DNS负载均衡
定义:解析同一个域名返回不同的IP地址,一般用来实现地理级别的均衡。例如同样的域名,北方用户和南方用户获取的地址是不一样的。
优点:
简单、成本低
实现就近访问,提升访问速度
缺点:
更新不及时(DNS缓存时间长)
扩展性差(无法根据业务定制和扩展)
分配策略简单(算法少、无法感知后端服务器状态)
2、硬件负载均衡
定义:通过单独的硬件设备实现负载均衡功能,可以理解为一个用于负载均衡的基础网络设备。目前业界典型的硬件负载均衡设备有两款:F5 和 A10。
优点:
功能强大(支持各层级负载、支持全面的负载算法、支持全局负载)
性能强大(支持100万以上并发)
稳定性高(商用硬件负载)
支持安全防护(具备防火墙、防DDoS攻击等功能)
缺点:
价格昂贵(起步15万,最高上百万)
扩展能力差(硬件设备无法进行扩展和定制)
3、软件负载均衡
定义:通过负载均衡软件来实现负载均衡功能,常见的有 Nginx 和 LVS两种。
优点:
简单(部署维护都比较简单)
便宜(只需Linux服务器装上软件)
灵活(可根据业务方便扩展和定制)
缺点(与硬件负载相比):
性能一般(一个Nginx大约支撑5万并发)
功能没有硬件负载强大
一般不具备防火墙和防DDoS等安全功能
4、典型架构
3种负载机制在实际应用中不是非此即彼,可以组合使用。
组合的基本原则为:DNS 负载均衡用于实现地理级别的负载均衡;硬件负载均衡用于实现集群级别的负载均衡;软件负载均衡用于实现机器级别的负载均衡。
算法
根据算法期望达到的目的,可以分为4类:
任务平分类:平均分配,平均可以是数量平均、也可以是比例平均、权重平均
负载均衡类:根据服务器负载进行分配,这里的负载指系统当前压力,如CPU负载、连接数、I/O使用率等
性能最优类:根据服务器响应时间进行分配,响应最快的分配更多新任务
Hash类:根据任务某些关键信息进行Hash运算,结果值相同的分配同一台服务器
1、轮询
定义:按照顺序轮流分配到服务器,不关注服务器本身运行状态如何。
特点:只关注服务器是否在运行,只要运行就分配任务,不管运行是否良好。『简单』是优点,也是缺点。
2、加权轮询
定义:轮询的特殊形式,根据服务器权重进行任务分配,权重指根据硬件配置进行静态配置的,主要目的是为了解决不同服务器处理能力有差异的问题。
特点:解决了轮询算法中无法根据服务器的配置差异进行任务分配的问题,但依然无法根据服务器的状态差异进行任务分配。
3、负载最低优先
定义:将任务分配给当前负载最低的服务器,这里的当前负载根据不同任务类型和业务,可以用不同指标衡量。如连接数、HTTP请求数、CPU负载、I/O负载等。
特点:解决了轮询算法中无法感知服务器状态的问题,代价是增加很多复杂度,因为需要感知服务器当前的运行状态。效果美好但实际应用场景没有轮询多。
4、性能最优类
定义:站在客户端的角度进行分配,优先将任务分配给处理速度最快的服务器。
特点:与负载最低优先类的算法类似,需要感知服务器状态并且在合适周期内进行统计分析,复杂度很高。
5、Hash类
定义:根据任务中的某些关键信息进行 Hash 运算,将值相同的请求分配到同一台服务器,目的主要是为了满足特定业务需求。常见的有源地址Hash和ID Hash。
特点:将同一个源地址或带有某个ID标识的任务分配给同一个服务器,适合于存在事务、会话的业务
链接:https://www.jianshu.com/p/dbba5763b30f
(版权归原作者所有,侵删)
微信扫码关注该文公众号作者