Kubernetes 资源请求和限制的最佳实践
当在Kubernetes中使用容器时,重要的是要知道所涉及的资源是什么以及如何需要它们。有些进程比其他进程需要更多的CPU或内存。有些是关键的,不应该被饿死。
知道了这一点,我们应该正确配置我们的容器和Pod,以获得两者的最佳效果。
在这篇文章中,我们将看到。
Kubernetes 的Limits和Requests介绍 实践案例 Kubernetes Requests Kubernetes Limits CPU的特殊性 内存的特殊性 Namespace ResourceQuta Namespace LimitRange 总结
Kubernetes的Limits和Requests介绍
在使用Kubernetes时,Limits和Requests是重要的配置,主要包含CPU和内存的配置。
Kubernetes将Limits定义为一个容器使用的最大资源量,这意味着容器的消耗量永远不能超过所显示的内存量或CPU量。
另一方面,Requests是指为容器保留的资源的最小保证量。
实践案例
让我们来看看下面这个deployment,我们需要为两个不同的容器在CPU和内存上设置Limits和Requests。
kind: Deployment
apiVersion: extensions/v1beta1
…
template:
spec:
containers:
- name: redis
image: redis:5.0.3-alpine
resources:
limits:
memory: 600Mi
cpu: 1
requests:
memory: 300Mi
cpu: 500m
- name: busybox
image: busybox:1.28
resources:
limits:
memory: 200Mi
cpu: 300m
requests:
memory: 100Mi
cpu: 100m
假如,我们要把该deployment部署到4C16G配置的节点上,可以得到如下信息。
Pod的有效请求是400 MiB的内存和600 millicores的CPU,你需要一个有足够自由可分配空间的节点来安排pod。 Redis容器的CPU份额将是512,而busybox容器是102,Kubernetes总是为每个核心分配1024个份额,因此redis:1024 * 0.5 cores ≅ 512和busybox:1024 * 0.1核 ≅ 102 如果Redis容器试图分配超过600MB的RAM,它将被OOM杀死,很可能使pod失败。 如果Redis试图在每100ms内使用超过100ms的CPU,(因为我们有4个核心,可用时间为每100ms 400ms),它将遭受CPU节流,导致性能下降。 如果Busybox容器试图分配超过200MB的RAM,它将被OOM杀死,导致一个失败的Pod。 如果Busybox试图每100ms使用超过30ms的CPU,它将遭受CPU节流,导致性能下降。
Kubernetes Requests
Kubernetes将请求定义为容器使用的资源的最低保证量。
基本上,它将设定容器所要消耗的资源的最小数量。
当一个Pod被调度时,kube-scheduler将检查Kubernetes请求,以便将其分配给一个特定的节点:该节点至少可以满足Pod中所有容器的这个数量。如果请求的数量高于可用的资源,Pod将不会被安排,并保持在Pending状态。
关于Pending状态的更多信息,请查看Understanding Kubernetes Pod pending problems【1】。
在这个例子中,在容器定义中,我们设置了一个请求,要求100m核心的CPU和4Mi的内存。
resources:
requests:
cpu: 0.1
memory: 4Mi
Requests通常被使用在以下场景:
当把Pod分配给一个节点时,所以Pod中的容器的指定请求被满足。 在运行时,指定的请求量将被保证为该Pod中的容器的最小值。
Kubernetes Limits
Kubernetes将Limits定义为一个容器使用的最大资源量。
这意味着容器的消耗量永远不能超过指定的内存量或CPU量。
resources:
limits:
cpu: 0.5
memory: 100Mi
Limits通常用于以下场景:
当把Pod分配给一个节点时,如果没有设置请求,默认情况下,Kubernetes将分配请求=限制。 在运行时,Kubernetes将检查Pod中的容器所消耗的资源量是否高于限制所显示的数量。
CPU的特性
CPU是一种可压缩的资源,这意味着它可以被拉伸,以满足所有的需求。如果进程要求太多的CPU,其中一些将被节制。
CPU代表计算处理时间,以核为单位。
你可以用毫微米(m)来表示比一个核心更小的数量(例如,500米是半个核心)。 最小的数量是1m 一个节点可能有一个以上的核心可用,所以请求CPU>1是可能的
内存的特性
内存是一种不可压缩的资源,意味着它不能像CPU那样被拉伸。如果一个进程没有得到足够的内存来工作,这个进程就会被杀死。
在Kubernetes中,内存的单位是字节。
你可以用,E,P,T,G,M,k来代表Exabyte,Petabyte,Terabyte,Gigabyte,Megabyte和kilobyte,尽管只有最后四个是常用的。(例如,500M, 4G) 警告:不要用小写的m表示内存(这代表Millibytes,低得离谱) 你可以用Mi来定义Mebibytes,其余的也可以用Ei、Pi、Ti来定义(例如,500Mi)
!! 一个Mebibyte(以及它们的类似物Kibibyte、Gibibyte...)是20字节的2次方。它的出现是为了避免与公制中的Kilo、Mega定义相混淆。你应该使用这个符号,因为它是字节的典型定义,而Kilo和Mega是1000的倍数。
最佳实践
在Kubernetes中,你应该很少使用限制来控制你的资源使用。这是因为如果你想避免饥饿(确保每个重要的进程都能得到它的份额),你应该首先使用请求。
通过设置限制,你只是防止进程在特殊情况下检索额外的资源,在内存方面造成OOM杀戮,在CPU方面造成Throttling(进程将需要等待CPU可以再次使用)。
欲了解更多信息,请查看article about OOM and Throttling【2】。
如果你在一个Pod的所有容器中设置一个等于限制的请求值,该Pod将获得保证的服务质量。
还需要注意的是,资源使用量高于请求的Pod更有可能被驱逐,所以设置非常低的请求会造成弊大于利。可以在Pod eviction and Quality of Service【3】查看。
Namespace ResourceQuata
由于命名空间的存在,我们可以将Kubernetes资源隔离到不同的组,也称为租户。
通过ResourceQuota,你可以为整个命名空间设置一个内存或CPU限制,确保其中的实体不能消耗超过这个数量。
apiVersion: v1
kind: ResourceQuota
metadata:
name: mem-cpu-demo
spec:
hard:
requests.cpu: 2
requests.memory: 1Gi
limits.cpu: 3
limits.memory: 2Gi
requests.cpu:这个命名空间中所有请求的最大CPU数量。 requests.memory:这个命名空间中所有请求的最大内存量。 limits.cpu:这个命名空间中所有限制的最大CPU数量。 limits.memory:这个命名空间中所有限制的总和的最大内存量。
然后,将其应用于你的命名空间。
kubectl apply -f resourcequota.yaml --namespace=mynamespace
你可以用以下方法列出一个命名空间的当前ResourceQuota。
kubectl get resourcequota -n mynamespace
注意,如果你为命名空间中的特定资源设置了ResourceQuota,那么你就需要为该命名空间中的每个Pod指定相应的限制或请求。否则,Kubernetes将返回一个 "failed quota"的错误。
Error from server (Forbidden): error when creating "mypod.yaml": pods "mypod" is forbidden: failed quota: mem-cpu-demo: must specify limits.cpu,limits.memory,requests.cpu,requests.memory
如果你试图添加一个新的Pod,其容器限制或请求超过了当前的ResourceQuota,Kubernetes将返回一个 "exceeded quota "的错误。
Error from server (Forbidden): error when creating "mypod.yaml": pods "mypod" is forbidden: exceeded quota: mem-cpu-demo, requested: limits.memory=2Gi,requests.memory=2Gi, used: limits.memory=1Gi,requests.memory=1Gi, limited: limits.memory=2Gi,requests.memory=1Gi
Namespace LimitRange
如果我们想限制一个命名空间可分配的资源总量,ResourceQuotas很有用。但如果我们想给里面的元素提供默认值,会发生什么?
LimitRanges是一种Kubernetes策略,它限制了命名空间中每个实体的资源设置。
apiVersion: v1
kind: LimitRange
metadata:
name: cpu-resource-constraint
spec:
limits:
- default:
cpu: 500m
defaultRequest:
cpu: 500m
min:
cpu: 100m
max:
cpu: "1"
type: Container
default。如果没有指定,创建的容器将有这个值。 min: 创建的容器不能有比这更小的限制或请求。 max: 创建的容器不能有大于此值的限制或请求。
以后,如果你创建一个没有设置请求或限制的新Pod,LimitRange会自动为其所有的容器设置这些值。
Limits:
cpu: 500m
Requests:
cpu: 100m
现在,想象一下,你添加一个新的Pod,以1200M为限。你会收到以下错误。
Error from server (Forbidden): error when creating "pods/mypod.yaml": pods "mypod" is forbidden: maximum cpu usage per Container is 1, but limit is 1200m
请注意,默认情况下,Pod中的所有容器将有效地拥有100m CPU的请求,即使没有设置LimitRanges。
总结
为我们的Kubernetes集群选择最佳限制是关键,以便获得最佳的能源消耗和成本。
为我们的Pod分配过多的资源可能会导致成本激增。
规模过小或专用于极少的CPU或内存将导致应用程序不能正常运行,甚至Pod被驱逐。
如前所述,除非在非常特殊的情况下,否则不应该使用Kubernetes限制,因为它们可能会造成更大的伤害。在内存不足的情况下,容器有可能被杀死,在CPU不足的情况下,容器有可能被节流。
对于请求,当你需要确保一个进程获得一个有保障的资源份额时,可以使用它们。
文档
【1】https://sysdig.com/blog/kubernetes-pod-pending-problems/
【2】https://sysdig.com/blog/troubleshoot-kubernetes-oom/
【3】https://sysdig.com/blog/kubernetes-pod-evicted/
链接:https://sysdig.com/blog/kubernetes-limits-requests/
(版权归原作者所有,侵删)
微信扫码关注该文公众号作者