Kubernetes优先级类（PriorityClass）[编辑 | 编辑源代码]

优先级类（PriorityClass）是Kubernetes中用于定义Pod调度优先级的资源对象。它允许集群管理员为不同的Pod分配不同的优先级，确保关键工作负载在资源紧张时优先获得调度。本指南将详细介绍其工作原理、配置方法及实际应用场景。

概述[编辑 | 编辑源代码]

优先级类通过数值（`value`字段）表示优先级，数值越大优先级越高。当集群资源不足时，调度器（kube-scheduler）会根据优先级决定哪些Pod会被优先调度或驱逐。优先级类的典型用途包括：

确保高优先级任务（如生产环境服务）优先于低优先级任务（如批处理作业）
定义系统关键Pod（如核心组件）的抢占行为

核心属性[编辑 | 编辑源代码]

一个PriorityClass的定义包含以下关键字段：

apiVersion: scheduling.k8s.io/v1
kind: PriorityClass
metadata:
  name: high-priority
value: 1000000        # 优先级数值（32位整数）
globalDefault: false  # 是否作为集群默认优先级
description: "用于关键生产服务"

字段说明[编辑 | 编辑源代码]

value：优先级数值，范围 -2,147,483,648 到 1,000,000,000（系统保留）
globalDefault：若为`true`，则未指定优先级的Pod自动使用此值（集群中只能有一个这样的PriorityClass）
description：人类可读的描述信息

创建优先级类[编辑 | 编辑源代码]

以下示例创建两个不同优先级的类：

# 创建高优先级类
kubectl apply -f - <<EOF
apiVersion: scheduling.k8s.io/v1
kind: PriorityClass
metadata:
  name: mission-critical
value: 1000000
description: "关键业务服务"
EOF

# 创建低优先级类
kubectl apply -f - <<EOF
apiVersion: scheduling.k8s.io/v1
kind: PriorityClass
metadata:
  name: batch-job
value: 100
description: "非紧急批处理任务"
EOF

验证创建结果：

kubectl get priorityclass

输出示例：

NAME               VALUE        GLOBAL-DEFAULT   AGE
mission-critical   1000000      false            15s
batch-job          100          false            8s

在Pod中使用[编辑 | 编辑源代码]

通过`priorityClassName`字段为Pod指定优先级：

apiVersion: v1
kind: Pod
metadata:
  name: nginx-high-priority
spec:
  containers:
  - name: nginx
    image: nginx
  priorityClassName: mission-critical  # 引用已定义的PriorityClass

优先级与抢占[编辑 | 编辑源代码]

当高优先级Pod因资源不足无法调度时，Kubernetes可能驱逐（preempt）低优先级Pod。抢占行为遵循以下规则： 1. 检查是否存在优先级低于请求Pod的正在运行Pod 2. 尝试找到能够通过驱逐释放足够资源的节点 3. 优雅终止被选中的Pod（遵循`terminationGracePeriodSeconds`）

系统优先级[编辑 | 编辑源代码]

Kubernetes保留两类特殊优先级：

system-cluster-critical：值=2,000,000,000（如kube-dns）
system-node-critical：值=2,000,000,001（如kube-proxy）

实际案例[编辑 | 编辑源代码]

场景：混合工作负载集群[编辑 | 编辑源代码]

某集群同时运行： 1. 用户-facing的Web服务（高优先级） 2. 数据分析批处理任务（低优先级）

配置方案：

# Web服务Pod配置
apiVersion: apps/v1
kind: Deployment
metadata:
  name: web-frontend
spec:
  template:
    spec:
      priorityClassName: mission-critical
      containers: [...] 

# 批处理任务配置
apiVersion: batch/v1
kind: Job
metadata:
  name: data-processing
spec:
  template:
    spec:
      priorityClassName: batch-job
      containers: [...]

当计算节点资源紧张时，批处理任务的Pod可能被驱逐以确保Web服务持续运行。

最佳实践[编辑 | 编辑源代码]

1. 合理规划优先级数值：建议在1000-1,000,000之间划分区间 2. 避免过度使用高优先级：可能导致低优先级任务"饥饿" 3. 监控抢占事件：通过kube-scheduler日志或事件观察 4. 系统组件保护：不要为普通Pod分配超过system-node-critical的值

数学表示[编辑 | 编辑源代码]

优先级调度可形式化为： $ScheduleOrder (P) = {\begin{cases} 优先调度 & if value (P) > threshold \\ 正常队列 & otherwise \end{cases}$ 其中 $P$ 表示Pod， $value (P)$ 是其优先级值。

常见问题[编辑 | 编辑源代码]

Q：如何查看Pod的优先级？[编辑 | 编辑源代码]

kubectl get pod <pod-name> -o jsonpath='{.spec.priorityClassName}'

Q：能否修改已存在的PriorityClass的value？[编辑 | 编辑源代码]

不可以，value字段是不可变的。需要删除后重建。

总结[编辑 | 编辑源代码]

优先级类是Kubernetes资源管理的重要机制，通过合理配置可以：

确保关键服务的高可用性
优化集群资源利用率
实现工作负载的差异化调度

初学者应从简单的优先级划分开始，逐步掌握复杂场景下的配置策略。