编辑“︁Kubernetes自动扩缩容”︁

= Kubernetes自动扩缩容 =

'''Kubernetes自动扩缩容'''（Horizontal Pod Autoscaler, HPA）是Kubernetes中一种动态调整Pod副本数量的机制，它能够根据资源使用率（如CPU、内存）或自定义指标自动扩展或收缩应用程序的实例数量。这一功能对于无服务器（Serverless）架构和云原生应用至关重要，能够优化资源利用率并保障服务稳定性。

== 核心概念 ==

自动扩缩容通过监控Pod的指标（默认支持CPU和内存，也可扩展至自定义指标）来动态调整副本数量。其核心组件包括：
* '''Metrics Server'''：收集集群资源指标（如CPU/内存使用率）。
* '''HPA控制器'''：根据目标值计算所需副本数。
* '''自定义指标适配器'''（如Prometheus Adapter）：支持基于应用特定指标（如请求延迟、队列长度）的扩缩容。

扩缩容行为遵循公式：
<math>
\text{期望副本数} = \lceil \frac{\text{当前指标值}}{\text{目标指标值}} \times \text{当前副本数} \rceil
</math>

== 配置示例 ==

以下是一个基于CPU使用率的HPA配置示例：

<syntaxhighlight lang="yaml">
apiVersion: autoscaling/v2
kind: HorizontalPodAutoscaler
metadata:
  name: myapp-hpa
spec:
  scaleTargetRef:
    apiVersion: apps/v1
    kind: Deployment
    name: myapp
  minReplicas: 1
  maxReplicas: 10
  metrics:
  - type: Resource
    resource:
      name: cpu
      target:
        type: Utilization
        averageUtilization: 50
</syntaxhighlight>

'''参数说明'''：
* '''scaleTargetRef'''：指定要扩缩的目标Deployment。
* '''minReplicas/maxReplicas'''：副本数上下限。
* '''target'''：当CPU平均使用率达到50%时触发扩缩容。

== 工作流程 ==
<mermaid>
graph TD
    A[Metrics Server收集指标] --> B[HPA控制器读取指标]
    B --> C{指标超过阈值?}
    C -->|是| D[增加副本数]
    C -->|否| E[减少副本数]
    D --> F[更新Deployment]
    E --> F
</mermaid>

== 高级配置 ==

=== 基于自定义指标 ===
需安装Prometheus Adapter并配置如下HPA：
<syntaxhighlight lang="yaml">
metrics:
- type: Pods
  pods:
    metric:
      name: requests_per_second
    target:
      type: AverageValue
      averageValue: 100
</syntaxhighlight>

=== 扩缩容行为调优 ===
通过`behavior`字段控制扩缩容速度：
<syntaxhighlight lang="yaml">
behavior:
  scaleDown:
    stabilizationWindowSeconds: 300
    policies:
    - type: Percent
      value: 10
      periodSeconds: 60
</syntaxhighlight>
此配置表示缩容时：
* 每60秒最多减少10%的副本数。
* 指标稳定时间窗口为300秒。

== 实际案例 ==

'''场景'''：电商网站在大促期间需处理突发流量。
'''解决方案'''：
1. 配置HPA基于CPU使用率和HTTP请求数双指标：
<syntaxhighlight lang="yaml">
metrics:
- type: Resource
  resource:
    name: cpu
    target:
      averageUtilization: 70
- type: External
  external:
    metric:
      name: http_requests
      selector:
        matchLabels:
          app: myapp
    target:
      type: AverageValue
      averageValue: 500
</syntaxhighlight>
2. 当任一指标超过阈值时触发扩容，确保服务可用性。

== 常见问题 ==

{| class="wikitable"
! 问题 !! 解决方法
|-
| HPA不生效 || 检查Metrics Server是否运行：<code>kubectl top pod</code>
|-
| 频繁抖动 || 调整`stabilizationWindowSeconds`或增加指标采样间隔
|-
| 自定义指标无法识别 || 验证Prometheus Adapter的规则配置
|}

== 最佳实践 ==
* 始终设置`minReplicas ≥ 1`保证基础可用性
* 结合Pod Disruption Budget（PDB）防止意外中断
* 生产环境建议使用`autoscaling/v2` API版本
* 通过`kubectl describe hpa`监控扩缩容事件

== 扩展阅读 ==
* Kubernetes官方文档：Horizontal Pod Autoscaler
* 自定义指标适配器实现方案（如KEDA）
* 垂直扩缩容（VPA）与HPA的协同使用

[[Category:集成部署]]
[[Category:Kubernetes]]
[[Category:Kubernetes无服务器]]