Airflow DAG触发规则[编辑 | 编辑源代码]

Airflow DAG触发规则（Trigger Rules）是Apache Airflow中控制任务执行逻辑的核心机制之一。它定义了任务在满足何种条件下才能被触发执行，尤其是在处理依赖关系复杂的DAG（有向无环图）时尤为重要。本文将详细介绍Airflow支持的触发规则类型、适用场景及实际案例。

概述[编辑 | 编辑源代码]

在Airflow中，DAG由多个任务（Task）组成，任务之间通过上下游依赖关系（使用`>>`或`set_upstream/set_downstream`）连接。默认情况下，一个任务仅在其所有直接上游任务成功执行后才会触发（即`all_success`规则）。然而，某些场景需要更灵活的控制逻辑，例如：

某个任务只要任意一个上游任务完成即可执行
上游任务失败时仍需要执行当前任务
完全忽略上游任务状态

Airflow通过`trigger_rule`参数提供多种触发规则选项，覆盖常见工作流需求。

触发规则类型[编辑 | 编辑源代码]

以下是Airflow支持的全部触发规则（截至2.0+版本）：

规则名称	描述	适用场景
`all_success`（默认）	所有上游任务必须成功	标准顺序流程
`all_failed`	所有上游任务必须失败	错误处理流程
`all_done`	所有上游任务完成（无论成功与否）	清理或通知任务
`one_success`	至少一个上游任务成功	并行分支选择
`one_failed`	至少一个上游任务失败	快速失败检测
`none_failed`	没有上游任务失败（允许跳过或成功）	条件分支
`none_skipped`	没有上游任务被跳过	严格顺序流程
`dummy`	完全忽略依赖关系	手动触发或测试

状态流转示意图[编辑 | 编辑源代码]

代码示例[编辑 | 编辑源代码]

以下示例展示不同触发规则的实际应用：

基础用法[编辑 | 编辑源代码]

from airflow import DAG
from airflow.operators.dummy import DummyOperator
from airflow.utils.dates import days_ago

dag = DAG('trigger_rules_demo', start_date=days_ago(1))

start = DummyOperator(task_id='start', dag=dag)
branch_a = DummyOperator(task_id='branch_a', dag=dag)
branch_b = DummyOperator(task_id='branch_b', dag=dag)
join = DummyOperator(task_id='join', dag=dag, trigger_rule='one_success')  # 关键配置

start >> [branch_a, branch_b] >> join

执行逻辑：

`join`任务会在`branch_a`或`branch_b`中任意一个成功时触发

错误处理场景[编辑 | 编辑源代码]

process = PythonOperator(task_id='process_data', python_callable=process_fn, dag=dag)
validate = PythonOperator(task_id='validate', python_callable=validate_fn, dag=dag)
notify_failure = EmailOperator(task_id='notify_failure', dag=dag, trigger_rule='all_failed')

process >> validate >> notify_failure

执行逻辑：

仅当`validate`任务失败时才会发送失败通知

数学表达[编辑 | 编辑源代码]

触发规则可以形式化表示为状态集合的布尔运算。设 $u p s t r e a m (T)$ 为任务T的所有上游任务集合， $s t a t e (t)$ 为任务t的状态（成功/失败/跳过等），则：

`all_success`: $\forall t \in u p s t r e a m (T), s t a t e (t) = s u c c e s s$
`one_failed`: $\exists t \in u p s t r e a m (T), s t a t e (t) = f a i l e d$
`none_skipped`: $∄ t \in u p s t r e a m (T), s t a t e (t) = s k i p p e d$

实际案例[编辑 | 编辑源代码]

案例1：并行数据处理[编辑 | 编辑源代码]

场景：需要处理来自多个数据源的文件，只要任一数据源处理完成即执行汇总任务。

配置代码：

summarize = PythonOperator(
    task_id='summarize',
    trigger_rule='one_success',  # 任一上游成功即触发
    ...
)

案例2：条件警报系统[编辑 | 编辑源代码]

场景：当所有检测任务均失败时触发紧急警报。

alert = SlackOperator(
    task_id='emergency_alert',
    trigger_rule='all_failed',  # 所有上游失败才触发
    ...
)

常见问题[编辑 | 编辑源代码]

Q: 如何跳过任务？

使用`BranchPythonOperator`或通过PythonCallback返回`airflow.utils.state.State.SKIPPED`

Q: `none_failed`与`all_success`的区别？

`none_failed`允许上游被跳过（SKIPPED），而`all_success`要求显式成功

Q: 为什么我的任务没有触发？

检查：1) 上游任务状态 2) 触发规则配置 3) DAG运行日期是否匹配

最佳实践[编辑 | 编辑源代码]

谨慎使用`dummy`规则，可能导致意外行为
在复杂工作流中为关键节点添加注释说明触发规则
使用`all_done`规则进行资源清理（如临时文件删除）
测试时结合`airflow tasks test`命令验证触发逻辑

通过合理运用触发规则，可以构建出既能处理常规流程又能应对异常情况的健壮数据流水线。