🛫 O que é o Apache Airflow?
O Apache Airflow é uma plataforma open-source para orquestração de workflows, ou seja, ele ajuda a criar, agendar e monitorar pipelines de dados (ou qualquer tipo de processo automatizado) de forma organizada e escalável.
Em vez de executar scripts de forma solta e sem controle, o Airflow permite:
📌 1. DAGs (Directed Acyclic Graphs)
O conceito central do Airflow é o DAG — Directed Acyclic Graph, ou grafo acÃclico direcionado.
💡 No Airflow:
>>
ou <<
.Exemplo simples de DAG no Airflow:
from airflow import DAG
from airflow.operators.python import PythonOperator
from datetime import datetime
def tarefa_exemplo():
print("Executando tarefa...")
with DAG(
dag_id='meu_dag_exemplo',
start_date=datetime(2025, 1, 1),
schedule_interval='@daily',
catchup=False
) as dag:
tarefa1 = PythonOperator(
task_id='tarefa_1',
python_callable=tarefa_exemplo
)
tarefa2 = PythonOperator(
task_id='tarefa_2',
python_callable=lambda: print("Segunda tarefa")
)
tarefa1 >> tarefa2 # Definindo a ordem