🧩 Contexto:
Trabajas en el backend de una tienda en línea. Cada noche a las 2:00 a.m., el sistema genera un archivo CSV con todas las ventas del día. Tu trabajo es construir un pipeline ETL que:
- Extraiga los datos del archivo CSV generado diariamente.
- Transforme los datos: convierta las fechas, limpie campos, calcule totales.
- Cargue los datos limpios en una base de datos PostgreSQL para análisis de negocio.
🛠 Herramientas sugeridas:
pandas
para lectura y transformación
psycopg2
o SQLAlchemy
para cargar a PostgreSQL
cron
o Prefect para automatización
🧪 Cómo practicar:
- Simula archivos CSV con columnas como:
order_id
, date
, customer_name
, amount
, currency
- Crea transformaciones: convertir moneda, extraer día de la semana, agrupar totales
- Automatiza con un script Python ejecutado diariamente