From c0e1cdb8d325d00cdaa1baace09e5afbd60a79be Mon Sep 17 00:00:00 2001 From: Marvin Pacheco Date: Wed, 25 Mar 2026 17:33:56 -0600 Subject: [PATCH] Add README for Python ETL FTP to SQL Server Added detailed documentation for the ETL process from FTP to SQL Server, including architecture, components, rules, and execution instructions. --- README.md | 88 +++++++++++++++++++++++++++++++++++++++++++++++++++++++ 1 file changed, 88 insertions(+) create mode 100644 README.md diff --git a/README.md b/README.md new file mode 100644 index 0000000..797e0d2 --- /dev/null +++ b/README.md @@ -0,0 +1,88 @@ +# Python_ETL_FTP-SQL +Proceso ETL en python para importar archivos en FTP a SQL Server +======= +# 🚀 ETL FTP → SQL Server + +## Descripción +Pipeline que: +- Descarga archivos FTP +- Procesa CSV sin encabezado +- Carga a SQL Server (modelo estrella) + +## Arquitectura +FTP → Python → SQL Server → BI + +## Componentes +- Dimensiones: edificio, puerta, fecha +- Fact: flujo personas +- Control incremental + +## Reglas +- Solo archivos que empiezan con "20" +- Agrupación por MAX (entradas/salidas) + +## Resultado +- Datos listos para análisis +- Detección de anomalías +- Soporte multi-horario + +_____________________________________________________________________ + + +FTP → Python → SQL Server → BI + + +--- + +## 📂 Estructura + +- `/sql` → scripts de base de datos +- `/python` → pipeline ETL +- `/docs` → documentación técnica + +--- + +## ⚙️ Reglas + +- Archivos válidos empiezan con `20` +- CSV sin encabezados +- Entradas = Campo 9 +- Salidas = Campo 10 +- Agregación por `MAX` + +--- + +## 📊 Modelo + +### Dimensiones +- Edificio +- Puerta +- Fecha +- Horario operativo + +### Hechos +- Flujo de personas + +--- + +## 🚀 Features + +- Incremental real +- Soporte multi-horario (temporadas) +- Detección de anomalías +- Listo para Power BI + +--- + +## 🔐 Seguridad + +NO subir credenciales: +- Usar variables de entorno + +--- + +## ▶️ Ejecución + +```bash +python ftp_pipeline.py +>>>>>>> e49016f (Python ETL FTP SQL)