Qué es ETL (Extract, Transform, Load)
El proceso de preparación de datos suele seguir tres etapas conocidas como ETL.
Extract (Extracción)
Consiste en obtener los datos desde las fuentes originales.
Ejemplos:
-
archivo Excel
-
base de datos SQL
-
API web
-
archivo CSV
Ejemplo real:
Una empresa tiene datos en:
-
ventas.xlsx
-
productos.csv
-
clientes en base de datos
Power BI puede extraer datos de todas estas fuentes.
Transform (Transformación)
En esta etapa se limpian y transforman los datos para prepararlos para el análisis.
Ejemplos de transformaciones:
-
eliminar columnas innecesarias
-
corregir errores
-
cambiar formatos
-
separar columnas
-
agrupar datos
-
crear nuevas columnas
Ejemplo:
Si una columna tiene valores:
España – Valencia
Francia – París
podemos dividirla en:
Ciudad
Load (Carga)
Una vez transformados, los datos se cargan en el modelo de Power BI para ser analizados.