Ejercicio 12: preproceso
Descarga el archivo adjunto que encontrarás al final y renómbralo como weather.arff
Paso 1: Cargar el dataset en Weka
- Abre Weka.
- Ve a la pestaña Explorer.
- En el menú Preprocess, haz clic en Open file….
- Busca y selecciona el archivo “weather.arff” que acabas de renombrar.
Paso 2: Revisar los atributos
- Observa la lista de atributos en la parte izquierda de la pantalla. Verás que algunos atributos son nominales (como outlook) y otros numéricos (como temperature y humidity).
- Puedes hacer clic en cada uno de ellos para obtener información adicional, como el número de valores diferentes y las estadísticas para atributos numéricos.
Paso 3: Manejo de valores faltantes
- Ve a la parte derecha de la ventana, donde dice Filter.
- Haz clic en el botón Choose.
Aplica el filtro necesario para reemplaza cualquier valor faltante en el conjunto de datos con valores predeterminados (como la media o el modo, dependiendo de si el atributo es numérico o nominal).
Paso 4: Discretización de atributos numéricos
Discretiza el campo temperature para que tenga 5 intercalos
Paso 5: Filtrar atributos irrelevantes
Elimina el atributo windy
Paso 6: Normalización de atributos numéricos
-
- Estandariza el campo humidity para que tenga valores numéricos para que estén en una distribución normal, con media 0 y desviación 1
Paso 7: Guardar el dataset preprocesado
- Después de aplicar los filtros y limpiar el dataset, puedes guardarlo haciendo clic en Save en la parte superior del menú
- weather.nu_bad