Uso visualizer
Pasos para usar el Visualizer con el dataset Iris:
1. Cargar el dataset Iris:
- Abre Weka.
- Ve a la pestaña Preprocess.
- En Open file…, selecciona el archivo iris.arff (que está incluido en Weka).
2. Ir a la pestaña Visualize:
- Una vez cargado el dataset, cambia a la pestaña Visualize.
- Aquí verás un gráfico de dispersión (scatter plot) que compara dos atributos a la vez, lo que te permite analizar visualmente la relación entre ellos.
3. Selección de atributos para visualizar:
- En el Panel de Visualización, selecciona el Eje X y el Eje Y en los menús desplegables para elegir los atributos que quieras visualizar. Por ejemplo:
- X-axis:
petal length (longitud del pétalo)
- Y-axis:
petal width (ancho del pétalo)
- X-axis:
4. Coloración por clase:
- Debajo de los ejes, puedes elegir colorear los puntos según la clase seleccionada. Selecciona el atributo
class
(que corresponde a las especies de Iris: Setosa, Versicolor, y Virginica). - Los puntos en el gráfico se colorearán de acuerdo a las especies, lo que te permite observar fácilmente cómo se distribuyen las tres clases en función de las dos variables elegidas.
5. Interpretación del gráfico:
- En este caso, al visualizar petal length vs. petal width, verás que las tres clases están bien separadas:
- La clase
Iris-setosa
aparece claramente separada en una región del gráfico. - Las clases
Iris-versicolor
eIris-virginica
están más solapadas, pero todavía muestran cierta separación.
Esta visualización te ayuda a comprender que los atributos relacionados con las dimensiones del pétalo tienen una fuerte influencia en la clasificación de las especies de Iris, lo que indica que son buenos predictores.
- La clase
6. Otras opciones:
- Puedes cambiar los atributos visualizados en el eje X y el eje Y para explorar otras relaciones, como la comparación de sepal length con sepal width, pero estas no mostrarán una separación tan clara entre las clases.
- También puedes utilizar opciones como Zoom o Selection, que te permiten acercar y seleccionar subconjuntos de datos para una inspección más detallada.
Ejemplo Visualizado:
Si seleccionas petal length y petal width como ejes y coloreas por la clase, el gráfico revelará que la clase Iris-setosa
está completamente separada de las otras dos, lo que indica que estos atributos son excelentes para distinguir esta clase. Sin embargo, las clases Iris-versicolor
e Iris-virginica
se solapan, sugiriendo que se requerirán atributos adicionales o más complejos para separarlas mejor.