Ejercicio 16: Testar clasificadores
En el dataset de weka hay varios archivos de ejemplo. Vamos a analizar los siguientes:
breast-cancer.arff
glass.arff
weather.numeric.arff
Probad para cada uno de ellos al menos tres algoritmos de clasificación (J48, NaiveBayes, RandomForest). Utilizad algunas de las opciones que hemos visto en el curso para intentar optimizar los resultados dentro de cada algoritmo. En base a los errores y la matriz de confusión explicad cual creéis que es mejor para cada uno de los archivos.
Recordad que evaluamos dos cosas: porcentaje de aciertos y matriz de confusión. Explicad cual nos da mejor precisión pero si al analizar la matriz de confusión detectáis que está desbalanceada haced un breve análisis de en qué casos nos interesaría utilizar un modelo o utilizar otro.