Ejercicio 14: j48
Vamos a cargar el dataset credit-g (german-credit) y a clasificarlo con el algoritmo J48
Vamos a probar primero con las opciones estándar.
Después vamos a bajar el nivel de confidencia a 0.05 y luego a subirlo a 0.5
Probamos con ‘unpruned’ a true
Volvemos a ponerlo en false y probamos ‘minnumobject’ a 4
Tenemos 5 conjuntos de prueba. Analicemos los resultados
¿Cuál tiene mayor precisión?
¿Cuál tiene mayor precisión en la clase bad?
Si nuestro objetivo fuera minimizar los falsos positivos de la clase ‘bad’, es decir, elementos que son ‘good’ pero que el algoritmo etiqueta como ‘bad’ ¿Qué modelo elegiríamos y por qué?