Du er ikke logget ind
Beskrivelse
La selección de características óptimas es un área importante de investigación en los sistemas de minería de datos médicos. En esta investigación introducimos un procedimiento eficiente -selección de subconjuntos de características, clasificación de características y clasificación- llamado Análisis de Componentes Principales basado en el método JK para la mejora de la precisión de la detección y la selección de subconjuntos de características óptimas. El método propuesto ajusta un parámetro denominado "cobertura de varianza" y construye el modelo con el valor en el que se obtiene la máxima precisión de clasificación. Esto facilita la selección de un conjunto compacto de características superiores, notablemente a un coste muy bajo. La extensa comparación experimental del método propuesto y otros métodos utilizando tres clasificadores diferentes (Naïve Bayes (NB), perceptrón multicapa (MLP) y árbol de decisión J48) y 6 conjuntos de datos médicos diferentes puede confirmar que la estrategia propuesta (PCA-JK) produce resultados prometedores en la selección de características y la precisión de la clasificación para el campo de investigación de la minería de datos médicos.