Du er ikke logget ind
Beskrivelse
A selecção das melhores características é uma importante área de investigação em sistemas de mineração de dados médicos. Nesta investigação introduzimos um procedimento eficiente - selecção de subconjuntos de características, classificação e classificação de características, chamado Análise de Componentes Principal baseada no método JK para a melhoria da precisão de detecção e selecção de subconjuntos de características óptimas. O método proposto ajusta um parâmetro denominado "cobertura de variância" e constrói o modelo com o valor a partir do qual se obtém a máxima precisão de classificação. Isto facilita a selecção de um conjunto compacto de características superiores, notavelmente a um custo muito baixo. A extensa comparação experimental do método proposto e outros métodos que utilizam três classificadores diferentes (Naïve Bayes (NB), perceptron multi-layer (MLP) e árvore de decisão J48) e 6 conjuntos de dados médicos diferentes podem confirmar que a estratégia proposta (PCA-JK) produz resultados promissores na selecção de características e precisão de classificação para o campo de investigação de dados médicos.