Du er ikke logget ind
Beskrivelse
Le présent travail concerne l¿optimisation de la décision par les méthodes ensemblistes pour le traitement des bases de données déséquilibrées. Pour y arriver nous avons utilisé les méthodes ensemblistes qui sont basées sur la combinaison homogène des prédictions ou classifieurs pour une meilleure généralisation.Dans notre projet, nous nous sommes basés sur la base de données de Credit Card Fraud Detection pour générer et évaluer le modèle proposé. Nous avons aussi choisi la méthode de combinaison forêt aléatoire (random forest) qui combine plusieurs arbres de décisions et applique la stratégie de vote majoritaire afin de dégager une prédiction optimale.Notre étude vise à construire un modèle de prédiction avec les méthodes ensemblistes pour améliorer les performances d¿un classifieur individuel afin traiter les jeux de données déséquilibrées. Pour atteindre notre objectif, hormis la méthode de combinaison forêt aléatoire utilisée, nous aussi utilisé les méthodes de sous-échantillonnage et de sur-échantillonnage pour aboutir aux mêmes résultats et enfin tirer une conclusion sur les trois méthodes utilisées et cela nous l¿avons implémenté avec le langage de programmation phyton.