Du er ikke logget ind
Beskrivelse
La pulizia dei dati è una fase cruciale della preparazione dei dati. I valori persi nel database sono un problema comune per gli analisti di dati. I valori mancanti nel data mining sono un problema continuo che può causare errori nell'analisi dei dati. Gli elementi casualmente mancanti negli attributi/dataset complicano l'analisi dei dati e confondono i risultati consolidati. Ciò influisce sull'accuratezza dei risultati e delle query intermedie. Utilizzando metodi statistici e numerici, è possibile recuperare i dati mancanti e diminuire la diffidenza nel database. La presente ricerca fornisce un approccio applicato al metodo Newton Forward Interpolation (NFI) per recuperare i valori mancanti e altri metodi diversi. I dati del dataset rimangono sempre gli elementi di base per qualsiasi interrogazione e per ulteriori attività e decisioni. Se i dati di base sono incompleti o se il set di dati presenta valori mancanti, non è possibile ipotizzare rapporti finali ben aggiornati. Nel data mining il riconoscimento e il recupero dei valori mancanti è ancora un problema importante per i dati irregolari. Per ovviare a questa situazione è necessario ricorrere a tecniche statistiche o numeriche per recuperare i valori mancanti nel set di dati.