Du er ikke logget ind
Beskrivelse
Explorar y utilizar una gran cantidad de documentos de texto es una cuestión importante en el área de la recuperación de información y la minería de textos. Todos los métodos que pretenden encontrar grupos de entidades utilizan medidas de similitud o disimilitud. Es necesario analizar cómo se comporta la medida de similitud en los documentos de texto antes de desarrollar o modificar una buena medida de similitud para la agrupación de documentos con el fin de comprender la eficacia de la técnica. Una función de similitud integrada en una función de criterio es en gran medida responsable de analizar la estructura intrínseca de los datos. Si se utilizan medidas de similitud adecuadas con una técnica de clustering específica, se puede mejorar la eficacia y la precisión de la tarea de descubrimiento de información. El uso de medidas apropiadas no sólo mejora la procedencia y la credibilidad de la información recuperada, sino que también ayuda a superar la complejidad de tiempo y costes del proceso. Este libro se centra en la identificación de las distintas medidas de similitud para el clustering. Se ilustra un método imperativo para medir la similitud entre los documentos de texto para agrupar los documentos utilizando la agrupación jerárquica y el método de selección de características utilizando Matlab.