Du er ikke logget ind
Beskrivelse
El discurso del odio y el acoso están muy extendidos en la comunicación en línea, debido a la libertad y el anonimato de los usuarios y a la falta de regulación de las redes sociales. Por ello, el trolling y el acoso cibernéticos son problemas importantes en la sociedad. Para superar este problema, podemos utilizar la capacidad del aprendizaje automático para la detección del discurso del odio con el fin de capturar las propiedades comunes de los conjuntos de datos genéricos y transferir este conocimiento para reconocer manifestaciones específicas del discurso del odio utilizando NLP, ML y análisis. Nuestro objetivo principal es aplicar este modelo sofisticado y eficiente a datos de texto para obtener resultados óptimos y precisos. Utilizamos diferentes técnicas de aprendizaje automático y aprendizaje profundo, incluidos enfoques multimodales. Utilizamos un conjunto de datos dividido en temas específicos como misoginia, sexismo, racismo, xenofobia y homofobia. El entrenamiento de un modelo en una combinación de varios (trainingsets de varios) conjuntos de datos de temas específicos es más eficaz que el entrenamiento de un modelo en un conjunto de datos genérico-atópico. Los conjuntos de datos pueden obtenerse de diversas fuentes, como YouTubeAPI, Twitter API, web-scrapping o diversas fuentes gubernamentales. Nuestro objetivo es realizar un preprocesamiento y un análisis exploratorio de los datos recopilados y extraer conclusiones a partir de ellos,