Detección de discurso de odio para apoyo a la salud mental
DOI:
https://doi.org/10.59681/2175-4411.v16.iEspecial.2024.1255Palabras clave:
Procesamiento de Lenguaje Natural, Inteligencia Artificial, OdioResumen
Objetivo: Este artículo tiene como objetivo explorar la clasificación de textos extraídos de comentarios en redes sociales que contienen lenguaje ofensivo y discurso de odio. Las interacciones en redes sociales con este sesgo pueden tener efectos perjudiciales para la salud mental de la población. Método: Utilizamos técnicas de Procesamiento del Lenguaje Natural y Aprendizaje Automático, aplicándolas a un conjunto de datos brasileños. Investigamos el uso de embeddings, el empleo de redes neuronales Long Short-Term Memory (LSTM) y un enfoque híbrido con Convolutional Neural Network (CNN). El análisis incluye la evaluación del desequilibrio de datos y la aplicación de técnicas de submuestreo y sobremuestreo. Resultados y conclusión: La optimización de LSTM resultó en ganancias modestas, siendo más efectiva cuando se combina con CNN, especialmente con sobremuestreo. Sin embargo, este último plantea preocupaciones sobre el sobreajuste. Los resultados indican que el modelo desarrollado es más confiable para detectar lenguaje ofensivo que discurso de odio.
Citas
Fortuna P, Nunes S. A Survey on Automatic Detection of Hate Speech in Text. ACM Computing Surveys. 2019;51(4):1-30. DOI: https://doi.org/10.1145/3232676
Salminen J, Almerekhi H, Milenković M, Jung S-G, An J, Kwak H, et al. Anatomy of Online Hate: Developing a Taxonomy and Machine Learning Models for Identifying and Classifying Hate in Online News Media. Proceedings of the International AAAI Conference on Web and Social Media. 2018;12(1). DOI: https://doi.org/10.1609/icwsm.v12i1.15028
Nguyen T. Merging public health and automated approaches to address online hate speech. AI and Ethics. 2023. DOI: https://doi.org/10.1007/s43681-023-00281-w
Saha K, Chandrasekharan E, Choudhury MD. Prevalence and Psychological Effects of Hateful Speech in Online College Communities. Proceedings of the 10th ACM Conference on Web Science; Boston, Massachusetts, USA: Association for Computing Machinery; 2019. p. 255–64. DOI: https://doi.org/10.1145/3292522.3326032
Vargas F, Carvalho I, Rodrigues de Góes F, Pardo T, Benevenuto F, editors. HateBR: A Large Expert Annotated Corpus of Brazilian Instagram Comments for Offensive Language and Hate Speech Detection2022 June; Marseille, France: European Language Resources Association.
Fortuna P, Rocha Da Silva J, Soler-Company J, Wanner L, Nunes S, editors. A Hierarchically-Labeled Portuguese Hate Speech Dataset. Proceedings of the Third Workshop on Abusive Language Online; 2019 2019-01-01: Association for Computational Linguistics. DOI: https://doi.org/10.18653/v1/W19-3510
Badjatiya P, Gupta S, Gupta M, Varma V, editors. Deep Learning for Hate Speech Detection in Tweets. Proceedings of the 26th International Conference on World Wide Web Companion - WWW '17 Companion; 2017 2017-01-01: ACM Press. DOI: https://doi.org/10.1145/3041021.3054223
Garg M, Saxena C, Saha S, Krishnan V, Joshi R, Mago V, editors. CAMS: An Annotated Corpus for Causal Analysis of Mental Health Issues in Social Media Posts2022 June; Marseille, France: European Language Resources Association.
Hartmann N, Fonseca E, Shulby C, Treviso M, Rodrigues J, Aluisio S. Portuguese word embeddings: Evaluating on word analogies and natural language tasks. arXiv preprint arXiv:170806025. 2017.
Rajalaxmi RR, Prasad LVN, Janakiramaiah B, Pavankumar CS, Neelima N, Sathishkumar VE. Optimizing Hyperparameters and Performance Analysis of LSTM Model in Detecting Fake News on Social media. ACM Trans Asian Low-Resour Lang Inf Process. 2022. DOI: https://doi.org/10.1145/3511897
Descargas
Publicado
Cómo citar
Número
Sección
Licencia
Esta obra está bajo una licencia internacional Creative Commons Atribución-NoComercial-CompartirIgual 4.0.
La sumisión de un artículo a el Journal of Health Informatics es entendida como exclusiva y que no esta siendo considerado para publicación en otro periódico. La permisión de los autores para la publicación de su artículo en lo JHI implica en la exclusiva autorización concedida a los editores para su inclusión en la revista. Al someter un artículo, a lo autor será solicitada la permisión electrónica de una Nota de Copyright. Una mensaje electrónica será enviada a lo autor correspondiente confirmando el recibo del manuscrito y lo aceite de la Nota de Copyright.