Detecção de discurso de ódio para o apoio à saúde mental

Ítalo Santos de Oliveira; Rodrigo Rafael Villarreal Goulart

doi:10.59681/2175-4411.v16.iEspecial.2024.1255

Autores/as

Ítalo Santos de Oliveira Universidade Feevale
Rodrigo Rafael Villarreal Goulart Universidade Feevale

DOI:

https://doi.org/10.59681/2175-4411.v16.iEspecial.2024.1255

Palabras clave:

Procesamiento de Lenguaje Natural, Inteligencia Artificial, Odio

Resumen

Objetivo: Este artículo tiene como objetivo explorar la clasificación de textos extraídos de comentarios en redes sociales que contienen lenguaje ofensivo y discurso de odio. Las interacciones en redes sociales con este sesgo pueden tener efectos perjudiciales para la salud mental de la población. Método: Utilizamos técnicas de Procesamiento del Lenguaje Natural y Aprendizaje Automático, aplicándolas a un conjunto de datos brasileños. Investigamos el uso de embeddings, el empleo de redes neuronales Long Short-Term Memory (LSTM) y un enfoque híbrido con Convolutional Neural Network (CNN). El análisis incluye la evaluación del desequilibrio de datos y la aplicación de técnicas de submuestreo y sobremuestreo. Resultados y conclusión: La optimización de LSTM resultó en ganancias modestas, siendo más efectiva cuando se combina con CNN, especialmente con sobremuestreo. Sin embargo, este último plantea preocupaciones sobre el sobreajuste. Los resultados indican que el modelo desarrollado es más confiable para detectar lenguaje ofensivo que discurso de odio.

Biografía del autor/a

Ítalo Santos de Oliveira, Universidade Feevale

Bacharelando, Universidade Feevale, Instituto de Ciências Criativas e Tecnológicas, Universidade Feevale, Novo Hamburgo (RS), Brasil.

Rodrigo Rafael Villarreal Goulart, Universidade Feevale

Pesquisador, Instituto de Ciências Criativas e Tecnológicas, Universidade Feevale, Novo Hamburgo (RS), Brasil.

Citas

Fortuna P, Nunes S. A Survey on Automatic Detection of Hate Speech in Text. ACM Computing Surveys. 2019;51(4):1-30. DOI: https://doi.org/10.1145/3232676

Salminen J, Almerekhi H, Milenković M, Jung S-G, An J, Kwak H, et al. Anatomy of Online Hate: Developing a Taxonomy and Machine Learning Models for Identifying and Classifying Hate in Online News Media. Proceedings of the International AAAI Conference on Web and Social Media. 2018;12(1). DOI: https://doi.org/10.1609/icwsm.v12i1.15028

Nguyen T. Merging public health and automated approaches to address online hate speech. AI and Ethics. 2023. DOI: https://doi.org/10.1007/s43681-023-00281-w

Saha K, Chandrasekharan E, Choudhury MD. Prevalence and Psychological Effects of Hateful Speech in Online College Communities. Proceedings of the 10th ACM Conference on Web Science; Boston, Massachusetts, USA: Association for Computing Machinery; 2019. p. 255–64. DOI: https://doi.org/10.1145/3292522.3326032

Vargas F, Carvalho I, Rodrigues de Góes F, Pardo T, Benevenuto F, editors. HateBR: A Large Expert Annotated Corpus of Brazilian Instagram Comments for Offensive Language and Hate Speech Detection2022 June; Marseille, France: European Language Resources Association.

Fortuna P, Rocha Da Silva J, Soler-Company J, Wanner L, Nunes S, editors. A Hierarchically-Labeled Portuguese Hate Speech Dataset. Proceedings of the Third Workshop on Abusive Language Online; 2019 2019-01-01: Association for Computational Linguistics. DOI: https://doi.org/10.18653/v1/W19-3510

Badjatiya P, Gupta S, Gupta M, Varma V, editors. Deep Learning for Hate Speech Detection in Tweets. Proceedings of the 26th International Conference on World Wide Web Companion - WWW '17 Companion; 2017 2017-01-01: ACM Press. DOI: https://doi.org/10.1145/3041021.3054223

Garg M, Saxena C, Saha S, Krishnan V, Joshi R, Mago V, editors. CAMS: An Annotated Corpus for Causal Analysis of Mental Health Issues in Social Media Posts2022 June; Marseille, France: European Language Resources Association.

Hartmann N, Fonseca E, Shulby C, Treviso M, Rodrigues J, Aluisio S. Portuguese word embeddings: Evaluating on word analogies and natural language tasks. arXiv preprint arXiv:170806025. 2017.

Rajalaxmi RR, Prasad LVN, Janakiramaiah B, Pavankumar CS, Neelima N, Sathishkumar VE. Optimizing Hyperparameters and Performance Analysis of LSTM Model in Detecting Fake News on Social media. ACM Trans Asian Low-Resour Lang Inf Process. 2022. DOI: https://doi.org/10.1145/3511897

Detección de discurso de odio para apoyo a la salud mental

Autores/as

DOI:

Palabras clave:

Resumen

Biografía del autor/a

Ítalo Santos de Oliveira, Universidade Feevale

Rodrigo Rafael Villarreal Goulart, Universidade Feevale

Citas

Descargas

Publicado

Cómo citar

Número

Sección

Licencia

Artículos similares

Idioma

Información

Indexadores, Bases de Dados, Repositórios e Bibliotecas