Detecção de discurso de ódio para o apoio à saúde mental
DOI:
https://doi.org/10.59681/2175-4411.v16.iEspecial.2024.1255Palavras-chave:
Processamento de Linguagem Natural, Inteligência Artificial, ÓdioResumo
Objetivo: Este artigo visa explorar a classificação de textos extraídos de comentários de redes sociais que contêm linguagem ofensiva e discurso de ódio. As interações em redes sociais com este viés podem ter efeitos prejudiciais à saúde mental da população. Método: Utilizamos técnicas de Processamento de Linguagem Natural e Aprendizado de Máquina, aplicando-as a um conjunto de dados brasileiro. Investigamos o uso de embeddings, o emprego de redes neurais Long Short Term Memory (LSTM) e uma abordagem híbrida com Convolutional Neural Network (CNN). A análise inclui a avaliação do desbalanceamento de dados e a aplicação de técnicas de undersampling e oversampling. Resultados e conclusão: A otimização da LSTM resultou em ganhos modestos, sendo mais eficaz quando combinada com a CNN, especialmente com oversampling. No entanto, este último gera preocupações de overfitting. Os resultados indicam que o modelo desenvolvido é mais confiável para a detecção de linguagem ofensiva do que para o discurso de ódio.
Referências
Fortuna P, Nunes S. A Survey on Automatic Detection of Hate Speech in Text. ACM Computing Surveys. 2019;51(4):1-30.
Salminen J, Almerekhi H, Milenković M, Jung S-G, An J, Kwak H, et al. Anatomy of Online Hate: Developing a Taxonomy and Machine Learning Models for Identifying and Classifying Hate in Online News Media. Proceedings of the International AAAI Conference on Web and Social Media. 2018;12(1).
Nguyen T. Merging public health and automated approaches to address online hate speech. AI and Ethics. 2023.
Saha K, Chandrasekharan E, Choudhury MD. Prevalence and Psychological Effects of Hateful Speech in Online College Communities. Proceedings of the 10th ACM Conference on Web Science; Boston, Massachusetts, USA: Association for Computing Machinery; 2019. p. 255–64.
Vargas F, Carvalho I, Rodrigues de Góes F, Pardo T, Benevenuto F, editors. HateBR: A Large Expert Annotated Corpus of Brazilian Instagram Comments for Offensive Language and Hate Speech Detection2022 June; Marseille, France: European Language Resources Association.
Fortuna P, Rocha Da Silva J, Soler-Company J, Wanner L, Nunes S, editors. A Hierarchically-Labeled Portuguese Hate Speech Dataset. Proceedings of the Third Workshop on Abusive Language Online; 2019 2019-01-01: Association for Computational Linguistics.
Badjatiya P, Gupta S, Gupta M, Varma V, editors. Deep Learning for Hate Speech Detection in Tweets. Proceedings of the 26th International Conference on World Wide Web Companion - WWW '17 Companion; 2017 2017-01-01: ACM Press.
Garg M, Saxena C, Saha S, Krishnan V, Joshi R, Mago V, editors. CAMS: An Annotated Corpus for Causal Analysis of Mental Health Issues in Social Media Posts2022 June; Marseille, France: European Language Resources Association.
Hartmann N, Fonseca E, Shulby C, Treviso M, Rodrigues J, Aluisio S. Portuguese word embeddings: Evaluating on word analogies and natural language tasks. arXiv preprint arXiv:170806025. 2017.
Rajalaxmi RR, Prasad LVN, Janakiramaiah B, Pavankumar CS, Neelima N, Sathishkumar VE. Optimizing Hyperparameters and Performance Analysis of LSTM Model in Detecting Fake News on Social media. ACM Trans Asian Low-Resour Lang Inf Process. 2022.
Downloads
Publicado
Como Citar
Edição
Seção
Licença
Este trabalho está licenciado sob uma licença Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License.
A submissão de um artigo ao Journal of Health Informatics é entendida como exclusiva e que não está sendo considerada para publicação em outra revista. A permissão dos autores para a publicação de seu artigo no J. Health Inform. implica na exclusiva autorização concedida aos editores para incluí-lo na revista. Ao submeter um artigo, ao autor será solicitada a permissão eletrônica de um Termo de Transferência de Direitos Autorais. Uma mensagem eletrônica será enviada ao autor correspondente confirmando o recibo do manuscrito e o aceite da Declaração de Direito Autoral.