Detecção de discurso de ódio para o apoio à saúde mental

Autores

  • Ítalo Santos de Oliveira Universidade Feevale
  • Rodrigo Rafael Villarreal Goulart Universidade Feevale

DOI:

https://doi.org/10.59681/2175-4411.v16.iEspecial.2024.1255

Palavras-chave:

Processamento de Linguagem Natural, Inteligência Artificial, Ódio

Resumo

Objetivo: Este artigo visa explorar a classificação de textos extraídos de comentários de redes sociais que contêm linguagem ofensiva e discurso de ódio. As interações em redes sociais com este viés podem ter efeitos prejudiciais à saúde mental da população. Método: Utilizamos técnicas de Processamento de Linguagem Natural e Aprendizado de Máquina, aplicando-as a um conjunto de dados brasileiro. Investigamos o uso de embeddings, o emprego de redes neurais Long Short Term Memory (LSTM) e uma abordagem híbrida com Convolutional Neural Network (CNN). A análise inclui a avaliação do desbalanceamento de dados e a aplicação de técnicas de undersampling e oversampling. Resultados e conclusão: A otimização da LSTM resultou em ganhos modestos, sendo mais eficaz quando combinada com a CNN, especialmente com oversampling. No entanto, este último gera preocupações de overfitting. Os resultados indicam que o modelo desenvolvido é mais confiável para a detecção de linguagem ofensiva do que para o discurso de ódio.

Biografia do Autor

Ítalo Santos de Oliveira, Universidade Feevale

Bacharelando, Universidade Feevale, Instituto de Ciências Criativas e Tecnológicas, Universidade Feevale, Novo Hamburgo (RS), Brasil.

Rodrigo Rafael Villarreal Goulart, Universidade Feevale

Pesquisador, Instituto de Ciências Criativas e Tecnológicas, Universidade Feevale, Novo Hamburgo (RS), Brasil.

Referências

Fortuna P, Nunes S. A Survey on Automatic Detection of Hate Speech in Text. ACM Computing Surveys. 2019;51(4):1-30. DOI: https://doi.org/10.1145/3232676

Salminen J, Almerekhi H, Milenković M, Jung S-G, An J, Kwak H, et al. Anatomy of Online Hate: Developing a Taxonomy and Machine Learning Models for Identifying and Classifying Hate in Online News Media. Proceedings of the International AAAI Conference on Web and Social Media. 2018;12(1). DOI: https://doi.org/10.1609/icwsm.v12i1.15028

Nguyen T. Merging public health and automated approaches to address online hate speech. AI and Ethics. 2023. DOI: https://doi.org/10.1007/s43681-023-00281-w

Saha K, Chandrasekharan E, Choudhury MD. Prevalence and Psychological Effects of Hateful Speech in Online College Communities. Proceedings of the 10th ACM Conference on Web Science; Boston, Massachusetts, USA: Association for Computing Machinery; 2019. p. 255–64. DOI: https://doi.org/10.1145/3292522.3326032

Vargas F, Carvalho I, Rodrigues de Góes F, Pardo T, Benevenuto F, editors. HateBR: A Large Expert Annotated Corpus of Brazilian Instagram Comments for Offensive Language and Hate Speech Detection2022 June; Marseille, France: European Language Resources Association.

Fortuna P, Rocha Da Silva J, Soler-Company J, Wanner L, Nunes S, editors. A Hierarchically-Labeled Portuguese Hate Speech Dataset. Proceedings of the Third Workshop on Abusive Language Online; 2019 2019-01-01: Association for Computational Linguistics. DOI: https://doi.org/10.18653/v1/W19-3510

Badjatiya P, Gupta S, Gupta M, Varma V, editors. Deep Learning for Hate Speech Detection in Tweets. Proceedings of the 26th International Conference on World Wide Web Companion - WWW '17 Companion; 2017 2017-01-01: ACM Press. DOI: https://doi.org/10.1145/3041021.3054223

Garg M, Saxena C, Saha S, Krishnan V, Joshi R, Mago V, editors. CAMS: An Annotated Corpus for Causal Analysis of Mental Health Issues in Social Media Posts2022 June; Marseille, France: European Language Resources Association.

Hartmann N, Fonseca E, Shulby C, Treviso M, Rodrigues J, Aluisio S. Portuguese word embeddings: Evaluating on word analogies and natural language tasks. arXiv preprint arXiv:170806025. 2017.

Rajalaxmi RR, Prasad LVN, Janakiramaiah B, Pavankumar CS, Neelima N, Sathishkumar VE. Optimizing Hyperparameters and Performance Analysis of LSTM Model in Detecting Fake News on Social media. ACM Trans Asian Low-Resour Lang Inf Process. 2022. DOI: https://doi.org/10.1145/3511897

Downloads

Publicado

19-11-2024

Como Citar

de Oliveira, Ítalo S., & Goulart, R. R. V. (2024). Detecção de discurso de ódio para o apoio à saúde mental. Journal of Health Informatics, 16(Especial). https://doi.org/10.59681/2175-4411.v16.iEspecial.2024.1255

Artigos Semelhantes

1 2 3 4 5 6 7 8 9 > >> 

Você também pode iniciar uma pesquisa avançada por similaridade para este artigo.