Detecção de discurso de ódio para o apoio à saúde mental

Ítalo Santos de Oliveira; Rodrigo Rafael Villarreal Goulart

doi:10.59681/2175-4411.v16.iEspecial.2024.1255

Autores

Ítalo Santos de Oliveira Universidade Feevale
Rodrigo Rafael Villarreal Goulart Universidade Feevale

DOI:

https://doi.org/10.59681/2175-4411.v16.iEspecial.2024.1255

Palavras-chave:

Processamento de Linguagem Natural, Inteligência Artificial, Ódio

Resumo

Objetivo: Este artigo visa explorar a classificação de textos extraídos de comentários de redes sociais que contêm linguagem ofensiva e discurso de ódio. As interações em redes sociais com este viés podem ter efeitos prejudiciais à saúde mental da população. Método: Utilizamos técnicas de Processamento de Linguagem Natural e Aprendizado de Máquina, aplicando-as a um conjunto de dados brasileiro. Investigamos o uso de embeddings, o emprego de redes neurais Long Short Term Memory (LSTM) e uma abordagem híbrida com Convolutional Neural Network (CNN). A análise inclui a avaliação do desbalanceamento de dados e a aplicação de técnicas de undersampling e oversampling. Resultados e conclusão: A otimização da LSTM resultou em ganhos modestos, sendo mais eficaz quando combinada com a CNN, especialmente com oversampling. No entanto, este último gera preocupações de overfitting. Os resultados indicam que o modelo desenvolvido é mais confiável para a detecção de linguagem ofensiva do que para o discurso de ódio.

Biografias Autor

Ítalo Santos de Oliveira, Universidade Feevale

Bacharelando, Universidade Feevale, Instituto de Ciências Criativas e Tecnológicas, Universidade Feevale, Novo Hamburgo (RS), Brasil.

Rodrigo Rafael Villarreal Goulart, Universidade Feevale

Pesquisador, Instituto de Ciências Criativas e Tecnológicas, Universidade Feevale, Novo Hamburgo (RS), Brasil.

Referências

Fortuna P, Nunes S. A Survey on Automatic Detection of Hate Speech in Text. ACM Computing Surveys. 2019;51(4):1-30. DOI: https://doi.org/10.1145/3232676

Salminen J, Almerekhi H, Milenković M, Jung S-G, An J, Kwak H, et al. Anatomy of Online Hate: Developing a Taxonomy and Machine Learning Models for Identifying and Classifying Hate in Online News Media. Proceedings of the International AAAI Conference on Web and Social Media. 2018;12(1). DOI: https://doi.org/10.1609/icwsm.v12i1.15028

Nguyen T. Merging public health and automated approaches to address online hate speech. AI and Ethics. 2023. DOI: https://doi.org/10.1007/s43681-023-00281-w

Saha K, Chandrasekharan E, Choudhury MD. Prevalence and Psychological Effects of Hateful Speech in Online College Communities. Proceedings of the 10th ACM Conference on Web Science; Boston, Massachusetts, USA: Association for Computing Machinery; 2019. p. 255–64. DOI: https://doi.org/10.1145/3292522.3326032

Vargas F, Carvalho I, Rodrigues de Góes F, Pardo T, Benevenuto F, editors. HateBR: A Large Expert Annotated Corpus of Brazilian Instagram Comments for Offensive Language and Hate Speech Detection2022 June; Marseille, France: European Language Resources Association.

Fortuna P, Rocha Da Silva J, Soler-Company J, Wanner L, Nunes S, editors. A Hierarchically-Labeled Portuguese Hate Speech Dataset. Proceedings of the Third Workshop on Abusive Language Online; 2019 2019-01-01: Association for Computational Linguistics. DOI: https://doi.org/10.18653/v1/W19-3510

Badjatiya P, Gupta S, Gupta M, Varma V, editors. Deep Learning for Hate Speech Detection in Tweets. Proceedings of the 26th International Conference on World Wide Web Companion - WWW '17 Companion; 2017 2017-01-01: ACM Press. DOI: https://doi.org/10.1145/3041021.3054223

Garg M, Saxena C, Saha S, Krishnan V, Joshi R, Mago V, editors. CAMS: An Annotated Corpus for Causal Analysis of Mental Health Issues in Social Media Posts2022 June; Marseille, France: European Language Resources Association.

Hartmann N, Fonseca E, Shulby C, Treviso M, Rodrigues J, Aluisio S. Portuguese word embeddings: Evaluating on word analogies and natural language tasks. arXiv preprint arXiv:170806025. 2017.

Rajalaxmi RR, Prasad LVN, Janakiramaiah B, Pavankumar CS, Neelima N, Sathishkumar VE. Optimizing Hyperparameters and Performance Analysis of LSTM Model in Detecting Fake News on Social media. ACM Trans Asian Low-Resour Lang Inf Process. 2022. DOI: https://doi.org/10.1145/3511897

Detecção de discurso de ódio para o apoio à saúde mental

Autores

DOI:

Palavras-chave:

Resumo

Biografias Autor

Ítalo Santos de Oliveira, Universidade Feevale

Rodrigo Rafael Villarreal Goulart, Universidade Feevale

Referências

Downloads

Publicado

Como Citar

Edição

Secção

Licença

Artigos Similares

Idioma

Informações

Indexadores, Bases de Dados, Repositórios e Bibliotecas