Características para detecção de depressão com dados do Twitter
DOI:
https://doi.org/10.59681/2175-4411.v16.iEspecial.2024.1319Palavras-chave:
Mineração de Dados, Reconhecimento Automatizado de padrão, DepressãoResumo
Objetivo: Identificar características relevantes na detecção de pessoas com depressão a partir de postagens no Twitter. Método: Criação da base de dados, aplicação de técnicas de pré-processamento, seleção de características utilizando testes de hipóteses e o classificador AdaBoost, e verificação do tamanho do vocabulário. Resultados: O AdaBoost utilizou 40 classificadores, dos quais 38 verificavam a presença de palavras específicas no texto, atingindo uma acurácia de 73%. Verificou-se que o vocabulário de pessoas com depressão é menor que o de pessoas sem depressão. Conclusão: Verificar a presença de certas palavras nos tweets de pessoas depressivas é suficiente para obter resultados semelhantes a técnicas mais complexas. Além disso, o vocabulário de pessoas com depressão é menor, conforme demonstrado pela abordagem baseada na entropia de Shannon.
Referências
Trifu RN, et al. Linguistic indicators of language in major depressive disorder (MDD). An evidence based research. J Evid Based Psychother. 2017;17(1).
Smirnova D, et al. Language patterns discriminate mild depression from normal sadness and euthymic state. Front Psychiatry. 2018;9:105.
Rude S, Gortner EM, Pennebaker J. Language use of depressed and depression-vulnerable college students. Cogn Emot. 2004;18(8):1121-1133.
Liu Y, et al. Predictors of depressive symptoms in college students: A systematic review and meta-analysis of cohort studies. J Affect Disord. 2019;244:196-208.
Santos WRD, de Oliveira RL, Paraboni I. SetembroBR: a social media corpus for depression and anxiety disorder prediction. Lang Res Evaluat. 2023.
Mann P, Paes A, Matsushima EH. See and read: detecting depression symptoms in higher education students using multimodal social media data. In: Proceedings of the International AAAI Conference on Web and Social Media. 2020. p. 440-451.
Alsagri HS, Ykhlef M. Machine learning-based approach for depression detection in Twitter using content and activity features. IEICE Trans Inf Syst. 2020;103(8):1825-1832.
Schapire RE. The boosting approach to machine learning: An overview. Nonlinear Estim Classif. 2003;149-171.
Domingos P. A few useful things to know about machine learning. Commun ACM. 2012;55(10):78-87.
Moreira LB, Namen AA. Sistema preditivo para a doença de Alzheimer na triagem clínica. J Health Inform. 2016;8(3).
Islam MR, et al. Depression detection from social network data using machine learning techniques. Health Inf Sci Syst. 2018;6:1-12.
Montalvao J, et al. On the representation of sparse stochastic matrices with state embedding [Pré-print]. Available at SSRN 4605637.
Armstrong RA. When to use the Bonferroni correction. Ophthalmic Physiol Opt. 2014;34(5):502-8.
Leis A, et al. Detecting signs of depression in tweets in Spanish: behavioral and linguistic analysis. J Med Internet Res. 2019;21(6):e14199.
Disner SG, Beevers CG, Haigh EA, Beck AT. Neural mechanisms of the cognitive model of depression. Nat Rev Neurosci. 2011;12(8):467-77.
Downloads
Publicado
Como Citar
Edição
Seção
Licença
Este trabalho está licenciado sob uma licença Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License.
A submissão de um artigo ao Journal of Health Informatics é entendida como exclusiva e que não está sendo considerada para publicação em outra revista. A permissão dos autores para a publicação de seu artigo no J. Health Inform. implica na exclusiva autorização concedida aos editores para incluí-lo na revista. Ao submeter um artigo, ao autor será solicitada a permissão eletrônica de um Termo de Transferência de Direitos Autorais. Uma mensagem eletrônica será enviada ao autor correspondente confirmando o recibo do manuscrito e o aceite da Declaração de Direito Autoral.