Características para detección de depresión con datos de Twitter
DOI:
https://doi.org/10.59681/2175-4411.v16.iEspecial.2024.1319Palabras clave:
Minería de Datos, Reconocimiento de Normas Patrones Automatizadas, DepresiónResumen
Objetivo: Identificar características relevantes en la detección de personas con depresión a partir de sus publicaciones en Twitter. Método: Creación de la base de datos, aplicación de técnicas de preprocesamiento, selección de características utilizando pruebas de hipótesis y el clasificador AdaBoost, y verificación del tamaño del vocabulario. Resultados: AdaBoost utilizó 40 clasificadores, 38 de los cuales verificaban la presencia de palabras específicas en el texto, alcanzando una precisión del 73%. Se encontró que el vocabulario de personas con depresión es menor que el de personas sin depresión. Conclusión: Verificar la presencia de ciertas palabras en los tweets de personas depresivas es suficiente para obtener resultados cercanos a técnicas más complejas. Además, se demostró que el vocabulario de personas con depresión es menor utilizando un enfoque basado en la entropía de Shannon.
Citas
Trifu RN, et al. Linguistic indicators of language in major depressive disorder (MDD). An evidence based research. J Evid Based Psychother. 2017;17(1).
Smirnova D, et al. Language patterns discriminate mild depression from normal sadness and euthymic state. Front Psychiatry. 2018;9:105.
Rude S, Gortner EM, Pennebaker J. Language use of depressed and depression-vulnerable college students. Cogn Emot. 2004;18(8):1121-1133.
Liu Y, et al. Predictors of depressive symptoms in college students: A systematic review and meta-analysis of cohort studies. J Affect Disord. 2019;244:196-208.
Santos WRD, de Oliveira RL, Paraboni I. SetembroBR: a social media corpus for depression and anxiety disorder prediction. Lang Res Evaluat. 2023.
Mann P, Paes A, Matsushima EH. See and read: detecting depression symptoms in higher education students using multimodal social media data. In: Proceedings of the International AAAI Conference on Web and Social Media. 2020. p. 440-451.
Alsagri HS, Ykhlef M. Machine learning-based approach for depression detection in Twitter using content and activity features. IEICE Trans Inf Syst. 2020;103(8):1825-1832.
Schapire RE. The boosting approach to machine learning: An overview. Nonlinear Estim Classif. 2003;149-171.
Domingos P. A few useful things to know about machine learning. Commun ACM. 2012;55(10):78-87.
Moreira LB, Namen AA. Sistema preditivo para a doença de Alzheimer na triagem clínica. J Health Inform. 2016;8(3).
Islam MR, et al. Depression detection from social network data using machine learning techniques. Health Inf Sci Syst. 2018;6:1-12.
Montalvao J, et al. On the representation of sparse stochastic matrices with state embedding [Pré-print]. Available at SSRN 4605637.
Armstrong RA. When to use the Bonferroni correction. Ophthalmic Physiol Opt. 2014;34(5):502-8.
Leis A, et al. Detecting signs of depression in tweets in Spanish: behavioral and linguistic analysis. J Med Internet Res. 2019;21(6):e14199.
Disner SG, Beevers CG, Haigh EA, Beck AT. Neural mechanisms of the cognitive model of depression. Nat Rev Neurosci. 2011;12(8):467-77.
Descargas
Publicado
Cómo citar
Número
Sección
Licencia
Esta obra está bajo una licencia internacional Creative Commons Atribución-NoComercial-CompartirIgual 4.0.
La sumisión de un artículo a el Journal of Health Informatics es entendida como exclusiva y que no esta siendo considerado para publicación en otro periódico. La permisión de los autores para la publicación de su artículo en lo JHI implica en la exclusiva autorización concedida a los editores para su inclusión en la revista. Al someter un artículo, a lo autor será solicitada la permisión electrónica de una Nota de Copyright. Una mensaje electrónica será enviada a lo autor correspondiente confirmando el recibo del manuscrito y lo aceite de la Nota de Copyright.