Algoritmos de aprendizaje automático para la predicción de la supervivencia del cáncer de mama
DOI:
https://doi.org/10.59681/2175-4411.v15.iEspecial.2023.1091Palabras clave:
Análisis de Supervivencia, Aprendizaje automático, Cáncer de mamaResumen
Objetivo: Este estudio tiene como objetivo mostrar un análisis comparativo de los algoritmos de Aprendizaje automático aplicados a la predicción de la supervivencia al cáncer de mama. Métodos: Estudio descriptivo que consideró datos de 1.570 pacientes con cáncer de mama en estadio I-III. Se aplicó la técnica de sobremuestreo de minorías sintéticas debido a un desequilibrio en el conjunto de datos. Se consideraron en el estudio los algoritmos Naive Bayes, Random Forest, Multilayer Perceptron y AdaBoost, y la validación cruzada como estrategia de aprendizaje. Resultados: El modelo desarrollado a partir del algoritmo Random Forest mostró mayor precisión (96,2%; IC95%: 95,5%-96,9%) y especificidad (97,4%; IC95%: 96,6%-98,2%); y el modelo desarrollado a partir de AdaBoost, mayor sensibilidad (95,3%; IC95%: 94,3%-96,4%). Conclusión: Así, entre los modelos presentados en nuestro estudio, el desarrollado a partir del algoritmo Random Forest presentó, en general, las mejores medidas de evaluación en la predicción de la supervivencia del cáncer de mama.
Citas
Hassan MA, Ates-Alagoz Z. Cyclin-Dependent Kinase 4/6 Inhibitors Against Breast Cancer. Mini Rev Med Chem. 2022.
INCA. Estimativa 2020. In: Saúde Md, editor. Incidência de Câncer no Brasil. Brasil: Instituto Nacional de Câncer José Alencar Gomes da Silva (INCA); 2019.
Yersal O, Barutca S. Biological subtypes of breast cancer: Prognostic and therapeutic implications. World J Clin Oncol. 2014;5(3):412-24.
Milosevic M, Jankovic D, Milenkovic A, Stojanov D. Early diagnosis and detection of breast cancer. Technol Health Care. 2018;26(4):729-59.
Trister AD, Buist DSM, Lee CI. Will Machine Learning Tip the Balance in Breast Cancer Screening? JAMA Oncol. 2017;3(11):1463-4.
Montazeri M, Montazeri M, Montazeri M, Beigzadeh A. Machine learning models in breast cancer survival prediction. Technol Health Care. 2016;24(1):31-42.
Nandakumar A, Anantha N, Venugopal TC, Sankaranarayanan R, Thimmasetty K, Dhar M. Survival in breast cancer: a population-based study in Bangalore, India. Int J Cancer. 1995;60(5):593-6.
Puja G, Shruti G. Breast Cancer Prediction using varying Parameters of Machine Learning Models. Procedia Computer Science. 2020;171:593-601.
Pinheiro TS, Yahata E, Santos PDd, Oliveira FSd, Takahata AK, Suyama R, et al. Machine Learning e Análise Multivariada aplicados à Sobrevida do Câncer Mama. Journal of Health Informatics. 2022;14(0).
Chawla NV, Bowyer KW, Hall LO, Kegelmeyer WP. SMOTE: Synthetic Minority Over-sampling Technique. Journal of Artificial Intelligence Research. 2002;16:321-57.
Hall M, Frank E, Holmes G, Pfahringer B, Reutemann P, Witten IH. The WEKA data mining software: an update. SIGKDD Explor Newsl. 2009;11(1):10–8.
Frank E, Hall M, Witten I. Appendix B - The WEKA workbench. In: Ian HW, Eibe F, Mark AH, Christopher JP, editors. Data Mining (Fourth Edition). Fourth Edition ed: Morgan Kaufmann; 2017. p. 553-71.
Nindrea RD, Aryandono T, Lazuardi L, Dwiprahasto I. Diagnostic Accuracy of Different Machine Learning Algorithms for Breast Cancer Risk Calculation: a Meta-Analysis. Asian Pac J Cancer Prev. 2018;19(7):1747-52.
Kalafi EY, Nor NAM, Taib NA, Ganggayah MD, Town C, Dhillon SK. Machine Learning and Deep Learning Approaches in Breast Cancer Survival Prediction Using Clinical Data. Folia Biol (Praha). 2019;65(5-6):212-20.
Le Thien MA, Redjdal A, Bouaud J, Seroussi B. Deep Learning, a Not so Magical Problem Solver: A Case Study with Predicting the Complexity of Breast Cancer Cases. Stud Health Technol Inform. 2021;287:144-8.
Freund Y, Schapire RE, editors. A desicion-theoretic generalization of on-line learning and an application to boosting. Computational Learning Theory; 1995 1995//; Berlin, Heidelberg: Springer Berlin Heidelberg.
Henry R, Meltzer MI. Etymologia: Bayesian Probability. Emerg Infect Dis. 2017;23(1):28.
Krishnan S. 6 - Machine learning for biomedical signal analysis. In: Krishnan S, editor. Biomedical Signal Analysis for Connected Healthcare: Academic Press; 2021. p. 223-64.
Biau G. Analysis of a Random Forests Model. Journal of Machine Learning Research. 2010;13.
Liaw A, Wiener M. Classification and regression by randomForest. R news. 2002;2(3):18-22.
Descargas
Publicado
Cómo citar
Número
Sección
Licencia
Derechos de autor 2023 Pablo Deoclecia dos Santos, Erika Yahata, Talita Santos Piheiro, Fellipe Soares de Oliveira, Priscyla Waleska Simões
Esta obra está bajo una licencia internacional Creative Commons Atribución-NoComercial-CompartirIgual 4.0.
La sumisión de un artículo a el Journal of Health Informatics es entendida como exclusiva y que no esta siendo considerado para publicación en otro periódico. La permisión de los autores para la publicación de su artículo en lo JHI implica en la exclusiva autorización concedida a los editores para su inclusión en la revista. Al someter un artículo, a lo autor será solicitada la permisión electrónica de una Nota de Copyright. Una mensaje electrónica será enviada a lo autor correspondiente confirmando el recibo del manuscrito y lo aceite de la Nota de Copyright.