Algoritmos de aprendizaje automático para la predicción de la supervivencia del cáncer de mama
DOI:
https://doi.org/10.59681/2175-4411.v15.iEspecial.2023.1091Palabras clave:
Análisis de Supervivencia, Aprendizaje automático, Cáncer de mamaResumen
Objetivo: Este estudio tiene como objetivo mostrar un análisis comparativo de los algoritmos de Aprendizaje automático aplicados a la predicción de la supervivencia al cáncer de mama. Métodos: Estudio descriptivo que consideró datos de 1.570 pacientes con cáncer de mama en estadio I-III. Se aplicó la técnica de sobremuestreo de minorías sintéticas debido a un desequilibrio en el conjunto de datos. Se consideraron en el estudio los algoritmos Naive Bayes, Random Forest, Multilayer Perceptron y AdaBoost, y la validación cruzada como estrategia de aprendizaje. Resultados: El modelo desarrollado a partir del algoritmo Random Forest mostró mayor precisión (96,2%; IC95%: 95,5%-96,9%) y especificidad (97,4%; IC95%: 96,6%-98,2%); y el modelo desarrollado a partir de AdaBoost, mayor sensibilidad (95,3%; IC95%: 94,3%-96,4%). Conclusión: Así, entre los modelos presentados en nuestro estudio, el desarrollado a partir del algoritmo Random Forest presentó, en general, las mejores medidas de evaluación en la predicción de la supervivencia del cáncer de mama.
Citas
Hassan MA, Ates-Alagoz Z. Cyclin-Dependent Kinase 4/6 Inhibitors Against Breast Cancer. Mini Rev Med Chem. 2022.
INCA. Estimativa 2020. In: Saúde Md, editor. Incidência de Câncer no Brasil. Brasil: Instituto Nacional de Câncer José Alencar Gomes da Silva (INCA); 2019.
Yersal O, Barutca S. Biological subtypes of breast cancer: Prognostic and therapeutic implications. World J Clin Oncol. 2014;5(3):412-24.
Milosevic M, Jankovic D, Milenkovic A, Stojanov D. Early diagnosis and detection of breast cancer. Technol Health Care. 2018;26(4):729-59.
Trister AD, Buist DSM, Lee CI. Will Machine Learning Tip the Balance in Breast Cancer Screening? JAMA Oncol. 2017;3(11):1463-4.
Montazeri M, Montazeri M, Montazeri M, Beigzadeh A. Machine learning models in breast cancer survival prediction. Technol Health Care. 2016;24(1):31-42.
Nandakumar A, Anantha N, Venugopal TC, Sankaranarayanan R, Thimmasetty K, Dhar M. Survival in breast cancer: a population-based study in Bangalore, India. Int J Cancer. 1995;60(5):593-6.
Puja G, Shruti G. Breast Cancer Prediction using varying Parameters of Machine Learning Models. Procedia Computer Science. 2020;171:593-601.
Pinheiro TS, Yahata E, Santos PDd, Oliveira FSd, Takahata AK, Suyama R, et al. Machine Learning e Análise Multivariada aplicados à Sobrevida do Câncer Mama. Journal of Health Informatics. 2022;14(0).
Chawla NV, Bowyer KW, Hall LO, Kegelmeyer WP. SMOTE: Synthetic Minority Over-sampling Technique. Journal of Artificial Intelligence Research. 2002;16:321-57.
Hall M, Frank E, Holmes G, Pfahringer B, Reutemann P, Witten IH. The WEKA data mining software: an update. SIGKDD Explor Newsl. 2009;11(1):10–8.
Frank E, Hall M, Witten I. Appendix B - The WEKA workbench. In: Ian HW, Eibe F, Mark AH, Christopher JP, editors. Data Mining (Fourth Edition). Fourth Edition ed: Morgan Kaufmann; 2017. p. 553-71.
Nindrea RD, Aryandono T, Lazuardi L, Dwiprahasto I. Diagnostic Accuracy of Different Machine Learning Algorithms for Breast Cancer Risk Calculation: a Meta-Analysis. Asian Pac J Cancer Prev. 2018;19(7):1747-52.
Kalafi EY, Nor NAM, Taib NA, Ganggayah MD, Town C, Dhillon SK. Machine Learning and Deep Learning Approaches in Breast Cancer Survival Prediction Using Clinical Data. Folia Biol (Praha). 2019;65(5-6):212-20.
Le Thien MA, Redjdal A, Bouaud J, Seroussi B. Deep Learning, a Not so Magical Problem Solver: A Case Study with Predicting the Complexity of Breast Cancer Cases. Stud Health Technol Inform. 2021;287:144-8.
Freund Y, Schapire RE, editors. A desicion-theoretic generalization of on-line learning and an application to boosting. Computational Learning Theory; 1995 1995//; Berlin, Heidelberg: Springer Berlin Heidelberg.
Henry R, Meltzer MI. Etymologia: Bayesian Probability. Emerg Infect Dis. 2017;23(1):28.
Krishnan S. 6 - Machine learning for biomedical signal analysis. In: Krishnan S, editor. Biomedical Signal Analysis for Connected Healthcare: Academic Press; 2021. p. 223-64.
Biau G. Analysis of a Random Forests Model. Journal of Machine Learning Research. 2010;13.
Liaw A, Wiener M. Classification and regression by randomForest. R news. 2002;2(3):18-22.
Descargas
Publicado
Cómo citar
Número
Sección
Licencia
Derechos de autor 2023 Pablo Deoclecia dos Santos, Erika Yahata, Talita Santos Piheiro, Fellipe Soares de Oliveira, Priscyla Waleska Simões
![Creative Commons License](http://i.creativecommons.org/l/by-nc-sa/4.0/88x31.png)
Esta obra está bajo una licencia internacional Creative Commons Atribución-NoComercial-CompartirIgual 4.0.
La sumisión de un artículo a el Journal of Health Informatics es entendida como exclusiva y que no esta siendo considerado para publicación en otro periódico. La permisión de los autores para la publicación de su artículo en lo JHI implica en la exclusiva autorización concedida a los editores para su inclusión en la revista. Al someter un artículo, a lo autor será solicitada la permisión electrónica de una Nota de Copyright. Una mensaje electrónica será enviada a lo autor correspondiente confirmando el recibo del manuscrito y lo aceite de la Nota de Copyright.