Geração de dados sintéticos para classificação de disléxicos por meio de aprendizado de máquina

Authors

  • Antonio Carlos da Silva Junior Universidade Federal de São Paulo
  • Emanuela Cristina Ramos Gonçalves Universidade Federal de São Paulo
  • Paulo Schor Universidade Federal de São Paulo
  • Martina Navarro University of Portsmouth
  • Felipe Mancini Universidade Federal de São Paulo

Keywords:

Dislexia, Aprendizado de Máquina, Leitura

Abstract

Objetivo: Este estudo pretende aplicar a técnica de geração de dados sintéticos com auxílio de técnicas de limpeza de dados para a classificação de disléxicos e não - disléxicos. Método: Os outliers foram selecionados por especialista. Foi feito uma geração sintética de dados. para cada um de cinco algoritmos foram selecionados características com busca exaustiva. Cada algoritmo foi executado com as características selecionadas e então suas curvas de calibração foram comparadas. Resultados: A regressão logística se destacou como o melhor algoritmo, apresentando o resultado de 99% de acurácia e área sob a curva ROC de 0,999, além de ter obtido a melhor curva de calibração Conclusão: O uso da geração sintética de dados e seleção de características foram capazes de fazer todos os algoritmos avaliados obterem ótimos resultados na classificação de disléxicos e não disléxicos. A regressão logística foi selecionado como melhor algoritmo para classificação de disléxicos.

Published

2021-03-10

How to Cite

Junior, A. C. da S., Gonçalves, E. C. R., Schor, P., Navarro, M., & Mancini, F. (2021). Geração de dados sintéticos para classificação de disléxicos por meio de aprendizado de máquina. Journal of Health Informatics, 13(1). Retrieved from https://jhi.sbis.org.br/index.php/jhi-sbis/article/view/764

Issue

Section

Original Articles

Similar Articles

1 2 > >> 

You may also start an advanced similarity search for this article.

Most read articles by the same author(s)