Geração de dados sintéticos para classificação de disléxicos por meio de aprendizado de máquina

Autores

  • Antonio Carlos da Silva Junior Universidade Federal de São Paulo
  • Emanuela Cristina Ramos Gonçalves Universidade Federal de São Paulo
  • Paulo Schor Universidade Federal de São Paulo
  • Martina Navarro University of Portsmouth
  • Felipe Mancini Universidade Federal de São Paulo

Palavras-chave:

Dislexia, Aprendizado de Máquina, Leitura

Resumo

Objetivo: Este estudo pretende aplicar a técnica de geração de dados sintéticos com auxílio de técnicas de limpeza de dados para a classificação de disléxicos e não - disléxicos. Método: Os outliers foram selecionados por especialista. Foi feito uma geração sintética de dados. para cada um de cinco algoritmos foram selecionados características com busca exaustiva. Cada algoritmo foi executado com as características selecionadas e então suas curvas de calibração foram comparadas. Resultados: A regressão logística se destacou como o melhor algoritmo, apresentando o resultado de 99% de acurácia e área sob a curva ROC de 0,999, além de ter obtido a melhor curva de calibração Conclusão: O uso da geração sintética de dados e seleção de características foram capazes de fazer todos os algoritmos avaliados obterem ótimos resultados na classificação de disléxicos e não disléxicos. A regressão logística foi selecionado como melhor algoritmo para classificação de disléxicos.

Downloads

Publicado

10-03-2021

Como Citar

Junior, A. C. da S., Gonçalves, E. C. R., Schor, P., Navarro, M., & Mancini, F. (2021). Geração de dados sintéticos para classificação de disléxicos por meio de aprendizado de máquina. Journal of Health Informatics, 13(1). Recuperado de https://jhi.sbis.org.br/index.php/jhi-sbis/article/view/764

Edição

Seção

Artigo Original

Artigos Semelhantes

1 2 > >> 

Você também pode iniciar uma pesquisa avançada por similaridade para este artigo.

Artigos mais lidos pelo mesmo(s) autor(es)