Geração de dados sintéticos para classificação de disléxicos por meio de aprendizado de máquina
Palavras-chave:
Dislexia, Aprendizado de Máquina, LeituraResumo
Objetivo: Este estudo pretende aplicar a técnica de geração de dados sintéticos com auxílio de técnicas de limpeza de dados para a classificação de disléxicos e não - disléxicos. Método: Os outliers foram selecionados por especialista. Foi feito uma geração sintética de dados. para cada um de cinco algoritmos foram selecionados características com busca exaustiva. Cada algoritmo foi executado com as características selecionadas e então suas curvas de calibração foram comparadas. Resultados: A regressão logística se destacou como o melhor algoritmo, apresentando o resultado de 99% de acurácia e área sob a curva ROC de 0,999, além de ter obtido a melhor curva de calibração Conclusão: O uso da geração sintética de dados e seleção de características foram capazes de fazer todos os algoritmos avaliados obterem ótimos resultados na classificação de disléxicos e não disléxicos. A regressão logística foi selecionado como melhor algoritmo para classificação de disléxicos.
Downloads
Publicado
Como Citar
Edição
Seção
Licença
A submissão de um artigo ao Journal of Health Informatics é entendida como exclusiva e que não está sendo considerada para publicação em outra revista. A permissão dos autores para a publicação de seu artigo no J. Health Inform. implica na exclusiva autorização concedida aos editores para incluí-lo na revista. Ao submeter um artigo, ao autor será solicitada a permissão eletrônica de um Termo de Transferência de Direitos Autorais. Uma mensagem eletrônica será enviada ao autor correspondente confirmando o recibo do manuscrito e o aceite da Declaração de Direito Autoral.