InDeCS: Método automatizado de classificação de páginas Web de Saúde usando mineração de texto e Descritores em Ciências da Saúde (DeCS)
Keywords:
Internet, Saúde, Classificação, Inteligência Artificial, Sistemas de Recuperação de InformaçãoAbstract
Introdução: A quantidade de páginas web tem crescido exponencialmente, potencialmente levando conhecimento a mais pessoas, mas com a desvantagem de dificultar a localização de informação relevante e confiável. Objetivo: Apresentar resultados sobre a construção de um método automatizado de classificação e indexação de páginas web de saúde. Métodos: Foram selecionados endereços de páginas web classificadas manualmente como “saúde” e “não-saúde”. Em uma segunda etapa foi calculada a similaridade dos termos do conteúdo destas páginas web com os Descritores de Ciência em Saúde (DeCS). Utilizando os valores de similaridade foram desenvolvidos e ajustados parâmetros de classificadores automatizados. Resultados: Para os experimentos foram coletadas 1.132 páginas web, separadas nas bases “saúde”, “não-saúde” e “Merck”, gerando mais de 3 milhões de composições até 3-gramas. Experimento usando as bases “saúde” e “não-saúde” resultou acerto, sensibilidade, especificidade e área sob a curva ROC de, respectivamente, 85,10%; 0,81; 0,88 e 0,92. Experimento usando as bases “Merck” e “não-saúde” resultou, respectivamente, 97,44%; 0,92; 1,00 e 0,98. Conclusão: Os resultados preliminares da investigação sobre o uso de métricas da mineração de texto e vocabulários controlados para aperfeiçoar o resultado de buscadores web especificamente para a área da saúde se mostraram significativos.Downloads
Published
2009-07-27
How to Cite
Falcão, A. E. J., Mancini, F., da Costa, T. M., Hummel, A. D., Teixeira, F. O., Sigulem, D., & Pisa, I. T. (2009). InDeCS: Método automatizado de classificação de páginas Web de Saúde usando mineração de texto e Descritores em Ciências da Saúde (DeCS). Journal of Health Informatics, 1(1). Retrieved from https://jhi.sbis.org.br/index.php/jhi-sbis/article/view/casa
Issue
Section
Original Articles