Identificação automática de termos de domínio do consumidor em saúde
Palabras clave:
Vocabulário controlado, Vocabulário, Informática aplicada à saúde dos consumidoresResumen
Objetivo: Deste estudo é descrever um processo de identificação automática de termos candidatos a partir de conteúdos disponíveis na web para fins de construção de um CHV no idioma português-brasileiro. Método: Inicialmente realizou-se recuperação de conteúdos da web, especificamente por meio de notícias curtas provenientes de feeds Really Simple Syndication (RSS). Como segunda etapa foram organizados vocabulários de controle baseados em CID-10 e Wikipédia, e finalmente foram aplicadas técnicas de análise de textos para fins de identificação e classificação de termos candidatos. Resultados: Foram recuperados 128 termos por meio do vocabulário controlado CID-10. O vocabulário Wikipédia resultou em 411 termos distintos. Os termos foram classificados utilizando a métrica estatística tf-idf possibilitando uma análise de sua relevância. Conclusão: A utilização e análise de conteúdos jornalísticos disponíveis na web podem apoiar significativamente o desenvolvimento de um CHV.Descargas
Publicado
Cómo citar
Número
Sección
Licencia
La sumisión de un artículo a el Journal of Health Informatics es entendida como exclusiva y que no esta siendo considerado para publicación en otro periódico. La permisión de los autores para la publicación de su artículo en lo JHI implica en la exclusiva autorización concedida a los editores para su inclusión en la revista. Al someter un artículo, a lo autor será solicitada la permisión electrónica de una Nota de Copyright. Una mensaje electrónica será enviada a lo autor correspondiente confirmando el recibo del manuscrito y lo aceite de la Nota de Copyright.