Identificação automática de termos de domínio do consumidor em saúde
Palavras-chave:
Vocabulário controlado, Vocabulário, Informática aplicada à saúde dos consumidoresResumo
Objetivo: Deste estudo é descrever um processo de identificação automática de termos candidatos a partir de conteúdos disponíveis na web para fins de construção de um CHV no idioma português-brasileiro. Método: Inicialmente realizou-se recuperação de conteúdos da web, especificamente por meio de notícias curtas provenientes de feeds Really Simple Syndication (RSS). Como segunda etapa foram organizados vocabulários de controle baseados em CID-10 e Wikipédia, e finalmente foram aplicadas técnicas de análise de textos para fins de identificação e classificação de termos candidatos. Resultados: Foram recuperados 128 termos por meio do vocabulário controlado CID-10. O vocabulário Wikipédia resultou em 411 termos distintos. Os termos foram classificados utilizando a métrica estatística tf-idf possibilitando uma análise de sua relevância. Conclusão: A utilização e análise de conteúdos jornalísticos disponíveis na web podem apoiar significativamente o desenvolvimento de um CHV.Downloads
Publicado
Como Citar
Edição
Seção
Licença
A submissão de um artigo ao Journal of Health Informatics é entendida como exclusiva e que não está sendo considerada para publicação em outra revista. A permissão dos autores para a publicação de seu artigo no J. Health Inform. implica na exclusiva autorização concedida aos editores para incluí-lo na revista. Ao submeter um artigo, ao autor será solicitada a permissão eletrônica de um Termo de Transferência de Direitos Autorais. Uma mensagem eletrônica será enviada ao autor correspondente confirmando o recibo do manuscrito e o aceite da Declaração de Direito Autoral.