InDeCS: Método automatizado de classificação de páginas Web de Saúde usando mineração de texto e Descritores em Ciências da Saúde (DeCS)

Authors

  • Alex Esteves Jaccoud Falcão UNIFESP
  • Felipe Mancini UNIFESP
  • Thiago Martini da Costa UNIFESP
  • Anderson Diniz Hummel UNIFESP
  • Fabio Oliveira Teixeira UNIFESP
  • Daniel Sigulem UNIFESP
  • Ivan Torres Pisa UNIFESP

Keywords:

Internet, Saúde, Classificação, Inteligência Artificial, Sistemas de Recuperação de Informação

Abstract

Introdução: A quantidade de páginas web tem crescido exponencialmente, potencialmente levando conhecimento a mais pessoas, mas com a desvantagem de dificultar a localização de informação relevante e confiável. Objetivo: Apresentar resultados sobre a construção de um método automatizado de classificação e indexação de páginas web de saúde. Métodos: Foram selecionados endereços de páginas web classificadas manualmente como “saúde” e “não-saúde”. Em uma segunda etapa foi calculada a similaridade dos termos do conteúdo destas páginas web com os Descritores de Ciência em Saúde (DeCS). Utilizando os valores de similaridade foram desenvolvidos e ajustados parâmetros de classificadores automatizados. Resultados: Para os experimentos foram coletadas 1.132 páginas web, separadas nas bases “saúde”, “não-saúde” e “Merck”, gerando mais de 3 milhões de composições até 3-gramas. Experimento usando as bases “saúde” e “não-saúde” resultou acerto, sensibilidade, especificidade e área sob a curva ROC de, respectivamente, 85,10%; 0,81; 0,88 e 0,92. Experimento usando as bases “Merck” e “não-saúde” resultou, respectivamente, 97,44%; 0,92; 1,00 e 0,98. Conclusão: Os resultados preliminares da investigação sobre o uso de métricas da mineração de texto e vocabulários controlados para aperfeiçoar o resultado de buscadores web especificamente para a área da saúde se mostraram significativos. 

Author Biographies

Alex Esteves Jaccoud Falcão, UNIFESP

AFILIAÇÃO: Atualmente cursa mestrado em ciências no programa de Pós-graduação em Informática em Saúde no Departamento de Informática em Saúde da Universidade Federal de São Paulo (UNIFESP).RESUMO: Concluiu curso técnico em eletrônica na Escola Técnica Estadual Jorge Street (1994). Possui graduação em bacharelado em Sistemas de Informação pela Universidade São Marcos (2000). Desde 2006 participa em atividades de pesquisa do Departamento de Informática em Saúde (DIS) da Universidade Federal de São Paulo (UNIFESP). Possui experiência na área de redes, desenvolvimento de sistemas, com ênfase em Sistemas de Telecomunicações e Internet. Tem interesse em busca e recuperação de conteúdo na Internet, Informática em Saúde e Sistemas distribuídos baseados em serviços. CONTATO: E-mail: a.falcao@unifesp.br. Página pessoal http://www.alexfalcao.pro.br.

Felipe Mancini, UNIFESP

Concluiu curso Técnico em Eletrônica na Escola Técnica Estadual São Paulo (ETESP) (1997). Possui bacharelado em Ciência da Computação pelo Centro Universitário São Camilo (2004), mestrado (2007) em Ciências pela Universidade Federal de São Paulo (UNIFESP) no Programa de Pós-graduação em Ciências da Informática em Saúde. Atualmente ocupa o cargo de professor de Ensino Técnico e Tecnológico pelo Instituto Federal de Educação, Ciência e Tecnologia de São Paulo (IFSP), além de cursar doutorado em Ciências pela UNIFESP no Programa de Pós-graduação em Informática em Saúde. Possui experiência no desenvolvimento e avaliação de sistemas de apoio à decisão, e implementação e aplicação de técnicas de mineração de dados e recuperação de informação.

Thiago Martini da Costa, UNIFESP

possui graduação em licenciatura em fisica pela Universidade de São Paulo (2007). Atualmente é candidato ao mestrado do Instituto de Pesquisas Energeticas e Nucleares. Tem experiência na área de Física, com ênfase em Prop. Óticas e Espectrosc. da Mat. Condens; Outras Inter. da Mat. com Rad. e Part.

Anderson Diniz Hummel, UNIFESP

Possuo graduação em Informática Biomédica pela Universidade de São Paulo (2007). Tenho experiência nas áreas de desenvolvimento de sistemas de informação, processamento de dados e imagens na área de saúde. Trabalhei na criação e gestão de empresas na área de informática em saúde e desenvolvimento de produtos.

Fabio Oliveira Teixeira, UNIFESP

Atualmente cursa Mestrado em Ciências no programa de Pós-graduação em Informática em Saúde pela Universidade Federal de São Paulo (UNIFESP). Possui graduação em Ciência da Computação e Gestão da Produção Industrial pelo Instituto Federal de Educação, Ciência e Tecnologia de São Paulo. Tem experiência na área de Ciência da Computação, com ênfase em Gerenciamento de Projetos e Desenvolvimento de Sistemas.

Daniel Sigulem, UNIFESP

Possui graduação em Medicina pela Escola Paulista de Medicina (1965) e doutorado em Medicina (Nefrologia) pela mesma Escola (1976). Atualmente é Professor Livre Docente e Professor Titular da Universidade Federal de São Paulo e Coordenador do Programa de Pós-Graduação em Informática em Saúde da Universidade Federal de São Paulo.

Ivan Torres Pisa, UNIFESP

AFILIAÇÃO: Professor Adjunto. Doutor em Ciências. Departamento de Informática em Saúde. Universidade Federal de São Paulo (UNIFESP). RESUMO: Concluiu curso técnico em informática industrial na Escola Técnica Prof Everardo Passos (ETEP) (1989). Possui graduação em bacharelado em matemática pela Universidade Estadual Paulista Júlio de Mesquita Filho (UNESP) (1996), mestrado (1999) e doutorado (2003) em ciências, no programa de pós-graduação em física aplicada à medicina e biologia pela Universidade de São Paulo (USP), na qual também realizou um pós-doutorado (2005). Desde 2003 participa ativamente em atividades de pesquisa, docência e extensão do Departamento de Informática em Saúde (DIS) da Universidade Federal de São Paulo (UNIFESP). Em maio de 2006 fo aprovado em concurso para professor adjunto no mesmo departamento e atualmente é orientador cadastrado nos programas de pós-graduação em informática em saúde e em saúde coletiva da UNIFESP. Possui experiência em ciências da computação e informática em saúde com interesse nas áreas de telemedicina e telessaúde, sistemas de apoio à decisão médica, sistemas de informação em saúde e PACS/HIS/RIS. POSIÇÕES: Diretoria (Tesoureiro) da Sociedade Brasieira de Informática em Saúde (SBIS) (dez/2008). Vice-coordenador da Área de Política, Planejamento e Gestão em Saúde (PPGS) no Programa de Pós-graduação em Saúde Coletiva, UNIFESP (abr/2008). Vice-coordenador no Programa de Pós-graduação em Informática em Saúde, UNIFESP (out/2007). Orientador no Programa de Pós-graduação em Saúde Coletiva, UNIFESP (dez/2005). Orientador no Programa de Pós-graduação em Informática em Saúde, UNIFESP (out/2005). Representante dos Professores Adjuntos junto à Comissão de Ensino de Pós-graduação (CEPG) do Programa de Pós-graduação em Informática em Saúde, UNIFESP. Representante dos Professores Adjuntos junto ao Conselho de Departamento, Departamento de Informática em Saúde, UNIFESP. Vice-coordenador no Programa de Pós-graduação em Ciências da Saúde, UNIFESP (jun/2007-abr/2008). CONTATO: E-mail: ivan.pisa@unifesp.br. Página pessoal http://ivanpisa.pro.br. Currículo Lattes completo, com informações adicionais: http://ivanpisa.pro.br/lattes.

Published

2009-07-27

How to Cite

Falcão, A. E. J., Mancini, F., da Costa, T. M., Hummel, A. D., Teixeira, F. O., Sigulem, D., & Pisa, I. T. (2009). InDeCS: Método automatizado de classificação de páginas Web de Saúde usando mineração de texto e Descritores em Ciências da Saúde (DeCS). Journal of Health Informatics, 1(1). Retrieved from https://jhi.sbis.org.br/index.php/jhi-sbis/article/view/casa

Issue

Section

Original Articles

Similar Articles

<< < 14 15 16 17 18 19 20 21 22 23 > >> 

You may also start an advanced similarity search for this article.

Most read articles by the same author(s)

1 2 3 4 > >>