Recuperação de Informações em Campos de Texto Livres de Prontuários Eletrônicos do Paciente Baseada em Semelhança Semântica e Ortográfica
Palabras clave:
information retrieval, approximate string matching, semantic similarity, free textsResumen
A maior parte da informação médica em forma digital se encontra na forma de textos livres como nos sites de medicina e saúde, artigos científicos em banco de dados da literatura biomédica e em prontuários eletrônicos do paciente (PEP). Muitos problemas podem ocorrer em sistemas de recuperação de informações médicas como o uso de sinonímia, erros de digitação e variações semânticas na linguagem médica. Para analisar a quantidade de informações que são perdidas em sistemas de busca tradicionais, que fazem um busca do termo exato, foram selecionados 34 termos médicos de duas bases de dados de PEPs e pesquisados com um algoritmo tradicional de busca direta embutido em um PEP chamado Clinic Manager? e um sistema desenvolvido batizado SIRIMED que embutiu algoritmos de semelhança semântica (incorporação de sinônimos) e semelhança ortográfica (edit distance+stemming).Os resultados mostram que a recuperação dos termos aumenta em cerca de 30% em relação à busca tradicional, com uma quantidade de falsos positivos baixa (menos de 1%), o que mostra que muitas informações são perdidas normalmente.
Descargas
Publicado
Cómo citar
Número
Sección
Licencia
La sumisión de un artículo a el Journal of Health Informatics es entendida como exclusiva y que no esta siendo considerado para publicación en otro periódico. La permisión de los autores para la publicación de su artículo en lo JHI implica en la exclusiva autorización concedida a los editores para su inclusión en la revista. Al someter un artículo, a lo autor será solicitada la permisión electrónica de una Nota de Copyright. Una mensaje electrónica será enviada a lo autor correspondiente confirmando el recibo del manuscrito y lo aceite de la Nota de Copyright.