The named entity extraction in clinical case reports

Authors

  • Alda Maria Norbiato Torres Instituto Federal do Espírito Santo
  • Raphael Pavani Manhães Bersot Instituto Federal do Espírito Santo
  • Cristiano da S. Colombo Instituto Federal do Espírito Santo

DOI:

https://doi.org/10.59681/2175-4411.v16.iEspecial.2024.1322

Keywords:

Clinical Case Reports, Information extraction, Named Entity Recognition

Abstract

It is well-known that clinical cases are used daily in the routine of healthcare professionals and can be effectively utilized to initiate studies and formulate hypotheses for systematic research. This article addresses a study on information extraction from clinical case reports, employing the Named Entity Recognition (NER) technique to aid in investigating patterns and adversities in such reports. The spaCy library in Python was employed to train a new knowledge base. As a result, HTML files were generated for the visualization of recognized entities, and after testing, the new pipeline showed superior performance compared to the native pre-trained spaCy model, achieving an accuracy greater than 90% in most cases.

Author Biographies

Alda Maria Norbiato Torres, Instituto Federal do Espírito Santo

Bacharelando em Sistemas de Informação, Coordenadoria de Sistemas de Informação, Instituto Federal do Espírito Santo, Cachoeiro de Itapemirim (ES), Brasil.

Raphael Pavani Manhães Bersot, Instituto Federal do Espírito Santo

Bacharelando em Sistemas de Informação, Coordenadoria de Sistemas de Informação, Instituto Federal do Espírito Santo, Cachoeiro de Itapemirim (ES), Brasil.

Cristiano da S. Colombo, Instituto Federal do Espírito Santo

Mestre em Cognição e Linguagem, Coordenadoria de Sistemas de Informação, Instituto Federal do Espírito Santo, Cachoeiro de Itapemirim (ES), Brasil.

References

CARLETON HA, Webb ML. The case report in context. Yale J Biol Med. 2012;85(1):93-96.

SANTOS, DB. Visualização de dados estruturados e não estruturados da área da saúde. Universidade Estadual Paulista (Unesp), 2022.

RIEDO, SAC. Vitor dos S. Um modelo para extração, estruturação, indexação e recuperação de casos clínicos publicados na web. ISSN 2178-8332.

CASELI, HM; NUNES, MGV. Processamento de linguagem natural: conceitos, técnicas e aplicações em português. 2023.

BARBOSA, J. et al. Introdução ao processamento de linguagem natural usando python. III Escola Regional de Informática do Piauí, v. 1, p. 336–360, 2017.

DE JESUS FALCÃO, LC; LOPES, B; SOUZA, RR. Absorção das tarefas de processamento de Linguagem Natural (NLP) pela Ciência da Informação (CI): uma revisão da literatura para tangibilização do uso de NLP pela CI. Em Questão, p. 13-34, 2022.

KIRSCH, BG; DORNELES, ÁP. Desenvolvimento de uma ferramenta para reconhecimento de entidades nomeadas em certificados de atividades complementares de curso utilizando spacy. Anais do Encontro Anual de Tecnologia da Informação, v. 12, n. 1, p. 44–44, 2023.

AMARAL, DOF. O reconhecimento de entidades nomeadas por meio de conditional random fields para a língua portuguesa. 2013. Dissertação de Mestrado. Pontifícia Universidade Católica do Rio Grande do Sul.

MILIDIú RUY LUIZ DUARTE, JCCR. Machine learning algorithms for Portuguese named entity recognition. Inteligência Artificial. Revista Iberoamericana de Inteligencia Artificial, 2007. ISSN 1137-3601. Disponível em: https://www.redalyc.org/articulo.oa?id=92503610

COLOMBO, CS; OLIVEIRA, ES. Intelligent information system for extracting knowledge from pharmaceutical package inserts. In: Proceedings of the XVIII Brazilian Symposium on Information Systems. [S.l.: s.n.], 2022. p. 1–9

SPACY. spaCy 101: Everything you need to know · spaCy Usage Documentation. Disponível em: <https://spacy.io/usage/spacy-101>.

Revista PubSaúde. Relato de Caso Clínico. Disponı́vel em: https://pubsaude.com.br/artigo-original/relato-de-caso-clinico/. Acesso em: 13 mar. 2024. [2024?].

PATINO, CM, FERREIRA, JC: Relatos de caso: narrativas destacando experiências clı́nicas que contribuem para a prática e para futuros estudos. Jornal Brasileiro de Pneumologia. 45, (2019). https://doi.org/10.1590/1806-3713/e20190251.

SANTOS, HDP, ULBRICH, AHDPS, VIEIRA, R. Evaluation of a Prescription Outlier Detection System in Hospital’s Pharmacy Services, Anais do IEEE International Conference on Bioinformatics and Biomedicine (BIBM), 2862–2868, 7, (2021).

LÓPEZ-ÚBEDA, P, DÍAZ-GALIANO, MC, UREÑA-LÓPEZ, A, MARTIN-VALDIVIA, MT: Combining word embeddings to extract chemical and drug entities in biomedical literature. BMC Bioinformatics 22(1), 1–17 (2021).

YAO CHEN, CZ, Tianxin Li, HW, Kai Ye, XZ, Jun, L. 2019. Named entity recognition from Chinese adverse drug event reports with lexical feature based BiLSTM-CRF and tri-training. Journal of Biomedical Informatics 96, 1 (jul 2019), 1–9. https://doi.org/10.1016/j.jbi.2019.103252.

SCHNEIDER, ETR, GUMIEL, YB, OLIVEIRA, LFA de, MONTENEGRO, CO, BARZOTTO, LR, MORO, C, Paraiso, EC. (2023). Developing a Transformer-based Clinical Part-of-Speech Tagger for Brazilian Portuguese. Journal of Health Informatics, 15(Especial). https://doi.org/10.59681/2175-4411.v15.iEspecial.2023.1086.

DUARTE, P, et al. Síndrome de Kounis: A propósito de um clínico. Revista Brasileira de Terapia Intensiva. 2020;32(1):149-152. https://doi.org/10.5935/0103-507X.20200021.

FILHO, ESM, et al. Púrpura trombocitopênica trombótica associada à gravidez: Relato de caso. Rev Bras Ter Intensiva. 2009; 21(3):336-339. https://doi.org/10.1590/S0103-507X2009000300016.

VIEIRA, DF, et al. Interação dos medicamentos glibenclamida e furosemida em paciente com hipertensão e diabetes: Relato e estudo de caso clínico. Enciclopédia Biosfera, 8(14). https://conhecer.org.br/ojs/index.php/biosfera/article/view/3978.

PSIQUIATRIA GERAL. Casos Farmacológicos. Disponível em: <https://www.psiquiatriageral.com.br/tratamento/interacoes14.htm>. Acesso em 17/02/2022.

COLOMBO, CS; OLIVEIRA, ES. A Extração de Entidades Nomeadas em Bulas de Medicamentos e em Relatos de Casos Clínicos. In: Anais do XXIV Simpósio Brasileiro de Computação Aplicada à Saúde. [S.l.: s.n.], 2024. p. 627–638. https://doi.org/10.5753/sbcas.2024.

PIROVANI, JPC; SPALENZA, MA; OLIVEIRA, E. Geração Automática de Questões a Partir do Reconhecimento de Entidades Nomeadas em Textos Didáticos. In: Anais do XXVIII Simpósio Brasileiro de Informática na Educação, 2017. p. 1147–1156.

Published

2024-11-19

How to Cite

Torres, A. M. N., Bersot, R. P. M., & Colombo, C. da S. (2024). The named entity extraction in clinical case reports. Journal of Health Informatics, 16(Especial). https://doi.org/10.59681/2175-4411.v16.iEspecial.2024.1322

Similar Articles

<< < 2 3 4 5 6 7 8 > >> 

You may also start an advanced similarity search for this article.