The named entity extraction in clinical case reports
DOI:
https://doi.org/10.59681/2175-4411.v16.iEspecial.2024.1322Keywords:
Clinical Case Reports, Information extraction, Named Entity RecognitionAbstract
It is well-known that clinical cases are used daily in the routine of healthcare professionals and can be effectively utilized to initiate studies and formulate hypotheses for systematic research. This article addresses a study on information extraction from clinical case reports, employing the Named Entity Recognition (NER) technique to aid in investigating patterns and adversities in such reports. The spaCy library in Python was employed to train a new knowledge base. As a result, HTML files were generated for the visualization of recognized entities, and after testing, the new pipeline showed superior performance compared to the native pre-trained spaCy model, achieving an accuracy greater than 90% in most cases.
References
CARLETON HA, Webb ML. The case report in context. Yale J Biol Med. 2012;85(1):93-96.
SANTOS, DB. Visualização de dados estruturados e não estruturados da área da saúde. Universidade Estadual Paulista (Unesp), 2022.
RIEDO, SAC. Vitor dos S. Um modelo para extração, estruturação, indexação e recuperação de casos clínicos publicados na web. ISSN 2178-8332.
CASELI, HM; NUNES, MGV. Processamento de linguagem natural: conceitos, técnicas e aplicações em português. 2023. DOI: https://doi.org/10.5753/sbc.10309.7.1
BARBOSA, J. et al. Introdução ao processamento de linguagem natural usando python. III Escola Regional de Informática do Piauí, v. 1, p. 336–360, 2017.
DE JESUS FALCÃO, LC; LOPES, B; SOUZA, RR. Absorção das tarefas de processamento de Linguagem Natural (NLP) pela Ciência da Informação (CI): uma revisão da literatura para tangibilização do uso de NLP pela CI. Em Questão, p. 13-34, 2022. DOI: https://doi.org/10.19132/1808-5245281.13-34
KIRSCH, BG; DORNELES, ÁP. Desenvolvimento de uma ferramenta para reconhecimento de entidades nomeadas em certificados de atividades complementares de curso utilizando spacy. Anais do Encontro Anual de Tecnologia da Informação, v. 12, n. 1, p. 44–44, 2023.
AMARAL, DOF. O reconhecimento de entidades nomeadas por meio de conditional random fields para a língua portuguesa. 2013. Dissertação de Mestrado. Pontifícia Universidade Católica do Rio Grande do Sul.
MILIDIú RUY LUIZ DUARTE, JCCR. Machine learning algorithms for Portuguese named entity recognition. Inteligência Artificial. Revista Iberoamericana de Inteligencia Artificial, 2007. ISSN 1137-3601. Disponível em: https://www.redalyc.org/articulo.oa?id=92503610 DOI: https://doi.org/10.4114/ia.v11i36.893
COLOMBO, CS; OLIVEIRA, ES. Intelligent information system for extracting knowledge from pharmaceutical package inserts. In: Proceedings of the XVIII Brazilian Symposium on Information Systems. [S.l.: s.n.], 2022. p. 1–9 DOI: https://doi.org/10.1145/3535511.3535558
SPACY. spaCy 101: Everything you need to know · spaCy Usage Documentation. Disponível em: <https://spacy.io/usage/spacy-101>.
Revista PubSaúde. Relato de Caso Clínico. Disponı́vel em: https://pubsaude.com.br/artigo-original/relato-de-caso-clinico/. Acesso em: 13 mar. 2024. [2024?].
PATINO, CM, FERREIRA, JC: Relatos de caso: narrativas destacando experiências clı́nicas que contribuem para a prática e para futuros estudos. Jornal Brasileiro de Pneumologia. 45, (2019). https://doi.org/10.1590/1806-3713/e20190251. DOI: https://doi.org/10.1590/1806-3713/e20190251
SANTOS, HDP, ULBRICH, AHDPS, VIEIRA, R. Evaluation of a Prescription Outlier Detection System in Hospital’s Pharmacy Services, Anais do IEEE International Conference on Bioinformatics and Biomedicine (BIBM), 2862–2868, 7, (2021). DOI: https://doi.org/10.1109/BIBM52615.2021.9669703
LÓPEZ-ÚBEDA, P, DÍAZ-GALIANO, MC, UREÑA-LÓPEZ, A, MARTIN-VALDIVIA, MT: Combining word embeddings to extract chemical and drug entities in biomedical literature. BMC Bioinformatics 22(1), 1–17 (2021). DOI: https://doi.org/10.1186/s12859-021-04188-3
YAO CHEN, CZ, Tianxin Li, HW, Kai Ye, XZ, Jun, L. 2019. Named entity recognition from Chinese adverse drug event reports with lexical feature based BiLSTM-CRF and tri-training. Journal of Biomedical Informatics 96, 1 (jul 2019), 1–9. https://doi.org/10.1016/j.jbi.2019.103252. DOI: https://doi.org/10.1016/j.jbi.2019.103252
SCHNEIDER, ETR, GUMIEL, YB, OLIVEIRA, LFA de, MONTENEGRO, CO, BARZOTTO, LR, MORO, C, Paraiso, EC. (2023). Developing a Transformer-based Clinical Part-of-Speech Tagger for Brazilian Portuguese. Journal of Health Informatics, 15(Especial). https://doi.org/10.59681/2175-4411.v15.iEspecial.2023.1086. DOI: https://doi.org/10.59681/2175-4411.v15.iEspecial.2023.1086
DUARTE, P, et al. Síndrome de Kounis: A propósito de um clínico. Revista Brasileira de Terapia Intensiva. 2020;32(1):149-152. https://doi.org/10.5935/0103-507X.20200021. DOI: https://doi.org/10.5935/0103-507X.20200021
FILHO, ESM, et al. Púrpura trombocitopênica trombótica associada à gravidez: Relato de caso. Rev Bras Ter Intensiva. 2009; 21(3):336-339. https://doi.org/10.1590/S0103-507X2009000300016. DOI: https://doi.org/10.1590/S0103-507X2009000300016
VIEIRA, DF, et al. Interação dos medicamentos glibenclamida e furosemida em paciente com hipertensão e diabetes: Relato e estudo de caso clínico. Enciclopédia Biosfera, 8(14). https://conhecer.org.br/ojs/index.php/biosfera/article/view/3978.
PSIQUIATRIA GERAL. Casos Farmacológicos. Disponível em: <https://www.psiquiatriageral.com.br/tratamento/interacoes14.htm>. Acesso em 17/02/2022.
COLOMBO, CS; OLIVEIRA, ES. A Extração de Entidades Nomeadas em Bulas de Medicamentos e em Relatos de Casos Clínicos. In: Anais do XXIV Simpósio Brasileiro de Computação Aplicada à Saúde. [S.l.: s.n.], 2024. p. 627–638. https://doi.org/10.5753/sbcas.2024. DOI: https://doi.org/10.5753/sbcas.2024.2799
PIROVANI, JPC; SPALENZA, MA; OLIVEIRA, E. Geração Automática de Questões a Partir do Reconhecimento de Entidades Nomeadas em Textos Didáticos. In: Anais do XXVIII Simpósio Brasileiro de Informática na Educação, 2017. p. 1147–1156. DOI: https://doi.org/10.5753/cbie.sbie.2017.1147
Downloads
Published
How to Cite
Issue
Section
License
This work is licensed under a Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License.
Submission of a paper to Journal of Health Informatics is understood to imply that it is not being considered for publication elsewhere and that the author(s) permission to publish his/her (their) article(s) in this Journal implies the exclusive authorization of the publishers to deal with all issues concerning the copyright therein. Upon the submission of an article, authors will be asked to sign a Copyright Notice. Acceptance of the agreement will ensure the widest possible dissemination of information. An e-mail will be sent to the corresponding author confirming receipt of the manuscript and acceptance of the agreement.