Please use this identifier to cite or link to this item: https://hdl.handle.net/10923/24606
Type: masterThesis
Title: Extração de informação em evoluções clínicas e integração com dados farmacogenômicos
Author(s): Bettoni, Giovani Nícolas
Advisor: Bordini, Rafael Heitor
Publisher: Pontifícia Universidade Católica do Rio Grande do Sul
Graduate Program: Programa de Pós-Graduação em Ciência da Computação
Issue Date: 2022
Keywords: PROCESSAMENTO DA LINGUAGEM NATURAL
LINGUÍSTICA COMPUTACIONAL
RECUPERAÇÃO DA INFORMAÇÃO
INFORMÁTICA
Abstract: A Extração de Informação (EI) abrange uma série de tarefas de Processamento de Linguagem Natural (PLN). Entre elas, o Reconhecimento de Entidades Nomeadas (REN) é uma tarefa que busca identificar as Entidades Nomeadas de um texto, tais como nomes de pessoas, locais e organizações, classificado-as em um conjunto pré-definido de categorias. Nesta dissertação pretendemos utilizar técnicas e ferramentas de PLN para a tarefa de REN no domínio Biomédico em Português. Portanto, realizamos a construção de um corpus específico e propomos dois modelos baseados em redes neurais capazes de processar o texto incluído em evoluções clínicas: BERT e uma rede neural convolucional (CNN). Além disso, foi introduzido um novo mecanismo para incorporar conhecimento farmacogenômico que sirva como base para auxiliar na decisão clínica. Os resultados mostram uma melhoria das medidas do modelo BERT em comparação à CNN e demonstram que os modelos baseados em Transformers são promissores para o avanço do desempenho de métodos de extração de informação para entidades no domínio Farmacológico em Português. O Reconhecimento de Entidades Nomeadas em evoluções clínicas está ganhando popularidade por melhorar os projetos de extração clínica. Este estudo permitiu à comunidade que trabalha com PLN, no contexto clínico, obter uma análise formal dessa tarefa, incluindo as formas mais bem-sucedidas de realizá-la.
Information Extraction (IE) covers a number of Natural Language Processing (NLP) tasks. Named Entity Recognition (NER) is a task that seeks to identify the Named Entities of a text, such as names of people, places, and organizations, classifying them in a predefined set of categories. This dissertation intends to use NLP techniques and tools for the REN task in the Biomedical domain in Portuguese. Thus, we build a specific corpus and propose two models defined in neural networks able to process the text included in clinical evolutions: BERT and a convolutional neural network (CNN). In addition, a new mechanism has been introduced to incorporate pharmacogenomic knowledge that serves as a basis for aiding clinical decisions. The results show an improvement in the measures of the BERT model compared to CNN and demonstrate that Transformers-based models are promising for advancing the performance of information extraction methods for entities in the Pharmacologic domain in Portuguese. Recognition of Named Entities in clinical evolutions is gaining popularity for improving clinical extraction projects. This study allowed the community working with NLP, in the clinical context, to obtain a formal analysis of this task, including the most successful ways of performing it.
URI: https://hdl.handle.net/10923/24606
Appears in Collections:Dissertação e Tese

Files in This Item:
File Description SizeFormat 
000503320-Texto+completo-0.pdfTexto completo1,98 MBAdobe PDFOpen
View


All Items in PUCRS Repository are protected by copyright, with all rights reserved, and are licensed under a Creative Commons Attribution-NonCommercial 4.0 International License. Read more.