Please use this identifier to cite or link to this item:
http://hdl.handle.net/10773/41756
Title: | Biomedical information extraction with natural language processing and machine learning methods |
Other Titles: | Extração de informação biomédica usando processamento de linguagem natural e aprendizagem automática |
Author: | Antunes, Rui Marcos Brandão |
Advisor: | Matos, Sérgio Guilherme Aleixo de |
Keywords: | Bioinformatics Information extraction Natural language processing Machine learning Concept disambiguation Text classification Relation extraction |
Defense Date: | 7-Mar-2023 |
Abstract: | We witness an overload of textual data: a vast amount of information
is recorded in natural language text and stored in digital media. In the
life sciences fields, the increasing number of biomedical scientific publications
and of clinical reports retains a wealth of knowledge that must
be unearthed and linked through automatic information extraction methods.
These are imperative to assist curation in biological databases and
play an important role in drug discovery, precision medicine, and pharmacological
and clinical research.
This thesis investigates the use of natural language processing, machine
learning, and knowledge-based methods to extract information
from biomedical text in English language. Specifically, we study and propose
methods for entity disambiguation, document classification, and
relation extraction. Overall, this work contributes with an exhaustive
evaluation study of several approaches for distinct biomedical information
extraction tasks, which are a vital support for the advancement of
the current knowledge. Assistimos a uma sobrecarga de dados textuais: uma quantidade avassaladora de informação é registada em texto de linguagem natural e armazenada em formato digital. Nas áreas ligadas às ciências da vida, o número crescente de publicações científicas no domínio da biomedicina e de relatórios clínicos retém uma riqueza de conhecimento que deve ser descoberto e associado através de métodos automáticos de extração de informação. Estes são essenciais para auxiliar a curadoria em bases de dados biológicos e desempenham um papel importante na descoberta de medicamentos, medicina de precisão, e investigação clínica. Esta tese investiga o uso de processamento de linguagem natural, aprendizagem automática, e métodos baseados em conhecimento para extrair informação a partir de textos biomédicos em língua inglesa. Especificamente, estudamos e propomos métodos para desambiguação de entidades, classificação de documentos, e extração de relações. Em suma, este trabalho contribui com um estudo exaustivo de avaliação de várias abordagens para distintas tarefas de extração de informação biomédica, que são um suporte vital para o avanço do conhecimento atual. |
URI: | http://hdl.handle.net/10773/41756 |
Appears in Collections: | UA - Teses de doutoramento DETI - Teses de doutoramento |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
Documento_Rui_Antunes.pdf | 1.06 MB | Adobe PDF | View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.