Biomedical information extraction with natural language processing and machine learning methods

Antunes, Rui Marcos Brandão

Please use this identifier to cite or link to this item: http://hdl.handle.net/10773/41756

Title:	Biomedical information extraction with natural language processing and machine learning methods
Other Titles:	Extração de informação biomédica usando processamento de linguagem natural e aprendizagem automática
Author:	Antunes, Rui Marcos Brandão
Advisor:	Matos, Sérgio Guilherme Aleixo de
Keywords:	Bioinformatics Information extraction Natural language processing Machine learning Concept disambiguation Text classification Relation extraction
Defense Date:	7-Mar-2023
Abstract:	We witness an overload of textual data: a vast amount of information is recorded in natural language text and stored in digital media. In the life sciences fields, the increasing number of biomedical scientific publications and of clinical reports retains a wealth of knowledge that must be unearthed and linked through automatic information extraction methods. These are imperative to assist curation in biological databases and play an important role in drug discovery, precision medicine, and pharmacological and clinical research. This thesis investigates the use of natural language processing, machine learning, and knowledge-based methods to extract information from biomedical text in English language. Specifically, we study and propose methods for entity disambiguation, document classification, and relation extraction. Overall, this work contributes with an exhaustive evaluation study of several approaches for distinct biomedical information extraction tasks, which are a vital support for the advancement of the current knowledge. Assistimos a uma sobrecarga de dados textuais: uma quantidade avassaladora de informação é registada em texto de linguagem natural e armazenada em formato digital. Nas áreas ligadas às ciências da vida, o número crescente de publicações científicas no domínio da biomedicina e de relatórios clínicos retém uma riqueza de conhecimento que deve ser descoberto e associado através de métodos automáticos de extração de informação. Estes são essenciais para auxiliar a curadoria em bases de dados biológicos e desempenham um papel importante na descoberta de medicamentos, medicina de precisão, e investigação clínica. Esta tese investiga o uso de processamento de linguagem natural, aprendizagem automática, e métodos baseados em conhecimento para extrair informação a partir de textos biomédicos em língua inglesa. Especificamente, estudamos e propomos métodos para desambiguação de entidades, classificação de documentos, e extração de relações. Em suma, este trabalho contribui com um estudo exaustivo de avaliação de várias abordagens para distintas tarefas de extração de informação biomédica, que são um suporte vital para o avanço do conhecimento atual.
URI:	http://hdl.handle.net/10773/41756
Appears in Collections:	UA - Teses de doutoramento DETI - Teses de doutoramento

Files in This Item:

File	Description	Size	Format
Documento_Rui_Antunes.pdf		1.06 MB	Adobe PDF	View/Open

Show full item record