Biomedical information extraction with natural language processing and machine learning methods

Antunes, Rui Marcos Brandão

Utilize este identificador para referenciar este registo: http://hdl.handle.net/10773/41756

Título:	Biomedical information extraction with natural language processing and machine learning methods
Outros títulos:	Extração de informação biomédica usando processamento de linguagem natural e aprendizagem automática
Autor:	Antunes, Rui Marcos Brandão
Orientador:	Matos, Sérgio Guilherme Aleixo de
Palavras-chave:	Bioinformatics Information extraction Natural language processing Machine learning Concept disambiguation Text classification Relation extraction
Data de Defesa:	7-Mar-2023
Resumo:	We witness an overload of textual data: a vast amount of information is recorded in natural language text and stored in digital media. In the life sciences fields, the increasing number of biomedical scientific publications and of clinical reports retains a wealth of knowledge that must be unearthed and linked through automatic information extraction methods. These are imperative to assist curation in biological databases and play an important role in drug discovery, precision medicine, and pharmacological and clinical research. This thesis investigates the use of natural language processing, machine learning, and knowledge-based methods to extract information from biomedical text in English language. Specifically, we study and propose methods for entity disambiguation, document classification, and relation extraction. Overall, this work contributes with an exhaustive evaluation study of several approaches for distinct biomedical information extraction tasks, which are a vital support for the advancement of the current knowledge. Assistimos a uma sobrecarga de dados textuais: uma quantidade avassaladora de informação é registada em texto de linguagem natural e armazenada em formato digital. Nas áreas ligadas às ciências da vida, o número crescente de publicações científicas no domínio da biomedicina e de relatórios clínicos retém uma riqueza de conhecimento que deve ser descoberto e associado através de métodos automáticos de extração de informação. Estes são essenciais para auxiliar a curadoria em bases de dados biológicos e desempenham um papel importante na descoberta de medicamentos, medicina de precisão, e investigação clínica. Esta tese investiga o uso de processamento de linguagem natural, aprendizagem automática, e métodos baseados em conhecimento para extrair informação a partir de textos biomédicos em língua inglesa. Especificamente, estudamos e propomos métodos para desambiguação de entidades, classificação de documentos, e extração de relações. Em suma, este trabalho contribui com um estudo exaustivo de avaliação de várias abordagens para distintas tarefas de extração de informação biomédica, que são um suporte vital para o avanço do conhecimento atual.
URI:	http://hdl.handle.net/10773/41756
Aparece nas coleções:	UA - Teses de doutoramento DETI - Teses de doutoramento

Ficheiros deste registo:

Ficheiro	Descrição	Tamanho	Formato
Documento_Rui_Antunes.pdf		1.06 MB	Adobe PDF	Ver/Abrir

Mostrar registo em formato completo