Please use this identifier to cite or link to this item:
http://hdl.handle.net/10773/17910
Title: | Automatic knowledge base construction from unstructured text |
Other Titles: | Construção e enriquecimento de redes de conceitos a partir de texto livre |
Author: | Sequeira, José Francisco Rodrigues |
Advisor: | Sérgio Guilherme Aleixo de Matos |
Keywords: | Armazenamento de dados Bases de dados relacionais Recuperação da informação Sistemas de informação médica Engenharia de computadores - Processamento de dados Bioinformática |
Defense Date: | 2016 |
Publisher: | Universidade de Aveiro |
Abstract: | Taking into account the overwhelming number of biomedical publications
being produced, the effort required for a user to efficiently explore those
publications in order to establish relationships between a wide range of
concepts is staggering.
This dissertation presents GRACE, a web-based platform that provides
an advanced graphical exploration interface that allows users to traverse the
biomedical domain in order to find explicit and latent associations between
annotated biomedical concepts belonging to a variety of semantic types (e.g.,
Genes, Proteins, Disorders, Procedures and Anatomy). The knowledge base
utilized is a collection of MEDLINE articles with English abstracts. These
annotations are then stored in an efficient data storage that allows for complex
queries and high-performance data delivery. Concept relationship are inferred
through statistical analysis, applying association measures to annotated
terms. These processes grant the graphical interface the ability to create,
in real-time, a data visualization in the form of a graph for the exploration of
these biomedical concept relationships. Tendo em conta o crescimento do número de publicações biomédicas a serem produzidas todos os anos, o esforço exigido para que um utilizador consiga, de uma forma eficiente, explorar estas publicações para conseguir estabelecer associações entre um conjunto alargado de conceitos torna esta tarefa exaustiva. Nesta disertação apresentamos uma plataforma web chamada GRACE, que providencia uma interface gráfica de exploração que permite aos utilizadores navegar pelo domínio biomédico em busca de associações explícitas ou latentes entre conceitos biomédicos pertencentes a uma variedade de domínios semânticos (i.e., Genes, Proteínas, Doenças, Procedimentos e Anatomia). A base de conhecimento usada é uma coleção de artigos MEDLINE com resumos escritos na língua inglesa. Estas anotações são armazenadas numa base de dados que permite pesquisas complexas e obtenção de dados com alta performance. As relações entre conceitos são inferidas a partir de análise estatística, aplicando medidas de associações entre os conceitos anotados. Estes processos permitem à interface gráfica criar, em tempo real, uma visualização de dados, na forma de um grafo, para a exploração destas relações entre conceitos do domínio biomédico. |
Description: | Mestrado em Engenharia de Computadores e Telemática |
URI: | http://hdl.handle.net/10773/17910 |
Appears in Collections: | UA - Dissertações de mestrado DETI - Dissertações de mestrado |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
Tese___Sequeira.pdf | 12.39 MB | Adobe PDF | View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.