Please use this identifier to cite or link to this item:
http://hdl.handle.net/10773/31293
Title: | Biomedical knowledge discovery through multi-relational graph embeddings |
Other Titles: | Descoberta de conhecimento biomédico através de representações continuas de grafos multi-relacionais |
Author: | Pereira, Rodrigo Amaral Ribeiro |
Advisor: | Matos, Sérgio Guilherme Aleixo de |
Defense Date: | 17-Feb-2021 |
Abstract: | Knowledge graphs are multi-relational graph structures that allow to
organize data in a way that is not only query able but that also allows
the inference of implicit knowledge by both humans and, particularly,
machines. In recent years new methods have been developed in order to
maximize the knowledge that can be extracted from these structures,
especially in the machine learning field. Knowledge graph embedding
(KGE) strategies allow to map the data of these graphs to a lower dimensional
space to facilitate the application of downstream tasks such
as link prediction or node classification. In this work the capabilities
and limitations of using these techniques to derive new knowledge from
pre-existing biomedical networks was explored, since this is a field that
not only has seen efforts towards converting its large knowledge bases
into knowledge graphs, but that also can make use of the predictive
capabilities of these models in order to accelerate research in the field.
In order to do so, several KGE models were studied and a pipeline was
created in order to obtain and train such models on different biomedical
datasets. The results show that these models can make accurate predictions
on some datasets, but that their performance can be hampered
by some inherent characteristics of the networks.
Additionally, with the knowledge acquired during this research a notebook
was created that aims to be an entry point to other researchers
interested in exploring this field. Grafos de conhecimento são grafos multi-relacionais que permitem organizar informação de maneira a que esta seja não apenas passível de ser inquirida, mas que também permita a inferência logica de nova informação por parte de humanos e especialmente sistemas computacionais. Recentemente vários métodos têm vindo a ser criados de maneira a maximizar a informação que pode ser retirada destas estruturas, sendo a área de \Machine Learning" um dos grandes propulsores para tal. \Knowledge graph embeddings" (KGE) permitem que os componentes destes grafos sejam mapeados num espaço latente, de maneira a facilitar a aplicação de tarefas como a predição de novas ligações no grafo ou classificação de nós. Neste trabalho foram exploradas as capacidades e limitações da aplicação de modelos baseados em \Knowledge graph embeddings" a redes biomédicas existentes, dado que a biomedicina é uma área na qual têm sido feitos esforços no sentido de organizar a sua vasta base de conhecimento em grafos de conhecimento, e onde esta capacidade de predição pode ser usada para potenciar avanços nos seus diversos domínios. Para tal, no presente trabalho, vários modelos foram estudados e uma pipeline foi criada para treinar os mesmos sobre algumas redes biomédicas. Os resultados mostram que estes modelos conseguem de facto ser precisos no que diz respeito á tarefa de predição de ligações em alguns conjuntos de dados, contudo esta precisão aparenta ser afetada por características inerentes à estrutura do grafo. Adicionalmente, com o conhecimento adquirido durante a realização deste trabalho foi criado um \notebook" que tem como objetivo servir como uma introdução à área de \Knowledge graph embeddings" para investigadores interessados em explorar a mesma. |
URI: | http://hdl.handle.net/10773/31293 |
Appears in Collections: | UA - Dissertações de mestrado DETI - Dissertações de mestrado |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
Documento_Rodrigo_Pereira.pdf | 3.45 MB | Adobe PDF | View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.