Utilize este identificador para referenciar este registo:
http://hdl.handle.net/10773/13949
Título: | Computational methods for gene characterization and genomic knowledge extraction |
Outros títulos: | Métodos computacionais para a caracterização de genes e extração de conhecimento genómico |
Autor: | Gaspar, Paulo Miguel da Silva |
Orientador: | Oliveira, José Luís Guimarães Matos, Sérgio Guilherme Aleixo de |
Palavras-chave: | Ciências da computação Bioinformática Genoma humano Diagnóstico |
Data de Defesa: | 2014 |
Editora: | Universidade de Aveiro |
Resumo: | Motivation: Medicine and health sciences are changing from the classical
symptom-based to a more personalized and genetics-based paradigm, with an
invaluable impact in health-care. While advancements in genetics were already
contributing significantly to the knowledge of the human organism, the
breakthrough achieved by several recent initiatives provided a comprehensive
characterization of the human genetic differences, paving the way for a new era
of medical diagnosis and personalized medicine.
Data generated from these and posterior experiments are now becoming
available, but its volume is now well over the humanly feasible to explore. It is
then the responsibility of computer scientists to create the means for extracting
the information and knowledge contained in that data.
Within the available data, genetic structures contain significant amounts of
encoded information that has been uncovered in the past decades. Finding,
reading and interpreting that information are necessary steps for building
computational models of genetic entities, organisms and diseases; a goal that
in due course leads to human benefits.
Aims: Numerous patterns can be found within the human variome and exome.
Exploring these patterns enables the computational analysis and manipulation
of digital genomic data, but requires specialized algorithmic approaches. In this
work we sought to create and explore efficient methodologies to
computationally calculate and combine known biological patterns for various
purposes, such as the in silico optimization of genetic structures, analysis of
human genes, and prediction of pathogenicity from human genetic variants.
Results: We devised several computational strategies to evaluate genes,
explore genomes, manipulate sequences, and analyze patients’ variomes. By
resorting to combinatorial and optimization techniques we were able to create
and combine sequence redesign algorithms to control genetic structures; by
combining the access to several web-services and external resources we
created tools to explore and analyze available genetic data and patient data;
and by using machine learning we developed a workflow for analyzing human
mutations and predicting their pathogenicity. Motivação: A medicina e as ciências da saúde estão atualmente num processo de alteração que muda o paradigma clássico baseado em sintomas para um personalizado e baseado na genética. O valor do impacto desta mudança nos cuidados da saúde é inestimável. Não obstante as contribuições dos avanços na genética para o conhecimento do organismo humano até agora, as descobertas realizadas recentemente por algumas iniciativas forneceram uma caracterização detalhada das diferenças genéticas humanas, abrindo o caminho a uma nova era de diagnóstico médico e medicina personalizada. Os dados gerados por estas e outras iniciativas estão disponíveis mas o seu volume está muito para lá do humanamente explorável, e é portanto da responsabilidade dos cientistas informáticos criar os meios para extrair a informação e conhecimento contidos nesses dados. Dentro dos dados disponíveis estão estruturas genéticas que contêm uma quantidade significativa de informação codificada que tem vindo a ser descoberta nas últimas décadas. Encontrar, ler e interpretar essa informação são passos necessários para construir modelos computacionais de entidades genéticas, organismos e doenças; uma meta que, em devido tempo, leva a benefícios humanos. Objetivos: É possível encontrar vários padrões no varioma e exoma humano. Explorar estes padrões permite a análise e manipulação computacional de dados genéticos digitais, mas requer algoritmos especializados. Neste trabalho procurámos criar e explorar metodologias eficientes para o cálculo e combinação de padrões biológicos conhecidos, com a intenção de realizar otimizações in silico de estruturas genéticas, análises de genes humanos, e previsão da patogenicidade a partir de diferenças genéticas humanas. Resultados: Concebemos várias estratégias computacionais para avaliar genes, explorar genomas, manipular sequências, e analisar o varioma de pacientes. Recorrendo a técnicas combinatórias e de otimização criámos e conjugámos algoritmos de redesenho de sequências para controlar estruturas genéticas; através da combinação do acesso a vários web-services e recursos externos criámos ferramentas para explorar e analisar dados genéticos, incluindo dados de pacientes; e através da aprendizagem automática desenvolvemos um procedimento para analisar mutações humanas e prever a sua patogenicidade. |
Descrição: | Doutoramento conjunto MAPi em Ciências da Computação |
URI: | http://hdl.handle.net/10773/13949 |
Aparece nas coleções: | UA - Teses de doutoramento DETI - Teses de doutoramento |
Todos os registos no repositório estão protegidos por leis de copyright, com todos os direitos reservados.