Please use this identifier to cite or link to this item: http://hdl.handle.net/10773/19140
Title: Análise das variações genéticas: caraterização do contexto em que ocorrem as variações de nucleótido único
Author: Enes, Vera Alexandra do Amparo R.
Advisor: Afreixo, Vera Mónica Almeida
Rodrigues, João Manuel de Oliveira e Silva
Keywords: Estatística
Variação genética - Métodos estatísticos
Genomas - Métodos estatísticos
Defense Date: 2016
Publisher: Universidade de Aveiro
Abstract: A identificação e caracterização das variações genéticas podem ajudar os médicos no diagnóstico e prevenção de doenças com origem genética. Com a sequenciação completa do genoma de referência foi possível, posteriormente, encontrar um grande número de variações genéticas entre a população, das quais as mais comuns são a variação de um único nucle ótido (SNV). No entanto, para ser possível capturar a diversidade humana, tornase necessário sequenciar o genoma de muitas pessoas. O projeto 1000 Genomas surge com objetivo de caracterizar a variação genética humana e construir o maior catálogo público de dados sobre variações, com especial foco nas variações raras. Neste trabalho, pretende-se caracterizar os diferentes tipos de SNVs, recorrendo aos dados disponibilizados na primeira fase do projeto do 1000 Genomas. Esses dados contêm 38 milhões de SNVs identificadas no genoma de 1092 indivíduos, provenientes de 14 populações. Tem-se como objetivo, avaliar a forma como ocorrem os diferentes tipos de SNVs ao longo do genoma, fazendo uma análise por cromossoma ou de acordo com a prevalência, assim como, verificar se os genótipos associados a cada SNV satisfazem o equilíbrio de Hardy-Weinberg (HWE). Para além disso, acreditando que as variações genéticas não ocorrem por acaso e que numa vizinhança da posição onde ocorre a SNV existir a informação que seja indicadora do fenómeno, um dos objetivos principais deste trabalho e caracterizar o contexto na vizinhança de cada SNV, através da contagem de palavras de diferentes tamanhos. Observou-se que os diferentes tipos de SNVs ocorrem de forma homogénea ao longo do genoma, mas que as frequências de palavras na vizinhança do local de ocorrência da SNV, estão associadas a cada tipo de variação, principalmente nas posições imediatamente adjacentes a esse local. Verificou-se ainda que para a maioria das SNVs, os respetivos genótipos estão de acordo com o HWE.
The identi cation and characterization of genetic variations can help physicians in the diagnosis and prevention of diseases with genetic origin. With the complete sequencing of the reference genome, was possible to nd a large number of genetic variations among the population, of which the most common are single nucleotide variation (SNV). However, to be able to capture human diversity, it becomes necessary to sequence the genome of many people. The 1000 Genomes project is designed to characterize human genetic variation and build the largest public catalog of variation data, with a special focus on rare variations. In this work, we intend to characterize the di erent types of SNVs, using the data available in the rst phase of the 1000 Genomes project. These data contain 38 million SNVs identi ed in the genome of 1092 individuals from 14 populations. The objective of this study was to evaluate the way di erent types of SNVs occur along the genome, by a chromosome analysis or according to the prevalence, as well as to verify if the genotypes associated to each SNV satisfy the Hardy- Weinberg equilibrium (HWE). In addition, believing that genetic variations do not occur by chance and that in a neighborhood of the position where the SNV occurs there will be information that is indicative of the phenomenon, one of the main objectives of this work is to characterize the context in the vicinity of each SNV, by counting words of di erent sizes. It was observed that the di erent types of SNVs occur homogeneously throughout the genome, but that the word frequencies in the vicinity of the SNV occurrence site are associated with each type of variation, especially at the positions immediately adjacent to that site. It was also veri ed that for most SNVs, the respective genotypes are in agreement with the HWE.
Description: Mestrado em Matemática e Aplicações - Estatística e Investigação Operacional
URI: http://hdl.handle.net/10773/19140
Appears in Collections:UA - Dissertações de mestrado
DMat - Dissertações de mestrado

Files in This Item:
File Description SizeFormat 
Dissertação.pdf6.21 MBAdobe PDFView/Open


FacebookTwitterLinkedIn
Formato BibTex MendeleyEndnote Degois 

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.