Please use this identifier to cite or link to this item: http://hdl.handle.net/10773/29792
Full metadata record
DC FieldValueLanguage
dc.contributor.advisorFreitas, Adelaide de Fátima Baptista Valentept_PT
dc.contributor.authorLeite, Letícia Cruz Costapt_PT
dc.date.accessioned2020-11-12T14:59:17Z-
dc.date.available2020-11-12T14:59:17Z-
dc.date.issued2019-07-26-
dc.identifier.urihttp://hdl.handle.net/10773/29792-
dc.description.abstractDados multivariados que representam descrições quantitativas positivas das partes de um todo como, por exemplo proporções, transmitindo informação relativa em vez de absoluta, são designados por dados composicionais e são o alvo fulcral de estudo da presente dissertação. Em particular, estudam-se e aplicam-se técnicas estatísticas numéricas, baseadas em transformações de log-razões, e técnicas estatísticas gráficas sobre os dados transformados na deteção de composições (observações) atípicas (outliers) às quais correspondem as observações multivariadas que, por algum motivo, diferem das restantes composições do conjunto de dados. Os métodos estatísticos multivariados clássicos tendem a ignorar os outliers, tomando-os como observações “normais” e potenciando assim o enviesamento de resultados. Técnicas estatísticas robustas, que reduzem a influência de outliers, são de extrema importância para uma correta análise e interpretação dos dados. Um dos métodos estatísticos mais usuais na identificação de observações multivariadas atípicas baseia-se na distância de Mahalanobis calculada com estimativas robustas da média e da matriz de covariância populacionais obtidas através do estimador MCD (Minimum Covariance Determinant). Graficamente, o método biplot é uma ferramenta exploratória amplamente utilizada na visualização de observações multivariadas e, consequentemente, de outliers. Considerando o caso especial de dados composicionais, um dos propósitos do presente trabalho reside também em estudar propriedades da distância de Mahalanobis robusta e biplots robustos sobre este tipo de dados na deteção de composições outliers. Comoaplicaçãodestasmetodologiasestatísticasexploram-se, sobopontode vista relativo (isto é, composicional), três conjuntos de dados demográficos, extraídos dos Censos de 2011, baseados na migração interna em Portugal. Esses conjuntos dizem respeito a todos os 308 municípios e, para cada município, têm-se contagens de residentes que afirmaram que no período de 2005 a 2011 mudaram de residência passando a habitar no município em causa. A contagem dos residentes que mudaram de município tem em conta o grupo etário, a habilitação académica e a situação profissional. A análise estatística realizada conduziu à identificação de grupos distintos de municípios outliers entre os três conjuntos de dados. Relativamente à situação profissional as conclusões foram mais interpretáveis. Tendo em conta a distribuição do grupo etário, da habilitação académica e da situação profissional, este estudo denuncia a existência de municípios atípicos por serem mais ou menos atrativos. Usando cartogramas constata-se que muitos destes municípios outliers localizam-se em regiões do interior de Portugal Continental.pt_PT
dc.description.abstractMultivariate data of positive values which describe parts of a whole such as proportions, conveying relative rather than absolute information, are referred to as compositional data. This type of data is the main subject of the study of this dissertation. Numerical statistical techniques, based on log-ratios transformations, and graphical statistical techniques on transformed data in the detection of atypical compositions (multivariate observations outliers) are discussed. Outliers are observations that, for some reason, differ from the other observations belonging to the data set. Classic multivariate statistical methods tend to ignore outliers which are taking as “normal” observations and can produce results biased. Hence, robust statistical techniques, which reduce the influence of outliers, are of extreme importance for proper analysis and interpretation of the data. One of the most popular statistical methods for identifying outliers is based on the Mahalanobis distance calculated using robust estimates of the mean and covariance matrix obtained by the MCD (Minimum Covariance Determinant) estimator. On another hand, graphically, the biplot method is an exploratory tool widely used in the visualization of multivariate data and, consequently, outliers. Considering the special case of compositional data, properties of Mahalanobis robust distance and robust biplots on this type of data in the detection of outlier are also studied of this dissertation. The applications of these statistical methodologies on three demographic data sets, extracted from the 2011 Census and based on internal migration in Portugal, are explored from a relative point of view (i.e., compositional). These data sets concern the total set of 308 municipalities of Portugal. For each municipality, there are counts of residents who stated that in the period from 2005 to 2011 they changed their residence and began to live in the municipality in question. The count of the residents who changed the municipality considers the age group, the academic qualification and the occupational status. The statistical analysis performed led to the identification of distinct groups of outlier’s municipalities among the three datasets. Concerning the occupational status the conclusions were more interpretable. Considering the age distribution, academic qualification and occupational status, this study denounces the existence of atypical municipalities because they are more or less attractive. Using cartograms, it is found that many of these outlier’s municipalities are in regions of the interior of Portugal.pt_PT
dc.language.isoporpt_PT
dc.rightsopenAccesspt_PT
dc.rights.urihttps://creativecommons.org/licenses/by/4.0/pt_PT
dc.subjectDados composicionaispt_PT
dc.subjectTransformações log-razõespt_PT
dc.subjectObservações atípicaspt_PT
dc.subjectDistância de mahalanobis robustapt_PT
dc.subjectEstimador MCDpt_PT
dc.subjectBiplot composicional robustopt_PT
dc.titleTécnicas exploratórias na deteção de outliers em dados composicionaispt_PT
dc.typemasterThesispt_PT
thesis.degree.grantorUniversidade de Aveiropt_PT
dc.description.masterMestrado em Matemática e Aplicaçõespt_PT
Appears in Collections:UA - Dissertações de mestrado
DMat - Dissertações de mestrado

Files in This Item:
File Description SizeFormat 
Documento Letícia_Leite.pdf1.91 MBAdobe PDFView/Open


FacebookTwitterLinkedIn
Formato BibTex MendeleyEndnote Degois 

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.