Please use this identifier to cite or link to this item: http://hdl.handle.net/10773/22200
Title: Outlier identification in multivariate time series
Other Titles: Identificação de outliers em séries temporais multivariadas
Author: Ribeiro, Joana Patrícia Bordonhos
Advisor: Silva, Luís Miguel Almeida da
Keywords: Matemática e aplicações
Análise de erros (Matemática)
Análise de séries temporais
Defense Date: 2017
Publisher: Universidade de Aveiro
Abstract: Com o desenvolvimento tecnológico, existe uma cada vez maior disponibilidade de dados. Geralmente representativos de situações do dia-a-dia, a existência de grandes quantidades de informação tem o seu interesse quando permite a extração de valor para o mercado. Além disso, surge importância em analisar não só os valores disponíveis mas também a sua associação com o tempo. A existência de valores anormais é inevitável. Geralmente denotados como outliers, a procura por estes valores é realizada comummente com o intuito de fazer a sua exclusão do estudo. No entanto, os outliers representam muitas vezes um objetivo de estudo. Por exemplo, no caso de deteção de fraudes bancárias ou no diagnóstico de doenças, o objetivo central é identificar situações anormais. Ao longo desta dissertação é apresentada uma metodologia que permite detetar outliers em séries temporais multivariadas, após aplicação de métodos de classificação. A abordagem escolhida é depois aplicada a um conjunto de dados real, representativo do funcionamento de caldeiras. O principal objetivo é identificar as suas falhas. Consequentemente, pretende-se melhorar os componentes do equipamento e portanto diminuir as suas falhas. Os algoritmos implementados permitem identificar não só as falhas do aparelho mas também o seu funcionamento normal. Pretende-se que as metodologias escolhidas sejam também aplicadas nos aparelhos futuros, permitindo melhorar a identificação em tempo real das falhas.
With the technological development, there is an increasing availability of data. Usually representative of day-to-day actions, the existence of large amounts of information has its own interest when it allows to extract value to the market. In addition, it is important to analyze not only the available values but also their association with time. The existence of abnormal values is inevitable. Usually denoted as outliers, the search for these values is commonly made in order to exclude them from the study. However, outliers often represent a goal of study. For example, in the case of bank fraud detection or disease diagnosis, the central objective is to identify the abnormal situations. Throughout this dissertation we present a methodology that allows the detection of outliers in multivariate time series, after application of classification methods. The chosen approach is then applied to a real data set, representative of boiler operation. The main goal is to identify faults. It is intended to improve boiler components and, hence, reduce the faults. The implemented algorithms allow to identify not only the boiler faults but also their normal operation cycles. We aim that the chosen methodologies will also be applied in future devices, allowing to improve real-time fault identification.
Description: Mestrado em Matemática e Aplicações
URI: http://hdl.handle.net/10773/22200
Appears in Collections:UA - Dissertações de mestrado
DMat - Dissertações de mestrado

Files in This Item:
File Description SizeFormat 
Dissertação.pdf2.31 MBAdobe PDFView/Open


FacebookTwitterLinkedIn
Formato BibTex MendeleyEndnote Degois 

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.