Please use this identifier to cite or link to this item:
http://hdl.handle.net/10773/25202
Title: | Clustering in cellular frustration models |
Other Titles: | Agrupamentos de dados em modelos de frustração celular |
Author: | Carvalho, Diana Barros de |
Advisor: | Abreu, Fernão |
Keywords: | Data mining Anomaly detection Cellular frustration |
Defense Date: | 18-Jul-2018 |
Abstract: | Cellular frustrated systems are models of interacting agents displaying complex
dynamics which can be used for anomaly detection applications. In their
simplest versions, these models consist of two agent types, called presenters
and detectors. Presenters display information from data samples. Detectors
read this information and perceive it in a binary signal, depending on its
frequency of appearance. The type of signal perceived will have an impact
on the agents' decision dynamics. In particular, the presence of anomalies
leads to less frustrated dynamics, i.e., more stable.
In this thesis it is questioned if the mapping in binary signals could not
bene t from the knowledge of the existence of clusters in the data set. To
this end, a clustering technique was developed that gives particular attention
to the fact that cellular frustrated systems discriminate samples depending
on the number of features displaying rare values. The clusters obtained
with this technique are also compared with those obtained using k-means
or hierarchical agglomerative clustering. It is shown that using a clustering
technique prior to application of cellular frustration system can improve
anomaly detection rates. However, it is also shown that depending on the
type of anomalies, this may not be generally the case, and therefore simpler
cellular frustration algorithms may have the advantage of being simpler. It
is believed that this study proposes new directions on how to improve the
cellular frustration technique in a broader context. Sistemas de frustração celular são modelos de interação de agentes que demonstram uma dinâmica complexa que pode ser utilizada para aplicações de deteção de anomalias. Na sua versão mais simples, estes modelos são compostos por dois tipos de agentes, designados de apresentadores e detetores. Os apresentadores exibem a informação das amostras. Os detetores leem essa informação e percecionam-na em sinais binários, dependendo da frequência com que são apresentados. O tipo de sinal percecionado terá impacto na dinâmica de decisões dos agentes. Em particular, a presença de anomalias produz uma dinâmica menos frustrada, i.e., mais estável. Nesta tese é questionado se este mapeamento em sinais binários não poderá bene ciar do conhecimento da existência de grupos (clusters) nas amostras. Com esta nalidade, foi desenvolvida uma técnica de clustering, que dá particular atenção ao facto que os sistemas de frustração celular detetam as amostras dependendo do número de características que exibem valores extremos. Os clusters obtidos com esta técnica também são comparados com aqueles obtidos com técnicas conhecidas, como o k-means ou o clus- tering hierárquico aglomerativo. Nesta tese demonstra-se que a utilização de uma técnica de clustering antes da aplicação do sistema de frustração celular pode melhorar as taxas de deteção de anomalias. Contudo, também é demonstrado que dependendo do tipo de anomalias, esta alteração pode não ser bené ca, podendo ser mais vantajoso utilizar a técnica de frustração celular original, uma vez que é mais simples. Acredita-se que este estudo propõe direções claras sobre como se poderá vir a melhorar a técnica da frustração celular num contexto mais geral. |
URI: | http://hdl.handle.net/10773/25202 |
Appears in Collections: | UA - Dissertações de mestrado DFis - Dissertações de mestrado |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
Documento.pdf | 2.75 MB | Adobe PDF | View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.