Please use this identifier to cite or link to this item: http://hdl.handle.net/10773/14273
Full metadata record
DC FieldValueLanguage
dc.contributor.advisorNeves, António José Ribeiropt
dc.contributor.advisorPinho, Armando José Formoso dept
dc.contributor.authorMatos, Luís Miguel de Oliveirapt
dc.date.accessioned2015-06-22T15:11:57Z-
dc.date.available2015-06-22T15:11:57Z-
dc.date.issued2015-
dc.identifier.urihttp://hdl.handle.net/10773/14273-
dc.descriptionDoutoramento em Informáticapt
dc.description.abstractNowadays, in the 21st century, the never-ending expansion of information is a major global concern. The pace at which storage and communication resources are evolving is not fast enough to compensate this tendency. In order to overcome this issue, sophisticated and efficient compression tools are required. The goal of compression is to represent information with as few bits as possible. There are two kinds of compression, lossy and lossless. In lossless compression, information loss is not tolerated so the decoded information is exactly the same as the encoded one. On the other hand, in lossy compression some loss is acceptable. In this work we focused on lossless methods. The goal of this thesis was to create lossless compression tools that can be used in two types of data. The first type is known in the literature as microarray images. These images have 16 bits per pixel and a high spatial resolution. The other data type is commonly called Whole Genome Alignments (WGA), in particularly applied to MAF files. Regarding the microarray images, we improved existing microarray-specific methods by using some pre-processing techniques (segmentation and bitplane reduction). Moreover, we also developed a compression method based on pixel values estimates and a mixture of finite-context models. Furthermore, an approach based on binary-tree decomposition was also considered. Two compression tools were developed to compress MAF files. The first one based on a mixture of finite-context models and arithmetic coding, where only the DNA bases and alignment gaps were considered. The second tool, designated as MAFCO, is a complete compression tool that can handle all the information that can be found in MAF files. MAFCO relies on several finite-context models and allows parallel compression/decompression of MAF files.pt
dc.description.abstractHoje em dia, no século XXI, a expansão interminável de informação é uma grande preocupação mundial. O ritmo ao qual os recursos de armazenamento e comunicação estão a evoluir não é suficientemente rápido para compensar esta tendência. De forma a ultrapassar esta situação, são necessárias ferramentas de compressão sofisticadas e eficientes. A compressão consiste em representar informação utilizando a menor quantidade de bits possível. Existem dois tipos de compressão, com e sem perdas. Na compressão sem perdas, a perda de informação não é tolerada, por isso a informação descodificada é exatamente a mesma que a informação que foi codificada. Por outro lado, na compressão com perdas alguma perda é aceitável. Neste trabalho, focámo-nos apenas em métodos de compressão sem perdas. O objetivo desta tese consistiu na criação de ferramentas de compressão sem perdas para dois tipos de dados. O primeiro tipo de dados é conhecido na literatura como imagens de microarrays. Estas imagens têm 16 bits por píxel e uma resolução espacial elevada. O outro tipo de dados é geralmente denominado como alinhamento de genomas completos, particularmente aplicado a ficheiros MAF. Relativamente às imagens de microarrays, melhorámos alguns métodos de compressão específicos utilizando algumas técnicas de pré-processamento (segmentação e redução de planos binários). Além disso, desenvolvemos também um método de compressão baseado em estimação dos valores dos pixéis e em misturas de modelos de contexto-finito. Foi também considerada, uma abordagem baseada em decomposição em árvore binária. Foram desenvolvidas duas ferramentas de compressão para ficheiros MAF. A primeira ferramenta, é baseada numa mistura de modelos de contexto-finito e codificação aritmética, onde apenas as bases de ADN e os símbolos de alinhamento foram considerados. A segunda, designada como MAFCO, é uma ferramenta de compressão completa que consegue lidar com todo o tipo de informação que pode ser encontrada nos ficheiros MAF. MAFCO baseia-se em vários modelos de contexto-finito e permite compressão/descompressão paralela de ficheiros MAF.pt
dc.language.isoengpt
dc.publisherUniversidade de Aveiropt
dc.relationFCT - SFRH/BD/86531/2012-
dc.rightsopenAccesspor
dc.subjectInformáticapt
dc.subjectProcessamento digital de imagempt
dc.subjectCompressão de imagempt
dc.subjectCodificação de imagempt
dc.subject.otherLossless image compressionpt
dc.subject.othermicroarray imagespt
dc.subject.othernite-context modelspt
dc.subject.otherbinary-tree decompositionpt
dc.subject.otherbitplane decompositionpt
dc.subject.otherbitplane reductionpt
dc.subject.otherwhole genome alignmentpt
dc.subject.othermultiple alignment formatpt
dc.titleLossless compression algorithms for microarray images and whole genome alignmentspt
dc.title.alternativeAlgoritmos de compressão sem perdas para imagens de microarrays e alinhamento de genomas completospt
dc.typedoctoralThesispt
thesis.degree.leveldoutoramentopt
thesis.degree.grantorUniversidade de Aveiropt
thesis.degree.grantorUniversidade do Minhopt
thesis.degree.grantorUniversidade do Portopt
dc.identifier.tid101419708-
Appears in Collections:UA - Teses de doutoramento
DETI - Teses de doutoramento

Files in This Item:
File Description SizeFormat 
Lossless compression algorithms for microarray.pdf14.13 MBAdobe PDFView/Open


FacebookTwitterLinkedIn
Formato BibTex MendeleyEndnote Degois 

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.