Please use this identifier to cite or link to this item: http://hdl.handle.net/10773/29221
Title: Efficient time-domain error recovery methods for flexible time-triggered systems
Other Titles: Métodos eficientes para recuperação de erros no domínio temporal em sistemas flexible time-triggered
Author: Marques, António Luís Ferreira
Advisor: Pedreiras, Paulo Bacelar Reis
Almeida, Luís Miguel Pinho de
Keywords: Distributed systems
CAN
Flexible time-triggered
Error recovery
Reliability
Bandwidth e ciency
Defense Date: 15-Jul-2019
Abstract: Nowadays there is an ubiquitous use of distributed embedded systems (DES), controlling all kinds of equipment, machinery or processes, that have a positive impact on our daily lives, e.g. cars, public transportation, medical equipment and HVAC systems. Depending on the nature of the tasks performed, along with performance requirements, there could be safety issues that must also be taken in consideration. Due to the distributed nature of these systems, the computing nodes must exchange information/messages for the system to perform its intended function. They achieve this using an underlying communication network that implements specific protocols for the type of traffic that exhibits stringent timeliness characteristics, which are inherited from real-time requirements at the system level. The environment where the network is deployed is never free of interferences, e.g. EMI noise. These can corrupt the messages, which leads to performance degradation or even preventing correct functioning of the corresponding distributed system and, in the limit, produce catastrophic results in case of safety critical systems. Clearly this problem must be tackled, and there are diverse ways to achieve it, commonly through use of fault tolerant techniques. Fault tolerance can be obtained using temporal redundancy, spatial redundancy or a combination of both, and the choice depends on different requirements, as for instance cost, power, weight, space, complexity or type of faults to handle. When dealing with safety-critical real time systems the most common choice is to use Time-Triggered networks, which use communication schedules defined at design-time, being therefore static. These networks present prompt error detection, but the latency in error recovery can only be minimized by bandwidth overprovisioning, proactively transmitting multiple instances of the same message, which makes it bandwidth inefficient. A possible alternative is to use networks based on the Flexible Time-Triggered (FTT) paradigm, since it uses online traffic scheduling, which enables a prompt reaction to errors, integrating retransmissions among the regular Time-Triggered messages and having the potential to use significantly less bandwidth than the common Time-Triggered option. In fact, the thesis states that it is possible to guarantee high-reliability of message transmission in Time-Triggered networks by performing error recovery in the time domain, using a centrally controlled and dynamically scheduled retransmission mechanism.
Atualmente, ha um uso omnipresente de sistemas embebidos distribuídos, controlando todos os tipos de equipamentos, maquinas ou processos, que têm um impacto positivo no nosso dia-a-dia, e.g. carros, transportes públicos, equipamentos médicos e sistemas HVAC. Dependendo da natureza das tarefas executadas, juntamente com os requisitos de desempenho, podem ainda existir questões relativas à segurança que também devem ser tidas em consideração. Devido à natureza distribuída desses sistemas, os nos de computação necessitam trocar mensagens de modo ao sistema executar as tarefas pretendidas. Isto e conseguido usando uma rede de comunicação subjacente, que implementa protocolos específicos para o tipo de tráfego que tem requisitos de pontualidade rigorosos, sendo estes herdadas dos requisitos de tempo real ao nível do sistema. O ambiente em que a rede e implementada nunca esta isento de interferências, por exemplo ruído devido a interferência eletromagnética. Estas podem corromper as mensagens, o que pode levar a degradação do desempenho ou ate mesmo impedindo o funcionamento correto do sistema distribuído e, no limite, produzir resultados catastróficos no caso de sistemas de segurança crítica. Claramente, este problema tem de ser resolvido, existindo diversos modos de o alcançar, geralmente através da utilização de métodos tolerantes a falhas. A tolerância a falhas pode ser obtida usando redundância temporal, redundância espacial ou uma combinação de ambas, onde a escolha depende de requisitos diversos, como por exemplo custo, consumo de energia, peso, espaço ocupado, complexidade ou tipo de falhas a serem toleradas. Para lidar com sistemas de tempo real de segurança crítica, a escolha mais comum e utilizar redes baseadas no paradigma Time-Triggered, que usam um escalonamento das comunicações definidas na fase de projeto, pelo que são estáticas. Estas redes permitem uma deteção rápida de erros, mas a latência na recuperação dos erros só pode ser minimizada pela reserva excessiva de largura de banda, transmitindo proactivamente varias instâncias da mesma mensagem, apresentando então um uso ineficiente da largura de banda disponível.
URI: http://hdl.handle.net/10773/29221
Appears in Collections:UA - Teses de doutoramento
DETI - Teses de doutoramento

Files in This Item:
File Description SizeFormat 
Documento.pdf6.97 MBAdobe PDFView/Open


FacebookTwitterLinkedIn
Formato BibTex MendeleyEndnote Degois 

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.