MECANISMOS AUTONÔMICOS DE TOLERÂNCIA A FALHAS PARA SISTEMAS DISTRIBUÍDOS
Bibliografica
Macêdo, R. J. A. A Vision on Autonomic Distributed Systems. Salvador, Ba, Brazil
Macêdo, R. J. A.; Freitas, A. E. S. Group communication for self-aware distributed systems. Sá, A. S. de; Macêdo, R. J. A. QoS self-configuring failure detectors for distributed systems. MECANISMOS AUTONÔMICOS DE TOLERÂNCIA A FALHAS PARA SISTEMAS
DISTRIBUÍDOS
Diversas aplicações tecnológicas on-line já estão inseridas no cotidiano da sociedade, de forma que se tornaram serviços essências. A não disponibilidade desses serviços acarreta em gravíssimos danos aos usuários. Diante de esse cenário garantir a disponibilidade e confiabilidade desses serviços tornou-se quesito fundamental no projeto e gerenciamento dessas aplicações.
Neste contexto encontramos a aplicação de
Sistemas Distribuídos.
Um sistema distribuído é caracterizado por um conjunto de unidades de processamento interconectadas através de canais de comunicação. Sobre as unidades de processamento, executam um conjunto de processos que se comunicam através de troca de mensagens e colaboram para atingir um objetivo comum (Coulouris; Dollimore;
Kindberg, 2005).
Com a ideia inicial de que computadores poderiam cooperar para realizar uma tarefa em comum, através de compartilhamento de processos, o conceito de Sistemas
Distribuídos já é conhecido desde os anos 70, e desde então vem sendo aprimorada e tem desafiado pesquisadores a aprimorar a utilização dessa estrutura. Pode-se dividir a pesquisa desse campo em: modelos computabilidade e algoritmos básicos de um lado, e infra-estrutura de software e ferramentas no outro.
Os modelos computacionais permitem a separação entre problemas solúveis e insolúveis em ambientes distribuídos. Para tanto, estes modelos são construídos considerando semânticas relacionadas ao tempo, às falhas de componentes e aos mecanismos e infra-estruturas subjacentes de suporte ao sistema (Veríssimo; Rodrigues,
2000). As semânticas relacionadas