Trab
Centro de Ciências Exatas e Tecnológicas – CCET
Departamento de Ciências da Computação - DCC
Curso de Sistemas de Informação
SISTEMAS DISTRIBUÍDOS - TOLERÂNCIA A FALHAS
Montes Claros
2012
Davi Costa Vieira Braga
Floripes Crispim Santana
Samyr Sandoval Ribeiro
SISTEMAS DISTRIBUÍDOS - TOLERÂNCIA A FALHAS Trabalho apresentado à disciplina Sistemas Distribuídos, como requisito de avaliação parcial.
Professor/Orientador: Reinaldo Xavier.
Montes Claros
2012
Sumário
1 Introdução 4
2 Manutenção 5
2.1 Tipos de Manutenção 5
2.1.1 Manutenção Corretiva 5
2.1.2 Manutenção Preventiva 6
2.1.3 Manutenção Preditiva 6
3 Modelos de Falha 7
4 Duração da Falha 7
5 Fases de aplicação das técnicas de tolerância a falhas 8
6 Mascaramento de falhas 10
7 Redundância 11
7.1 Redundância de hardware 13
7.2 Redundância em software 15
8 Resiliência de Processos 15
9 Conclusão 17
Referências 18
1 Introdução
Sistemas distribuídos são construídos por vários componentes independentes. Esses sistemas se diferenciam de computadores paralelos pelo acoplamento fraco entre os processadores de cada componente, ou seja, os elementos de um sistema distribuído não têm acesso a uma memória comum. Toda a interação deve ser feita por troca de mensagens através de canais de comunicação. Além disso, sistemas distribuídos são geralmente construídos com elementos não homogêneos, assíncronos e sem um controle centralizado.
Sistemas distribuídos apresentam um problema intrínseco, qual seja, garantir a integridade e consistência dos dados distribuídos pelos vários processadores. Esse problema força a aplicação de técnicas de tolerância a falhas, mesmo quando não existe qualquer outra exigência mais forte com relação à confiabilidade imposta pela aplicação. Assim como em arquiteturas paralelas, sistemas distribuídos apresentam uma redundância natural, extremamente