Classificação de falhas
Alan de Almeida Pacheco
Artigo sobre Classificação de Falhas apresentado ao curso de Redes de Computadores, disciplina Sistemas Distribuídos ministrada pelo Profº. Guna Santos.
Resumo
Em um ambiente distribuído suportado por infraestrutura de rede de computadores, supõe-se que o sistema computacional opere apropriadamente, sem interrupção no seu serviço e sem perda de dados ou mensagens. No mundo ideal, sistemas computacionais são totalmente confiáveis e 100% disponíveis. No mundo real, confiabilidade e disponibilidade absolutas estão muito longe de serem alcançadas. A confiabilidade e a disponibilidade de equipamentos e serviços de computação não são conceitos abstratos e absolutos, mas são atributos de um sistema que podem ser medidos quantitativamente. Várias técnicas de projeto podem ser usadas para aumentar o valor dessas medidas, que podem chegar próximas aos 100%. Mesmo assim, sistemas totalmente infalíveis são impossíveis, pois falhas são inevitáveis. Mas usuários e desenvolvedores não devem se conformar com equipamentos e serviços de baixa qualidade, desde que estejam dispostos a arcar com o custo do emprego de técnicas de tolerância a falhas. Esse texto conduz uma visão geral da área de tolerância a falhas e suas classificações. São explorados tanto aspectos teóricos como exemplos práticos.
Palavras-chave: tolerância a falhas, alta disponibilidade, confiabilidade, sistemas distribuídos, classificações.
Introdução
Nas últimas décadas, observa-se uma crescente popularização dos computadores pessoais, que se tornaram itens indispensáveis em nosso cotidiano. Muito mais do que isto, estas máquinas passaram a exercer papéis fundamentais em ambientes corporativos, quaisquer que sejam seus ramos de atuação no mercado.
Neste contexto, torna-se desejável a existência de um projeto que objetiva estudar a previsão e prevenção de falhas em sistemas computacionais.
A importância dos sistemas computacionais é percebida