Tolerância a falhas em sistemas críticos
Luiz Antonio Gonçalves Rodrigues Junior
Centro Universitário Franciscano (UNIFRA)Santa Maria – RS – Brasil luizjunioradm@hotmail.com Resumo. Este artigo descreve a aplicação da tolerância a falhas nos sistemas considerados críticos. Serão conceituados erros, falhas e defeitos, caracterizando onde cada um desses conceitos se aplica. Ainda será demonstrada a importância da dependabilidade descrita através de cada um de seus atributos. Ao longo do artigo é descrita a metodologia (SAM – Safety Assesment Methodology) usada a fim dos programas poderem alcançar níveis de segurança críticos adequados. Na conclusão é destacada a importância da certificação e da tolerância a falhas nos sistemas críticos.
1. Introdução
No mundo inteiro, existem sistemas em que erros e falhas simplesmente necessitam ser suprimidos devido a seu alto risco em caso de não funcionamento. São programas que, caso venham a falhar, provocariam perdas econômicas, ambientais e até mesmo colocariam em risco vidas humanas, como é o caso de softwares de controle de tráfego aéreo, por exemplo. Para que tal risco seja reduzido ao mínimo ou até mesmo anulado, foram desenvolvidos procedimentos que objetivam fazer com que o programa continue com a performance correta de suas tarefas, mesmo na presença de falhas (FLORES, LOBATO, 1997).
Essa área de estudo, conhecida como tolerância a falhas, se ramifica no estudo de tolerância a falhas no software desenvolvido. Os erros afetam as unidades de informação, tornando essas unidades incorretas (FLORES, LOBATO, 1997). O objetivo deste trabalho é identificar a aplicação da tolerância a falhas em sistemas considerados críticos, com foco nos erros e falhas dos softwares.
2. Referencial Teórico
Segundo Furtado et al. (2008), o conceito de sistemas críticos significa:
Sistemas críticos são aqueles sistemas em que uma falha pode provocar perdas de vidas humanas, danos ambientais ou perdas financeiras consideráveis. Quando