Qualidade de dados
2º Ten Marcello Sandi Pinheiro – Analista de BI e Qualidade de Dados
Cap Marçal de Lima Hokama – Administrador de Banco de Dados
INTRODUÇÃO
Durante os últimos anos ocorreu um crescimento significativo dos Sistemas de Informações nas organizações, fruto de um processo natural de implantação de tecnologias visando a automatização das áreas e atividades dentro da organização e, com isso, a dinamização dos serviços dentro da organização como um todo. Tecnicamente, tais Sistemas de Informações (SI) mantém repositórios com os dados que, na verdade, representam o negócio da organização, e são, na realidade, o que há de mais precioso depois dos recursos humano da organização.
Além disso, sabendo que os repositórios podem ser acessados por diversos sistemas e considerando a suas características evolutivas, o problema principal está em garantir que a informação esteja íntegra e “saudável”, quer dizer, livre de inconsistências e redundâncias, tanto as relacionadas à padronização e completude quanto as relacionadas às regras de negócio.
Nesse sentido, ao se levar em consideração que os dados são usados para diversas finalidades, inclusive para a tomada de decisão, há uma necessidade intrínseca de qualidade dos dados, pois há uma razão bem simples para que isso aconteça: garantir a confiabilidade da informação (HUANG et al, 2001).
Em (BATINI, 2003) afirma-se que a importância da qualidade dos dados nos processos decisórios e operacionais é reconhecido por várias instituições e organizações internacionais. O Data Warehousing Educational & Solution (TDWI, 2010) afirma que a há uma diferença significativa entre a qualidade dos dados percebida e a real em muitas organizações. Tais problemas com qualidade dos dados geram um prejuízo de mais de 600 bilhões de dólares por ano nas empresas Norte-Americanas.
Tamanho é o problema que a