Daa warehouse
O conceito de Data Warehouse surgiu da necessidade de integrar dados corporativos espalhados em diferentes sistemas de informação e torná-los acessíveis a todos os usuários que precisam desses dados para tomar algum tipo de decisão.
Normalmente, os sistemas transacionais suportam as operações básicas do cotidiano dos seus usuários. No ambiente de Data Warehouse, os dados consistem de um retrato no tempo e podem abranger longos períodos, sendo atualizados periodicamente e não em tempo real. Toda estrutura de dados do Data Warehouse tem um elemento de tempo como referência, tais como: dia, mês, semestre, ano, quase sempre concatenado com a identificação do dado. O Data Warehouse tem como objetivo suportar o processamento analítico on-line , ou seja, ele é estruturado por assunto ou tema para responder algumas questões, como por exemplo: qual foi o total de evasão de uma turma de um determinado curso em um período de tempo e quais foram os professores que trabalharam com esta turma. Já os sistemas transacionais são orientados por transações, como por exemplo, viabilizar o lançamento de notas, a emissão de boletas, a realização de matrícula do aluno, etc. Existe uma forte ligação entre esses tipos de sistemas, pois a geração dos dados do Data Warehouse ocorre a partir dos dados dos sistemas transacionais. Para o sucesso da implementação do Data Warehouse é muito importante construir também um catálogo com a descrição dos dados que participam do novo ambiente. Os dados que compõem este catálogo são chamados de metadados, ou seja, dados acerca dos dados. Alguns autores afirmam que o metadado é o DNA da informação.
Separar o Data Warehouse do ambiente de sistemas transacionais é muito importante. Isso permite que os usuários que precisam tomar decisões utilizem, explorem e analisem os dados do Data Warehouse sem impactar o desempenho dos sistemas transacionais.
A estrutura do Data Warehouse abrange diferentes níveis de agrupamento, consolidação e