Geração Automática de Código SQL para Dimensões em um Ambiente de Data Warehouse
Ambiente de Data Warehouse
Igor Peterson Oliveira Santos, Juli Kelle Gois Costa,
André Vinicius Rodrigues Passos Nascimento, Methanias Colaço Rodrigues Júnior
Departamento de Sistemas de Informação
Universidade Federal de Sergipe
Itabaiana-SE, Brasil
{igorp.ita,julikelle,mjrse}@hotmail.com, andreviniciusnascimento@gmail.com
Resumo— O termo Data Warehouse é adotado pelas organizações como sinônimo de repositório de dados de alta qualidade. Desse modo, identificar problemas com validade, consistência e integridade dos dados representa uma preocupação constante das empresas no processo de utilização dos sistemas de suporte à decisão. A codificação manual de rotinas para povoamento de dimensões é apontada como uma das principais causas da má qualidade dos dados em um Data Warehouse. Erros de codificação, estratégias incorretas de atualização, e má interpretação das estratégias de armazenamento de histórico representam os principais problemas que podem ser gerados pela codificação manual. Acreditamos que o uso da geração automática de código para rotinas de povoamento possa substituir a codificação manual, reduzir o número de erros de codificação e eliminar interpretações incorretas na codificação de estratégias de atualização. Nesse trabalho, apresentamos os primeiros resultados da utilização de uma ferramenta para geração automática de código para rotinas de povoamento de dimensões. Experimentos iniciais apresentam fortes evidências de que é possível capturar a semântica necessária para gerar automaticamente rotinas de povoamento para os principais tipos de dimensões, e contribuir para o aumento da produtividade e redução de erros de codificação na construção dessas rotinas.
Keywords: Data Warehouse; Qualidade de Dados; Geração Automática de Código
I. Introdução
Data Warehouse (DW) representa um banco de dados histórico, separado lógica e fisicamente do ambiente de produção de uma organização,