sistemas distribuidos
Fatos
Andre Luís Andrade Menolli
Gestão da Informação II - UENP
ETL – Carregando Dados nas Dimensões
As tabelas de dimensão proporcionará o contexto para as tabelas de fatos e, consequentemente, para todos os medições apresentadas no datawarehouse.
Data Flow: Extract ➔ Clean ➔ Conform ➔ Deliver
A estrutura Básica de uma Dimensão
Todas as dimensões devem ser fisicamente construído para que haja um conjunto mínimo de componentes.
A chave primária de uma dimensão é usada para unir as tabelas fato. Uma vez que todas tabelas de fatos devem preservar a integridade referencial, a chave primária de dimensões está associado a uma chave estrangeira correspondente na tabela de fatos.
A estrutura Básica de uma Dimensão
A estrutura Básica de uma Dimensão
A chave primária é um campo único contendo um inteiro, sem sentido único. A chave inteira, não tem um significado especial para a dimensão, ela é chamada de chave substituta. A chave substituta é inserida no DW por meio da ETL.
Todas as tabelas de dimensões devem possuir um ou mais outros campos que compõem a chave natural da dimensão.
A estrutura Básica de uma Dimensão
O componente final de todas as dimensões, além da chave primária e as chaves naturais, é o conjunto de atributos descritivos. Atributos descritivos são predominantemente textual, mas numéricos atributos descritivos são legítimos.
A Granularidade da Dimensão
Para iniciar a carga em uma dimensão deve-se saber a granularidade mínima que as tabelas de fatos possam utilizá-las. Ex: Cliente
Observar elementos repetidos, e utilizar Distincts, para selecionar os elementos.
Plano Básico para Carregar uma Dimensão.
Data Flow: Extract ➔ Clean ➔ Conform ➔ Deliver
Limpeza de Dados
A limpeza de dados é constituído por todas as etapas necessárias para limpar e validar o alimentação de dados de dimensão e aplicar regras de negócio conhecido por fazer o
dados