SAD Estudo Dirigido 02 1
1. O que é um Data Warehouse?
Um Data Warehouse é um conjunto de dados produzido para oferecer suporte à tomada de decisão; é também um repositório de dados atuais e históricos de possível interesse aos gerentes de toda a organização. Ou seja, é uma coleção de dados orientada por assunto, integrada, variável no tempo e não-volátil, que proporciona suporte ao processo de tomada de decisão da gerência.
2. Um data mart pode substituir ou complementar um data warehouse? Compare e discuta essas opções.
Um data warehouse une banco de dados de toda uma empresa. Já um data mart é menor e se concentra em um assunto ou departamento específico. Um data mart é um subconjunto de um data warehouse, que normalmente consiste em uma única área temática.
Neste sentido, um data mart substituiria um data warehouse, em que um departamento trabalharia com informações do seu setor correspondente.
3. Descreva os processos de ETL (extração, transformação e carga).
Esse processo possui três etapas:
A primeira é a extração (extract);
A segunda a transformação (transform);
E por fim, a carga (load).
A etapa de extração pode ser entendida como a fase onde os dados são extraídos dos OLTPs e conduzidos para a área de transição ou área temporária, onde são convertidos para um único formato. A conversão se faz necessária devido a heterogeneidade existente nas informações oriundas desses sistemas, sendo essencial a conformação prévia para o tratamento adequado.
Após a extração, teremos subsídios para iniciar a etapa de transformação e limpeza dos dados. Nessa fase são corrigidos, padronizados e tratados os desvios e inconsistências, transformando os dados de acordo com as regras do negócio.
A etapa de carga ocorre em sequência com a de transformação. Assim que são efetuados os tratamentos necessários nos dados, a carga no DW é iniciada. Essa fase se resume na persistência dos dados na base consolidada.
4. Defina OLAP e compare ao OLTP.
O OLTP, do inglês "On-line