Ferramenta ETL
Extract, transform, load
O ETL termo que significa extração, transformação e carga é um processo de três estágios no uso de banco de dados e data warehouse. Ele permite a integração e análise dos dados armazenados em diferentes bases de dados e formatos heterogêneos. Depois de serem coletadas de várias fontes (extração), os dados são reformatados e limpa para as necessidades operacionais (transformação). Finalmente, ele é carregado em um banco de dados, data warehouse ou data mart a ser analisado. A maioria das inúmeras ferramentas de extração e transformação também permite o carregamento dos dados no destino final. Exceto para armazenamento de dados e inteligência de negócios, ferramentas de ETL também podem ser usado para mover dados de um sistema operacional para outro.
Extração
O objetivo do processo de extração é chegar aos sistemas de origem e coletar os dados necessários para o data warehouse.
Normalmente, os dados são consolidados a partir de diferentes sistemas de origem que podem usar uma organização de dados diferente ou formato para a extração deverá converter os dados em um formato adequado para o processamento de transformação. A complexidade do processo de extração pode variar e depende do tipo de fonte de dados. O processo de extração também inclui a seleção dos dados como a fonte geralmente contém dados redundantes ou dados de pouco interesse.
Para a extração de ETL para ser bem sucedido, requer uma compreensão do layout de dados. Uma ferramenta de ETL bom permite, adicionalmente, um dispositivo de armazenamento de uma versão intermediária de dados a ser extraída. Isso é chamado de "área de teste" e faz a recarga dados brutos possível em caso de outro problema de carregamento, sem re-extração. Os dados brutos também devem ser copiados e arquivados.
Transformação
A fase de transformar um processo de ETL envolve a aplicação de uma série de regras ou funções para os dados extraídos. Ele inclui a validação de registros e sua rejeição,