Migração de dados
INTRODUÇÃO
Esse trabalho tem como objetivo apresentar as fases e divisões de um projeto.
Justificativa: Apresentar a divisão de um projeto em fases.
2 FUNDAMENTAÇÃO TEÓRICA
Neste capítulo será apresentada a fundamentação teórica referente às técnicas e processos de ETL utilizadas para o desenvolvimento da ferramenta de software para a migração de dados.
2.1 ETL
ETL, da língua inglesa, Extract, Transform and Load, é um processo baseado em ferramentas de software que se destinam a extração, transformação e carga de dados. Estes dados podem ser originados de uma ou mais bases de dados, bem como o destino destes dados podem ser para um ou mais bancos de dados de sistemas de informação ou data warehouse, segundo Abreu (2010).
No processo de ETL, torna-se necessária a extração e carga dos dados, ficando a transformação e tratamento de erros dos dados de origem opcionais. Esta metodologia de não aplicar a validação ou tratamento dos dados a serem carregados deve ser adotada somente se os dados de origem estiverem em conformidade com o escopo do processo de carga.
ETL é aplicado em migração de dados para sistemas de informação, business intelligence e aplicações de data warehouse, data marts, que segundo Silberschatz et al. (1999), são repositórios de informações originadas de diversas fontes e armazenadas sob um esquema único para extração de informações. 2.1.1 Extração
Na fase inicial do processo de ETL, temos a extração dos dados de origem, que podem ser provenientes de uma ou mais fontes ou sistemas de informação.
Estes dados podem ser obtidos através de bancos de dados relacionais, arquivos textos (flat files), planilhas eletrônicas, web services, emails, arquivos xBase (arquivos de banco de dados com extensão “dbf”, utilizados em linguagens de programação como Clipper, Dbase, Foxpro entre outras) e diversos outros possíveis formatos.
Nesta fase é necessário identificar o tipo,