Big data
Big Data
Desafios e Oportunidades
Recife, 15 de novembro de 2012
Índice
1. Motivação
O volume de dados gerados pelo mundo está aumentando. Um estudo elaborado pela IDC [1] em 2011 mostra o volume de dados estão mais do que dobrando a cada dois anos e deve atingir 11,8 zettabytes (1,8 trilhões de gigabytes). Podemos dizer que estamos vivendo numa explosão de dados.
Segundo a IBM [2], 90% dos dados armazenados no mundo hoje foram criados nos últimos dois anos. Outros estudos [3] [4] revelam que 30 bilhões publicações são compartilhadas no Facebook por mês. Um milhão de transações de clientes são geradas por hora no Wal-Mart. E em 2020, as empresas terão que administrar 10 vezes mais servidores, 50 vezes mais dados, 75 vezes mais arquivos, com apenas 1,5 vezes mais pessoas.
Podemos perceber ao longo da história uma evolução no valor dos dados. Durante a década de 50 e 60 os dados eram vistos como produto. Nas duas décadas seguintes, os dados eram vistos como subproduto. Já nas décadas de 90 e 2000 os dados já começaram a ter um valor, auxiliando as organizações no processo de tomada de decisão. E na presente década, em diante, os dados são tratados como substrato, ou seja, algo essencial para o dia-a-dia das organizações.
Dados estão sendo coletados em grande escala. Eles são provenientes das mais diversas fontes, como: dados gerados por sistemas transacionais, sensores, câmeras, satélites, logs, redes sociais, etc.
Diante de toda essa inundação e evolução no valor dos dados, surge uma questão: O que podemos fazer com toda essa quantidade de informação? No mundo corporativo, decisões que antes eram baseadas em suposições, ou em modelos construídos por especialistas, agora podem ser feita com base nos dados coletados.
2. Introdução
O conceito de Big Data não surge