GOOGLE BIG TABLE E GOOGLE FILE SYSTEM
1 INTRODUÇÃO
Este trabalho tem como finalidade apresentar um estudo de Big Data com Google Big Table e Google File System, iniciando pela introdução de sistemas de arquivos até chegar ao estudo do Google File System e conceitos do Big Table. O sistema de arquivos é parte do sistema operacional responsável pela gerência dos arquivos e provê mecanismos para o armazenamento, persistência da informação, acesso à informação de forma concorrente e a interface que esconde detalhes da implementação. O sistema de arquivos distribuído (SAD) fornece os mesmos serviços e recursos de um sistema de arquivos convencional, porém, o acesso à informação é realizado de forma transparente ao usuário independentemente da localização da informação (local ou remota). Pode-se citar como vantagens dos sistemas de arquivos distribuídos a maior disponibilidade e visão única entre os clientes e como desvantagens e/ou desafios a segurança, escalabilidade e confiabilidade.
Dentre os sistemas de arquivos distribuídos podemos citar:
- AFS (Andrew File System) que foi desenvolvido na Carnegie Mellon University em 1980, posteriormente comprado pela IBM e relançado como TransarcDFS e recentemente teve seu código aberto sob o nome de Open AFS;
- Global File System desenvolvido em 2001 como parte de uma tese na Universidade de Minnesota. Em 2003 foi comprado pela Red Hat Inc e está sendo portado para o Linux;
- NFS (Network File System). Sistema de arquivos distribuídos desenvolvido pela Sun Microsystems, desde 1985 acompanha o sistema operacional SunOS;
- Google File System. Criado em 2003 é um sistema de arquivos distribuído escalável para aplicações intensivas de dados distribuídos de grande porte. Ele fornece tolerância a falhas durante a execução em hardware commodity de baixo custo, e que oferece alto desempenho agregado a um grande número de clientes.
2 JUSTIFICATIVA
A grande questão que vem desafiando a indústria de armazenamento de dados é como obter uma