Senhor
JULIO ADRIANO PIM RM 46101
FERNANDO ALBUQUERQUE CANELAS RM 45932
JACKSON GUERRA RM 45874
VITOR SAMPAIO RM 45819
RAFAEL SILVA RM 45667
GOOGLE BIG TABLE E GOOGLE FILE SYSTEM
SÃO PAULO, SP
2014
1 INTRODUÇÃO
Este trabalho tem como finalidade apresentar um estudo de Big Data com Google Big Table e Google File System, iniciando pela introdução de sistemas de arquivos até chegar ao estudo do Google File System e conceitos do Big Table. O sistema de arquivos é parte do sistema operacional responsável pela gerência dos arquivos e provê mecanismos para o armazenamento, persistência da informação, acesso à informação de forma concorrente e a interface que esconde detalhes da implementação. O sistema de arquivos distribuído (SAD) fornece os mesmos serviços e recursos de um sistema de arquivos convencional, porém, o acesso à informação é realizado de forma transparente ao usuário independentemente da localização da informação (local ou remota). Pode-se citar como vantagens dos sistemas de arquivos distribuídos a maior disponibilidade e visão única entre os clientes e como desvantagens e/ou desafios a segurança, escalabilidade e confiabilidade.
Dentre os sistemas de arquivos distribuídos podemos citar:
- AFS (Andrew File System) que foi desenvolvido na Carnegie Mellon University em 1980, posteriormente comprado pela IBM e relançado como TransarcDFS e recentemente teve seu código aberto sob o nome de Open AFS;
- Global File System desenvolvido em 2001 como parte de uma tese na Universidade de Minnesota. Em 2003 foi comprado pela Red Hat Inc e está sendo portado para o Linux;
- NFS (Network File System). Sistema de arquivos distribuídos desenvolvido pela Sun Microsystems, desde 1985 acompanha o sistema operacional SunOS;
- Google File System. Criado em 2003 é um sistema de arquivos distribuído escalável para aplicações intensivas de dados