Cassandra
Cassandra – Uma sistema de armazenamento
NoSQL altamente escalável
Tiago Pasqualini da Silva
Universidade Federal de São Carlos – Campus Sorocaba
Sorocaba, São Paulo
Email: tiago.pasqualini@gmail.com
Resumo—O grande crescimento no número de acessos em diversos serviços oferecidos na Internet requer que os dados sejam armazenados de forma eficiente e escalável. O Cassandra, um sistema de banco de dados NoSQL baseado em chave/valor afirma garantir um armazenamento de dados distribuído, altamente escalável e eventualmente consistente. Com o seu uso, várias empresas otimizaram seus serviços, pois o Cassandra se mostra bem mais rápido que as outras soluções de banco de dados distribuídos baseados em NoSQL.
Palavras-chave — cloud computing, banco de dados, sistemas distribuídos, NoSQL, escalabilidade, disponibilidade.
H
I. INTRODUÇÃO
em dia, grandes serviços vêm sendo oferecidos através da Internet. Esses grandes serviços possuem um número absurdo de acessos simultâneos e devem manterse disponíveis o tempo todo. Para garantir essa disponibilidade, grandes empresas como Google e Facebook apostam no novo modelo de computação chamado de Cloud
Computing. Um dos fatores chave nesse novo modelo de computação é o armazenamento dos dados.
O armazenamento de dados, que antes era feito em bancos de dados relacionais comuns, hoje em dia se tornou obsoleto para alguns tipos de serviços que precisam guardar volumes enormes de dados com rapidez e eficiência. Como solução para esses serviços surgiram os bancos de dados NoSQL [2].
Nessa nova abordagem, os bancos de dados se tornaram mais simples, porém mais robustos. Além disso, esses bancos de dados NoSQL possuem, em sua grande maioria, tolerância ao particionamento de dados, o que ajuda muito na escalabilidade, pois os dados podem ser divididos entre diversas máquinas para dividir o processamento desses dados entre as várias máquinas.
Nessa linha, o Facebook tinha um problema com as suas buscas nas mensagens enviadas entre os