Uso do Hadoop

358 palavras 2 páginas

HADOOP

1. Apache Hadoop, o que é? Apache Hadoop é uma plataforma de computação distribuída para processamento de grandes quantidades de dados. Desenvolvida em Java, permite que uma aplicação seja executada em clusters com mais de 1000 nós. Apache Hadoop é um projeto open-source e mantido pela Apache Software Foundation (ASF).
*Fontes:
http://wiki.apache.org/hadoop/FrontPage

2. Breve história O Hadoop foi desenvolvido por Doug Cutting e Mike Cafarella em 2005. O nome Hadoop vem de um elefante de brinquedo do filho de Cutting. Foi desenvolvido inicialmente para auxiliar o projeto do motor de buscas Nutch.
*Fontes:
http://en.wikipedia.org/wiki/Apache_Hadoop#History

3. Componentes O Apache Hadoop é composto por três componentes principais. São elas, armazenamento, processamento e gestão de recursos.
*Fontes:
http://hortonworks.com/hadoop/ 3.1 Processamento É baseado no paradigma de MapReduce que distribuí tarefas entre os nós dos clusters.
*Fonte:
http://wiki.apache.org/hadoop/MapReduce 3.2 Armazenamento
*Fonte:
http://wiki.apache.org/hadoop/HDFS?action=show&redirect=DFS 3.3 Gestão de Recursos
*Fonte:
http://hadoop.apache.org/docs/current/hadoop-yarn/hadoop-yarn-site/YARN.html http://hortonworks.com/hadoop/yarn/ 4. Quem usa?
*Fonte:
http://en.wikipedia.org/wiki/Apache_Hadoop#Prominent_users 4.1 Principais usuários 4.1.1 Yahoo! Em Fevereiro de 2008, o Yahoo! anunciou o que seria a maior aplicação Hadoop do mundo. O Yahoo! Search Webmap que é uma aplicação que é executada com um cluster Linux com mais de 10000 nós e produz dados que são utilizados pela ferramenta de buscas.
*Fontes:
http://en.wikipedia.org/wiki/Apache_Hadoop#Prominent_users 4.1.2 Facebook Em 2010, o Facebook anuncio ter o maior cluster Hadoop com 21 PB de dados armazenados. Em 27 de julho de 2011, anunciaram que havia crescido para 30 PB.
Em 2012, o montante chegava a 100 PB. E a velocidade de crescimento da base de dados seria de cerca de meio

Relacionados

hadoop
1592 palavras | 7 páginas

Cursos HADOOP com Certificado CLOUDERA Para mais informação com relação à oferta de formação, contatem com a equipe de Pragsis Bidoop a través do e-mail: university@pragsis.com ou pelo telefone: +34 91768049 Cursos HADOOP para programadores e administradores com certificado CLOUDERA Segundo Gartner, o volume de informação gerada cresce de forma progressiva cada ano, dado que confirma o Mckinsey Global Institute, que situa este crescimento em um 40%anual. Este volume tão grande precisa….

exibir mais
qualidade
1456 palavras | 6 páginas

MapReduce Hadoop H d Amazon’s VPC 2 1 Historia e Contexto Mainframes (≈ 1950‐80) Micro‐computadores (80’s) Cliente‐Servidor (80) WWW (≈ 1992) Telefonia Móvel (≈ 1995) Grid Computing (≈ 1995) VMware e Xen (≈ 1999) SalesForce.com (≈ 1999) SUN’s Thin Client Computing (≈ 1999) Representational State Transfer (REST) - Roy Fielding’s PhD (2000) Banda Larga (>2000) Writley/Google Apps/Zoho – Office prod. Apps (≈ 2005) Amazon WS (≈ 2005) Apache s Apache’s Hadoop (≈ 2005)….

exibir mais
Tecnologia
1385 palavras | 6 páginas

Elastic MapReduce MapReduce Hadoop H d Amazon’s VPC 2 Historia e Contexto Mainframes (≈ 1950‐80) Micro‐computadores (80’s) Cliente‐Servidor (80) WWW (≈ 1992) Telefonia Móvel (≈ 1995) Grid Computing (≈ 1995) VMware e Xen (≈ 1999) SalesForce.com (≈ 1999) SUN’s Thin Client Computing (≈ 1999) Representational State Transfer (REST) - Roy Fielding’s PhD (2000) Banda Larga (>2000) Writley/Google Apps/Zoho – Office prod. Apps (≈ 2005) Amazon WS (≈ 2005) Apache s Apache’s Hadoop (≈ 2005) … 3 Definições….

exibir mais
Banco de dados nosql
11898 palavras | 48 páginas

INTERDISCIPLINAR V São Paulo - SP 2013 Lista de Figuras Figura 1. Exemplo de arquitetura utilizando o sistema Memcached............................. Figura 2. Utilização do Hadoop...................................................................................... Figura 3. Arquitetura do sistema de arquivos do Hadoop (HDFS)............................... Lista de Abreviaturas e Siglas….

exibir mais
big data
16635 palavras | 67 páginas

Data / Guilherme de Lima Bernardes. – Brasília, DF, 201473 p. : il. (algumas color.) ; 30 cm. Orientador: Prof. Dr. Fernando William Cruz Trabalho de Conclusão de Curso – Universidade de Brasília - UnB Faculdade UnB Gama - FGA , 2014. 1. Big Data. 2. Hadoop. I. Prof. Dr. Fernando William Cruz. II. Universidade de Brasília. III. Faculdade UnB Gama. IV. Desenvolvimento de Software no Contexto Big Data CDU 02:141:005.6 Guilherme de Lima Bernardes Desenvolvimento de Software no Contexto Big Data Monografia….

exibir mais
mapreduce
20916 palavras | 84 páginas

Capítulo 3 Apache Hadoop: conceitos teóricos e práticos, evolução e novas possibilidades Alfredo Goldman, Fabio Kon, Francisco Pereira Junior, Ivanilton Polato, Rosangela de Fátima Pereira Abstract Advancements on the Internet popularity over the last decade and the increase in volume and complexity of services available on the Web led to the generation of massive amounts of data. To process these data, both performance and availability are critical factors that need to be evaluated since….

exibir mais
Relatório hadoop mini curso utfpr scampr 2012
574 palavras | 3 páginas

Resumo do minicurso sobre Hadoop O Hadoop foi criado pelo Yahoo em 2005 e pode ser considerada uma das maiores invenções de data management desde o modelo relacional. É um framework open source desenvolvido em Java, para rodar aplicações, que manipulem uma grande quantidade de dados, em ambientes “clusterizados” (vários computadores processando um conjunto de dados paralelamente ). Trabalha como um conjunto de ferramentas que trabalham em sintonia para basicamente resolver questões como:….

exibir mais
MapReduce
463 palavras | 2 páginas

algoritmo paralelo e distribuído em que a Google foi pioneira. É implementada no projeto Apache Hadoop, utilizando todo o hardware disponível no cluster. Isto torna os problemas de paralelização mais fáceis, apresentando aos programadores uma API estruturada para implementar funcionalidades de computação paralela. Grandes corporações como Amazon e Facebook, utilizam a implementação em larga escala o Hadoop, em aplicações Big Data. Um bom exemplo seria a evolução da capacidade de armazenamento dos….

exibir mais
Teste
1043 palavras | 5 páginas

Nasa utiliza Hadoop A NASA conta com a Hadoop para lidar com grandes volumes de dados em projetos como o Square Kilometer Array, para visualização dos céus: prevê-se que este produza 700 TB quando for construído na próxima década. Os sistemas de dados vão incluir a Hadoop, assim como tecnologias Apache OODT (Object Oriented Data Technology), para lidar com maciços volumes de trabalho, diz Chris Mattmann, cientista de computação da NASA. Twitter utiliza Hadoop O Twitter é um outro….

exibir mais
Twitter
2311 palavras | 10 páginas

.................. 3 2.3 Privacidade ....................................................................................................................... 3 3. Hadoop .................................................................................................................................... 4 3.1 Arquitetura de um Hadoop ............................................................................................. 4 3.1.1 NameNode.....................................................….

exibir mais

Outros Trabalhos Populares