Algoritmo page rank
E
O ALGORITMO PAGERANK
Teresinha Moreira de Magalhães[1]
RESUMO
O presente trabalho apresenta a metodologia de busca e classificação de páginas na Web utilizadas pelo motor de busca Google. Técnicas de recuperação das informações, bem como as características do algoritmo PageRank são apresentadas.
PALAVRAS CHAVES: Google, PageRank, algoritmo, WebCrawler
INTRODUÇÃO
Google PageRank - Todos usam, mas poucos sabem como ele funciona. Google PageRank é, provavelmente, um dos algoritmos mais importantes já desenvolvidos para a Web. Com bilhões de páginas existentes e milhões de páginas geradas a cada dia, a questão de pesquisa na Web é mais complexa do que, provavelmente, possa parecer. PageRank é apenas um dos centenas de fatores utilizados pelo Google para determinar os melhores resultados de busca, além de manter as buscas limpas e eficientes. Mas como é, realmente, feito? Como funciona o Google PageRank? Quais fatores impactuam sobre ele e quais não? E o que realmente se sabe sobre PageRank? A pesquisa se norteou através de dezenas de sugestões e fatos selecionados sobre o PageRank. Reuniram se trabalhos acadêmicos relacionados ao tema - como propostas científicas para melhores resultados dos motores de busca. Foi possível encontrar referências a conhecimentos matemáticos do PageRank, bem como ferramentas úteis para usar o PageRank para analisar a classificação dos projetos web. O PageRank, por sua vez, é o algoritmo usado pelo motor de busca Google para ajudar a determinar a relevância ou importância de uma página, de acordo com o número de vezes que a página é referenciada por outros sites. Interpreta o link de uma página para a outra como um voto das mesmas. Além disso, analisa o valor da página que dá o voto. Os votos dados por páginas importantes pesam mais e ajudam a tornar outras páginas importantes (BRIN & PAGE, apud ZANIER, 2006, p. 39). Diante