Teacnologia da informação

1105 palavras 5 páginas
1. COMO FUNCIONA O SISTEMA DE BUSCA (GOOGLE, YAHOO...)
Os sistemas de busca trabalham armazenando informações sobre um grande número de páginas, as quais eles obtêm da própria WWW. Estas páginas são recuperadas por um Web crawler (também conhecido como spider) — uma Web browser automatizado que segue cada link que vê. As exclusões podem ser feitas pelo uso do robots.txt. O conteúdo de cada página então é analisado para determinar como deverá ser indexado (por exemplo, as palavras são extraídas de títulos, cabeçalhos ou campos especiais chamados meta tags). Os dados sobre as páginas são armazenados em um banco de dados indexado para uso nas pesquisas futuras.
Alguns sistemas, como o do Google, armazenam todo ou parte da página de origem (referido como um cachê) assim como informações sobre as páginas, no qual alguns armazenam cada palavra de cada página encontrada, como a Alta Vista. Esta página em cachê sempre guarda o próprio texto de busca, pois, como ele mesmo foi indexado, pode ser útil quando o conteúdo da página atual foi atualizado e os termos de pesquisa não mais estão contidos nela. Este problema pode ser considerado uma forma moderada de linkrot (perda de links em documentos da Internet, ou seja, quando os sites deixaram de existir ou mudaram de endereço), e a maneira como o Google lida com isso aumenta a usabilidade ao satisfazer as expectativas dos usuários pelo fato de o termo de busca estarão na página retornada. Isto satisfaz o princípio de “menos surpresa”, pois o usuário normalmente espera que os termos de pesquisa estejam nas páginas retornadas.
Embora a tecnologia avance rapidamente, os Sistemas de Busca estão longe de serem criaturas inteligentes a ponto de poderem apreciar a beleza de um design, imagens ou mesmo apreciar os sons ou movimentos em um filme. Estes Sistemas de Busca rastreiam a Web procurando por itens particulares (principalmente texto) para terem uma idéia sobre o conteúdo (tema) de um site em particular.
Depois que uma

Relacionados

  • Teacnologia da informação
    709 palavras | 3 páginas