Recuperação de informação
OLINDA NOGUEIRA PAES CARDOSO 1 UFLA – Universidade Federal de Lavras DCC – Departamento de Ciência da Computação Cx. Postal 37 – CEP 37.200-000 Lavras (MG) olinda@comp.ufla.br
1
Resumo: Recuperação de Informação é uma área da Ciência da Computação que lida com armazenamento automático e recuperação de documentos, que são de grande importância devido ao uso universal da linguagem para comunicação. Este artigo apresenta uma visão geral dos modelos, componentes e um método de avaliação dos sistemas de recuperação de informação. São descritos os componentes de um sistema, um método de avaliação e os modelos clássicos de recuperação de informação. É apresentada a realimentação de relevantes, uma importante técnica para aumentar o desempenho dos sistemas de informações. Tópicos relacionados à área de recuperação de informação são brevemente descritos. Palavras-chave: Modelos de recuperação de informação, bibliotecas digitais, bancos de dados textuais, realimentação de relevantes.
1 Introdução Com o crescimento do volume de publicações, ao longo dos anos, foram desenvolvidas técnicas de recuperação de informação para responder às necessidades dos usuários de bibliotecas, tradicionais ou digitais. A ferramenta mais importante para auxiliar o processo de recuperação é denominada índice, que é uma coleção de termos que indicam o local onde a informação desejada pode ser localizada [Frakes (1992)]. Estes termos devem ser organizados de forma a facilitar sua busca. Atualmente já não se pode falar em crescimento do volume de publicações mas em uma verdadeira explosão. As bibliotecas digitais, que são publicações armazenadas e manipuladas eletronicamente, aparecem como um paradigma para melhorar a busca e apresentação de informações desejadas. Neste contexto são estudadas técnicas de digitalização de objetos originados de fontes heterogêneas, técnicas de armazenamento, processos de busca, recuperação e apresentação de forma amigável das