Apresenta o BDII
• Introdução
• O que são Banco de Dados Textuais
• Motivação
• Aplicações
• Características
• Operações em Texto
• Recuperação de Informações
• Modelos de Recuperação de Informações
• Recuperação de Dados X Recuperação de Informações
• Arquitetura
• Armazenamento de Informações
• Considerações Finais
Introdução
A área de Banco de Dados visa armazenar e recuperar informações de forma eficiente. Com o crescente volume e variedade de informações se tornando acessíveis a um grande número de pessoas, surge a necessidade de se extrair as que são úteis desse grande conjunto de informações disponibilizadas. Parte destas, são dados na forma de textos, o que gera a necessidade de armazená-los em um banco de dados e ser capaz de recuperá-los através de consultas.
O que são Banco de Dados Textuais?
São bancos que organizam, acessam, manipulam informações textuais, armazenando documentos de textos e que são capazes de recuperar as informações a partir destes documentos.
Motivação
Há vários motivos pelos quais optamos por converter textos, livros e documentos na forma digitalizada, dentre eles estão:
•Reduzir a quantidade de papel e espaço (no caso de haver muitos livros ou documentos empilhados, por exemplo);
•Compartilhamento de informações, ou seja, disponibilizá-las para outras pessoas; •Promover a diversidade de informação.
Aplicações
• Bibliotecas digitais;
• Automatização de escritórios;
• Dicionários e enciclopédias digitais;
• Livros e artigos digitais.
Características
• Grande volume de informações;
• Os dados não são necessariamente estruturados, isto é, nem sempre estão em tabelas em bancos de dados relacionais, pelo contrário, textos são em sua maioria, dados não-estruturados;
• Indexação de termos;
• Algoritmos complexos de indexação e busca;
• Tempo elevado de indexação;
• Alteração nos dados requer nova indexação.
Operações em Texto
Para recuperar informações, é necessário que cada texto possua uma representação. •Análise Léxica: possibilita a