Introdução A Deep Web
Ronaldo S. Mello
GBD/INE/CTC/UFSC
GBD
UFSC
Novembro, 2010
Grupo de Banco de
Dados da Universidade
Federal de Santa
Catarina
Roteiro
1. Introdução
2. Principais Tópicos de Pesquisa
i. Crawling ii. Extração iii. Matching iv. Consulta
3. Algumas Iniciativas
4. Tendências
Referências
Roteiro
1. Introdução
2. Principais Tópicos de Pesquisa
i. Crawling ii. Extração iii. Matching iv. Consulta
3. Algumas Iniciativas
4. Tendências
Referências
Dados na Web
●
Um “oceano” de conteúdo
●
Pesquisa a dados na Web
–
●
“Atirar uma rede neste oceano”
Oceano
–
Tem uma superfície
●
●
–
Alguns animais (dados) são facilmente visíveis
Fácil capturá-los com a rede (pesquisá-los)
É profundo
●
●
Animais que não são visíveis
Difícil encontrá-los e capturá-los
Surface Web (ou Web Visível)
●
Dados em páginas Web estáticas
–
Dados alcançados pelas máquinas de busca search engines - “barcos pesqueiros”
●
●
Google, Yahoo!, Bing, ...
Processo de pesquisa
–
Não é focado em domínio (keywords)
–
Dados são facilmente localizados no conteúdo da página ou através de seus links
Deep Web (ou Web Escondida)
●
Dados invisíveis
–
●
Visíveis apenas quando mostrados em páginas dinâmicas criadas a partir do resultado de uma pesquisa definida sobre um formulário - Web
Form
Web Form (WF)
Interface de pesquisa para um Banco de
Dados
(BD)
“escondido” na Web
–
Deep Web: “Oceano” de Dados & Domínios
Cars.com
Amazon.com
Biography.com
Apartments.com
411localte.com
401carfinder.com
Deep Web vs. Surface Web
Similaridade
- Ambas crescem rapidamente em diversos domínios
● Diferenças
- Quadrantes de Kevin Chang
●
Surface Web
Access
Structure
Deep Web
Por quê o Interesse pela Deep Web?
●
Principal fonte de dados estruturados na Web a disposição –
Serviços úteis em diversos domínios!
●
●