TECNOLOGIA GEOPROCESSAMENTO
RESUMO
Este artigo apresenta uma abordagem que ajuda a descobrir as localizações geográficas do reconhecimento , extração e geocodificação de endereços urbanos encontrados em páginas da web. Experimentos que avaliam a presença e incidência de endereços urbanos em páginas da Web são descritos . Os resultados experimentais , com base em uma coleção de mais de 4 milhões de documentos da Web brasileira, mostrar a viabilidade e eficácia do método proposto.
Categorias e Descritores Assunto
H.3.3 [ Information Storage and Retrieval ] : Construções da linguagem e recursos – formulaçãod e consulta , modelos de recuperação, processo de busca.
Termos gerais
Desenho, Experimentação , Performance.
Palavras-chave
Recuperação de informação geográfica , busca local , a ontologia urbana, endereço urbana.
1 . INTRODUÇÃO
O reconhecimento automático de características geográficas embutidos em dados da Web e documentos tem inúmeras aplicações sociais e econômicos , por exemplo , no turismo ou de saúde. No entanto , continua a ser uma tarefa difícil. Muitas páginas da Web contêm provas geoespaciais , como nomes de lugares , endereços, códigos postais ou números de telefone , geralmente de uma forma semi-estruturada , no entanto, permitir que os seres humanos para reconhecê-la e atribuir significado geográfico de páginas da web. Outra evidência é encontrado embutido no texto de linguagem natural , e reconhecendo que requer compreensão do contexto da página.
Sanderson e Kohler [14] verificou-se que cerca de 18% de palavras-chave como consultas submetidas ao mecanismo de busca Excite conter termos relacionados à geografia . No Brasil , uma análise dos seis meses de logs de consulta de TodoBR ( um grande motor de pesquisa brasileiro , adquirido pelo Google em 2005) [6] revelou que 14,1% das consultas continham pelo menos um termo geográfico - relacionados, tais como o nome da cidade ou digita,