Apriori
Mineração de Dados na Web
L. M. R. de Vasconcelos
C. L. de Carvalho
Technical Report - RT-INF_004-04 - Relatório Técnico
November - 2004 - Novembro
The contents of this document are the sole responsibility of the authors.
O conteúdo do presente documento é de única responsabilidade dos autores.
Instituto de Informática
Universidade Federal de Goiás www.inf.ufg.br Aplicação de Regras de Associação para Mineração de Dados na Web
Lívia Maria Rocha de Vasconcelos ∗
Cedric Luiz de Carvalho †
lrocha@inf.ufg.br
cedric@inf.ufg.br
Abstract. This paper discuss the use of Association Rules to get knowledge from Web.
It gives an overview of the Knowledge Discovery in DataBases, specially the data mining step. It is also discussed, superficially, the introduction of semantic in the existing Web and its consequences to the data mining processes.
Keywords: Data Mining, Association Rules, Apriori Algorithm, Web.
Resumo. Este texto trata do uso de Regras de Associação para a obtenção de conhecimento na Web. É dada uma visão geral do processo de Descoberta de Conhecimento, especialmente a fase de Mineração de Dados. Também se discute, superficialmente, a introdução de semântica na Web atual e seus reflexos no processo de mineração de dados.
Palavras-Chave: Mineração de dados, Regras de Associação, Algoritmo Apriori,Web
1 Introdução
A Web é a maior fonte de informação disponível nos dias atuais. Entretanto, grande parte desta informação se encontra escondida no meio da gigantesca massa de dados que é disponibilizada. Neste ambiente, é muito importante que o usuário possa contar com ferramentas que busquem estes dados, de forma inteligente e automática, e os transformem em conhecimento útil. Neste contexto, surge a necessidade de se descobrir correlações, padrões e tendências entre as informações da Web: mineração de dados. A análise sobre essa grande quantidade de dados armazenados pode ser feita usando-se técnicas estatísticas,