Mineração de Regras de Associação Em Uma Base de Dados Real
I. INTRODUÇÃO
Este trabalho tem como objetivo extrair regras de associações a partir de uma base de dados real de compras realizadas em um supermercado durante um 30 dias. A divisão desse texto ocorrerá da seguinte maneira: A Seção 2 tratará da ferramenta utiliza e as transformações (Pré- processamento) realizadas para utilizar a base de dados fornecida. A Seção 3 comenta o algoritmo utilizado para a extração de regras de associação e os parâmetros utilizados. A Seção 4 discute sobre as regras de associação geradas de acordo com os parâmetros usados na Seção 3. Seção 5 é a conclusão. No apêndice A encontram-se as regras geradas pelo algoritmo Apriori executado no Weka.
II. FERRAMENTA E PRÉ-PROCESSAMENTO
A ferramenta utilizada neste trabalho é o Weka versão 3.6.4. Essa ferramenta trabalha com arquivos de vários formatos, mas utiliza como padrão o formato ARFF.
Um arquivo no formato ARFF é um arquivo de texto composto por três seções:
Relação, a primeira linha do arquivo, que deve ser igual a @relation seguida de uma palavra chave que identifique a relação ou tarefa sendo estudada.
Atributos, um conjunto de linhas onde cada uma inicia com @attribute seguida do nome do atributo e seguida do seu tipo, que pode ser nominal ou numérico.
Dados, depois de uma linha contendo @data. Cada linha deve corresponder a uma instância e deve ter valores separados por vírgula correspondentes (e na mesma ordem) dos atributos da seção Atributos.
Abaixo temos um exemplo de um arquivo ARFF.
@relation compras
@attribute tempo {sol, nublado}
@attribute umidade {baixa, alta}
@attribute jogar {sim, não}
@data sol, baixa, não sol, alta, sim nublado, baixa, sim nublado alta, sim
A base de dados usada nesse trabalho foi fornecida em formato de texto puro onde cada linha representa uma compra com seus respectivos produtos, separados por espaço. Para facilitar a manipulação e