WEKA
Com a crescente evolução na área de tecnologia da informação, os meios de armazenamento de informações têm aumentado consideravelmente a sua capacidade e reduzido o seu custo. Paralelo a este fato, o volume dos dados tem aumentando muito nos últimos anos, o que torna cada vez mais complexa a transformação destas informação em conhecimento útil para as organizações.
Torna-se inviável ao homem efetuar a análise em grande quantidades de dados, sem o auxílio de um processo de tratamento dos dados e uma ferramenta computacional que o ampare nessa difícil tarefa. Com intuito de auxiliar a análise, interpretação e transformação do dado em conhecimento, surgiu uma área de estudos denominada Descoberta de Conhecimento em Bases de Dados (Knowledge Discovery in Database - KDD) (GOLDSCHMIDT, 2005).
De acordo com Goldschmidt (2005), o termo KDD foi formalizado em 1989 em referência ao amplo conceito de procurar conhecimento a partir de bases de dados. O processo de KDD é interativo e composto por etapas sequenciais (FAYYAD, 1996). Complementando o autor, Goldschmidt (2005) acrescenta que é interativo por indicar a necessidade de envolvimento do homem controlando o processo e iterativo por sugerir a possibilidade de repetições total ou parcial do processo buscando conhecimento satisfatório por meio de refinamentos sucessivos.
Dessa forma o processo de KDD sugere uma estrutura cooperativa entre o homem e a máquina. Humanos definem seus objetivos a fim de identificar novos conhecimentos para auxiliar em sua área de atuação e, por sua vez, computadores processam grandes volumes de dados com o intuito de encontrar padrões válidos, visando satisfazer os objetivos traçados anteriormente pelo humano.
2.1 ETAPAS DO PROCESSO DE KDD
Buscando obter conhecimento em uma base de dados em seu estado bruto, uma das principais tarefas é encontrar o entendimento do domínio da aplicação e ter os objetivos finais definidos de forma