Técnicas de mineração
Mineração de Dados é uma área de pesquisa multidisciplinar, incluindo tecnologia de bancos de dados, inteligência articial, aprendizado de máquina, redes neurais, estatística, reconhecimento de padrões, sistemas baseados em conhecimento, recuperação da informação, computação de alto desempenho e visualização de dados. Este curso é baseado em um perspectiva de banco de dados e é focalizado sobretudo sobre as técnicas para realizar uma grande variedade de tarefas de mineração. Apresentamos algoritmos, técnicas de otimização, importantes domínios de aplicação e também alguns aspectos teóricos da área que podem ajudar no desenvolvimento de algoritmos para novas tarefas de mineração.5.1 Introdução
Mineração de Dados é um ramo da computação que teve início nos anos 80, quando os prossionais das empresas e organizações começaram a se preocupar com os grandes volumes de dados informáticos estocados e inutilizados dentro da empresa. Nesta época,
Data Mining consistia essencialmente em extrair informação de gigantescas bases de dados da maneira mais automatizada possível. Atualmente, Data Mining consiste sobretudo na análise dos dados após a extração, buscando-se por exemplo levantar as necessidades reais e hipotéticas de cada cliente para realizar campanhas de marketing. Assim, uma empresa de cartões de crédito, por exemplo, tem uma mina de ouro de informações: ela sabe os hábitos de compra de cada um dos seus seis milhões de clientes. O que costuma consumir, qual o seu padrão de gastos, grau de endividamento, etc. Para a empresa essas informações são extremamente úteis no estabelecimento do limite de crédito para cada cliente, e além disso, contém dados comportamentais de compra de altíssimo valor. Os seguintes pontos são algumas das razões por que o Data Mining vem se tornando necessário para uma boa gestão empresarial: (a) os volumes de dados são muito importantes para um tratamento utilizando somente técnicas clássicas de análise, (b) o