Mineração de dados de empresas juniores
Esdras Degaspari Leite (4510650) Jairo Toshio Tuboi (6427150) Leonardo Barbosa Alves (5889522) Murilo Giacometti Rocha (6427125) Rafael Regis do Prado (6427132) Renato Coneglian (6427212) Renato Mascarenhas Costa (6427341)
1
1.1
Introdu¸˜o ca
Aprendizado de M´quina e Minera¸˜o de Dados a ca
O Aprendizado de M´quina (AM) vem ganhando importˆncia nos ultimos anos. Com o avan¸o das a a ´ c pesquisas nesse ramo de Inteligˆncia artificial, percebemos a importˆncia e o valor que o AM agrega e a aos sistemas e projetos de computa¸˜o. E uma sub-´rea de Inteligˆncia artificial, ligada principalmente ca ´ a e ao desenvolvimento de novas t´cnicas e algoritmos que possibilitam ao computador aprender das mais e diversas formas: otimizando um processo, criando um modelo que descreva um conjunto de dados, detectar padr˜es, entre outras. o E quando falamos de Aprendizado de M´quina, n˜o podemos deixar de citar a Minera¸˜o de Dados. a a ca Ambas est˜o intimamente relacionadas entre si. A Minera¸˜o de Dados ´ o processo de explorar a ca e grandes quantidades de dados ` procura de padr˜es relevantes, utilizando regras de associa¸˜o ou a o ca sequˆncias temporais, para detectar relacionamentos sistem´ticos entre vari´veis, detectando assim e a a novos subconjuntos de dados. Esse trabalho, dessa forma, utiliza as t´cnicas de AM para minerar os dados, explorando poss´ e ıveis ´ rela¸˜es entre as caracter´ co ısticas do nosso conjunto de dados. S˜o usadas principalmente Arvores de a Decis˜o, regras de associa¸˜o e agrupamento, que descrevem de forma intuitiva o conhecimento obtido, a ca em detrimento de t´cnicas com Redes Neurais, que funcionam como uma ”caixa-preta”. e
1.2
Weka
O Weka ´ uma ferramenta que agrega algoritmos de diferentes paradigmas em Inteligˆncia Are e tificial dedicada ao estudo do Aprendizado de M´quina. O software possui mecanismos para pr´a e processamentos de dados, classifica¸˜o,