Gestão da Informação
Trabalho Prático Final Curso: Análise e Desenvolvimento de Sistemas Disciplina: Gestão da Informação Professor: João Paulo B. Nascimento
Aluno:Sergio Agostinho Da Silva
Belo Horizonte - Julho 2014
Índice
TOC \o "1-3" \h \z \u 1Introdução PAGEREF _Toc225951325 \h 32Métodos PAGEREF _Toc225951326 \h 53Resultados PAGEREF _Toc225951327 \h 63.1J486
3.1.1Informações sobre o algoritmo6
3.1.2Cross Validation6
3.1.3Percentage Split7
3.1.4Análise do modelo8
3.2Naive Bayes8
3.2.1Informações sobre o algoritmo8
3.2.2Cross Validation8
3.2.3Percentage Split9
3.2.4Análise do modelo PAGEREF _Toc225951342 \h 10
4Discussão PAGEREF _Toc225951343 \h 10
5Bibliografia PAGEREF _Toc225951344 \h 11
IntroduçãoEste trabalho consisti na execução de algoritmos de mineração de dados sob bases de dados fictícias utilizando o software livre Weka. Foi proposto trabalho com o objectivo de conhecer ferramentas e métodos de análise e processamento de dados, conhecer principais técnicas de mineração de dados e aprendizagem de máquina e desenvolver capacidade de análise de dados e alteração de parâmetros. A base de dados utilizada "SINISTRO" representa dados fictícios referentes aos acidentes automobilísticos.
Aplicar a tarefa CLASSIFICAÇÃO, através dos seguintes atributos:
SEXO; Representa o sexo do condutor. As únicas duas possibilidades são masculino e feminino.
IDADE; Representa a idade do condutor. Os dados desse atributo já estão classificados em menor ou igual a 25 anos e maior de 25 anos.
CASADO; Diz respeito ao estado civil do condutor. Apenas os valores sim ou não são permitidos.
CARTEIRA PROVISÓRIA; Informa se o condutor está habilitado por menos de um ano. Apenas os valores sim ou não são permitidos.
ACIDENTE; É o atributo