Decision Trees
Centro de Ciências Computacionais C3
Engenharia de Computação EC17
Relatório Árvores de
Decisão
Diones Fischer 48737
Janeiro, 2014
1. Introdução
As árvores de decisão, também conhecidas como árvores de regressão ou árvores de classificação, são um modelo preditivo, e uma ferramenta para a tomada de decisões. A principal vantagem das árvores de decisão é que elas são simples, podem ser montadas com poucos dados e são facilmente interpretadas.
Neste contexto, o trabalho desenvolvido visa montar uma árvore de decisão sobre um conjunto de dados do repositório UCI utilizando a ferramenta Weka, que é uma coleção de algoritmos de
Machine Learning, e então explicar como a árvore foi montada e interpretar os resultados.
2. Descrição dos Dados
O Conjunto de Dados do repositório da UCI escolhido para a elaboração da Árvore de Decisão foi o Balloons. O conjunto de dados possui 5 atributos:
● Cor: Amarelo ou Roxo
● Tamanho: Grande ou Pequeno
● Ação: Esticar ou Mergulhar
● Idade: Criança ou Adulto
● Inflado: Verdadeiro ou Falso
Logo, a árvore de decisão montada irá dizer dado as entradas de cor, tamanho, ação e idade; se o balão é inflado ou não. O conjunto escolhido possui apenas 16 entradas, e por isso mesmo foi escolhido, para demonstrar que é possível montar uma árvore de decisões com poucas entradas e com uma boa taxa de acertos.
A conjunto de dados de teste é o seguinte:
YELLOW,SMALL,STRETCH,ADULT,T
YELLOW,SMALL,STRETCH,CHILD,T
YELLOW,SMALL,DIP,ADULT,T
YELLOW,SMALL,DIP,CHILD,T
YELLOW,LARGE,STRETCH,ADULT,T
YELLOW,LARGE,STRETCH,CHILD,F
YELLOW,LARGE,DIP,ADULT,F
YELLOW,LARGE,DIP,CHILD,F
PURPLE,SMALL,STRETCH,ADULT,T
PURPLE,SMALL,STRETCH,CHILD,F
PURPLE,SMALL,DIP,ADULT,F
PURPLE,SMALL,DIP,CHILD,F
PURPLE,LARGE,STRETCH,ADULT,T
PURPLE,LARGE,STRETCH,CHILD,F
PURPLE,LARGE,DIP,ADULT,F
PURPLE,LARGE,DIP,CHILD,F
Para que fosse possível utilizar o conjunto de