Diferen as entre Id3 e J48
451 palavras
2 páginas
1- Diferenças entre Id3 e J48:As árvores de decisão geradas pelo algoritmo Id3 (Iterative Dichotomizer 3) são baseadas em que o algoritmo tende a gerar árvores menores a partir das instâncias de treinamento, utilizando a heurística da entropia.
O algoritmo segue os seguintes passos:
Primeiro ele calcula a entropia de cada atributo a partir dos dados;
Segundo ele busca o atributo que tenha menor entropia;
Após isso ele gera um nó com o atributo selecionado no passo dois, e então executa recursivamente o algoritmo para expandir os filhos do nó gerado.
Já as árvores de decisão geradas pelo algoritmo J48 são bem parecidas com as geradas com o algoritmo ID3, com algumas diferenças no que diz respeito à função de avaliação dos atributos, bem como da escolha de alguns nós.
A função de avaliação utilizada para escolher qual atributo determinará a ramificação em um nó, é utilizada a função de Ganho de Informação ao invés da entropia.
No que diz respeito a definição ramos, o algoritmo J48 é dotado de mecanismos para remover da árvore segmentos que possuem baixo Ganho de Informação, ou seja, os que não estiverem cooperando ao modelo a ter sucesso. Além disto, o algoritmo J48 ainda tem a vantagem (com relação ao Id3) de não necessitar de dados precisos.
2- Diferenças entre Apriori e FP-growth:
A estratégia do Algoritmo Apriori é inicialmente identificar os conjuntos de itemsets
Frequentes (cujo suporte seja maior ou igual ao suporte mínimo definido) e, em seguida, construir regras de associação a partir desses conjuntos, nos quais possuam confiança maior ou igual a definido como mínimo também. A ideia inovadora desse algoritmo está na criação dos itemsets candidatos usando a propriedade de conjuntos que garante que, se um conjunto de itens não for frequente, então todos os seus superconjuntos também não são frequentes. Com isso, o algoritmo ganha em desempenho, já que não perde tempo analisando esses superconjuntos.
O algoritmo FP-growth adota uma estratégia