Analise Discriminante
Enquadramento
A análise discriminante (AD) é usada para investigar diferenças entre grupos com base nos atributos de cada membro, no sentido de identificar as características que distinguem os membros de um grupo dos de outro de modo a que, conhecidas as características dos novos membros, seja possível prever a que grupo pertencem bem como testar se os membros já classificados o foram corretamente.
A AD pode ser entendida de modo análogo à regressão múltipla. Admitindo a existência de dois grupos (codificados em grupo 1 e 2) e um conjunto de variáveis caracterizadoras das observações que compõem estes grupos, então pode utilizar-se a variável grupo como variável dependente numa análise de regressão múltipla. A AD consiste na obtenção de uma, ou mais, combinações lineares das variáveis independentes utilizadas e em que cada combinação linear do tipo:
"Y" _"i" "=a+" "b" _"1" "X" _"1" "+" "b" _"2" "X" _"2" "+" "b" _"1" "X" _"1" "…++" "b" _"m" "X" _"m" " " (1)
constitui uma função discriminante (FD) linear em que a é uma constante, b1 a bm coeficientes de ponderação e x1 a xm as variáveis discriminantes. A variável dependente desta função (Yi) é denominada de score discriminante (SD).
Os coeficientes de ponderação b1 a bm podem ser interpretados de modo idêntico aos coeficientes de um modelo de regressão múltipla. Pode então considerar-se que, quanto maior o valor dos coeficientes estandardizados, maior a contribuição da variável para a FD, ou seja, maior a importância da variável para a diferençiação entre grupos.
Quando existem mais do que dois grupos podes estimar-se mais de uma FD. O número de FD é sempre igual a K-1. As funções assim obtidas são independentes não se registando sobreposição da sua contribuição para a discriminação entre os grupos.
Em