conteúdos estatísticos
Componentes
Principais
Análise em Componentes Principais é uma técnica de análise exploratória multivariada que transforma um conjunto de variáveis correlacionadas num conjunto menor de variáveis independentes, combinações lineares das variáveis originais, designadas por componentes principais.
Objectivos do trabalho
Reduzir a dimensionalidade;
Obter novas combinações lineares de variáveis; Detectar possíveis candidatos a outliers;
Confirmar algumas suposições anteriores;
Componentes Principais
Pretendemos
determinar o vector componentes principais, C1,..,Cp, tal que
das
, com aij constantes sujeitas à restrição de normalidade. Aplicando o método dos Multiplicadores de
Lagrange, chegamos à conclusão que:
, onde é o maior valor próprio da matriz de covariâncias. Importância de cada componente:
É a percentagem da variação total nos dados que é explicada pela componente k.
Regras de Paragem
Teste SCREE
Este teste permite encontrar a posição, onde os valores próprios da matriz de covariâncias começam a estabilizar.
Teste
Kaiser
Próprios)
(Média
dos
Valores
Este modelo pretende, usando a matriz de correlações, excluir as componentes com valores próprios inferiores a 1, utilizando apenas as restantes componentes.
Fases da Análise em
Componentes Principais
1ª Fase: Escolher as variáveis a ser estudadas;
2ª Fase: Calcular a Matriz de Covariâncias/Correlações e observar os grupos de variáveis com altos índices de correlações;
3ª Fase: Calcular as Componentes Principais;
4ª Fase: Calcular as percentagens de cada componente na explicação da variabilidade total dos dados; 5ª Fase: Interpretar essas percentagens e as componentes e retirar as respectivas conclusões.
NO NOSSO CASO…
Admitamos que :
X1 – Altura; X2 – Peso; X3 – Pão; X4 – Carne;
X5 – Leite; X6 – Laranja; X7 – Banana; X8 – Alface;
X9 – Tomate; X10 - Resma de Papel; X11 – Lápis; X12 –