Quimiometria
4. ANÁLISE DE AGRUPAMENTOS
4.1. Introdução
Análise de agrupamentos (cluster analysis) é um termo usado para descrever diversas técnicas numéricas cujo propósito fundamental é classificar os valores de uma matriz de dados sob estudo em grupos discretos. A técnica classificatória multivariada da análise de agrupamentos pode ser utilizada quando se
deseja explorar as similaridades entre indivíduos (modo Q) ou entre
variáveis (modo R) definindo-os em grupos, considerando simultaneamente, no primeiro caso, todas as variáveis medidas em cada indivíduo e, no segundo, todos os indivíduos nos quais foram feitas as mesmas mensurações. Segundo esse método, desenvolvido, inicialmente em Zoologia por taxonomistas numéricos, procura-se por agrupamentos homogêneos de itens representados por pontos num espaço n-dimensional em um número conveniente de grupos relacionando-os através de coeficientes de similaridades ou de correspondências.
A aplicação desta análise é controversa entre os pesquisadores, pois pouco se sabe a respeito dos pressupostos estatísticos dos seu vários métodos e apenas testes limitados são conhecidos para verificar a significância dos resultados. Na análise introdutória de matrizes de dados tornam-se, porem, bastante eficientes para auxiliar na formulação de hipóteses a respeito da homogeneidade ou não desses dados.
4.2. Métodos de classificação
Segundo Davis (1986) os diversos métodos para a análise de agrupamentos podem ser enquadrados em quatro tipos gerais:
a) Métodos de partição: procuram classificar regiões no espaço, definido em função de variáveis, que sejam densamente ocupados em termos de observações daqueles com ocupação mais esparsa.
b) Métodos com origem arbitrária: procuram classificar as observações segundo “k” conjuntos previamente definidos; neste caso “k” pontos arbitrários servirão como centróides iniciais e as observações irão se agrupando, por similaridade, em torno desses