Análise de clusters e testes de hipótese paramétricos e não paramétricos
Análise de Clusters
A análise de Clusters é uma técnica estatística que pretende agrupar elementos de dados baseando-se na similaridade entre eles. Essa informação é organizada em grupos (Clusters) homogéneos dentro dos grupos e heterogéneos entre eles, ou seja, pretende-se que os elementos do mesmo grupo sejam o mais semelhante possível e que se distingam ao máximo dos elementos dos outros grupos. O objetivo desta técnica é facilitar a análise de todas as combinações de grupos possíveis num grande volume de dados. Este método é exploratório e permite apenas gerar hipóteses que, posteriormente, serão validas ou não através de testes estatísticos.
Assim, foi selecionada uma subamostra de factores? a serem agrupados, no caso de estudo – como é que fizemos?.
Método Hierárquico
Para a realização da análise de Clusters considerámos o método hierárquico o mais indicado. O Método Hierárquico compreende a construção de matrizes que permitem a observação das semelhanças e diferenças entre cada dois elementos. O seu objectivo é conseguir obter uma hierarquia. O número de Clusters é conseguido através da observação dos dendogramas – “outputs”. Os dendogramas podem ser gerados a partir dos seguintes critérios pra agregar e desagregar os fatores? : o critério do Centróide ou Centroid Method; o critério do Vizinho mais próximo ou Single-Linkage Method; o critério do Vizinho mais afastado ou Complete-Linkage Method; o critério da Média dos grupos ou Average-Linkage Method e o critério de Ward ou Ward’s Method.
Para esta etapa, foram gerados e analisados cerca de 40 dendogramas, utilizando todos os métodos anteriormente referidos. Porém, apenas 10 foram selecionados por melhor representarem a realidade que pretendemos estudar. Esses dendogramas selecionados foram, por coincidência, todos gerados através do critério de Ward. Ao analisar os dendogramas deve-se determinar uma distância de corte para definir quais serão os grupos formados. Essa decisão é subjetiva e