Análise de cluster
Professora: Sonoê Pinheiro
Introdução O trabalho visa, a partir de uma análise fatorial, obter fatores que expliquem a variabilidade nos dados referentes ao número de estabelecimentos formais por subsetor da economia dos municípios de São Paulo no ano de 2005. Em seguida, pretende-se dividir os municípios em clusters, usando tanto as variáveis utilizadas na análise fatorial quanto os fatores obtidos, a fim de verificar se existe diferença entre os grupos gerados. Com a redução de dimensões, obtida pela análise espacial, espera-se construir um modelo parcimonioso capaz de predizer o PIB municipal. Uma vez que o PIB municipal é divulgado quinquenalmente, uma forma de predizê-lo torna-se interessante. Os dados a serem utilizados na análise fatorial foram obtidos na RAIS (relatório anual de informação social) do ministério do trabalho e emprego e o PIB municipal foi extraído do BME (banco multidimensional de estatística) do IBGE. Os dados foram padronizados para a realização da análise fatorial. Análise Fatorial Matriz de correlação e variação total explicada Abaixo segue a matriz de correlação das variáveis selecionadas: EXTR MINERAL | 1,000 | ,795 | ,794 | ,792 | ,784 | ,786 | ,791 | ,785 | ,782 | ,786 | ,809 | ,800 | ,803 | ,784 | ,788 | ,779 | ,790 | ,797 | ,801 | ,363 | MIN NAO MET | ,795 | 1,000 | ,869 | ,863 | ,838 | ,859 | ,862 | ,836 | ,835 | ,853 | ,868 | ,853 | ,860 | ,833 | ,835 | ,822 | ,844 | ,845 | ,854 | ,338 | IND METALURG | ,794 | ,869 | 1,000 | ,995 | ,984 | ,995 | ,974 | ,983 | ,979 | ,993 | ,984 | ,978 | ,985 | ,979 | ,979 | ,969 | ,982 | ,981 | ,979 | ,260 | IND MECANICA | ,792 | ,863 | ,995 | 1,000 | ,984 | ,990 | ,974 | ,983 | ,979 | ,990 | ,984 | ,977 | ,983 | ,979 | ,979 | ,970 | ,981 | ,980 | ,978 | ,257 | ELET E COMUN | ,784 | ,838 | ,984 | ,984 | 1,000 | ,983 | ,972 | ,996 | ,983 | ,990 | ,983 | ,984 | ,986 | ,995 | ,993 | ,986 | ,988 |