Correlação entre variáveis
Quando estudamos uma única variável o interesse é analisar as medidas de tendência central
(média, mediana, moda). Com duas ou mais variáveis, além destas medidas também estamos interssados em saber se há alguma relação entre as variáveis. A associação entre duas variáveis pode ser:
• correlacional : quando não se tem controle sobre sobre as variáveis estudadas.
• experimental : quando os valores de uma das variáveis são controlados pela atribuição ao acaso. Frequentemente precisamos estudar o relacionamento entre duas variáveis ou mais. Esse estudo pode ser feito de duas formas:
• Correlação: fornece um número que resume o grau de relacionamento linear entre as duas variáveis. • Regressão: fornece uma equação que descreve essa relação.
Independente do tipo de relação entre as variáveis, podemos resumi-la através de uma equação que indica o padrão de associação destas variáveis. Quando não é possível percerber uma relação sistemática entre as variáveis dizemos que as variáveis são não correlacionadas, independentes ou ortogonais.
Indicadores de correlação
Tabelas de Contingência 2x2
Suponha que queremos determinar se o desempenho dos empregados no trabalho está relacionado com a pontuação obtida num teste vocacional. Podemos obter:
• Tanto o desempenho no trabalho quanto no teste estão acima da mediana (++)
• O desempenho no trabalho está acima, mas o do teste está abaixo da mediana (+−)
• Tanto o desempenho no trabalho quanto o no teste estão abaixo da mediana (−−)
• O desempenho no trabalho está abaixo da mediana, mas o teste não (−+)
Estas quatro possibilidades podem ser arrumadas em uma tabela:
Se não há relação entre as variáveis deve-se o mesmo número de empregados em cada uma das células da tabela.
O que se vê na tabela é que parece haver uma forte correlação entre as duas variáveis, pois se tem um grande número de ambas as variáveis acima da mediana e um grande número de ambas as variáveis abaixo