Análise de regressão e correlação
Quando se consideram observações de 2 ou mais variáveis surge um ponto novo: “O estudo das relações porventura existentes entre as variáveis.”
A análise de regressão e correlação compreendem a análise de dados amostrais para saber se e como um certo conjunto de variáveis está relacionado com outra variável.
Análise de regressão: estuda o relacionamento entre uma variável chamada a variável dependente e outras variáveis chamadas variáveis independentes. Este relacionamento é representado por um modelo matemático , isto é, por uma equação que associa a variável dependente com as variáveis independentes. Este modelo é designado por modelo de regressão linear simples se define uma relação linear entre a variável dependente e uma variável independente. Se em vez de uma, forem incorporadas várias variáveis independentes, o modelo passa a denominar-se modelo de regressão linear múltipla.
1
Análise de correlação: dedica-se a inferências estatísticas das medidas de associação linear que se seguem: • coeficiente de correlação simples: mede a “força” ou “grau” de relacionamento linear entre 2 variáveis. • coeficiente de correlação múltiplo: mede a “força” ou “grau” de relacionamento linear entre uma variável e um conjunto de outras variáveis.
As técnicas de análise de correlação e regressão estão intimamente ligadas.
2
REGRESSÃO LINEAR SIMPLES Vamos considerar a situação em que duas variáveis estão ligadas por um relacionamento linear. A relação entre elas pode ser descrita matematicamente através do seguinte modelo:
Y = β 0 + β1 X + E
sendo, • X a variável explicativa ou independente medida sem erro (não aleatória); • E a variável aleatória residual na qual se procuram incluir todas as influências no comportamento da variável Y que não podem ser explicadas linearmente pelo comportamento da variável X; • β 0 e β1 parâmetros desconhecidos do modelo (a estimar). • Y a variável explicada ou dependente (aleatória);