Correlação e Regressão
A análise de correlação e regressão verifica como duas ou mais variáveis estão relacionadas uma com a outra numa dada população. A análise de Correlação dá um número que resume o grau de relacionamento entre duas variáveis. A análise de Regressão dá uma equação matemática que descreve essa relação. Essa equação pode ser usada para predizer os valores futuros de uma variável quando a correlação é forte.
Correlação mede a FORÇA ou o GRAU de relacionamento entre duas variáveis. A regressão é uma equação que descreve esse relacionamento em linguagem matemática.
A regressão linear é o estabelecimento de uma reta que represente a correlação entre duas variáveis. É, portanto, uma média.
Deve ser usada quando uma variável influencia a outra e isso pode ser medido, e quando conhecendo uma delas, queremos conhecer a outra.
Exemplo: Explicar o aumento da criminalidade pelo aumento dos níveis de desemprego, o crescimento na estatura de pessoas pelo incremento de proteínas disponibilizadas a essa população, etc.
Equação Linear Y = a + bx
Três utilidades principais:
1 – Quando se deseja utilizar uma variável mais simples e estimar os valores da outra. Desde que as duas variáveis meçam aproximadamente a mesma coisa (e isso possa ser medido) e uma delas é dispendiosa, destrutiva ou difícil de lidar
Exemplo: Se o teste de resistência destrói o metal e o teste de dureza não o destrói, a resistência e a dureza podem estar relacionadas, e isso pode ser medido, será preferível estimar a resistência a partir dos testes de dureza.
2 – Quando se deseja explicar os valores de uma variável em função da outra. Naturalmente isso só é possível quando há um forte grau de correlação, isto é, quando uma das variáveis explica fortemente os valores assumidos pela outra.
Exemplo: A quantidade de fertilizante utilizada numa fazenda pode explicar o incremento da produção de grãos.
3 – Quando se quer predizer valores