Análise de regressão
REGRESSÃO
1. Introdução
2. A regressão linear
3. Método dos mínimos quadrados
4. Inferência em análise de regressão
5. O coeficiente de determinação (r2)
6. Intervalos de confiança
7. Observações discrepantes
8. Conclusão
1. INTRODUÇÃO
O objetivo principal da análise de regressão é predizer o valor de uma variável (a variável dependente), desde que seja conhecido o valor de uma variável associada (a variável independente). A equação de regressão é a fórmula algébrica para determinação do valor previsto da variável dependente.
Mais especificamente, a análise de regressão compreende o exame de dados amostrais para saber se e como duas ou mais variáveis estão relacionadas uma com a outra numa população, propiciando, como resultado, uma equação matemática que descreva o relacionamento. Tal equação pode ser usada para estimar ou predizer valores futuros de uma variável quando se conhecem ou se supõem conhecidos os valores da outra variável.
Os dados para a análise de regressão resultam de observações de variáveis emparelhadas. Para um problema de duas variáveis, cada observação origina dois valores, um para cada variável. Por exemplo, um estudo que envolva características do mercado específico (de carros usados) poderia focalizar níveis de quilometragem e preços de carros.
2. REGRESSÃO LINEAR
A regressão linear simples constitui uma tentativa de estabelecer uma equação matemática linear (linha reta) que descreva o relacionamento entre duas variáveis e que seja fácil de lidar e de interpretar.
2.1 Equação Linear
Duas importantes características da equação linear são o coeficiente angular da reta e a cota da reta em determinado ponto. Uma equação linear tem a forma: y = a + bx em que a e b são valores que se determinam com base nos valores amostrais; a é a cota da reta em x=0, e b é o coeficiente angular. A variável y é aquela a ser predita, e x é o valor preditor.
A Fig.1 ilustra a relação entre o gráfico de uma