Regressão e Correlação
A regressão e a correlação são duas técnicas estreitamente relacionadas que envolvem uma forma de estimação. Mais especificamente, a análise de correlação e regressão compreende a análise de dados amostrais para saber se, e como, duas ou mais variáveis estão relacionadas uma com a outra.
A correlação mede o grau, ou força, de relacionamento de duas variáveis.
A regressão dá uma equação que descreve o relacionamento em termos matemáticos.
Diagrama de Dispersão
Primeiramente precisamos visualizar através de um gráfico se as variáveis em questão demonstram algum tipo de relacionamento. Construímos então o Diagrama de dispersão.
É simplesmente uma representação de pontos de dados em um gráfico xy. O eixo y é utilizado para representar a variável dependente que interessa a quem toma as decisões, enquanto o eixo x é para representar uma variável que pode ser controlada ou medida por quem toma a decisão.
Exemplo 1: A tabela abaixo nos fornece o valor investido em propaganda (em R$) e valores de venda (em R$) numa semana, que imagino estarem relacionadas de alguma forma. Neste caso a variável independente é valor em propaganda, pois, as vendas dependem das propagandas realizadas.
Propaganda (em R$)
Vendas
(em R$)
5
80
6
70
9
80
10
90
12
95
14
140
16
140
22
230
28
250
32
280
O diagrama nos sugere que pode existir uma relação entre as vendas e os custos de propaganda. Em particular ele sugere que, quanto mais dinheiro for gasto em propaganda, maior será o valor das vendas (propaganda é a variável independente e a venda é a variável dependente). O padrão dos pontos forma aproximadamente uma linha reta, sugerindo que é possível que exista uma associação linear entre as duas variáveis.
Coeficiente de Correlação Linear de Pearson
Nosso próximo passo será medir a força desse relacionamento entre as variáveis através do coeficiente de correlação de Pearson. Esse coeficiente resulta sempre em um