Estatistica e Probabilidade
Em muitas pesquisas estatísticas, o objetivo principal é estabelecer relações que possibilitem predizer uma ou mais variáveis em termos de outras. Assim é que se fazem estudos para predizer as vendas futuras de um produto em função do seu preço, ou a perda de peso de uma pessoa em decorrência do número de semanas que se submete a uma dieta de 800 calorias--dia, ou a despesa de uma família com médico e remédios em função de sua renda, ou o consumo per capita de certos alimentos em função de seu valor nutritivo e do gasto com propaganda na TV, etc.
Naturalmente, o ideal seria que pudéssemos predizer uma quantidade exatamente em termos de outra, mas isso raramente é possível. Na maioria dos casos, devemos contentar-nos com a predição de médias, ou valores esperados. Por exemplo, não podemos predizer exatamente quanto ganhará um bacharel nos 10 anos subseqüentes à sua formatura, mas, com base em dados adequados, é possível predizermos o ganho médio de todos os bacharéis nos 10 anos após a formatura. Analogamente, podemos predizer a safra média de certa variedade de trigo em termos do índice pluviométrico de julho, e a nota média de um calouro do curso de Direito em função do seu QI.
Assim, quando consideramos variáveis como peso e altura de um grupo de pessoas, uso de cigarro e incidência de câncer, procuramos verificar se existe alguma relação entre as variáveis de cada um dos pares e qual o grau dessa relação. Para isso, é necessário o conhecimento de novas medidas.
A regressão e a correlação são duas técnicas estreitamente relacionadas que envolvem uma forma de estimação. A análise de correlação dá um número que resume o grau de relacionamento entre duas variáveis; a análise de regressão tem como resultado uma equação matemática que descreve o relacionamento.
REGRESSÃO LINEAR
A regressão linear simples constitui uma tentativa de estabelecer uma equação matemática linear (linha reta) que descreva o relacionamento entre duas variáveis.
A