Unidade VI Correlação e Regressão 1. Situando a Temática Correlação e Regressão são duas técnicas estritamente relacionadas que envolvem uma forma de estimação. A diferença entre essas duas técnicas e o tipo de estimação estudados anteriormente é que as técnicas anteriores foram utilizadas para estimar um único parâmetro, enquanto que as técnicas que serão estudadas nesta unidade se referem à estimação de uma relação que possa existir na população. 2. Problematizando a Temática A correlação e regressão permite-nos investigar uma relação entre duas variáveis. O estudo de tal relação pode ser a resposta a perguntas, tais como: “Qual o preço de venda para uma casa com 200m2 ?” ou “Pais mais altos tendem a ter filhos mais altos?” ou, ainda, “De cada unidade adicional de renda quanto, em média, é gasto com despesas adicionais com vestuário?”. A noção de casualidade está implícita nestas questões. Por exemplo, o tamanho de uma casa determina, ou contribui, para a definição do preço de venda, mas não o contrário. Ao estudar a correlação entre variáveis, a determinação da direção da casualidade entre tais variáveis deve ser o primeiro passo ao se analisar dados para o uso dessas técnicas inferenciais, que serão melhor discutidas a seguir. 3. Conhecendo a Temática 3.1. Correlação O objetivo do estudo da correlação é a determinação do grau de relacionamento entre duas variáveis. O termo correlação significa “co-relacionamento”, sinalizando até que ponto os valores de uma variável estão relacionados com os da outra. Caso os pontos das variáveis, representados num plano cartesiano (X, Y) ou gráfico de dispersão, apresentem uma dispersão ao longo de uma reta imaginária, dizemos que os dados apresentam uma correlação linear. Diagrama de Dispersão Uma forma de visualizarmos se duas variáveis (X,Y) apresentam-se correlacionadas é através do diagrama de dispersão, onde os valores das variáveis são representados por pontos, num sistema cartesiano. A figura abaixo representa dois