Predicao
Introdução
Este estudo analisa a tendência de preços de imóveis em relação a variáveis de tamanho da área do imóvel em metros quadrados, quantidades de (dormitórios, suítes, banheiros), atualização, descrição e bairro. O objetivo deste estudo é fazer uma análise preditiva e verificar tendências ou fatores que levam o preço de um imóvel valorizar, para que a partir dos resultados obtidos possam ser feitas tomadas de decisão.
Método
1 - Captura de dados
Para a captura dos dados usamos o website “www.kimonolabs.com” que utiliza um extrator inteligente que reconhece padrões em conteúdo web permitindo que se obtenha os dados rapidamente. Para utilização deste site, precisamos criar uma conta e então garimpamos os dados no site de busca de imóveis “www.123i.com.br” com a ferramenta do site Kimonolabs. Os dados capturados são relacionados a imóveis e usamos as seguintes variáveis: preço, área, dormitórios, vagas, suítes, banheiros, descrição, atualização e bairro. Assim dessa forma, podemos relacionar os dados da variável preço aos dados das outras variáveis. Após a extração dos dados criamos a API (em formato JSON, CSV ou RSS) para que seja feita a devida análise dos mesmos.
2 – Análise Exploratória
Para fazermos a Análise Exploratória dos conjuntos de dados fizemos uma extração de medidas da área de estatística denominada estatística descritiva. Com uso da linguagem de programação R, que permiti cálculos estatísticos e criação de gráficos, através da IDE RStudio analisamos os dados advindos da API criada no Kimonolabs.
Iniciamos a análise exploratória relacionando cada atributo com a classe preço para podermos verificar se há alguma relação. Para isso usamos o método de regressão linear simples que tenta identificar se existe uma relação entre a variável dependente (valor que precisa ser predito) e variável independente. Primeiro relacionamos preço com a área do