Análise Exploratória de Dados
A Análise Exploratória de Dados (AED) foi lançada por John Wild Tukey em
1977 no livro Exploratory Data Analysis e emprega uma grande quantidade de técnicas gráficas e descritivas, tais como gráficos de barras, gráficos de setores (popularmente conhecido como gráfico de pizza), cálculos de medidas de tendência central (média, moda e mediana) e cálculo de medidas de variabilidade (variância, desvio padrão e coeficiente de variação). Todas essas técnicas, aplicadas em conjunto, objetivam descrever os dados de modo a obter informações úteis sobre suas características.
2 Definições Importantes
A seguir são apresentadas algumas definições consideradas importantes para o entendimento das técnicas e métodos que serão apresentadas neste texto:
2.1 População
Uma população ou universo, no sentido amplo, é um conjunto de elementos que possui pelo menos uma característica em comum. Essa característica permite determinar inequivocamente, se o elemento pertence ou não a população analisada.
Exemplo 1: Suponha que desejamos obter informações sobre o nível de escolaridade, renda, estado civil e número de filhos dos funcionários de uma determinada empresa do setor petroquímico. Concluímos, portanto, que a população que será analisada será constituída por todos os funcionários que trabalham naquela determinada empresa.
2.2 Amostra
Em grande parte das situações não é possível, ou até mesmo é impossível, realizar o levantamento de todos os elementos da população. Neste tipo de situação, devemos limitar as nossas observações a apenas uma parte da população, ou seja, obtemos uma amostra da população original.
Exemplo 2: Nas pesquisas eleitorais, as previsões sobre as intenções de votos são obtidas a partir de uma pequena parcela (amostra) da população formada pelos eleitores. É importante alertarmos, que sempre é mais adequado utilizarmos amostras representativas da população, para com isso, podermos fazer previsões mais realísticas e