Histograma
Quando o volume de dados aumenta indefinidamente dentro do conjunto e o intervalo de classes tende a zero (o que torna os retângulos cada vez mais "finos" e "altos"), a distribuição de frequência passa para uma distribuição de densidade de probabilidades.
A construção de histogramas tem caráter preliminar em qualquer estudo e é um importante indicador da distribuição de dados. Eles podem indicar se uma distribuição se aproxima de uma função normal, assim como também pode indicar a mistura de populações, quando se apresentam bimodais.
A construção de um histograma envolve as seguintes etapas:
Organizar os dados em ordem crescente.
Definir os intervalos e o número de classes.
Construir o gráfico.
Como definir o intervalo e o número de classes para um dado conjunto de dados? Não há fórmula matemática exata, mas uma sistemática consiste em determinar:
κ = número de classes
Δi = intervalo
Vmax = valor máximo
Vmín = valor mínimo n = número de dados
Dentro dessa sistemática, é essencial que κ . Δi ≥ Vmax - Vmin, de modo que todos os dados do intervalo sejam abrangidos. Um Δi muito pequeno pode incluir variações muito pequenas de valores ou ruído e um Δi muito grande pode eliminar variações importantes dos dados.3
Para n < 200, pode-se aplicar com segurança a fórmula proposta por Sturges:4
κ é o menor inteiro tal que κ > 1 + 3,32 * log(n)
Neste exemplo:
n = 18 e κ = 6 é uma boa escolha.
Δi ≥ (Vmax-Vmin)/κ. Como Δi ≥ (67-44)/6 , Δi