18905469147
300 palavras
2 páginas
HistogramaUm histograma é uma representação gráfica da função de probabilidades ou da função de densidade de probabilidades de um conjunto de dados independentes. Normalmente o histograma é um gráfico de barras verticais. A palavra histograma é de origem grega, derivada de duas: histos que pode significar testemunha no sentido de 'aquilo que se vê', como as barras verticais do histograma, e da também palavra grega gramma que significa desenhar, registrar ou escrever.
O histograma é um gráfico composto por retângulos justapostos em que a base de cada um deles corresponde ao intervalo de classe e a sua altura à respectiva freqüência. A construção de histogramas tem caráter preliminar em qualquer estudo e é um importante indicador da distribuição de dados. Pode indicar se uma distribuição aproximase de uma densidade normal, como pode indicar mistura de densidade quando os dados apresentam várias modas.
Definimos matematicamente o histograma como uma função mi que conta o número de observações que pertencem a vários intervalos disjuntos, entanto que o gráfico do histograma ou simplesmente histograma é uma mera representação desta função. Assim, se chamamos por n o total de k observações e por k o número de intervalos disjuntos, o histograma satisfaz que n=∑ i=1 mi .
Uma questão importante é determinar de maneira automatizada o número de intervalos disjuntos que serão utilizados para a construção do gráfico. Uma maneira é calcular k=máximo x−minimo x/h , onde h é comprimento de cada intervalo. Outras formas de escolher o número de intervalos 'epela fórmula de Sturges k=log 2 n1 (padrão no R) , a fórmula de Scott h=3.5s/n1/ 3 , onde s é
1 /3 o desvio padrão e a fórmula de FreedmanDiaconis h=2 IQR x/n
, onde IRQ é a diferença
entre o terceiro e o primeiro quantil.