resumo estatística geral II
Curvas de densidade
Ao analisar o histograma de variáveis quantitativas contínuas, muitas vezes notamos que o padrão geral poderia ser descrito por uma curva suave.
Uma curva de densidade é uma descrição idealizada do padrão global de uma distribuição, a qual suaviza as irregularidades observadas nos dados, esta curva deve:
(I) Estar sempre sobre o eixo horizontal ou acima dele;
(II) Ter área sob curva igual a 1.
A partir de uma curva de densidade podemos obter as proporções de observações que se encontram em determinado intervalo. Isto é feito a partir do cálculo da área sob a curva no intervalo.
Obs.: Na prática é mais fácil trabalhar com curvas de densidades suaves do que com histogramas (os quais são afetados pelo nº de classes escolhido).
Distribuições normais (ou gaussianas)
Dentre as curvas de densidades mais conhecidas, destacam-se as curvas normais (ou gaussianas) estas curvas são simétricas, unimodais e possuem formato de sino. Além disso, descrevem bem inúmeros fenômenos da natureza.
Uma variável x, com média µ e variância σ² é dita ter densidade normal se esta for dada por: f(x)= 1√2𝜋𝜎 exp {(−1/2) ((𝑥−µ)²/𝜎²)}, xЄR, µЄR, 𝛔 > 0
O gráfico desta densidade é dado:
Obs.: No caso dos dados possuírem distribuição normal, teremos µ= µ0= µd, α 3= 0, e α4=3. Se os nossos dados têm distribuição normal com média µ e variância 𝛔², denotaremos:
X~N(µ,𝛔²)
Além disso, temos sempre:
- 68% das observações situadas no intervalo µ±𝛔
- 95% das observações situadas no intervalo µ±2𝛔
- 99,7% das observações situadas no intervalo µ±3𝛔
Distribuição normal padronizada (ou “normal padrão”)
Sabemos que padronizados uma variável quando subtraímos a média e dividimos pelo desviopadrão. Podemos estender este resultado e concluir que se X segue uma distribuição N(µ, 𝛔2), então a variável Z=
terá distribuição N(0,1).
Cálculos com a distribuição normal
Sabemos que a área sob uma curva de densidade pode ser entendida como