Medidas de dispersão
Introdução Amplitude Variância Desvio Padrão Coeficiente de Variação
Introdução
• Estudo de medidas que mostram a dispersão dos dados em torno da tendência central • Analisaremos as seguintes medidas:
– Amplitude – Variância – Desvio Padrão – Coeficiente de Variação
Introdução
• Por que estudar?
– Entender grandes volumes de informação (pesquisas de mercado, índices populacionais, acessos a sites) – Qualidade de processos (CEP – Controle Estatístico de Processos) – Previsões confiáveis (projeções financeiras e populacionais, vida útil de equipamentos) – Planejamento (coleta de dados, definição de amostras, planos de contingência)
Amplitude
• É a diferença entre a maior e a menor observação em um conjunto de dados
A = X maior − X menor
• Mede a dispersão total no conjunto de dados • É uma medida simples que não leva em consideração como os dados são efetivamente distribuídos entre os valores extremos
Amplitude
• Exemplo: Dada a amostra abaixo, calcule a amplitude.
Custo de produção
(em milhões) 2 3 3,5 3,7 5 12
A = 12 − 2 = 10
OBS: A amplitude calculada não nos fornece qualquer informação sobre a tendência central e distribuição das observações
Variância
• A variância da amostra é a média aproximada das diferenças ao quadrado entre cada uma das observações e a média aritmética da amostra
( X 1 − X ) 2 + ( X 2 − X ) 2 + ( X 3 − X ) 2 + .... + ( X n − X ) 2 S2 = n− 1 onde: n é o tamanho da amostra
OBS: O tamanho da amostra é subtraído de 1 devido ao fator de
correção de Bessel, que visa uma estimativa mais precisa. No cálculo de variância para toda a população, este corretor é dispensado.
Variância
• A fórmula da variância de uma amostra pode ser escrita de forma resumida n S2 =
∑
i= 1
( X i − X )2 n− 1
Resumindo: A variância é a soma das diferenças ao quadrado em torno da média aritmética dividida pelo tamanho da amostra menos um
Variância
• A variância também pode ser