Estatistica
2 Medidas-Resumo
Vimos, na unidade 1, que o resumo dos dados por meio de tabelas de frequências e gráficos fornece muitas informações sobre o comportamento da variável em estudo. Além destas informações, na descrição, exploração e comparação de
conjuntos de dados, algumas características são de extrema importância: centro, variação, distribuição, outliers. Nesta unidade estudaremos como calcular e interpretar cada uma destas características.
1.1
Medidas de Posição As medidas de posição fornecem um número que representa o valor central de
um conjunto de dados. Há várias maneiras de se determinar o valor central, tais como: média, mediana, moda. Agora, definiremos cada uma destas medidas.
2.1.1 Média
A média aritmética é a soma das observações dividida pelo número total de observações, ou seja, x x1 x 2 ... x n 1 n xi n n i 1
Quando o conjunto de dados já estiver organizado numa tabela de frequência calculamos a média por:
x
1 k xi f i n i 1
A média é representada por x (pronuncia-se “x barra”) se o conjunto de dados é uma amostra da população; se são usados todos os valores da população, então representamos a média por (letra grega minúscula “mi”). As estatísticas são geralmente representadas por letras do alfabeto latino, e os parâmetros populacionais são, em geral, representados por letras gregas.
2
Notação:
Somatório de um conjunto de dados.
xi : variável usada para representar valores individuais do conjunto de dados. n: representa o número de valores em uma amostra. N: representa o número de valores em uma população.
2.1.2 Mediana
A mediana é o valor que ocupa a posição central dos dados ordenados. Se n for ímpar, a mediana será o elemento central (de ordem será a média entre os elementos centrais (de ordem n 1 ). Caso n seja par, a mediana 2
n n e +1). 2 2
2.1.3 Moda
A moda é definida como a observação mais freqüente do conjunto de dados observados.
Observações:
1.