estatistica discritiva
ESTATÍSTICA DESCRITIVA
Amostras com dados agrupados em classes
Nas próximas secções iremos abordar a análise estatística de uma amostra em que os dados numéricos estão agrupados em classes, ou seja, em intervalos.
Este agrupamento em classes pode dever-se a diversos motivos:
•
fonte de informação: os dados podem ter sido obtidos em fontes em que os dados já estão no formato de classes, e não se dispõe dos dados individualizados para todos os elementos da amostra. É o que acontece frequentemente em dados recolhidos de publicações de diversas Instituições (por exemplo, Anuários do
Instituto Nacional de Estatística);
•
no processo de recolha de informação, os dados foram recolhidos em classes, e não individualizados. Imaginemos, por exemplo, a recolha de diâmetros de árvores num povoamento florestal, em que se registaram o número de árvores cujos diâmetros se encontram nos intervalos ]15 , 20], ]20 , 25], ]25, 30], etc, em vez de se registarem os diâmetros individualmente;
•
a dimensão da amostra é demasiado grande, agrupando-se os dados em classes, a fim de facilitar a análise (esta vantagem actualmente é insignificante, face aos meios de cálculo disponíveis).
Muitas das variáveis numéricas são de natureza contínua, em que o processo de quantificação do valor dessa variável pressupõe de algum modo a discretização da variável. Imaginemos, por exemplo, a recolha de pesos de uma amostra de borregos; a característica “peso” é tipicamente de natureza contínua; porém, ao pesar cada um dos borregos, o operador faz um registo que corresponde a um valor aproximado do peso desse borrego, e não do seu peso exacto; os erros de arredondamento, ou aproximação, que se fazem nestas situações, dependem fundamentalmente dos objectivos do estudo, do material usado, etc.
Nesta perspectiva, ao falar-se de um valor de peso de borrego de 4.5 kg, rigorosamente o que se está a fazer é arredondar para este valor toda a gama