Analise deOutiler

845 palavras 4 páginas
1- Genericamente em que casos a utilização da mediana é mais adequada que a média como uma medida de posição central ?
Resp.: Quando temos o OUTLIER ou assimetria para representar a centralidade, a mediana é melhor.

2) Este exercício é referente as variáveis do Banco de Dados 1.xls

a) Quantos elementos existem nesse conjunto de dados ?
Resp.: Neste banco de dados temos 22 segurados, ou seja 22 elementos.

b) Quantas variáveis existem nesse conjunto de dados ?
Resp.: Temos 8 variáveis neste conjunto de dados.

c) Quais variáveis são qualitativas e quais são quantitativas ?
Resp.:
- Variáveis Qualitativas: Estado e Sexo.

- Variáveis Quantitativas: Valor do automóvel, prêmio auto, valor do seguro de Vida e prêmio Vida, idade e ano.

d) Construa um gráfico de pizza e uma tabela com a distribuição de frequências (frequência absoluta e frequência relativa) para as variáveis estado e sexo.

Frequência por Sexo
Sexo
Absoluta
Relativa
Masculino
11
0,5
Feminino
11
0,5
Total
22
1

Frequência por Estado
Estado
Absoluta
Relativa
São Paulo
12
0,545455
Paraná
10
0,454545
Total
22
1

e) Para a amostra dos segurados do estado de São Paulo calcule as medidas de posição (média aritmética, mediana, moda), as medidas de dispersão (desvio padrão e coeficiente de variação) e construa o box-plot para as variáveis : idade, valor do automóvel, prêmio do automóvel, valor do seguro de vida e prêmio do seguro de vida (existe algum valor aberrante ?).

Idade em São Paulo

Valor do Automóvel em São Paulo

Prêmio do automóvel em São Paulo

Valor do seguro de vida em São Paulo

Prêmio do seguro de vida – São Paulo

Existe algum valor aberrante: Sim. Os valores de seguro de vida e prêmio de seguro de vida apresentaram alterações significativas para o Estado de São Paulo.

f) Para a amostra dos segurados do estado do Paraná calcule as medidas de posição (média aritmética, mediana, moda), as medidas de dispersão (desvio padrão e coeficiente de

Relacionados