Distribuição Amostral de uma Proporção
logo, temos que X é uma variável discreta, com distribuição de Bernoulli tal que
Retirada uma amostra aleatória X1, X2, ..., Xn sem reposição de tamanho n dessa população, e indicando por Yn o total de indivíduos portadores de artrite nessa amostra, sabemos que
ou seja,
Vamos definir por a proporção de indivíduos portadores de artrite, ou seja,
Então,
ou seja, a distribuição amostral de é obtida da distribuição de Yn. Observamos que
onde cada Xi tem distribuição de Bernoulli com média μ = p e variância σ2 = p(1-p) com p desconhecido e são duas a duas independentes. Desta forma, podemos escrever que
mas, pelo Teorema Central do Limite, terá distribuição aproximadamente normal, com média p e variância p(1-p)/n, ou seja
Logo, a transformação terá a distribuição
Podemos observar que , na expressão acima, é a própria variável e, desse modo, para n grande podemos considerar a distribuição amostral de p como aproximadamente normal
Exemplo 1: Suponha que queremos saber a porcentagem de casamentos que terminam em divórcio entre casais que vivem em São Paulo. Como não temos recursos suficientes para checar todos os arquivos, vamos estimar esta porcentagem baseados em alguns dados disponíveis. Suponha que temos dados sobre 10 casais:
Isto é, o primeiro casal se divorciou, os próximos três não se divorciaram, o quinto casal se divorciou e assim por diante. O número de divórcios entre estes casais é
então a probabilidade estimada de um divórcio é
Note que para a distribuição binomial, se sabemos a real probabilidade de divórcio, p, poderíamos calcular a probabilidade de termos baseados em uma amostra de tamanho 10. Quando n = 10, esta é justamente a probabilidade de observamos 3