golias
INTRODUÇÃO
- IDEIA BÁSICA: reamostrar de um conjunto de dados, diretamente ou via um modelo ajustado, a fim de criar replicas dos dados, a partir das quais podemos avaliar a variabilidade de quantidades de interesse, sem usar cálculos analíticos.
- APLICAÇÃO DO MB: podem ser aplicados quando existe, ou não, um modelo probabilístico bem definido para os dados.
- METODO: COMPUTER-INTENSIVE
- CONCEITOS BASICOS
DADOS: y1, y2, ..., yn ~Y com fdp f e fda F θ: característica populacional
T: estatística; t: valor de T na amostra
- INTERESSE: obter a distribuição de probabilidade de T; viés de T, dp(T); quatis, intervalo de confiança para θ, testes. - SITUAÇÕES: PARAMETRICA E NÃO-PARAMETRICA
- FUNÇÃO DE DISTRIBUIÇÃO EMPIRICA(FDE)
ˆ
F : estimativa de F, a partir da distribuição empírica, que
coloca probabilidade 1/n em cada yj.
ˆ
F ( y) =
# { y j ≤ y} n - FUNÇÃO ESTATÍSTICA
Estatística de interesse: t=f(y(1), ..., y(n))
ˆ
t = t (F ) : função estatística
θ = t (F )
ˆ
F→F
ˆ
⇒ T = t ( F ) → θ = t ( F ) em probabilidade(consistência)
- PRECISÃO DA MEDIA AMOSTRAL
Amostra: x1, ..., xn: x = ∑
xi
n
Erro padrão de x =
s n , s
2
∑ (x
=
i
− x)2
n −1
- ERRO PADRÃO DE T: estimador de θ ep(T ) = var(T )
Em geral, var(T) depende de θ, portanto
ˆ
ˆ ep (T ) = var(T )
Para a maioria dos estimadores, não há formulas para calcular o ep.
BOOTSTRAP
x = ( x1 , L , x n ) : dados independentes →
s( x) : estatística de
interesse
∗
∗
Amostra
bootstrap: x = ( x1∗ , L, x n ) , reposição, n vezes de x
amostramos,
com
- ALGORITMO BOOTSTRAP: gera um grande número independentes: x ∗1 , x ∗2 ,L , x ∗ B
de
amostras
bootstrap
Cada uma de tamanho n. B ≈ 200.
- OBJETIVO: estimar ep dos estimadores
- RÉPLICA BOOTSTRAP:
Amostra bootstrap x ∗ → s ( x ∗ ) : réplica bootstrap
- ESTIMADOR BOOTSTRAP DO ERRO PADRÃO: desvio padrão das réplicas bootstrap
1
ˆ
epboot