Testes não paramétricos
1. Introdução
As técnicas clássicas de inferência estatística partem geralmente de pressupostos restritivos sobre a população ou populações a partir das quais as observações são retiradas. Por exemplo, assumir que os dados são provenientes de populações normalmente distribuídas. Pode em alguns casos pressupor-se que as populações envolvidas possuem a mesma variância, ou que existe uma relação conhecida entre elas. No caso Normal, o teste estatístico que se obtém é geralmente uma função da média amostral e da variância amostral. Alternativamente, podemos assumir que os dados são provenientes de outras distribuições conhecidas como a Exponencial, Gamma ou Poisson. Continuaríamos ainda assim num procedimento baseado nos parâmetros que caracterizam a referida distribuição. Nestas circunstâncias, estamos no contexto da inferência paramétrica, para as quais: 1) Os testes incidem sobre um parâmetro (valor esperado; variância; proporção…) 2) A distribuição amostral da estatística de teste pressupõe uma forma particular da distribuição populacional. As provas paramétricas exigem também que os valores analisados resultem de medidas efectuadas pelo menos ao nível intervalar de modo a se poderem realizar operações aritméticas.
1
Os problemas surgem quando estes pressupostos não podem ser feitos, porque são contrários aos mecanismos que geram a população ou porque os dados simplesmente não satisfazem os pressupostos. Nestes casos necessitamos de recorrer a técnicas de inferência que não requerem pressupostos sobre o mecanismo subjacente à geração dos dados. Podemos neste contexto recorrer a utilização de teste não paramétrico, ou seja, testes cujo modelo não especifica condições sobre os parâmetros da qual se extraiu a amostra. Existem contudo suposições básicas associadas à maioria das provas não paramétricas, nomeadamente que as observações sejam independentes e que haja continuidade da distribuição subjacente aos dados. Uma vantagem dos