Regressão Logística
Regressão Logística
1. Definição
• É um modelo de regressão com as seguintes características:
– Função não é linear.
– A variável resposta Y não é contínua (é discreta ou qualitativa binária).
– As estimativas dos parâmetros beta não são feitas por mínimos quadrados.
– Os pressupostos de resíduos normais e homocedásticos não são satisfeitos.
2. Aplicações
• Dado um conjunto de variáveis comportamentais, avaliar a probabilidade de compra de um produto.
• Avaliação do risco de concessão de crédito a um cliente. • Dado um conjunto de sintomas, classificar o paciente entre doente ou saudável.
• Dado resultados de um conjunto de testes, avaliar um candidato como promissor ou não para determinada função.
3. Passo a passo
Formular o Problema
Selecionar Variáveis
Rodar modelo de regressão
Eliminar variáveis não significativas
Analisar a capacidade preditiva do modelo
Decidir por um ponto de corte
Usar o modelo com função discriminante
4. Construção do Modelo
• Definimos Y=1 quando ocorre o evento de interesse (event group) e Y=0 quando o evento não ocorre.
• O interesse é predizer a probabilidade de Y=1 e depois utilizá-la para classificação. • Suponhamos, como exemplo, a tabela a seguir em que Y=1 se o respondente utiliza determinada marca de sabonete e 0 caso use outra marca segundo idade.
obs.
Y
Idade
obs.
Y
Idade
obs.
Y
Idade
1
0
22
12
0
40
23
0
54
2
0
23
13
1
41
24
1
55
3
0
24
14
0
46
25
1
58
4
0
27
15
0
47
26
1
60
5
0
28
16
0
48
27
0
60
6
0
30
17
1
49
28
1
62
7
0
30
18
0
49
29
1
65
8
0
32
19
1
50
30
1
67
9
0
33
20
0
51
31
1
71
10
1
35
21
1
51
32
1
77
11
0
38
22
0
52
33