Trabalho SMO
Manoel Neto
Francieli Travessini
Mathias Henrique
SMO / SVM
O que é SVM? conjunto de métodos do aprendizado supervisionado que analisam os dados e reconhecem padrões, usado para classificação e análise de regressão.
Classificação em dois grupos
Classificação de múltiplas classes não é uma limitação, pois pode-se construir uma
SVM para cada classe.
Apresenta resultados melhores que muitos métodos populares de classificação.
BASE MATEMÁTICA
• 1968: base matemática
– Teoria de Lagrange (teoria dos grupos)
• [Vapnik et al, 1992] Primeiro artigo
• [Vapnik et al, 1998] Definição detalhada
• Última década
– Série de artigos com aplicações de SVM
– Série de artigos com otimizações de SVM
• SMO, por exemplo
UTILIZAÇÃO
• SVM / SMO são utilizadas em diversas áreas:
– Bioinformática
– Reconhecimento de assinaturas
– Classificação de texto e imagens
– Identificação de spams
– Reconhecimento de padrões diversos
– Identificação de dados replicados
Motivação da SVM
Como separar as duas classes?
Como separar as duas classes?
Motivação da SVM
Reta / Plano / Hiperplano
Qual o hiperplano ótimo?
Menor erro de classificação
?
Conceitos de SVM
• Qual o hiperplano ótimo?
– Menor erro de classificação
– Maior margem
• Distância entre vetores de suporte e o hiperplano
Conceitos de SVM
• Qual o hiperplano ótimo?
– Menor erro de classificação
– Maior margem
• Distância entre vetores de suporte e o hiperplano
Como funciona para dados linearmente separáveis?
• Dados de treinamento
– Tuplas no formato (X1, X2, ..., Xn, Y)
• Atributos Xi
• Classe Y (+1, -1)
• Conjunto dito linearmente separável, se existir um hiperplano H (no espaço de entrada) que separe as tuplas de classes diferentes
• Determinar os vetores de suporte
• Encontrar o hiperplano ótimo
– Com maior margem
O Hiperplano (H)
• Pontos que pertencem a H satisfazem a equação w⋅x+b= 0
• w: vetor normal a H w = w1, w2, ..., wn
• ||w|| é a norma euclidiana de w
√ (w ⋅ w ) = √ (w12 + ...