Beruflich Dokumente
Kultur Dokumente
Alessandro L. Koerich
• Introdução
• Espaço Euclidiano
• Aprendizagem Baseada em Instâncias
• Regra k vizinhos mais próximos (k-NN)
• Exemplos
• Resumo
• Raciocínio Baseado em Casos (CBR)
Introdução
C (classes)
c1
treinamento c2
c3
Árvore Bayes
Paradigmas de Aprendizagem
• Na classificação...
Árvore de Decisão
Bayes
Introdução
D (exemplos de treinamento)
Comparação
(distância)
xt (exemplo de teste)
• Paradigma baseado em
instâncias...
Valor do Conceito Alvo
(exemplo de
treinamento mais
próximo)
Introdução
x1 x2 2-dimensional
x2 x1
x1 x2 x3 3-dimensional
x1
x3
Espaço Euclidiano
? x1 x2 x3 x4 4-dimensional
.
. .
? x1 x2 x3 x4
... xn n-dimensional
Espaço Euclidiano?
2-dimensional
sunny high
<xn,cn> dxnxt
Aprendizagem Baseada em Instâncias
• Observações importantes:
x
Aprendizagem k–NN
a ( x ) a ( x )
n
d ( xi , x j )
2
r i r j
r 1
Algoritmo k–NN
Algoritmo de treinamento
• Para cada exemplo de treinamento <x,c>, adicione o
exemplo à lista training_examples
Algoritmo de classificação
• Dada uma instância xt a ser classificada,
• Faça x1, ...,xk representar as k instâncias de training_examples
que estão mais próximas de xt
• Retorne
k
f ( xt ) arg max c, f ( xi )
c C i 1
• Supondo:
– n exemplos de treinamento rotulados;
– Vetores com d dimensões;
– buscamos o exemplo mais próximo de uma instância
de teste xt (k=1).
– distância parcial;
– pré–estruturação;
• Refinamento do k–NN:
– Ponderar a contribuição de cada um dos k vizinhos de acordo
com suas distâncias até o ponto xt que queremos classificar,
dando maior peso aos vizinhos mais próximos.
• Vantagens:
– habilidade para modelar funções alvo complexas por
uma coleção de aproximações locais menos
complexas.
– A informação presente nos exemplos de treinamento
nunca é perdida.
• Dificuldades:
– Tempo ?
– Determinação de uma métrica.