Beruflich Dokumente
Kultur Dokumente
Curso 2009-2010.
Jos D. Martn, Emilio Soria, Antonio J. Serrano
TEMA 2: MODELOS
CLASIFICADORES
NDICE
Introduccin.
Clasificadores lineales.
rboles de decisin.
Clasificador basado en redes neuronales:
El perceptrn multicapa.
Procesado y Anlisis de Datos Ambientales. Curso 2009-2010. Jos D. Martn, Emilio Soria, Antonio J. Serrano
NDICE
Introduccin.
Clasificadores lineales.
rboles de decisin.
Clasificador basado en redes neuronales:
El perceptrn multicapa.
Procesado y Anlisis de Datos Ambientales. Curso 2009-2010. Jos D. Martn, Emilio Soria, Antonio J. Serrano
INTRODUCCIN
Los problemas de clasificacin son fundamentales en el
anlisis de datos ambientales.
Bondad en la clasificacin Vs. Complejidad de los modelos.
Es importante analizar el nmero de clases y el de patrones
dentro de cada clase.
Clasificacin no supervisada: agrupamiento (clustering).
Clasificacin supervisada.
Procesado y Anlisis de Datos Ambientales. Curso 2009-2010. Jos D. Martn, Emilio Soria, Antonio J. Serrano
NDICE
Introduccin.
Clasificadores lineales.
rboles de decisin.
Clasificador basado en redes neuronales:
El perceptrn multicapa.
Procesado y Anlisis de Datos Ambientales. Curso 2009-2010. Jos D. Martn, Emilio Soria, Antonio J. Serrano
SENCILLEZ
Aproximacin probabilstica:
Clasificacin binaria: dos clases con probabilidades asociadas p y 1-p.
Probabilidad de pertenencia de la observacin i a la clase A definida por una
respuesta unidad (salida=1):
+ x +....+ x
J Ji
e 0 1 1i
pi =
+ x +....+ J xJ i
1 + e 0 1 1i
pik =
0 + 1 x1 i +....+ J x J i
K 1
1+ e
0 + 1 x1 i +....+ J x J i
, k = 1,2...., (K 1)
k =1
piK =
1
K 1
1+ e
0 + 1 x1 i +....+ J x J i
, k=K
k =1
Procesado y Anlisis de Datos Ambientales. Curso 2009-2010. Jos D. Martn, Emilio Soria, Antonio J. Serrano
NDICE
Introduccin.
Clasificadores lineales.
rboles de decisin.
Clasificador basado en redes neuronales:
El perceptrn multicapa.
Procesado y Anlisis de Datos Ambientales. Curso 2009-2010. Jos D. Martn, Emilio Soria, Antonio J. Serrano
Procesado y Anlisis de Datos Ambientales. Curso 2009-2010. Jos D. Martn, Emilio Soria, Antonio J. Serrano
Procesado y Anlisis de Datos Ambientales. Curso 2009-2010. Jos D. Martn, Emilio Soria, Antonio J. Serrano
Procesado y Anlisis de Datos Ambientales. Curso 2009-2010. Jos D. Martn, Emilio Soria, Antonio J. Serrano
NDICE
Introduccin.
Clasificadores lineales.
rboles de decisin.
Clasificador basado en redes neuronales:
El perceptrn multicapa.
Procesado y Anlisis de Datos Ambientales. Curso 2009-2010. Jos D. Martn, Emilio Soria, Antonio J. Serrano
x0=1
wm0
x1
PERCEPTRN
MULTICAPA CON DOS
CAPAS OCULTAS
NEURONA NO LINEAL
wm1
x2
Entrada
.
.
.
vm
wm2
wmn
Unin
Funcin
no
lineal
xn
Pesos
Procesado y Anlisis de Datos Ambientales. Curso 2009-2010. Jos D. Martn, Emilio Soria, Antonio J. Serrano
Salida
ym
e j (i)
2
i =1 j =1
F.C. ENTRPICA
(Distribucin Binomial)
1
J=
M
1 + d j (i )
1 d j (i )
+
+
(
1
d
(
i
))
ln
(
1
d
(
i
))
ln
j
j
i =1 j =1
1 + o j (i )
1 o j (i )
M
vm (t ) = wmi (t ) xi
PROPAGACIN
HACIA
DELANTE (UNA
CAPA OCULTA)
i =0
ym (t ) = m (vm (t ))
r
z p (t ) = hpj (t ) y j (t )
j =0
o p (t ) = p ( z p (t ))
El aprendizaje se basar
en la minimizacin de la
funcin de coste.
Procesado y Anlisis de Datos Ambientales. Curso 2009-2010. Jos D. Martn, Emilio Soria, Antonio J. Serrano
Regla Delta
(Backpropagation)
90
80
70
60
( t ) =
50
J
( t )
40
30
: cte. Adaptacin
: pesos sinpticos
20
10
0
0
10
15
20
h pj (t ) = 2 e p (t ) p ' ( z p (t )) y j (t )
h p 0 (t ) = 2 e p (t ) p ' ( z p (t )) 1
wmi (t ) = 2 e p (t ) p ' ( z p (t )) h pm (t ) m ' (vm (t )) xi
25
0
10
15
20
25
ACTUALIZACIN
PESOS
SINPTICOS
(x ) =
a
' ( x) = ab (1 )
1 + e ( b x )
(Sigmoide, entre 0 y 1)
1 e b x
1
( x ) = a
' ( x) = ab(1 2 )
b x
1+ e
2
Procesado y Anlisis de Datos Ambientales. Curso 2009-2010. Jos D. Martn, Emilio Soria, Antonio J. Serrano
d ent = d + [d d
wmi (t ) = J + wmi (t 1)
Silva-Almeida (d<1 y u>1).
(
(
)(
)(
)
)
(
(
)
)
(t 1) + u wij (t ) J ( ij (t 1) ) > 0
(t ) =
(t 1) d wij (t ) J ( ij (t 1) ) < 0
0<<1
ij ( t 1) = (1 ) w ij ( t 1) J + ij ( t 2)
Procesado y Anlisis de Datos Ambientales. Curso 2009-2010. Jos D. Martn, Emilio Soria, Antonio J. Serrano
w ij ( t ) = ( t ) signo w ij ( t ) J
(
(
)(
)(
)
)
(u>1 y d<1)
Procesado y Anlisis de Datos Ambientales. Curso 2009-2010. Jos D. Martn, Emilio Soria, Antonio J. Serrano
CONCLUSIONES FINALES
Deben utilizarse siempre mtodos lo ms sencillos posibles. Si
un algoritmo sencillo funciona, no vale la pena complicarlo con
variantes pero si tenemos problemas s!!
Es fundamental realizar una buena definicin del problema y
un preprocesado adecuado.
El MLP es una herramienta muy potente que debe manejarse
con cautela, evitando sus inconvenientes ms comunes.
Debe llegarse a un compromiso entre estabilidad y plasticidad,
y entre complejidad e interpretabilidad.
Para decidir el mtodo a emplear hemos de plantearnos el
objetivo que queremos alcanzar y el problema a resolver.
Procesado y Anlisis de Datos Ambientales. Curso 2009-2010. Jos D. Martn, Emilio Soria, Antonio J. Serrano