You are on page 1of 7

Universidad de las Fuerzas Armadas ESPE

Procesamiento Digital de Seales


Nombre: Diego Quispe
NRC: 2147

Biomtrica Reconocimiento Facial


Los humanos a menudo utilizan los rostros para reconocer individuos y
los avances en las capacidades de computacin en las ltimas dcadas,
ahora permiten reconocimientos similares en forma automtica. Los
algoritmos de reconocimiento facial anteriores usaban modelos
geomtricos simples, pero el proceso de reconocimiento actualmente ha
madurado en una Ciencia de Sofisticadas representaciones matemticas
y procesos de coincidencia. Importantes avances e iniciativas en los
pasados diez a quince aos han propulsado a la tecnologa de
reconocimiento facial al centro de la atencin.
La industria de reconocimiento facial basado en computadoras ha hecho
muchos adelantos tiles en la pasada dcada; sin embargo la necesidad
de sistemas de mayor precisin persiste. A travs de la determinacin y
compromiso de la industria, las evaluaciones del gobierno, y cuerpos
estndar organizados, el crecimiento y el progreso continuaran,
elevando la barra para la tecnologa de reconocimiento facial.
Mtodos
Hay tres enfoques predominantes en el problema de reconocimiento facial: i)
geomtrico: basado en los rasgos, ii) fotomtrico: basado en lo visual, y iii) la
combinacin de los dos enfoques anteriores.
Conforme a que el inters en reconocimiento facial continu, fueron
desarrollados muchos algoritmos diferentes; se deben destacar tres de ellos,
los cuales han sido bien estudiados en la literatura del reconocimiento facial:

Correspondencia entre agrupaciones de grafos elsticos (Elastic Bunch


Graph Matching, EBGM),
Modelo de apariencia activa (Active Appearance Model, AAM)

Correspondencia entre agrupaciones de grafos elsticos (Elastic


Bunch Graph Matching, EBGM)
El algoritmo EBGM fue diseado para realizar tareas de reconocimiento facial,
utilizando solamente algunos puntos de inters y no la cara en su totalidad. La
tcnica de EBGM se desarrolla bsicamente en dos etapas: la primera consiste
en ajustar un grafo de puntos principales a la cara del individuo, utilizando para
ello un modelo estadstico de dicho grafo; la segunda etapa extrae
caractersticas locales en dichos puntos y halla la distancia entre el grafo
obtenido y sus descriptores al grafo almacenado de la persona a identificar.
Dependiendo de la distancia encontrada, se ratifica o no la identidad del
individuo.
El primer paso, antes de la utilizacin de este algoritmo, es la normalizacin de
las imgenes. En este proceso se reduce el tamao de las imgenes y se
realizan transformaciones geomtricas que ubican las coordenadas de los ojos

Figura 1 Correspondencia entre agrupaciones de grafos elsticos


del individuo en posiciones predeterminadas.
La implementacin del algoritmo EBGM (Figura 2) requiere el uso de las
wavelets Gabor (filtros espaciales paso-banda, que permiten alcanzar la
resolucin conjunta de informacin mxima en los espacios bidimensionales
espacial y frecuencial), ya que estas brindan una descripcin de la informacin
en frecuencia, en una regin especfica de la imagen. Para ello es necesario
realizar la operacin de convolucin de la regin con una variedad de wavelets;
estas wavelets son almacenadas como mscaras en arreglos bidimensionales.
Las mscaras se pueden definir mediante la ecuacin 1, donde las wavelets se
separan en parte par y parte impar.
Con: xr=(x-x0)*cos()+(y-y0)*sin(); donde define la longitud de onda, define
el radio de la gaussiana, define la relacin de aspecto de la gaussiana,
representa la orientacin de la portadora y (x0, y0) determinan la ubicacin del
valor pico de la funcin gaussiana. A continuacin se describe la parte del
algoritmo EBGM que se refiere a la localizacin de puntos caractersticos.
1. Se define una estructura de grafo sobre la cara, cuyos nodos son puntos
de inters, que se puedan localizar fcilmente y que posean la misma
estructura en todos los rostros.
2. Cada nodo del grafo es caracterizado utilizando un banco de filtros de
Gabor de diferentes frecuencias y orientaciones. En cada nodo, se
calcula la respuesta de todos los filtros, denominado Jet. Por
consiguiente, cada nodo queda etiquetado con sus coordenadas y su Jet
asociado.
3. Para una imagen nueva se busca en la base de datos el conjunto de Jets
que sean ms similares. Para realizar esto, se centra el grafo en los ojos
de la nueva imagen, se calculan los jets de estos puntos y se comparan
con los jets de los ojos de la base de datos. Para la comparacin de los
jets se utiliza una funcin de similitud de fase, sta es similar a una
correlacin, y est definida como se describe en la ecuacin 2.

Dnde: a es la magnitud del jet de la base de datos, a la magnitud del Jet


de la imagen nueva, la fase del Jet de la base de datos, la fase del Jet de la
imagen nueva y n el nmero de coeficientes del Jet.
Este algoritmo tiene en cuenta que las imgenes faciales reales tienen
muchas caractersticas no lineales que no son tratadas en los mtodos
lineales de anlisis (LDA, PCA), tales como variaciones en la iluminacin
(iluminacin de exteriores vs interior fluorescente), postura (frontal vs
inclinada) y expresin (sonrisa vs ceo fruncido). Sin embargo, la dificultada
de este mtodo es el requerimiento de la precisa localizacin del punto de
referencia.
- Linear Discriminant Analysis: LDA
LDA o Linear Discriminant Analysis es una tcnica de aprendizaje
supervisado para clasificar datos. La idea central de LDA es obtener una
proyeccin de los datos en un espacio de menor (o incluso igual)
dimensin que los datos entrantes, con el fin de que la separabilidad de
las clases sea la mayor posible. Es una tcnica supervisada ya que para
poder buscar esa proyeccin se debe entrenar el sistema con patrones
etiquetados. Es importante aclarar que LDA no busca en ningn
momento minimizar el error de representacin cometido, como s lo
haca PCA.

Para explicarlo vamos a considerar la versin ms simple del problema:

Encontrar el vector w de proyeccin, que proyecte los datos a un


espacio uni-dimensional de manera de obtener la mayor separabilidad
entre sus clases.

Formalizando, tenemos x1 xn patrones d-dimensionales etiquetados

en c clases. Cada clase cuenta con Nc patrones. Se busca w , para

obtener y i=wT x i proyecciones uni-dimensionales de los patrones.

Lo que se busca es maximizar la siguiente funcin objetivo:


Donde SB es la matriz de dispersin inter-clase y SW es la matriz de

dispersin intra-clase. Siendo ms precisos:

Siendo c la media de cada clase, la media de todos los datos, Nc la


cantidad de patrones de la clase c.

Se busca encontrar el vector w de proyeccin que maximice el


cociente entre la matriz de dispersin inter-clase y la matriz de
dispersin intra-clase.

Operando se puede ver que el w que maximiza la funcin objetivo debe


cumplir:
Si SW es no singular podemos resolver el clsico problema de valores
propios para la matriz S 1 W SB:
Si ahora sustituimos la solucin en J(w) obtenemos lo siguiente:

Siendo wk vector propio k de valor propio k.

En consecuencia, para maximizar la solucin debemos considerar el


vector propio con mayor valor propio asociado.

Claro est que este desarrollo vali para el caso en que queremos
proyectar los datos sobre un espacio uni-dimensional. Se puede ver sin
mayor esfuerzo [9] que para el caso de querer proyectar sobre un
espacio m-dimensional, se debe resolver el mismo problema y elegir los
m vectores propios con valores propios asociados ms grandes.

En este caso particular en donde se trabaja con imgenes (datos de alta


dimensin) se aplic, como en el caso de ICA, una primera etapa de PCA
para reducir la dimensionalidad de los datos. Los datos fueron reducidos
a dimensin 100. Cabe acotar que existen formas directas de aplicar LDA
(D-LDA) que no fueron objeto de estudio en este proyecto.
Modelo de apariencia activa (Active Appearance Model, AAM)
Los Modelos de Apariencia Activa (AAM) permiten reproducir de forma sinttica
imgenes de superficies que incluyen deformaciones no rgidas y cambios de
apariencia. Estn basados en la obtencin, mediante una fase de
entrenamiento, de un modelo estadstico de la forma y la apariencia del objeto
de inters. En un AAM la forma es descrita mediante un conjunto de N puntos
caractersticos (los llamados Parmetros de forma), que determinan una malla

similar a la representada en la Figura 2 y que es expresada por el siguiente


vector:
Donde ui, vi son las coordenadas del vrtice i.

Figura 2 Ejemplo
de malla en AAM
Mediante el anlisis de componentes principales (PCA) sobre las mallas de
entrenamiento se obtiene una malla s0 y un subespacio Bs=[s1,,sN] formado
por n componentes principales, con una dimensionalidad menor que la del
conjunto de entrenamiento.
Cualquier instancia de la forma del modelo se obtiene a partir de una
combinacin lineal de los vectores de la base de forma, Bs mediante la
siguiente expresin:

La inclusin de los parmetros de forma en el modelo se realiza mediante una


transformacin afn definida a trozos denominada funcin warp W(x;p). Esta
funcin se encarga de transformar los puntos interiores de una malla concreta
(normalmente se elige s0), en donde se define la apariencia, a cualquier malla
s(p) generada a partir de la ecuacin anterior. Es decir:

Donde x son puntos en el interior de s0 y x est definido en el interior de s(p).


La apariencia se describe a partir del mapa de bits definido en el interior de los
diversos tringulos que forman los puntos de la malla s0, son los llamados
Parmetros de apariencia.
Mediante la ecuacin anterior se transforman las imgenes de entrenamiento,
con el fin de normalizarlas en forma. De la misma manera que con los
parmetros de forma, mediante PCA se obtienen tanto la apariencia media A0,
como la base de un subespacio BA=[A1(x), A2(x),,Am(x)], de dimensin
menor al conjunto de entrenamiento, que est formada por las m componentes
principales del entrenamiento.
A partir de estos elementos, se obtiene un modelo de apariencia lineal, que es
capaz de generar una instancia de apariencia a partir de una combinacin
lineal de la media y las componentes de la base, ponderadas por un conjunto

de parmetros =(1,2,,m):
Una vez obtenido el modelo de apariencia lineal, se procede con el ajuste del
modelo que trata de, a partir de una imagen de entrada I(x), encontrar el
conjunto de parmetros p y que minimicen el error cuadrtico entre la
instancia del modelo generado a partir de esos parmetros y la imagen de
entrada:

Existen diversos mtodos para minimizar esta ecuacin, entre los que destacan
por su precisin el algoritmo de Lucas-Kanade, el cual, en lneas generales, es

un mtodo de minimizacin iterativo basado en el algoritmo de Gauss-Newton.


El modelo AAM es un buen mtodo estadstico para ajustes de plantillas, el cual
usa toda la informacin de la cara, es decir, no solo los puntos de los bordes,
sino tambin los interiores. El gran problema de este modelo, es que son muy
sensibles al proceso de inicializacin, esto es, cuando la inicializacin est
alejada del objeto destino, ellos pueden converger hacia mnimos locales.

Bibliografa
D. Bolme, R. Beveridge, M. Teixeira, and B. Draper, "The CSU Face Identification
Evaluation System: Its Purpose, Features and Structure," International
Conference on Vision Systems, Graz, Austria, April 1-3, 2003. (Springer-Verlag)
304-311.
"Eigenface Recognition" http://et.wcu.edu/aidc/BioWebPages/eigenfaces.htm.
J. Lu, K.N. Plataniotis, and A.N. Venetsanopoulos, "Regularized Discriminant
Analysis For the Small Sample Size Problem in Face
Recognition," Pattern Recognition Letters, December 2003, Vol. 24, Issue 16:
3079-3087.