Beruflich Dokumente
Kultur Dokumente
imágenes y vídeos
Antoine Manzanera
ENSTA – ParisTech
Unité d'Électronique et d'Informatique
BD Imagenes y videos:
●
• Agencias de fotografia
● Aplicaciones:
• Mediametria • Datos biomedicales
• Propriedad intelectual / artistica • Imagens aeriales, por satelite...
● Dibujo, esquema
● Modelo CAD
● Mapa
● Plano
● .../...
Evaluacion de los resultados :
Base de datos
# respuestas relevantes
Precision =
# respuestas
# respuestas relevantes
Recuerdo =
●Dificultades: # datos relevantes
➢ A diferencia de los datos textuales, el contenido semantico nunca es explicito.
Dimension multidisciplinaria:
Multimedia : texto, imagen, sonido - Gestion de bases de datos - Hardware - Aprendizaje - Lingüistica,...
Escena:
✗ Tipo de plano
✗ Tipo de accion
✗ .../...
imagen It transformada
●Difficultades:
● Transicion por sobreimpresion,...
● Movimientos bruscos,...
Software MD-shots (IRISA Rennes / projet VISTA)
de cortada de video, basado sobre un descriptor
global del movimiento dominante (eje vertical)
{
0, 0, 0
x 0 x 1 , x p
......................
Base de datos
{M ,C ,} de indices
Datos estadísticos ● Tiempo de calculo de la indexación: no primordial
● Indices + datos estadísticos: calculo incremental
......................
y 0, y1, , y p
{M ,C ,}
Base de datos imágenes
Datos estadísticos
n n n
x 0 , x 1 , , x p
● Dificultades:
● Variabilidad: rotación, traslación, homotecia,...
● Reconocimiento 2d o 3d
● Visibilidad parcial
● Cambio de luminosidad
●.../...
Reconstruccion 3d
● Técnicas de processamiento:
● Deteccion + cerradura de contornos
(transformada de Hough)
Indices: listas de coordenadas de las estructuras (segmentos, elipses,...)
Metrica de apareamiento: basada sobre la correspondencia de las estructuras
Ej.: Calculo de la transformacion + Distancia de Hausdorff
distancia de Haussdorff entre
dos conjuntos P y Q : H P ,Q=max {h P ,Q , hQ , P} con: h X ,Y =max min d x , y
x ∈X y ∈Y
● aumento de la robusteza
i j
con: G = ∂i j G
t t t t
“Local jet”: L =G ∗I
ij ij ij
Puntos de interés
(método de Harris)
∂x ∂y
1 − x y
2 2 t : factor de escala
y: t
G x , y= 2
exp 2
2 t 2t
t
Se denota: {Lij ; 0i j 3}={L , L x , L y , L xx , L xy , L yy , L xxx , L xxy , L xyy , L yyy }
(derivadas hasta el 3o orden)
Antoine Manzanera – Curso « Indexación » - Bogotá 2008
Invariantes geométricos y fotométricos
El principio del calculo de los invariantes es combinar las diferentes componentes del
“local jet” de manera a tener valores que sean invariantes a varios cambios de aspecto,
incluso transformacion afines y cambio de iluminacion.
1 - Invariancia por desplazamiento
Invariantes diferenciales de Hilbert:
cuantidades invariantes por rotacion (NB: invariancia por rotacion del nucleo gausiano)
L xx = yy =0
Con:
L i Li xy =− yx =1
Li Lij L j
L ii
Notationes de Einstein: sumacion sobre los indices
= Lij L ij
ij L jkl L i L k L l −L jkk Li Ll Ll Por ej.:
Liij L j L k L k − Lijk Li L j L k 2 =L i L ij L j = L xx L x L x 2 L x L xy L y L yy L y L y
−ij L jkl L i L k Ll 7 =−ij L jkl L i L k L l= L xxy −L x L x L x2L x L y L y
Lijk Li L j L k L xyy −2L x L x L y L y L y L y −L yyy L x L y L y L xxx L x L x L y
Entonces un vector de
invariantes esta calculado para
cada punto de interés en todas
las imagenes. Son estos vectores x={x 1 , , x n }
que seran comparados
posteriormente. y={y 1 ,, y n }
.../...
Distancia euclidiana
Distancia de Mahalanobis Distancia de los puntos del espacio al centro de masas (media) de una nube de
puntos, en distancia euclidiana (izq.) y en distancia de Mahalanobis (der.).
m x , x ' =t x− x ' C −1 x−x '
var x1 cov x 1 , x 2 ⋯ cov x 1 , x n
cov x i , x j =〈 xi −i x j − j 〉=〈 x i x j 〉−〈 xi 〉 〈 x j 〉
cov x 2 , x 1 var x 2 ⋯ cov x 2 , x n
con: C=
⋮ ⋮ ⋱ ⋮ var x i =cov xi , x i i =〈 x i 〉
cov x n , x 1 cov x n , x 2 ⋯ var x n
...donde < . > denota la media.
Antoine Manzanera – Curso « Indexación » - Bogotá 2008
Métricas de apareamiento
La matriz de covarianza C es calculada y actualizada “off-line”.
Diagonalizando C -1, se puede volver a un calculo de distancia euclidiana por respecto a
los vectores descriptores “normalizados”:
−1 t
C = P DP t x− x ' C −1 x− x ' =∥D Px− D Px '∥
{
{
distancia
normalizacion elipsoidal
A cada actualizacion de la base se debe, entonces:
- actualizar la matriz de covariancia C.
- calcular y diagonalizar C -1.
- normalizar todos los vectores: x D Px
m x , y=e D P x , D P y
.. .
...
dimension
vector nuevo
Otra cortada posible de
vector de la base la base de indices
representacion de la vecindad del vector nuevo en un Kd-tree
2 d
m N3 d N = numero de imagenes de la base
Complexidad de la busqueda: d
m 3 m = numero de invariantes por imagen
k
{
0, 0, 0
x 0 x 1 , x p
......................
y 0, y1, , y p
n n n
x 0 , x 1 , , x p
y ' ' 0, y ' ' 1, , y ' ' p El bucle de busqueda (relevance feedback) es una
técnica utilizando una evaluacion interactiva con
el utilizador para modificar el descriptor de la
consulta o la métrica de apareamiento, por
ejemplo modificando los pesos de las
y ' ' ' 0, y ' ' ' 1, , y ' ' ' p
componentes, o guardando solamente los
invariantes juzgados mas pertinentes respecto a
las evaluaciones.
Antoine Manzanera – Curso « Indexación » - Bogotá 2008
Bibliografia y fuentes
● P. Gros : Traitement des images par le contenu - documento de curso - IRISA 1999.
● C. Schmid : Appariement d'images par invariants locaux de niveaux de gris - Tésis
University