Beruflich Dokumente
Kultur Dokumente
Color:
- Diagrama cromtico y teora triestmulo - Espacios (modelos) del color: RGB, HSI, ...
Textura:
- Anlisis estructural - Anlisis estadstico - Anlisis en el dominio de Fourier
Bibliografa
BSICA: R.C. Gonzlez y R.E. Woods, Digital Image Processing, Addison Wesley, 2 edicin, 2002. (caps. 6 y 11) A. de la Escalera, Visin por computador: Fundamentos y mtodos, Pearson- Prentice Hall, 2001. (caps. 3 y 6) COMPLEMENTARIA: G.A. Baxes, Digital Image Processing, John Wliley & Sons, 1994. (cap. 5) J.D. Foley et al, Computer Graphics: Pinciples and Practice, 2 Edicin, Addison-Wesley, 1997. (cap. 13) M. Sonka et al., Image Processing, Analysis, and Machine Vision, PWS Publishing, 1999. (cap. 6)
Introduccin (I)
Para reconocer objetos en imgenes es necesario extraer caractersticas medibles de stos. Estas caractersticas permiten definir vectores de caractersticas normalizados que se usan para el reconocimiento de patrones. Algunas de las caractersticas principales extrables de los objetos (o de las regiones segmentadas) en una imagen, utilizadas en la etapa de reconocimiento dentro de un Sistema de Visin Artificial, son la forma, el color y la textura.
Introduccin (II)
Ejemplos :
Forma
Color
Textura
Forma (I)
Medidas generales sobre formas
Definir la forma de un objeto puede resultar difcil (verbalmente o grficamente). Forma = figura exterior (o geometra) de un cuerpo u objeto. Es posible describir una forma 2D por medio de algunos de sus caractersticas y propiedades (rea, permetro, ). Medidas sobre forma:
rea Permetro Dimetro Distancias: mxima y mnima al centro de masas, media al contorno,... Ejes mayor y menor, ngulo del eje mayor Envolvente (bounding box) Nmero de agujeros Ratios: redondez=(4Area)/Perimetro2, Area Agujeros/Area Total, ...
Forma (II)
Medidas generales sobre formas
rea Permetro
Bounding box
rea:
Nmero de pxeles de la forma (sobre la imagen binaria)
Eje menor:
Eje perpendicular al eje mayor Ambos ejes definen los lados del MRE Estos ejes tambin estn relacionados con los autovectores de la matriz de covarianzas (autoejes de las formas) usando el anlisis de componentes principales
Grado de simetra (se comprueba desde el eje mayor del objeto) Distancias mxima y mnima entre el centroide y los puntos del contorno Distancia media al contorno:
Sea f una forma con N puntos, pf un punto de f, y d(p,contorno(f)) la distancia menor entre p y todos los puntos del contorno, entonces la distancia media al contorno se calcula como:
= ( d(p,contorno(f))) / N
E=1
E=0
E=-1
Descriptores de curvatura:
Muestras de la curvatura en puntos de inters Estadsticos de curvatura: curvatura media, varianza, desviacin tpica, Energa de curvatura B (donde k(t) describe el contorno y P el permetro):
1 B = k (t ) 2 dt P
Basadas en contornos
Basadas en regiones
Basadas en transfomadas
Contornos paramtricos
Conjuntos de puntos
Descomposicin en regiones
Regiones envolventes
Transformadas no lineales
a d
a d b
a d b
Forma
Caja de Feret
MRE
Cierre convexo
Forma
Esqueleto
r()
r()
(2)A
A
/4 /2 3/4 5/4 3/2 7/4 2
A
/4 /2 3/4 5/4 3/2 7/4 2
El cdigo de cadena de un contorno (de objeto o regin) se define partiendo de un pxel cualquiera del contorno y encadenando la direccin en que se encuentran los puntos adyacentes del contorno mediante un convenio de seguimiento establecido. Se consigue as una cadena de smbolos que determinan unvocamente al objeto, que es invariante a traslaciones.
1 2 3 0
3 4 5
1 0
(a)
(b)
Ejemplo: Cdigo de cadena de conectividad 4. El punto grueso indica el nodo de inicio. Inicialmente se obtiene: 3030012122, que desplazndolo para obtener el mnimo queda: 0012122303. Finalmente, codificando las diferencias se obtiene: 0113101131
Los momentos espaciales de un objeto son medidas estadsticas que permiten describir regiones (objetos) en trminos de sus puntos interiores. Para una funcin f(x,y) continua en 2D, se define el momento de orden (p +q) como:
m pq =
p q x y f ( x, y)dxdy
Para una imagen digital, la frmula queda: x y El momento central de orden (p + q) de una imagen es:
pq = ( x x) ( y y ) q I ( x, y )
p x y
m pq = x p y q I ( x, y )
Momentos espaciales de orden uno: Corresponden a las sumas en la direcciones x e y, respectivamente, de los valores de brillo de los pxeles del objeto, cada una de ellas multiplicada por su respectivo valor de coordenada x o y en la imagen.
m10 = xI ( x, y )
x y
m01 = yI ( x, y )
x y
x=
m10 m 00
y=
m 01 m 00
Momentos espaciales de orden dos: Dan informacin sobre la orientacin del objeto. Hu propuso un conjunto de momentos centrales normalizados de rdenes 2 y 3 que son invariantes a traslaciones, rotaciones y escalados.
Color (I)
Introduccin
El sistema visual humano puede distinguir entre miles de colores y slo puede diferenciar alrededor de 100 niveles de intensidad. La percepcin del color depende de las caractersticas de la luz (fundamentalmente, la luz reflejada por el objeto) y del complejo proceso de percepcin realizado por el sistema visual humano (ojo-cerebro). Las radiaciones electromagnticas con longitud de onda entre 400 y 700 nanmetros (luz visible) estimulan los receptores humanos y producen la sensacin de color.
El color es un descriptor muy potente para diferenciar objetos. Importancia en aplicaciones de segmentacin y reconocimiento de patrones. Tratamiento imgenes color: color completo y pseudocolor.
Color (II)
Diagrama cromtico y teora triestmulo
La mezcla aditiva de la luz emitida por tres linternas, una roja (de 650 nm), otra verde (de 530 nm) y otra azul (de 425 nm) permite obtener una amplia gama de colores (teora triestmulo). Muchos dispositivos que generan imgenes en color (tubos de televisores, monitores, pantallas de cristal lquido, pantallas de plasma, etc) se fundamentan en este principio. En 1931 la Comisin Internacional de Iluminacin (I.C.I.) convino en expresar qu cantidad, en Lmenes, tiene que emitir cada una de tres linternas patrn para expresar todos los matices del espectro de manera aditiva.
2,5
C
2
Lumenes
1,5
A B
1
0,5
Color (III)
Diagrama cromtico y teora triestmulo
La obtencin de un color determinado se basa en tres componentes primarios:
x= A A+ B +C y = B A+ B +C z = C A+ B +C
donde: x+y+z=1. Representando en un plano XY el color asociado a cada punto (x,y,z) se obtiene el diagrama cromtico CIE (a):
(a)
(b)
Color (IV)
Diagrama cromtico y teora triestmulo
Los colores comprendidos dentro del tringulo definido por los puntos R,G,B de la fig. (b) son aqullos que se pueden obtener por mezcla aditiva de tres linternas con los colores correspondientes a los vrtices del tringulo. Los televisores y los monitores de ordenador, eligen cuidadosamente la base de tres colores (rojo, verde y azul) que usarn para construir las imgenes que presentan, de manera que el rea del triangulo dentro del diagrama I.C.I sea mxima, y as poder representar el mximo posible de colores en sus pantallas. El diagrama I.C.I da lugar a otro tipo de representacin denominado HSV (Hue-Saturation-Value). Esta representacin puede ser un superconjunto de una representacin RGB, en ella los valores que definen una radiacin son el color (Hue), su saturacin (Saturation), y su luminosidad (Value).
Color (V)
Tintas
Usando tintas, no se puede realizar la mezcla aditiva de haces de luz ya que, los colores percibidos al mezclar tintas son el resultado de una mezcla substractiva. Al tintar un papel blanco se le van restando componentes que ya no podr reflejar. Se trata de escoger adecuadamente una base de colores, para que la gama de matices, que se pueda representar mezclando componentes de esta base, sea lo ms extensa posible. Las impresoras, que usan papel y tinta, toman como base la los colores: cian, magenta y amarillo (CMY).
A la izquierda mezcla aditiva de la luz tres linternas sobre una superficie negra. A la derecha mezcla substractiva de tres tintas sobre un lienzo blanco.
Color (VI)
Espacios (modelos) de color
Una combinacin de caractersticas fsicas del mundo real determina lo que la visin humana percibe como el color. Un espacio (o modelo) de color es una representacin matemtica de estas caractersticas. Los espacios de color son siempre tridimensionales:
El espacio ms habitual en imgenes digitales (pantallas de ordenador) es el Red/Green/Blue (RGB). En impresin se usa el espacio Cyan/Magenta/Yellow (CYM). El espacio Hue/Saturation/Value (HSV) se usa tpicamente en imgenes artsticas. Los espacios de color basados en Intensity/Chromaticity (YUV y YIQ) se usan para transmisin de seales de televisin.
Muchas aplicaciones de tratamiento de imgenes digitales requieren transformaciones entre el espacio RGB y otros espacios de color.
Color (VII)
Espacio de color RGB
En este espacio aditivo, cada color tema valores entre 0 y 255, resultando una estructura de cubo. Cada color se define dando sus coordenadas de R, G y B, en forma de 3-tupla: (rojo, verde, azul) con respecto al cubo.
Color (VIII)
Espacio de color CMY
Espacio inverso del RGB: C = max-R M = max-G Y = max-B Uso en imgenes impresas (una vez que la imagen se convierte a CMY no se puede visualizar correctamente en pantalla). Tras aos de experiencia, se han desarrollado tcnicas para crear imgenes impresas de alta calidad y a bajo coste. El modelo CMYK, que es una modificacin del CMY donde K representa el color negro, permite este tipo de impresin con buen ratio: calidad/coste.
Color (XI)
Espacio de color HSV (o HSI)
Espacio de color bastante diferente al RGB y al CMY. Operar en HSI requiere mayor precisin aritmtica (coma flotante o 16-32 bits de precisin entera). Hue = Longitud de onda
dominante o tono del color (ngulo entre 0 y 360) Saturation = Saturacin o fuerza del color (entre 0 y 1) Value = Intensidad del color (entre 0 correspondiente al negro y 1 al blanco) Procesamiento en modelo HSI: 1) Convertir de RGB a HSI, 2) Modificar parmetro H (o S o I), y 3) Volver a convertir a RGB.
Color (X)
Espacios de color YUV y YIQ (luminancia-crominancia)
Estos espacios usan las caractersticas de brillo y color. El espacio YUV se usa para el sistema de televisin PAL (Europa) y el YIQ para el sistema NTSC (USA). Los dos mtodos son casi idnticos, diferencindose en las ecuaciones de conversin entre RGB y el modelo respectivo. En ambos sistemas, Y representa la luminancia o componente de brillo, e I y Q (o U y V), la crominancia o color. Estas variables (brillo, color) se pueden cambiar mediante los botones de una televisin (u ordenador). La ventaja de usar YUV o YIQ para enviar la seal de televisin es que se reduce la cantidad de informacin para definir el color. Esta compresin restringe el rango de colores en imgenes de televisin. Ejemplo: Y = .299R + .587G + .114B Ecuaciones de conversin de RGB a YUV: U = -.147R - .289G + .437B
V = .615R - .515G - .100B
Textura (I)
Introduccin
Las texturas ofrecen informacin sobre la ordenacin espacial de los niveles de gris (o de los colores) en una imagen. Son patrones visuales homogneos, locales y repetitivos que se observan en ciertos tipos de materiales (telas, piedras, madera, etc). Resulta importante para muchos aplicaciones de Visin Artificial: segmentacin de regiones en imgenes, determinacin de formas (o caractersticas) de objetos, clasificacin, etc. Al observar ciertos tipos de materiales se nota que presentan un aspecto homogneo a pesar de no tener un nivel de gris constante. La textura no puede definirse para pxeles aislados. La textura viene dada por distribucin espacial de los niveles de gris en una regin (medida cuantitativa). Esta caracterstica depende del grado de resolucin de la imagen.
Textura (Ib)
Introduccin
Textura: Uno o ms patrones locales que se repiten de manera peridica. Para el estudio y comparacin de los algoritmos sobre imgenes de texturas se utilizan como referencia las imgenes de Brodatz.
Textura (Ib)
Introduccin
Problemas relacionados con texturas (Forsyth y Ponce, 2003) Segmentacin basada en textura: descomponer una imagen en regiones cuya textura sea uniforme Sntesis de texturas: construir regiones grandes de textura a partir de imgenes (pequeas) de ejemplo usadas para construir modelos de probabilidad de textura Extraccin de la forma a partir de la textura: la deformacin de la textura pixel a pixel se usa como una caracterstica para descubrir la forma de una region
Textura (II)
Introduccin
Ejemplos de texturas: pavimento (izquierda) y tejido (derecha).
Textura (III)
Medidas cuantitativas: informacin bordes
El nmero de pxeles borde detectados en una regin de tamao fijo y las orientaciones de estos bordes ofrecen una informacin bsica de textura. Para regiones pequeas de N pxeles, cada pxel p tiene dos propiedades generadas por un algoritmo de deteccin de bordes: la magnitud del gradiente Mag(p) y su orientacin Dir(p). Se puede calcular la densidad de bordes como:
FdensidadBordes = p : Mag ( p ) T N
Textura (IV)
Medidas cuantitativas : informacin bordes
Sea Hmag(R) el histograma normalizado de magnitudes de gradiente en la regin R y Hdir(R) el histograma normalizado de orientaciones de gradiente en la regin R, una medida cuantitativa que describe la textura de la regin viene dada por: Fmag dir = (Hmag(R), Hdir(R)) Dadas dos imgenes I1 e I2, se puede calcular para cada una de ellas su correspondiente par de histogramas (Hmag(R), Hdir(R)), y dichos histogramas H1 y H2 se comparan por medio de una medida de distancia:
L1 ( H 1 , H 2 ) = H 1 (i ) H 2 (i )
i =1
Textura (V)
Medidas cuantitativas: Ejemplo
Sean dos imgenes de 55 (25 pxeles):
FdensidadBordes(I1) = 1 y FdensidadBordes(I2) = 0.24 Imagen I1: Hmag(I1)=(0.24, 0.76), Hdir(I1)=(0.48, 0.52, 0.00) Imagen I2: Hmag(I2) =(0.00, 0.24), Hdir(I2)=(0.00, 0.00, 0.24) Texturas muy distinguibles. L1(H1,H2) = 2
Textura (VI)
Medidas cuantitativas: particin binaria local
Para cada pxel p de la imagen se examinan sus 8 vecinos. Se construye un nmero binario de 8 dgitos a partir de dichos vecinos: b1b2b3b4 b5b6b7b8 siendo bi=0 si la intensidad del pxel i es menor o igual que la del pxel p, y bi=1 en caso contrario. El valor decimal de este nmero estar entre 0 y 255. Se construye un histograma con estos valores, para todos los pxeles de la imagen, con el fin de representar la textura de la imagen. Dos imgenes o regiones se pueden compara a nivel de textura por la distancia L1 entre sus histogramas correspondientes.
Textura (VII)
Anlisis: Mtodos estructurales
Se basan en el uso de primitivas de textura (llamadas txeles) y de reglas (gramaticales) de formacin. tiles cuando las primitivas o patrones de textura son son los suficientemente grandes y sencillos para poder ser segmentados (se habla de macrotexturas). Para imgenes binarias, las primitivas puedes extraerse por mtodos morfolgicos y luego obtener las reglas de formacin. Las imgenes en niveles de gris se preprocesan primero con un filtro de tipo laplaciana de una gausiana (LoG) para obtener las primitivas de textura, luego se definen reglas de formacin usando medidas basadas en las co-ocurrencias de estas primitivas. Ejemplo: Dada la primitiva p: , y la regla de formacin: S pS, se pueden obtener la siguiente imagen binaria 2D aplicando la regla de formacin en las direcciones x e y:
Textura (VIII)
Anlisis: Mtodos estadsticos
Analizan la distribucin estadstica de alguna propiedad para cada uno de los pxeles de la imagen. Se clasifican en: mtodos de primer orden (aqullos basados en el histograma), mtodos de segundo orden (los basados en matrices de co-ocurrencias), y mtodos de rdenes superiores. Estadsticos de primer orden: Se calcula el histograma de la imagen. Si a cada valor del histograma se lo divide por el nmero total de pxeles de la imagen, se tiene un histograma de probabilidades de niveles de gris h. Propiedades que se obtienen a partir de este histograma son: Media Varianza Coef. de asimetra Curtosis Entropa
= ih(i )
i =1 n
= (i ) h(i )
2 2 i =1
3 =
(i ) h(i ) 3
3 i =1
4 =
(i ) 4 h(i ) 4
i =1
Textura (IX)
Anlisis: Mtodos estadsticos (de segundo orden)
Los estadsticos basados en el histograma tienen el inconveniente de perder la informacin espacial. Se obtendra la misma informacin para una imagen de un tablero de ajedrez con los cuadros blancos y negros intercambiados. Para capturar las dependencias espaciales de los valores de niveles de gris, que contribuyen a la percepcin de las texturas presentes en una imagen, se define una estructura 2D llamada matriz de co-ocurrencias para analizar texturas. La matriz de coocurrencias P[i,j] se define especificando una direccin de desplazamiento d=(di,dj) y contando todos los pares de pxeles separados por d y que tienen valores de gris i y j.
Textura (X)
Anlisis: Mtodos estadsticos (de segundo orden)
Ejemplo: Imagen de 55 con tres niveles de gris (0, 1 y 2).
2 0 0 1 2 1 2 1 2 0 2 1 2 2 1 0 1 2 0 0 1 2 0 1 1
Como hay tres niveles de gris, Pd[i,j] es de tamao 33. Sea, por ejemplo d=(1,1). En la imagen existen 16 pares de pxeles que satisfacen esta separacin espacial. La matriz Pd[i,j] resultante para este valor de d es:
0 2 2 0 2 1 3 1 j 2 2 2 2 0 1 2 i
Textura (XI)
Anlisis: Mtodos estadsticos (de segundo orden)
Para analizar texturas pueden calcularse diferentes matrices de coocurrencias de la misma imagen con diferentes valores de d. Algunas propiedades que pueden extraerse a partir de dicha matriz son:
Energa (o segundo momento angular): Indica el grado de homogeneidad de la imagen. n n Pd (i, j )2
i =1 j =1
k Pd (i, j )2 , donde : i j = k
2 i =1 j =1
n 1
Textura (XII)
Anlisis: Mtodos espectrales (Fourier)
Tambin a partir de la transformada de Fourier de una imagen, se pueden analizar sus texturas predominantes. El espectro de la transformada (su mdulo) |F(u,v)|, resulta ideal para describir la direccin de los patrones peridicos 2D de la imagen f(x,y). Tambin se puede utilizar la energa del espectro: P(u,v) = |F(u,v)|2. Se consideran dos caractersticas del espectro de Fourier de la imagen que son tiles al describir texturas: 1) los picos prominentes del espectro indican la direccin principal de los patrones de textura; 2) la localizacin de esos picos en el plano de frecuencias indican el periodo espacial de los patrones. Al expresar el espectro en coordenadas polares, se tiene: S(r,). Por cada direccin de , S(r,) es una funcin 1D S(r), y similarmente para cada frecuencia r, Sr().
Textura (XIII)
Anlisis: Mtodos espectrales (Fourier)
Se obtienen dos distribuciones:
S(r) = S (r)
=0
S() = Sr ()
r=1
R0
Para cada par de valores (r,), se obtiene el par [S(r),S()]. Variando estas coordenadas se pueden generar dos funciones: S(r) y S() que constituyen una descripcin espectral de la textura para una imagen completa. Adems, algunos descriptores propios de estas distribuciones, S(r) y S(), se pueden calcular para obtener para caracterizar las texturas de forma cuantitativa.