Sie sind auf Seite 1von 22

ELEMENTOS DE PERCEPCION

VISUAL

Visin Artificial Dr. Renato Salinas 1


UCN 2013
Receptores de luz: Conos y Bastoncillos

Receptores estn distribuidos en forma discreta sobre


el rea de la retina.
Conos: ~ 5 - 7 millones
Bastoncillos: ~ 75 - 150 millones
Nervios: ~1 milln (lo que implica un arreglo
receptor de 1000x1000)

Visin Artificial Dr. Renato Salinas 2


Concentracin de Conos y Bastoncillos

Se puede apreciar que los conos estn concentrados


cerca del eje ptico

Visin Artificial Dr. Renato Salinas 3


Adaptacin a la luminosidad

Con bajos niveles de


luminosidad se pierde la
visin en colores (conos).
El rango total en cada
instante es slo una pequea
porcin de la curva (nivel de
sensibilidad)

Rango de sensaciones subjetivas de iluminacin

Visin Artificial Dr. Renato Salinas 4


Bandas de Mach

Ernst Mach (1865) descubri que el sistema visual


tiende a sobrevalorar o infravalorar la intensidad
cerca de los lmites de dos regiones con niveles de
gris distintos.
Visin Artificial Dr. Renato Salinas 5
Un modelo de imagen

f(x,y) = i(x,y) r(x,y)


f: intensidad de la imagen
i: componente de iluminacin (luz)
r: componente de reflectancia (objeto)
i(x,y) Valor (cd/pie2) Material r(x,y) Valor

Da claro 9000 Terciopelo 0.01


negro

Da nublado 1000 Acero 0.65


inoxidable

Oficina 100 Nieve 0.93


Visin Artificial Dr. Renato Salinas 6
Nivel de Gris

La intensidad de una imagen monocromtica se


denomina nivel de gris. Dicho nivel de gris estar
comprendido entre un valor mnimo y un mximo.
fmin < f < fmax
se suele mapear al rango 0 a L (0 = negro, L = blanco)

m
En el computador el rango de valores va desde 0 a 2 -1

Visin Artificial Dr. Renato Salinas 7


Muestreo uniforme y cuantificacin
Una funcin de imagen f(x,y) debe ser digitalizada
espacialmente y en amplitud.
Muestreo: digitalizacin de las coordenadas espaciales
Cuantificacin: digitalizacin de la amplitud

F(0,0) F(0,1) F(0,N-1)

F(1,0)
f(i,j) =
F(i,j)

F(M-1,0) F(M-1, N-1)

Visin Artificial Dr. Renato Salinas 8


Contornos Falsos y Pixelacin
Contornos falsos: fenmeno causado por un nmero
insuficiente de niveles de grises en reas suaves (variaciones de
nivel de gris suaves) de la imagen.
Pixelacin: se aprecia cuando la resolucin espacial es baja y
se observa la naturaleza discreta de los pixeles.

Visin Artificial Dr. Renato Salinas 9


Resolucin Espacial Niveles de grises (16, 8, 4, 2)
Visin Artificial (1024,, 32) Dr. Renato Salinas 10
Relaciones Bsicas entre Pixeles
Dada la naturaleza discreta de las imgenes digitales, el anlisis
requiere definir relaciones de vecindad y conectividad.

Un pixel p con coordenadas (x,y) tiene cuatro vecinos ms


cercanos (horizontales y verticales), con coordenadas: (x-1,y),
(x+1,y), (x,y-1), (x,y+1). Este conjunto de pixeles se llama los
4-Vecinos de p, y se denota por N4(p).
Los cuatro vecinos diagonales de p, tienen coordenadas (x-1,y-1),
(x-1,y+1), (x+1,y-1), (x+1,y+1), y se denotan por ND(p).
La unin de las dos vecindades se conoce como los 8-Vecinos de
p se denota por N8(p).

Visin Artificial Dr. Renato Salinas 11


Conectividad
La conectividad entre pixeles es importante para
determinar los componentes en una imagen y los bordes
de los objetos.
Los pixeles conectables deben tener niveles de gris
similares y ubicaciones cercanas.
Sea V el conjunto de niveles de grises usado para definir
conectividad ( por ejemplo, V= {1} para una imagen binaria)
4-CONECTIVIDAD: dos pixeles p y q con valores en
V estn 4-conectados si q est en el conjunto N4(p).
8-CONECTIVIDAD: dos pixeles p y q con valores en
V estn 8-conectados si q est en el conjunto N8(p).

Visin Artificial Dr. Renato Salinas 12


Adyacencia
Dos pixeles son Adyacentes si estn Conectados.
Podemos definir 4-, 8-, o m-adyacencia dependiendo
del tipo de conectividad especificada.
Se dice que dos subconjuntos (S1 y S2) son
adyacentes si algn pixel en S1 es adyacente a algn
pixel en S2.

Visin Artificial Dr. Renato Salinas 13


Caminos
Un CAMINO desde un pixel p con coordenadas (x,y) a un
pixel q con coordenadas (s,t) es una secuencia de n+1
pixeles con coordenadas: (x0,y0), (x1,y1), , (xn,yn),
donde (x0,y0) = (x,y) y (xn,yn)=(s,t), tal que cada pixel es
adyacente con a lo menos un pixel del camino
(la excepcin puede estar dada por los posibles pixeles
extremos del camino, si es un camino abierto)
Dos pixeles p y q en un subconjunto S estn conectados
en S si existe un camino desde p a q formado por pixeles
pertenecientes a S.
Para cualquier pixel p en S, el conjunto de pixeles de S
conectados a p se denominada componente conectado.
Componentes conectados distintos son disjuntos.

Visin Artificial Dr. Renato Salinas 14


Etiquetado de componentes
4-conectados
Considere un imagen binaria, con objetos representados por 1s. Sea un
barrido desde la parte superior fila por fila. Cada pixel objeto ser analizado y
asignado una etiqueta, nica para cada objeto.
Si (valor de) p es 0, avance a la siguiente posicin en imagen.
Si p es 1, examine r y t.
Si ambos son 0, asigne nueva etiqueta a p;
Si slo uno es 1, asigne su etiqueta a p;
Si ambos son 1 y tienen etiquetas iguales, asigne su
etiqueta a p;
Si ambos son 1 y tienen distintas etiquetas, asigne una de las
etiquetas a p y anote la equivalencia entre dichas etiquetas.
Al final del primer barrido, todos los pixeles-objeto estarn
etiquetados. En un segundo barrido, todas las etiquetas equivalentes
son reemplazadas por la etiqueta escogida para la clase de
equivalencias.
Visin Artificial Dr. Renato Salinas 15
Ejemplos
000000 000000
En el primer ejemplo, slo se
011110 0aaaa0 necesita un barrido sobre la
imagen, ya que no hay etiquetas
000110 000aa0 equivalentes
000000 000000
001100 00bb00

000000 000000 000000 En el 2o ejemplo, bRc y


cRd, entonces, por
011011 0aa0bb 0aa0bb transitividad, {b,c,d}
forman una sola clase
000110 000cb0 000bb0 equivalente, i.e., una
010100 0d0c00 0b0b00 sola etiqueta.
(arbitrariamente se le
011100 0ddc00 0bbb00 asign la etiqueta b)
Original Paso I Paso II
Visin Artificial Dr. Renato Salinas 16
Teorema de Jordan
Toda curva cerrada en el dominio continuo define dos regiones: una
regin interior y otra regin exterior. Ambas regiones estn
separadas por la curva.

Para evitar la paradoja de que un pixel al interior de una curva est


conectado con su exterior, debemos definir diferente tipo de
conectividad para los pixels-objeto y para los pixels-fondo.

Visin Artificial Dr. Renato Salinas 17


Medidas de Distancia

Para tres pixeles con coordenadas p en (x,y), q en (s,t), z en (u,v)


D es una funcin distancia o mtrica si se cumplen:
D(p,q) 0 (D(p,q) = 0 ssi p=q),
D(p,q) = D(q,p), y
D(p,z) D(p,q) + D(q,z)

La DISTANCIA EUCLIDEANA De se define por


De(p,q) = {(x-s)2 + (y-t)2}

Visin Artificial Dr. Renato Salinas 18


La DISTANCIA D4 (o de Bloques de Ciudad) se define por
D4(p,q) = |x-s| + |y-t|

La DISTANCIA D8 (o de Tablero de Ajedrez) se define por


D8(p,q) = mx(|x-s|, |y-t|)

La DISTANCIA Dm (o Distancia del m-camino) depende de los


valores de los pixeles a lo largo del camino, por lo que no se puede
dar una frmula. Las distancias De, D4, y D8 en cambio, dependen slo
de las coordenadas de p y q.

Visin Artificial Dr. Renato Salinas 19


Operaciones Aritmtico-Lgicas
La operaciones aritmticas sobre imgenes se realizan pixel a pixel.
Adicin (el promediar varias imgenes reduce el ruido)
Sustraccin (suele usarse para eliminar informacin esttica de
fondo en imgenes mdicas)
Multiplicacin (o divisin) (se usa para corregir variaciones de
nivel debidas a iluminacin no uniforme)

Las principales operaciones lgicas son el Y (AND), el O (OR), y la


Negacin (NOT). Con ellas podemos construir operaciones lgicas ms
complejas. Tambin operan pixel a pixel. La mayora de las operaciones
lgicas requieren de dos operandos (imgenes), excepto el NOT.
La operaciones aqu definidas operan sobre una posicin a la vez, y no
involucran varios pixeles vecinos, por lo que podran implementarse con
mltiples procesadores operando sobre los datos (SIMD).
Visin Artificial Dr. Renato Salinas 20
Ejemplo de operaciones lgicas sobre
imgenes binarias

Visin Artificial Dr. Renato Salinas 21


Generalizacin de las Operaciones
Lgicas
Las operaciones lgicas tradicionales operan sobre datos
binarios, usando Unin, Interseccin y Complemento. Si
definimos estas operaciones como sigue podemos ampliar su
empleo a imgenes en escalas de grises (supongamos imgenes
normalizadas al rango [0,1], es decir, si la escala de grises era de
0 a 255, dividimos cada pixel por el mximo). Entonces:
v(p) v(q) = mx (v(p), v(q))
v(p) v(q) = mn (v(p), v(q))
Complemento de v(p) = 1 - v(p)

Los operadores as definidos funcionan correctamente para


imgenes estrictamente binarias.

Visin Artificial Dr. Renato Salinas 22

Das könnte Ihnen auch gefallen