Elementos Percepcion

ELEMENTOS DE PERCEPCION
VISUAL
Visin Artificial Dr. Renato Salinas 1

UCN 2013
Receptores de luz: Conos y Bastoncillos
Receptores estn distribuidos en forma discreta sobre

el rea de la retina.
Conos: ~ 5 - 7 millones
Bastoncillos: ~ 75 - 150 millones
Nervios: ~1 milln (lo que implica un arreglo
receptor de 1000x1000)

Concentracin de Conos y Bastoncillos
Se puede apreciar que los conos estn concentrados

cerca del eje ptico

Adaptacin a la luminosidad
Con bajos niveles de

luminosidad se pierde la
visin en colores (conos).
El rango total en cada
instante es slo una pequea
porcin de la curva (nivel de
sensibilidad)
Rango de sensaciones subjetivas de iluminacin

Bandas de Mach
Ernst Mach (1865) descubri que el sistema visual

tiende a sobrevalorar o infravalorar la intensidad
cerca de los lmites de dos regiones con niveles de
gris distintos.
Un modelo de imagen
f(x,y) = i(x,y) r(x,y)

f: intensidad de la imagen
i: componente de iluminacin (luz)
r: componente de reflectancia (objeto)
i(x,y) Valor (cd/pie2) Material r(x,y) Valor
Da claro 9000 Terciopelo 0.01

negro
Da nublado 1000 Acero 0.65

inoxidable
Oficina 100 Nieve 0.93

Nivel de Gris
La intensidad de una imagen monocromtica se

denomina nivel de gris. Dicho nivel de gris estar
comprendido entre un valor mnimo y un mximo.
fmin < f < fmax
se suele mapear al rango 0 a L (0 = negro, L = blanco)
m
En el computador el rango de valores va desde 0 a 2 -1

Muestreo uniforme y cuantificacin
Una funcin de imagen f(x,y) debe ser digitalizada
espacialmente y en amplitud.
Muestreo: digitalizacin de las coordenadas espaciales
Cuantificacin: digitalizacin de la amplitud
F(0,0) F(0,1) F(0,N-1)
F(1,0)
f(i,j) =
F(i,j)
F(M-1,0) F(M-1, N-1)

Contornos Falsos y Pixelacin
Contornos falsos: fenmeno causado por un nmero
insuficiente de niveles de grises en reas suaves (variaciones de
nivel de gris suaves) de la imagen.
Pixelacin: se aprecia cuando la resolucin espacial es baja y
se observa la naturaleza discreta de los pixeles.

Resolucin Espacial Niveles de grises (16, 8, 4, 2)
Visin Artificial (1024,, 32) Dr. Renato Salinas 10
Relaciones Bsicas entre Pixeles
Dada la naturaleza discreta de las imgenes digitales, el anlisis
requiere definir relaciones de vecindad y conectividad.
Un pixel p con coordenadas (x,y) tiene cuatro vecinos ms

cercanos (horizontales y verticales), con coordenadas: (x-1,y),
(x+1,y), (x,y-1), (x,y+1). Este conjunto de pixeles se llama los
4-Vecinos de p, y se denota por N4(p).
Los cuatro vecinos diagonales de p, tienen coordenadas (x-1,y-1),
(x-1,y+1), (x+1,y-1), (x+1,y+1), y se denotan por ND(p).
La unin de las dos vecindades se conoce como los 8-Vecinos de
p se denota por N8(p).

Conectividad
La conectividad entre pixeles es importante para
determinar los componentes en una imagen y los bordes
de los objetos.
Los pixeles conectables deben tener niveles de gris
similares y ubicaciones cercanas.
Sea V el conjunto de niveles de grises usado para definir
conectividad ( por ejemplo, V= {1} para una imagen binaria)
4-CONECTIVIDAD: dos pixeles p y q con valores en
V estn 4-conectados si q est en el conjunto N4(p).
8-CONECTIVIDAD: dos pixeles p y q con valores en
V estn 8-conectados si q est en el conjunto N8(p).

Adyacencia
Dos pixeles son Adyacentes si estn Conectados.
Podemos definir 4-, 8-, o m-adyacencia dependiendo
del tipo de conectividad especificada.
Se dice que dos subconjuntos (S1 y S2) son
adyacentes si algn pixel en S1 es adyacente a algn
pixel en S2.

Caminos
Un CAMINO desde un pixel p con coordenadas (x,y) a un
pixel q con coordenadas (s,t) es una secuencia de n+1
pixeles con coordenadas: (x0,y0), (x1,y1), , (xn,yn),
donde (x0,y0) = (x,y) y (xn,yn)=(s,t), tal que cada pixel es
adyacente con a lo menos un pixel del camino
(la excepcin puede estar dada por los posibles pixeles
extremos del camino, si es un camino abierto)
Dos pixeles p y q en un subconjunto S estn conectados
en S si existe un camino desde p a q formado por pixeles
pertenecientes a S.
Para cualquier pixel p en S, el conjunto de pixeles de S
conectados a p se denominada componente conectado.
Componentes conectados distintos son disjuntos.

Etiquetado de componentes
4-conectados
Considere un imagen binaria, con objetos representados por 1s. Sea un
barrido desde la parte superior fila por fila. Cada pixel objeto ser analizado y
asignado una etiqueta, nica para cada objeto.
Si (valor de) p es 0, avance a la siguiente posicin en imagen.
Si p es 1, examine r y t.
Si ambos son 0, asigne nueva etiqueta a p;
Si slo uno es 1, asigne su etiqueta a p;
Si ambos son 1 y tienen etiquetas iguales, asigne su
etiqueta a p;
Si ambos son 1 y tienen distintas etiquetas, asigne una de las
etiquetas a p y anote la equivalencia entre dichas etiquetas.
Al final del primer barrido, todos los pixeles-objeto estarn
etiquetados. En un segundo barrido, todas las etiquetas equivalentes
son reemplazadas por la etiqueta escogida para la clase de
equivalencias.
Ejemplos
000000 000000
En el primer ejemplo, slo se
011110 0aaaa0 necesita un barrido sobre la
imagen, ya que no hay etiquetas
000110 000aa0 equivalentes
000000 000000
001100 00bb00
000000 000000 000000 En el 2o ejemplo, bRc y

cRd, entonces, por
011011 0aa0bb 0aa0bb transitividad, {b,c,d}
forman una sola clase
000110 000cb0 000bb0 equivalente, i.e., una
010100 0d0c00 0b0b00 sola etiqueta.
(arbitrariamente se le
011100 0ddc00 0bbb00 asign la etiqueta b)
Original Paso I Paso II
Teorema de Jordan
Toda curva cerrada en el dominio continuo define dos regiones: una
regin interior y otra regin exterior. Ambas regiones estn
separadas por la curva.
Para evitar la paradoja de que un pixel al interior de una curva est

conectado con su exterior, debemos definir diferente tipo de
conectividad para los pixels-objeto y para los pixels-fondo.

Medidas de Distancia
Para tres pixeles con coordenadas p en (x,y), q en (s,t), z en (u,v)

D es una funcin distancia o mtrica si se cumplen:
D(p,q) 0 (D(p,q) = 0 ssi p=q),
D(p,q) = D(q,p), y
D(p,z) D(p,q) + D(q,z)
La DISTANCIA EUCLIDEANA De se define por

De(p,q) = {(x-s)2 + (y-t)2}

La DISTANCIA D4 (o de Bloques de Ciudad) se define por
D4(p,q) = |x-s| + |y-t|
La DISTANCIA D8 (o de Tablero de Ajedrez) se define por

D8(p,q) = mx(|x-s|, |y-t|)
La DISTANCIA Dm (o Distancia del m-camino) depende de los

valores de los pixeles a lo largo del camino, por lo que no se puede
dar una frmula. Las distancias De, D4, y D8 en cambio, dependen slo
de las coordenadas de p y q.

Operaciones Aritmtico-Lgicas
La operaciones aritmticas sobre imgenes se realizan pixel a pixel.
Adicin (el promediar varias imgenes reduce el ruido)
Sustraccin (suele usarse para eliminar informacin esttica de
fondo en imgenes mdicas)
Multiplicacin (o divisin) (se usa para corregir variaciones de
nivel debidas a iluminacin no uniforme)
Las principales operaciones lgicas son el Y (AND), el O (OR), y la

Negacin (NOT). Con ellas podemos construir operaciones lgicas ms
complejas. Tambin operan pixel a pixel. La mayora de las operaciones
lgicas requieren de dos operandos (imgenes), excepto el NOT.
La operaciones aqu definidas operan sobre una posicin a la vez, y no
involucran varios pixeles vecinos, por lo que podran implementarse con
mltiples procesadores operando sobre los datos (SIMD).
Ejemplo de operaciones lgicas sobre
imgenes binarias

Generalizacin de las Operaciones
Lgicas
Las operaciones lgicas tradicionales operan sobre datos
binarios, usando Unin, Interseccin y Complemento. Si
definimos estas operaciones como sigue podemos ampliar su
empleo a imgenes en escalas de grises (supongamos imgenes
normalizadas al rango [0,1], es decir, si la escala de grises era de
0 a 255, dividimos cada pixel por el mximo). Entonces:
v(p) v(q) = mx (v(p), v(q))
v(p) v(q) = mn (v(p), v(q))
Complemento de v(p) = 1 - v(p)
Los operadores as definidos funcionan correctamente para

imgenes estrictamente binarias.

Elementos Percepcion

Hochgeladen von

Dokumentinformationen

Copyright

Verfügbare Formate

Dieses Dokument teilen

Dokument teilen oder einbetten

Freigabeoptionen

Stufen Sie dieses Dokument als nützlich ein?

Sind diese Inhalte unangemessen?

Copyright:

Verfügbare Formate

Elementos Percepcion

Hochgeladen von

Copyright:

Verfügbare Formate

ELEMENTOS DE PERCEPCION

Visin Artificial Dr. Renato Salinas 1

Receptores estn distribuidos en forma discreta sobre

Visin Artificial Dr. Renato Salinas 2

Se puede apreciar que los conos estn concentrados

Visin Artificial Dr. Renato Salinas 3

Con bajos niveles de

Rango de sensaciones subjetivas de iluminacin

Visin Artificial Dr. Renato Salinas 4

Ernst Mach (1865) descubri que el sistema visual

f(x,y) = i(x,y) r(x,y)

Da claro 9000 Terciopelo 0.01

Da nublado 1000 Acero 0.65

Oficina 100 Nieve 0.93

La intensidad de una imagen monocromtica se

Visin Artificial Dr. Renato Salinas 7

F(0,0) F(0,1) F(0,N-1)

F(M-1,0) F(M-1, N-1)

Visin Artificial Dr. Renato Salinas 8

Visin Artificial Dr. Renato Salinas 9

Un pixel p con coordenadas (x,y) tiene cuatro vecinos ms

Visin Artificial Dr. Renato Salinas 11

Visin Artificial Dr. Renato Salinas 12

Visin Artificial Dr. Renato Salinas 13

Visin Artificial Dr. Renato Salinas 14

000000 000000 000000 En el 2o ejemplo, bRc y

Para evitar la paradoja de que un pixel al interior de una curva est

Visin Artificial Dr. Renato Salinas 17

Para tres pixeles con coordenadas p en (x,y), q en (s,t), z en (u,v)

La DISTANCIA EUCLIDEANA De se define por

Visin Artificial Dr. Renato Salinas 18

La DISTANCIA D8 (o de Tablero de Ajedrez) se define por

La DISTANCIA Dm (o Distancia del m-camino) depende de los

Visin Artificial Dr. Renato Salinas 19

Las principales operaciones lgicas son el Y (AND), el O (OR), y la

Visin Artificial Dr. Renato Salinas 21

Los operadores as definidos funcionan correctamente para

Visin Artificial Dr. Renato Salinas 22

Das könnte Ihnen auch gefallen