Beruflich Dokumente
Kultur Dokumente
INTRODUCCIN
Actualmente
se
desarrollan
sistemas
de
visin
por
computadora, para utilizarse como herramientas de trabajo en diversas reas tales como: medicina, vigilancia, control de calidad, inspeccin industrial, robtica, espacio, radares, etc., en estas reas existen actividades que requieren una gran cantidad de tiempo para resolver un problema especfico, sin embargo estos sistemas ayudan en la reduccin de tiempo para llevar a cabo dichas actividades. Los sistemas desarrollados son considerados herramientas de gran utilidad donde la inspeccin visual es difcil, tediosa o peligrosa para un humano.
La
visin
es una
tecnologa de los
creciendo,
bsicamente
dispositivos: dispositivos para capturar imgenes, sistemas de iluminacin que aseguren la calidad de la imagen,
computadoras y software que pueda hacer la manipulacin de las imgenes adquiridas, de tal forma que se pueda hacer el reconocimiento de las caractersticas en la imagen.
Es por todo esto que el desarrollo del contenido de esta monografa est organizado de la siguiente manera: En el captulo I se habla del concepto e historia de sistemas de visin por computadora, en el captulo II se aborda los principales elementos que conforma un sistema de visin por computadora, en el captulo III se describen las diferentes etapas que conforman un sistema de visin por computadora y por ltimo en el captulo IV se mencionan algunas reas de aplicacin de un sistema de visin por computadora en la actualidad.
VI
NDICE GENERAL
Pgi Introduccin ndice . Lista de general Captulo I: figuras 1.1 Introduccin 1.2 Concepto de visin por Historia 1.3 Visin humana y visin por computadora.. Captulo II: Elementos de un sistema de visin por computadora. 2.1 computadora. 2.2 Imagen Iluminacin
VII
V na VI IX 11 12 15 17 21 22 26
2.3 2.4 pticas 2.5 Tarjetas de Cmaras Captulo III: Etapas de un sistema de visin por adquisicin 3.1 Captacin de computadora 3.2 Procesamiento de imagen. 3.2.1 Realce de la imgenes 3.2.2 Deteccin de imagen. 3.2.3 Eliminacin de bordes 3.3 ruidos 3.3.1 Tcnica basada en Segmentacin 3.3.2 Tcnica basada en umbralizacin. 3.3.3 Tcnica orientada a bordes. 3.4 regiones.. Representacin y 3.5 Reconocimiento e descripcin 3.5.1 Elementos de anlisis de interpretacin 3.5.2 Patrones y clases de imgenes.. 3.5.3 patrones.. Captulo IV: Interpretacin 4.1 Aplicaciones Medicina
28 31 39 41 42 43 44 45 46 48 51 52 53 5 55 4 56 57 57 59 59
VIII
4.2 Control de calidad en la 4.3 industria.. 4.4 Identificacin de Robtica 4.5 Seguridad y personas.. Conclusin vigilancia Bibliografa . .
61 64 67 69 70 71
LISTA DE FIGURAS
Pgin a Figura 1.1: Visin por computadora versus visin humana. 20 Figura 2.1: Elementos de un sistema de visin 21 Figura 2.2: Una imagen analgica y su conversin a una imagen digital. 22 23 Figura 2.3: Proceso de digitalizacin de una imagen distintas resoluciones 24
IX
Figura 2.5: Cuatro representaciones de una misma imagen con distintas profundidad de bits.. Figura 2.6: Ejemplo de iluminacin. Figura 2.7: Ejemplo de ptica.. Figura 2.8: Sensor CDD. 35 Figura 2.9: Sensor CMOS.. 36 Figura 2.10: Tarjetas digitalizadoras.. 40 Figura 3.1: Etapas de una aplicacin basada en la visin por computadora . .. 41 42 Figura 3.2: Captacin de imagen Figura 3.3: Ejemplo de realzado de la imagen. 44 Figura 3.4: Ejemplo de obtencin de los bordes de una imagen.. Figura 3.5: Ruido Gaussiano. 47
X
25 27 29
46
Figura 3.6: Ruido Sal y Pimienta Figura 3.7: Ejemplo de eliminacin de ruido.. 48 Figura 3.8: Ejemplo de segmentacin de imgenes..
6
47
49 51
Figura 3.9: Segmentacin por umbralizacin.. Figura 3.10: Segmentacin basada en bordes.. Figura 3.11: Segmentacin orientada a 52
regiones 53 Figura 3.12: Imagen de un poisedon y una sirena en la misma escena........ 54 Figura 3.13: (a) Ejemplo de etiquetado de una imagen.. 55 Figura 3.13: (b) Ejemplo de reconocimiento de objetos. 55 Figura 3.14: Reconocimiento e interpretacin Figura 4.1: Ejemplo de aplicacin en la medicina. X. Figura 4.3: Ejemplo de 60 60 59 58
XI
Figura 4.5: Figura: 4.4: Robots trabajando en la industria. 67 Figura 4.6: Ejemplo de reconocimiento de caras 68 Figura 4.7: Ejemplo de identificacin por huella digital. 69 Figura 4.8: Ejemplo de seguridad y vigilancia a travs de captacin de imgenes por cmaras. 69
XII
CAPTULO I: INTRODUCCIN
Uno de los sentidos ms importantes de los seres humanos es la visin. sta es empleada para obtener la informacin visual del entorno fsico. Segn Aristteles, Visin es saber que hay y donde mediante la vista, de hecho, se calcula que ms de 70% de las tareas del cerebro son empleadas en el anlisis de la informacin visual.
El refrn popular de una imagen vale ms que mil palabras tiene mucho que ver con los aspectos cognoscitivos de la especie humana. Casi todas las disciplinas cientficas emplean un conjunto de grficos para transmitir conocimiento. Se podra hacer mediante texto, pero para la especie humana resulta mucho ms eficiente procesar imgenes que procesar texto.
11
La visin humana es el sentido ms desarrollado y el que menos se conoce debido a su gran complejidad. Es una actividad inconsciente y difcil de saber cmo se produce. El uso de nuestro sistema de visin est integrado a un sofisticado sistema de control que incluye desde el ajuste del sistema de lentes del ojo para focalizar la imagen en la retina, hasta los clculos precisos que realiza para saber donde caer la pelota en un partido de ftbol.
Para construir un sistema de visin artificial, se tiene que recurrir a los elementos equivalentes a la visin natural para construir con artefactos, mquinas, equipos y sistemas que vean y acten en funcin de lo que ven. Como ejemplo se puede pensar en un operador de fbrica cuya funcin es retirar, de la lnea de produccin, todos los productos con defectos; y sustituido por una mquina que haga exactamente lo mismo.
12
1.1 HISTORIA
Los sentidos son los medios de los que dispone el ser humano para interactuar con el entorno que le rodea y la visin es uno de los mecanismos sensoriales de percepcin ms importante en el ser humano. Debido a la importancia del sentido de la vista humana y con la aparicin de las primeras computadoras, una de las primeras aplicaciones en la que se investig fue en la visin por computadora.
Los
primeros
trabajos
relacionados
con
la
visin
por
computadora datan de la dcada de 1950. El entusiasmo inicial fue tan grande debido principalmente a una gran confianza en las posibilidades de las computadoras y porque para el hombre la accin de ver es una tarea sencilla, e igual debera suceder para las computadoras. Aos despus, ese entusiasmo
13
Aunque en los aos sesenta se desarrollaron algoritmos que son utilizados hoy en da, como los detectores de bordes de Roberts (1965), Sobel (1970) y Prewitt (1970), su funcionamiento estaba muy limitado a un reducido nmero de imgenes y casos. Es por ello que en los aos setenta hubo un abandono progresivo en la investigacin.
A partir de la dcada de los ochenta se empieza a hacer hincapi en la extraccin de caractersticas. As se tiene la deteccin de texturas (Haralik (1979)), y la obtencin de la forma a travs de ellas (Witkin (l98l)). En ese mismo ao, 1981, se publican artculos sobre visin estreo (Mayhew y Frisby), deteccin del movimiento (Horn), interpretacin de formas (Steven) y lneas (Hanade); o los detectores de esquinas de Kitchen y Rosendfeld (1982). Quiz el trabajo ms importante
14
de esa dcada es el libro de David Marr (Visin: a computacional investigation into the human reprentation and processing of cisual information, 1982) donde se abordaba por primera vez una metodologa completa del anlisis de imgenes a travs de la computadora.
A partir de esta dcada la visin por computadora toma de nuevo inters y empieza a ser una de las principales lneas de investigacin en muchas universidades. Como confirmacin de este nuevo inters aparece en revistas especializadas, aumenta el nmero de congresos dedicados a la visin por computadora, aparecen asignaturas en los planes de estudio de las
universidades, etc.
Los principales motivos de este crecimiento se debe en gran parte a un enfoque ms realista del problema a resolver, al desarrollo de las computadoras (aumento de la capacidad de
15
El trmino Visin por Computadora dentro del campo de la Inteligencia Artificial puede considerarse como el conjunto de todas aquellas tcnicas y modelos que permiten el
procesamiento, anlisis y explicacin de cualquier tipo de informacin especial obtenida a travs de imgenes digitales.
A continuacin se enumeran diferentes conceptos de visin por computadora, que es lo mismo decir visin artificial o visin por computador.
16
Ciencia que desarrolla la base terica y algortmica mediante la que se extrae y analiza informacin til sobre el mundo / entorno, a partir de una imagen.
Visin es un proceso que produce, a partir de imgenes del mundo externo, una descripcin que es til para el observador y que est libre de informacin irrelevante.
La Visin Artificial describe la deduccin automtica de las estructuras y propiedades de un mundo tridimensional, posiblemente dinmico, a partir de una o varias imgenes bidimensionales de l.
17
En resumen, la visin por computadora es la ciencia que estudia la interpretacin de imgenes mediante computadores, que pretende los siguientes objetivos:
Inspeccionar los objetos: Correctos e incorrectos. Localizar objetos. 1.3 VISIN HUMANA Y VISIN POR COMPUTADORA
El hombre ha imitado muchas veces, en la construccin de sus artefactos, a la naturaleza, la visin por computadora intenta copiar la manera cmo los seres humanos perciben la
informacin visual por medio de usar cmaras fotogrficas que actan como globos oculares y computadoras para procesar la informacin de una manera inteligente al igual que el cerebro humano. Las cmaras con sus pticas hacen las veces del globo
18
ocular,
mientras
la
computadora
realiza
las
tareas
de
Cuando se establecieron en la dcada de los 50, los objetivos de la Inteligencia Artificial, se supona que con la llegada del siglo XXI habra mquinas que seran capaces de describir, con informacin de alto nivel, las escenas capturadas. Con el paso del tiempo se vio que aquel anhelo se iba desvaneciendo.
Hoy en da, todava no hay una teora de la visin. No se conocen los mecanismos que el cerebro utiliza para obtener la informacin de la percepcin.
El cerebro es capaz, de manera inconsciente, de determinar la distancia a los objetos, de reconocerlos en diferentes
posiciones, aunque se encuentren rotados y con informacin parcialmente oculta. En definitiva, el cerebro presenta una
19
sofisticacin en la percepcin que ni ahora ni en mucho tiempo habr posibilidad de implementar artificialmente.
Lo que s hace la visin por computadora es construir nuevos y ms sofisticados algoritmos que sean capaces de obtener informacin de bajo nivel visual. Y aunque todava se est aos luz de la percepcin visual de los seres vivos, la visin artificial es muy eficaz en tareas visuales repetitivas para el hombre. Por ejemplo, en el campo de la inspeccin de productos en la industria o en contar clulas en una imagen de microscopa o en determinar la trayectoria de un vehculo en una autopista, etc.
Resumiendo, las principales ventajas de la visin humana respecto a la de computadora y viceversa (vase la figura 1.1), son:
20
Sistema humano:
Mejor reconocimiento de objetos. Mejor adaptacin a situaciones imprevistas. Utilizacin de conocimiento previo. Mejor en tareas de alto nivel de proceso.
Mejor para la realizacin de tareas rutinarias. Mejor en tareas de bajo nivel de proceso.
Objetos muy pequeos o muy grandes. Detalles con alta resolucin. Cuerpos muy cercanos o muy alejados. Entornos muy oscuros o muy iluminados.
21
Entornos peligrosos. Tareas rutinarias y repetitivas. Aumento de la objetividad. Elevado nmero de imgenes a visualizar.
Dotar de percepcin visual a sistemas autnomos. Sustitucin del ser humano por rentabilidad.
22
En este captulo se definen y describen los elementos bsicos que conforma el sistema de visin por computadora. Para
desarrollar una aplicacin que requiera el anlisis de imgenes por computadora se tiene disponible un amplio conjunto de elementos que van desde las fuentes de luz necesarias para iluminar los objetos hasta los algoritmos encargados de
SISTEMA DE ILUMINACION
COMPUTADORA
TARJETA DE ADQUISICION
23
ESCENA
2.1 IMAGEN
Una imagen es un registro de valores organizados en forma bidimensional, generalmente representando intensidad de
radiacin electromagntica.
Para que una imagen analgica (una imagen natural captada con una cmara, en blanco y negro, en escala de grises, o a color, pueda ser procesada mediante una computadora, es preciso someter a la imagen analgica (ver figura 2.2 (a)) a un proceso de discretizacin, tanto espacialmente como en
intensidad para obtener la imagen digital (ver figura 2.2 (b)). En donde la unidad mnima de informacin es el pxel.
24
(b)
Matriz
numrica
tras
la
La transformacin de una imagen analgica a otra discreta se llama digitalizacin y es el primer paso en cualquier aplicacin de procesamiento de imgenes digitales. El proceso de
El muestreo consiste en una subdivisin de la imagen analgica en porciones, es la parte encargada de integrar en puntos la informacin que se halla en un rea determinada. Estos puntos en los que se integra el rea son los elementos ms pequeos en que se divide una imagen: los pxeles.
25
La cuantificacin consiste en codificar digitalmente el color integrado en cada pxel. La meta de la cuantificacin es cambiar la resolucin de color de una imagen (nmero de bits en la representacin del color) con una distorsin mnima.
La resolucin de una imagen, o tambin denominada resolucin espacial, se refiere a la cantidad de pxeles de una imagen por pulgada (ppi). Dicho con un ejemplo prctico, si una imagen tiene una resolucin de 100 ppi, significa que contiene 10,000 pxeles en una pulgada cuadrada (100 pxeles de ancho por 100 pxeles de alto). Cuanto mayor sea la resolucin de las imgenes mayor nmero de pxeles contendrn y por tanto mayor calidad se obtiene.
26
La resolucin ms adecuada para una imagen depende de lo que se vaya a hacer con dicha imagen. A continuacin se muestra un ejemplo (ver figura 2.4) de la misma imagen pero con diferentes resoluciones, manteniendo el rango de niveles de intensidad entre 0 y 128.
(d)
Figura 2.4: Cuatro representaciones de una misma imagen con distintas resoluciones.
La profundidad de pxeles, es el nmero de bits de informacin almacenados por pxel. La profundidad de pxeles determina cuanta informacin de color (o nivel de gris) existe para cada pxel de la imagen. Un pxel con una profundidad de bits de 1 tiene dos valores posibles: 0 y 1, por ejemplo blanco y negro.
27
Con una profundidad de 8 bits hay 256 valores posibles y con una profundidad de 24 bits se obtienen 16,7 millones de valores posibles.
En la figura 2.5 se muestran cuatro imgenes que tienen todas, una resolucin de 200x320 pxeles, pero donde la profundidad de bits vara. La figura 2.5 (a) tiene 64 niveles de gris, que son 6 bits de profundidad, la figura 2.5 (b) posee 32 niveles de gris (5 bits de profundidad), la figura 2.5 (c) solamente tiene 8 niveles de gris (3 bits) y la figura 2.5 (d) tiene 2 niveles de grises, que en realidad sern el blanco y el negro.
(a) Imagen con 6 bits de (b) Imagen con 5 bits de Imagen con 1 bits de Profundidad Profundidad Profundidad
(d)
Figura 2.5: Cuatro representaciones de una misma imagen con distintas profundidad de bits.
28
2.2 ILUMINACIN
La iluminacin es importante durante el procesamiento de imgenes, ya que una iluminacin deficiente hace ms difcil de interpretar a dicho objeto en una escena.
La iluminacin juega un papel primordial dentro del proceso de visin, ya que una iluminacin deficiente hace ms difcil de interpretar al objeto en una escena (pues simplifica
considerablemente el anlisis y la interpretacin de la escena). Las imgenes recibidas por las cmaras no pueden estar, generalmente, en un ambiente de iluminacin no adecuada, esto es, donde las condiciones de iluminacin no hayan sido estudiadas. En estos casos, la propia sombra de otro objeto que interfiera har peligrar el xito del montaje.
Los sistemas de visin por computadora trabajan, normalmente, con iluminaciones estructuradas (adecuadas). El espacio
29
captado por las cmaras est aislado del resto, en donde no hay contaminacin lumnica, no hay sombras inesperadas, no existen objetos que interseccionen a los escenarios que se desean capturar. La iluminacin se disea para que sea capaz de resaltar los objetos de inters. La iluminacin depende bsicamente de la naturaleza de las superficies donde se va a reflejar y del tipo de fuente luminosa (Ver figura 2.6).
Tcnicas de iluminacin Existen muchas tcnicas de iluminacin y resulta difcil de generalizar sobre los distintos tipos de iluminacin, ya que suele
30
Iluminacin direccional Iluminacin difusa Iluminacin a contraluz Iluminacin estructurada Iluminacin polarizada Aspectos a considerar en la iluminacin
Variacin de la iluminacin en pequeos periodos de tiempo. Alimentacin contina, alimentacin alterna en alta
frecuencia y sincronizacin. Variacin de la iluminacin en largos periodos de tiempo. Arranque y autocalibracin. Temperatura y disposicin fsica. Fuentes luminosas de alta precisin.
31
2.3 PTICAS
La ptica es el elemento del sistema de visin que permite concentrar los rayos luminosos del entorno sobre el plano sensor. Una vez definido el sistema de iluminacin, la eleccin de la ptica influir en la calidad de la imagen recibida y del tamao de los objetos.
32
Enfoque. Actuando sobre el enfoque se puede conseguir una imagen ms o menos ntida. Las pticas comerciales se pueden clasificar por el enfoque en: pticas fijas, pticas variables y pticas motorizadas. Estas ltimas disponen de un motor de forma que se puede enfocar o bien de forma automtica o bien de forma teleoperada.
Iris o apertura. El dispositivo de apertura est formado de lminas muy delgadas dispuestas de tal manera que en el centro se forma un crculo por el que puede entrar la luz. Abriendo o cerrando el iris entrar ms o menos luz, haciendo que la imagen sea ms clara o ms oscura. Cerrando el iris tambin se aumenta la profundidad de campo y se disminuyen las aberraciones de la lente, sin embargo se tendr que iluminar ms la escena. El iris puede ser manual, automtico (autoiris) o motorizado. Las pticas con auto iris tienen un motor, al igual que las
33
motorizadas, pero sta no se controla por un usuario a distancia, sino por la propia cmara. La cmara regular el auto iris abrindolo o cerrndolo en funcin de la cantidad de luz que est recibiendo.
Zoom. Las pticas con zoom permiten, mediante dos conjuntos de lentes que se pueden acercar o separar, hacer que la escena aparezca ms prxima. De esta manera se puede fijar en detalles que a simple vista no se aprecian, pudiendo tener una vista general de la escena o en detalles concretos, realizando una magnificacin de la imagen. El efecto de aumentar el zoom es la disminucin del ngulo de vista. Las pticas pueden ser con o sin zoom y stas pueden ser manuales o motorizadas.
34
A la hora de comprar una ptica en el mercado para un sistema de visin hay que tener claro las necesidades del proyecto. El precio de la ptica puede variar en funcin de sus
Distancia focal f.
2.4 CMARAS
Las cmaras de video han tenido una rpida evolucin en los ltimos aos, desde las primeras cmaras de video que iban
35
equipadas con tubos Vidicon hasta las ms modernas cmaras provistas de sensores CCD y CMOS. Hay dos tipos principales de cmaras que se utilizan en sistemas de visin por computadoras: Cmaras Matriciales y Cmaras Lineales.
Cada uno de estos tipos de cmaras se describir por separado y se consideran generalmente tecnologas completamente distintas. Sin embargo hay muchas caractersticas que se superponen en ambos tipos de cmaras.
Cmaras Matriciales Trmino que se refiere a que el sensor de la cmara cubre un rea o que est formado por una matriz de pxeles.
Una cmara matricial produce una imagen de un rea, normalmente con una relacin de aspecto de 4 a 3. Esta
36
relacin viene de los tiempos de las cmaras Vidicon y de los formatos de cine y televisin. Actualmente existen muchas cmaras que ya no mantienen esta relacin y que no siguen los formatos de la televisin.
Cmaras Lineales El concepto de barrido lineal se asocia a la construccin de una imagen lnea a lnea, utilizando un sensor lineal de forma que la cmara se desplaza con respecto al objeto a capturar, o bien el objeto se desplaza con respecto a la cmara. La utilizacin de cmaras lineales sin ser compleja requiere de una mayor experiencia en los entornos de visin que la utilizacin de cmaras matriciales.
La tecnologa de cmaras lineales hace mucho tiempo que fue desarrollada para aplicaciones de inspeccin de materiales fabricados en continuo, como papel, tela, planchas metlicas,
37
etc. Sin embargo en la actualidad se est imponiendo en muchos otros procesos productivos y de inspeccin, que requieren alta resolucin y / o alta velocidad a un precio competitivo.
Las cmaras lineales utilizan sensores lineales que acostumbran a tener entre los 512 y 8192 elementos (pxeles), con una longitud lo ms corta posible, y con una gran calidad con el fin de obtener la mejor sensibilidad y prestaciones.
Con la tecnologa de cmaras lineales es posible capturar objetos de grandes dimensiones en una sola pasada, mientras que con cmaras matriciales este mismo objeto debera ser dividido en una secuencia de imgenes parciales.
38
El sensor de imagen de la cmara se encarga de transformar la luz en seales elctricas. Cuando se fabrica una cmara, existen dos tecnologas de sensor de imagen disponibles:
complementario)
Los
sensores
CCD
se
fabrican
usando
una
tecnologa
desarrollada especficamente para la industria de cmaras, mientras que los sensores CMOS se basan en una tecnologa estndar ampliamente utilizada en los chips de memoria como por ejemplo, dentro de una PC.
Tecnologa CCD
39
Los sensores CCD (ver figura 2.8) llevan utilizndose en las cmaras desde hace ms de 20 aos y presentan muchas ventajas de calidad, entre las cuales cabe destacar una mejor sensibilidad a la luz que los sensores CMOS. Esta mayor sensibilidad a la luz se traduce en mejores imgenes en situaciones de luz escasa. Sin embargo, los sensores CCD son caros ya que estn fabricados siguiendo un proceso no estandarizado y ms complejo para ser incorporados a una cmara. Adems, cuando existe un objeto muy luminoso en la escena (como, por ejemplo, una lmpara o la luz solar directa), el CCD puede tener prdidas, provocando rayas verticales por encima y por debajo del objeto.
40
Tecnologa CMOS Los recientes avances en los sensores CMOS (ver figura 2.9) los acercan a sus homlogos CCD en trminos de calidad de la imagen, pero siguen siendo inadecuados para cmaras donde se exige la mxima calidad de imagen posible.
Una de las limitaciones actuales de los sensores CMOS es su menor sensibilidad a la luz. En condiciones de luz normales esto no supone ningn problema, mientras que en situaciones de escasa luz se vuelve manifiesto. El resultado es una imagen muy oscura o una imagen con apariencia granular.
41
Eleccin de una cmara Muchos son los aspectos que pueden influir en la eleccin de una cmara a otra. Sin embargo, algunas consideraciones han de tenerse en cuenta para no arrepentirse de la compra o para no gastarse ms dinero del que realmente hace falta.
Normalmente, la eleccin de la cmara va ntimamente ligada a la de la ptica. Las caractersticas tcnicas son las ms importantes y las que siempre se tendr presente a la hora de adquirir una cmara. A continuacin se enumeran algunas de ellas.
Formato de video EI formato de la seal es importantsimo ya que tanto las cmaras como las digitalizadoras y, a veces, los monitores
42
En Europa se tiene el sistema PAL (Phase Alternating Line, en espaol lnea alternada en fase) o CCIR (Comit Consultivo Internacional de Radiocomunicaciones) que ser siempre al que se haga referencia. En los pases francfonos se emplea el sistema SECAM (Color secuencial con memoria) y en el continente Americano y Japn el sistema NTSC (National Television System(s) Committee). Otro tipo de cmaras que no sigue ninguno de estos formatos son las llamadas cmaras digitales que envan la informacin al digitalizador en formato digital codificado segn el formato de cada fabricante, aunque se est extendiendo el protocolo IEEE 1394 o FireWire. Si se adquiere una cmara de este tipo hay que tener en cuenta que son mucho ms caras y que no todos los computadores tienen este puerto, aunque ofrecen
numerosas ventajas.
43
Resolucin Una imagen en el sistema CCIR est formada por 576 filas y 768 columnas, sin embargo, el tamao del CCD puede ser mayor o menor. La norma es que cuantos ms pxeles disponga el CCD mayor ser la calidad de la imagen. Otro factor a tener en cuenta, en la resolucin, es el nmero de bits con que se digitaliza el pxel. Lo normal en cmaras digitales es emplear 8 bits, aunque existen cmaras de hasta 16 bits por pxel.
2.5
TARJETAS DE ADQUISICIN
El nombre tarjeta digitalizadora (vase figura 2.10) no es correcto del todo, ya que sta incluye operaciones de
44
Sin embargo, este trmino es ampliamente aceptado por razones histricas, pues al principio estas tarjetas no hacan ms que digitalizar la imagen y era el computador el encargado de procesarlas.
Una tarjeta digitalizadora o frame grabber tiene como propsito principal muestrear, en tiempo real, la salida estndar de una cmara de vdeo, pasando la informacin a la computadora. La informacin es almacenada temporalmente y una vez all la informacin es procesada siguiendo las directrices de un programa.
Dependiendo de la aplicacin, la tarjeta puede ser programada para capturar y almacenar cuadros individuales, recoger una cierta secuencia de cuadros o quizs leer de manera continua la imagen de vdeo y realizar una tarea determinada en tiempo real. Algunas tarjetas tienen caractersticas avanzadas como puede ser captura sncrona de las imgenes.
45
Las digitalizadoras con capacidades para el procesamiento en tiempo real derivan sus prestaciones de los procesadores digitales de seal (DSP). stos pueden realizar procesamientos bsicos sobre la seal de una manera encadenada y en tiempo real.
46
El desarrollo de una aplicacin basada en la visin por computadora se puede dividir en seis etapas, tal como lo muestra el esquema de la figura 3.1, en donde las flechas coloreadas indican el orden en las etapas, mientras que las flechas sin colorear significan que en cada etapa se actualiza el conocimiento del problema con la informacin que se extrae en la misma. Aunque el orden que se marca es secuencial, a veces y dependiendo de los objetivos del problema no se tiene que pasar por todas las etapas o incluso realizar una realimentacin si es necesario. Cada una de las etapas que conforman el sistema de visin se describen a continuacin.
Conocimiento del problema
Extraccin de caractersticas Segmentacin
Preprocesamient o
Descripcin de objetos
47
Adquisicin de Imagen
Reconocimiento
Figura 3.1: Etapas de una aplicacin basada en la visin por computadora. 3.1
CAPTACIN DE IMGENES
La primera etapa del proceso es la adquisicin de la imagen, es decir la adquisicin de una imagen digital. Para la adquisicin digital de imgenes se necesitan dos elementos. El primero de ellos es un dispositivo fsico sensible a una determinada banda del espectro de energa electromecnica (como las bandas de rayos X, ultravioleta, visible o infrarrojo) y que produzca una seal elctrica de salida proporcional al nivel de energa detectado.
48
El segundo, denominado digitalizador, es un dispositivo para convertir la seal de salida del sistema sensible a forma digital. sta es transmitida hasta el computador, ya sea para su monitorizacin o procesamiento.
PROCESAMIENTO DE IMGENES
Una vez preparada la escena para ser capturada por las cmaras de visin por computadora, se deber de tratar el aspecto tanto de cuantificacin como de codificacin que sufre la seal de vdeo al ser introducida en la computadora. Esta etapa, trata de obtener una nueva imagen que o bien mejore su
49
Esta etapa pretende mejorar o realzar las propiedades de la imagen para facilitar las siguientes operaciones del sistema de visin por computadora, tales como las etapas de
En el primer aspecto se tratarn de corregir las posibles faltas de iluminacin uniforme, la eliminacin del ruido o de aumentar el contraste en la imagen. Mientras en el segundo, su objetivo es realzar los bordes de los objetos, regularizar sus colores, destacar sus texturas, etc.
continuacin
se
describen
las
principales
tcnicas
de
procesamiento de imgenes:
50
3.2.1
REALCE DE LA IMAGEN
El objetivo principal del realce (ver figura 3.3) es el de destacar los detalles finos de una imagen o intensificar detalles que han sido difuminados, bien sea por error bien por efecto natural del mtodo de adquisicin de la imagen.
El realce tiene un efecto opuesto a la eliminacin de ruido, ya que se trata de resaltar aquellos pxeles que presentan un nivel de gris distinto al de sus vecinos. Por ello, si la imagen es ruidosa, el efecto del ruido se multiplicar, por lo que antes de resaltar la imagen habr que eliminar el ruido de la misma.
3.2.2
DETECCIN DE BORDES
51
Una vez que la imagen ha sido procesada se est en disposicin de detectar los objetos presentes en ella. Para ello se buscan en la imagen caractersticas que definen al objeto que se desea encontrar.
Una de las informaciones ms tiles que se encuentran en una imagen la constituyen los bordes, ya que al delimitar los objetos definen los lmites entre ellos entre s. y el fondo, y entre los objetos
Un borde es la frontera entre dos regiones con niveles de gris relativamente distintas. Su causa principal es originada por la interseccin de varios objetos, con diferentes niveles de reflectancia, que al ser proyectados sobre la cmara generan discontinuidades de intensidad en los pxeles correspondidos (vase la figura 3.4).
52
Sin embargo, estas discontinuidades tambin aparecen de forma no deseada por la presencia del ruido, por el efecto de sombras sobre los propios objetos o por una iluminacin no uniforme dentro de la escena.
3.2.3
ELIMINACIN DE RUIDOS
53
Todas las imgenes tienen una cierta cantidad de ruido, valores distorsionados, etc., debidos a diversos motivos, como al sensor de la cmara que captura la imagen o al medio de transmisin de la seal. El ruido se manifiesta generalmente en pxeles aislados que toman un valor de gris diferente al de sus vecinos y es una informacin no deseada que contamina la imagen (vase la figura 3.7(a)). Bsicamente, el ruido se puede clasificar en dos tipos:
Gausiano: El ruido se superpone a los puntos de la imagen de forma aditiva. Su valor sigue una distribucin normal.
54
Impulsional (sal y pimienta): Se caracteriza por la aparicin de pxeles con valores arbitrarios normalmente detectables porque se diferencian mucho de sus vecinos ms
prximos.
a) Imagen original
a) de
55
3.3
SEGMENTACIN
En cualquier imagen se encontrarn presentes uno o varios objetos. El objetivo de la segmentacin es separar dichos objetos y distinguirlos entre s (vase figura 3.8). Despus de esta separacin estar el proceso de descripcin individualizada de los objetos encontrados y su reconocimiento e
interpretacin.
La segmentacin se basa en tres propiedades: 1. Similitud. Cada uno de los pxeles de un elemento tiene valores parecidos para alguna propiedad. 2. Discontinuidad. Los objetos destacan el entorno y tienen por tanto unos bordes definidos. 3. Conectividad. Los pxeles pertenecientes al mismo objeto tienen que ser contiguos, es decir, deben estar agrupados.
56
Estas
suposiciones
no son fciles
de cumplir,
pero
son
fundamentales para una buena segmentacin. Respecto a la similitud, uniforme. los objetos deberan presentar una apariencia
Esto no va a ser posible debido a diversos factores como la iluminacin, pequeas variaciones en el material de los objetos, al sensor de la cmara, etc. Respecto a la discontinuidad, los bordes no tienen por que estar bien definidos. Y por ltimo, se puede dar el caso de ocultamientos parciales de un objeto por
57
parte
de otro
lo
que
dificultar
el cumplimiento
de
la
Las tcnicas de segmentacin se basan en la bsqueda de las partes uniforme de la imagen o justo lo contrario, aquellas partes donde se produce un cambio. Tanto si se elige una u otra forma para la segmentacin, o una combinacin de ambas, al final lo que se obtendrn sern regiones.
Una regin es un conjunto de pxeles en los que existe un camino entre cualquier pareja de sus pxeles, y todos los pxeles del camino pertenecen a la regin, adems de presentar propiedades o caractersticas comunes.
58
3.3.1
La umbralizacin es una tcnica de segmentacin ampliamente utilizada en las aplicaciones industriales. Se emplea cuando hay una clara diferencia entre los objetos a extraer respecto del fondo de la escena. Los principios que rigen son la similitud entre los pxeles pertenecientes a un objeto y sus diferencias respecto al resto. Por tanto, la escena debe caracterizarse por un fondo uniforme y por objetos parecidos. La tcnica ms utilizada es la segmentacin por anlisis del histograma.
La umbralizacin consiste en elegir un valor de la intensidad y convertir todo lo que es superior a ese valor a 1 y lo que es inferior a 0.
59
3.3.2
La localizacin de las fronteras de los objetos en la escena, emplearn las tcnicas de deteccin de los bordes. Sin embargo, esta etapa no es definitiva para poder segmentar los objetos presentes en la imagen. La presencia de ruido, el efecto de las sombras, la falta de iluminacin uniforme y un largo etctera de causas, produce que los contornos no sean del todo continuos y cerrados sobre los objetos.
Se requiere otra etapa de post-procesamiento. Esta nueva fase emplea los resultados de la deteccin de bordes para elaborar las fronteras de los objetos. Se trata de agrupar los pxeles etiquetados como bordes, de la etapa anterior (de deteccin de bordes), empleando la propiedad de conectividad.
60
La estrategia a emplear en este tipo de segmentacin est basada en los criterios de similitud y continuidad de los pxeles que forman una regin. Las regiones se forman mediante pxeles que tengan conectividad y presenten alguna propiedad de similitud y discrepancia respecto al resto de los pxeles que no pertenecen a la regin.
61
3.4
REPRESENTACIN Y DESCRIPCIN
A la salida del proceso de segmentacin habitualmente se tienen los datos de pxel en bruto, que constituyen bien el
contorno de una regin o bien todos los puntos de una regin determinada.
La descripcin en la visin consiste en extraer caractersticas de un objeto para reconocerlo. Por lo general los descriptores deben ser independientes del tamao de la localizacin y orientacin del objeto y deben contener suficiente informacin
62
de discriminacin para distinguir un objeto del otr Existen ambigedades en las que un descriptor no puede distinguir un objeto de otro como se observa en la figura 3.9, en la que se visualiza una imagen de poisedon y tambin la forma de una sirena.
RECONOCIMIENTO E INTERPRETACIN
El reconocimiento es el proceso que asigna una etiqueta a un objeto basndose en la informacin proporcionada por sus descriptores. La interpretacin implica asignar significado a un conjunto de objetos reconocidos. La interpretacin trata de asignar significado a un conjunto de entidades etiquetadas. El
63
El anlisis de imgenes es un proceso que consiste en descubrir, identificar comprender los patrones que son
Uno de los principales objetivos del anlisis de imgenes por computadora consiste en dotar a una mquina, en algn sentido, de la capacidad de aproximacin, similar a la de los seres humanos.
Resulta conceptualmente til dividir el espectro de tcnicas de anlisis imgenes en tres reas bsicas. Estas reas son:
1. Procesado de bajo nivel Trata de un tipo de funciones a las que se puede considerar como reacciones automticas, y que no requieren inteligencia por parte del sistema de anlisis de imgenes.
2. Procesado de nivel intermedio Se refiere a la labor de extraccin y caracterizacin de los componentes de la imagen que se obtiene de un proceso a bajo nivel. 3. Procesado de alto nivel
65
Comprende el reconocimiento y la interpretacin, estos dos procesos tienen un gran parecido con lo que normalmente se conoce como conocimiento inteligente.
3.5.2
Un patrn es una descripcin estructural o cuantitativa de un objeto o de alguna otra entidad de inters en una imagen. Una clase de patrones es una familia de patrones que comparten algunas propiedades comunes.
3.5.3 INTERPRETACIN
66
La potencia de un sistema de visin artificial se determina por su capacidad de extraer informacin con significado de una escena dentro de un amplio margen de condiciones de visin y usando un mnimo de conocimiento sobre los objetos que se estn observando.
67
En
este
captulo
se
describen
algunas
de
las
muchas
4.1 MEDICINA
La comunidad mdica utiliza muchas aplicaciones en las que aparece el procesamiento de imgenes, entre las que se incluyen radiografas, ultrasonidos, etc.
68
69
Hoy en da, en muchos procesos de fabricacin, los lmites de deteccin de defectos han superado la percepcin del ojo humano; por esta razn las empresas del mundo moderno han visto la necesidad de crear un sistema que permita controlar en forma precisa y acertada la calidad de sus productos. Es as como nace la visin por computadora.
La visin por computadora, como se ha definido anteriormente es un sistema informatizado que captura la imagen de un objeto determinado en una lnea de produccin y procede a la
70
identificacin de diferentes parmetros para el control de calidad, como el color, la textura, la forma, la estructura interna y externa del producto.
Los sistemas de visin por computadora completan tareas de inspeccin con un alto nivel de flexibilidad y repetibilidad, nunca se cansan, ni se aburren, ni se distraen y pueden ser puestos a trabajar en ambiente donde los inspectores humanos no podran trabajar bajo condiciones de seguridad. Mientras los sistemas de visin por computadora exceden a los operadores humanos en trminos de ambiente de trabajo, s dependen de la forma en que el ojo humano interacta con el cerebro para procesar imgenes y tomar decisiones.
Para un inspector humano, los ojos proporcionan informacin del ambiente que lo rodea, el cerebro interpreta lo que los ojos ven, basado en experiencias previas con objetos similares. Basndose en esta interpretacin, se toman decisiones y
71
acciones.
En
forma
similar,
los
sistemas
de
visin
por
La visin por computadora se est convirtiendo rpidamente en un factor clave en el desarrollo de la calidad total dentro de los diferentes procesos de automatizacin industrial.
Su implementacin en una empresa genera un aumento en el nivel de produccin y una reduccin en los costos de
La visin por computadora permite inspeccionar el proceso de produccin sin fatigas ni distracciones, facilitando la
cuantificacin de las variables de calidad traducindose en un mejoramiento continuo (vase figura 4.3).
72
Algunas de las tareas que realiza el sistema de visin por computadora en esta rea son las siguientes: Verificacin de etiquetas. Inspeccin de contenedores. Inspeccin de motores. Inspeccin de cristales. Control de calidad de comida. Inspeccin de soldaduras. Inspeccin de circuitos impresos. Inspeccin madera, tela, fundiciones, papel.
73
4.3 ROBTICA
Un robot es un manipulador controlado por computadora, diseado para mover materiales, piezas, herramientas u otros dispositivos especializados a travs de una serie de pasos programados.
La robtica se define como el conjunto de conocimientos tericos y prcticos sistemas que permiten en concebir, estructuras determinado realizar y
automatizar
basados de
mecnicas grado de
poliarticuladas,
dotados
un
inteligencia y destinados a la produccin industrial o al sustitucin del hombre en muy diversas tareas. Un sistema robtica puede describirse como Aqul que es capaz de recibir informacin, de comprender su entorno a travs del empleo de
74
pluridisciplinaria y se apoya en gran medida en los progresos de la microelectrnica y de la informtica, as como en los de nuevas disciplinas tales como el reconocimiento de patrones y de inteligencia artificial.
La robtica es un componente esencial de la automatizacin de la fabricacin, que afectar la mano de obra humana a todos niveles, desde los trabajadores ms especializados hasta los tcnicos profesionales y directores de produccin. Los futuros robots pueden encontrar aplicaciones fuera de la fbrica, por ejemplo en bancos, restaurantes e incluso en sus propios hogares. Es posible, y quiz probable, que la robtica llegue a ser un campo como el de la tecnologa informtica actual, que invada nuestra sociedad.
Objetivos de la robtica:
75
1. El aumento de la productividad.- Esto se consigue, fundamentalmente, optimizando la velocidad del trabajo del robot, que reduce el tiempo parcial a cargo del manipulador y aumenta el rendimiento total en lnea de produccin.
3. Conseguir una rpida amortizacin de la inversin, como consecuencia de la sustitucin de la mano de obra, mejor uso y mayor duracin de las herramientas, menores prdidas de material residual, pocas averas y
mantenimiento reducido.
76
4. Mejorar la capacidad de los productos fabricados, dada la precisa repetividad de los movimientos del robot y la posibilidad de incrementar un control de calidad.
tales como las que se llevan a cabo en ambientes con temperaturas elevadas, contaminacin, gases txicos, materiales inflamables o radiactivos y en los entornos submarinos o espaciales.
rea de la robtica donde se aplica el sistema de visin por computadora (vase figura 4.4): Guiado de robots industriales Navegacin de robots mviles.
77
Consiste en identificar o verificar automticamente la identidad de las personas basndose en sus caractersticas fsicas o sus pautas de comportamientos. Por ejemplo el reconocimiento del iris, las huellas dactilares, la cara o la voz, etc. Reconocimiento de la cara Permite determinar la identidad de una persona, al comparar una imagen de su cara con imgenes de referencia
almacenadas en una base de datos, en la que tambin se almacena la identidad de las personas asociadas a cada imagen de referencia. Esta comparacin se realiza analizando
78
Huellas dactilares Las huellas dactilares son los surcos o lneas que existen en las yemas de los dedos. Estas lneas poseen diseos nicos en cada persona y por lo tanto se utilizan como un mtodo de identificacin de identidad. Un escner ptico captura una imagen de los surcos y estras de nuestra huella dactilar, y compara los puntos en que terminan o se bifurcan los surcos con los de la imagen que tiene archivada.
79
4.5 SEGURIDAD Y VIGILANCIA Consiste a la deteccin y seguimiento de personas a travs de cmaras (vase figura 4.6), de esta forma el sistema de visin capta todas las imgenes en los establecimientos donde se encuentra instalada ya sea en bancos, tiendas comerciales o en cualquier otro negocio, empresa o industria.
Figura 4.8: Ejemplo de seguridad y vigilancia a travs de captacin de imgenes por cmaras.
CONCLUSIONES
80
En este trabajo se present una breve introduccin al tema de sistema de visin por computadora siguiendo con una
descripcin de los elementos en que se compone, as como las etapas que lo conforman, concluyendo con una explicacin de las principales aplicaciones del mismo.
Es preciso reconocer que hoy por hoy la visin por computadora a veces no es la mejor solucin a un problema. Existen muchas ocasiones en las que el problema es tan complejo que la solucin humana es lo mejor, la solucin humana es menos estructurada que la solucin artificial y muchos problemas de visin por computadora requieren un nivel de inteligencia mucho mayor que el que la mquina pueda ofrecer. No obstante el sistema de visin humana puede describir automticamente una textura en detalle, un borde, un color, una representacin bidimensional de una tridimensional, ya que puede diferenciar entre imgenes de diferentes personas, firmas, colores, etc., puede vigilar ciertas zonas, etc. Aun a pesar de las limitaciones
81
BIBLIOGRAFA
Referencias Bibliogrficas:
1. Gonzlez, Rafael y Woods,
Ed. Paraninfo.
4. Snchez Calle, ngel, 2005. Aplicaciones de la Visin
Referencias de Internet:
1. Http://Iris.Usc.Edu/Vision-Notes/Rosenfeld/Contents.Html 2. Http://Turing.Iimas.Unam.Mx/~Elena/Teaching/CV-
Mast.Html
82
3. Http://Www.Debevec.Org/Research/IBL/ 4. Http://Ccc.Inaoep.Mx/%7Elabvision/
5. Http://Www.Diinf.Usach.Cl/~Dmery/Visiona/Visiona.Pdf
6. Http://Www.Des.Udc.Es/~Adriana/Tercerciclo/Cursoimag
en/Curso/Web/Indice.Html
83