Vision Artificial

La visin artificial y las operaciones morfolgicas en imgenes binarias
Jess Cceres Tello Servicios Informticos Profesor Asociado del Dpto. Ciencias de la Computacin Escuela Tcnica Superior de Informtica Universidad de Alcal jesus.caceres@uah.es Resumen. Este artculo muestra una introduccin a la visin artificial como
una parte importante de la inteligencia artificial y la aplicacin de esta al tratamiento de las imgenes, ms concretamente a las imgenes con formato binario, su tratamiento morfolgico ser el tema a destacar.
1 Introduccin
La visin artificial es una subrama de la inteligencia artificial orientada a permitir al computador a que pueda entender una imagen o conjunto de ella. Todo esto se consigue median mltiples tcnica: La deteccin, segmentacin, localizacin y reconocimiento de ciertos objetos en imgenes (por ejemplo, caras humanas). La evaluacin de los resultados (ej.: segmentacin, registro). Registro de diferentes imgenes de una misma escena u objeto, i.e., hacer concordar un mismo objeto en diversas imgenes. Seguimiento de un objeto en una secuencia de imgenes. Mapeo de una escena para generar un modelo tridimensional de la escena; tal modelo podra ser usado por un robot para navegar por la escena. Estimacin de las posturas tridimensionales de humanos. Bsqueda de imgenes digitales por su contenido. Concretamente nos vamos a centrar en el estudio de la tcnica denominada reconocimiento de patrones, su objetivo es clasificar patrones en base a un conocimiento a priori or informacin estadstica extrada de los patrones. Los patrones a clasificar suelen ser observaciones o puntos en el espacio. Aunque dependiendo del medio (sonar en un medio acutico) tambin puede variar y estar orientado a aristas y ngulos. La primera fase es la adquisicin de estos datos y su transformacin de los mismos a datos numricos, o simblicos. Una vez conseguida esta fase se procede a utilizar un sistema de clasificacin o descripcin que, basado en las caractersticas extradas, clasifica la medicin, pudiendo ser esta fase un algoritmo de autoaprendizaje que mejore el rendimiento del mecanismo.
2 Elementos de un Sistema de Visin Artificial

La visin artificial es una tcnica basada en la adquisicin de imgenes, generalmente en dos dimensiones, para luego procesarlas digitalmente mediante algn tipo de CPU (computadora, microcontrolador, DSP, etc), con el fin de extraer y medir determinadas propiedades de la imgenes adquiridas. Se trata, por tanto, de una tecnologa que combina las computadoras con las cmaras de video para adquirir, analizar e interpretar imgenes de una forma equivalente a la inspeccin visual humana. Un sistema de visin artificial se compone bsicamente de los siguientes elementos: 1. Fuente de luz. 2. Sensor de Imagen.
2.1 Fuente de Luz Es un aspecto de vital importancia ya que debe proporcionar unas condiciones de iluminacin uniformes e independientes del entorno, facilitando adems, si es posible, la extraccin de los rasgos de inters para una determinada aplicacin. La fuente de luz es un factor de vital importancia en los sistemas de visin artificial y afectan de forma crucial a los algoritmos de visin que se vayan a utilizar bajo esas condiciones. Tipos de iluminacin Iluminacin posterior (backlight). Iluminacin Frontal Oblicua y Direccional. Iluminacin Frontal Axial (difusa). Iluminacin de Da Nublado (cloudy day ilumination, CDI). Iluminacin de Campo Oscuro (dark field). Array de luces. Iluminacin de campo claro (o brillante). 2.2 Sensor de Imagen Es el encargado de recoger las caractersticas del objeto bajo estudio. Los sensores de imagen son componentes sensibles a la luz que modifican su seal elctrica en funcin de la intensidad luminosa que perciben. La tecnologa ms habitual en este tipo de sensores es el CCD (charge coupled devices o dispositivos de acoplamiento de carga) donde se integra en un mismo chip los elementos fotosensibles y el conjunto de puertas lgicas y circuitera de control asociada. En stos, la seal elctrica que transmiten los fotodiodos es funcin de la intensidad luminosa que reciben, su espectro, y el tiempo de integracin (tiempo durante el cual los fotodiodos son sensibles a la luz incidente).
Resolucin Existen diferentes arquitecturas de sensores. En primer lugar estn los sensores lineales. En stos, el sensor es una lnea de fotodiodos. Esta arquitectura permite la utilizacin de sensores de 1x1024, 1x2048, 1x4096, e incluso 1x6000 pxeles, lo que la hace muy adecuada para trabajar con altas resoluciones sobre superficies en movimiento. Para condiciones de iluminacin muy exigentes o velocidades de trabajo muy altas existe la posibilidad del uso de sensores TDI (time delay integrated). Esta tecnologa consiste en el uso de varias lneas de captura sobre la misma lnea del objeto, con el fin de sumar su carga y obtener as una mayor sensibilidad. En segundo lugar estn los sensores de rea. Estos alcanzan resoluciones habituales de 1024x1024, aunque existen en el mercado algunas casas que disponen de cmaras especiales con resoluciones de hasta 3072x2048. En este caso existen tecnologas de adquisicin de imgenes, entrelazada y no entrelazada. El mtodo entrelazado captura las lneas pares e impares que forman una imagen en instantes de tiempo diferentes. La tecnologa de no entrelazado (progressive scan) captura todas las lneas en el mismo instante de tiempo. Es ms costoso econmicamente, pero indispensable para trabajar con objetos en movimiento. Cuantizacin La cuantizacin (conversin analgica-digital) determina el nmero de bits usados para representar la informacin capturada. Por ejemplo, usando un sistema blanco y negro de 8 bits tenemos 256 niveles diferentes mientras que, usando un sistema de 10 bits, obtendramos 1024 niveles de gris diferentes, lo que permite una mayor definicin. Tarjeta de captura o adquisicin de imgenes: es la interfaz entre el sensor y la computadora o mdulo de proceso que permite al mismo disponer de la informacin capturada por el sensor de imagen. Las tarjetas de captura de imagen permiten transferir la imagen de la cmara a la memoria de la computadora con el fin de que sta pueda realizar el procesamiento adecuado a las imgenes. Algoritmos de anlisis de imagen: es la parte inteligente del sistema. Su misin consiste en aplicar las transformaciones necesarias y extracciones de informacin de las imgenes capturadas, con el fin de obtener los resultados para los que haya sido diseado. Los algoritmos relacionados con visin artificial son muy variados y abarcan numerosas tcnicas y objetivos. Computadora o mdulo de proceso: es el sistema que analiza las imgenes recibidas por el sensor para extraer la informacin de inters en cada uno de los casos implementando y ejecutando los algoritmos diseados para la obtencin de los objetivos. Sistema de respuesta en tiempo real: con la informacin extrada, los sistemas de visin artificial pueden tomar decisiones que afecten al sistema productivo con el fin de mejorar la calidad global de produccin. Se trata de automatismos que responden electromecnicamente con el fin de corregir o evitar, por ejemplo, en los sistemas de produccin, las causas generadoras de los problemas de deteccin. Otra de las funciones de estos sistemas es la generacin de estadsticas e informes de del proceso al que estn asociados,
lo que permite disponer de una informacin global de los procesos para facilitar la toma de decisiones.
3 Operaciones Morfolgicas en imgenes binarias

La morfologa matemtica es una herramienta muy utilizada en el procesamiento de imgenes. Las operaciones morfolgicas pueden simplificar los datos de una imagen, preservar las caractersticas esenciales y eliminar aspectos irrelevantes. Teniendo en cuenta que la identificacin y descomposicin de objetos, la extraccin de rasgos, la localizacin de defectos e incluso los defectos en lneas de ensamblaje estn sumamente relacionados con las formas, es obvio el papel de la morfologa matemtica. La morfologa matemtica se puede usar, entre otros, con los siguientes objetivos: Preprocesamiento de imgenes (supresin de ruido, simplificacin de formas). Destacar la estructura de objetos (extraer el esqueleto, marcado de objetos, envolvente convexa, ampliacin, reduccin). Descripcin cualitativa de objetos (rea, permetro, dimetro, etc). 3.1 Representacin de imgenes binarias
Definiremos una imagen binaria como una funcin de dos variables discretas a[m,n]que puede tomar dos valores, 0 o 1, dependiendo del nivel de gris de la imagen (una imagen binaria tiene dos niveles: blanco y negro). Se puede proponer una definicin alternativa si consideramos que una imagen consiste en un conjunto de coordenadas discretas (tambin pueden ser reales pero no es el objetivo de este estudio). En este sentido, el conjunto corresponde a todos aquellos puntos o pxeles que pertenecen a la imagen. Por lo tanto, se puede decir que en morfologa matemtica los conjuntos representan objetos en una imagen. Por ejemplo, el conjunto de todos los pxeles negros en una imagen binaria constituye una descripcin completa de la misma (Fig. 1). Como ya habamos adelantado, en las imgenes binarias, los conjuntos en cuestin pertenecen al espacio Z2, donde cada elemento del conjunto es una 2-upla (vector 2-D) cuyas coordenadas son las coordenadas [m,n] de un pxel blanco (o negro, segn la convencin) de la imagen. En la figura 2 se pueden ver dos conjuntos, A y B. Observemos que se ha colocado un sistema de coordenadas. El conjunto (u objeto) A consiste en los puntos { [2,3]; [2,4]; [2,5]; [1,3]; [1,4]; [1,5]; [0,5] } mientras que el B contiene los puntos { [0,0]; [0,1]; [1,0] }. En este punto se debe acotar que en la mayora de los lenguajes de programacin los arrays de elementos que sern los encargados de contener la imagen no admiten ndices negativos y en general menores a 1. Por lo tanto, ser necesario realizar u-na pequea modificacin al sistema de coordenadas que consiste en un simple desplazamiento para poder operar sobre una imagen (contenida en un array).
Figura 1: Representacin binaria de una imagen
Figura 2: Representacin de una imagen binaria en el eje de coordenadas (Arrays de elementos)
3.1 Dilatacin y Erosin Estas operaciones son fundamentales en el procesamiento morfolgico. De hecho, la mayora de los algoritmos morfolgicos estn basados en estas dos operaciones aunque tambin se utilizan las siguientes:
Adems de estas dos primeras que son las ms importantes, tambin se usan:
Apertura y Clausura (Opening and Closing) Transformacin Hit-or-Miss (o Ganancia - Prdida) Extraccin de Frontera (Boundary Extraction) Afinado o Adelgazamiento (Thinning) Engrosamiento (Thickening) Relleno de Regin (Region Filling) Esqueleto Poda (Pruning) Traslacin Reflexin
Resta de imgenes
Dilatacin Tomar cada pxel del objeto (con valor 1) y setear al valor 1 todos aquellos pxeles pertenecientes al fondo (background) que tienen una conectividad C (C=4, C=8, etc) con el pxel del objeto. En pocas palabras, poner a 1 los pxeles del fondo vecinos a los pxeles del objeto. Erosin Tomar cada pxel del objeto que tiene una conectividad C con los pxeles del fondo y resetearlo al valor 0. En otras palabras, poner a 0 los pxeles del objeto vecinos a los pxeles del fondo.
6. Conclusiones.
Gracias a la Web Semntica y a la utilizacin de lenguajes de Metadatos como el RDF la usabilidad y aprovechamiento de la Web y sus recursos interconectados aumentar gracias a una serie de factores: Los documentos etiquetados con informacin semntica (estilo la etiqueta <meta> de HTML utilizada para facilitar el trabajo a los robots). Se pretende que esta informacin sea interpretada por el ordenador con una capacidad comparable a la del lector humano. El etiquetado puede incluir Metadatos descriptivos de otros aspectos documentales o protocolarios. Los vocabularios comunes de Metadatos (ontologas) y mapas entre vocabularios permiten a quienes elaboran los documentos disponer de nociones claras de cmo deben etiquetarlos para que los agentes automticos puedan usar la informacin contenida en los Metadatos (por ejemplo el metadato autor debera significar autor de la pgina y no autor del objeto descrito en la pgina) Los agentes automticos que realizan tareas para los usuarios de estos metadatos de la Web Semntica. Los servicios web que proporcionan informacin a los agentes (por ejemplo un servicio de garantas a quien un agente pudiera consultar sobre si un comercio electrnico tiene un historial de mal servicio o de generar correo basura). Los proveedores primarios de esta tecnologa son las URIs que identifican los recursos junto con XML y los namespace. Si a esto se aade un poco de lgica mediante RDF, la Web estar lista para alcanzar las aspiraciones de su inventor Tim BernersLee.
Referencias
Juan Carlos Camara. Posibilidades de Websemantico http://www.iua.upf.es/~jblat/material/doctorat/students/jccbis/Web_Sema ntico.htm MNDEZ RODRGUEZ, Eva Mara. RDF: Un modelo de metadatos flexible para las bibliotecas digitales del prximo milenio. http://www.cobdc.org/jornades/7JCD/1.pdf RDF Model Theory.W3C Working Draft 29 April 2002. http://www.w3.org/TR/rdf-mt/#graphsyntax RDF Tutorial. Pierre-Antoine Champin. http://www710.univlyon1.fr/~champin/rdf-tutorial/rdf-tutorial.html Resource Description Framework (RDF): Concepts and Abstract Syntax. W3C Working Draft 08 November 2002. http://www.w3.org/TR/2002/WD-rdf-concepts-20021108/ W3C. Resource Description Framework (RDF). http://www.w3.org/RDF/

Vision Artificial

Hochgeladen von

Dokumentinformationen

Originaltitel

Copyright

Verfügbare Formate

Dieses Dokument teilen

Dokument teilen oder einbetten

Freigabeoptionen

Stufen Sie dieses Dokument als nützlich ein?

Sind diese Inhalte unangemessen?

Copyright:

Verfügbare Formate

Vision Artificial

Hochgeladen von

Copyright:

Verfügbare Formate

La visin artificial y las operaciones morfolgicas en imgenes binarias

2 Elementos de un Sistema de Visin Artificial

3 Operaciones Morfolgicas en imgenes binarias

Figura 1: Representacin binaria de una imagen

Figura 2: Representacin de una imagen binaria en el eje de coordenadas (Arrays de elementos)

Das könnte Ihnen auch gefallen