Beruflich Dokumente
Kultur Dokumente
UCR ECCI CI-2657 Robtica Prof. M.Sc. Kryscia Daviana Ramrez Benavides
Introduccin
La visin artificial, tambin conocida como visin por computador (computer vision) o visin tcnica, es un subcampo de la inteligencia artificial.
Su propsito es programar un computador para que "entienda" una escena o las caractersticas de una imagen.
La visin de mquina tambin denominada visin de computadora, es una importante tecnologa de sensores con aplicaciones potenciales en muchas industrias.
Introduccin (cont.)
La deteccin, segmentacin, localizacin y reconocimiento de ciertos objetos en imgenes (ejemplo: caras humanas). La evaluacin de los resultados (ejemplo: segmentacin, registro). Registro de diferentes imgenes de una misma escena u objeto, es decir, hacer concordar un mismo objeto en diversas imgenes. Seguimiento de un objeto en una secuencia de imgenes. Mapeo de una escena para generar un modelo tridimensional; este modelo podra ser usado por un robot para navegar por la escena. Estimacin de las posturas tridimensionales de humanos. Bsqueda de imgenes digitales por su contenido.
Introduccin (cont.)
Segmentacin
En el campo de la visin artificial es el proceso de dividir una imagen digital en varias partes (grupos de pxeles) u objetos. El objetivo es simplificar y/o cambiar la representacin de una imagen en otra ms significativa y ms fcil de analizar. La segmentacin se usa tanto para localizar objetos como para encontrar los lmites de estos dentro de una imagen.
Ms precisamente, es el proceso de asignacin de una etiqueta a cada pxel de la imagen de forma que los pxeles que compartan la misma etiqueta tambin tendrn ciertas caractersticas visuales similares. 6
Segmentacin (cont.)
El resultado de la segmentacin de una imagen es un conjunto de segmentos que cubren en conjunto a toda la imagen, o un conjunto de las curvas de nivel extradas de la imagen. Cada uno de los pxeles de una regin son similares en alguna caracterstica, como el color, la intensidad o la textura. Regiones adyacentes son significativamente diferentes con respecto a la(s) misma(s) caracterstica(s).
Segmentacin (cont.)
Discontinuidades del nivel de gris. Consisten en segmentar la imagen a partir de los cambios grandes en los niveles de gris entre los pxeles. Las tcnicas que utilizan las discontinuidades como base son la deteccin de lneas, de bordes, de puntos aislados, etc. Similitud de niveles de gris. Es lo contrario al mtodo anterior, las divisiones de la imagen se hacen agrupando los pxeles que tienen unas caractersticas similares. Algunas tcnicas que usan esto son la umbralizacin, el crecimiento de regiones, etc.
Segmentacin (cont.)
Es el proceso que divide a una escena percibida en sus partes constituyentes u objetos. La segmentacin se divide en sus dos siguientes principios bsicos:
DISCONTINUIDAD. Suele usar la deteccin de bordes. La deteccin de bordes. Considera el cambio de intensidad que se produce en los pxeles en el contorno o bordes de un objeto como lo muestra la figura:
Segmentacin (cont.)
SIMILITUD. Este usa la fijacin de umbrales y el crecimiento de regiones. La fijacin de umbrales es una tcnica de conversin binaria en la que cada pixel es convertido a un valor binario, blanco o negro. Para mejorar una imagen se usan las siguientes mscaras:
Mscaras de Prewitt
10
Segmentacin (cont.)
La figura siguiente muestra las mscaras que fueron usadas sobre un objeto.
a) Imagen original. b) Imagen usando la mscara de Prewitt. c) Aplicacin del valor mximo de color blanco. d) Se le asign un valor cero (negro) en aquellos puntos que no exceda al valor del color blanco.
11
Segmentacin (cont.)
Algoritmos:
Mtodos de agrupamiento (Clustering) Algoritmo de K-means. Mtodos basados en el histograma Deteccin de bordes Mtodos de crecimiento de regiones Mtodo del conjunto de nivel Mtodos de particionamiento grfico Transformacin divisoria (watershed) Mtodo del valor umbral (umbralizacin)
12
Segmentacin (cont.)
Algoritmos:
Segmentacin basada en modelos Segmentacin multi-escala Segmentacin semi-automtica Redes neuronales de segmentacin
13
Descripcin
Consiste en extraer caractersticas de un objeto para reconocerlo por regiones, una regin se puede describir por la forma de su frontera o por sus caractersticas internas. La identificacin de objetos o regiones en una imagen a menudo se pueden realizar usando descriptores de textura.
14
Interpretacin
Es el proceso que dota a un sistema de visin para reconocer e interpretar a un objeto. La potencia de un sistema de visin artificial se determina por su capacidad de extraer informacin con significado de una escena dentro de un amplio margen de condiciones de visin.
15
Reconocimiento y Clasificacin
Los mtodos de reconocimiento que se usan se pueden dividir en dos categoras principales:
Mtodos de decisin terica. Se basan en descripciones cuantitativas, esto es estadsticos de textura. Mtodos estructurales. Se basan en las descripciones simblicas y sus relaciones, mediante direcciones de fronteras codificadas en cadena. El principio del reconocimiento estructural es la descomposicin de un objeto en patrones bsicos.
16
Una manera muy sencilla de clasificar imgenes es compararla pixel a pixel con un conjunto de imgenes ya conocido y clasificarla como la clase de la imagen ms parecida.
Esta forma de actuar presenta claros problemas al compara la imagen entera. Hay zonas de la imagen que no interesan a la hora de clasificar.
Los sistemas de reconocimiento de imgenes deben de ser robustos y capaces de trabajar bajo variaciones de los objetos a reconocer.
Para tratar de dar solucin a algunos de estos problemas se presentan las caractersticas locales. Las imgenes se representarn por varias imgenes ms pequeas que definen las caractersticas locales extradas.
18
Se analiza la varianza local en cada pixel de la imagen. Aquellos pixeles cuya varianza sea superior a un cierto umbral son seleccionados. Como caractersticas locales extraemos una ventana alrededor de los pixeles seleccionados.
Para clasificar una imagen se comparan todas y cada una de sus caractersticas locales con todas y cada una de las caractersticas locales extradas del conjunto de aprendizaje. Las imgenes se clasifican en la clase que mayor nmero de coincidencias tenga.
19
Referencias Bibliogrficas
Fu, K.S.; Gonzlez, R.C. y Lee, C.S.G. Robotics: Control, Sensing, Vision, and Intelligence. McGraw-Hill. 1987. Wikipedia. Procesamiento digital de imgenes). URL: http://es.wikipedia.org/wiki/Procesamiento_digital_de_im%C3%A1g enes. Wikipedia. Segmentacin (procesamiento de imgenes). URL: http://es.wikipedia.org/wiki/Segmentaci%C3%B3n_(procesamiento_ de_im%C3%A1genes)
20
Visin artificial y Procesamiento Digital de Imgenes usando Matlab. URL: http://www.vision-por-computador.com/. MATLAB: PROCESAMIENTO DE IMGENES. URLs: http://www.youtube.com/watch?v=tcrIZDdNWnM y http://www.youtube.com/watch?v=GRULGx0TuZA MATLAB: SEGMENTACIN DE IMGENES. URL: http://www.youtube.com/watch?v=339gWDlXuF0&feature=relmfu MATLAB: RECONOCIMIENTO DE FORMA Y COLOR. URL: http://www.youtube.com/watch?v=-NXnfwp4gU4&feature=relmfu RECONOCIMIENTO DE FORMAS CON MATLAB. URL: http://www.youtube.com/watch?v=fj_DLBPVsYw&feature=relmfu 21