Sie sind auf Seite 1von 53

Tema 4.- Imagen.

Tema 4.Imagen.

Tecnologas para los Sistemas Multimedia Curso 2004/05 - 1/53

Tema 4.- Imagen.

ndice
NDICE........................................................................................................................................................................ 2 IMAGEN...................................................................................................................................................................... 3 4.1. INTRODUCCIN. ............................................................................................................................................. 3 4.2. CONCEPTOS BSICOS DE LOS GRFICOS POR COMPUTADOR........................................................................... 3 4.3. MODELOS DE COLOR...................................................................................................................................... 6 4.4. NATURALEZA DE LOS GRFICOS POR COMPUTADOR. ..................................................................................... 7 4.4.1. Grficos Vectoriales.............................................................................................................................. 7 4.4.2. Mapas de Bits........................................................................................................................................ 8 4.5. CARACTERSTICAS DE LOS PROGRAMAS DE GRFICOS 2D. ............................................................................. 9 4.5.1. Capas (layers) y mscaras (masks)....................................................................................................... 9 4.5.2. Texto.................................................................................................................................................... 10 4.5.3. Salida de la imagen............................................................................................................................. 10 4.5.4. Filtros y proceso grfico..................................................................................................................... 11 4.6. COMPRESIN. .............................................................................................................................................. 11 4.6.1. Conceptos bsicos de los sistemas de compresin de imgenes. ........................................................ 11 4.6.2. Tcnicas de Compresin. .................................................................................................................... 12 4.6.2.1. Reduccin de bits ............................................................................................................................ 13 4.6.2.2. Transformacin............................................................................................................................... 14 4.7. FORMATOS DE FICHEROS GRFICOS Y ESTNDARES. ................................................................................... 18 4.7.1. Formatos grficos bitmap. .................................................................................................................. 18 4.7.1.1. Formato BMP ................................................................................................................................ 19 4.7.1.2. Formato GIF. .................................................................................................................................. 20 4.7.2. Formatos grficos vectoriales............................................................................................................. 24 4.7.2.1. Formato WMF................................................................................................................................. 25 4.7.3. Formato JPEG. ................................................................................................................................... 27 4.7.3.1. Cmo comprimir correctamente imgenes JPEG?. ...................................................................... 30 4.7.3.2. Por qu usar JPEG?. .................................................................................................................... 30 4.7.3.3. JPEG frente a GIF. ......................................................................................................................... 31 4.7.3.4. Estructura de un archivo JPEG ...................................................................................................... 32 4.8. HARDWARE GRFICO. ................................................................................................................................. 34 4.8.1. Tarjetas de Vdeo. ............................................................................................................................... 34 4.8.1.1. El Procesador Grfico. ................................................................................................................... 35 4.8.1.2. La memoria de vdeo....................................................................................................................... 35 4.8.1.3. El RAMDAC.................................................................................................................................... 36 4.8.1.4. El Programa Controlador (Driver)................................................................................................. 36 4.8.1.5. El sistema grfico AGP para PC. ................................................................................................... 36 4.8.2. Escners.............................................................................................................................................. 37 4.8.2.1. Modo de Operacin......................................................................................................................... 38 4.8.2.2. Resolucin....................................................................................................................................... 38 4.8.2.3. Interpolacin................................................................................................................................... 39 4.8.2.4. Escners de color............................................................................................................................ 39 4.8.2.5. Resolucin Tonal............................................................................................................................. 39 4.8.2.6. El Software Controlador (Driver)................................................................................................... 40 4.8.2.7. Tipos de escneres .......................................................................................................................... 40 4.8.3. Cmaras digitales ............................................................................................................................... 43 4.8.3.1. Aspectos a tener en cuenta en una cmara digital.......................................................................... 44 4.9. HERRAMIENTAS PARA TRATAMIENTO DE IMGENES .................................................................................... 51 4.9.1. Adobe Photoshop ................................................................................................................................ 52 4.9.2. GIMP................................................................................................................................................... 52

Tecnologas para los Sistemas Multimedia Curso 2004/05 - 2/53

Tema 4.- Imagen.

Imagen.
4.1. Introduccin.
Los grficos por computador, estn presentes en diferentes manifestaciones del da a da: en televisin, en pelculas, en libros y revistas, en psters y, por supuesto, en los monitores de los computadores. Son tan habituales que no se les suele prestar demasiada atencin. Estas imgenes pueden provenir del mundo real (como por ejemplo mediante el uso de fotografas o dibujos que son digitalizados) o que pueden ser generados en un computador (utilizando algn software). En este tema vamos a describir los grficos por computador, buscando establecer su naturaleza y caractersticas de forma que lleguemos a ser capaces de aplicar en la prctica los conceptos que se pueden encontrar en las aplicaciones de retoque fotogrfico o composicin y comprender las opciones que estas permiten aplicar sobre las imgenes, con la idea de construir una aplicacin/presentacin multimedia. En este tema se abordan conceptos relativos al almacenamiento de los grficos en memoria y en disco, formatos de los ficheros grficos y elementos en el campo del proceso de imgenes y su visualizacin.

4.2. Conceptos bsicos de los grficos por computador.


Actualmente, los computadores cuando manejan grficos lo hacen sobre monitores basados en mapas de bits o Bitmaps. Es frecuente encontrar los trminos bitmap y raster para hacer referencia al mismo concepto. Un Bitmap es un grfico formado por un conjunto de puntos individuales. Estos puntos reciben el nombre de pixels (picture-element). Los puntos o pixels que componen una imagen se almacena en memoria mediante bits, bytes o palabras en memoria, en funcin de la cantidad de informacin que posea dicho punto. La memoria donde se almacena la imagen que estamos viendo en el monitor usualmente se encuentra en la tarjeta de vdeo y se la llama memoria de vdeo o frame buffer para distinguirla de la memoria principal.

Figura 1. Tarjeta de vdeo y monitor.

Para el caso del monitor monocromo ms sencillo, cada pixel puede tomar dos valores blanco o negro, por lo que basta un nico bit para representar su estado. En la siguiente figura podemos ver la correspondencia entre la memoria de vdeo y un vector de dos dimensiones en la pantalla. En sta se ilustra una pantalla de 640 por 480 pixels, donde un bit de la memoria de vdeo se corresponde con un nico pixel.

Tecnologas para los Sistemas Multimedia Curso 2004/05 - 3/53

Tema 4.- Imagen.

Figura 2. Memoria de vdeo monitor monocromo con resolucin 640x480.

Aunque el monitor slo representa puntos en blanco o negro, mediante la utilizacin de un patrn alternativo de pixels blancos y negros es posible dar la sensacin de niveles intermedios (escala de grises). Este proceso, que se conoce como dithering, se utiliza frecuentemente en impresoras de puntos y lseres para representar esos valores de grises. La desventaja del dithering es la prdida de resolucin debida a la necesidad de utilizar varios pixels para representar cada valor de "gris". Un monitor que realmente sea capaz de representar tonalidades de gris debe ser capaz de trabajar con un rango de intensidades que permitan representar los valores entre el negro y el blanco. En este caso, es necesario utilizar un nmero de bits para definir la "cantidad" de gris para cada pixel. Esta idea se puede ver como la generalizacin del esquema anterior al que se le aade una tercera dimensin. Por esto, se habla de que existen planos de bit en la memoria de vdeo o profundidad de color (colour depth). En la Figura 3 se muestra un monitor monocromo de cuatro bits por pixel, permitiendo representar hasta diecisis niveles diferentes de gris. En el caso de utilizar un monitor digital, esos valores de 4 bits se corresponden directamente con cuatro seales en el hardware de vdeo. En los monitores analgicos, que aceptan un rango continuo de niveles de entrada, la tarjeta de vdeo ha de transformar (mediante conversores digital a analgico) estos valores de pixels en niveles de tensin aceptables por el monitor.

Figura 3. Memoria de vdeo monitor monocromo con niveles de gris y resolucin 640x480.

En los monitores de color, ste se produce como combinacin de tres colores primarios: rojo, verde y azul. En la Figura 4 se ilustra un sistema con 24 planos de bit, donde se utilizan ocho para cada componente de color y que se conoce como True Color. Por lo tanto cada pixel puede tomar un valor entre 224,, o aproximadamente 16,7 millones de colores.

Figura 4. Memoria de vdeo monitor color con 24 bits de color.

Tecnologas para los Sistemas Multimedia Curso 2004/05 - 4/53

Tema 4.- Imagen.

Como en este caso aumenta la necesidad de memoria (3 bytes por pixel), en muchos sistemas se utiliza lo que se denomina una paleta de colores (colormap lookup table - LUT). De esta forma es posible utilizar menos bits por pixel para representar el contenido de los puntos en la pantalla. Estos valores se utilizan como ndices en esa tabla de colores. En la Figura 5 se ilustra este concepto para el caso de un sistema con 8 bits por pixel, que se utilizan para indexar una paleta con 256 entradas de 24 bits cada una. Con este sistema sigue siendo posible elegir entre los 16,7 millones de colores, pero slo es posible mostrar 256 diferentes de forma simultnea.

Figura 5. Representacin del color mediante paleta de colores o color indexado.

Los requerimientos de memoria se reducen en un factor de 3 respecto a los de la Figura 4. Las desventajas son la reduccin en el nmero de colores que es posible mostrar de forma simultnea y la complejidad aadida de mantener la paleta de colores. Tambin aqu es posible utilizar la tcnica de dithering, comentada al principio de este punto, para representar un mayor nmero de colores. En la tabla siguiente se puede ver de forma comparativa un sistema de visualizacin en color sin y con utilizacin de paleta de color. Los usuarios de sistemas basados en el uso de paletas observarn, a veces, la existencia de un fenmeno de parpadeo de colores (color flashing ). Este aparece cuando al cambiar de una imagen a otra, el sistema de representacin grfica (el manejador de ventanas) cambia el mapa de color para visualizar la nueva imagen.
Tipo de Display Color Color con paleta Bits por pixel 24 8 Colores Resolucin 16,7 millones 1024 * 768 256 (de una paleta 1024 * 768 de un milln) Tabla 1.- Comparacin de Sistemas de visualizacin. Memoria de Vdeo 23 MB 769 KB

En ocasiones se destinan para los grficos un total de 32 bits por pixel, en estos, 24 se dedican a representar el color del pixel y los ocho restantes forman el denominado canal alfa que codifica otras informaciones, como por ejemplo: para representar transparencias y niveles o capas en los "objetos" que componen una imagen. Otras veces, pese a no utilizar estos 8 bits sobrantes, el tener las representaciones de los pixels alineadas con fronteras de 32 bits supone una ventaja de velocidad, o una mayor precisin al transformarse en una seal analgica de tono continuo. Respecto a cmo se eligen los colores a representar en la paleta, nicamente comentar que existen tcnicas de cuantizacin para tales efectos.

Tecnologas para los Sistemas Multimedia Curso 2004/05 - 5/53

Tema 4.- Imagen.

4.3. Modelos de color.


Antes de hablar de cmo se trabaja con imgenes ya sea de forma analgica o digital, es necesario conocer qu es el color y cmo el ojo humano es capaz de interpretarlo. El color que presenta cualquier objeto no es ms que la interpretacin que nuestros ojos dan a la luz que este objeto est reflejando. Cada material refleja determinadas longitudes de onda de la luz que incide sobre l y absorbe todas las dems. Lo que conocemos como luz es una radiacin de energa que se encuentra en unos determinados mrgenes de frecuencia. El ojo humano es capaz de interpretar una gama de esta radiacin, que es la llamada luz visible y engloba las longitudes de onda o frecuencias que existen entre el rojo y el violeta. Los colores negro y blanco son casos especiales, pues el negro es la forma en la que percibimos la ausencia de luz y el blanco es la tonalidad que nuestro ojo nos muestra cuando recibimos reflejado de un objeto todo el margen de frecuencias visible. Podra decirse que el negro es la ausencia de color y el blanco es la suma de todos los colores que podemos apreciar. Nuestro ojo tiene varias lentes, cornea y cristalino que enfocan la imagen sobre la retina en el fondo del ojo. All se encuentran unos corpsculos especiales encargados de traducir las radiaciones lumnicas a seales elctricas que sern trasmitidas por el nervio ptico hasta el cerebro. Existen tres grupos diferenciados de corpsculos en la retina, cada uno de ellos es sensible a uno de los tres colores llamados bsicos: rojo, verde y azul. Nuestros ojos interpretan cada color en funcin de sus componentes rojo verde y azul (en ingls se usan las siglas RGB para designar este sistema de codificar el color). El sistema de color RGB se utiliza con dispositivos que emiten luz, como es el caso de las pantallas. Como hemos comentado antes, est basado dos mximas: que el negro es la ausencia de colores y que el blanco es la suma de todos ellos. Este es el modelo de color ideal para usar en pantallas pues internamente los monitores funcionan de esta forma. La pantalla en reposo es de color negro y el tubo de color internamente tiene tres caones de rayos catdicos, uno para cada color RGB. Cuando los tres caones inciden sobre un mismo punto en la pantalla ste se muestra de color blanco. El modelo de color RGB es aditivo; los colores bsicos se suman unos a otros para formar colores compuestos. Cuando estamos trabajando con dispositivos en los que la luz es reflejada, como en el caso de las impresoras, el modelo ms adecuado es el sustractivo. El color de base es el blanco y se aaden tintas que van restando colores para por ltimo alcanzar el negro. Es el esquema habitual de las impresoras de color, CMYK (Cyan + Magenta + Yellow + blacK). Cuando en la hoja de papel incide la luz blanca en tintas traslcidas, se absorbe el color. Al combinarse C, M, Y se absorben todos los colores y se genera negro. Por eso se les llama colores sustractivos. Restndole estos colores al blanco debiera conseguirse el negro, pero eso slo ocurre en el modelo ideal. En la prctica el color ms oscuro que se consigue es un gris oscuro de aspecto sucio. Para corregir este defecto se aadi una nueva componente de color de tonalidad negra, que consigue que los colores sean ms ntidos y el negro tenga la tonalidad adecuada. La combinacin de estas tintas con objeto de conseguir colores se denomina tambin cuatricoma. Existen otros modelos de color que utilizan codificaciones de color diferentes y uno de los ms usados es el L*a*b. Este es un modelo de color propuesto por la Commission Internationale d'Eclariage, encargados de realizar un estndar de codificacin del color. Cada color se compone con tres canales: uno de luminosidad (L) y dos de color (a, b), variando el canal a de verde a rojo y el b de azul a

Tecnologas para los Sistemas Multimedia Curso 2004/05 - 6/53

Tema 4.- Imagen.

amarillo. Este modelo de color se utiliza como estndar independiente del dispositivo y no est ligado a pantallas como el RGB o a dispositivos de impresin como el CMYK. Otro de estos modelos de codificacin del color usado con frecuencia es el HSB (Hue, Saturation y Brightness), que almacena tres parmetros por color: uno indica la tonalidad, otro la saturacin o cromatismo y por ltimo est el de brillo. A continuacin se describen cada uno de los parmetros con mayor detenimiento: Hue es tono (color), medido como una posicin en grados en la rueda de colores estndar La saturacin dice cmo de puro es un color, bsicamente siguiendo una lnea entre el color puro (100) y gris a idntico brillo (0). Por ejemplo, el rosa es rojo menos saturado, y el gris es rojo, o cualquier otro color, sin ninguna saturacin. El brillo indica la luminosidad del color completo y marcara la lnea entre blanco (100, suma de todo color) y negro (0, ausencia). Los modelos de color no son perfectos y cada uno abarca distintas gamas en la escala de frecuencias. El modelo de color que ms colores comprende es el L*a*b, luego el RGB y por ltimo el que menos colores puede representar es el CMYK.

Figura 6. Modelos de color.

4.4. Naturaleza de los grficos por computador.


Es posible distinguir dos clases de grficos en funcin de la forma en que se almacenan los datos de la imagen: vectoriales y mapa de bits. Ambos tipos de grficos constituyen dos filosofas diferentes de abordar un mismo tema: la representacin de una imagen o grfico en un fichero.

4.4.1. Grficos Vectoriales.


Las imgenes en formato vectorial se componen de objetos. Todos los objetos se construyen a partir de primitivas (que son las instrucciones bsicas de dibujo, como por ejemplo lneas, rectngulos y elipses). Los objetos se pueden agrupas para formar otros ms complejos con lo que es posible hablar de la existencia de una jerarqua de objetos. Las principales propiedades de los grficos vectoriales son: La imagen se compone de distintos segmentos o formas, llamados objetos de diseo (a veces se emplea el trmino line art pero suele utilizarse ambiguamente tambin para imgenes en blanco y negro). Los objetos clsicos son lneas, rectngulos, arcos y curvas (las curvas de Bezier son las ms tpicas), formas abiertas y formas cerradas, texto. Cada objeto tiene caractersticas (atributos) propias: anchura de lnea, color, patrn, relleno (si existe el "interior"). Lo fundamental es que estos objetos retienen su identidad separada del resto de objetos, por lo que pueden ser manipulados independientemente. Si varios objetos se superponen (lo cual es perfectamente probable) existe una relacin de profundidad que hace que no se vean las partes ocultas de los objetos que se encuentran "detrs". En algunos sistemas de diseo se puede adems graduar el nivel de transparencia de los objetos que se encuentran "delante".

Tecnologas para los Sistemas Multimedia Curso 2004/05 - 7/53

Tema 4.- Imagen.

Por este funcionamiento a veces se llaman a estos programas de diseo orientados a objetos. Algunos sistemas operativos (Macintosh - QuickDraw) permiten trabajar con estos objetos a bajo nivel, lo que hace ms estandarizado el proceso y ms sencillo su trabajo e intercambio.

Como consecuencia de esto: El grfico se puede escalar sin ningn problema (de hecho, ya inicialmente no tiene una medida fija), quizs con excepcin de la anchura de las lneas que en muchos sistemas tiende a ser fija y dependiente de la pantalla. El trabajo de edicin y modificacin de un dibujo "orientado a entidades" es bastante sencillo; no as un dibujo artstico "orientado a color -o a sombras-". Los puntos de color slo se producen para visualizar ese grfico en la pantalla o en la impresora, y es un proceso que se realiza al final, con lo que la calidad siempre ser la mxima posible. Igual que en 2-D, esta tcnica puede utilizarse en 3-D. Los grficos vectoriales pueden dividirse en dos tipos: los que representan dibujos en dos dimensiones y los que son modelos en tres dimensiones que muestran objetos o escenas sintticas. La potencia de los grficos vectoriales es su escalabilidad, ya que en vez de almacenar el dibujo en una escala determinada, almacenan la posicin relativa de los vrtices de los polgonos que lo forman as como las funciones de las lneas y curvas que los unen. Para mostrar los dibujos a otro tamao se cambia la escala y se calcula de nuevo el dibujo; de esta manera los dibujos pueden ser representados a cualquier tamao sin prdida alguna de calidad. Tambin son muy bajos sus requerimientos de memoria al poder representar el contenido de la imagen como una serie de instrucciones junto a sus parmetros y la informacin de color asociada. La aplicacin tpica de los grficos vectoriales es el dibujo lineal en dos dimensiones, pues est compuesto por colores planos o gradientes de color sencillos. Estas caractersticas lo hacen perfecto para la rotulacin, los logotipos publicitarios y todo trabajo que deba imprimirse a gran tamao. El caso de los grficos en tres dimensiones es un caso particular de los grficos vectoriales, pues aunque el modelo en tres dimensiones se almacena de manera vectorial, el resultado una vez realizada la generacin (render) es almacenado como un mapa de bits. El proceso mediante el cual se convierte un modelo en tres dimensiones en una imagen de aspecto casi real, es un complejo clculo matemtico que simula la forma en la que percibimos los objetos que nos rodean. A cada objeto le son asignadas unas propiedades determinadas, como color, rugosidad, brillo, etc. En definitiva, se crea un modelo matemtico de cada objeto para luego introducir tambin las caractersticas ambientales como pueden ser las luces. Tras esto se calcula cmo la luz es reflejada por cada objeto y cmo por ltimo incide en el objetivo que se toma como punto de vista. Programas como CorelDraw, Adobe Ilustrator, estn especializados en trabajar con grficos vectoriales en 2D.

4.4.2. Mapas de Bits.


Los bitmaps (o raster graphics) son imgenes compuestas de puntos discretos conocidos como pxels (pixels o picture elements), donde cada uno de estos pueden tomar cualquier valor dentro de un rango. La resolucin de un bitmap viene dada por sus dimensiones, en pixels, en horizontal y en vertical. As un bitmap de 640 por 480 visualizado sobre un monitor VGA se ver mejor que uno de 320 por 200 sobre el mismo monitor y pero que uno de 1024 por 768. Esto es, a mayor nmero de pixels por unidad de rea, mayor ser la resolucin y menos imperfecciones se observarn en la imagen.

Tecnologas para los Sistemas Multimedia Curso 2004/05 - 8/53

Tema 4.- Imagen.

La profundidad de color de un bitmap viene determinada por la cantidad total de memoria reservada para cada pixel. As, el nmero de colores posibles por pixel vendr dado por 2 elevado al nmero de bits por pixel. Lgicamente, la correcta visualizacin de estos vendr determinada por la capacidad del hardware: la memoria de vdeo. Podramos resumir las principales caractersticas de los grficos de mapas de bits como: Es simplemente un patrn de puntos de color (pxels en pantalla) suficientemente pequeos. Es lo que toman los scanners (e incluso las fotografas): no hace falta "inteligencia" para crearlos partiendo del mundo real o de un grfico dado. Es imposible o muy difcil convertirlo a diseo (vectorizador), mientras que un diseo puede convertirse automticamente a bitmap. El proceso de extraccin de informacin partiendo de un bitmap suele ser complejo si no imposible (OCR, vectorizadores, reconocimiento de imagen...). No tiene sentido hablar de bitmap en 3-D. El escalado de bitmaps es complicado y pierde calidad, sobre cuando se quiere aumentar el dibujo. Este tipo de grficos es el utilizado para trabajar con fotografas, debido a que para representar estas imgenes se necesita gran cantidad de color y tener en cuenta las texturas y tramas de color que muestra un objeto como resultado del material que lo forma y la manera en que ste refleja la luz. Adobe Photoshop o Corel PhotoPaint, son algunos de los programas ms utilizados para trabajar con imgenes de mapa de bits. Afortunadamente, ya hay sistemas que permiten la unin de estos dos soportes (dibujos compuestos), a travs de: Capas, unas con bitmaps y otras con grficos vectoriales. Inclusin del bitmap como un objeto ms dentro de un programa de diseo.

4.5. Caractersticas de los programas de grficos 2d.


Vamos a comentar algunos de los conceptos ms importantes que suelen existir de una forma u otra en los programas de proceso de imagen 2d, comentando algunos de los trminos utilizados para explicar su funcionalidad.

4.5.1. Capas (layers) y mscaras (masks).


Las capas son una de las maneras ms interesantes de trabajar con grficos. Antiguamente al ir dibujando unos elementos encima de otros se perda el elemento situado "debajo" del nuevo, con lo que cualquier retoque posterior ms all de los undo era imposible, y la informacin tapada desapareca realmente de la imagen. Las capas permiten evitar eso, mediante la manipulacin de dibujos distintos e independientes en la misma pantalla. La metfora de la capa es una especie de dibujo hecho en papel transparente, de modo que deja ver con todo detalle los dibujos situados detrs en otras capas (transparentes a su vez), salvo debajo de los dibujos. De este modo, las capas se organizan en una especie de "niveles", desde el ms cercano al usuario (y esa capa se ver por completo) hasta el ms lejano (que se ver parcial o totalmente tapado por las capas superiores). Pero si en un momento cambiamos algn dibujo de una de las capas, las partes tapadas de las capas inferiores no han desaparecido, de hecho se mantienen todas las capas intactas e indiferentes a la manipulacin que se haga con los dems.

Tecnologas para los Sistemas Multimedia Curso 2004/05 - 9/53

Tema 4.- Imagen.

Los programas permiten adems ocultar temporalmente algunas capas para posibilitar el trabajo sin considerar los objetos que se sitan encima. Tambin puede cambiarse el orden de superposicin de las capas. Los programas ms avanzados de proceso de imagen (como Adobe Photoshop) permiten combinar de modos ms complejos las capas, utilizando mscaras (masks). Estas mscaras permiten definir qu parte de una imagen es transparente a las dems, e incluso un grado de transparencia. Por ejemplo se pueden definir mscaras usando canal alfa (alpha channel), una mscara graduada que indica en cada pxel qu porcentaje x de la imagen RGB se muestra y qu porcentaje 100-x deja ver lo que haya detrs. Cada una de las capas debe tener su propia definicin de alpha channel (como si tuviera una informacin ms que R-G-B, codificada en otro rango de bits).

4.5.2. Texto
Texto y suavizado (anti-aliasing)

Figura 6. Modelos de color.

El suavizado persigue evitar el efecto de discontinuidad que tienen los puntos de visualizacin, que a menudo son demasiado grandes para que el ojo no aprecie que los textos acaban en bordes rectangulares abruptamente sobre el fondo (esto se nota mucho ms cuanto ms contraste haya entre los colores del texto y del fondo). Realmente este efecto de suavizado se puede realizar con cualquier objeto grfico que se posicione sobre un fondo de color muy diferente. Consiste simplemente en, como se ve en la figura, que el programa realice una interpolacin automtica de los bordes a grises (o colores intermedios en caso de uso de color) para dar una sensacin visual de transicin en lugar de finalizacin o corte.

4.5.3. Salida de la imagen.


Cuando se saca la imagen a pantalla o impresora, las limitaciones del medio no siempre hacen posible una reproduccin absolutamente fidedigna de la imagen digital producida. As por ejemplo tenemos: El tramado (dithering), que es una tcnica usada cuando slo est disponible en pantalla una paleta de color limitada: para crear impresin de un color que no est en la paleta a travs de un patrn de pxels de colores prximos que, vistos a distancia, dan la impresin adecuada de similitud al color que se quiere "simular". Los semitonos (Half-tones), que realizan en parte un proceso similar. Cuando en impresin tenemos que formar colores o grises partiendo de tintas que son slo slidas, lo que se determina es qu resolucin de semitonos vamos a tener; es decir, cul es el tamao de la casilla que, para representar a cierto color o gris, combinar puntos ms pequeos (normalmente entre 1,5 y 2 veces). Algunas impresoras, por ejemplo lser, emplean tcnicas distintas a las de semitonos para producir tonos de color o gris intermedios.

Tecnologas para los Sistemas Multimedia Curso 2004/05 - 10/53

Tema 4.- Imagen.

4.5.4. Filtros y proceso grfico.


Hay una gran cantidad de acciones que se pueden llevar a cabo sobre un grfico en 2d. Se examinarn algunas de las posibilidades ms habituales y necesarias en las prcticas de software de manipulacin grfica.

4.6. Compresin.
El principal problema de los grficos en formato de mapa de bits es la necesidad de disponer de espacio para su almacenamiento, que pueden llegan a alcanzar valores muy grandes. Por ello se utilizan tcnicas de compresin que pueden reducir de forma apreciable la cantidad de memoria necesaria para su almacenamiento. La necesidad de mtodos efectivos de compresin de datos es evidente en la mayora de aplicaciones dirigidas a la transmisin y almacenamiento de informacin digital (imgenes y sonido). As, en un CD-ROM que dispone de aproximadamente 650 Mbytes, se almacenan unos 72 minutos de sonido de calidad CD estreo y sin comprimir. Pero el mismo CD-ROM, slo puede almacenar 30 segundos de video digital con calidad de estudio sin comprimir. Para guardar una pelcula de unos 90 minutos, hara falta aproximadamente unos 120 Gbytes. Si se digitaliza una fotografa de 35 mm en color a una resolucin de 2000 por 2000 (lo que significa extraer unos 4 millones de los 20 millones de pixels que puede ofrecer la pelcula fotogrfica) se genera un fichero de 10 Mbytes. Y un documento escaneado a 300 pixels por pulgada con 1 bit por pixel genera un total de 8'4 Mbits de datos, que requieren 5 minutos de transmisin en una lnea a 32 K. Respecto al caso particular de las imgenes, es posible obtener unos porcentajes altos de compresin sin prdidas significativas de la calidad visual de la imagen, debido a que contienen un alto grado de redundancia: Los tipos de redundancia que nos podemos encontrar en los elementos de una imagen son: 1. Espacial, debido a la correlacin existente entre los pixels vecinos. 2. Espectral, debido a la correlacin entre las componentes de color. 3. Psicovisual, debido a propiedades de la visin humana. A mayor grado de redundancia, mayor ser el grado de compresin que se pueda alcanzar. La intencin de este punto no es realizar una revisin formal de la teora de la compresin de imgenes, sino proporcionar la mnima informacin necesaria para entender los algoritmos/estndares de compresin de imgenes.

4.6.1. Conceptos bsicos de los sistemas de compresin de imgenes.


En el campo de la teora de la informacin, el proceso de compresin de datos basados en la reduccin por redundancia se conoce como source encoding. Las imgenes contienen, bsicamente, dos tipos de redundancia: estadstica (espacial) y psicovisual. La redundancia estadstica se presenta por la aparicin de ciertos patrones espaciales que aparecen con mayor frecuencia que otros; mientras que la redundancia psicovisual proviene del hecho de que el ojo humano es menos sensible a ciertas frecuencias espaciales. El diagrama de bloques de un modelo de source encoding se muestra en la Figura 7 y est compuesto por los elementos siguientes: El transformador (transformer, T) aplica una transformacin uno a uno de los datos de entrada. La salida de este bloque es una representacin de la imagen ms apropiada al mtodo de compresin utilizado que lo es la imagen sin tratar. Las transformaciones tpicas son correspondencias predictivas lineales (linear predictive mapping), que hacen corresponder al valor de intensidad de un pixel con una seal de prediccin de error por

Tecnologas para los Sistemas Multimedia Curso 2004/05 - 11/53

Tema 4.- Imagen.

diferencias con la parte predecible del valor de intensidad; como por ejemplo: correspondencias unitarias (transformada discreta del coseno o DCT) que comprime el valor de energa de una seal en un nmero ms pequeo de coeficientes y correspondencias no unitarias (multiresolution), como la descomposicin en subbandas y la transformada por Wavelets. El cuantizador (quantizer, Q) genera un nmero limitado de smbolos que puedan ser utilizados para representar la imagen comprimida. Es una correspondencia muchos a uno que, por lo tanto, no es reversible. Puede ser escalar, en cuyo caso hace referencia a la cuantizacin de los datos elemento a elemento; o vectorial, en cuyo caso se trabaja con bloques de datos. El codificador (coder, C) asigna un cdigo, una secuencia binaria, a cada smbolo de los obtenidos como resultado de aplicar la etapa anterior. Puede emplear cdigos de longitud fija o variable. Estos ltimos (variable-length coding o VLC) son tambin conocidos como cdigos de entropa, puesto que asignan los valores de forma que se minimice la longitud media de la representacin binaria de los smbolos. Para ello, se asignan los cdigos ms cortos a los smbolos que aparecen ms frecuentemente.

Figura 7. Diagrama de bloques de un sistema de compresin de imgenes.

Diferentes sistemas de compresin de imgenes implementan diferentes combinaciones de estas etapas. Y as, es posible realizar una clasificacin de los mtodos de compresin en Sin prdidas (Lossless o noiseless) que buscan minimizar el tamao sin perder informacin en la imagen. Con prdidas (Lossy) que tiene como objetivo obtener la mejor fidelidad dado un tamao o minimizar el tamao dado un factor de fidelidad con la informacin original. Los bloques de transformacin y codificacin son, por s, sin prdidas. Sin embargo la etapa de cuantizacin es susceptible de prdidas. Por lo que los mtodos sin prdidas, que slo hacen uso de redundancias estadsticas no emplean la etapa de cuantizacin. En la mayora de casos, una pequea prdida de informacin debe permitirse para alcanzar altos porcentajes de compresin. Los mtodos con prdidas hacen uso de los dos tipos de redundancia mencionados.

4.6.2. Tcnicas de Compresin.


Hay que resaltar la diferencia entre informacin y datos, ya que en muchas ocasiones se utilizan como sinnimos y no lo son. Los datos son una forma representar la informacin; as, una misma informacin puede ser representada por distintas cantidades de datos. Por tanto, algunas representaciones de la misma informacin contienen datos redundantes. La compresin de datos se define como el proceso de reducir la cantidad de datos necesarios para representar eficazmente una informacin, es decir, la eliminacin de datos redundantes. En el caso de las imgenes, existen tres maneras de reducir el nmero de datos redundantes: eliminar cdigo redundante, eliminar pxeles redundantes y eliminar redundancia visual.

Tecnologas para los Sistemas Multimedia Curso 2004/05 - 12/53

Tema 4.- Imagen.

CDIGO REDUNDANTE El cdigo de una imagen representa el cuerpo de la informacin mediante un conjunto de smbolos. La eliminacin del cdigo redundante consiste en utilizar el menor nmero de smbolos para representar la informacin. Las tcnicas de compresin por codificacin de Huffman y codificacin aritmtica utilizan clculos estadsticos para lograr eliminar este tipo de redundancia y reducir la ocupacin original de los datos. PIXELES REDUNDANTES La mayora de las imgenes presentan semejanzas o correlaciones entre sus pxeles. Estas correlaciones se deben a la existencia de estructuras similares en las imgenes, puesto que no son completamente aleatorias. De esta manera, el valor de un pxel puede emplearse para predecir el de sus vecinos. Las tcnicas de compresin Lempel-Ziv implementan algoritmos basados en sustituciones para lograr la eliminacin de esta redundancia. REDUNDANCIA VISUAL El ojo humano responde con diferente sensibilidad a la informacin visual que recibe. La informacin a la que es menos sensible se puede descartar sin afectar a la percepcin de la imagen. Se suprime as lo que se conoce como redundancia visual. La eliminacin de la redundancia esta relacionada con la cuantificacin de la informacin, lo que conlleva una prdida de informacin irreversible. Tcnicas de compresin como JPEG, EZW o SPIHT hacen uso de la cuantificacin. CLASIFICACIN Los mtodos de compresin se pueden agrupar en dos grandes clases: mtodos de compresin sin prdida de informacin y mtodos con prdida de informacin. LOSSLESS Los mtodos de compresin sin prdida de informacin (lossless) se caracterizan porque la tasa de compresin que proporcionan est limitada por la entropa (redundancia de datos) de la seal original. Entre estas tcnicas destacan las que emplean mtodos estadsticos, basados en la teora de Shannon, que permite la compresin sin prdida. Por ejemplo: codificacin de Huffman, codificacin aritmtica y Lempel-Ziv. Son mtodos idneos para la compresin dura de archivos. LOSSY Los mtodos de compresin con prdida de informacin (lossy) logran alcanzar unas tasas de compresin ms elevadas a costa de sufrir una prdida de informacin sobre la imagen original. Por ejemplo: JPEG, compresin fractal, EZW, SPIHT, etc. Para la compresin de imgenes se emplean mtodos lossy, ya que se busca alcanzar una tasa de compresin considerable, pero que se adapte a la calidad deseada que la aplicacin exige sobre la imagen objeto de compresin. Desde otro punto de vista, las tcnicas de compresin se podran clasificar en tres tipos: Reduccin de la precisin de los valores individuales. Codificacin de los valores individuales reduciendo el nmero de bits. Transformacin de los datos en otra representacin que sea ms fcil de ser reducida. Muchos formatos combinan dos o las tres formas de comprimir.

4.6.2.1.

Reduccin de bits

A continuacin vamos describir algunos esquemas de compresin de este tipo: Cdigos de desplazamiento (shift codes). Si slo un pequeo subconjunto consecutivo de valores aparece la mayor parte de las veces, entonces se puede elegir un cdigo con longitud (bits) suficiente slo para representar este subconjunto, de modo que los pocos valores que no estn en l se indican con un cdigo especial de overflow que seala los valores representados con ms longitud. Al indicar la mayora de los valores con un nmero reducido de bits, se pueden conseguir reducciones significativas de tamao, entre 2:1 y 3:1 usualmente, aunque siempre dependiendo del grfico. Para ello se desprecian algunos de los bits, dependiendo del rango de valores. La NASA, por ejemplo, usa cdigos de desplazamiento para transmitir la imagen de satlites.

Tecnologas para los Sistemas Multimedia Curso 2004/05 - 13/53

Tema 4.- Imagen.

Cdigos de Huffman. Los cdigos de Huffman (su inventor) asignan un cdigo de longitud variable a cada posible dato o valor de un pixel, de modo que los valores que ocurren ms a menudo tienen cdigos de menor longitud y viceversa. Dada la probabilidad de que un valor dado ocurra, el algoritmo de Huffman puede crear automticamente un asignacin de cdigos. El concepto es sencillo de expresar grficamente: ordenados los valores de mayor a menor probabilidad, se dibuja un rbol binario que los relaciona, de modo que todos los valores estn en hojas y cuanta ms probabilidad tenga cada valor ms cerca est de la raz. Cada una de las ramas descendiente de un nodo dado se etiqueta con un 1 o un 0, y el cdigo Huffman de cada valor es la enumeracin de 1s y 0s desde la raz hasta l. Para dibujar el rbol se empieza por los cdigos de menor probabilidad y se van uniendo en pequeos rboles y sumando sus probabilidades, de modo que siempre se unen los dos nodos con menor probabilidad. Por ejemplo:
1

62

1 0 1

35 % 27 % 23
1 0 1 0

- 11 - 10 -

pixel

fr.apar.

100
0

12 % 11 % 10 % 5
1 0

- 011 - 010 - 001 -

23 112 125 12 54 33 67

35 % 27 % 12 % 11 % 10 % 3% 2%

38 15

3% 2%

- 0001 - 0000 -

Aunque depende, por supuesto, del grfico en cuestin, los cdigos de Huffman permiten una compresin habitual del 1,5:1 al 2:1. El cdigo Huffman puede ser predefinido genrico para cada tipo de compresin, o puede ser especfico y creado expresamente para cada conjunto de datos. Codificacin aritmtica. Tiene el mismo fundamento que el de Huffman (asociar un cdigo en funcin de la probabilidad de cada valor), pero en este caso se funciona asociando cdigos a grupos de valores (por ejemplo, si el valor 7 y el valor 23 tienen mucha probabilidad, este esquema asociar probablemente un cdigo a la subserie 7 23, otro a la 7 7, otro a la 23 23... o incluso a subseries ms largas, dependiendo de la probabilidad. Es algo ms complejo de implementar que el cdigo de Huffman, pero produce entre un 5 y un 10% ms compresin.

4.6.2.2. Transformacin.
Es una tcnica que permite evitar o minimizar la prdida. Bsicamente, hay que buscar patrones que se repitan en los datos. Si no existen (datos totalmente aleatorios), no puede existir compresin sin prdida. De hecho, aplicar un esquema de compresin a datos totalmente aleatorios puede con facilidad incrementar el tamao de los ficheros. De qu manera se buscan los patrones?. Depende de lo que consideremos. En principio, teniendo en cuenta la manera en que recorramos los datos en busca de los patrones repetitivos podemos considerar: Bsqueda en una dimensin, si procesamos los datos como una lista secuencial En dos dimensiones, si los consideramos como un array (un cuadro, en vertical y en horizontal) En tres dimensiones, considerando cuadros que suceden secuencialmente (tpico en vdeo).

Tecnologas para los Sistemas Multimedia Curso 2004/05 - 14/53

Tema 4.- Imagen.

Si generalizamos la manera en la que encontramos los patrones, podemos distinguir: Reduccin del nmero de valores, encontrando informacin redundante y resumindola. Reduccin del significado de los datos, resumiendo grupos de valores con los valores que en esencia los describen (es decir, despreciando informacin no muy significativa). Reduccin de la magnitud de los datos, limitando el nmero de datos a representar en el sistema de codificacin, buscando los datos que originalmente se podan representar pero que no son significativos. El nombre tcnico que se usa a menudo en transformaciones es correspondencia (mapping) para indicar que se hacen corresponder patrones (se "mapean") de los datos originales a cdigos que representan a los patrones. Con esto, comentamos algunas de las tcnicas ms comnmente usadas: Run-Length Encoding. A veces los datos contienen secuencias idnticas de bytes. Si reemplazamos esas secuencias de bytes repetidos por el nmero de repeticiones, podemos obtener una reduccin sustancial del espacio. Para esta codificacin se requiere el uso de un marcador especial que no aparezca en los datos para sealar la repeticin. En caso de que el carcter aparezca en los datos, se duplicar para indicar una presencia real del carcter y no del marcador. Esta tcnica funciona de la siguiente manera. Si un byte ocurre al menos 4 veces consecutivas, entonces se cuenta el nmero de ocurrencias. Los datos comprimidos contienen el byte seguido por el marcador y el nmero de ocurrencias del byte. Por ejemplo, la secuencia: 5 5 14 14 14 14 14 8 8 8 8 7 5 5 5 3 2 2 (18 bytes) se podra codificar usando la siguiente: 2 5 5 14 4 8 1 7 3 5 1 3 2 2 (14 bytes)

Por lo tanto, este algoritmo permite la compresin de entre 4 y 258 bytes en slo 3 bytes. Muchos algoritmos tpicos utilizan alguna variante de RLE: MacPaint, que usa PackBits. Si el byte b est en el rango [0,127] indica que los siguientes b+1 bytes son literales; si est en [-1,-127] repite el siguiente byte -b+1 veces. Por ejemplo: 5 5 14 14 14 14 14 8 8 8 8 7 3 2 5 5 5 = -1 5 -4 14 -3 8 2 7 3 2 -2 5 PCX, que usa los dos bits de mayor peso de cada byte para diferenciar valores de contadores: si ambos son 1, es un contador (de 6 bits, o sea, de 0 a 63) que indica cuntas veces se repite el siguiente byte (que no est codificado); si alguno es 0, directamente indica un valor. Por ejemplo: 5 5 5 255 254 17 255 255 255 255 = 11000011 5 11000001 255 11000001 254 17 11000100 255 PostScript, que usa RunLengthEncode y RunLengthDecode (similares a PackBits). El propio RLE, que es algo ms complicado pero con cierta similitud a PackBits. TARGA y TIFF, con varias implementaciones distintas. Si la ordenacin de valores RGB en los bytes sucesivos es intercalada (byte R, byte G, byte B, etc.) entonces la posibilidad de aplicar algoritmos de tipo RLE es mucho menor que si se ordenan por planos de color (bytes R, bytes G, bytes B), en cuyo caso es ms posible que haya patrones repetidos contiguos. Normalmente es posible trabajar en ratios de compresin 2:1 a 5:1.

Tecnologas para los Sistemas Multimedia Curso 2004/05 - 15/53

Tema 4.- Imagen.

Codificacin LZW. El algoritmo LZW considera la posibilidad de que una secuencia de valores (no necesariamente iguales) se repita, an no consecutivamente, en la secuencia de datos. Por ejemplo, la secuencia 4 12 10 2 8 4 12 10 9 8 4 12 10 9 8 4 se podra representar como: a 2 8 a b a b 4 (siendo a = 4 12 10, b = 9 8) Obsrvese en este ejemplo uno de los problemas de LZW: la secuencia 8 4 tambin se repite, tres veces, pero no se podra indicar si se quiere codificar la subsecuencia alternativa 4 12 10. No hay una nica manera de codificar bytes comunes, por lo que habr que intentar elegir la mejor codificacin posible en funcin de cada fichero. Y esto significara generar la codificacin despus de examinado todo el fichero, con lo que normalmente se opta por una solucin de compromiso que es ir codificando "sobre la marcha" y recordando las secuencias de datos codificadas a partir de all (en el ejemplo, se desprecia la posibilidad 4 12 10 9 8 que se repite dos veces, porque ya se ha encontrado la ms corta pero anterior 4 12 10). LZW se basa en esta idea, aplicando una estrategia de reconocimiento de claves posterior a ser encontradas y dejadas en la salida, sencilla por su bajo requerimiento de memoria. El algoritmo LZW (llamado as por sus desarrolladores, Lempel-Ziv y Welch) est registrado por Unisys y debe licenciarse para su utilizacin comercial. Los formatos GIF, PostScript y TIFF utilizan codificacin LZW. Diferenciacin (differencing). Este esquema de compresin se basa en el hecho de que en ficheros grficos realistas es comn que muchos datos sucesivos tengan diferencias pequeas (por ejemplo, verdes de gamas muy similares con pequeas variaciones de brillo). En ese caso, en vez de representar cada dato por completo, partiendo de uno inicial los dems se pueden expresar como diferencias con respecto a l, o al inmediato anterior, utilizando muchos menos bits para ello. Por ejemplo, la serie: 35 37 38 33 36 35 35 se puede representar con la otra: 35 -2 -1 5 -3 1 0 La compresin de este tipo de algoritmos depende mucho de los datos aunque todos los grficos habituales, tanto fotos reales como no, suelen tener bastantes series reconocibles de valores cercanos. Reducciones de 1,5:1 a 3:1 pueden alcanzarse con facilidad. Existen algoritmos de diferenciacin de 2 dimensiones que se basan en comparaciones de cada lnea horizontal del grfico con la siguiente, buscando similitudes que es habitual que existan. Es el caso de los formatos JPEG o MPEG sin prdida. Fractales. J.E.Hutchinson fue en 1981 el primer matemtico que estudiando las propiedades comunes (compacidad, autosemejanza,...) de los fractales ya conocidos, elabor una teora unificada para la obtencin de una amplia clase de conjuntos fractales: los fractales autosemejantes. M.F.Barnsley, en 1985, estudi una generalizacin del mtodo de J.E.Hutchinson. Mientras que J.E.Hutchinson utilizaba semejanzas contractivas, M.F.Barnsley utiliza aplicaciones contractivas, lo que le permite ampliar notablemente la familia de fractales obtenidos. El mtodo de M.F.Barnsley descubre la posibilidad de

Tecnologas para los Sistemas Multimedia Curso 2004/05 - 16/53

Tema 4.- Imagen.

encontrar un fractal que se aproxime, tanto como queramos, a un objeto natural. M.F.Barnsley utiliza el trmino fractal para referirse a cualquier conjunto compacto y no vaco. El mtodo de M.F.Barnsley para generar conjuntos fractales, se basa en los sistemas de funciones iteradas (SFI). La compresin consiste en buscar un conjunto de transformadas afines (ver figura siguiente) que describan aproximadamente la imagen. Se propone considerar las imgenes como una coleccin de transformaciones afines de pequeos dominios de imagen. Barnsley sugiere que las imgenes sean almacenadas como una coleccin de transformadas, cuyo nmero determina la tasa de compresin.

Con el mtodo de M.F.Barnsley, a partir de una imagen natural, obtenemos una familia de contracciones que generan un fractal que se aproxima a la imagen natural tanto como queramos. As, en vez de comprimir la informacin de cada punto de la imagen, nos basta con guardar la familia de contracciones que generan el fractal. Para la compresin de imgenes mediante el mtodo de M.F.Barnsley, necesitamos funciones contractivas de R4, ya que en cada punto de la imagen trabajamos con (largo, alto, color, contraste). Para construir un fractal autosemejante partimos de un nmero finito de transformaciones que son semejanzas contractivas. Una aplicacin f : Rn Rn, se llama contractiva si: d(f(x) , f(y)) <=r *d(x , y) , para todo x , y Rn donde r [0 , 1) se llama razn de contraccin. Toda aplicacin contractiva es continua. Entre dos figuras semejantes y distintas del plano eucldeo, siempre existe una aplicacin contractiva que transforma la mayor en la menor. Esta aplicacin contractiva es una composicin de isometras (traslaciones, giros y simetras) y una homotecia contractiva. La forma general de la aplicacin contractiva es: F(x , y) = (a *x + b *y + e , c *x + d *y + f) Para determinar los coeficientes a, b, c, d, e, f, se procede a determinar las imgenes de tres puntos y a resolver el correspondiente sistema de 6 ecuaciones con 6 incgnitas que nos dar sus valores. ALGORITMO DE COMPRESIN Lo primero que hay que hacer es tomar una particin de la imagen en subconjuntos llamados regiones dominio. Cada una de estas regiones se sustituir por la transformada afn que la genera. Cuanto mayor sea el tamao de los subconjuntos de la particin, mayor ser la compresin de la imagen, y peor su calidad. Ahora tenemos que conseguir las regiones rango, que son subconjuntos de la imagen, de tamao mayor que las regiones dominio (dos o tres veces mayores), que no tienen porque cubrir todo el conjunto, y que pueden superponerse. La idea del algoritmo es buscar transformaciones contractivas que transformen a las regiones rango en regiones dominio. Para cada dominio buscamos entre todas las regiones rango la que mediante una transformacin contractiva ms se parezca al dominio, y almacenamos dicha transformacin. Este proceso es muy lento, al tener que trabajar con un gran nmero de conjuntos. ALGORITMO DE DESCOMPRESIN Lo primero que hay que hacer es elegir dos zonas de memoria capaces de contener a la imagen una vez descomprimida. Se le aplican a la primera zona de memoria las transformaciones contractivas obtenidas en la compresin, y se almacena el resultado en la segunda zona. Ahora se comparan las imgenes contenidas en las dos zonas de memoria, y si son muy distintas se repite el proceso descrito anteriormente. Este algoritmo de descompresin es muy rpido, y tras unas 20 iteraciones del proceso anterior, obtenemos la imagen descomprimida.

Tecnologas para los Sistemas Multimedia Curso 2004/05 - 17/53

Tema 4.- Imagen.

Esquemas de transformaciones matemticas. Existen muchas operaciones matemticas que transforman un conjunto de valores a otro y despus pueden ser aplicadas a la inversa para reconstruir el conjunto original. Algunas de ellas son especialmente tiles para su aplicacin a algoritmos de compresin, por ejemplo: Discrete Fourier Transform (DFT). Discrete Cosine Transform (DCT). Hadamard-Haar Transforms (HHT). Karhunen-Loeve Transforms (KLT). Slant-Haar Transforms (SHT). Walsh-Hadamard Transforms (WHT). Con mucho, la funcin ms utilizada es la DCT, que por ejemplo se usa en versiones de JPEG y MPEG. Para ello se reemplazan bloques de intensidad de color de 8x8 pxels por una serie de valores parametrizando una funcin cosenoidal.

4.7. Formatos de ficheros grficos y estndares.


Existen infinidad de formatos grficos, cada uno con sus ventajas y sus inconvenientes, por ello vamos a describir brevemente algunos de los ms utilizados agrupndolos en formatos grficos bitmaps y formatos grficos vectoriales. Posteriormente describiremos con mayor detalles los formatos ms utilizados, con los formatos de compresin utilizados, etc.

4.7.1. Formatos grficos bitmap.


Algunos de los formatos grficos bitmap ms utilizados son los siguientes: PNG (Portable Network Graphics): otro formato tan potente como el TIFF es el PNG (pronunciado ping), que fue creado para evitar el algoritmo LZW, pues el propietario de la marca, Unisys, cobra a todo aquel que utilice este mtodo para comprimir sus imgenes. Este formato es casi tan completo como el TIFF y mucho ms que el GIF, y al ser de dominio pblico todo el mundo puede usarlo sin necesidad de pagar derechos de autor a ninguna empresa. Integra caractersticas de GIF y JPEG. Este formato es el nuevo estndar para la publicacin en Internet que intenta introducir el W3C. PPM (Portable Pixmap): es un formato de bitmap que incluye una mnima cabecera, por lo que en tamao es poco mayor que lo que ocupan los pixels de la imagen. Existen variantes en formato binario y ASCII, siendo este ltimo unas cinco veces mayor que el primero. rgb: es un formato propio del sistema operativo IRIS de Silicon Graphics, Inc. Es aproximadamente del tamao del bitmap. TIFF (Tagged Image File Format) permite trabajar en diferentes plataformas, con cualquier profundidad de pixel y admite diversas opciones de compresin. Generalmente se utiliza sin comprimir o utilizando el algoritmo LZW. Es aproximadamente del tamao del bitmap. PICT: es el formato usual en plataformas Macintosh. No soporta color en 24 bits. PICT2: es la extensin del formato PIC, que permite imgenes de 24 bits de color, y permite agrupar imgenes bitmap y vectoriales.

Tecnologas para los Sistemas Multimedia Curso 2004/05 - 18/53

Tema 4.- Imagen.

TGA (TARGA): desarrollado por AT&T y Truevision, es uno de los ms utilizados en el rea de sntesis de imagen. Permite diferentes tipos de compresin y variantes como paletas, comentarios y ordenacin de los datos. PCX: es un formato muy prximo al raster, utilizado en plataformas Windows, utiliza compresin RLE. FIF (Fractal Image Format): es un formato desarrollado por Iterated System, basado en tcnicas de compresin fractal que se caracteriza por ser uno de los formatos de compresin con prdidas que mayores niveles de compresin consigue junto a una calidad de imagen muy superior a JPEG. El problema de este formato es la cantidad de CPU que consume la descompresin de las imgenes.

A continuacin veremos la estructura de los archivos de dos de los formatos anteriores, BMP y GIF. 4.7.1.1. Formato BMP

BMP es un formato sencillo de bitmap propio de plataformas Windows. Se guardan rpido pero son muy grandes. Sin embargo, oa estructura de un BMP no es tan simple como mucha gente piensa. No son solo pixels. Los archivos de mapa de bits tienen una cabecera con sus estructuras y variables para guardar, entre otras cosas, el tipo de archivo, el tamao en bytes del archivo, el tamao horizontal y vertical de la imagen, etc. En la cabecera se pueden diferenciar 3 estructuras: BITMAPFILEHEADER, BITMAPINFOHEADER, y en algunos casos utiliza la estructura RGBQUAD para definir la paleta de colores. A continuacin vamos a pasar a explicar ms detalladamente cada una de ellas. En la BITMAPFILEHEADER podemos encontrar la informacin mas general del archivo. En C podemos describirla de una manera tal como: struct { char bftype[2]; int bfsize; short bfreserved1; short bfreserved2; unsigned long bfoffbits; } bmfh; La primera variable "char bftype[2]" de 2 bytes es el tipo de archivo, y deber contener BM. "int bfsize": contendra el tamao del archivo. "short bfreserved1" y "short bfreserved2": son variables reservadas y en principio debern valer 0. "unsigned long bfoffbits": en este campo se guarda el tamao de la cabecera en bytes, con lo cual a partir del siguiente byte marcado por bfoffbits empezarn los pxels. Seguiremos con la estructura BITMAPINFOHEADER que contendr informacin ms detallada acerca del archivo. Podemos describirla como: struct { unsigned long bisize; unsigned long biwidht; unsigned long biheight; short biplanes; short bibitcount; unsigned long bicompression; unsigned long bisizeimage; unsigned long bixpelspermeter; unsigned long biypelspermeter;

Tecnologas para los Sistemas Multimedia Curso 2004/05 - 19/53

Tema 4.- Imagen.

unsigned long biclrused; unsigned long biclrimportant; } bmih; Pasemos a explicar los campos: "unsigned long bisize": Tamao de esta estructura. "unsigned long biwidht": Anchura de la imagen en pxels. "unsigned long biheight": Altura de la imagen en pxels. "short biplanes": Nmero de planos. Siempre es 1. "short bibitcount": Bits por pxel. Puede ser 1 para blanco y negro, 4 para 16 colores, 8 para 256 colores y 24 para 16 millones de colores. "unsigned long bicompression": Compresin de la imagen. Normalmente es 0 (sin comprimir) pero puede tener valores 1 y 2. "unsigned long bisizeimage": Tamao de la imagen. Puede ser 0 si no est comprimida. "unsigned long bixpelspermeter": Resolucin horizontal en pxels por metro. "unsigned long biypelspermeter": Resolucin vertical en pxels por metro. "unsigned long biclrused": Colores ms usados "unsigned long biclrimportant": Colores importantes en la imagen. La siguiente estructura, RGBQUAD, tan solo se utiliza para definir las paletas de colores. En una imagen de 24 bits/pixel no existe la paleta, ya que se pueden utilizar todos los colores existentes. En cambio, en una imagen de 8 bits/pixel, directamente despus de la BITMAPINFOHEADER se suceden 256 campos formados x estructuras de esta clase que definen la paleta. La estructura seria de esta forma: struct { unsigned char rgbBlue; unsigned char rgbGreen; unsigned char rgbRed; unsigned char rgbReserved; } rgbq; Donde: "unsigned char rgbBlue": Intensidad de azul. "unsigned char rgbGreen": Intensidad de verde. "unsigned char rgbRed": Intensidad de rojo. "unsigned char rgbReserved": No se usa. Deber contener un 0. A partir de aqu se encontrarn los pxels. Si la imagen es por ejemplo de 24 bits/ pixel, cada 24 bits ser un pixel. 4.7.1.2. Formato GIF.

GIF o Graphic Interchange Format es un formato propietario de CompuServe y se desarroll especficamente para transmisin en tiempo real de grficos. Utiliza el algoritmo de compresin LZW (Lempel-Ziv y Welch) que se basa en reducir el nmero de pxeles cuando muchos prximos son del mismo color. El copyright no est muy claro, porque LZW est patentado. Lo cierto es que se usa mundialmente sin demasiado problema al respecto. Sus caractersticas permiten: 256 colores como mximo (8 bits), elegibles entre una paleta cualquiera.

Tecnologas para los Sistemas Multimedia Curso 2004/05 - 20/53

Tema 4.- Imagen.

Crear GIFs entrelazados, que pueden mostrarse progresivamente de menor a mayor resolucin en lugar de tener que esperar a cargarse por completo. Definir un color transparente para superponer el grfico a otros elementos (o el fondo) de la pgina. Los GIFs transparentes tambin admiten tcnicas de anti-aliasing, como el caso de los textos. Definir pequeas animaciones con mltiples dibujos que se van visualizando progresivamente (gifs animados).

Los GIFs son muy adecuados con dibujos con rango de colores limitado (como los clip-art), no foto realistas o imgenes digitalizadas. El formato GIF define un protocolo orientado a la transmisin e intercambio de datos grficos on-line de manera independiente al hardware de creacin y visualizacin. El formato se define en trminos de bloques y sub-bloques que contienen parmetros relevantes y datos usados en la reproduccin de un grfico. Un flujo de datos GIF es una secuencia de bloques y subbloques de protocolo que representan una coleccin de grficos. En general, se asume que estos datos estn de alguna forma relacionados entre s y que comparten alguna informacin de control. El formato no hace deteccin ni correccin de errores y los datos deben ser interpretados en su contexto. La definicin del formato GIF permite que un fichero slo contenga la cabecera, el descriptor lgico, una tabla de colores global y el final. El formato GIF define la siguiente gramtica: <GIF Data Stream> ::= <Logical Screen> ::= <Data> ::= <Graphic Block> ::= Header <Logical Screen> <Data>* Trailer Logical Screen Descriptor [Global Color Table] <Graphic Block> | <Special-Purpose Block> [Graphic Control Extension] <Graphic-Rendering Block>

<Graphic-Rendering Block> ::= <Table-Based Image> |Plain Text Extension <Table-Based Image> ::= Image Descriptor [Local Color Table] Image Data <Special-Purpose Block> ::= Application Extension | Comment Extension Veamos cada uno de estos bloques. Header: La cabecera identifica el archivo GIF. Se divide en dos campos de 3 bytes, denominados firma y versin. Firma identifica el comienzo del archivo y la versin identifica el conjunto de capacidades requeridas en el decodificador. Este bloque es obligatorio debe ser nico en el archivo. Logical Screen Descriptor: Contiene los parmetros necesarios para definir el rea en el cual se mostrar la imagen. Las coordenadas se dan con referencia a las esquina superior izquierda de la pantalla virtual y no tienen por qu ser coordenadas absolutas, lo que implica que pueden ser coordenadas con respecto a la ventana donde se visualice. Es un bloque obligatorio y nico. La estructura viene dada por la siguiente tabla Campo Logical screen width Logical screen height Packet fields Global Color Table flag Color Resolution Sort flag Funcin Anchura en pxels Altura en pxels Los 4 campos siguientes Indica si existe o no una tabla de colores Nmero de bits por color primario -1 Indica si est ordenada la tabla de colores, por lo general en orden decreciente de Tamao (bytes) 2 2 1 1 bit 3 bits 1 bit

Tecnologas para los Sistemas Multimedia Curso 2004/05 - 21/53

Tema 4.- Imagen.

Global Color Table Size Background color index

Pxel Aspect Ratio

importancia Si el flag vale 1, entonces indica el nmero de bytes de la tabla ndice en la tabla de colores para el fondo de la imagen, se usa para los pxels no cubiertos por una imagen. Factor para calcular una aproximacin al aspecto del pxel en el imagen original Aspect Ratio = (Pixel Aspect Ratio + 15) / 64

3 bits 1

Global Table Color: Este bloque contiene la tabla de colores, que es una secuencia de bytes representando tripletas rojo-verde-azul. Se usa en imgenes sin tabla local de colores y por las extensiones de texto. Aparece cuando el valor de Global Color Table Flag vale 1 en el bloque anterior. En dicho caso, el tamao de este caso sera 3 x 2^(Size of Global Color Table+1). Este bloque es opcional, como mucho debe aparecer uno. Image Descriptor: Cada imagen est compuesta de un descriptor de imagen, una tabla local de colores (opcional) y los datos de la imagen. Cada imagen debe encajar en los lmites de la pantalla virtual definida en el Logical Screen Descriptor. El descriptor de imagen contiene los parmetros necesarios para procesar una imagen basada en tabla. Las coordenadas dadas en este bloque referencian coordenadas de la pantalla lgica en pxels. Este bloque es del tipo Graphic-Rendering y opcionalmente puede ir precedido por bloques de control tipo Graphic Control Extension y opcionalmente seguido por la Local Color Table. Al descriptor de imagen siempre le siguen los datos de la imagen. Este bloque es obligatorio y nico para cada imagen del archivo. Veamos la estructura de este bloque: Campo Image Separator Funcin Identifica el comienzo de un descriptor de imagen, valor 0x2c Columna ms a la izquierda de la imagen en pxels, respecto del lmite izquierdo de la pantalla virtual Fila superior de la imagen en pxels, respecto del lmite superior de la pantalla virtual Anchura de la imagen en pxels Altura de la imagen en pxels Los 5 campos siguientes Indica la presencia de una tabla local de color despus del descriptor de imagen Indica si la imagen est entrelazada Indica si la tabla local de color est ordenada Indica el tamao de la tabla local de color, si la hay Tamao en bytes 1

Image Left Position

Image Top Position

Image Width Image Height Packed fields Local Color Table Flag

2 2 1 1 bit

Interlace Flag Sort Flag Reservados Size of Local Color Table

1 bit 1 bit 2 bits 3 bits

Local Color Table: Estructura idntica a la Global Color Table.

Tecnologas para los Sistemas Multimedia Curso 2004/05 - 22/53

Tema 4.- Imagen.

Table based Image Data: Secuencia de sub-bloques de tamao mximo 255 conteniendo un ndice a la tabla de color activa para cada pxel en la imagen. Los pxels se ordenan de arriba a abajo y de izquierda a derecha. Cada valor debe estar en el rango vlido. La secuencia de ndice se codifica usando el algoritmo LZW con longitud de cdigo variable. Graphic Control Extension: Contiene parmetros usados para procesar un Graphic Rendering Block. Este bloque es opcional y como mucho puede aparece uno antes de un Graphic Rendering Block. Su estructura es la siguiente: Campo Extension Introducer Funcin Identifica el comienzo de un bloque de extensin, valor fijo 0x21 Identifica el bloque actual como Graphic Control Extension, valor fijo 0xF9 Nmero de bytes en el bloque a partir de este punto, valor fijo 4 Los cuatro campos siguientes Indica cmo se debe tratar la imagen despus de mostrarla: 1 dejarla, 2 poner fondo, 3 poner la anterior Indica si se espera entrada de usuario Indica si existe un ndice de transparencia Centsimas de segundo a esperar antes de proseguir con la imagen Si existe ndice entonces no se modifica el pxel correspondiente Indica el final del bloque Tamao en bytes 1

Graphic Control Label

Block size Packed fields Reservado Disposal method

1 1 3 bits 3 bits

User input flag Transparent color flag Delay time

1 bit 1 bit 2

Transparency index

Block terminator

Comment Extension: Contiene informacin textual que no es parte de los grficos actuales. Se aconseja para incluir comentarios sobre los grficos, crditos, o descripciones de datos. Se puede ignorar o retrasar su procesamiento. Es un bloque opcional y no hay lmite de aparicin. Contiene los siguientes campos: Extension Introducer: Comienzo de bloque a valor fijo 0x21. Comment Label: Identificacin de bloque de Comment Extension a valor fijo 0xFE. Comment Data: Secuencia de sub-bloques entre 1 y 255 bytes, con el tamao en 1 byte precediendo a los datos. El final se marca con un Block Terminator Plain Text Extension: Contienen datos de texto y los parmetros necesarios para procesar los datos como un grfico de manera sencilla. Los datos de texto se codifican usando el cdigo ASCII de 7 bits y a cada carcter se le asigna una celda individual. Este bloque se estructura de la siguiente forma: Campo Extension Introducer Plain Text Label Block size Text Grid Left Position Funcin Comienzo de extensin, valor 0x21 Identifica el bloque actual como de texto, valor fijo 0x01 Tamao en bytes, valor fijo 12 Columna en pxels de lmite Tamao en bytes 1 1 1 2

Tecnologas para los Sistemas Multimedia Curso 2004/05 - 23/53

Tema 4.- Imagen.

Text Grid Top Position

Image Grid Width Image Grid Height Character Cell Width Character Cell Height Text Foreground Color Index Text Background Color Index

Plain Text Data

Block Terminador

izquierdo del grid del texto respecto a la pantalla lgica Fila en pxels de lmite superior del grid del texto respecto a la pantalla lgica Anchura en pxels del grid Altura en pxels del grid Ancho en pxels de cada celda Alto en pxels de cada celda ndice en la tabla global de colores usado para el texto ndice en la tabla global de colores usado para el fondo del texto Secuencia de sub-bloques de entre 1 y 255 bytes, con un byte predecesor para indicar el tamao Fin de Bloque

2 2 1 1 1 1

Application Extension: Contiene informacin especfica de la aplicacin. Su estructura es la siguiente: Campo Extension introducer Application Extension Label Funcin Valor 0x21 Identifica el bloque como extensin de aplicacin valor 0xFF Tamao del bloque de extensin, excluyendo el campo Application Data, valor 11 8 caracteres ASCII para identificar la aplicacin propietaria de la extensin Una aplicacin puede usar un algoritmo que la identifique unvocamente como propietario Sub-bloques de datos Fin de bloque Tamao en bytes 1 1

Block size

Application Identifier

Application Code Application Data Block Terminador

Authentication

N 1

Trailer: Contiene el valor fijo 0x3B. Indica el final del GIF.

La paleta de un fichero GIF puede tener slo 256 colores. Los GIFs de paleta ampliada no son sino un truco para representar imgenes de ms colores, que se basa en un GIF con varias imgenes con paletas locales, cada una de ellas con 256 colores de la imagen original. Obviamente, si el driver de pantalla tiene slo 256 colores el resultado ser un pequeo caos. Adems, a quin le importa que los GIFs slo tengan 256 colores pudiendo usar un JPEG para casos as?.

4.7.2. Formatos grficos vectoriales.


Algunos de los formatos grficos vectoriales ms utilizados son los siguientes:

Tecnologas para los Sistemas Multimedia Curso 2004/05 - 24/53

Tema 4.- Imagen.

PS (PostScript): es un formato de fichero basado en un lenguaje de descripcin de pginas creado por Adobe, que permite almacenar ficheros grficos en formato vectorial y que se ha convertido en un estndar en el campo de la impresin. Es alrededor de dos veces el tamao del bitmap, puesto que almacena la imagen como secuencias de bits en formato ascii. Es posible introducir imgenes en formato raster (bitmaps) en tipo de ficheros como una primitiva ms de dibujo y en ese caso se denomina EPS (Encapsulated PS). En esencia un fichero en formato postscript es un pequeo programa que indica cmo se debe dibujar el contenido. DXF (AutoCAD): se ha convertido en uno de los estndares en software CAD. Es un formato vectorial en el que la informacin est en formato ASCII codificado. Suelen ser de gran tamao y no permite especificar colores en 24 bits. CDR (Corel Draw Drawing): utilizado en los programas Coreldraw. GL/2 (Hewlett-Packard): es un lenguaje para la realizacin de grficos vectoriales.

Otros formatos son EMF (Extended MetaFile), CGM (Computer Graphics Metafile), AI (Adobe Ilustrator), etc. 4.7.2.1. Formato WMF.

A modo de ejemplo de formato vectorial, vamos a describir el formato de los ficheros WMF. Simplemente contienen una cabecera con: Tipo de fichero Tamao de la cabecera Nmero de versin Tamao del fichero Nmero de objetos Tamao del registro mximo Y a continuacin hay una serie de llamadas de funcin grficas de Windows (GDI, GraphicalDevice-Interface). Estas son una serie de primitivas con las que se construye el grfico vectorial: Bsicas: SetPixel, LineTo, MoveTo, Rectangle, RoundRect, Polygon, PolyPolygon, PolyLine, Arc, Ellipse, Pie, Chord, FloodFill Texto: DrawText, TextOut, ExtTextOut, SetTextAlign, SetTextCharExtra, SetTextColor, SetTextJustification, CreateFontIndirect Primitivas Bitmap: BitBlt, PatBlt, StretchBlt, StretchDIBits, SetDIBitsToDevice, SetStretchBl Color: CreatePalette, SelectPalette, SetPaletteEntries, AnimatePalette, RealizePalette, ResizePalette Regiones: CreateRegion, SelectClipRegion, ExludeClipRect, IntersectClipRect, OffsetClipRgn, OffsetViewportOrg, OffsetWindowOrg, ScaleViewportExt, SaaleWindowExt, SetViewportExt, SetViewportOrg, SetViewportExt, SetWindowOrg Estado grfico: CreateBrushIndirect, CreatePatternBrush, CreatePenIndirect, RestoreDC, SaveDC, SetBkColor, SetBkMode, SetMapMode, SetMapperFlags, SetPlyFillMode, SetROP02 Otras: SelectObject, DeleteObject, Escape Cada una de las primitivas se codifica con un nmero nico para cada funcin, seguido de una serie de parmetros, en nmero y tipo dependiendo de cada funcin. Veamos con ms detalle la estructura de un archivo WMF.

Tecnologas para los Sistemas Multimedia Curso 2004/05 - 25/53

Tema 4.- Imagen.

Metadatos Este encabezamiento contiene una descripcin del tamao del meta archivo y del nmero de objetos de dibujo usados. Los objetos de dibujo pueden ser pinceles, brochas, bitmaps o fuentes. Tine la siguiente estructura: typedef struct tagMETAHEADER { WORD mtType; WORD mtHeaderSize; WORD mtVersion; DWORD mtSize; WORD mtNoObjects; DWORD mtMaxRecord; WORD mtNoParameters; } METAHEADER; mtType: Especifica si el metaarchivo se almacena en memoria (0) o en fichero (1). mtHeaderSize: Especifica el tamao en palabras de este encabezamiento. mtVersion: Especifica el nmero de serie de Windos (0x300 a partir de la versin 3.0). mtSize: Especifica el tamao en palabras del archive. mtNoObjects: Especifica el mximo nmero de objetos que pueden existir en el metaarchivo al mismo tiempo. mtMaxRecord: Especifica el tamao en palabras del registro ms largo del metaarchivo. mtNoParameters: No se usa. El interfaz del dispositivo grfico almacena la mayor parte de las funciones GDi que una aplicacin puede usar para crear metaarchivos en registros tpicos, que tienen la siguiente estructura: struct { DWORD rdSize; WORD rdFunction; WORD rdParm[]; } rdSize: Tamao en palabras del registro. rdFunction: Especifica el nmero de funcin, debe ser el nmero de alguna de las funciones que aparece al final de esta seccin. rdParm: Identifica un array de palabras conteniendo los parmetros de la funcin. GDI function Value

Arc 0x0817 Chord 0x0830 Ellipse 0x0418 ExcludeClipRect 0x0415 FloodFill 0x0419 IntersectClipRect 0x0416 LineTo 0x0213 MoveTo 0x0214

Tecnologas para los Sistemas Multimedia Curso 2004/05 - 26/53

Tema 4.- Imagen.

OffsetClipRgn 0x0220 OffsetViewportOrg 0x0211 OffsetWindowOrg 0x020F PatBlt 0x061D Pie 0x081A RealizePalette (3.0 and later) 0x0035 Rectangle 0x041B ResizePalette (3.0 and later) 0x0139 RestoreDC 0x0127 RoundRect 0x061C SaveDC 0x001E ScaleViewportExt 0x0412 ScaleWindowExt 0x0400 SetBkColor 0x0201 SetBkMode 0x0102 SetMapMode 0x0103 SetMapperFlags 0x0231 SetPixel0x041F SetPolyFillMode 0x0106 SetROP2 0x0104 SetStretchBltMode 0x0107 SetTextAlign 0x012E SetTextCharacterExtra 0x0108 SetTextColor 0x0209 SetTextJustification 0x020A SetViewportExt 0x020E SetViewportOrg 0x020D SetWindowExt 0x020C SetWindowOrg 0x020B WMFs modificado Un WMF modificado es un WMF con una cabecera adicional de 22 bytes que contiene informacin sobre el aspect ratio y el tamao original del metaarchivo. Esta cabecera tiene la siguiente estructura: typedef struct { DWORD key; HANDLE hmf; RECT bbox; WORD inch; DWORD reserved; WORD checksum; } METAFILEHEADER; key: Especifica el cdigo binario que identifica este tipo de fichero: 0x9AC6CDD7L. hmf: No se usa, valor nulo. Bbox: Especifica las coordenadas del menor rectngulo que encuadra a la imagen. Inch: Especifica el nmero de unidades del archivo, debe ser menor de 1440. Reserved: No se usa, valor nulo. Checksum: XOR de las 10 primeras palabras del encabezamiento. El resto de un WMF modificado es igual que uno estndar.

4.7.3. Formato JPEG.

Tecnologas para los Sistemas Multimedia Curso 2004/05 - 27/53

Tema 4.- Imagen.

JPEG (Joint Photografic Expert Group), no es un formato de fichero, en realidad es un algoritmo de compresin de imgenes de color de 24 bits, que pierde datos de la imagen al comprimir. Por eso, se puede parametrizar la compresin, eligiendo la calidad mantenida, y lgicamente disminuyendo el tamao a la vez que la calidad. Este formato permite obtener muy buenos porcentajes de compresin (ratios iguales o superiores a 10 veces los obtenidos por las tcnicas sin prdidas). Utiliza un formato de compresin con prdidas y se obtienen mejores resultados en imgenes reales con muchos colores y en las que existen pocos objetos con caractersticas geomtricas. Soporta 24 bits por pixel. Y con porcentajes de calidad superiores al 10% no se aprecian grandes prdidas en la imagen recuperada, debido a que con 24 bits por pixel se representan ms colores de los que el ser humano es capaz de distinguir. Este estndar define una familia de tcnicas de compresin para imgenes estticas continuas (ms de dos niveles) en niveles de gris o color. Basndose en el efecto de redundancia psicovisual, JPEG emplea un esquema de compresin con prdidas basado en una transformacin sobre los smbolos. JPEG permite cuatro modos de operacin: secuencial (baseline), jerrquico, progresivo y sin prdidas. En la siguiente figura podemos ver un esquema de estos cuatro modos.

Figura 8. Modos de operacin de JPEG.

El algoritmo bsico (baseline o sequential encoding) es el ms sencillo, en el cual al imagen se recorre de izquierda a derecha y de arriba abajo. Es un modo con prdidas. En la Figura 9 se muestran a grandes rasgos las etapas de este proceso y que podemos enunciar como: Proceso de Codificacin. Codificacin de la fuente: Transformacin de los datos (Discrete Cosine Transformation o Forward DCT). Cuantizacin. Clculo de la Entropa (codificacin): Codificacin Run-length. Codificacin Huffman o aritmtica. Proceso de descompresin. Clculo de la Entropa (decodificacin): Decodificacin Huffman o aritmtica. Decodificacin Run-length. Decodificacin de la fuente: Descuantificacin Transformada discreta inversa del coseno (IDCT).

Tecnologas para los Sistemas Multimedia Curso 2004/05 - 28/53

Tema 4.- Imagen.

Figura 9. Descripcin del algoritmo bsico de JPEG.

En el modo jerrquico, el proceso de codificacin se aplica sobre diferentes rangos de resoluciones que pueden ser descomprimidos de forma separada. En modo progresivo permite la reconstruccin de la imagen en varias pasadas, puesto que es como se realiza la codificacin. Tambin es un mtodo con prdidas. Y finalmente, el modo sin prdidas en el que el proceso de compresin es reversible. Las principales caractersticas de JPEG las podemos resumir como: Independencia de la resolucin: es posible manejar cualquier resolucin. En los modos de operacin basados en DCT se trabaja siempre con tamaos mltiplos de 8, pero es transparente al resto del proceso. Precisin: en los modos basados en DCT se restringe a 8 y 12 bits por muestra, mientras que el modo sin prdidas se puede elegir entre 2 a 16 bits por muestra. Compromiso calidad/tamao controlado por el usuario mediante, fundamentalmente, la matriz de cuantizacin. Separabilidad de las componentes de luminancia y crominancia. Es posible extraer la componente de luminancia sin tener que decodificar la otra componente en la seal codificada. Extensible: no hay limitacin en el nmero de etapas en el modo progresivo o en el jerrquico.

Como resumen, decir que la codificacin de una secuencia de datos en JPEG se define en funcin de lo que el decodificador precisa para descomprimir la secuencia. No existe una definicin formal del formato de fichero, resolucin espacial o modelo de color a emplear. Aunque s existe una definicin de los mnimos recomendables: el JPEG File Interchange Format (JFIF) para permitir el intercambio entre diferentes plataformas y aplicaciones.

Tecnologas para los Sistemas Multimedia Curso 2004/05 - 29/53

Tema 4.- Imagen.

Figura 10. Un vistazo al formato de bloques de JPEG.

Cuando estemos retocando una imagen JPEG, debera guardarse la imagen original como referencia y luego probar JPEGs de calidad menor hasta encontrar un compromiso entre espacio y calidad. Por encima de ratios 20:1 (es decir, imagen comprimida ocupando la veinteava parte de la original) la degradacin ya es ms que obvia.

Figura 11. Compresin 1 (61 Kb), 20 (15 Kb, 4:1), 85 (5 Kb, 12:1) y 99 (2 Kb, 30:1)).

JPEG es mejor que GIFs para grficos de calidad fotogrfica, porque sobre todo se basa en eliminar colores en degradados y en disminuir la resolucin an manteniendo el tamao del cuadro. Tambin existe un JPEG progresivo para ver una imagen de menor a mayor resolucin (aunque pocas herramientas lo soportan).

4.7.3.1. Cmo comprimir correctamente imgenes JPEG?.


Los mejores mtodos de compresin con prdida pueden comprimir un ratio de 2:1, mientras que JPEG puede conseguir normalmente una compresin desde 10:1 hasta 20:1 sin prdida visible. Hemos dicho anteriormente que en este formato podemos elegir el grado de compresin que queremos para las imgenes. Sin embargo, debemos tener en cuenta que para ratios de compresin de 30:1 a 50:1 en imgenes de alta calidad ya se observan defectos. Para grficos de baja calidad de resolucin, la compresin de 100:1 es totalmente factible. Comparativamente, la misma imagen en formato GIF sacrificara la mayor parte de informacin sobre el color, para reducirla a 256 colores (8 bits por pixel). GIF tiene compresin LZW pero no funciona tan bien con fotografas; a lo sumo un ratio de 5:1 en conjunto.

4.7.3.2. Por qu usar JPEG?.

Tecnologas para los Sistemas Multimedia Curso 2004/05 - 30/53

Tema 4.- Imagen.

Tenemos dos buenas razones para emplear JPEG: Disminuir el tamao que ocupan los archivos de imagen. Almacenar en formato de 24 bits/pixel datos de 8 bits/pixel. Actualmente se necesita mucho ms tiempo para decodificar y ver una imagen JPEG que otra en un formato simple como GIF. Podemos considerar que JPEG es un trueque espacio/tiempo: nos conviene a la hora de la transmisin por el ahorro de espacio, pero no vale la pena el tiempo ahorrado en transmitir un fichero de pequeo tamao si es muy elevado el tiempo que se necesita para transmitirlo. GIF es razonablemente bueno para visualizaciones inexpresivas (PCs que no pueden visualizar ms de 256 colores a la vez) pero para el hardware de color completo (24-32 bits), las fotos JPEG se ven mucho mejor que las GIF. La desventaja de la compresin con prdida es que si repetidamente comprimimos y descomprimimos la imagen, se pierde una gran cantidad de informacin cada vez.

4.7.3.3. JPEG frente a GIF.


Son dos de los formatos grficos soportados por todos los navegadores grficos y la eleccin de uno u otro depende de las necesidades de cada documento. Entre las principales ventajas de JPEG encontramos: Ocupan menos espacio que los GIF. Permite una mayor cantidad de colores simultneos en pantalla (hasta 16,8 millones de colores frente a los 256 del GIF). Con hardware de color completo, las imgenes JPEG se ven mejor. Entre las ventajas de GIF encontramos: Entrelazado: permite ver la imagen formndose a medida que llega al browser, permitiendo al usuario tomar la decisin de esperar a ver la imagen o pasar a otra pgina. Transparencia: permite montar una imagen sobre el fondo de manera que no genere interrupciones visuales. Animaciones: varias imgenes y atributos de tiempo para crear animaciones. ltimamente el formato PNG est ganando popularidad porque rene las cualidades del GIF y JPEG, sin embargo slo es posible usarlo para navegadores de ltima generacin. Existe el formato JPEG progresivo que permite lo que se consigue con el GIF entrelazado. Existe un formato llamado HSI JPEG que toma lo mejor de JPEG y GIF, desactivando la compresin JPEG cuando encuentra zonas extensas del mismo color. JPEG no desplazar del todo a GIF, puesto que para algunos tipos de imagen, GIF es superior en calidad de imagen, tamao reducido del fichero o ambos a la vez. JPEG es superior a GIF en almacenamiento de color total o escala de grises de escenas reales: como escaneado de fotografas, etc. Cualquier variacin suave en color, tal como ocurre en reas destacadas u oscuras puede ser representada ms fielmente y en menos espacio con JPEG. GIF es significativamente mejor en imgenes con pocos colores distintos tales como dibujos lineales. No slo pierde menos calidad para tales imgenes, sino que a menudo los compacta ms.

Tecnologas para los Sistemas Multimedia Curso 2004/05 - 31/53

Tema 4.- Imagen.

GIF tambin es ms adecuado para grandes reas de pxels que son iguales en color, iconos, dibujos lineales, animaciones simples, etc. Cuanto ms compleja, sofisticada y sutilmente dibujada es una imagen, es ms probable que JPEG tenga xito. Cuando tenemos bordes afilados, JPEG lo pasa mal: una fila de pxels negro puro contigua a otra de blanco.

4.7.3.4.

Estructura de un archivo JPEG

Para concluir esta seccin de JPEG, estudiaremos en detalle la estructura de un archivo JPEG. Antes de que los datos de la imagen sean cargados al visualizar, los marcadores deben ser ledos. En una imagen JPEG, el primer marcador es el Start Of Image (SOI). La mayora de marcadores contienen informacin adicional. En este caso, el marcador y su informacin asociada son conocidos como encabezamiento. En un encabezamiento, el marcador viene seguido inmediatamente por dos bytes que indican la longitud en bytes de la informacin contenida en el encabezamiento. Un marcador lleva el prefijo hexadecimal FF. A continuacin mostramos los marcadores esenciales para los ficheros JPEG secuenciales. Un componente es un canal de color especfico en una imagen. Por ejemplo, una imagen RGB contiene 3 componentes: Rojo, Verde y Azul.

Marcador de comienzo de imagen (SOI) --2 bytes (FFD8) Marcador JFIF (FFE0) longitud -- 2 bytes identificador -- 5 bytes: 4A, 46, 49, 46, 00 ("JFIF") versin -- 2 bytes: generalmente 01, 02 los bytes ms significativos se usan para revisiones mayores los bytes menos significativos se usan para revisiones menores unidades- 1 byte: Unidades para las densidades X e Y. 0 => X e Y especifican el aspect ratio de pxel 1 => X e Y son puntos/pulgada 2 => X e Y son puntos/cm Densidad X 2 bytes Densidad Y -- 2 bytes Thumbnail X -- 1 byte: 0 = no thumbnail Thumbnail Y -- 1 byte: 0 = no thumbnail (RGB)n -- 3n bytes: (24-bit) valores RGB empaquetados para los pxels thumbnails, n = Xthumbnail * Ythumbnail Marcador de definicin tabla de cuantizacin (FFDB) Los dos primeros bytes indican el nmero de bytes del encabezamiento, incluyendo estos dos bytes de longitud. Para el resto del encabezamiento: ndice de tabla de cuantizacin y precisin: 1 byte (la precisin la indican los 4 bits ms significativos, y el ndice los 4 menos significativos). En este caso la precisin suele ser 0 1 indicando 8bits o 16 respectivamente. Valores de cuantizacin: 64 bytes. Las tablas de cuantizacin se almacenan en forma de zigzag. Marcador de definicin de la tabla de Huffman (FFC4)

Tecnologas para los Sistemas Multimedia Curso 2004/05 - 32/53

Tema 4.- Imagen.

Los dos primeros bytes indican el nmero de bytes del encabezamiento, incluyendo estos dos bytes de longitud. Para el resto del encabezamiento: ndice: 1 byte: si el valor es mayor que 15 entonces indica tabla AC, de otro modo indica tabla DC. bits -- 16 bytes valores Huffman -- # bytes = la suma de los 16 bytes anteriores Marcador de comienzo de frame (FFC0) Los dos primeros bytes indican el nmero de bytes del encabezamiento, incluyendo estos dos bytes de longitud. Esta cabecera contiene: P -- 1 byte: precision de muestra en bits (generalmente 8 en JPEG secuencial) Y -- 2 bytes X -- 2 bytes Nf -- 1 byte: el nmero de componentes en la imagen 3 para imgenes JPEG secuenciales en color 1 para imgenes JPEG secuenciales en escala de grises Hacer Nf veces : Identificador de Componente -- 1 byte Factores de muestreo H y V -- 1 byte: H los 4 primeros bits y V los cuatro siguientes Nmero de tabla de cuantizacin-- 1 byte Los valores de sampleo H y V indican el final del componente al que estn asociados. Por ejemplo, el espacio de color define Y,Cb, y Cr con los valores por defecto 2, 1 y 1 los valores H y V por defecto son 2 en la librera 6a JPEG. Esto significa que el componente Y ser de tamao doble que las otros dos componentes de color, obteniendo una mayor resolucin. Por ello, hay que reducir cuatro veces el tamao de los componentes de menor resolucin para conseguir esta diferencia y al descomprimir hay que cuadruplicar los componentes Cb y Cr. Marcador de comienzo de escaneo (FFDA)

Los dos primeros bytes indican el nmero de bytes del encabezamiento, incluyendo estos dos bytes de longitud. Esta cabecera contiene: Nmero de componentes, n -- 1 byte: nmero de componentes en el escaneo. Hacer n veces: Identificador de Componente -- 1 byte Nmeros de tabla DC y AC -- 1 byte: DC (primeros cuatro bits) y AC (ltimos 4 bits) Ss -- 1 byte Se -- 1 byte Ah y Al -- 1 byte Marcador de comentarios (FFFE) Los dos primeros bytes indican el nmero de bytes del encabezamiento, incluyendo estos dos bytes de longitud. Esta cabecera contiene lo que quiera el usuario Marcador de fin de imagen (EOI) (FFD9)

Tecnologas para los Sistemas Multimedia Curso 2004/05 - 33/53

Tema 4.- Imagen.

4.8. Hardware Grfico.


A continuacin vamos a describir los componentes hardware ms significativos relacionados con el tratamiento de imgenes, como son: tarjeta de vdeo y escner.

4.8.1. Tarjetas de Vdeo.


Dado que hoy en da los monitores son capaces de mostrar imgenes en alta resolucin y truecolor, los factores que influyen en las posibilidades grficas son: La cantidad de memoria disponible para la visualizacin Y la velocidad a la que es posible "dibujar" en los monitores Estos factores se controlan a travs de las tarjetas de vdeo. Estas son tarjetas de circuito impreso que incluyen una memoria y/o un procesador (o varios) para mejorar las capacidades grficas de un computador. La memoria local de estas tarjetas permite aumentar el rango de colores y resoluciones con que se pueden mostrar los grficos en la pantalla. El procesador se encarga de las tareas habituales tales como redibujar la pantalla cuando, en un entorno grfico, se activa una aplicacin cuya ventana estaba total o parcialmente oculta por otra, descargando de esta forma de trabajo al procesador central. Las tarjetas de vdeo son las responsables de mostrar la informacin en la pantalla del computador. Con la llegada de los entornos grficos, la cantidad de informacin involucrada en esta tarea ha hecho necesaria la incorporacin de un hardware que descargue de este trabajo al procesador central. Con la llegada de las aplicaciones multimedia y los grficos en 3D, la necesidad de hardware se ha incrementado considerablemente, lo que ha llevado a desarrollar una circuitera (que incluye un microprocesador) altamente especializada. VGA fue el ltimo de los estndares de vdeo definidos por IBM. A partir de aqu, The Video Electronics Standards Association (VESA), un consorcio de fabricantes de tarjetas de vdeo y de monitores cuyo objetivo es estandarizar los protocolos de vdeo ha desarrollado una familia de estndares conocida como SuperVGA, que son compatibles con el estndar anterior (VGA) y que permite mayores resoluciones y un mayor nmero de colores. Puesto que los pixels son ms pequeos a medida que se utiliza una resolucin mayor y los objetos son de un tamao fijo en la pantalla, aparecern ms pequeos conforme aumente la resolucin de la pantalla. Todos los estndares SVGA soportan la visualizacin en 16 millones de colores, pero el nmero de estos que puede ser utilizado simultneamente est limitado por la memoria de vdeo del sistema. Si se aumenta el nmero de colores o la resolucin se har necesaria una mayor cantidad de memoria. Sin embargo, disminuir uno de los dos permitir aumentar el otro. En la tabla siguiente se muestran las posibles combinaciones para los tamaos ms usuales de memoria de vdeo. Memoria de vdeo
1Mb 2Mb

Resolucin
1024 x 768 800 x 600 1280 x 1024 1024 x 768 800 x 600

Profundidad de color
8-bit 16-bit 8-bit 16-bit 24-bit

Nmero de colores
256 65,536 256 65,536 16.7 millones

Tecnologas para los Sistemas Multimedia Curso 2004/05 - 34/53

Tema 4.- Imagen.

4Mb 6Mb 8Mb

1024 x 768 1280 x 1024 1600 x 1200

24-bit 24-bit 32-bit

16.7 millones 16.7 millones 16.7 millones

Dentro de las tarjetas de grficos de los PCs actuales podemos distinguir cuatro componentes principales: El procesador grfico. La memoria de vdeo. El random access memory digital-to-analog converter (RAMDAC). El software manejador (driver).

Figura 12. Esquema de una tarjeta de vdeo.

Los primeros sistemas VGA eran lentos. La CPU soportaba una alta carga por el proceso que requeran los grficos y la cantidad de informacin que se transfiere a travs del bus a la tarjeta grfica. Los problemas aumentaron por el hecho de que la memoria utilizada (DRAM) no poda ser escrita y leda simultneamente, lo que quiere decir que el RAMDAC deba esperar para leer cuando la CPU no estaba escribiendo y al revs.

4.8.1.1. El Procesador Grfico.


Es problema se solucion al introducir un chip dedicado a procesar los grficos en las tarjetas grficas. En lugar de enviar una imagen completa, la CPU enva un pequeo conjunto de instrucciones de dibujo que son interpretadas por el driver del fabricante de la tarjeta grfica y ejecutadas por el procesador de la tarjeta. Estas operaciones incluyen transferencias y dibujo de bitmaps, cambios en la geometra de las ventanas, dibujo de lneas, escalado de fuentes de letras y dibujo de polgonos. Y son llevadas a cabo por el procesador de la tarjeta de grficos, que est diseado para llevar a cabo estas tareas en hardware a velocidades mucho mayores de lo que lo hara el software que se ejecuta en la CPU El procesador grfico escribe entonces los datos en la memoria de vdeo. Como hay menos datos que transferir habr menos congestin en el bus del sistema y la carga de la CPU se ver reducida en forma considerable.

4.8.1.2. La memoria de vdeo.


La memoria que guarda la imagen se la suele denominar frame buffer y se encuentra, usualmente, en la misma tarjeta de vdeo. Los primeros sistemas de vdeo utilizaban memoria DRAM estndar. Sin embargo, esto requera de un refresco continuo de los datos que impeda el acceso a los mismos durante esos periodos. Como consecuencia, al incrementar las frecuencias de reloj, la productividad descendi en gran modo.

Tecnologas para los Sistemas Multimedia Curso 2004/05 - 35/53

Tema 4.- Imagen.

Una ventaja de incluir la memoria de vdeo en la tarjeta de grficos es que hace posible su adecuacin a tareas especficas y ha contribuido a la aparicin de nuevas tecnologas de memorias, como por ejemplo: Video RAM (VRAM), es un tipo especial de DRAM de doble puerto, que puede ser escrita y leda al mismo tiempo. Utiliza frecuencias de refresco menores que la DRAM ordinaria y como resultado la productividad aumenta. Windows RAM (WRAM), utilizada en las tarjetas Matrox Millenium, es tambin de doble puerto y puede utilizarse a frecuencias un poco mayores que la VRAM convencional. EDO DRAM, ofrece un ancho de banda mayor que la DRAM, puede utilizarse a frecuencias mayores que la DRAM normal y mejora el tratamiento de los ciclos de lectura/escritura de manera ms efectiva.

4.8.1.3. El RAMDAC.
La informacin en la memoria de vdeo es una imagen de lo que ha de aparecer en la pantalla, almacenada como un bitmap en formato digital. Pero el medio de representacin de esta informacin en el monitor utiliza seales analgicas. Estas requieren ms que una indicacin de encender o apagar la seal, necesitan informacin acerca de dnde, cundo y con qu intensidad el can de electrones debe ser disparado en el monitor. Aqu es donde interviene el RAMDAC. Muchas veces por segundo, el RAMDAC, lee los contenidos de la memoria de vdeo, la convierte en una seal analgica RGB y la enva por el cable de vdeo hacia el monitor. La frecuencia a la que puede convertir la informacin y el diseo del propio procesador de grficos, dictan el rango de frecuencias de refresco que la tarjeta de grficos puede soportar. El RAMDAC tambin limita el nmero de colores disponibles a una determinada resolucin, dependiendo de su arquitectura interna.

4.8.1.4. El Programa Controlador (Driver).


Es importante en la productividad y caractersticas que ofrecen las tarjetas. Se ocupa de traducir lo que las aplicaciones quieren visualizar a instrucciones propias del procesador de la tarjeta. Esta traduccin es de gran importancia, puesto que los procesadores son capaces de operaciones ms complejas que las de actualizar el valor de un pixel en la pantalla: pueden dibujar lneas, curvas y mover grandes bloques de datos entre otras. Es misin del driver decidir las instrucciones que deber ejecutar el procesador de la tarjeta para llevar a cabo la tarea que indica la aplicacin (la visualizacin). En la mayora de casos existe un driver diferente para cada resolucin y/o profundidad de color. Esto quiere decir que, incluso a pesar de la sobrecarga que conlleva utilizar diferentes resoluciones y nmero de colores, una determinada tarjeta ofrecer diferentes prestaciones dependiendo de cmo se haya implementado un driver en particular.

4.8.1.5. El sistema grfico AGP para PC.


AGP es una interconexin de alto rendimiento entre el chipset base y la controladora de grficos para mejorar el rendimiento de grficos avanzados para aplicaciones 3D. Reduce el cuello de botella grfico al aadir un interfaz de alta velocidad entre el chipset y la controladora grfica tal y como indica la siguiente figura.

Tecnologas para los Sistemas Multimedia Curso 2004/05 - 36/53

Tema 4.- Imagen.

Esta figura es una representacin de cmo se podran almacenar texturas en la memoria del sistema y ser enviadas directamente al buffer del frame, lo que elimina ancho de banda 3D y trfico de vdeo que limitan el bus PCI y permite usar ms texturas de las que tpicamente pueden caber en la memoria local para imgenes de alta calidad y mapas de texturas. Esto tambin reduce los requerimientos de memoria local en la tarjeta grfica. Los segmentos de la memoria del sistema se reservan dinmicamente para ser usados por la controladora grfica. Esta memoria se llama memoria AGP o memoria no local de vdeo. El resultado neto es que la controladora de grficos es requerida para mantener menos mapas de texturas en la memoria local. Menores requerimientos de memoria significan menor coste global del sistema. Esta innovacin tambin elimina la restriccin de tamao que la memoria grfica local establece sobre mapas de texturas, permitiendo que las aplicaciones usen mapas de texturas de mayor tamao y por lo tanto, mejoras en el realismo y calidad de la imagen. AGP tiene 32 lneas para direcciones y datos multiplexados. La memoria de vdeo local puede ser muy cara y no puede ser usada para otros menesteres por el sistema operativo cuando no sea requerida por el sistema grfico. La controladora grfica necesita acceso rpido a la memoria de vdeo local para refrescar la pantalla y para realizar tareas como el Z-buffering, doble buffering, texturas, etc. Beneficios de la tecnologa AGP AGP no est limitado al ancho de banda de 132MB/s que tiene el bus PCI Con el direccionamiento por bandas laterales, AGP usa 9 lneas de direcciones laterales extra que permiten al controlador grfico tratar varias direcciones y peticiones simultneamente. Ejecucin directa de mapas de textura desde la memoria de sistema. AGP permite acceso directo de ala velocidad a la memoria del sistema por medio del controlador grfico. Menor congestin del bus PCI, que est conectado a una gran variedad de dispositivos de E/S tales como controladoras de disco, de red o sistemas de captura de vdeo. AGP opera de manera concurrente e independiente de la mayora de transacciones PCI. Los accesos de la CPU a la memoria del sistema se pueden realizar de manera concurrente a las lecturas de la controladora grfica de la memoria AGP. La reduccin de trfico de vdeo del bus PCI tambin posibilita tener una mayor estabilidad. Ancho de banda pico por encima de 21 GB/s segn la nueva especificacin AGP 3.0.

4.8.2.

Escners.

Un escner es un dispositivo que permite la conversin de imgenes en un formato que sea vlido para ser procesado por un computador. Las imgenes pueden ser fotografas para su retoque, correccin uso en procesos de maquetado grfico. Pueden ser logotipos hechos a mano para el encabezamiento de documentos o cartas. Tambin pueden ser diapositivas, negativos o transparencias. La lista de aplicaciones en las que se utiliza un escner es mayor de lo que aqu se ha enunciado. En cualquier caso, lo que es ms interesante es hacer notar que la diversidad de las mismas ha resultado

Tecnologas para los Sistemas Multimedia Curso 2004/05 - 37/53

Tema 4.- Imagen.

en la aparicin de diversos formatos de escners para adaptarse a cada caso: compactos para aplicaciones exclusivas digitalizacin de documentos (mayormente OCRs); de fotografa, en los que la fuente de luz es fija y se mueve la foto; de mano, para casos de menores requerimientos y de sobremesa (desktop or flatbed scanners), los ms flexibles. Estos son capaces de digitalizar imgenes, documentos, pginas de libros y revistas y, con los accesorios adecuados, diapositivas.

4.8.2.1. Modo de Operacin.


Todos los escners, se basan en el principio de la reflexin o transmisin (reflectance or transmission) que se ilustra en la Figura 14. El objeto se sita (en el caso de los escners de sobremesa) sobre una pieza mvil que consiste en una fuente de luz y un sensor. La luz reflejada o transmitida por el objeto es recogida por el sensor y convertida en un voltaje proporcional a la intensidad de luz: cuanto ms brillante es una parte, ms luz se refleja (o transmite) resultando en un mayor voltaje.

Figura 14. Esquema de un escner.

El sensor utilizado en la mayora de los escners es un CCD (Charge Coupled Device) lineal. Que consiste en una serie de elementos sensibles a la luz, dispuestos en una lnea. A mayor nmero de estos elementos por unidad de longitud, mayor es la resolucin obtenida. El CCD mide la luz reflejada y la convierte en un voltaje que toma un valor analgico, este se muestrea y convierte en valores discretos mediante la utilizacin de un conversor ADC (analogue-to-digital converter).

4.8.2.2. Resolucin

El CCD es el componente fundamental de un escner, ya que de l depende la resolucin que puede alcanzar la imagen digitalizada. La resolucin se mide en ppp, puntos por pulgada. Un escner tiene diferentes tipos de resolucin. La resolucin ptica o real es el nmero de puntos individuales de una imagen que es capaz de captar el CCD. Esta es la resolucin ms importante porque define los lmites fsicos del escner. Se expresa dando los ppp horizontales x los ppp verticales. Por ejemplo, un escner con una resolucin de 300x600 ppp significa que una linea horizontal de una pulgada contiene 300 puntos individuales, y una lnea vertical de una pulgada contiene 600 puntos individuales. La resolucin interpolada est dada por puntos creados por la computadora, que acomoda entre los puntos captados en la resolucin real. Estos puntos "inventados" deben sus caractersticas a los puntos reales que tengan al lado. Por ejemplo, la computadora puede intuir que entre un punto blanco y uno negro se encontraba uno gris, entonces lo crea y lo acomoda entre ellos. Esto aumenta mucho la resolucin, pero siempre depende de la resolucin ptica o real. Por ltimo existe la resolucin de escaneado, que es definida por el usuario. Puede ir desde un mnimo de 75 ppp hasta el mximo que pueda alcanzar el escner con la definicin interpolada

Tecnologas para los Sistemas Multimedia Curso 2004/05 - 38/53

Tema 4.- Imagen.

En el CCD se obtienen tantos pixels como elementos tiene. As, para un escner de sobremesa capaz de obtener una resolucin ptica horizontal de 600 ppi (pixels per inch) y un tamao mximo de anchura de documento de 8.5 pulgadas habr un total de 5.100 elementos de CCD en lo que es denomina cabezal o (scan head). El cabezal del escner est montado en un elemento mvil que se desplaza a lo largo del objeto a digitalizar. Realizndose la captura de una lnea cada cierto nmero de milisegundos. El nmero de elementos fsicos en la matriz del CCD determina la frecuencia de muestreo en la direccin x y el nmero de lecturas de lnea por unidad de tiempo, en relacin a la velocidad de exploracin, determina la de la direccin en y. Aunque se utilicen estos parmetros para definir la "resolucin" de un escner, este trmino no es el adecuado. En la determinacin de la resolucin de un escner hay que considerar otros factores como la calidad de la electrnica, la ptica, los filtros y el motor de control. La definicin de resolucin depende de varios factores y es la capacidad de un escner para determinar los detalles de un objeto. Es posible mejorar la resolucin aparente mediante la tcnica de interpolacin, que bajo el control de software o hardware calcula puntos intermedios entre los que recoge el escner.

4.8.2.3. Interpolacin.
Tpicamente, los escneres ofrecen resoluciones de 2,400 dpi (dots per inch), 4,800dpi y 9,600dpi. Mientras que las resoluciones pticas son del orden de 600 por 1.200 dpi, es posible ofrecer las anteriores mediante interpolacin. Para ello, a partir de los puntos que se obtienen por el proceso de escaneo, se calculan puntos intermedios que aproximen el comportamiento de los obtenidos. El problema es que nunca sern tan precisos como los que se obtienen en la etapa inicial, por lo que las imgenes obtenidas muestran un aparente desenfoque. Este efecto no es apreciable en imgenes de grficos de lneas, pero s en el caso de imgenes de tonos continuos como las obtenidas a partir de fotografas.

4.8.2.4. Escners de color.


Los escneres de color trabajan con tres fuentes de luz, una para cada uno de los colores primarios (rojo, verde y azul). Algunos escneres tienen un cabezal con una nica fuente de luz fluorescente con tres CCDs con un filtro para cada uno de los colores primarios que obtiene una imagen en una sola pasada. Otros, otros tienen tres fuentes y un slo CCD, por lo que realizan tres pasadas sobre el objeto. Otra alternativa es utilizar un escner de una sola pasada utilizando luz blanca y leyendo los colores separados en el cabezal, puesto que incorporan tres filas de elementos, conteniendo cada una un filtro directamente en el chip (esta misma aproximacin se utiliza en las cmaras de vdeo). Tambin es posible utilizar un prisma que descompone la luz blanca en sus tres componentes y dirigirlas a tres filas de CCDs, lo que requiere una ptica de alta calidad y gran precisin en la disposicin de los elementos.

4.8.2.5. Resolucin Tonal.


El rango de colores (o niveles de gris) que se obtienen en un escner est en relacin con el rango dinmico de los conversores analgico a digital del mismo, la pureza de la luz utilizada como iluminante, la calidad de los filtros y cualquier ruido que pueda producir el sistema. En teora, un escner de 24 bits ofrece un rango de 8 bits (256 niveles) por cada color primario, esta diferencia se admite como suficiente para la capacidad de discriminacin de color del ojo humano. Desgraciadamente, algunos de los bits menos significativos son afectados por el ruido existente, mientras que operaciones de correccin de tono posteriores a la operacin de escaneado reducen mucho
Tecnologas para los Sistemas Multimedia Curso 2004/05 - 39/53

Tema 4.- Imagen.

el rango dinmico. Por esto es mejor realizar las correcciones de tonos antes de la propia operacin de escaneado. Algunos equipos ofrecen valores de 30 y 36 bits para el color, obteniendo un mayor nivel de detalle y permitiendo que posteriores operaciones de correccin ofrezcan valores ms precisos en 24 bits que los mtodos tradicionales.

4.8.2.6. El Software Controlador (Driver).


Los escners, suelen utilizar como estndar de acceso a sus funciones el protocolo TWAIN. Este es un estndar en el proceso de adquisicin desarrollado por Hewlett-Packard, Kodak, Aldus, Logitech y Caere que establece la conexin entre escners y PCs y la utilizacin por parte de las aplicaciones. En la prctica, la opcin de adquisicin (acquire) de una aplicacin permite al usuario indicar la fuente TWAIN lo que permitir ejecutar el driver oportuno a utilizar sin salir de la aplicacin. Despus del escaneado, el driver ofrece la imagen obtenida a la aplicacin que lo ha ejecutado.

4.8.2.7. Escner plano (de mesa)

Tipos de escneres

Este es el tipo de escner ms conocido y vendido. Adems de ser sencillos en la forma de uso, tuvieron un gran auge cuando se utilizaron para publicar imgenes en internet. En este tipo de escners la fuente de luz y el sensor CCD, se encuentran acoplados en un brazo mvil que se desliza sobre el documento que se encuentra inmvil sobre una placa de vidrio. Por lo general tienen un rea de lectura de dimensiones 22 por 28 cm y una resolucin real de escaneado entre 300 y 400 ppp aunque mediante interpolacin lleguen a resoluciones de hasta 1600 ppp. Existen escners planos profesionales que cuentan con sistemas de eliminacin de ruido electrnico, alto rango dinmico y mayores niveles de resolucin. Una variante del escner plano es el escner de libros de trayectoria area, el cual permite escanear volmenes encuadernados con las hojas hacia arriba gracias a que la fuente de luz y el sensor CCD se encuentran ensamblados a un brazo de trayectoria area. Con los escners planos se pueden escanear fotografas, hojas sueltas, peridicos, libros encuadernados e incluso transparencias, diapositivas o negativos con los adaptadores adecuados.

Escner con alimentador de hojas En este tipo de escner el sensor y la fuente de luz permanecen fijos mientras que lo que se mueve es el documento, ayudado por un transporte de rodillos, cinta, tambor o de vaco. Estn diseados para documentos que sean de un tamao uniforme y con una solidez suficiente para soportar una manipulacin brusca. Son utilizados principalmente en negocios grandes, donde importa maximizar el rendimiento, por lo general a expensas de la calidad. Suelen escanear en blanco y negro o con una escala de grises con resoluciones relativamente bajas. Un tipo de escner con alimentador de hojas es el modelo de pie, diseado para los documentos de gran formato, como los mapas y los planos arquitectnicos.

Tecnologas para los Sistemas Multimedia Curso 2004/05 - 40/53

Tema 4.- Imagen.

Escner de tambor Este tipo de mquinas consiguen la mayor resolucin, que puede llegar hasta 4.000 ppp en modo ptico. Estos escners en lugar de utilizar el sensor CCD utilizan un sistema de tubos fotomultiplicadores (PMT) en el bloque lector. Un sistema de transmisin fotomecnico recorre la imagen punto por punto, obteniendo as una gran resolucin y gama dinmica entre bajas y altas luces. Produce una imagen en colores primarios, pero sta puede ser convertida en CMYK mientras el lector recorre la imagen. Los escners de tambor son lentos, no son indicados para documentos de papel quebradizo y requieren un alto nivel de habilidad por parte del operador

Escner para transparencias Los escneres para transparencias digitalizan varios formatos de pelcula transparente, ya sea negativa, positiva, color o blanco y negro. El tamao de escaneado va desde 35 mm hasta placas de 9 x 12 cm. Por lo general el resultado es una imagen con un buen rango dinmico, sin embargo dependiendo del tamao del original, la resolucin puede ser insuficiente para algunas necesidades, adems que el rendimiento puede ser lento. El escner de mesa plana puede realizar tambin este tipo de escaneado, siempre y cuando se cuente con el adaptador necesario.

Escner de mano o porttil

Es un escner pequeo, de bajo precio y buena resolucin, casi como la de los escneres de mesa plana. Hasta hace unos aos eran los escneres ms accesibles econmicamente, ya que los precios de los escneres de mesa plana eras exageradamente caros, poro ltimamente stos han bajado mucho de precio. Su principal limitacin est en el tamao que deben tener los documentos que se desea

Tecnologas para los Sistemas Multimedia Curso 2004/05 - 41/53

Tema 4.- Imagen.

digitalizar, generalmente el largo no importa, pero el ancho no puede sobrepasar los 10 cm. Son lentos y los modelos ms econmicos no manejan colores. La mayora de estos modelos carecen de un motor para pasar las hojas, es el mismo usuario el que debe deslizar el escner sobre el original. Suelen conectarse al puerto de impresora de la computadora y otros modelos llevan su propia tarjeta para puerto ISA. Este tipo de escner es muy tile para digitalizar imgenes de libros encuadernados, artculos periodsticos, facturas y todo tipo de imgenes pequeas

Especificaciones Al igual que con todos los productos informticos, comprar un escner significa entender toda una nueva serie de especificaciones y trminos. A continuacin se exponen los ms importantes: Resolucin. Se especifica en puntos por pulgada (ppp) y es una medida aproximada de la capacidad que tiene un escner para capturar los pequeos detalles de una pelcula o impresin. Existen dos tipos de resolucin: ptica e interpolada; lo que cuenta es la especificacin. A menudo, ver la resolucin de un escner plano expresada como dos nmeros, por ejemplo 600 x 1.200. El primer nmero, la resolucin ptica vertical del escner, es el ms importante y debe ser como mnimo de 600 ppp para obtener una digitalizacin de fotografas de alta calidad. En comparacin, un escner de pelcula de alta calidad tendr una resolucin de ms de 2.000 ppp, y los de ms alta calidad llegan hasta los 4.000 ppp. No haga caso de las cifras a menudo astronmicas que los fabricantes de escneres proponen para la resolucin interpolada: no tienen ningn sentido. Intervalo dinmico (densidad ptica. Es el intervalo de tonos oscuros a claros en los que el escner puede diferenciar detalles y es tan importante como la resolucin. Un escner con un intervalo dinmico alto permite digitalizar con ms detalles de sombras y luces, as como colores y tonos ms uniformes en general. La densidad ptica es la especificacin de escner que indica el intervalo dinmico, por lo que la de un buen escner de fotos debe ser como mnimo de 3,0. Una especificacin relacionada es la profundidad de color en bits, que mide cuntos colores puede especificar un escner. Busque un mnimo de 36 colores. Velocidad. No se olvide de comprobar tambin la velocidad del escner, sobre todo si va a digitalizar muchas fotos seguidas. Digitalizar 15 20 fotos puede suponer fcilmente una hora o ms en un escner de velocidad media. Ms all de las especificaciones Una vez explicadas estas especificaciones, viene lo que nos podamos imaginar: no se puede juzgar un escner slo por sus especificaciones. Dos escneres con resoluciones idnticas, por ejemplo, pocas veces capturan el mismo nivel de detalle en las fotos. Nada puede sustituir dos ojos a la hora de juzgar escneres. Consideraremos estas especificaciones slo como un punto de partida. Algunos escneres de pelcula de gama alta ofrecen accesorios opcionales para pelcula de carrete y alimentador automtico de diapositivas, que permiten la digitalizacin desatendida por lotes de diapositivas o negativos. Si buscamos un escner de pelcula de buena calidad, tambin se encontrar con una sopa de letras de caractersticas especiales con nombres como ICE, ROC y GEM, todas ellas desarrolladas por una empresa llamada Applied Science Fiction. ICE quita automticamente los defectos superficiales de las imgenes digitalizadas a partir de pelculas daadas o sucias; ROC recupera los colores atenuados en las imgenes digitalizadas a partir de pelculas viejas o mal conservadas; y GEM reduce el grano visible.

Tecnologas para los Sistemas Multimedia Curso 2004/05 - 42/53

Tema 4.- Imagen.

Si deseamos convertirnos en fotgrafos profesionales debemos comprobar las caractersticas y la interfaz del software del escner. Un software de escner avanzado permitir un mayor control del brillo, el equilibrio de los colores y la nitidez de las imgenes digitalizadas. Puede suponer una gran diferencia con una foto complicada. Si somos partidarios del tratamiento del color, debemos asegurarnos de que el software del escner es lo ltimo tambin en espacios de color. Conexin Casi todos los nuevos escneres se conectan a los equipos con interfaces USB o FireWire (IEEE 1394, i.Link), y la mayora son compatibles con la caracterstica Plug and Play de Windows. Claro que siempre debemos comprobarlo.

4.8.3.

Cmaras digitales

En una cmara tradicional, la luz que pasa a travs del lente registra una imagen sobre la pelcula compuesta de varias capas superpuestas de productos qumicos (tres capas sensibles al rojo, verde y al azul respectivamente, y en una pelcula negativa de color, una capa protectora naranja). En una cmara digital, la luz golpea un captador electrnico. El fenmeno producido ya no es qumico, sino electrnico. La imagen tomada con una cmara digital consta de millones de pxeles ordenados en lneas y columnas. Esta organizacin puede verse fcilmente en una pantalla de ordenador. En la pantalla de un ordenador, el color de cada pxel se obtiene mediante tres elementos separados: los luminoforos. Uno para el rojo, otro para el verde y el tercero para el azul. Su brillo vara segn la tensin que se aplica les aplica. Sin entrar en los detalles, las cantidades relativas de estos tres colores pueden reproducir casi cualquier color del espectro visible. La mayora de los ordenadores visualizan 16.777.216 colores. Los pxeles de sus captadores no emiten luz, sino que crean una corriente elctrica con base en la luz recibida. La tcnica utilizada es ms compleja que para una pantalla de ordenador. Est basada en pequeos elementos fotosensibles llamados puntos de fsforo. Para simplificar, durante el tiempo de exposicin, cada punto de fsforo recibe una parte de la luz que pasa a travs del lente y la convierte en corriente elctrica. Entre ms intensa sea la luz y ms prolongada sea exposicin, mayor ser la carga elctrica que resulta. Actualmente, todo el mundo toma fotografas en color. Desde un punto de vista elctrico, el captador es el mismo. Cada punto de fsforo est cubierto simplemente por un filtro rojo, verde o azul. Por ejemplo, un filtro rojo detiene los rayos verdes y azules, pero deja pasar el componente rojo de la luz. Dado que los puntos de fsforo son menos sensibles al azul que los puntos rojos y verdes, las cmaras digitales requieren dos captadores para el componente azul de la imagen. Transferencia de una imagen Cuando toma una fotografa, los varios millones de puntos de fsforo del captador contienen diferentes cargas elctricas. La cmara digital debe ahora guardarlas en forma de un archivo de imagen. Para esto, debe enviar el contenido de todos los puntos de fsforo a la memoria de la cmara. En una fraccin de segundo, se transfieren todas las cargas elctricas almacenadas en los puntos de fsforo a una zona de almacenamiento, liberando los captadores. Despus, se desplaza las cargas de una a otra zona y se les transfiere a la memoria. Durante esta operacin, se amplifica las cargas elctricas.

Tecnologas para los Sistemas Multimedia Curso 2004/05 - 43/53

Tema 4.- Imagen.

Despus, se convierte las cargas elctricas en valores digitales de 0 a 255. Por supuesto, se mantiene el orden en el que se ha guardado cada punto de fsforo, de manera a que los pxeles estn dispuestos correctamente en la imagen final visualizada en la pantalla del ordenador. En funcin de la marca y del modelo de la cmara, se guarda la imagen en los formatos grficos RAW, TIF, FlashPix o Targa (TGA). Pero la mayora de las veces, se comprime la imagen. La compresin de la imagen es la ltima fase del proceso de toma de la fotografa. Un programa residente en los componentes electrnicos de la cmara realiza la compresin. En funcin de la calidad elegida por el usuario (en la cmara misma), esta compresin producir un archivo de imagen JPEG de tamao variable. Finalmente, se almacena la imagen en el soporte de almacenamiento de la memoria de la cmara (tarjeta de memoria, disco duro, CD-Rom, etc.) y se puede visualizarla.

4.8.3.1.

Aspectos a tener en cuenta en una cmara digital.

Las cmaras digitales mega-pxel estn bajando de precio, mientras la calidad y el nmero de caractersticas de las mismas se va incrementando. Algunas proyecciones sugieren que las cmaras digitales se volvern tan populares como las cmaras basadas en pelcula para el ao 2005 .La eleccin de una cmara digital involucra un cierto nmero de decisiones, que dependen de los siguientes parmetros. Calidad de imagen La calidad de imagen es un tema complejo que involucra a la precisin de exposicin, pureza de colores y tcnicas de compresin de imgenes. Trataremos este tema con mayor detalle ms adelante. Por ahora, lo ms importante a tener en mente es que no existe realmente un sustituto para la experiencia directa. Capacidad de imagen Dependiendo de su aplicacin, la cantidad de almacenamiento de imagen en la tarjeta es muy importante. Existe generalmente un compromiso entre la capacidad de imgenes y la calidad de la imagen, por lo tanto no conviene alegarse demasiado por una gran capacidad de imagen hasta que verifique cuanta memoria real la cmara contiene comparada con la resolucin de las imgenes. Una cmara puede prometer un almacenamiento doble de resolucin por imagen que otra , pero sin embargo

Tecnologas para los Sistemas Multimedia Curso 2004/05 - 44/53

Tema 4.- Imagen.

no disponer de ms espacio real de almacenamiento . La consecuencia sera probablemente una prdida de calidad de imagen. Muchas cmaras nos permiten tomar la decisin propia acerca de la relacin memoria/costo permitindole almacenar imgenes en tarjetas de conexin externa. Esta aproximacin permite que cada usuario agregue tanta memoria como necesite. Tiempo atrs, la mayora de las cmaras usaban un tipo nico de tarjeta de memoria (llamada PCMCIA ) , pero esos das pertenecen al pasado. Salida, almacenamiento y compresin La mayora de las cmaras digitales en el mercado en la actualidad disponen de un visor (o display ) LCD , lo que significa que podemos observar la imagen en tiempo real . Esta es una de las grandes ventajas de una cmara digital: respuesta inmediata sobre lo que se captura. Una vez que la imagen deja el sensor CCD (por medio del ADC y el microprocesador) , est lista para ser vista en el LCD . Por supuesto, ste no es el fin de la historia, el observar la imagen en su cmara perdera su atractivo si fuera todo lo que pudiera hacer. Queremos adems transferir la imagen a la computadora o enviarla directamente a la impresora. Existen diferentes maneras de almacenar imgenes en una cmara y luego transferirlas a la computadora. Las primeras generaciones de cmaras digitales tenan almacenamiento fijo dentro de la cmara. Para sacar las imgenes necesitaban ser transferidas a la computadora a travs de cables. A pesar de que la mayora de las cmaras actuales son capaces de conectarse a un cable de puerto serie, paralelo , SCSI , USB , etc . , las mismas vienen provistas de algn tipo de dispositivo de almacenamiento removible. Las tecnologas rivales son CompactFlash , SmartMedia , y Memory Sticks , pero existen otras. Estas tres representan dispositivos de memorias del tipo flash pequeas, removibles , y de estado slido , que no tienen partes mviles . Son medios rpidos y baratos de almacenar fotos de manera que pueda transferirlas a una computadora o imprimirlas posteriormente. Para poder pedir o transferir archivos desde una memoria flash hacia su computadora sin usar cables, deberemos disponer de un driver o lector para su mquina . Estos dispositivos se comportan en forma muy similar a lectoras de mini discos y son de precio accesible. Considere a todos estos medios de almacenamiento como pelculas digitales reusables. Los diferentes tipos de dispositivos para memorias flash no son intercambiables. Cada fabricante de cmara ha decidido sobre un dispositivo u otro. Cada uno de los dispositivos de memoria necesitan de algn tipo lector de tarjeta para poder transferir los datos. Una tarjeta de memoria en tamao natural, este dispositivo es el soporte de las imgenes captadas por la cmara, de la cual se pueden transferir al computador . Almacenamiento La cmara necesita almacenar sus imgenes en algn lugar, y usa memoria para hacerlo . Existe un nmero de de sistemas de almacenamiento corrientemente usados en las cmaras digitales: Memoria interna: Algunas cmaras extremadamente baratas tienen una memoria flash interna . No existe ningn modo de cambiar o ampliar la memoria. La memoria interna puede servir para mantener 6 12 imgenes, luego usted puede bajar las imgenes a su computadora o borrarlas para poder cargar ms . Tarjetas SmartMedia: Las tarjetas SmartMedia son mdulos de memoria flash pequeos . La cmara puede venir con uno, y luego usted puede comprar tarjetas adicionales si necesita mas memoria . Los tamaos son de 4,8,16,32 y 64 megabytes (MB) . Tarjetas Compact flash : Las tarjetas Compact flash son otro tipo de memoria flash , similares a la anterior , pero ligeramente diferentes . Los rangos de capacidad varan hasta 128 MB . Memoria tipo Memory stick : es una forma registrada de memoria usada por Sony. Mini disco ( disco floppy , disquete ) algunas cmaras almacenan las imgenes directamente sobre disquetes . Esto facilita la transferencia de imgenes debido a que simplemente se puede sacar el disquete y colocarlo dentro de cualquier computadora . El problemas es que un disquete slo almacena hasta 1.4 MB de informacin , lo que no es suficiente cuando estamos hablando de imgenes de alta resolucin . Usted puede almacenar aproximadamente 30 imgenes de 640X480 en un disco floppy .

Tecnologas para los Sistemas Multimedia Curso 2004/05 - 45/53

Tema 4.- Imagen.

Disco rgido - Algunas cmaras mas sofisticadas usan discos rgidos integrados , o tarjetas de disco rgido PCMCIA , para el almacenamiento de imgenes . Los tamaos pueden variar hasta un gigabyte (GB) , dependiendo del factor de forma . Grabacin de CD y DVD - Algunos de las cmaras nuevas usan discos compactos (CD) y DVDs grabables para almacenar imgenes. Un disco compacto grabable almacena hasta 650 MB , un DVD puede almacena hasta 5.6 gygabytes (GB) .

Para elegir entre estas diferentes opciones, existen algunos temas a considerar : si nos gusta tomar una docena de tomas de 640 x 480 en un cumpleaos y luego cargarla en su computadora para enviarlas por e-mail , cualquiera de estos sistemas funcionar . Si no necesitamos mucha memoria, entonces un disquete est bien, o una pequea cantidad de memoria ( 2 4 MB ) flash trabaja bien . Si planeamos irnos de viaje, tomar cientos de fotografas y luego volver a casa a observarlas, necesitaremos grandes cantidades de almacenamiento. Puede obtenerlo comprando memoria flash extra o usando una cmara con disco rgido. Si queremos tomar imgenes de alta resolucin (por ejemplo , imgenes de 2 megapxeles ) , necesitaremos gran cantidad de almacenamiento . Necesitaremos probablemente tarjetas de memoria flash extras o usar una cmara con disco rgido. Versatilidad de exposicin Una desventaja notable de las cmaras digitales es su inhabilidad para manejar condiciones de iluminacin radicalmente diferentes simplemente usando un tipo diferente de pelcula: (con una cmara digital , la cmara es la pelcula ). Esto significa que deberemos estar seguro de que el sistema de exposicin de la cmara ( obturador , apertura de lente variable , flash suplementario ) pueda manejar un rango suficientemente amplio de condiciones . En esta categora , observaremos el nmero equivalente ISO de la cmara , que mide la sensibilidad del sensor de la cmara a la luz . Un nmero ms alto significa que la cmara puede capturar con mayor capacidad imgenes con menor luz. La mayora de las cmaras del tipo "apunte y dispare" tienen rangos ISO equivalentes dentro de los valores 80-200, a pesar de que algunas van mucho mas all de stos lmites. Ms all del rgimen ISO, buscaremos un mayor rango de velocidad de obturador y de aperturas de lente . Nmero tpicos aqu son velocidades de obturador de 1/30 a 1/1000 de segundo, y aperturas de lentes de f2.8 a f16, a pesar de que la presente generacin de cmaras tienen velocidades de obturador desde a 1/10.000 de segundo. Cuanto mayor sea el rango cubierto por ambos juegos de nmeros mejor . Pondremos adems atencin a la capacidad del flash interno si es que existe . Factores claves aqu son el rango de distancia dentro del cual el flash ser til , y el nmero de "modos" de que dispone . Las cmaras de primera generacin tenan un muy limitado alcance de flash, evidenciado por las mximas distancias de trabajo de 10 pies o menos, pero la mayora de los modelos corrientes alcanzan a los 16 pies o ms. Los "modos" de flash se refieren a las diferentes maneras en que los sensores de luz de la cmara pueden controlar el circuito de flash. En el modo mas bsico, la cmara "baja el puntaje " (cierra) de la apertura de su lente y hace funcionar el flash a plena potencia de manera que la mayora de la luz que incide sobre el objeto es proporcionada por el flash. Algunas cmaras ofrecen el modo "fill" (llenado) para su flash, en ste modo , la cmara ajusta la velocidad del obturador y apertura de lente basndose en la cantidad de luz proveniente del conjunto de la escena . En el modo "fill", slo una suficiente cantidad de iluminacin es usada para "llenar" las sombras y elevar la iluminacin hasta el mnimo requerido. El resultado es con frecuencia un objeto ms natural, iluminado en forma uniforme. Muchas cmaras ofrecen los modos especiales de reduccin de ojos rojos "red-eye reduction", en el cual el flash destella una o dos veces antes de realizar la exposicin, para inducir una reduccin de la pupila ojo de la persona, disminuyendo as la reflexin interna que provoca el efecto de "ojo rojo". Juego de caractersticas De forma paralela a los parmetros bsicos arriba citados, existe una variedad de caractersticas de cmaras que pueden tener variados grados de usos en su aplicacin: Primeros planos y gran angular . La habilidad para tomar fotos de primeros planos es crtica en muchas aplicaciones. Muchas cmaras digitales del tipo "apunte & dispare" tienen lentes de foco fijo , en las cuales la distancia focal es ajustada de manera que todo los que se encuentre alrededor de 1,2 metros est en foco . Esto es til cuando necesitamos fotografiar objetos en dicho rango , pero intil si usted debe tomar una foto de algo que est slo a unos pocos centmetros. Algunas cmaras del tipo "apunte & dispare " disponen de la posibilidad

Tecnologas para los Sistemas Multimedia Curso 2004/05 - 46/53

Tema 4.- Imagen.

de agregar dispositivos opcionales para mejorar el desempeo en primeros planos, mientras que otras ofrecen modos de enfoque "macro" especiales que le permiten llegar ms cerca del objeto que lo que llegaran las lentes estndar. La fotografa de gran angular es otra habilidad importante si usted la necesita. (Esto podra ser particularmente importante para fotografa de propiedades o de seguros , donde las condiciones de tomas pueden ser muy estrechas). Nuevamente, algunas cmaras tienen accesorios opcionales disponibles para expandir su campo de visin . Algunas cmaras vienen provistas con lentes zoom con un rango de distancias focales que se extienden desde un ligero gran angular ( casi equivalente a una lente de 35mm en una cmara de 35 mm ) hasta un telefoto ( ligeramente mayor que el equivalente de una lente de 100 mm en una cmara de 35mm ) . El temporizador El temporizador interno ("self-timer") es simplemente un retardo en el obturador que le permite disparar la cmara, para luego correr, ubicarse y luego ser incluido en la imagen antes de que el obturador sea accionado. Este es un adicional fcil desde el punto de vista de la tecnologa requerida, pero omitido con frecuencia. Si usted planea ser parte de cualquier grupo de fotos, verifique que su cmara tenga esta caracterstica. Software incluido El software incluido con la cmara es muy importante, de hecho, sta es un rea donde encontraremos la mayor variacin entre las cmaras. Los elementos a considerar incluyen cuan conveniente es descargar imgenes desde la cmara. Puede una cmara llena de imgenes ser trasladada a su disco rgido rpidamente para un procesamiento posterior? , o se debe mantener la cmara cautiva mientras cada imagen es procesada individualmente? . Alternativamente, pueden ser observadas vistas previas de las imgenes antes de ser descargados sus archivos en forma completa? Esto puede ahorrar una gran cantidad de tiempo en seleccionar las mejores tomas de un grupo grande de fotografas. Manipulacin de imgenes Transferir las imgenes a la computadora es slo el comienzo: Permite el software incluido manipular las imgenes luego de haberlas capturado?, con qu facilidad puede usted compensar exposiciones pobres, prdidas de color, o imgenes fuera de alineacin? Qu hay acerca de los retoques menores para remover imperfecciones, reflexiones errantes, etc ? Formato de archivos Particularmente importante es la capacidad de exportacin de archivos del software: Puede el software provisto proporcionar fcilmente imgenes en el formato de archivo que necesitamos?, sus requerimientos pueden ser diferentes si planeamos capturar imgenes para presentaciones de multimedia que para una presentacin impresa. La mayor parte del software de cmaras es muy competente en ste aspecto, con algunos fabricantes incrementando su nivel de capacidad . Virtualmente todos los paquetes proporcionan el estndar RGB TIFF o JPEG para exportacin, que la mayora de las aplicaciones de documentos y de proceso soportan. La mayora de las cmaras en la actualidad almacenan sus imgenes en formato JPEG, y podemos seleccionar entre modo de detalles finos y modo normal. Cmaras de mayor precio pueden adems soportar el formato TIFF. Mientras el formato JPEG comprime la imagen el formato TIFF no lo hace, por lo tanto las imgenes TIFF ocupan mucho espacio. La ventaja del almacenamiento TIFF es que no hay prdida de datos en el proceso de compresin. Catlogo La disponibilidad de un adecuado espacio de almacenamiento es slo parte de la batalla: encontrar las imgenes es otro tema completamente. En reconocimiento a ste hecho, algunas cmaras incluyen al menos una rudimentaria capacidad de catlogo de imgenes en su paquete de software. Algunos

Tecnologas para los Sistemas Multimedia Curso 2004/05 - 47/53

Tema 4.- Imagen.

fabricantes han comenzado a entregar productos para catalogacin de imgenes de terceras partes ms poderosos con sus cmaras, un agregado por cierto muy bienvenido . Calidad de imagen La calidad de imagen es una de las caractersticas ms importantes a considerar al elegir una cmara, y es imposible hacer una evaluacin a partir de las hojas de caractersticas de los fabricantes. Esto resalta la importancia de las imgenes de prueba: ltimamente, la nica manera de decir si una cmara dada producir resultados aceptables en su aplicacin es ver y probar imgenes de objetos similares. La razn por la cual la calidad de la imagen es tan difcil de manejar es por dos razones. Primero, no existe en la actualidad ningn estndar o escala objetivas por la cual medir la precisin del color en las cmaras digitales. Segundo, todos los dispositivos digitales del tipo Apunte & dispare usan tecnologa de compresin de imgenes para compactarlas dentro de una memoria limitada. Dependiendo del algoritmo usado y la cantidad de compresin aplicada, la calidad de la imagen puede variar ampliamente, an entre dispositivos usando el mismo sensor CCD . Veamos algunos elementos que contribuyen a la calidad de imagen : Calidad del color Es un tpico complejo y generalmente no muy bien comprendido. La calidad del color est formada por dos parmetros relacionados pero diferentes: pureza del color y balance tonal. La gente tiende a asumir que los errores de color pueden ser corregidos fcilmente en un programa de edicin de imgenes como Photoshop, y por lo tanto tienden a descontar su importancia. Esto es generalmente verdadero en cuanto a los errores tonales, pero los errores debidos a la pureza del color son virtualmente imposibles de corregir. Balance de grises y precisin del color ( Errores tonales ) , rango tonal: Los errores tonales en una imagen digital son fcilmente compensables por resultados muy gratificantes El balance de grises es tanto el ms dramtico y a la vez el ms fcilmente corregible. Mientras que un tratamiento completo del balance de grises est ms all de esta discusin particular, podemos sin embargo cubrir unos cuantos puntos clave, y ver los efectos de ajustes relativamente fciles. El balance de grises se refiere al balance de los canales rojo, verde y azul a lo largo de todo el rango tonal, llevando a los tonos grises en la imagen a su balance de colores neutros. Si el canal azul de una cmara respondiera ms que el rojo o el verde, las imgenes tendran una tendencia generalizada al azul. Mientras que los problemas del balance de grises son a veces as, generalmente son mas complejos. En una cmara digital, nos preocupamos por el color a lo largo de todo el rango de tonalidades, lo que significa que necesitamos concentrarnos en el balance de grises en las sombras, en las zonas iluminadas y todos los puntos intermedios. En la prctica, no es ni prctico ni necesario hacer ajustes de balance de grises punto a punto a lo largo de toda la escala tonal. Generalmente, ajustando el balance en las zonas iluminadas, sombras y medio tonos trae resultados dramticos con relativamente poco esfuerzo. Rango tonal : Es la habilidad de una cmara para cubrir un amplio rango de tonos desde la luz hasta la oscuridad es una de las funciones de imagen mas crticas . Sorprendentemente , esta es la tarea mucho mas difcil que podemos asumir. El problema es que nuestros ojos no responden en forma proporcional ( o "lineal" ) a la luz , pero compensan escenas ms claras u oscuras . Adems, el medio de salida final , que puede ser una pantalla de monitor o una pgina impresa , no se puede remotamente aproximar al rango de brillo de las escenas reales . El resultado es que el rango de valores de brillo tpicos del sujeto deben ser comprimidos para adaptarse al rango que puede ser reproducido por la pantalla o papel que vemos en la imagen final. La imagen digital es muy impiadosa con las exposiciones excesivas y las bajas exposiciones. La pelcula convencional (especialmente de negativos color ) tiene una tremenda latitud de exposicin , lo que significa que la misma responde en forma predecible a tremendos rangos de valores de brillo . Si el negativo es un poco ms claro u oscuro , no importa : es suficientemente fcil ajustar la exposicin en el proceso de impresin para hacer que la copia final se vea bien . Con dispositivos digitales, sin embargo, estamos restringidos a un absoluto (y verdaderamente pequeo ) rango de valores numricos . (En la mayor parte de los casos, los nmeros disponibles para representar el brillo van desde el 0 al 255 ). Todas

Tecnologas para los Sistemas Multimedia Curso 2004/05 - 48/53

Tema 4.- Imagen.

las cmaras digitales pueden decirnos en un punto que el mismo es "ms claro" o " es ms oscuro " , y cualquier variacin en el brillo se pierde . De manera de no perder detalles, usted pensara que nosotros querramos que para la cmara o el escner ninguna parte de la imagen fuera completamente "blanca" o "oscura" . Es verdad que sta aproximacin preserva el detalle tonal mximo , pero las imgenes resultantes se veran muy carentes de contrastes . Aparte de un bajo contraste , tales imgenes apareceran adems con colores muy "barrosos" . En la prctica, para que la cosas se vean mejor , la cmara casi siempre deber descartar algo de informacin , el tema es cunto , y cun notable ser esto en la imagen final . Para probar el rango tonal de una cmara , nosotros idealmente buscamos varios objetos , variando desde el contraste alto hasta el bajo . En el extremo, necesitamos un objeto con un rango realmente amplio desde la iluminacin mas alta hasta la mas baja , esto nos dir bien si la cmara puede manejar situaciones extremas . No todas las imgenes de la vida real llegan a abarcar rangos tan amplios sin embargo Evaluando la pureza y precisin del color La precisin del color es un parmetro difcil de cuantificar. Despus de la reproduccin tonal, la reproduccin del color es probablemente el factor ms importante dentro de las caractersticas de las cmaras digitales. Para discutir adecuadamente la reproduccin del color sin embargo, necesitamos dos palabras claves del vocabulario: matiz y saturacin . El matiz se refiere a qu color estamos hablando, en otras palabras, el matiz nos dice dentro de qu parte del arco iris caera el color. La saturacin se refiere a la cantidad de color presente. Una imagen monocroma tal como una foto en blanco y negro tiene cero saturacin , mientras que los colores primarios brillantes tienen una muy alta saturacin. En general , los errores de saturacin son fcilmente reparables en programas de edicin de imgenes. Los errores de matiz son de un tipo completamente diferente. Este tipo de problemas puede ser ajustado con la mayora de los programas de edicin de imgenes . Por el contrario , los errores en la precisin del color , o "contaminacin de color" son virtualmente imposibles de resolver. La contaminacin del color se refiere a situaciones en que los colores primarios no son capturados como primarios puros, sino como "contaminados" con variadas cantidades de otros colores. La conclusin de esto es que es muy importante para una cmara digital o escner producir colores "puros". Rango dinmico El rango dinmico mide la amplitud de rango de la luminancia de un objeto (por lo tanto el brillo) que un sensor puede medir en forma precisa. La mayora de las cmaras digitales pueden capturar un amplio rango de valores de brillo que la pgina impresa puede reproducir. El factor ms importante es la cantidad de trabajo bueno que el hardware y el software pueden hacer al comprimir el rango completo de brillo de la escena dentro de un rango que los dispositivos de salida puedan reproducir. Esta capacidad, tanto en una cmara como en un escner de alto rango, es llamada compresin de tonos , y es una importante caracterstica de los dispositivos de entrada de alta calidad . La compresin de tonos es tanto un arte como una ciencia, y los diferentes dispositivos usan diferentes curvas de entrada a salida para llevarla a cabo. Generalmente, usted busca evitar la prdida de zonas luminosas como de sombras, y an mantener un razonable contraste en los medio tonos. Visualmente, los fotgrafos estn acostumbrados a observar problemas tonales en objetos muy iluminados y muy oscuros. Ruido del sensor La caracterstica que ms limita al rango tonal total de una cmara digital es el ruido en el dispositivo sensor. Sin entrar en tecnicismos, un sensor ruidoso significa que usted ver "granulado" o "nieve" en grises slidos o colores firmes. Este efecto es particularmente pronunciado en reas sombreadas. Esta variacin aleatoria del valor "ideal" es llamada ruido, y puede ser un factor de calidad en algunos dispositivos . El ruido en las imgenes es generalmente el mayor problema cuando usted est tratando de obtener detalles significativos de entre las sombras extremas, ajustando los valores de brillo y contraste luego de que la toma ya se ha hecho . El ruido puede adems aparecer tambin como granulado no deseado en reas de color uniforme .

Tecnologas para los Sistemas Multimedia Curso 2004/05 - 49/53

Tema 4.- Imagen.

Sensor y efectos pticos , aberracin de color. Cada imagen capturada por una cmara digital es en realidad formada por tres imgenes separadas (rojo , verde y azul ) . De manera de ver su imagen correctamente, todas estas imgenes deben ser mantenidas en un perfecto registro. Si el registro entre las imgenes tricolor est corrido en cualquier parte, el resultado ser una aberracin de color. En la prctica, la mayora de las cmaras digitales Apunte & dispare usan "arreglos de bandas" , de manera que el registro de color sea fijo .Existen dos diferentes sensores usados en las cmaras en la actualidad : Sensores CCD estos sensores han estado en el mercado por ms tiempo. En general , los CCD tienen mas pxeles y trabajan mejor en baja luz . Sin embargo, tienden a ser mas caros y usan un montn de energa . Sensores CMOS estos sensores tienen menor resolucin, usan menos potencia y no trabajan bien en baja luz . Si usted est buscando una cmara barata, de baja resolucin o planeas usarla al aire libre , un sensor CMOS sera una buena eleccin .

Las cmaras de alta resolucin necesitan un sensor CCD. Resolucin La cantidad de detalles que una cmara puede capturar es llamada resolucin, y es medida en pxeles. La resolucin es uno de los parmetros menos entendidos , menos representados y confusos en todo el campo de la fotografa digital . Es adems una de las caractersticas ms difciles de especificar en precisin , de una manera objetiva y particular en las cmaras digitales . Uno de los puntos ms importantes para comprender acerca de la resolucin en las cmaras digitales es que los pxeles no son resolucin, TODAS las cmaras digitales del tipo apunte & dispare en su nivel de entrada usan un alto grado de compresin de imgenes para poder hacer entrar un nmero razonable de imgenes dentro de su limitada memoria RAM . Hemos visto anteriormente los detalles tcnicos importantes de manera de poder simplificar la explicacin del color. La luz es convertida a cargas elctricas, pero las cargas elctricas que se forman en el CCD no son seales digitales listas para ser usadas por su computadora. Al digitalizar la informacin, la seal debe pasarse a travs de un conversor analgico a digital (ADC). La interpolacin es llevada a cabo por un microprocesador luego de que los datos han sido digitalizados. Es el nmero de fotostios el mismo que el nmero de pxeles ?:Al leer las caractersticas de una cmara cuidadosamente , notaremos que el nmero de pxeles y el valor de resolucin mxima no son muy compatibles . Por ejemplo, una cmara dice ser de 2.1 mega-pxeles y es capaz de producir imgenes con una resolucin de 1600 X 1200 . Haciendo un poco de matemticas, una imagen del 1600 X 1200 contienen 1.920.000 pxeles. Pero 2.1 mega-pxeles significa que deberan haber al menos 2.100.000 pxeles . Esto no es un error de redondeo , y no es un truco matemtico . Existe una real discrepancia entre estos dos nmeros . Si una cmara dice que tiene 2.1 mega-pxeles , entonces existen realmente aproximadamente 2.100.000 fotostios en el CCD. De qu tamao son los sensores ? La generacin actual de sensores digitales son ms pequeos que una pelcula . Emulsiones de pelcula tpicas que son expuestas en una cmara basada en pelcula miden 24 mm x 36 mm . Si usted ha observado la especificaciones de una tpica cmara de 1.3 mega-pxel , encontrar que dispone de un sensor CCD que mide 4,4 mm X 6.6 mm . Un sensor ms pequeo significa lentes ms chicas. Ya existen sensores CCD de ms de 6 millones de fotostios y es aproximadamente del tamao de una pelcula estndar de 35 mm . Lo que ocurre es que algunos de los fotostios no son usados por la imagen. El CCD no es un dispositivo analgico , es necesario proporcionar algunos circuitos a los fotostios da manera que el ADC pueda medir la cantidad de carga . Este circuito es negro de manera que no pueda absorber ninguna luz que distorsione la imagen. Se necesita un montn de memoria para almacenar una imagen de aproximadamente 1.2 millones de pxeles . Casi todas las cmaras digitales usan algn tipo de compresin de datos para hacer los archivos ms chicos . Existen dos caractersticas de las imgenes digitales que hacen posible la compresin :

Tecnologas para los Sistemas Multimedia Curso 2004/05 - 50/53

Tema 4.- Imagen.

Repeticin: Cuando las rutinas de compresin toman ventaja de los patrones que se repitan , no hay prdida de informacin y la imagen puede ser reconstruida exactamente como fue registrada en la cmara . Desafortunadamente , esto no reduce los archivos mas de un 50% , y a veces no llega ni siquiera a ese nivel . La irrelevancia es un tema ms trucado. Una cmara digital registra ms informacin que la que es fcilmente detectada por el ojo humano. Algunas rutinas de compresin toman ventaja de ste hecho para descartar parte de la informacin intrascendente. Si usted necesita archivos ms chicos, deber estar dispuesto a descartar ms datos. La mayora de las cmaras ofrecen diferentes niveles de compresin a pesar de que no lo llamen as, lo ms probable es que lo ofrezcan como diferentes niveles de resolucin, esto es lo mismo , una menor resolucin significa una mayor compresin y por ende mayor compresin significa menor resolucin . En general, cuanto ms pxeles tenga la cmara, ms detalles podr capturar. Cuanto mayor cantidad de detalles sean capturados, ms se podr aumentar la foto antes de que la misma aparezca "granulada" , y aparezca fuera de foco . Algunas resoluciones tpicas que podemos encontrar en cmaras digitales en la actualidad incluyen : 256X256 pxeles - Encontrar esta resolucin en cmaras baratas. Esa resolucin es tan baja que la calidad de la imagen es casi siempre inaceptable . El total de pxeles es de 65.000 . 640X480 pxeles - Esta es la ms baja en la cmaras "reales" . Esta resolucin es buena para enviar por e-mail la mayora de sus imgenes a amigos o publicarlas en la Web . El total de pxeles es de 307.000 . 1216X912 pxeles - Para imprimir con buena calidad las imgenes, sta es una buena resolucin . Este es el tamao mega-pixel - 1.109.000 pxeles en total . 1600X1200 pxeles - Esto es "alta resolucin " , las imgenes tomadas en esta resolucin pueden ser impresas en tamaos ms grandes , como por ejemplo 8X10 pulgadas , con buenos resultados . Esto da casi un total de 2 millones de pxeles. Las cmaras son frecuentemente clasificadas en trminos de nmero de pxeles que las mismas producen en sus archivos finales , y la gente generalmente interpreta al nmero de pxeles como la "resolucin" de la cmara. Desafortunadamente , resolucin y pxeles tienen slo una cercana relacin entre s . Las imgenes de 1024x768 pxeles pueden en verdad verse mejor que imgenes difusas de 1280x960 . La nica razn por la que hay una relacin entre cantidad de pxeles y resolucin es que todos los fabricantes presionan para un mejor compromiso entre tamao/definicin tanto como pueden , y todos ms o menos igual . Realmente , la resolucin se refiere a cunto detalle usted puede ver en la imagen , lo que debera ser una cosa fcil de cuantificar : simplemente fotografe un objeto que muestre progresivamente detalles ms finos , y note el detalle ms fino que usted pueda realmente ver . Desafortunadamente , sta rpida aproximacin es complicada por las realidades de la imagen digital , con los factores duales del aliasing y la compresin JPEG de la imagen contribuyendo a la confusin . Aliasing es lo que ocurre cuando un sensor no tiene suficiente resolucin para reproducir los detalles ms finos en una escena . En vez de ver la imagen , lo que usted termina viendo es alguna combinacin de la imagen y los pxeles mismos del sensor . La segunda complicacin en medir la resolucin surge del efecto de la compresin JPEG sobre los datos de la imagen. El algoritmo JPEG comprime archivos de imgenes quitando informacin que el mismo considera redundante o sin importancia. En la prctica, el mismo realiza un muy buen trabajo preservando los detalles en reas de la imagen con fuertes contrastes , pero es mas agresivo descartando datos cuando el contraste no es muy marcado , esto significa que usted al final deber confiar en sus propios ojos para juzgar la resolucin , basndose en cmo la cmara responde a los tipos de objetos que usted probablemente fotografa .

4.9. Herramientas para tratamiento de imgenes

Tecnologas para los Sistemas Multimedia Curso 2004/05 - 51/53

Tema 4.- Imagen.

4.9.1.

Adobe Photoshop

Adobe Photoshop es probablemente el estndar profesional para el tratamiento de imgenes digitales. Est considerada como una herramienta fundamental para diseadores grficos y webmasters. A continuacin comentaremos una serie de sus caractersticas principales. En el apartado de gestin de imgenes, destacan las posibilidades de bsqueda y edicin de metadatos de archivos, que permiten localizar imgenes rpidamente sin necesidad de abrir archivos realizando bsquedas de metadatos y de palabras clave nuevas y personalizables en el Explorador de archivos. Permite la comparticin desde el explorador de archivos de lotes de imgenes en presentaciones en PDF de Adobe, galeras de fotografas Web, servicios de impresin en lnea, paquetes de imgenes, etc. La galera de filtros permite la previsualizacin de varios efectos a la vez, incluyendo ms de 95 filtros diferentes. Incluye una ayuda mejorada para la gestin del color, que asiste en la configuracin de impresoras y monitores para obtener un color preciso y uniforme. Permite la creacin de imgenes originales o retoque de fotografas mediante una amplia y completa gama de herramientas de pintura, dibujo y retoques. Podemos aislar y enmascarar automticamente reas complejas de una imagen mediante las herramientas de resaltado y limpieza de la funcin Extraer imgenes, as como crear patrones de fondo a partir de cualquier imagen. Divisin en capas, que pueden ser controladas agrupndolas en conjuntos, mediante la codificacin del color y el bloqueo. Podremos agrupar nuestros trabajos hasta en cinco niveles de capas anidadas, y crear variaciones de diseo de forma ms eficiente guardando distintas combinaciones de capas en el mismo archivo como composiciones de capas. Es un medio ideal para crear imgenes de gran tamao, como anuncios para vallas publicitarias y autobuses, imgenes tcnicas, etc con imgenes de hasta 300.000 x 300.000 pxeles y con 56 canales por archivo. Ofrece la posibilidad de crear bitmaps con texto de resolucin independiente y formas vectoriales en el mismo archivo. Permite la creacin de lneas, rectngulos, elipses y polgonos basados en vectores que se podrn combinar y editar para ser usados como mscaras o compartidos. Simulacin de tcnicas pictricas tradiciones mediante los efectos secos y hmedos de pinceles, pasteles, carboncillos, etc. En cuanto a las posibilidades para manejar texto, permite la creacin de texto basado en vectores que se pueden editar en el lienzo., incluyendo opciones de formato como separacin de palabras por slabas, saltos de lnea ptimos, etc. El texto se puede convertir en formas que se pueden utilizar como mscaras u otros efectos especiales. Ofrece soporte completo para datos de imgenes y de archivo sin formato de cmaras digitales, que se pueden editar haciendo uso de las funciones centrales para editar y retocar. Asimismo, presenta facilidades para mejorar el color, contraste, intervalo dinmico y correspondencia de color de cualquier imagen. Podremos controlar los cambios de la imagen mediante la paleta Histograma, que se actualiza dinmicamente a medida que se van realizando ajustes. Podemos aplicar a nuestras imgenes filtros fotogrficos que imitan los efectos de los filtros tradicionales de las cmaras, as como simular tcnicas de desenfoque reales con el efecto de desenfoque de la lente. Finalmente, permite la exportacin de archivos en formato Flash, la creacin de documentos HTML y la conversin de archivos con capas en animaciones GIF, as como la creacin de imgenes de vdeo y pelcula.

4.9.2.

GIMP

GIMP es un acrnimo para GNU Image Manipulation Program (Programa GNU par a Manipular Imgenes). Es un software de libre distribucin adecuado para tareas tales como retoque y composicin de imgenes. Puede ser usado como un programa tipo Paint, como un programa de retoque con calida fotogrfica, un sistema de procesamiento online, un renderizador, un conversor de imgenes, etc. Fue diseado para ser extendido y aumentado en base a plug-ins. Tiene un interfaz de scripting avanzado que permite que se puedan crear scripts que incluya cualquier tipo de tarea de manipulacin de imgenes. A continuacin enumeramos una lista de caractersticas de este software:

Tecnologas para los Sistemas Multimedia Curso 2004/05 - 52/53

Tema 4.- Imagen.

Completa gama de herramientas para dibujar: brush, pencil, airbrush, clone, etc. Tamao de imagen nicamente limitado por el espacio disponible en disco. Muestreo de sub-pxels para buscar una alta calidad de anti-aliasing. Soporte completo para canal alpha. Capas y canales Contiene una base de datos procedimental para llamadas a funciones GIMP desde programas externos y scripts. Capacidades avanzadas de scripting Mltiples operaciones Undo/Redo Virtualmente ilimitado nmero de imgenes abiertas a la vez. Poderoso editor de gradientes. Cargado y salvado de animaciones en formato frame-capa. Herramientas de transformacin que incluyen rotacin, escalado, etc. Formatos de fichero soportados, entre otros: gif, jpg, png, xpm, tiff, tga, mpeg, ps, pdf, pcx, bmp. Herramientas de seleccin incluyendo rectngulo, elipse, libre, fuzzy, bezier e inteligente. Plug-ins que permiten la adicin de nuevos formatos y efectos. Ms de 100 plug-ins disponibles.

Tecnologas para los Sistemas Multimedia Curso 2004/05 - 53/53