Sie sind auf Seite 1von 50

Conceptos

bsicos de vdeo y
audio.
Introduccin
Alex Ribelles Garca
PID_00176933
CC-BY-NC-ND PID_00176933 Conceptos bsicos de vdeo y audio. Introduccin

Los textos e imgenes publicados en esta obra estn sujetos excepto que se indique lo contrario a una licencia de
Reconocimiento-NoComercial-SinObraDerivada (BY-NC-ND) v.3.0 Espaa de Creative Commons. Podis copiarlos, distribuirlos
y transmitirlos pblicamente siempre que citis el autor y la fuente (FUOC. Fundacin para la Universitat Oberta de Catalunya),
no hagis de ellos un uso comercial y ni obra derivada. La licencia completa se puede consultar en http://creativecommons.org/
licenses/by-nc-nd/3.0/es/legalcode.es
CC-BY-NC-ND PID_00176933 Conceptos bsicos de vdeo y audio. Introduccin

ndice

Introduccin............................................................................................... 5

Objetivos....................................................................................................... 6

1. Caractersticas de la imagen........................................................... 7
1.1. Fundamentando la imagen: parmetros bsicos ........................ 7
1.2. Trabajando con seales de vdeo analgico ............................... 8
1.2.1. Vdeo compuesto ........................................................... 8
1.2.2. S-Vdeo ........................................................................... 9
1.2.3. Vdeo analgico en componentes ................................. 9
1.3. Vdeo digital en calidad estndar, alta definicin y 3D .............. 10
1.3.1. SDI (Serial Digital Video) ............................................... 11
1.3.2. HD-SDI (High Definition SDI) ....................................... 12
1.3.3. 3G-SDI ............................................................................ 12
1.3.4. DVI (Digital Visual Interface) ........................................ 12
1.3.5. HDMI (High Definition Multimedia Interface) ............. 13
1.3.6. Firewire ........................................................................... 13
1.3.7. USB (Universal Serial Bus) ............................................. 14
1.3.8. Conclusin ..................................................................... 14
1.4. Broadcast frente a vdeo en Internet ........................................... 15
1.5. Resoluciones, velocidad de cuadro, relaciones de aspecto y
otros parmetros ......................................................................... 19

2. Caractersticas del sonido................................................................ 23


2.1. Audio analgico .......................................................................... 23
2.2. Audio digital ................................................................................ 23

3. La revolucin en la gestin de las seales................................... 25

4. Codificacin de la imagen fija....................................................... 27


4.1. La necesidad de comprimir ......................................................... 27
4.1.1. Codificacin y compresin. Tipos de compresin ........ 28
4.1.2. Redundancia y entropa ................................................ 28
4.1.3. Medida de la compresin de imagen ............................ 29
4.1.4. Medida objetiva y subjetiva de la calidad de imagen .... 30
4.2. El JPEG ........................................................................................ 30
4.2.1. El modo secuencial ........................................................ 31
4.2.2. Otros modos de trabajo del JPEG .................................. 44
4.3. JPEG 2000 .................................................................................... 45
4.4. JPEG XR ....................................................................................... 47
4.5. Tendencias futuras de la codificacin de imagen ....................... 48
CC-BY-NC-ND PID_00176933 Conceptos bsicos de vdeo y audio. Introduccin

Resumen....................................................................................................... 49
CC-BY-NC-ND PID_00176933 5 Conceptos bsicos de vdeo y audio. Introduccin

Introduccin

Desde el momento en el que la madurez tecnolgica de los dispositivos mvi-


les ha llegado a tal punto que los capacita para la generacin, gestin y distri-
bucin de contenidos multimedia, la frontera que los separaba de los equipos
dedicados se ha difuminado. As, se han aplicado buena parte de las tecnolo-
gas ya existentes y se han generado otras nuevas que aprovechan la flexibili-
dad y movilidad caractersticas del nuevo medio.

Una buena captacin es importante para conseguir material audiovisual que


integrar en nuestros proyectos, al igual que seleccionar el formato adecuado
para su almacenamiento y posterior tratamiento digital. As pues, empezamos
el mdulo construyendo sobre los fundamentos bsicos de la imagen y el so-
nido, definiendo los parmetros que los caracterizan, los estndares de inter-
conexin y acabamos viendo el estndar de almacenamiento de la imagen es-
ttica, con el que se introducen los conceptos bsicos de codificacin y com-
presin que estarn presentes en el resto de mdulos, especialmente en el de
vdeo.

El mdulo es eminentemente prctico, si bien es de obligada necesidad intro-


ducir conceptos tericos que se ilustran en las actividades integradas en el tex-
to. Como herramientas de trabajo, se van a utilizar dos programas, el VLCde
Videolan (para todas las plataformas) y el programa AdobePhotoshop (Win-
dows y Mac) que se incluye en el software de la asignatura.
CC-BY-NC-ND PID_00176933 6 Conceptos bsicos de vdeo y audio. Introduccin

Objetivos

Los objetivos que se pretende alcanzar con el estudio de este mdulo son los
siguientes:

1. Identificar los parmetros que caracterizan la imagen y el sonido.

2. Diferenciar los estndares de interconexin multimedia domsticos, semi-


profesionales y profesionales.

3. Identificar el transporte fsico ms adecuado segn el tipo de contenido


digital, coste y prestaciones.

4. Diferenciar los conceptos de codificacin y compresin.

5. Interpretar los parmetros de compresin de JPEG y JPEG2000 y seleccio-


nar los valores adecuados en funcin del contenido visual de la imagen.

6. Identificar los artefactos visuales ms habituales en estos estndares de


imagen.
CC-BY-NC-ND PID_00176933 7 Conceptos bsicos de vdeo y audio. Introduccin

1. Caractersticas de la imagen

En la generacin de contenido multimedia, es frecuente la participacin de Ved tambin


elementos audiovisuales originados por captura, es decir, digitalizados. En este
Estos conceptos de compre-
primer mdulo, vamos a introducir las caractersticas bsicas que definen la sin se utilizarn concretamen-
seal de vdeo y audio y, a partir de ellas, ilustraremos y compararemos los te en los mdulos "Digitaliza-
cin, almacenamiento y trans-
diferentes tipos de seales y transportes de vdeo y audio existentes en el mer- misin de audio y vdeo".

cado industrial y broadcast, con los que se trabaja en el da a da. A partir de ese
momento y en el resto del curso, nos vamos a centrar en las seales digitales
y presentaremos cmo se codifica la imagen esttica. En este recorrido, desta-
caremos conceptos de compresin que utilizaremos tambin intensivamente
en otros mdulos de la asignatura.

1.1. Fundamentando la imagen: parmetros bsicos

Cualquier texto sobre imagen o vdeo comienza con la definicin de algunos


trminos bsicos y, en nuestro caso, vamos a ser breves:

1)Pxel: es el elemento visual mnimo de una imagen. Es la piedra angular


de todas las formas de imagen digital, incluyendo tanto la fotografa como
el vdeo, y si bien el concepto es sencillo su uso no lo es, en especial en un
mundo de formatos digitales de variada relacin de aspecto.

2)Luminanciaoluma: es la porcin de la seal de vdeo que representa el


brillo de cada pxel. La luminancia mxima de un pxel es el blanco y la mni-
ma, el negro. El ojo humano est desarrollado para percibir una gran cantidad
de niveles de luminancia.

3)Crominanciaocroma: es la otra porcin de la seal de vdeo, que repre-


senta el color de cada pxel. Los colores se destinan a cubrir todo el espectro
completo del sistema visual humano, del rojo al verde y al azul, en cualquier
combinacin. El ojo humano, a diferencia de otros seres vivos, no posee la
misma capacidad de discriminacin de colores que la que posee para la lumi-
nancia. En realidad, esta porcin consta de varios elementos diferentes, cuya
combinacin da el color.

4)Escaneado: es el proceso utilizado en una seal de vdeo tanto para captu- Escaneado
rar como para mostrar los valores de luminancia y crominancia de cada pxel.
La presentacin en dispositi-
El escaneado sita la informacin de cada pxel en un orden especfico para vos en matriz, como pantallas
que un equipo pueda determinar la informacin que pertenece a cada pxel. LCD, plasma o LED, ya no se
realiza en escaneado, sino que
Para el ojo humano, la presentacin de una secuencia de imgenes escanea- se refrescan todos los pxeles
de manera sncrona.
da en pantalla a ms de 18 imgenes por segundo ya le genera un efecto de
movimiento.
CC-BY-NC-ND PID_00176933 8 Conceptos bsicos de vdeo y audio. Introduccin

Los cuatro conceptos estn ntimamente ligados. As, como un carcter de tex-
to o un byte de datos, cada pxel tiene un valor o conjunto de valores. Uno de
ellos es el brillo (la luminancia) y, si es en color, tambin la crominancia. Para
obtener una imagen fija, el valor de cada pxel es fijo y suficiente, aunque se
necesitan los suficientes como para que la imagen sea reconocible por el des-
tinatario. Pero para vdeo, adems, la informacin de cada pxel se escanea (se
presenta) al menos 18 veces por segundo. Ms adelante, haremos algunos n-
meros para demostrar el gran problema que supone la gestin de tal cantidad
de datos para lograr transmitirlo y el porqu de los estndares de compresin.

1.2. Trabajando con seales de vdeo analgico

Las seales de vdeo analgico, por su naturaleza, pueden crearse a partir


de tres seales diferentes de color (R, G y B) o bien a partir de dos seales
(luminancia Y y crominancias U y V).

En el quehacer diario con equipos de vdeo (como cmaras y grabadores) y


programas de gestin (como tratamiento de la imagen o transmisin de vdeo),
trabajamos con estas seales en sus diferentes formatos a la vez, a veces de
manera inconsciente. Vemoslo con detalle.

1.2.1. Vdeo compuesto

Una seal de vdeo compuesto contiene toda la informacin necesaria para


presentar vdeo en color en pantalla. La seal se enva normalmente en un
nico cable coaxial entre dispositivos como un reproductor de vdeo y un te-
levisor. Muchos sistemas de consumo utilizan un conector amarillo, denomi-
nado RCA (aunque a veces podemos encontrar un conector BNC). Es el ms
extendido en el sector domstico, pero el de menor calidad: la seal de vdeo
compuesto es PAL, sistema analgico de vdeo en color de 625 lneas y 25 im-
Conectores RCA
genes por segundo que tambin se utilizaba para las emisiones de televisin
analgicas hasta el 2010. Al igual que sus sistemas hermanos NTSC y SECAM,
tiene ventajas e inconvenientes, que indicamos en un cuadro resumen al final
de este apartado.

Los equipos de captura de vdeo que se basaban en seales de vdeo compues- Hardware externo
to fueron la puerta de entrada al mercado domstico y semiprofesional en la
Este hardware externo era, por
dcada de 1980. Aquellos pioneros que trabajaban con un Mac, Amiga o Atari, ejemplo, Truevision TGA de
entre otros, y un reproductor VHS o Beta necesitaban un hardware externo de Targa o Video Toaster de New-
tek.
CC-BY-NC-ND PID_00176933 9 Conceptos bsicos de vdeo y audio. Introduccin

muy alto coste a veces integrado en el mismo equipo, siempre con problemas Ved tambin
de interferencia en las seales y multitud de parmetros por ajustar en cada
Al final de este subapartado,
captura para conseguir una calidad aceptable. encontraris una tabla resu-
men con las ventajas y desven-
tajas de este tipo de seales.
1.2.2. S-Vdeo

Denominado tambin conector S-VHS, es analgico como el vdeo com-


puesto, pero la transmisin de luminancia y croma se lleva a cabo a
travs de diferentes cables, lo que reduce sensiblemente la degradacin
de la seal. Por esta razn, un cable de S-Vdeo tiene cuatro pines: un
par para la seal de croma U + V y otro par para la de luminancia Y.

Su llegada a finales de la dcada de 1980 con los equipos SuperVHS y 8 mm


Conectores S-Vdeo
facilit mejorar tanto la calidad de imagen tanto en reproduccin como en
captura y el S-Vdeo an puede encontrarse de manera testimonial en dispo-
sitivos de vdeo de consumo, incluyendo pantallas de vdeo, reproductores de
DVD, videocmaras digitales, descodificadores de televisin por cable y sat-
lite o consolas de videojuegos. En general, para aplicaciones de consumo y
semiprofesionales, el S-Vdeo debe usarse siempre que sea posible en lugar del
vdeo compuesto sinohayalgunaalternativadigital como las que veremos
ms adelante.

1.2.3. Vdeo analgico en componentes

Superior en calidad a los dos anteriores, utiliza un cable diferente para


cada una de las tres seales, por lo que la calidad de color era mejor que
la anterior al sacrificar la distancia mxima entre reproductor y presen-
tacin o captura.

Hay dos versiones diferentes segn el equipo:

a) Vdeo en componentes RGB: cada seal es de un color especfico y de


buena resolucin, adems supone un mnimo procesado para el equipo que la
emite y el que la recibe, por lo que es compatible directamente con la pantalla
de presentacin y mejora la imagen sensiblemente.

b) Vdeo en componentes YUV: versin que trabaja con la seal de luma


y las dos de croma. Es recomendable en equipos que trabajen internamente
con stas, como el Betacam SP. Si va a ser usada para suministrar vdeo a una
pantalla, deber convertir internamente las seales a RGB.
CC-BY-NC-ND PID_00176933 10 Conceptos bsicos de vdeo y audio. Introduccin

Asignacin de pines entre componentes analgicos YUV y conector VGA

Ejemplos

Un ejemplo an vigente de este sistema de conexin es el estndar VGA en componentes


analgicos, que aade seales de pulsos de sincrona para ajustar la seal al barrido de
la pantalla.

Otro ejemplo an vigente es el robusto euroconector, que de manera excepcional incluye


diferentes formatos de vdeo de la misma seal: vdeo compuesto, S-Vdeo y componentes
RGB analgico para dar servicio a todo tipo de pantallas desde el mismo conector, adems
de audio estreo analgico. Al ser tan verstil, su vida til se ha alargado incluso a esta
dcada. El robusto euroconector, un clsico desde la
dcada de 1970

1.3. Vdeo digital en calidad estndar, alta definicin y 3D

Ninguno de los sistemas analgicos de conexin anteriores sera capaz de man-


tener la calidad de una seal actual de vdeo digital con requerimientos de
ancho de banda superiores, ms si cabe si adems es de alta definicin o 3D, al
poseer una cantidad mucho mayor de pxeles que transmitir cada segundo. Y
es que el vdeo digital se compone de muestras de seal, cada una representa
una porcin minscula de sta.

La seal de vdeo digital, al igual que la analgica, se puede representar


por tres seales de color independientes (R, G y B) o bien una seal de
luminancia (Y) y dos de crominancia (U y V).

El proceso de digitalizacin de una seal analgica sigue siempre el criteriode


Nyquist, es decir, se muestrea, al menos, al doble de la mxima frecuencia de
la seal analgica. No entraremos en clculos, pero un ejemplo sencillo nos
puede ilustrar tan sencilla regla: en el caso del audio, si la frecuencia mxima
de la seal se establece en 20.000 Hz (por limitaciones del odo humano, y esta
suposicin es muy optimista), se muestrea a ms de 40.000 muestras/segundo.
Por ejemplo, CD y DAT utilizan 44.100 muestras/segundo.
CC-BY-NC-ND PID_00176933 11 Conceptos bsicos de vdeo y audio. Introduccin

En el caso del vdeo, si llevamos a cabo la misma operacin con la seal de Mala resolucin para el
vdeo en RGB, el volumen de datos que resulta es inmenso, pues para cada color

muestra de rojo R necesitamos otra muestra de verde G y una tercera de azul Un ejemplo esclarecedor es in-
B, pero si utilizamos la seal YUV se reduce sensiblemente. Esto se debe a una tentar adivinar el color de un
nico hilo de tejido que haya-
pequea argucia: el ojo humano tiene buena resolucin en blanco y negro, mos situado a varios metros: es
posible que detectemos si hay
pero pobre en color. un hilo, pero no su color.

As, podemos submuestrear las seales de color U y V, es decir, generar menos


muestras de las que realizaremos para la luminancia Y, sin que el usuario final
se percate:

Representacin visual de la asignacin de muestras sobre pxeles segn diferentes formatos

La proporcin denominada 4:2:2 supone que por cada dos muestras de seal
Y realizaremos una de U y otra de V, mientras que la 4:2:0 supone una muestra
de U y otra de V por cada cuatro de Y. Todo depende de la calidad de color
que se desee.

En todo caso, los flujos de datos generados son de tal volumen (centenares de
Mbits) que necesitamos una nueva generacin de sistemas de conexionado,
as destacan los SDI y HD-SDI para el entorno industrial y broadcast y los DVI
y HDMI para el entorno domstico.

1.3.1. SDI (Serial Digital Video)

El estndar de facto en el entorno profesional sigue la norma CCIR 601 que


opera a 270 Mbps y contiene la seal de vdeo en calidad estndar 720x576 a
25 imgenes/segundo y adems hasta 16 seales de audio digital embebidas,
todo a travs de un nico cable coaxial con conector BNC y hasta una distancia
de cientos de metros, ideal tanto para el estudio como para el despliegue de
equipos en un gran acontecimiento.
CC-BY-NC-ND PID_00176933 12 Conceptos bsicos de vdeo y audio. Introduccin

La seal digital que transmite es por componentes (Y, U, V) digitalizados en


proporcin 4:2:2 que se alternan en el tiempo, de manera que el cable slo
transporta una de estas tres seales en cada instante de tiempo, as pues no
existe interferencia alguna. Los equipos Betacam SP, Betacam Digital, Betacam
SX, DVCAM y DVCPRO, entre otros, y todos los sistemas de enrutamiento y
mezclado de imagen que existen se interconectan con este sistema si desean
ser comerciales.

1.3.2. HD-SDI (High Definition SDI)


El conector BNC llega al siglo XXI llevando HD y
sonido multicanal en un solo cable.
La evolucin natural del estndar SDI, compatible con seales de alta defini-
cin, sigue la norma SMPTE 292M y opera a 1,5 Gbps pero es mecnicamen-
te similar al anterior: un cable coaxial (evidentemente ms caro) con conec-
tores BNC. Tiene cinco veces la velocidad del anterior para acoger seales de
1920x1080 o 1440x1080 a 25 imgenes/segundo (modo denominado 1080i
o 1080 entrelazado) o 1280x720 a 50 imgenes/segundo (modo 720p o 720
progresivo), siempre sin comprimir.

Formatos de vdeo como HDCAM o DVCPRO HD y todas las pantallas de alta


definicin industrial y broadcast se interconectan as.

1.3.3. 3G-SDI

Sin embargo, para seales HD-SDI en 3D se necesita el doble de velocidad


de datos, ya que en broadcast el 3D se genera con dos flujos 1080i HD-SDI
independientes que han de circular por un mismo cable (modo 1080p o 1080
progresivo), de manera que el nuevo estndar 3G (denominado as porque
llega casi a 3 Gbps) ya aparece como sustituto natural del HD-SDI.

1.3.4. DVI (Digital Visual Interface)

En un entorno domstico, las seales SDI o HD-SDI no son utilizadas al no


necesitarse tal calidad, ya que para cuando la seal sale de su origen y llega a
su destino a travs de la red de transporte utilizada (por TDT, satlite, streaming
por Internet, en soporte DVD o Blu-ray), est comprimida, es decir, se ha
reducido su calidad visual para reducir su peso en bits y hacer comercial su
difusin. En realidad, buena parte de esta asignatura versa sobre cmo se debe
comprimir en todas esas redes de distribucin.
Conector DVI

As pues, como soluciones de conexionado ms sencillas contamos con el DVI,


que puede tratar con seales de vdeo tanto digitales (estndar o alta defini-
cin) como analgicas, pero habitualmente sin el sonido asociado, que requie-
re un cableado aparte. La novedad es que es bidireccional, de manera que el
equipo emisor y el receptor pueden acordar la resolucin ms adecuada para
trabajar entre s y posibilita tambin encriptar la seal, aunque raramente se
usa en ese aspecto. Sin duda, es la evolucin natural del VGA y se encuentra
CC-BY-NC-ND PID_00176933 13 Conceptos bsicos de vdeo y audio. Introduccin

en la mayora de monitores de vdeo del hogar, tarjetas grficas e incluso en


televisores planos, aunque en este ltimo sector est perdiendo terreno frente
a su evolucin, el HDMI.

Equipos emisor y receptor

Un equipo Blu-ray que desee reproducir a 1080p conectado a una pantalla HD Ready
reproducir en calidad 1080i o 720p, ya que la pantalla comunicar va DVI su incapa-
cidad para presentar seales en 1080p, sin necesidad de ninguna accin por parte del
usuario. Si, en cambio, la pantalla es Full HD 1080, la reproduccin tendr lugar en m-
xima resolucin.

1.3.5. HDMI (High Definition Multimedia Interface)

El HDMI lleva tanto vdeo digital como seales de audio. Se basa en DVI me-
diante la adicin de audio digital en el mismo cable, pero conserva la com-
patibilidad con la especificacin elctrica DVI-Digital, es decir, un mero adap-
tador convierte un conector HDMI en DVI, por lo que pierde el sonido. La
proteccin anticopia se basa en una tecnologa llamada HDCP (proteccin de
contenido de gran banda digital), que obliga a que el equipo reproductor y el
equipo monitor acuerden que slo se visualizar la seal y no se ejecutarn
copias. Si el acuerdo fracasa, se reproduce en baja calidad o sencillamente no
hay reproduccin posible.

Conector HDMI
De las diferentes versiones que han ido apareciendo en el mercado desde su
nacimiento en el 2002, actualmente se trabaja con la 1.4, la nica capaz de
trabajar con seales HDTV-3D y que abre la posibilidad de trabajar con reso-
luciones superiores a 2.000x2.000 pxeles an en estudio (Quad HD, Super Hi-
Vision, Ultra HDTV).

1.3.6. Firewire

Si bien el origen de Firewire se asocia con la transmisin en serie de datos


digitales en entornos informticos, al trabajar con vdeo en estas plataformas
tambin son utilizados, usualmente para transferencia de vdeo digital entre
equipos.

Firewire

Originalmente fue denominado IEEE 1394 o, por parte de Sony, i.Link.

Firewire fue desarrollado por Apple en 1995 y actualmente existe en diferentes


versiones segn la velocidad de transferencia (400, 800, 1.600, 3.200 Mbps).
Este soporte fsico se utiliza con el protocolo DV para conectar grabadores de
vdeo y cmaras domsticas e industriales a ordenadores e incluye comandos
de control (como rebobinado, play o stop) y datos como el cdigo de tiempo.

Arriba, conectores 400 (estndar y mini); abajo,


conectores 800
CC-BY-NC-ND PID_00176933 14 Conceptos bsicos de vdeo y audio. Introduccin

1.3.7. USB (Universal Serial Bus)

Si por uso extensivo y versatilidad se tuviese que seleccionar un sistema de


transmisin de seales, sin duda el USB sera el que centrara nuestra atencin.
Nacido a mediados de los noventa principalmente para el mercado inform-
tico, en la actualidad se extiende su uso en entornos mviles e incluso en sis-
temas industriales. Su resistencia, facilidad de mantenimiento, interoperabili-
dad entre equipos, altas prestaciones de velocidad y fiabilidad, as como una
constante mejora en velocidad resultan idneos para las crecientes necesida-
El omnipresente USB
des de transferencias de datos: desde 1,5 Mbps (USB 1.0), pasando por los 12
Mbps (USB 1.1) y los 480 Mbps (USB 2.0), hasta llegar a los 4,8 Gbps en la
revisin 3.0.

1.3.8. Conclusin

A modo de conclusin, presentamos la siguiente tabla con un resumen de los


estndares de transporte de vdeo ms habituales.

Tabla resumen de los estndares de transporte de vdeo ms habituales

Transporte de vdeo analgico Ventajas Inconvenientes

Vdeocompuesto Gran nmero de dispositivos lo poseen en La seal de luminancia Y y las de crominan-


todo el mundo. cia U y V se interfieren entre s al compar-
Un nico cable para transmitir la seal de tir el cable, lo que degrada la imagen resul-
vdeo. tante.
Es analgico, por lo que queda fcilmente
afectado por interferencias externas y rui-
do.

S-Vdeo Gran nmero de dispositivos lo poseen en Conector mecnicamente ms delicado.


todo el mundo. Sigue siendo analgico, por lo que se utiliza
La luma y la croma van por caminos sepa- en exclusiva para distancias inferiores a los
rados, no se interfieren y da mejor seal de 2-3 metros.
imagen.

Vdeoencomponentes Mxima calidad en analgico. Aadiendo las seales de sincrona H y V,


Aceptable para edicin y posproduccin son necesarios hasta cinco cables.
profesional. Todos ellos han de ser exactamente iguales
o los retardos no coinciden y aparecen ar-
tefactos en la imagen.
Exclusivamente para distancias cortas.

Transporte de vdeo digital Ventajas Inconvenientes

SDI/HDSDI/3G Seal digital, por lo que es poco sensible al Requiere equipamiento industrial o broad-
ruido y las interferencias. cast de alto coste.
Acepta mltiples generaciones de copiado. Los 270 Mbps que genera no son de fcil
El audio, el cdigo de tiempo y otras seales gestin ni almacenamiento.
van incrustadas en la misma seal de vdeo.
De fcil conexin con un solo cable.
Es un estndar generalizado en entornos in-
dustriales y broadcast.

DVI Muy compatible, pues puede trabajar con Dedicado exclusivamente para visualiza-
seales analgicas o digitales. cin de vdeo, no a la interconexin de
En el caso digital, puede trabajar con ca- equipos.
bleado de hasta 50 metros. Es un conector multipin, por lo que es com-
plejo y puede sufrir torsin.
El audio necesita de cableado aparte.
CC-BY-NC-ND PID_00176933 15 Conceptos bsicos de vdeo y audio. Introduccin

Transporte de vdeo analgico Ventajas Inconvenientes

HDMI Conector compacto. Existen varias versiones del HDMI con capa-
Incluye la seal de audio. cidades de transmisin diferentes.
Mediante extensores, puede llegar a los El conector no posee anclaje, de modo que
250 metros. es fcilmente desconectable.
Un sencillo adaptador lo convierte en DVI. Si bien podra utilizarse para transferir vdeo
Incluye proteccin anticopia HDCP. entre equipos, el sistema anticopia es un
handicap que lo relega la conexin a moni-
tores digitales.

Firewire Conector sencillo y compacto. No posee anclajes.


De uso universal, aunque es el ms adop- Es propietario (Apple).
tado para la transferencia de audio y vdeo No est tan extendido como el USB.
a alta velocidad en entornos domsticos y
semiprofesionales.
Mayor transferencia sostenida de datos que
el USB, necesaria para vdeo.

USB Conector sencillo y compacto. Orientado a la interconexin de perifricos.


De uso universal. Rendimiento lento para vdeo de alta defi-
Se utiliza para fuentes de vdeo de baja ve- nicin.
locidad, como webcams y escneres. No posee anclajes.

Actividades

Actividad1

Revisad el equipo informtico que tenis actualmente. Qu tipo de entradas y salidas


pueden ser interesantes para capturar vdeo?

Actividad2

Revisad las entradas de seal del monitor. Qu seales de vdeo acepta? Pensad que,
si tenis un porttil multimedia, puede adelantarse que la entrada es de componentes
digitales RGB, aunque conectada directamente a la placa grfica del porttil.

Actividad3

Si tenis una cmara de vdeo o webcam, con qu estndar de conexionado se conecta?

Actividad4

Si tenis software de captura (como Adobe Premiere, Camtasia o software gratuito), es


compatible con las entradas disponibles?

Actividad5

Ahora revisad el televisor del comedor. Si es de reciente adquisicin, el nmero de entra-


das que posee suele ser apabullante. Cules son compatibles con el equipo informtico?
Por lo general, se acaba creyendo realmente en la tantas veces pronosticada conversin
de la televisin en un centro multimedia digital.

1.4. Broadcast frente a vdeo en Internet

Hasta ahora, en este mdulo nos hemos dedicado a las seales de vdeo tradi-
cionales, las que pueden ser entregadas directamente a una pantalla de vdeo o
a un ordenador a travs de un simple cable, a distancias no superiores a los 100
metros. Por el contrario, los contenidos de vdeo transmitidos o compartidos
a travs de Internet han de ser obligatoriamente digitales (si no se capturan
CC-BY-NC-ND PID_00176933 16 Conceptos bsicos de vdeo y audio. Introduccin

previamente) y requieren un dispositivo (como un ordenador o un descodi-


ficador dedicado) o un software especfico para reconstruirlas correctamente
antes de ser visibles.

Todos los ficheros o streams de vdeo de la Red destinados a los consumidores Ved tambin
finales secomprimen mediante alguno de los muchos tipos de compresin
Los diferentes tipos de com-
disponibles en la actualidad, por lo que ambas seales de audio y vdeo deben presin se tratan en el mdulo
ser descomprimidas mediante hardware o software antes de poder ser entre- "Digitalizacin, almacenamien-
to y transmisin de audio y v-
gadas al destinatario. Si se tiene TDT, televisin por cable o por satlite, se des- deo".

comprime por hardware, mientras que si se tiene un equipo Windows Media


Center o sencillamente se es usuario de YouTube, por software.

En el caso del software, el ms interesante y con mayor futuro, concretemos


que hay pequeas aplicaciones denominadas extensiones o plugins que, in-
tegradas en el programa navegador de uso habitual lo capacitan para ejecutar
esa descodificacin al vuelo: Adobe Flash Player, QuickTime de Apple y Win-
dows Media Player, por citar algunas de las ms populares. Las seales de vdeo
por Internet pueden ser esencialmente de cualquier nmero de pxeles hori-
zontales y verticales y hay una amplia seleccin de sistemas de proteccin de
contenidos y tcnicas de entrega de los datos a travs de la red.

Con todas las distintas combinaciones disponibles, los proveedores de vdeo


por Internet son capaces de desarrollar sus propias combinaciones de forma-
tos, por lo que el vdeo producido en un sitio puede no ser directamente com-
patible con otros sitios de alojamiento. Por ello, la flexibilidad es un elemento
clave de los reproductores de vdeo de Internet: los televidentes deberan tener
libertad para detener, iniciar, rebobinar y pausar la reproduccin en cualquier
momento, controlar el tamao del vdeo en sus pantallas y elegir entre una
variedad de formatos de pantalla del reproductor. Cuando queris distribuir
vuestro producto audiovisual por la Red, no os aferris a un estndar en par-
ticular porque reduciris el impacto.

En una red como Internet, pensada para la transmisin de datos, las seales
de vdeo no son fciles de transportar, bsicamente por dos razones:

a) La primera es que no es una red pensada para vdeo, el trnsito a travs de la


red del vdeo y audio comprimidos se realiza mediante paquetes de datos ge-
nricos (paquetes IP), como todos los dems tipos de datos (textos, imgenes)
que fluyen por la Red. Estos paquetes de datos circulan por las mismas redes y
son encaminados por los mismos centros de distribucin (routers) como cual-
quier otro dato, a veces desordenndose o perdindose.
CC-BY-NC-ND PID_00176933 17 Conceptos bsicos de vdeo y audio. Introduccin

b) La segunda razn es un flujo de datos muy alto, casi constante, por lo que
necesita gran cantidad de paquetes necesarios para asegurar la reproduccin
con la cadencia necesaria: por ejemplo, un vdeo de YouTube de un minuto
puede exigir la entrega de unos mil paquetes sin perder el orden y con una
cadencia fija. Todo esto lo veremos con detalle en otros mdulos.

Sin duda, entre el vdeo por Internet y el vdeo broadcast hay diferencias cr-
ticas en su distribucin que obligan a retos tcnicos en parte superados. Sin
embargo, ms all de la tecnologa, hay una revolucin ms profunda y de
consecuencias ms intensas: el usuario elige lo que desea ver desde el punto
en el que desea verlo, en contraposicin a ver lo que ofrecen tal como indica
la programacin esttica del canal. Esta nueva capacidad de decisin por parte
del usuario final obliga a replantear la atraccin del producto y a crear nuevos
mercados en los que aprovechar la interaccin. Esta revolucin ya est pasan-
do, por mucho que se niegue en algunos sectores, aferrados a argumentos tales
como la falta de calidad de imagen o de tratamiento profesional asegurado
de los contenidos de la Red, pero estos argumentos van perdiendo fuerza ao
tras ao al incorporarse profesionales preparados para trabajar en este medio
como su entorno natural. Esperemos aportar nuestro grano de arena.

Actividades

Actividad6

Comparemos los niveles de compresin que se utilizan habitualmente en el merca-


do. Para ello, vamos a instalar el programa de reproduccin de vdeos VLC (http://
www.videolan.org).
CC-BY-NC-ND PID_00176933 18 Conceptos bsicos de vdeo y audio. Introduccin

Tasas de bits informadas por VLC

Primero veamos la compresin de vdeo utilizada para poder almacenar una pelcula
en un DVD domstico; para ello, mediante el men Medio-Abrir disco, seleccionad la
unidad de disco y reproducid una pelcula. Accediendo en cualquier momento al men
Herramientas-Informacin multimedia-Detalles del cdec donde en el apartado Vdeo
indicar el formato de codificacin, usualmente MPEG-2, el ancho y el alto de la imagen
en pxeles y los fotogramas por segundo. Es fcil calcular, pues, que el flujo de datos de
lectura en bits/s debera ser, sin compresin, de:

Ahora, en la solapa Estadsticas, podis ver la Tasa de bits del contenido, los bits por
segundo necesarios para reproducir correctamente el fichero comprimido:

Tasas de bits en la solapa Estadsticas de VLC

La compresin que ha conseguido, usualmente muy alta, se calcula como:

Actividad7

Realizad la misma operacin, pero en este caso con un fichero de vdeo que se haya
descargado de Internet (WMV, MP4, AVI). Para visualizarlo con VLC, seleccionad el men
Medio-Abrir archivo y recoged los datos que presenta. Calculad el factor de compresin
y comparadlo con el del caso DVD. Por qu razn hay tal diferencia?
CC-BY-NC-ND PID_00176933 19 Conceptos bsicos de vdeo y audio. Introduccin

Si en vez de DVD se utiliza Blu-ray, comparadlo con un fichero de vdeo que sea en alta
definicin o la comparativa no tendra sentido.

1.5. Resoluciones, velocidad de cuadro, relaciones de aspecto y


otros parmetros

El cuadro es la unidad de imagen en vdeo, una imagen con todo el


contenido visual captado.

Sin embargo, a la hora de presentarlo en pantalla, puede hacerse de dos ma-


neras:

Enmodoprogresivo: por completo, es decir, presentando todas y cada Modo progresivo


una de sus filas de pxeles una debajo de la otra hasta finalizar la presen-
En Europa, los modos 720p,
tacin del cuadro. 1080p y 1080p50, a 25, 24 y
50 cuadros/segundo o Hz res-
pectivamente.
Enmodoentrelazado: el cuadro se descompone en dos subimgenes, los
campos, uno con las filas impares y el otro con las pares. A continuacin,
se presenta el primer campo y luego el segundo. Modo entrelazado

En Europa, los modos 576i,


PAL y 1080i, a 50 campos/se-
gundo o Hz (25 cuadros/se-
gundo).

Por historia, el modo entrelazado posibilit emitir televisin utilizando un an-


cho de banda pequeo (era ms sencillo emitir dos subimgenes alternativa-
mente que una gran imagen), pero a costa de generar un efecto de vibracin
visual en las zonas de imagen con detalle brillante, denominado flicker. Algu-
nas personas son ms receptivas a este problema que otras.

La tcnica ms habitual para reducir el flicker de una seal entrelazada ha si-


do simular con mayor o menor gracia una frecuencia de cuadro mayor en el
El rayado en los perfiles de los objetos es
receptor: un monitor que prometa 100 Hz, 200 Hz e incluso 600 Hz intenta indicativo de entrelazado.

mejorar la experiencia visual, a la vez que reduce el flicker, pero introduce arti-
ficios varios que, en general, generan otros problemas visuales colaterales. En
vdeo digital, que es nuestro campo de trabajo, todo software de tratamiento
de vdeo provee de alguna herramienta para reducir los efectos visuales del
entrelazado.

Es curiosa la existencia de la nueva frecuencia de cuadro de 24 imgenes/se-


gundo en televisin digital. Hasta ahora, toda transferencia de material cine-
matogrfico a vdeo haba sido a costa de perder calidad visual. Si hablamos Tpicas opciones contra el entrelazado

de pelcula en 16 mm o 35 mm, rodada a 24 imgenes por segundo, al trans-


ferirla a vdeo con una cmara de 25 imgenes/segundo aparecan transicio-
nes visuales oscuras constantemente, por lo que se opt por reproducirla a 25
imgenes/segundo y acelerar as la accin en unos 4 minutos de cada 100 (una
pelcula de 100 minutos en el cine dura 96 en televisin). Gracias a la intro-
CC-BY-NC-ND PID_00176933 20 Conceptos bsicos de vdeo y audio. Introduccin

duccin de la frecuencia de vdeo de 24 imgenes/segundo en los formatos


720 y 1080, estos fenmenos desaparecen y se puede capturar, almacenar y
reproducir digitalmente el material de celuloide tal como se hizo.

El modo entrelazado y el progresivo conviven en la actualidad. En realidad,


cualquier sistema que supere los 18 cuadros/segundo es factible, pero cuanto
mayor es la velocidad de cuadro ms realista es la experiencia, aunque
requiera ms velocidad de datos. En casos especficos como la videoconferen-
cia, sistema puramente progresivo, este lmite es aconsejable aunque, si no se
cumple, no pierde el valor aadido de una comunicacin a gran distancia por
muy bajo coste.

Actividad 8

Abrid el VLC y, mediante el men Medio-Abrir archivo, visualizad los vdeos indicados
en el aula. Este programa posee capacidad de desentrelazar utilizando diferentes tcnicas
enumeradas en el men Vdeo-Modo desentrelazado.

Opciones de desentrelazado de VLC

Una vez seleccionada una de stas, se puede aplicar y ver el resultado mediante Vdeo-Des-
entrelazar-Activar. Seleccionad el que se crea ms adecuado para cada vdeo.

Puede desactivarse mediante Vdeo-Desentrelazar-Desactivar.

Respecto a la resolucindeimagen, solemos hablar de la resolucin


vertical, que se define como el nmero de lneas horizontales de imagen
que pueden distinguirse al recorrer en vertical la imagen.

As, en PAL o DVD son 576 lneas de un total de 625 (el resto son lneas de
sincrona sin imagen) y en Blu-ray son 720 (modo 720p) y 1.080 (modos 1080i
y 1080p).

La videoconferencia

En la videoconferencia, por ejemplo, se utiliza a menudo el formato denominado CIF


(Common Intermediate Format), de 352 pxeles de ancho y 288 lneas de resolucin
CC-BY-NC-ND PID_00176933 21 Conceptos bsicos de vdeo y audio. Introduccin

vertical, el 4CIF (que cuadriplica este tamao hasta llegar a 704x576) o el QCIF (un cuarto
del CIF, 176x144).

Sin embargo, la resolucin de la imagen vendr limitada a continuacin por


la resolucin de la pantalla sobre la que se muestre y viceversa. As, tamaos
de 640x480 (el ya casi inexistente VGA) hasta 1600x1200 (UXGA) son los ms
habituales en el entorno informtico, mientras que resoluciones de 1920x1080
son las propias de monitores Full HD domsticos, aun cuando estos dos seg-
mentos de mercado parecen tender a un destino comn (la unificacin augu-
rada del televisor domstico como centro digital).

Finalmente, el tercer parmetro que debemos destacar es la relacinde


aspecto, que indica la proporcin entre el ancho y el alto de la imagen.

En la actualidad, el estndar en vdeo es 16:9 (ms cmodo que decir 1,78). David Sarnoff Center
Estudios han indicado que este rectngulo poda abarcar los formatos de as-
Estos estudios fueron dirigidos
pecto ms frecuentes que han existido hasta ahora (4:3 convencional, 1.85:1 y en 1980 por el doctor Kerns
2.39:1 cinematogrfico, 3:2 fotogrfico), ya sea utilizando el zoom o mediante Powers del David Sarnoff Cen-
ter y miembro del SMPTE.
barras negras a los lados (pillarbox) o arriba y abajo (letterbox).

Comparativa de los diferentes formatos de imagen

La relacin de aspecto est relacionada con la proporcin del pxel: en el


mundo de la informtica, los pxeles son cuadrados. As, una imagen 4:3 de
1024x768 (VGA) tiene una proporcin exacta de 4:3 y una imagen 16:9 de
1600x900 tiene una proporcin de 16:9. Sin embargo, en el mundo de la ima-
gen no es as: el vdeo convencional de 720x576 es 4:3 pero la relacin de sus
pxeles no:
CC-BY-NC-ND PID_00176933 22 Conceptos bsicos de vdeo y audio. Introduccin

Con frecuencia, trabajar con seales de resolucin estndar en entornos in-


formticos supone tener que encoger horizontalmente la imagen para verla
en la proporcin correcta, cosa que los propios programas de captura ya reali-
zan internamente. Este problema no existe con las seales de alta definicin,
ya que la mayora de sus formatos son de pxel cuadrado: 1280x720 (720p) y
1920x1080 (1080i y 1080p) (16:9). El formato 1440x1080 (1080i) es la excep-
cin, con un pxel representado en pantalla ligeramente rectangular.

Actividad 9

Mediante VLC, se puede experimentar con los dos formatos habituales de trabajo en v-
deo digital. El men es Vdeo-Proporcin, cuyos valores van desde Predeterminado (el
programa elige la proporcin segn los datos del propio fichero de vdeo) hasta propor-
ciones ms rectangulares. Comprobad que los vdeos en alta definicin siempre son en
proporcin 16:9.

Seleccin de proporciones en VLC


CC-BY-NC-ND PID_00176933 23 Conceptos bsicos de vdeo y audio. Introduccin

2. Caractersticas del sonido

La distribucin de imagen en casi cualquier aspecto va asociada a la distribu-


cin de audio, por ello requiere tratarlo en este apartado. Como el audio tiene
caractersticas diferentes a la imagen, su tratamiento es tambin diferente, en
general ms sencillo. Comencemos con el audio analgico y luego el digital
para ver los estndares de compresin en el siguiente apartado.

2.1. Audio analgico

Convertido el audio en una seal elctrica, sta puede alimentar directamente


el equipo, el altavoz o los cascos, por ejemplo, donde se vaya a reproducir.
Salvando la potencia necesaria, este sistema de audio abarca desde micrfonos
hasta sistemas de bafles de conciertos con xito desde hace dcadas, sobrevi-
viendo en la era digital a travs de las salidas RCA de los equipos CD, DVD,
descodificadores de cable y satlite, o de las salidas de auriculares de 3,5 mm
de todo reproductor MP3. Sin embargo, el ruido, las interferencias, la calidad Conectores de audio estreo analgico:
minijack (arriba) y pareja RCA (abajo)
de los conectores y del cable hacen mella en su resultado final; adems, no
incluye sealizacin que facilite su sincrona con el vdeo que pueda acompa-
ar, por lo que se circunscribe actualmente al entorno de consumo.

2.2. Audio digital

El sonido siempre ser analgico, pero la transmisin y almacenamiento se Ved tambin


han digitalizado, por lo que as lo han protegido del ruido y lo han hecho
Las tcnicas de compresin
inmune a las interferencias, a la vez que lo compatibiliza con los sistemas di- se tratan en el mdulo "Digi-
gitales. Adems, del CD al MP3, el audio digital ha pasado de ser no compri- talizacin, almacenamiento y
transmisin de audio y vdeo"
mido a utilizar tcnicas de compresin que veremos ms adelante. Necesita de esta asignatura.

conectores Canon XLS, aunque el formato AES tambin es el utilizado para


empaquetar el audio digital en la seal de vdeo SDI, HD-SDI o 3G, transmi-
tiendo todo el conjunto por un nico cable coaxial.

La seal de audio digital sigue el formato AES/EBU, con cada muestra de 16 bits
y a velocidades de 32.000, 44.100 y 48.000 muestras segn el ancho de banda
analgico que se desee representar (hasta 16 kHz, calidad FM; hasta 22 kHz,
calidad CD, y hasta 24 kHz, calidad de estudio profesional, respectivamente).
Sin duda, sigue el mencionado criterio de Nyquist. As, una seal estreo digital
Conectores Canon de audio digital (AES)
AES supone un flujo de datos de:

Flujo de audio = 44.100 muestras x 16 bits/muestra x 2 canales = 1,41 Mbps


CC-BY-NC-ND PID_00176933 24 Conceptos bsicos de vdeo y audio. Introduccin

Si adems contamos con que el estndar AES reserva 32 bits para transportar
cada muestra y otros datos asociados (como el cdigo de tiempo), resulta lo
siguiente:

Flujo de transporte de audio = flujo de audio x 2 = 2,82 Mbps

Eso supondra casi una conexin de 3 Mbps slo para reproducir el audio es-
treo a travs de una red, el caso de audio multicanal o envolvente multiplica
por 3 o 6 esta cifra. Evidentemente, se ha de poder comprimir sin perder gran
calidad para poder distribuir audio por red, cosa que veremos ms adelante.

Actividad 10

Mediante VLC, abrid un fichero de audio y, mientras est en reproduccin, acceded a


Herramientas-Informacin multimedia. En la pestaa Detalles del cdec indicar el for-
mato en el que est comprimido el audio y en la pestaa Estadsticas se presentar una
serie de datos de los que en especial destaca la Tasa de bits de entrada, es decir, los kilobits
por segundo que el programa va leyendo del fichero de audio, la Tasa de bits de conteni-
do, que indica cuntos de los kilobits por segundo ledos realmente son para audio (los
dems son de control, calidad, sincrona y dems).

Datos proporcionados por VLC de un fichero de audio

Comparad la tasa de bits de contenido con el flujo de audio (no el flujo de transporte de
audio) que debera tener en formato AES para dar una idea de la compresin conseguida
con el formato de audio del fichero perdiendo la calidad de sonido que se pueda detectar.

Probadlo con diferentes formatos (por ejemplo MP3, WMA o WAV).


CC-BY-NC-ND PID_00176933 25 Conceptos bsicos de vdeo y audio. Introduccin

3. La revolucin en la gestin de las seales

Una vez hemos caracterizado las seales principales, nos quedan otras infor-
maciones adicionales que tienen definido su sitio en el entorno domstico y
profesional, como la audiodescripcin para personas con discapacidad visual,
el teletexto de informacin general o los subttulos para el colectivo con di-
ferentes grados de discapacidad auditiva. Estas seales deberan poder subsis-
tir o tener equivalentes funcionales en cualquier plataforma de distribucin
digital, siempre a costa de un consumo mayor de ancho de banda, pero los
beneficios para la audiencia son evidentes. Incluso en ciertos pases son de
obligada existencia.

La gestin de este cmulo de informacin ligada (vdeo, audio, servicios


adicionales) en una productora audiovisual se realiza mediante equipos
denominados matricesoenrutadores de vdeo y audio, que seleccio-
nan las seales adecuadas del conjunto de seales existentes para conse-
guir un producto resultante coherente. Sin entrar en detalles, han exis-
tido matrices analgicas y actualmente todas son digitales.

Al tener que trabajar con seales totalmente digitales, las condiciones son las Una matriz de vdeo y audio que presenta las
conexiones de entradas y salidas.
mismas que las de trabajo de un router IP, aparato concentrador de datos que
encamina los paquetes digitales de datos desde un origen hasta un destino. La
fusin entre las matrices digitales de audio/vdeo y los routers IP no ha tardado
en llegar, habida cuenta de las funciones avanzadas de los routers IP de ltima
generacin en entornos de muy alta velocidad. As, las instalaciones tradicio-
nales de audio y vdeo con cables coaxiales dedicados desde cada equipo hasta
la matriz van desapareciendo y se sustituyen por una red de alta velocidad en
la que se conectan todos los equipos al router IP central. Es una red escalable,
es decir, de tamao fcilmente ampliable si se requieren nuevos equipos para
la produccin.

Este cambio sustancial en el ncleo de produccin unifica adems la gestin


del resto de seales, incluyendo la telefona interna, la gestin remota de los
equipos, la integracin de la produccin en la red de distribucin al cliente,
a otros centros de produccin o directamente al mercado Internet. Sin duda,
hay otro tipo nuevo de problemas, entre ellos la lucha contra el retardo de los
datos y la mejora de la robustez del sistema ante la congestin de la red y su
consecuente prdida de paquetes de datos.
CC-BY-NC-ND PID_00176933 26 Conceptos bsicos de vdeo y audio. Introduccin

Si en el campo de la distribucin audiovisual la Red ya tena ganada la batalla,


en el campo de la produccin audiovisual la victoria es clara a medio plazo.
Muchos equipos broadcast ya incluyen conexiones de red (fibra o cobre) de
alta velocidad (4 Gbps en adelante) preparados para este cambio de proceso.
El transporte de vdeo y audio por IP ir en aumento vertiginoso.
CC-BY-NC-ND PID_00176933 27 Conceptos bsicos de vdeo y audio. Introduccin

4. Codificacin de la imagen fija

4.1. La necesidad de comprimir

Las imgenes requieren considerablemente ms espacio que el texto y el audio


y el vdeo an demandan ms en trminos de almacenamiento y velocidad de
transmisin. Unos pocos nmeros nos ilustran en este aspecto e introducen
as algunos conceptos bsicos que vamos a usar a lo largo de todo el curso a
partir de este punto:

Una pgina de este libro contiene unas 35 lneas de 80 caracteres; si cada


carcter puede representarse, almacenarse y transmitirse digitalmente con
1 byte (8 bits), cada pgina ocupa 22.400 bits.

Una imagen de vectores (es decir, creada con lneas, como los diseos de
Autocad o una fuente escalable) contiene unos 500 trazos. Si cada trazo se
representa por sus coordenadas de inicio y final (cuatro nmeros en total)
y cada nmero por 2 bytes, la imagen ocupa 32.000 bits.

La msica en calidad CD supone 44.100 muestras/segundo, si las muestras


son de 16 bits y es estreo, se generan 1.411.200 bits cada segundo.

Una imagen fotogrfica de 720 por 576 pxeles contiene 414.720 pxeles
en total, si la imagen es en blanco y negro cada pxel se representa por un
byte, por lo que ocupa 3.317.760 bits.

Si la imagen anterior fuese en color, cada pxel se representa por 3 bytes


(uno para el rojo, otro para el verde y otro para el azul), por lo que ocupa
el triple, 9.953.280 bits.

El sonido digital envolvente puede llegar a suponer casi 9 Mbps sin trata-
miento alguno.

En el caso del vdeo, una seal PAL de 625 lneas a 25 cuadros/segundo se


descompone en luminancia y dos seales de crominancia que necesitan
unos 216 Mbps.

Si es HD a 1080i, aumenta a 1.15 Gbps.

Los requerimientos de memoria y velocidad de transmisin para estas infor-


maciones deben reducirse de manera notable para que puedan ser gestionados
por los equipos actuales, con capacidades de almacenamiento del orden de
CC-BY-NC-ND PID_00176933 28 Conceptos bsicos de vdeo y audio. Introduccin

Gbytes y memorias buffer del orden de Mbytes, y de sistemas de transmisin


en el entorno de algunos Mbps. Necesitamos comprimir y, en algunos casos,
de manera drstica.

4.1.1. Codificacin y compresin. Tipos de compresin

Es usual que se utilicen los trminos codificacin y compresin de ma-


nera equivalente, pero codificacin es sencillamente expresar una in-
formacin de una manera diferente utilizando un nuevo cdigo, mien-
tras que compresin es reducir su tamao total en bits. La compresin
es un caso particular de codificacin, donde el nuevo cdigo utiliza me-
nos elementos para representar la misma informacin.

As, la tabla ASCII codifica los caracteres y los expresa en formato binario, sin
existir ninguna compresin en el proceso. Por el contrario, una codificacin
que utiliza una herramienta informtica que represente un fichero de datos
con otro de menor tamao en bits (como .zip o .rar en Windows, .sit en OSX
o .tg en Linux) es un caso de compresin.

No obstante, an podemos perfilar ms la definicin de compresin: cuando


indicamos que ha de representar la misma informacin, no significa en todos
los casos que deba ser exactamente la misma informacin final que la original,
es decir, la compresin puede ser sinprdidas o conprdidas. En el primer
caso, podemos realizar el proceso inverso para volver a tener la misma infor-
macin exacta original: de todo fichero .zip o .rar puede recuperarse el fichero
original. En el segundo caso, aceptamos una degradacin del mensaje en aras
de conseguir una compresin efectiva, siempre y cuando no haga inservible
la informacin que lleva.

4.1.2. Redundancia y entropa

A qu nos referimos con informacin inservible? En muchos casos, la infor-


macin por transmitir tiene datosredundantes, informacin predecible o re-
petitiva que se puede comprimir de forma intensa, como por ejemplo varios
espacios en blanco consecutivos en un texto o varios pxeles consecutivos de
un mismo color en un fax. Su reconstruccin al descomprimir es exacta. En
la compresin sin prdidas se elimina la redundancia de la informacin, sin
tocar un pice la informacin fundamental. Es la ideal para ficheros de datos
(como zip, rar, sit y tg), algunos formatos de imagen como GIF, PIC, un modo
de trabajo especfico del formato de compresin de imagen JPEG 2000, entre
otros.
CC-BY-NC-ND PID_00176933 29 Conceptos bsicos de vdeo y audio. Introduccin

Sin embargo, estas compresiones sin prdidas no rinden mucho. Conseguir


un 50% de reduccin es generalmente un xito, por lo que la compresin con
prdidas es la que domina en el mundo de la imagen y el sonido, donde se
necesitan tasas de reduccin mucho ms altas.

La base de la compresin con prdidas es la eliminacin de los datosirrele-


vantes, como por ejemplo las pequeas variaciones de color entre pxeles cer-
canos (ya que el ojo humano tiene poca resolucin para el color) o los sonidos
de frecuencias superiores a los 16.000 Hz (pues pocos seres humanos adultos
son capaces de orlos). La informacin irrelevante se suprime completamente,
al modificar de manera permanente la informacin por transmitir, aunque de
una manera tolerable para el destinatario al que vaya dirigida. Ejemplos de
formatos estndar de compresin con prdidas son los siguientes:

formatos de compresindeimagen como JPEG, EZW, SPIHT y casi todos


los modos de trabajo de JPEG 2000,
formatos de compresindeaudio como AAC o MP3,
formatos de compresindevdeo como la familia MPEG.

Es evidente que el xito de cualquier compresin depender de cunta infor-


macin redundante o irrelevante haya en el mensaje, por lo que es habitual
que el rendimiento de la compresin vare casi constantemente. La entropa
es una medida de la informacin esencial de un mensaje (la diferencia entre la
cantidad total de datos que contiene el mensaje y su redundancia). A mayor
entropa, ms datos no pueden eliminarse, por lo que la codificacin con pr-
didas rendir poco. A menor entropa, la codificacin con prdidas ser muy
efectiva.

4.1.3. Medida de la compresin de imagen

Para medir la compresin conseguida en una imagen y as poder comparar


diferentes sistemas de compresin como haremos en el curso, utilizamos el
factor de compresin que ya vimos antes, un valor numrico que aumenta
con la compresin lograda. As, dada una imagen original y su equivalente
comprimido, el factor de compresin es el siguiente:

Nota

Recordad indicar ambos pesos


siempre en la misma unidad
Otra manera de representar la compresin es indicando el nmero de bits que (bits, bytes, Kbytes).
necesita cada pxel de la imagen, el bit por pxel (bpp):
CC-BY-NC-ND PID_00176933 30 Conceptos bsicos de vdeo y audio. Introduccin

De manera sencilla podemos deducir que el bpp de una imagen original y el


bpp de su imagen comprimida se relacionan con el factor de compresin entre
ellas:

Actividad 11

Si una imagen es de 1600x1200 pxeles con 24 bits de color/pxel y se comprime en un


formato tal que el fichero resultante es de 230 Kbytes, cul es el bpp de la imagen origi-
nal? Y el de la comprimida? Cul ser el factor de compresin conseguido? Atencin
con las unidades, no mezclis bits con bytes.

4.1.4. Medida objetiva y subjetiva de la calidad de imagen

En la actualidad, se siguen investigando tcnicas cuantitativas que puedan


asignar un valor numrico a la calidad visual de cualquier imagen, as nos da
una idea de lo degradada que ha resultado tras aplicarle cierta compresin con
prdidas y nos ayuda a elegir el estndar de compresin ms adecuado.

En todo caso, presentamos una medida, el errorcuadrticomedio, una ma-


nera de calcular las diferencias que existen entre una imagen y su comprimida.
Bsicamente es una aproximacin para diferenciar en cunto son diferentes,
algo que el ojo humano hace de manera natural en instantes pero que mate-
mticamente es muy difcil de concretar, pues no se conocen con detalle los
mecanismos del cerebro humano que posibilitan tal hazaa. La idea es restar
pxel a pxel una de otra y sumar las diferencias, el resultado es un valor que,
cuanto ms se acerca a cero, ms parecidas son las imgenes.

Sin embargo, es una medida no del todo fiable, pues los errores visuales son
percibidos por el ojo humano en mayor medida en funcin del entorno en el
que aparecen, cosa que no se valora con esta herramienta. Tras ver el formato
JPEG, veremos una manera mucho ms visual y entretenida de detectar los
errores mediante la aplicacin Photoshop, capaz de calcular la imagen dife-
rencia, es decir, una resta visual pxel a pxel entre, por ejemplo, una imagen
sin comprimir y su equivalente comprimido, lo que pone en evidencia la in-
formacin perdida en la compresin.

4.2. El JPEG

Comencemos viendo el primer sistemadecodificacindeimagenfija e in-


troduciendo una serie de conceptos que utilizaremos a lo largo de todo el cur-
so. El JPEG es un comit (Joint Photographic Experts Group), no un estndar
de codificacin, que a finales de la dcada de 1980 ide un proceso por el que
una imagen digital poda comprimirse y mantener un compromiso con la ca-
lidad visual. En aquellos aos ya comenzaba a ser necesario algn sistema para
que las imgenes no ocupasen los reducidos espacios de almacenamiento di-
gital existentes en la poca y para poder ser transmitidas por lneas de telefona
CC-BY-NC-ND PID_00176933 31 Conceptos bsicos de vdeo y audio. Introduccin

digital de baja velocidad. En general, el proceso es suficientemente robusto y


de resultados aceptables, en especial con fotografas naturales e imgenes rea-
listas, con lo que se llega a un promedio de compresin de 10:1 con prdidas
imperceptibles visualmente, por eso sigue siendo un formato muy utilizado.

Por primera vez en este curso, hemos de distinguir entre el sistema de codifi- Los metadatos
cacin (cdec) de la imagen, que es JPEG, y el contenedor o formato de fiche-
Son los datos adicionales aso-
ro donde se guardan los datos resultantes de la codificacin, del que hay dos ciados a la imagen como, por
tipos, JFIF y EXIF. As, JPEG/JFIF es el formato clsico, mientras que JPEG/EXIF ejemplo, la fecha y hora de la
captura, la velocidad del obtu-
posibilita aadir metadatos. En la actualidad, algunos mviles con cmara y rador, el nombre de la cmara
o los datos de configuracin.
GPS integrados aaden la longitud y latitud en la que una foto fue tomada.
Nuestro inters se centra en el cdec.

El JPEG puede trabajar en varios modos diferentes, aunque slo vamos a de-
tallar dos modos conprdidas: el ms utilizado, el modosecuencial, con el
que introduciremos varios conceptos de codificacin relevantes en cada paso
del proceso de codificacin, y el modoprogresivo.

4.2.1. El modo secuencial

Un esquema general de los diferentes pasos que se realizan en este modo se-
cuencial es el siguiente:

Esquema general de los pasos en el modo secuencial

1)Paso1:cambiodeespaciodecolorysubmuestreodelcolor
CC-BY-NC-ND PID_00176933 32 Conceptos bsicos de vdeo y audio. Introduccin

Si la imagen es RGB, en primer lugar se transforma a YUV. Como ya vimos al Reducir el nmero de
principio de este mdulo, dado que el ojo humano tiene menor resolucin de pxeles

color, las imgenes U y V se submuestrean y as reducen su nmero de pxeles. La reduccin se realiza en pro-
La imagen Y (blanco y negro) se mantiene inalterada. porcin 4:4:4, 4:2:2 o 4:2:0 en
funcin de la calidad elegida.

2)Paso2:divisinenbloquesysecuenciado

Cada uno de los tres componentes se comprime por separado y se divide en


bloques de 8x8 pxeles. As, cada componente se convierte en una secuencia de
bloques, comenzando por el de la esquina superior izquierda y acabando con
el de la esquina inferior derecha. A partir de este punto, el proceso se ejecuta
de forma individual por cada bloque.

3)Paso3:codificacindecadabloque

Cada bloque de imagen de 8x8 pxeles se transforma matemticamente en otro Bloques de pxeles
bloque de 8x8 valores (tambin enteros) que ya no representan una pequea
Los pxeles son de valor entero
imagen sino las frecuenciasespaciales de sta. El bloque, pues, contiene la de 0 a 255, pero en este punto
misma informacin que tena pero con otros valores: un puro ejemplo de co- se le resta a cada uno 128 pa-
ra que estn en el margen de
dificacin. Y sin prdidas hasta este punto, pues podramos realizar el proceso 128 a 127. Esta curiosa opera-
cin previa a la codificacin se
inverso y recuperar exactamente la pequea imagen original. explica en el paso siguiente.

La transformacin utilizada se denomina DCT (discrete cosinus trans-


form) y es la base de la compresin de imagen y vdeo hoy en da.
CC-BY-NC-ND PID_00176933 33 Conceptos bsicos de vdeo y audio. Introduccin

4)Paso4:cuantificacindecadabloque

Si ambos bloques contienen la misma informacin, por qu buena parte de


los valores o coeficientes del segundo bloque son de valor muy reducido, in-
cluso nulo, respecto a los restantes? ste es el quid del proceso: la transfor-
macin DCT compacta la informacin asociada a la imagen en los primeros
coeficientes (situados cerca de la esquina superior izquierda), con lo que nos
posibilitara eliminar buena parte del resto con valores nulos o de bajo valor
(indicados en rojo en la imagen adjunta) y reducir el nmero total de coefi-
cientes que representan el bloque.

Pero qu criterio elegir para eliminar los coeficientes pequeos? Y qu quiere


decir pequeo? Para automatizar la seleccin de los coeficientes por eliminar
en cada bloque de una manera razonable, se utiliza una tabla de referencia
denominada decuantificacin, que contiene 8x8 valores de peso o pondera-
cin, definida tras muchas pruebas de calidad subjetiva realizadas con grupos
de observadores. Esta tabla contiene pesos pequeos en las posiciones cerca-
nas a la esquina superior izquierda y pesos crecientes cuanto ms lejanos estn
de sta. Cada coeficiente de la imagen transformada se divide por el peso que
le corresponde por posicin, de manera que los alejados de la esquina supe-
rior izquierda quedan divididos por pesos elevados y dan resultado cero (se
desprecian los decimales).

Ejemplo

Veamos un ejemplo de tabla de cuantificacin utilizada en JPEG (Losheller):

16 11 10 10 24 40 51 61
CC-BY-NC-ND PID_00176933 34 Conceptos bsicos de vdeo y audio. Introduccin

12 12 14 19 26 58 60 55

14 13 16 24 40 57 69 56

14 17 22 29 51 87 80 62

18 22 37 56 68 109 103 77

24 35 55 64 81 104 113 92

49 64 78 87 103 121 120 101

72 92 95 98 112 100 103 99

Si hicisemos la transformacin inversa, denominada IDCT, para recuperar el


bloque de imagen original a partir del bloque transformado y cuantificado,
elefectovisualdelaprdidadecoeficientesesmnimo. En el ejemplo si-
guiente, hay que descartar que los indicados en rojo no afectan sensiblemente
al resultado destransformado.

Sin duda, almacenar en un fichero los coeficientes trasformados que nos in-
teresan en vez de todos los pxeles originales dara una buena tasa de com-
presin. Si adems descartamos aquellos que tienen valor despreciable, la tasa
mejora sensiblemente al minimizar el efecto visual de las prdidas introduci-
das cuando se invierte la transformacin y se recupera la imagen. Adems, la
DCT no necesita de un procesador potente de clculo y se puede ejecutar en
hardware sencillo. Sin embargo, el proceso de compresin JPEG an no ha
acabado.
CC-BY-NC-ND PID_00176933 35 Conceptos bsicos de vdeo y audio. Introduccin

Hagamos una pausa en el proceso de explicacin y razonemos las siguientes


cuestiones:

a)CmoesposiblequelaDCThagainsensiblevisualmentelaelimina- Potencia de clculo en la


cindebuenapartedelos64valores? Tras aos de pruebas y comparativas dcada de 1980

con todas y cada una de las transformaciones conocidas, la DCT es la que me- El 80386 de Intel era el pro-
jor condensa lo importante en menos datos sin necesidad de mucha poten- cesador del momento hasta
1989.
cia de clculo (factor que en los aos ochenta era crtico). Hay transformacio-
nes mejores, pero todas necesitan clculo intenso superior, como por ejemplo
JPEG2000, que veremos ms adelante en este mismo mdulo.

b)Qusignificavisualmentecadaunodelos64coeficientes? Tal como


se ha indicado, estos datos generados por la DCT representan frecuencias es-
paciales, es decir, cada coeficiente, por s solo, generara un bloque de imagen
simple correspondiente a una oscilacin visual.

La imagen que tenis en el margen es un resumen del tipo de bloque de ima-


gen generado por cada coeficiente en funcin de su posicin en el bloque
transformado. Por ejemplo, el coeficiente que se ubica en la esquina superior
izquierda genera por s solo un bloque de imagen de 8x8 pxeles como el in-
dicado en esa misma esquina, un bloque visualmente homogneo. El segun-
do coeficiente genera un bloque de imagen de 8x8 pxeles similar a una onda
horizontal de medio periodo, el tercero una onda horizontal de un periodo y
as sucesivamente.

Ejemplo completo de la imagen generada por


Pues bien, cualquier fragmento de fotografa en blanco y negro de 8x8 pxeles cada coeficiente por separado

que se elija puede representarse como una suma de estos 64 bloques debida-
mente ponderados (multiplicados) por un valor. Si se tuviese tiempo (aos)
y paciencia, se podran ir probando sumas de estos bloques debidamente am-
plificados cada uno por un valor a nuestra eleccin. El da que consiguisemos
la suma perfecta que reprodujese exactamente el fragmento de fotografa, des-
cubriramos que los 64 valores seleccionados coinciden con los generados por
la sencilla DCT.

El primer coeficiente del bloque es el peso o valor de la frecuencia cero que


denominados componente de continua o baja frecuencia (visual) y que,
como podis ver, recrea el valor medio de brillo de todo el bloque y genera
por s solo un bloque visual de 8x8 homogneo. As, si borrsemos todos los
componentes del bloque salvo ste y aplicramos la transformada inversa pa-
ra volver a tener un bloque de imagen, tendramos lo que denominamos un
efecto mosaico.

Imagen codificada slo


con los tres primeros
componentes de cada
bloque
CC-BY-NC-ND PID_00176933 36 Conceptos bsicos de vdeo y audio. Introduccin

El ojo humano es muy sensible a este valor medio y se percata de cualquier


error en este valor, de tal manera que cualquier variacin que hubiese entre
dos cuadros consecutivos genera un efecto mosaico. Por ello, el JPEG mima el
valor de este coeficiente como ningn otro, tal como vamos a ver en el paso
siguiente.

Los 63 coeficientes restantes se denominan de alterna o alta frecuencia y


son responsables de las variaciones de brillo a partir de este nivel de base. Los
bloques de imagen con mucho detalle visual, al aplicrseles la DCT, tienen
muchos coeficientes de este tipo con gran valor, mientras que los bloques de
poco detalle al contrario.

c)Calidaddeimagenytablasdecuantificacin

Cuando se desea codificar una imagen en formato JPEG, el software (por ejem-
plo, Photoshop) pregunta el nivel de calidad que deseamos mantener de la
imagen original en la nueva imagen JPEG. Usualmente es un parmetro cuan-
titativo (como un valor de 0 a 10 o de 0 a 12, incluso un porcentaje de 0 a
100%) y el primero es la peor calidad y mxima compresin, mientras que
el ltimo es la mxima calidad y mnima compresin. En otras ocasiones, po-
sibilita seleccionar la calidad o compresin mediante valores cualitativos (de
menor a mayor detalle), como por ejemplo en las configuraciones de las c- Opciones de compresin JPEG de Photoshop

maras digitales.

Cuadro comparativo de las compresiones JPEG sobre una misma imagen


CC-BY-NC-ND PID_00176933 37 Conceptos bsicos de vdeo y audio. Introduccin

Este parmetro de calidad seleccionado por el usuario est ntimamente ligado


a la tabla de cuantificacin que debemos aplicar para eliminar los coeficientes
de alta frecuencia de todos los bloques transformados de la imagen por codi-
ficar. As, a mayor valor de calidad, los valores de la tabla de cuantificacin
se reducen, por lo que la divisin da un resultado mayor y sobreviven ms
coeficientes de alta frecuencia. Cuando la calidad es mxima, los valores de la
tabla de cuantificacin son todos 1 y no teniendo ningn efecto.

Tambin el valor de calidad puede hacer seleccionar al codificador utilizar tc-


nicas de submuestreo de color 4:2:2 o 4:2:0 para reducir sensiblemente el n-
mero de bloques de color, lo que mejora la compresin sin necesidad de nin-
guna accin por parte del usuario.

5)Paso5:codificacindeloscoeficientes

Si bien los 64 coeficientes son enteros, en este paso se convierten a binario y


se almacenan en fichero mediante una codificacin que reduce la necesidad
de bits para su almacenamiento. Como el coeficiente de continua es tan im-
portante, se trata con una codificacin especfica.

En primer lugar, se ordenan siguiendo un orden en zigzag establecido. A con-


tinuacin, se codifican de la siguiente manera:

Coeficiente de baja frecuencia: guardar la diferencia entre dos valores


ocupa casi siempre menos espacio que guardar los dos valores, siempre y
cuando estos valores sean parecidos. Es lo que se denomina codificacin
diferencial(DPCM) y se aplica al coeficiente de continua de cada bloque:
como en la mayora de imgenes el valor medio de un bloque es usual-
mente similar al del bloque inmediatamente anterior, se almacena el valor
El camino en zigzag de ordenacin de los
coeficientes
del primero y posteriormente las diferencias de cada uno con el siguiente
coeficiente de continua. Si adems se almacena en el fichero JPEG antes
que el resto de coeficientes, tendremos la imagen mosaico de manera in-
mediata como vista preliminar de sta.

Coeficientesdealtafrecuencia: en la ristra secuencial de valores genera-


da por la ordenacin en zigzag aparecen usualmente muchos valores repe-
tidos, la mayora ceros, por lo que se aplican tcnicas de compresin que
aprovechen esta caracterstica (Huffman).

Segn como se almacenen en el fichero los componentes de color, se habla de


componentesentrelazados (donde se van almacenando los bloques de lumi-
nancia y de color alternativamente) o noentrelazados (primero se almacenan
los de luminancia y luego los de color).
CC-BY-NC-ND PID_00176933 38 Conceptos bsicos de vdeo y audio. Introduccin

Descodificacin de una imagen JPEG

El fichero JPEG posee toda la informacin necesaria para recuperar la


imagen comprimida segn el valor de calidad con el que se gener, ya
que no slo incluye los coeficientes transformados de todos los bloques,
sino la informacin necesaria para recuperarlos a partir de sus versiones
codificadas, el valor de calidad seleccionado y la tabla de cuantificacin
seleccionada para eliminar elementos.

Actividades

Actividad12

Vamos a comprimir una imagen en formato JPEG mediante Photoshop para su efecto
en la calidad de la imagen y en el tamao del fichero resultante. Para ello, abrid la apli-
cacin y leed una imagen, a continuacin mediante Archivo-Guardar como seleccionad
un nuevo nombre y como formato de grabacin elegid JPEG (*.JPG, *.JPEG, *.JPE, las
tres extensiones habituales que se aaden al nombre del fichero). Tras aceptar, aparece
la siguiente ventana, donde se pregunta la calidad visual en la que se desea comprimirla
(un valor de 0 a 12). Por ahora, mantened como opcin el modo baseline (estndar) del
que se hablar en el siguiente apartado.

Tras aceptar, el Photoshop almacenar el fichero comprimido. Visualizad el resultado y


mediante el sistema operativo que se use (Windows, OSX) tomad nota del tamao en
Kbytes del fichero resultante. Podis calcular sencillamente el factor de compresin.

Actividad13

Como os percatis, el factor de compresin puede dar una idea aproximada del resultado,
pero no es til si se desea descubrir realmente dnde se est generando la prdida de
informacin visual. Para ello, se puede crear una imagen diferencia que sea la resta pxel
a pxel entre la imagen sin comprimir y la comprimida, en este caso, en JPEG.

Abrid el Photoshop, leed la imagen original y leed tambin la imagen comprimida (acon-
sejamos elegir una imagen comprimida en un factor de 4 a 6, as los errores sern ms
evidentes).
CC-BY-NC-ND PID_00176933 39 Conceptos bsicos de vdeo y audio. Introduccin

A continuacin, seleccionad con un clic la imagen original sin comprimir y mediante


CTRL-J (Windows) o COMMAND-J (Mac) duplicad su capa Background en la paleta de
capas. El resultado son dos capas: la capa Background (o Fondo) original abajo y una copia
que el Photoshop denomina Layer 1 (o Capa 1 en funcin del idioma del programa).

Ambas capas son idnticas, como demostracin presentaremos la imagen diferencia: se


puede avanzar que, si ambas son iguales, la diferencia entre pxeles correspondientes
ser 0, con lo que todos los pxeles de la imagen diferencia sern de valor 0, es decir,
totalmente negros. En el desplegable de la ventana de capas, elegid Diferencia:
CC-BY-NC-ND PID_00176933 40 Conceptos bsicos de vdeo y audio. Introduccin

Tal como era previsible, la imagendiferencia aparece totalmente negra.

Seamos escpticos y confirmad que es as de una manera ms explcita; para ello, selec-
cionad la herramienta de ajuste y, de las opciones existentes, elegid Levels (Niveles).
CC-BY-NC-ND PID_00176933 41 Conceptos bsicos de vdeo y audio. Introduccin

Activar una ventana de dilogo donde se refleja el histograma de la imagen diferencia.


Es tan estrecho porque todos los pxeles son del mismo valor, no se distribuyen en otros
valores ms que el cero.

Una vez demostrada que la imagen diferencia entre dos imgenes iguales es negra, borrad
Layer 1 (Capa 1) seleccionndola con un clic en la ventana de capas y pulsando la papelera
situada en esa misma ventana.
CC-BY-NC-ND PID_00176933 42 Conceptos bsicos de vdeo y audio. Introduccin

Ahora que se sabe cmo realizar una imagen diferencia y que hemos vuelto al punto de
partida, volved a ejecutar la operacin pero con las dos imgenes que an estn abiertas
en el Photoshop. Seleccionad la herramienta Mover en la barra de herramientas, pulsad
el ratn sobre la imagencomprimida sin soltarlo, arrastrad el ratn hasta la imagen sin
comprimir, pulsad y mantened la tecla MAYUS y finalmente soltad el ratn.

Si bien visualmente no parece haber habido ningn efecto, en la ventana de capas se


ver que se ha creado una segunda capa, Layer 1 o Capa 1, que es la imagen comprimida,
mientras que Background o Fondo es la imagen sin comprimir.
CC-BY-NC-ND PID_00176933 43 Conceptos bsicos de vdeo y audio. Introduccin

Ya se tienen ambas imgenes en capas, por lo que se puede volver a ejecutar la operacin
Diferencia (aparecer sta, aproximadamente negra) y a continuacin la herramienta de
capas, eligiendo Niveles:

Casi con seguridad, el histograma ya no ser tan uniforme:

Para poder discernir con claridad los pxeles diferencia, desplazad el gadget blanco hacia
la izquierda y as realzaris visualmente sus valores.
CC-BY-NC-ND PID_00176933 44 Conceptos bsicos de vdeo y audio. Introduccin

De este modo, todos los errores generados por la codificacin con prdidas de JPEG se
reflejan claramente situados en zonas especficas de la imagen, como los bordes de los
objetos y en general las zonas con gran detalle visual.

Realizando el proceso con niveles de compresin ms elevados aparecen igualmente erro-


res en zonas de color homogneo y un claro efecto de bloques en general, intrnsecos a
la manera como el JPEG trabaja la imagen.

4.2.2. Otros modos de trabajo del JPEG

El modo secuencial base explicado es vlido para la mayora de aplicaciones


de tratamiento de la imagen, donde stas poseen 8 bits por cada uno de los
componentes (RGB) e incluso una cuarta capa de transparencia.

Sin embargo, existen otros modos (hasta 44) para aplicaciones especficas. Por
ejemplo, para imgenes de muy alta calidad con 12 bits por componente o
para aplicar otros sistemas de codificacin de coeficientes ms efectivos (codi-
ficacin aritmtica en vez de Huffman).
CC-BY-NC-ND PID_00176933 45 Conceptos bsicos de vdeo y audio. Introduccin

Una versin mejorada del modo secuencial base, el modo secuencial base
optimizado, permite una mejora del 2% al 8% en el tamao del fichero final.
Sin embargo, algunas aplicaciones pueden no ser compatibles con este modo.

Actividad 14
Modo secuencial base optimizado
Visualizad la imagen diferencia en el caso de compresin JPEG en modo Lnea de base
optimizado/Baseline optimized y valorad la diferencia con JPEG Standard/Baseline uti-
lizando la misma imagen original del ejercicio anterior y comprimindola a la misma
calidad. Valorad la calidad visual y el factor de compresin de la resultante.

El tercer modo interesante, el modoprogresivo, muy utilizado para imgenes


de sitios web cuyos servidores tienen conexiones de baja velocidad o tienden
a estar muy saturados, posibilita ver una imagen mosaico (es decir, la imagen
con slo el coeficiente de continua de cada bloque) y sus sucesivas mejoras de
calidad en funcin del orden de recepcin de los datos, por lo que el especta-
dor puede tener vistas parciales cada vez ms detalladas de la imagen que va
recibiendo. Hay varias maneras de implementar esta solucin, aunque la ms
generalizada es almacenar en el fichero JPEG en primer lugar los coeficientes Modo progresivo

de continua y los primeros coeficientes de alterna de todos los bloques, luego


coeficientes de alterna de menor relevancia visual (mayor detalle) y despus
de relevancia an menor (y ms detalle). El proceso suele realizar tres, cuatro
o cinco fases de separacin de los coeficientes. Un fichero JPEG en modo pro-
gresivo tiene normalmente un tamao en bytes superior al de su equivalente
en modo secuencial o secuencial optimizado.

Actividad 15

Realizad el ejercicio anterior eligiendo en este caso el modo Progresivo/Progressive con


cuatro lecturas. Mediante un navegador o programa de visualizacin, abrid el fichero de
imagen generado y comprobad que se visualiza con una mejora gradual.

Para finalizar, el modoJPEG-LS (lossless JPEG, JPEG sin prdidas) es un mo-


do creado unos aos ms tarde (1993) que codifica la imagen sinprdidas.
Utiliza una DCT para codificar, pero no utiliza tablas de cuantificacin, sino
que calcula previsiones de los pxeles a partir de sus pxeles vecinos. Destinado
a aplicaciones mdicas de imagen, consigue unos factores de compresin de
2:1, sin tener relevancia fuera de este campo.

4.3. JPEG 2000

Una dcada ms tarde de la aparicin del JPEG, el escenario haba cambiado


sensiblemente: se haban investigado con xito nuevas transformaciones que
superaban la clsica DCT, aunque obligaban a un clculo intensivo, pero la
capacidad de clculo de los equipos domsticos y profesionales quintuplicaba
el de diez aos antes, lo que haca factible un nuevo formato de codificacin
que diese respuesta a las nuevas exigencias del mercado, entre otras:

la codificacin con prdidas o sin prdidas,


el alto factor de compresin con menores artefactos visibles,
CC-BY-NC-ND PID_00176933 46 Conceptos bsicos de vdeo y audio. Introduccin

la robustez contra errores para poder transmitir a baja velocidad, por ejem-
plo,
la capacidad de aadir datos adicionales o metadata,
la mejor codificacin de imgenes sintticas o bitono.

Lamentablemente, la situacin legal del formato JPEG2000 fue siempre con- Problemas legales con
trovertida, ya que existen patentes sobre partes del proceso, lo que ha frenado JPEG 2000

desde el principio su popularizacin. Buena parte del software de


tratamiento de imgenes no
lo incluye o lo hace opcional-
El JPEG da calidades subjetivas de imagen muy bajas en compresiones meno- mente, como el Adobe Pho-
toshop. En el caso de formatos
res de 0,25 bpp, donde el JPEG2000 an puede dar calidad incluso hasta en de compresin sin prdida, ac-
tualmente PNG es el ms ex-
0,1 bpp. Y en los rangos de compresin habituales, este nuevo sistema de co- tendido.
dificacin supera al JPEG.

El secreto es la transformacin Wavelet, que tratalaimagencomountodo


(no la descompone en bloques), le aplica varios filtros espaciales y aprovecha
de manera muy eficiente la codificacin de los resultados. Segn los filtros
que se utilicen, esta transformacin puede ser sinprdidas o conprdidas,
en este ltimo caso mejora la compresin a costa de algn efecto visual en los
contornos (la alta frecuencia espacial).

As, si el JPEG2000 es capaz de comprimir con calidad a mayor tasa, es mejor


para transmitir imagen a baja velocidad. Como adems el tipodedescodifi-
cacinesprogresivo, la imagen recibida se descodifica a partir de una primera
versin bsica (baja frecuencia espacial) que va mejorando en detalle, perfecto
para transmisin: si se interrumpe en cierto momento, al menos tendremos
una imagen completa parcialmente detallada.

El estndar posibilita incluir datos adicionales (metadata) en el fichero de ima-


gen. El JPEG ya lo posibilitaba en su formato EXIF, pero el JPEG2000 lo hace
de manera ms estandarizada siguiendo el formato XML.

Actividad 16

El Photoshop lee y graba en formato JPEG2000 (extensiones *.JPF, *.JPX, *.JP2, *.J2C y
*.JPC) aceptando una configuracin personalizada en cada grabacin, que destaca si se
desea una compresin "sin prdidas/lossless" en una calidad indicada por un valor de 0
a 100.

Realizad algunas compresiones con este formato en modo con prdidas y probad el for-
mato sin prdidas, as valoraris el nivel de compresin logrado en el mbito del tamao
de fichero.
CC-BY-NC-ND PID_00176933 47 Conceptos bsicos de vdeo y audio. Introduccin

Opciones de codificacin con o sin prdidas de JPEG2000

4.4. JPEG XR

En el 2006, Microsoft introdujo un cdec propietario de imagen inicialmente


denominado HD Photo y dirigido exclusivamente al sector de la fotografa di-
gital que desde el 2009, ao en el que se convirti en estndar ISO, es conoci-
do como JPEG XR (Extended Range). La extensin de los ficheros de imagen
es .wpd.
CC-BY-NC-ND PID_00176933 48 Conceptos bsicos de vdeo y audio. Introduccin

Sus caractersticas principales son las siguientes:

codificacin con prdidas o sin prdidas,


decodificacin progresiva,
mejor compresin que el JPEG,
un abanico de formatos amplio: 8, 16 o 32 bits por canal de color, los pxe-
les pueden tener valor entero o incluso flotante para adaptarse a cmaras
fotogrficas de rango dinmico muy alto y un formato en blanco y negro
de 16 bits,
el formato contenedor puede incluir metadata y un canal alfa,
no est destinado a ser utilizado en imgenes sintticas o con bitonos (tex-
to o grficos).

Si bien este formato slo est soportado por Windows desde su versin Vista
y existen algunos plugins comerciales (por ejemplo para el Adobe Photoshop
ofrecidos por Microsoft), su avance es lento frente al estndar abierto de ima-
gen DNG (Adobe, 2004). La liberacin del JPEG XR en el 2010 por parte de
Microsoft podra darle una posibilidad de xito al facilitar su uso en aplicacio-
nes de cdigo abierto.

4.5. Tendencias futuras de la codificacin de imagen

A mediados de la dcada de 1980, el matemtico Michael Barnsley present


la base de un sistema de compresin de imgenes con prdidas basado en
fractales que gener gran expectacin.

Un fractal es un elemento sencillo que, iterado sobre s mismo repeti-


das veces, genera un nuevo elemento complejo. La idea de Barnsley es
generar una imagen original a partir de un elemento visual bsico me-
diante iteraciones. As, slo se debera almacenar o transmitir el frac-
tal o grupo de fractales, no la imagen. Incluso es posible reconstruir la
imagen original a resoluciones superiores a las de partida con muy poca
capacidad de clculo.

Sin embargo, el problema principal reside en cmo encontrar de manera au-


tomtica el elemento visual bsico (o el conjunto de elementos bsicos) que
pudiese lograrlo. La necesidad de una gran capacidad de clculo para conse-
guir deducirlos y la falta de un algoritmo eficiente para todo tipo de imgenes
ha frenado hasta la fecha este sistema de compresin, aunque la investigacin
sigue abierta incluso para su aplicacin en vdeo.
CC-BY-NC-ND PID_00176933 49 Conceptos bsicos de vdeo y audio. Introduccin

Resumen

Se han descrito los diferentes mecanismos de transporte de imagen y sonido


para su captura, se han diferenciado los analgicos de los digitales y, de entre
ellos, los de entorno puramente informtico y se ha valorado la calidad con-
seguible en cada uno de ellos. En esta visin, se han introducido los conceptos
de luminancia y crominancia, base de los sistemas de compresin de imagen
y vdeo actuales.

Hemos tenido un primer contacto con la problemtica de la transmisin de


vdeo y audio digital a travs de Internet, hemos valorado los problemas de
retraso y prdidas que puedan ocasionarse y hemos demostrado la existencia
de la compresin en todo sistema de almacenamiento en archivos multimedia.

Describimos a continuacin el sistema de codificacin de imagen esttica


JPEG, sus fases de trabajo, los parmetros que la configuran y los diferentes
modos. Este caso nos posibilita diferenciar entre los conceptos de codificacin
y compresin y nos ilustra algunas maneras de valorar tanto la compresin
conseguida como los errores introducidos en el caso de compresin con pr-
didas. Finalmente, damos una visin superficial de los estndares JPEG2000 y
JPEG XR, al compararlos con el estndar original.

Das könnte Ihnen auch gefallen