Sie sind auf Seite 1von 8

COMPRESIN DE IMGENES EN MOVIMIENTO (MPEG)

Con el desarrollo de la compresin de imgenes fijas se vio la necesidad de almacenar y reproducir


imgenes en movimiento; es as que en el ao de 1990 llevaron a ISO a formar un grupo denominado
MPEG (Motion Pictures Experts Group), creando el estndar ISO/IEC 11172. El objetivo principal era
permitir que el almacenamiento en CD-ROM o CD-I (de una sola velocidad) de vdeo en directo y sonido
estreo, lo que implic una tasa de bits mxima de 1,5 Mb /s. [1]
A partir del desarrollo de este estndar se crea el estndar MPEG 1, publicado en Noviembre de 1992 la
cual consiste en 3 partes

Sistema MPEG-1 (ISO / IEC 11172-1): define la estructura mltiplex MPEG-1


Video MPEG-1 (ISO / IEC 13818-2): define la codificacin de vdeo MPEG-2;
Audio MPEG-1 (ISO / IEC 13818-3): define la codificacin de audio en MPEG-2.

SI embargo el estndar MPEG 1 no era adecuado para el ancho de banda de las aplicaciones; adems no
tuvo en cuenta factores como codificacin de imgenes entrelazadas, televisin de alta definicin. Se crea
en el ao de 1994 un mejoramiento denominado MPEG 2 que se divide en 3 parte al igual

Sistema MPEG-2 (ISO / IEC 13818-1): define la estructura mltiplex MPEG-2


Video MPEG-2 (ISO / IEC 13818-): define vdeo MPEG-2 de codificacin;
Audio MPEG-2 (ISO / IEC 13818-3): define la

1.

Principios de MPEG-1

Con MPEG-1, el objetivo principal es llegar a una calidad media de video con una tasa de bits
constante de 1.5 Mbps.

Se destina 1.15 Mbps para el video y la capacidad restante (350 Kbps) es utilizada por el audio,
y datos adicionales que requiere el sistema; pero esto puede ser flexible tomando en cuenta la
tasa de compresin y calidad requerida, as como la complejidad del codificador.

Utiliza los mismos principios de prdida que JPEG, al que se agregan nuevas tcnicas
(prediccin con compensacin de movimiento) para formar el toolbox MPEG-1, aprovechando
la fuerte correlacin entre imgenes sucesivas y reduciendo as la cantidad de informacin.

La decodificacin se realiza en tiempo real mediante hardware especializado. La codificacin


puede realizarse en varias pasadas si no es en tiempo real, pero si la calidad es importante se
requiere hacerlo en tiempo real.

1.1. Tipos de imgenes MPEG


MPEG define tres tipos de imgenes que estn dispuestas como se muestra en la Figura 5.

Fig. 1. Concatenacin de los tres tipos de imgenes en MPEG. [1]

imgenes I (intra), Son el punto de entrada esencial para una secuencia de video debido a que se
codifican sin referencia a otras imgenes, por lo tanto su tasa de compresin es relativamente
baja.

imgenes P (prevista), Se codifican a partir de la imagen I o P precedente (tcnicas de


prediccin con compensacin de movimiento) y se pueden utilizar como base para la prxima
prediccin. No se puede ampliar demasiando el nmero de estas imgenes debido a que la
compensacin no es perfecta. Tiene una tasa de compresin significativamente mayor que una
imagen I.

Imgenes B (bidireccional o bidireccionalmente predicha), Se codifican mediante interpolacin


bidireccional entre la imagen I o P que precede y sigue y no propagan errores de codificacin ya
que no se utilizan para codificar otras imgenes. Tienen alta tasa de compresin.

Existe tambin un cuarto tipo de imagen (D) utilizadas para navegar rpidamente dentro de una secuencia
de vdeo.

1.2. Parmetros M y N
Se utilizan los parmetros M Y N para una sucesin de imgenes tal como se muestra en la figura 6.

M es la distancia (en nmero de imgenes) entre dos imgenes P sucesivas.

N es la distancia entre dos imgenes I sucesivas, conocida como "grupo de imgenes (GOP)".

Fig. 2. Ejemplo de un grupo de imgenes (GOP) MPEG para M=3 y N=12.

1.3. Descomposicin en capas de una secuencia de video MPEG


MPEG define una jerarqua de capas dentro de una secuencia de vdeo, como se muestra en la Figura 7.

Fig. 3. Jerarqua de las capas de video MPEG.

Cada una de estas capas tiene funciones especficas en el proceso de MPEG. Comenzando desde el nivel
superior las capas sucesivas son:

Secuencia. Es la capa ms alta que define el contexto valido para toda la secuencia (parmetros
bsicos de video, etc.).

Grupo de Imgenes (GOP). Esta es la capa que determina el acceso aleatorio a la secuencia que
siempre inicia con una imagen I. En el ejemplo anterior (M=3 y N=12), el GOP se compone de
12 imgenes.

Imagen. Unidad de visualizacin elemental, que puede ser de uno de los tres tipos (I, P o B).

Porcin (slice). Es la capa para el direccionamiento intra-frame y (re) sincronizacin, por


ejemplo para recuperacin de errores. Se define como un conjunto de macro-bloques contiguos.
El conjunto de porciones cubren toda la imagen sin superposiciones entre diferentes
porciones. El tamao de una porcin puede tericamente variar de un macro-bloque a la
imagen completa, pero a menudo es una fila completa de macro-bloques.

Macro-bloque. Esta es la capa usada para el movimiento estimacin/compensacin. Un macrobloque tiene un tamao de 16 x 16 pixeles y est formada de cuatro bloques de luminancia y dos
bloques de crominancia (Uno Cr y uno Cb) que cubren la misma rea. Fig. 8

Fig. 4. Composicin de un macro-bloque

Bloque. Al igual que en JPEG, una imagen se divide en bloques de 8 x 8 pixeles. El bloque es la
capa donde la DCT toma lugar.

1.4. Prediccin, estimacin de movimiento y compensacin


Hemos indicado antes que las imgenes P y B fueron predichas de imgenes anteriores y/o siguientes.
Ahora veremos cmo.

En una secuencia de imgenes en movimiento, los objetos en movimiento conducen a


diferencias entre las zonas correspondientes de imgenes consecutivas, de manera que no hay
una correlacin obvia entre estas dos zonas.

La estimacin de movimiento consiste en la definicin de un vector de movimiento que


asegura la correlacin entre una zona de llegada en la segunda imagen y una zona de salida en la
primera imagen, usando una tcnica conocida como bloque de adaptacin (block matching).

Esto se hace a nivel de macro-bloque (16 x 16 pixeles) moviendo un macro-bloque de la imagen


actual dentro de una pequea ventana de bsqueda de la imagen anterior, y comparndolo con
todos los macro-bloques posibles en la ventana con el fin de encontrar el que ms se asemeja. La
diferencia en la posicin de los dos macro-bloques agrupados da un vector de movimiento
(Figura 9) que se aplicar a todos los tres componentes del macrobloque (Y, Cb, Cr).

Fig. 5. Ilustracin de la compensacin de movimiento

En la comparacin de una imagen P y una imagen I, o dos imgenes P, debido a la distancia


temporal entre estas imgenes (tres imgenes en el caso de M = 3, N = 12), el bloque de
adaptacin generalmente no es perfecto y los vectores de movimiento pueden ser de amplitud
relativamente alta.

Es por ello que la diferencia (o error de prediccin) entre el bloque actual a ser codificado y el bloque de
adaptacin se calcula y se codifica en una manera similar a los bloques de las imgenes I (DCT,
cuantificacin, RLC / VLC). Este proceso se denomina compensacin de movimiento.

Para imgenes B, los vectores de movimiento se calculan por la interpolacin temporal de la


siguiente imagen P de tres maneras diferentes (hacia adelante, hacia atrs y bidireccional); el
resultado con el error de prediccin ms pequeo se retiene y el error se codifica de la misma
manera que las imgenes P. Solo los macro-bloques que difieren de las imgenes usadas para
la prediccin tendrn que ser codificados.

2.

Codificacin de MPEG-2 (Aplicacines de Broadcast)

MPEG-2 es ms complejo que su versin 1, se define como un superconjunto de herramientas de


compresin ya que utiliza todas las herramientas de MPEG-1 y aade algunas nuevas.
MPEG-2 tambin fue diseado para decodificar MPEG-1 lo cual lo hace compatible con la informacin
codificada en MPEG-1..

2.1. Niveles y perfiles de MPEG-2


El estndar MPEG-2 define 4 niveles en cuanto se refiere a la resolucin de la imagen, que van desde SIF
a HDTV, y 5 perfiles que determinan la herramienta para usar en la compresin, la compresin que se use
est entre la tasa de compresin y el costo del decodificador.

Fig. 6. Niveles y perfiles MPEG-2

Fig. 7. Perfiles y Niveles MPEG-2

Los niveles bajos corresponden a SIF resolucin usada en MPEG-1, mientras que los niveles altos estn
dirigido para HDTV y su optimizado para pantallas grandes de HDTV.
En cuanto a los perfiles tenemos:
-

Perfil simple: este fue hecho para simplificar el codificador y decodificador, claro reduciendo la
velocidad de bits, ya que no hace utilizacin de la prediccin bidireccional (Imgenes B).

Perfil principal: este es la mejor combinacin entre compresin de tasa de bits y el coste de
codificacin, ya que utiliza tres tipos de imagen (I, P, B), pero conduce a un codificador y
decodificador ms complejo.

Perfil escalable: permitirn la transmisin de una imagen bsica de calidad en trminos de


resolucin espacial, precisin de cuantificacin, informacin alta en la cual permite que las
caractersticas sean mejoradas. Esto se puede utilizar por ejemplo para transmitir la misma
imagen en una resolucin bsica en decodificadores estndares y alta resolucin en
decodificadores HD espacial, alternativamente dependiendo de la recepcin se escoger la
resolucin.

Perfil alto: definido para aplicaciones de broadcast HDTV en formatos 4:2:0 o 4:2:2.

Estos perfiles tienen compatibilidad ascendente entre ellos.


De los perfiles antes mencionados el de mayor aplicacin sobretodo en Europa, es el perfil principal
codificacin de imgenes entrelazadas en 4:2:0 con una resolucin de 720 x 480 a 30Hz o 720x576 a
25Hz, el cual puede contener codificacin de imagen B,I,P. Dependiendo del compromiso entre la tasa de
bits y la calidad de la imagen y de la naturaleza de las imgenes a transmitirse, la tasa de bits estar
generalmente entre 4 Mb/s y 9 Mb/s.

Si excluimos los niveles y perfiles, la principal novedad de MPEG-2 en comparacin con MPEG-1 es el
procesamiento de imgenes entrelazadas, que introduce cierta complejidad y ciertos modos especficos.
2.2. MPEG-2 MODOS DE IMAGENES
La secuencia temporal de la posicin vertical de las lneas de pertenencia a campos sucesivos en un
sistema entrelazado:

Fig. 8.

Divisin de la imagen en lneas

Progresivo: es el mtodo de exploracin secuencial de las lneas de una imagen de televisin, un barrido
sucesivo de una lnea despus de otra que efectan los aparatos reproductores de televisin para
componer la imagen, es el ms adecuado para casos en los que hay poco movimiento entre dos sucesivos
campos.

Fig. 9. Escaneo progresivo

Normalmente utilizada en sistema de TV digitales, se compensa el parpadeo, utilizando una frecuencia de


refresco de 100 Hz. En el televisor, una memoria digital almacena el campo y, al cabo de 1/50 de
segundo, lo transfiere a una velocidad de 1/100 segundo, y as sucesivamente. Por tanto, en la pantalla se
visualizan los campos a una velocidad de refresco de 100 Hz. Algunos procesadores de memoria toman
en consideracin las lneas de ambos campos, con el fin de incrementar la resolucin vertical de la
imagen.
Entrelazado: consiste en analizar cada cuadro de la imagen en dos semicuadros iguales denominados
campos, de forma que las lneas resultantes estn imbricadas entre si alternadamente por superposicin.
Uno de los campos contiene las lneas pares; se lo denomina campo par, mientras que el otro contiene
la impares y se lo denomina campo impar al comienzo de cada uno de ellos se sita el sincronismo
vertical.

Fig. 10. Escaneo entrelazado

Tambin el flujo de MPEG-2 est hecho de una serie de cuadros de imgenes codificadas. Las 3 maneras
de codificar una imagen son: intra-codificada (I), predecible posterior (P), predecible bi-direccional (B).
-

Intra-codificada: un marco que est codificado independientemente de cualquier otro marco.

Predictivo: la trama depende de una trama anterior

Bidireccional: codificacin es dependiente de lo anterior o posterior P marcos.

Fig. 11. Imgenes I,P,B

PEG-2 utiliza 4 niveles que determinan la resolucin y 5 perfiles que determinan el set de herramientas
usadas para la compresin.
En la Figura 10 se muestran los niveles que son: bajo, principal, alto-1440 y alto. As como los
perfiles: Simple, Principal, SNR escalable, espacialmente escalable y alto
emos indicado antes que las imgenes P y B fueron predichas
2.3. ESTANDAR DE VIDEO COMPRESIN MPEG 4.10 (H.264/AVC)
El nuevo estndar de compresin de vdeo MPEG-4,10 es el resultado de la los esfuerzos de un equipo de
vdeo Conjunto (JVT) que incluye miembros de la Codificacin del Grupo de Expertos (VCEG) del UITT y del Movimiento de vdeo Pictures Expert Group (MPEG) de la ISO-IEC, que es la razn por su doble
denominacin (H.264 y MPEG-4.10). El estndar es tambin a menudo referido como H.264 / AVC
(codificacin de vdeo avanzada).
Ofrece un aumento considerable en la eficiencia de compresin sobre MPEG-2 (Una ganancia de al
menos 50%). Esta eficiencia es de particular importancia en vista de la televisin de alta definicin
(HDTV), que en MPEG-2 requiere una tasa de bits de al menos 15 a 18 Mb / s.
Por esta razn, en septiembre de 2004 el consorcio DVB permiti el uso del estndar como alternativa a
MPEG-2 para la televisin por satlite, cable, terrestre, o cualquier otro medio de transmisin de banda
ancha (tales como ADSL).
El estndar H264 / AVC consiste en dos capas: una capa de codificacin de vdeo (VCL), que representa,
en la forma ms compacta posible, el contenido de vdeo; y una capa de abstraccin de red (NAL), que
formatea la representacin VCL en la forma ms adecuada a su destino (Transporte o el almacenamiento).

La capa NAL da formato a los datos producidos por la codificacin en VCL, particularmente a adaptar el
formato de datos de vdeo al soporte de transmisin. VCL (Video Coding Layer) que se ocupa de
representar eficazmente el contenido de vdeo.
Al igual que MPEG2, H.264 es compatible con la codificacin de entrelazado o progresivo imgenes en
formato 4: 2: 0, pero en el caso de H.264, una secuencia puede incluir ambos tipos de imgenes.
La mejora de la eficiencia muy importante de H.264 en relacin con MPEG-2 no es resultado de un
algoritmo revolucionario, es el resultado de adicin de mltiples mejoras relativamente pequeas, si se
toma separadamente.
Entre estas mejoras se tiene:
-

modos de prediccin ms sofisticados, que pueden


imagen y se refieren a un mayor nmero de imgenes sucesivas.

Un nmero entero en la transformada para evitar los errores de redondeo habituales en la DTC y
garantizar un ajuste perfecto.

Una codificacin de entropa adaptativa ms eficiente.

variar

dentro

de

una

La codificacin de entropa es adaptable al contexto y puede utilizar dos modalidades, CABAC (Contextcodificacin aritmtica binaria con adaptacin) y CAVLC (Adaptativa al contexto de codificacin de
longitud variable). CABAC permite en su poseer una reduccin de aproximadamente 10 a 15% de la tasa
de bits requerida de una imagen con una calidad equivalente en comparacin con CAVLC, que es en s
misma significativamente ms eficiente que el VLC habitual de MPEG-2.

Das könnte Ihnen auch gefallen