Sie sind auf Seite 1von 29

Cmo funciona el MP3?

Ursula Molter
Departamento de Matemtica Facultad de Ciencias Exactas y Naturales Universidad de Buenos Aires

Semana de la Matemtica 2010

Digitalizacin por qu y para qu?

La palabra digital hoy ya se incorpor al lenguaje diario. cmaras digitales, telfonos digitales, megapixeles, ancho de banda. La digitalizacin permite una transformacin y procesamiento de la informacin, con grandes benecios. Es aqu donde se necesita la matemtica para desarrollar y fundamentar las tcnicas usadas.

Qu queremos digitalizar?

Las seales que pretendemos digitalizar - con distintos objetivos, incluyen: Seales de Audio: Msica y Voz Video: Imgenes y Televisin Datos: Resonancia Magntica, Electrocardiogramas, Nmeros, Letras, Patentes

Seales de Audio

Consideremos por ejemplo una suite de Bach. Cuando l la escribi, probablemente us lo que se denomina notacin musical. Es evidente que de esta escritura, no se obtiene toda la informacin de una pieza: depende de quin la ejecuta, cmo la interpreta, etc. Matemticamente, esto no es muy preciso.

Cmo digitalizamos a Bach?


1

En primer lugar registramos el sonido con intervalos de tiempo muy pequeos. (muestreo - sampling de la seal analgica.) Cada medicin se cuantica asignndole en forma proporcional un nmero entero positivo en un cierto rango, por ejemplo (de 0 a 512). Cada uno de estos nmeros es ahora convertido a notacin binaria (ceros y unos). Estos nmeros binarios agrupados consecutivamente forman una sucesin de ceros y unos, que es lo que llamamos, la seal sonora digital en contraposicin a la seal analgica.

En este proceso de digitalizacin slo se registr informacin en determinados instantes de tiempo equiespaciados. El resto de la seal aparentemente se ha perdido.

Teorema del Muestreo


Cmo hacemos para entonces escuchar toda la msica? Usamos la matemtica! El Teorema de muestreo de Shannon, dice que para conocer el valor de una funcin o seal f (cuyo rango de frecuencias est limitado) basta con conocerla en algunos instantes equi-distribuidos. O sea, si conozco . . . , f (1/B ), f (0/B ), f (1/B ), f (2/B ), . . . entonces puedo averiguar cunto vale f en cualquier valor. Cmo? Lo que prob C.E. Shannon es que usando la funcin seno, puede calcular f en cualquier valor:
f (x ) = + f (1/B ) sen((Bx (0))) sen((Bx (1))) sen((Bx (1))) + f (0/B ) + f (1/B ) +... (Bx (1)) (Bx (0)) (Bx (1))

C.E. Shannon en realidad redescubri este teorema en 1949 que haba sido descubierto por Whittaker en 1935. Pero Shannon se dio cuenta de la utilidad de este resultado en la teora de la transmisin de la informacin. Este teorema slamente se aplica a seales cuyo rango de frecuencias est limitado a un intervalo nito. Pero esto es siempre el caso en las seales que aparecen en la prctica (por ejemplo, la frecuencia mxima trasmitida por una lnea telefnica est alrededor de 4.000 ciclos por segundo). Este teorema se prueba (demuestra) utilizando la Transformada de Fourier.

Transformada de Fourier
El matemtico Jean Baptiste-Joseph Fourier alrededor de 1800 escribi su famoso tratado del calor en el cual explic que las funciones pueden ser descompuestas en componentes muy simples, utilizando slamente funciones como cos(x ) y sen(x ).

Transformada de Fourier (cont.)

La transformada de Fourier es un procedimiento matemtico que descompone una seal en cada una de las frecuencias que la componen. Se puede pensar en una analoga con un prisma que descompone la luz en colores. La idea es que cada funcin se puede escribir como una suma de mltiplos de senos y cosenos. Si consideramos para cada nmero entero k (positivo y negativo) las funciones cos(kx ) y sen(kx ) obtenemos un sistema (o familia) innito de funciones, conocido como el sistema trigonomtrico.

Transformada de Fourier (cont.)

Toda funcin f , de duracin nita (por ejemplo dura 2 horas), puede ser escrita, de manera nica, como sumas de mltiplos de estas funciones:

f (x ) = +a2 cos(2x )+a1 cos(x )+a0 +a1 cos(x )+a2 cos(2x )+. . . Est claro, que conociendo los nmeros {. . . , a2 , a1 , a0 , a1 , a2 , . . . } se vuelve a obtener la funcin original. El procedimiento que a una funcin le asigna la sucesin de nmeros {. . . , a2 , a1 , a0 , a1 , a2 , . . . }, es lo que se llama transformada de Fourier. (Ojo! hay innitos nmeros)

Varios Cosenos

Otras seales
Una combinacin de tres cosenos:

Una funcin y su transformada:

Virtudes ...
Para remover ruido:

Ejemplo con sonido: Digitalizando a Caruso

La seal corresponde a un pasaje muy corto (6s) del tenor Caruso, obtenido a partir de una grabacin de un disco de pasta. Caruso Original Qu podemos hacer con esta representacin numrica? Le aplicamos la transformada de Fourier, y le eliminamos las frecuencias altas. Caruso Limpio Hemos eliminado el ruido!

Manipulando a Caruso

Caruso Original

Caruso Limpio

Caruso Ruido

Caruso Ms Limpio

Problemas
El problema de la transformada de Fourier, para analizar seales, se presenta cuando hay cambios abruptos en la seal. Veamos:

Podemos pensar en una funcin suave + dos saltos:

Fenmeno de Gibbs
La transformada de Fourier de la funcin de salto es:

Esto produce, que al reproducir la funcin usando solamente un nmero nito de coecientes, obtengamos:

Esto se debe a que las funciones seno y coseno no estn localizadas.

Mala Sinfona
Pensando en la orquesta, Gilbert Strang en 1994 dijo: La transformada de Fourier para representar una sinfona, consta de una orquesta de innitos msicos, cada uno tocando slamente una nota: No se necesita director - los msicos estn totalmente aburridos. En contrapartida est la notacin musical, donde las indicaciones si bien no totalmente precisas - se adecuan a lo que uno se imagina: las diferentes notas indican la duracin y la posicin en el pentagrama, la frecuencia.

Mejorando Fourier
Entonces est el desafo matemtico: Podemos inventar algo mejor? Sera bueno, que las funciones base estn localizadas en el tiempo, ya que entonces podemos analizar la seal localmente sin condicionar el resto. Efectivamente esto es posible, y se obtiene utilizando un resultado muy profundo que se debe a uno de los matemticos ms brillantes del siglo pasado, el argentino Alberto Caldern

Wavelets

Denicin: Una wavelet es una funcin del tiempo, = (t ), de energa nita, oscilante y bien concentrada.

3 wavelets famosas: Haar(1909) Meyer (1985) Daubechies (1988) .

Wavelets
Esta funcin luego es dilatada y trasladada para obtener una coleccin de funciones que nuevamente permiten representar todas las seales.

Por ejemplo, (2t ) dura la mitad del tiempo, mientras que (t /2) dura el doble. Por otro lado, la seal (t k ) comienza k unidades de tiempoi ms temprano, y a(t ) tiene una amplitud a veces la wavelet original.

Anlisis por transformadas

Lo que se denomina la transformada wavelet es la representacin que asocia a cada seal una sucesin de coecientes que corresponden a las traslaciones y dilataciones de una wavelet original. Teorema: Si es una funcin adecuadamente elegida, a partir de la transformada wavelet se puede reconstruir la funcin.

Ventajas de las escalas


Observemos qu es lo que signica analizar una imgen con diferentes escalas de la funcin de Haar:

Qu se perdi?

Esta imgen muestra lo que se ha perdido al pasar de la primer imgen a la segunda. Est claro que con las dos imgenes juntas (la segunda y esta diferencia) obtenemos la primera.

Siguiendo

La ltima imgen slamente requiere 1024 pixeles, mientras que la original usa 262.144

Lena

Otro xito

Las wavelets han sido exitosas en compresin: el FBI ha optado utilizar las mismas para comprimir su archivo de huellas digitales.

MUCHAS GRACIAS POR ESCUCHARME!


Ursula Molter umolter@dm.uba.ar

Das könnte Ihnen auch gefallen