Sie sind auf Seite 1von 7

Audio digital

Audio digital
El audio digital es la codificacin digital de una seal elctrica que representa una onda
sonora. Consiste en una secuencia de nmeros binarios y se obtiene del muestreo y
cuantificacin digital de la seal elctrica (que en este tema se llama seal analgica, para
contraponerla a la seal digital) posteriormente se puede codificar o comprimir, dando
lugar a formatos ms compactos (compresin de audio).
El muestreo consiste en tomar la amplitud de la seal
elctrica a intervalos regulares de tiempo (tasa de
muestreo). Para cubrir el espectro audible (20 a 20000
Hz) suele bastar con tasas de muestreo de algo ms de
40000 Hz (el estndar CD-Audio emplea una tasa un
10% mayor con objeto de contemplar el uso de filtros
no ideales), con 32000 muestras por segundo se tendra
Muestreo digital de una seal de audio
un ancho de banda similar al de la radio FM o una cinta
de casete, es decir, permite registrar componentes de hasta 15 kHz, aproximadamente.
Para reproduccir un determinado intervalo de frecuencias se necesita una tasa de muestreo
de poco ms del doble (Teorema de muestreo de Nyquist-Shannon). Por ejemplo en los CDs,
que reproducen hasta 20 kHz, emplean una tasa de muestreo de 44,1 kHz (frecuencia
Nyquist de 22,05 kHz).
La cuantificacin consiste en convertir el valor de las muestra obtenidas en el proceso de
muestreo, normalmente, un nivel de tensin, en un valor entero de rango finito y
predeterminado. Por ejemplo, utilizando cuantificacin lineal, una codificacin lineal de 8
bits discriminar entre 256 niveles de seal equidistantes (28). Tambin se pueden hacer
cuantificaciones no lineales, como es el caso de cuantificadores logartmicos como la Ley
Mu o la Ley A, que, a modo de ejemplo, an usando 8 bits funcionan perceptualmente como
10 bits lineales para seales de baja amplitud en promedio, como la voz humana por
ejemplo.
El formato ms usado de audio digital PCM lineal es el del CD de audio: 44,1 kHz de tasa de
muestreo y cuantificacin lineal de 16 bits (que mide 65536 niveles de seal diferentes) y
que, en la prctica, permite registrar seales analgicas con componentes hasta los 20 kHz
y con relaciones seal a ruido de ms de 90 dB.

Audio digital

Tasa de muestreo
De acuerdo con el Teorema de
muestreo de Nyquist-Shannon, la
tasa de muestreo, esto es, el
nmero de muestras con las que
se realiza el proceso de muestreo
en
una
unidad
de
tiempo,
determina
exclusivamente
la
frecuencia
mxima
de
los
componentes
armnicos
que
pueden formar parte del material a
digitalizar.[1]
Satisfechos
los
requerimientos de Nyquist y un
pequeo margen prctico, y al
contrario de lo que es una
creencia
errnea
muy
[2]
eddxtendida,
no existe relacin
directa entre el sobremuestreo A/D
(realizar el muestreo digital a una
tasa mayor de la estrictamente
necesaria para el ancho de banda
de inters) y una mayor fidelidad
en la posterior reconstruccin de
la seal en todo el espectro
(hasta la frecuencia de Nyquist).[3]

Aliasing

Ejemplo de reconstruccin de una seal de 14,7 kHz (lnea gris


discontinua) con slo cinco muestras. Cada ciclo se compone de
slo 3 muestras a 44100 muestras por segundo. La
reconstruccin terica resulta de la suma ponderada de la
funcin de interpolacin g(t) y sus versiones correspondientes
desplazadas en el tiempo g(t-nT) con
, donde
los coeficientes de ponderacin son las muestras x(n). En esta
imagen cada funcin de interpolacin est representada con un
color (en total, cinco) y estn ponderadas al valor de su
correspondiente muestra (el mximo de cada funcin pasa por un
punto azul que representa la muestra).

Con objeto de evitar el fenmeno


conocido
como
aliasing,
es
necesario eliminar todos los componentes de frecuencias que exceden la mitad de la tasa de
muestreo, es decir, del lmite de Nyquist, antes del proceso de digitalizacin (conversin
A/D). En la prctica, estos componentes se atenan fuertemente mediante un filtro activo
analgico pasa-bajo que se aplica a la seal analgica de inters antes de su digitalizacin y
que para este objetivo se denomina filtro antialiasing. En el proceso de reconstruccin
posterior (conversin D/A) de la reproduccin se deber aplicar en esencia el mismo
filtrado analgico mediante un filtro que, empleado en este proceso, se denomina de
reconstruccin.

Tamao de las muestras


El nmero de bits que conforman las muestras en un proceso determinado de cuantificacin
determina la relacin seal a ruido mxima que debe tener la seal (la salida de un
micrfono y, consecuentemente, el material sonoro que recoge, la salida de un mster
analgico, etc.) que se pretende cuantificar y, por tanto, limita tambin el rango dinmico
que debe tener para su cuantificacin completa, de modo parecido a cmo la capacidad de
un recipiente (bits por muestra) limita el volumen de lquido (rango del material sonoro a

Audio digital
cuantificar) que puede contener.
Sea el nmero de bits con las que se cuantifican las muestras, la relacin seal (para
sinusoidal mxima que cubre todo el rango) a ruido de cuantificacin terica se obtiene en
dB:[4]

Por tanto, una cuantificacin de 16 bits permite un mximo terico para la relacin seal
sinusoidal a ruido de cuantificacin de 98,09 dB (122,17 dB para 20 bits, valor muy cercano
al lmite real que permite el ruido de Johnson-Nyquist (tambin conocido como ruido
trmico) de los mejores convertidores A/D actuales). En la prctica, el lmite de una seal
analgica para que pueda ser cuantificada sin merma dinmica es, aproximadamente, el
90% del lmite terico.[5] Por lo tanto, el lmite que debe tener una seal (por ejemplo, la
seal directa de un micrfono o la que resultara de un mster analgico) para ser
cuantificada con seguridad con slo 14 bits es de unos 78 dB, an cuando el lmite terico
sea de 86,05 dB en este caso.
Una vez que la relacin seal a ruido de cuantificacin que permite un proceso de
cuantificacin dado excede la relacin seal a ruido mxima del material sonoro que se
pretende cuantificar, esta podr ser cuantificada totalmente sin prdidas en su rango
dinmico. Pasado este umbral, de nada sirve aumentar el nmero de bits por muestra del
proceso de cuantificacin: no resultar en una conversin ms fiel. Por ejemplo, una
relacin seal a ruido de cuantificacin de 90 dB (una relacin prctica que permiten
sobradamente los 16 bits por muestra de un CD-Audio) es suficiente para cuantificar
cualquier grabacin musical normal, cuyo rango de intensidad sonora puede ir desde los 25
dB(SPL) del ruido de fondo de un estudio de grabacin hasta los 115 dB(SPL), casi el
umbral del dolor de la audicin humana,[6] en la posicin del micrfono duante una
grabacin en dicho estudio.
El tamao de las muestras necesario en un proceso de cuantificacin digital se determina,
por tanto, a partir del anlisis del ruido de fondo y de la intensidad mxima del material
sonoro a registrar. Aumentar por encima de lo necesario el tamao de las muestras es slo
un desperdicio de ancho de banda, especialmente en los formatos finales de distribucin.
No supone mejora alguna, ni siquiera mensurable, ya que slo servira para registrar el
ruido con ms bits, es decir, ms bits intiles cuyo valor depender exclusivamente del azar
o, segn se ajuste la ganancia, para dejar los bits ms significativos a cero en todas las
muestras (o una combinacin de ambas cosas). De modo parecido, un recipiente de
capacidad mayor a la del lquido que se pretende depositar en l no mejora en medida
alguna la calidad o cantidad de dicho lquido respecto al uso de un recipiente de menor
capacidad siempre que sta capacidad menor sea an suficiente para el volumen del
lquido. Dicho de otro modo, al contrario de lo que es una creencia errnea muy
extendida,[7] el tamao de las muestras a emplear en una cuantificacin depende del
material sonoro que se pretende cuantificar y nada tienen que ver la fidelidad de la
reconstruccin en la reproduccin o los lmites psicoacsticos humanos (por la percepcin
de dicha fidelidad) con esta determinacin, por ejemplo. Si un material sonoro a digitalizar
"cabe" en 10 bits por muestra, cuantificar a 14 bits (o 20) no hace ms fiel su
reconstruccin posterior ni, consecuentemente, es posible percibir diferencias subjetivas
que no resulten de la sugestin.

Audio digital

Dither
Con objeto de evitar que el ruido
de cuantificacin se manifieste
como una distorsin, se hace
necesario
aadir
un
ruido
denominado dither antes del
proceso de cuantificacin en todos
los casos donde el nivel del ruido
de la seal (por ejemplo, ruido de
Johnson-Nyquist o ruido trmico
de un circuito especfico) sea
inferior al de cuantificacin.[8] Sea
el incremento de tensin
(diferencia
de
potencial)
correspondiente a un escaln de
cuantificacin, el valor eficaz
(RMS) del ruido de cuantificacin
sera:

Seal armnica (sinusoidal pura) con dither aadido en una


relacin seal a ruido de 21,03 dB lista para ser cuantificada con
slo 4 bits por muestra (16 niveles de cuantificacin). La seal
tiene, por tanto, unas 127 veces la potencia del dither (11,26
veces su valor eficaz -RMS-). Una futura conversin A/D con ms
niveles de cuantificacin (ms bits por muestra) permitiran
aadir un dither proporcionalmente (respecto de la seal) menor.

Dado que actualmente los mejores convertidores tienen relaciones seal a ruido trmico
que raramente exceden los 122 dB a temperatura ambiente, se hace necesario aadir
dither en todos los casos en los que se emplean cuantificaciones (o recuantificaciones)
inferiores a 20 bits. Los cuantificadores de 24 bits, si bien no presentan ventajas prcticas
sobre los de 20 bits debido al nivel del ruido trmico de los convertidores, al menos no
requieren la adicin de dither (y permiten registrar la muestra en un nmero entero de
bytes). Sin embargo, s ser imprescindible aadir dither en los casos donde se
recuantifican estas grabaciones a muestras de 16 bits, por ejemplo.

Formatos de archivo de audio digital


Este artculo o seccin necesita fuentes o referencias que aparezcan en una publicacin
acreditada, como libros de texto, pginas de Internet serias e independientes u otras publicaciones
especializadas en el tema.
Puedes dar aviso al autor principal del artculo pegando el siguiente cdigo en su pgina de
discusin: {{subst:Aviso referencias|Audio digital}} ~~~~

Los archivos de audio digital almacenan toda la informacin que ocurra en el tiempo, el
tamao del archivo no vara as contenga 'silencio' o sonidos muy complejos[citarequerida].
Existen muchos formatos de archivo de audio digital, que se pueden dividir en dos
categoras PCM y comprimidos. Como se vio arriba el tamao puede depender de la
cantidad de canales que tenga el archivo y de la resolucin (tasa de muestreo y
profundidad).
Formatos PCM Los formatos PCM contienen toda la informacin que sali del convertidor
analgico a digital, sin ninguna omisin y por eso, tienen la mejor calidad. Dentro de esta

Audio digital
categora se encuentran los formatos WAV, AIFF, SU, AU y RAW (crudo). La diferencia
principal que tienen estos formatos es el encabezado, alrededor de 1000 bytes al comienzo
del archivo[citarequerida].
Formatos comprimidos Para usar menos memoria que los archivos PCM existen formatos
de sonido comprimidos, como por ejemplo el MP3, AAC y Ogg. Ciertos algoritmos de
compresin descartan informacin que no es perceptible por el odo humano para lograr
que el mismo fragmento de audio pueda ocupar en la memoria inclusive dcima parte -o
menos- de lo que ocupara de ser PCM[citarequerida]. La reduccin en tamao implica una
prdida de informacin y por esto a los formatos de este tipo se les llama formatos
comprimidos con prdida[citarequerida]. Existen tambin formatos de archivo comprimido sin
prdida, dentro de los que se cuentan el FLAC y el Apple Lossless Encoder, cuyo tamao
suele ser de aproximadamente la mitad de su equivalente PCM[citarequerida].
Formatos descriptivos: Archivos MIDI Este formato de archivos no es precisamente de
audio digital, pero s pertenece a las tecnologas de la informtica musical. El archivo MIDI
no almacena "sonido grabado", sino las indicaciones para que un sintetizador o cualquier
otro dispositivo MIDI "interprete" una serie de notas u otras acciones (control de un
mezclador, etc.)[citarequerida]. Podemos imaginarlos como algo similar a una partitura, con
los nombres de los instrumentos que hay que utilizar, las notas, tiempos y algunas
indicaciones acerca de la interpretacin.

Bibliografa
Proakis, J. G. y Manolakis, D. G. (1998). Tratamiento digital de seales. Principios,
algoritmos y aplicaciones. Hertfordshire: PRENTICE HALL International (UK) Ltd. ISBN
84-8322-000-8.

Vase tambin

Seal de audio
Grabacin digital de sonido
Compresin de audio
Ruido de cuantificacin
Teorema de muestreo de Nyquist-Shannon
Tasa de muestreo
Muestreo digital
Cuantificacin digital

Referencias
[1] Teora de muestreo (Dan Lavry de Lavry Engineering, Inc.): (http:/ / www. lavryengineering. com/ documents/
Sampling_Theory. pdf) Por qu ms no es mejor. (ingls)
[2] Embedded Signal Processing Laboratory (University of Texas at Austin): Debunking Audio Myths (http:/ /
signal. ece. utexas. edu/ seminars/ dsp_seminars/ 01fall/ AudioMyths. pdf) Desenmascarando los mitos del audio
(ingls). Vase "Mito 4: Necesitamos 96 kHz, no, mejor 192 kHz".
[3] Las tcnicas de Noise-Shaping pueden mejorar la relacin seal a ruido de parte del espectro hasta el lmite
de Nyquist pero siempre a cambio de empeorar esa relacin en otra parte de ese mismo espectro. No hay
nunca, por tanto, mejora global de ningn tipo en todo el espectro hasta la frecuencia de Nyquist por
aumentar la tasa, incluso cuando este aumento se realiza con la intencin de aplicar estas tcnicas de modelado
de ruido.
[4] Smith, J.O. (2007). "Round-off Error Variance", en Mathematics of the Discrete Fourier Transform (DFT). ISBN
978-0-9745607-4-8.

Audio digital
[5] Por la necesidad de aadir dither y contemplar un margen de error de ajuste (se deber ajustar el nivel de la
seal a cuantificar para que coincida, aproximadamente, la potencia del ruido de cuantificacin con la del ruido
base de la seal).
[6] Threshold of Hearing (http:/ / hyperphysics. phy-astr. gsu. edu/ hbase/ sound/ earcrv. html#c2).
Hyperphysics.
[7] Kite, Thomas (2001). Signal Processing Seminar: Debunking Audio Myths (Vase "Myth 5: 16 bits are not
enough") (http:/ / signal. ece. utexas. edu/ seminars/ dsp_seminars/ 01fall/ AudioMyths. pdf). The Embedded
Signal Processing Laboratory - University of Texas at Austin.
[8] Martin, Geoff (2004). "Dither examples", en Introduction to Sound Recording (http:/ / www. tonmeister. ca/
main/ textbook/ node595. html).

Fuentes y contribuyentes del artculo

Fuentes y contribuyentes del artculo


Audio digital Fuente: http://es.wikipedia.org/w/index.php?oldid=28847446 Contribuyentes: Albertcontreras, Bigsus, Carmin, Deprieto, GermanX,
HUB, Jepuente, Matdrodes, Netito777, Phirosiberia, PoLuX124, Snakefang, Tostadora, Yeza, 135 ediciones annimas

Fuentes de imagen, Licencias y


contribuyentes
Archivo:Sampled_signal.png Fuente: http://es.wikipedia.org/w/index.php?title=Archivo:Sampled_signal.png Licencia: desconocido Contribuyentes:
Original uploader was Ivan.Romero at es.wikipedia
Archivo:Sinusoidal14700Hz.png Fuente: http://es.wikipedia.org/w/index.php?title=Archivo:Sinusoidal14700Hz.png Licencia: Public Domain
Contribuyentes: User:Jmcalderon
Archivo:Senal4bitsDitherAnalogica1.png Fuente: http://es.wikipedia.org/w/index.php?title=Archivo:Senal4bitsDitherAnalogica1.png Licencia:
Public Domain Contribuyentes: User:Jmcalderon
Imagen:Question book.svg Fuente: http://es.wikipedia.org/w/index.php?title=Archivo:Question_book.svg Licencia: GNU Free Documentation License
Contribuyentes: Javierme, Loyna, Remember the dot, Victormoz, 3 ediciones annimas

Licencia
Creative Commons Attribution-Share Alike 3.0 Unported
http:/ / creativecommons. org/ licenses/ by-sa/ 3. 0/

Das könnte Ihnen auch gefallen