Sie sind auf Seite 1von 60

MANUAL PARA CREAR

SONIDO
EDICIONES DATA-CENTER

Manual Versin Digital

CREAR SONIDO

DATA-CENTER
VENTA EN ARGENTINA Y LATINO AMERICA
WWW.MERCADOLIBRE.COM.AR / WWW.DEREMATE.COM.AR
DATA-CENTER DESARROLLO DE SERVICIOS Y PROYECTOS DIGITALES

INTRODUCCIN AL AUDIO DIGITAL


DISEO DE SONIDO
POST PRODUCCION DE SONIDO
CONVERTIR WAV A MIDI Y VICEVERSA

INTRODUCCIN AL AUDIO DIGITAL


Qu es el audio digital?
Podramos definir audio digital como la representacin de una seal de audio
mediante nmeros, en general codificados en forma binaria (es decir con ceros
y unos, el lenguaje interno de los ordenadores).
Entendemos como seal de audio cualquier objeto sonoro audible, el viento, el
agua, nuestra voz, nuestra msica preferida y evidentemente esos molestos
"ruidos" nocturnos de los vecinos que no nos dejan dormir. Cualquier sonido
puede representarse en nmeros, al igual que cualquier imagen o grafico.
En trminos menos genricos, tambin podemos llamar audio digital a la
tecnologa que permite grabar, editar, mezclar y masterizar una seal de audio
completamente en el dominio digital.
Para ello existe un amplio surtido de aparatos y equipos que procesan la seal
de audio en el dominio digital, dominio que ofrece muchas ms ventajas ya que
es totalmente "tratable" por un ordenador, es decir, permite un grado de
manipulacin sin precedentes.

1-Introduccin
Para la gran industria de la msica, el audio digital naci de una necesidad muy
concreta; ahorrar tiempo de produccin. Antes del audio digital, el mtodo de
grabacin era lo que hoy en da se conoce como grabacin analgica, los
impulsos del sonio se registraban en una bobina o cinta. La edicin de esa
bobina era un proceso muy largo y tedioso, en el que la precisin y paciencia
eran algo obligado. Por otro lado, obtener un buen equipo analgico era algo
realmente caro. Hablando de creatividad de mezclas y produccin de audio, los
procesos que podan aplicarse eran muy limitados comparados con los de hoy
en da. Por poner un ejemplo, si se requera una reverberacin concreta el
msico deba registrar su interpretacin en la sala que produca esa
reverberacin.

Estudio de grabacin de audio analgico. La calidad de audio no es


comparable a los modernos sistemas digitales, aunque esta misma calidad nos
ha servido durante muchos aos para escuchar nuestros discos favoritos.

Estudio de grabacin de audio digital. El ordenador se encarga de registrar


(primer monitor), mezclar y procesar efectos (segundo monitor) as como
generar sintetizadores y samplers virtuales (tercer monitor)

La introduccin del audio digital ha revolucionado, sin duda alguna, toda la


industria de la msica, las empresas que construyen instrumentos, los
creadores o msicos, los procedimientos de edicin y mezcla, y desde luego el
soporte; es decir lo que nosotros omos en casa: un CD de audio o los tan
famosos MP3. La tecnologa del audio digital ha dado lugar a toda una nueva
legin de instrumentos musicales que prometen un grado de libertad de
creacin de sonidos sin precedentes (solo superada por al sntesis virtual).
Estos nuevos instrumentos han propiciado la existencia d nuevos estilos
musicales que dependen en gran parte de esa tecnologa. Un ejemplo muy
corriente puede ser lo que se conoce popularmente como msica "dance" que
no slo se produce con instrumentos digitales sino que parte de la composicin
es un puzzle de otras grabaciones digitales realizadas por terceros y
mezcladas hasta formar una nueva composicin.

Ejemplos de los nuevos instrumentos digitales basados en la tecnologa de


captura y reproduccin de audio digital. En la parte superior, el "sampler" AKAI
S-6000 y en la parte inferior el sintetizador Korg TRITON

El msico tradicional ha tenido que adaptarse a esos cambios. Cuando


nacieron los primeros instrumentos digitales los msicos eran reacios a
utilizarlos (el sintetizador el instrumento musical con ms rechazo de toda la
historia). Muchos pensaban que eran mquinas malditas que pretendan
sustituir o imitar instrumentos tradicionales. No les faltaba parte de razn. El
audio digital son fotografas digitales de sonido, por lo que no hacia falta tratar
de imitar un piano, ya que tenemos la foto del sonido de un piano. La primera
consecuencia fue la drstica reduccin de costes de grabacin. Para grabar un

piano hacen falta micrfonos. Los micrfonos deben situarse correctamente


segn el ambiente y color que pretendemos dar a ese piano. Eso representa
horas de pruebas y correccin de pequeas imperfecciones producidas por el
solapamiento de las seales de los micros. Si utilizamos un instrumento digital
con un buen sonido de piano, slo requerimos dos cables, izquierdo y derecho
y siempre sonar igual de bien sea cual sea el entorno acstico. Aunque los
primeros instrumentos digitales eran muy caros, hoy en cualquier ordenador
incluye un instrumento digital, la tarjeta de sonido, que es muy limitada en
comparacin con los grandes sintetizadores de la industria , pero
extremadamente ms avanzada que los primeros instrumentos digitales.
En el entorno del estudio de grabacin, el audio digital tambin ha supuesto un
importante avance. Ya no hace falta guardar celosamente las bobinas master
(para que el paso del tiempo no las merme) el audio digital es indestructible,
slo puede destruirse deteriorando el medio en el que se almacena; un CD, un
disco duro, etc.... Tambin han desaparecido los tediosos procesos de cortar y
pegar (hechos literalmente con tijeras y cola). Ahora existe la edicin no lineal
que como veremos ms adelante puede ser destructiva o no. La ambientacin
de la mezcla ha pasado a ser una realidad palpable. Donde antes existan
habitaciones enormes con paredes mviles para recrear reverberaciones,
ahora existen pequeos equipos de no ms de 5kg que incluyen ambientes de
salas y halls famosos; podramos cantar con el ambiente de en la opera de
Sydney, aunque eso slo existir en nuestro cerebro, ya que en realidad
estaramos solos delante de un ordenador. Existen otros detalles menores,
como el hecho de que por primera vez el msico puede grabar parte de su
msica en casa y luego seguir en un estudio, transfiriendo digitalmente las
pistas. Esto ofrece una libertad de mezclas y produccin de audio increbles: un
usuario sin recursos puede acudir a un estudio y seguir editando sin perder la
calidad original.
Por ltimo, tenemos el soporte digital, es decir el medio en el que recibimos el
producto musical acabado. Donde ante tenamos los discos de vinilo o las
cintas de cassette, ahora tenemos el CD /DVD y el minidisc. Desde el punto de
vista de fiabilidad, estos soportes no fallan (cuantas veces se nos ha
enganchado una cinta en el cabezal?) y fsicamente son ms duros y
compactos, para que dejen de funcionar hay que destruir el medio, no basta
con una rayada.
2-Soporte digital y analgico
Veamos con detenimiento las diferencias ms importantes entre el soporte
analgico y el digital:
Soporte Analgico
Degradable: Cuantas ms veces se usa, mayor degradacin se obtiene. Los
datos se almacenan fsicamente sobre un sustrato que es mucho ms alterable
con el paso del tiempo.
Lineal: El audio se graba secuencialmente en el tiempo y con el mismo orden
de ejecucin, de principio a fin.

Grabador analgico de audio (2 pistas). Resulta evidente comprobar que su


acceso no es aleatorio.

Calidad de audio: La calidad de un sistema de grabacin analgico resulta


inferior a la mnima calidad de audio ofrecida por un sistema digital. En la
prctica, un sistema analgico rara vez supera los 70dB de relacin seal ruido
(SNR). Un grabador profesional analgico puede alcanzar los 85dB SNR. Una
tarjeta como la nueva SoundBlaster Prodigy posee una relacin seal ruido de
100dB. Inicialmente, no es importante saber qu es la relacin seal ruido, sino
simplemente tener constancia de las distintas cifras que miden esta importante
caracterstica de las tarjetas: existen tarjetas de audio con ms de 115dB SNR.
Por otro lado, deberamos evitar una sensacin de triunfalismo absoluto del
audio digital frente al analgico. En buen tcnico de sonido puede lograr que
una cancin suene increblemente bien en sistemas analgicos, de hecho
tenemos toda la industria de la msica para demostrarlo. Aunque el medio
analgico sufre muchos problemas de calidad e inestabilidad, los grandes
profesionales de produccin saben como solucionar estos problemas. Qu
problemas?
Por ejemplo, la diafona e imperfecciones de la mecnica. Los distintos canales
de una grabadora analgica suelen mezclarse, es decir, parte de la seal de un
canal tambin se percibe en otro canal. El propio medio analgico provoca que
parte de la seal de un canal se "cuele" en el otro canal. Un mtodo para evitar
este problema consiste en utilizar cintas ms anchas, en las que las pistas
ocupan ms espacio fsico. Por otro lado, las imperfecciones de la mecnica
empleada para la reproduccin sonora dan lugar a problemas de wow, flutter,
tremolo, etc. Otras notables diferencias son la separacin entre los canales
izquierdo y derecho, la relacin entre la seal y el ruido de fondo, la linealidad
de la respuesta en frecuencias y de fase, la relacin entre el nivel ms bajo y el
ms alto.
Edicin destructiva: La edicin de las grabaciones de audio en el mundo
analgico es totalmente destructiva, baste un slo ejemplo para comprobarlo.

Algo tan sencillo como copiar un fragmento del estribillo, significa grabar ese
fragmento en otra cinta, reproducir esta mientras la original inicia la grabacin a
partir del punto deseado. La edicin en el mundo analgico es siempre
destructiva e incluso a veces se destruye parte del propio medio en el que
reside la grabacin, la cinta o bobina (en operaciones de copia en las que se
requiere cortar fsicamente la cinta). Por otro lado, el tiempo invertido en la
edicin es extremadamente elevado as como los costes en trminos el precio
en trminos de pruebas fallidas y errores humanos.
Soporte Digital
No degradable: Una grabacin de audio digital es una cadena gigante de 0 y 1
perfectamente ordenados. Es imposible que "el paso del tiempo" convierta un 0
a un 1, es decir que pueda alterar esa cadena. Como mucho, es posible que
una mala manipulacin del soporte (por ejemplo el CD) provoque que durante
un instante aparezcan artefactos o ruidos que originalmente no estaban. Lo que
nunca ocurrir es que el audio de ese soporte digital vaya apagndose,
perdiendo brillo con el paso del tiempo. La durabilidad de los datos es eterna,
puesto que pueden ser almacenados en cualquier dispositivo de
almacenamiento, como puede ser un disco duro, una memoria, etc., y
recuperados en cualquier momento
Lineal / No-lineal (acceso aleatorio): Si en el mundo analgico el tiempo es algo
fijo e invariable (una cancin se registra de principio a fin) en el mundo digital
no tiene porque ser as. Existe un soporte digital llamado DAT que est basado
en cinta analgica aunque en ella se registran 0 y 1 como un en CD pero con
una calidad superior a ste. En este caso, la grabacin y reproduccin es lineal.
Si deseo ir al final de la cancin, debo pulsar el botn Fast Foward y esperar a
que la cinta llegue a su punto. Considerando el disco duro de nuestro
ordenador como soporte digital (archivos wav, aiff o MP3) llegamos a la
inequvoca conclusin de que es un soporte no lineal. Los 0 y 1 de las
canciones que registramos se almacenan por todo el disco duro sin orden
alguno. El acceso a cualquier parte de esta cancin (una vez grabada) es
instantneo, no hay tiempo de espera, dicho de otra forma, se tarda tanto en
reproducir desde el inicio de la cancin como, en mitad de ella: apenas unos
milisegundos.

Grabador de audio digital multipista (8 pistas) basado en cinta de SVHS. Al


basarse en cinta, la edicin es lineal

Grabador de audio digital multipista (24 pistas) basado en disco duro. Al


basarse en disco duro, la edicin es no lineal
Calidad de audio: La calidad de audio del soporte digital, es mayor que la del
analgico. La respuesta de frecuencias, es decir el espectro de frecuencias que
el grabador digital es capaz de grabar es mucho mayor que el analgico,
aunque en el caso del mundo digital la teora y la prctica siguen caminos que
pueden ser muy distintos, es decir, la calidad terica de un sistema de audio a
24 bits es superior a la calidad que ofrece en la realidad, aunque esta realidad
mermada es muy superior a la analgica; sea como sea, el audio digital
siempre puede tener ms calidad que el analgico.
Diafona imperceptible o casi nula: En los grabadores de audio digital, nunca
ocurrir que monitorizando una pista aislada podamos or parte de la seal de
sus pistas adyacentes. Cada pista de ese grabador digital registra y reproduce
sus propias cadenas gigantes de 0 y 1. Es imposible que el ordenador se
equivoque y sume 0 y 1 de distintas pistas.
Edicin no destructiva: El ltimo aspecto es quizs el mas interesante dentro de
la vertiente creativa del sonido. Por primera vez es posible crear audio. La
msica siempre ha tenido efectos como reverberacin, retardos, distorsiones y
ecualizacin, pero por primera vez estamos ante el nacimiento de nuevos
efectos de indescriptibles resultados. En la pelcula MATRIX, cuando Neo es
desconectado del mundo "Real" produce un interesante grito de dolor.
Imaginemos a Andy Wachowski (director de MATRIX) dicindole al tcnico de
audio que desea un grito humano que vaya convirtindose progresivamente en
un grito digital, una voz que denote la existencia de un mundo digital, la
sensacin que debe percibir el espectador es la de que Neo abandona el
mundo de los vivos para adentrase en el mundo de la mquina MATRIX. Ese
efecto de sonido que apenas dura 3 segundos, es materialmente imposible de
recrear sin la tecnologa de procesado de audio digital. Si el grito de Neo
original no hubiera sido grabado digitalmente en forma de 0 y 1, nunca se
habra podido aplicar ese grado de manipulacin. El procesado de estos
efectos puede ser destructivo, es decir alterando la grabacin original (los 0 y
1) son manipulados y alterados o bien no destructiva en el que los clculos se
realizan a tiempo real, es decir, "mientras el audio suena". En este caso el
archivo original se mantiene intacto.

1-Frecuencia de muestreo
El proceso de captura de audio a soporte digital ser conoce como "muestreo"
(sampling, en el mbito de los DJ). Esta operacin de codificacin del audio
analgico a 0, 1 tiene lugar a tiempo real, es decir mientras la seal de audio
analgico (audio "real") se reproduce. En los grabadores de audio digital, tanto
en sistemas dedicados como en las tarjetas de sonido populares, existe un
componente llamado conversor AD (analgico-digital, es decir el componente
que se encarga de convertir seales elctricas a cadenas binarias). El proceso
inverso, es decir la reproduccin utiliza un conversor DA (digital-analgico). El
conversor aplica una "rejilla" de tiempo al audio y captura el audio comprendido
en las casillas de la rejilla. Podemos utilizar un ejemplo muy sencillo. Si
queremos grabar un atleta que corre durante" x" metros en una pista olmpica,
necesitamos una cmara que corra junto a ste (imagina la clsica cmara
montada en rales). Esta cmara capturar 25 fotos (frames, en el argot) por
segundo. 25 y no 98 o 4.7? 25 fotos por segundo es ms que suficiente para
engaar al ojo humano y hacerle creer que esta sucesin de fotos es un
movimiento real de un seor corriendo. Para capturar el audio de ese corredor
necesitamos un micrfono y un grabador de audio que "fotografe" el sonido.
Para engaar al odo, necesitamos ms de 25 fotos por segundo, bastantes
ms...44.100 fotos por segundo, para ser exactos.

Cuadro de dilogo de configuracin del programa Pro Tools Free. Desde esta
pantalla indicamos la frecuencia de muestreo que se utilizar en la sesin
actual. Pro-Tools slo permite utilizar archivos con una sola frecuencia de
muestreo. Existen otros programas que permiten utilizar archivos con mltiples
frecuencias de muestreo en una sola sesin. El programa convierte la
frecuencia de muestreo a tiempo real ya que un CD no soporta mltiples
frecuencias de muestreo
En el mundo del audio no se utiliza la expresin fotos por segundo, sino que se
habla de la Frecuencia de Muestreo. Una frecuencia de muestreo de 44.100 se
conoce como 44.1 kHz (Kilo Hercios). Esta frecuen cia de muestreo permitira
no diferenciar la fuente un sonido que se produce en la habitacin de al lado,
oiramos a un seor hablando y no sabramos si es real o una grabacin que se
est reproduciendo. Si la frecuencia de muestreo fuera menor, por ejemplo
22.050 kHz, ese seor tendra una voz muy opaca, como si hablase con una
mano tapndose la boca. Nos parecera muy raro, no seria una voz natural. No

podran engaarnos!.
Existe una relacin matemtica que relaciona la frecuencia mxima registrable
(es decir, hasta qu frecuencia podremos grabar) en funcin de la frecuencia
de muestreo. Estamos hablando del teorema de Nyquist y bsicamente nos
dice que si queremos grabar una seal de audio que llega hasta "x" frecuencia,
debemos utilizar una frecuencia de muestreo mnima de "2x", es decir el doble
de la frecuencia ms alta originada en la seal que deseamos grabar. Por
ejemplo, si queremos grabar una seal de audio que llega hasta los 20 KHz,
Nyquist nos dice que necesitamos una frecuencia de muestreo mayor o igual a
40kHz. Todos los CD del mercado reproducen audio con una frecuencia de
muestreo de 44.1kHz, es decir, pueden reproducir perfectamente seales de
audio con frecuencias de hasta 22050Hz (que es justamente el lmite de
frecuencias terico que podemos or los humanos; los elefantes poseen un
limite inferior por debajo de los 10Hz y las hormigas mayor a 22kHz). La radio
digital emplea una frecuencia de muestreo de 32kHz (hasta los 16000Hz) frente
a los 96kHz del estndar DVD (hasta los 48000Hz). Por lo tanto...

Segn Nyquist, es posible repetir con exactitud una seal de audio si la


frecuencia de muestreo es como mnimo el doble de la frecuencia de la
componente de mayor frecuencia.

Observando la parte inferior de esta captura


de pantalla (Sound Forge 5.0) de ese archivo
descubrimos que es un audio mono de 8 bits
Cuadro de dilogo de grabacin a 8.192Hz. Se trata de una captura de una
de audio del programa Wavelab emisin desde el espacio registrada por el
SETI. Esta frecuencia de muestreo es ms
3.0 de Steinberg. Ntese que
que suficiente para el material de audio que
permite grabar audio con
resoluciones de hasta 192kHz y tratan en este instituto de bsqueda s e
seales de vida extraterrestre.
24 bits.

2- Resolucin de bits
Ya sabemos que necesitamos tomar 44100 "fotos" del sonido por segundo,
pero estas fotos cmo se almacenan?. En forma de bits, cadenas de 0 y 1
totalmente manejables por el ordenador. La cantidad de bits que se utilizan
para representar la muestra del audio es la resolucin de la muestra. Una
resolucin de 8 bits (1 byte) permite manejar valores de entre 0 a 255 (256
valores). Dicho de otra forma, para representar una seal mxima de 255
necesitar 8 dgitos binarios (0 o 1) y en este ejemplo, 255 es 1111111 en
binario (8 dgitos 1). Una palabra de 16 bits (2 bytes) maneja un valor mximo
de 65535 (65536 si contamos el 0 como valor), 1111111111111111=65535.

Archivo de audio cargado en WaveLab 3.0. Como siempre, en la parte inferior


nos muestran los "atributos" de dicho archivo, en este caso, estreo a 16 bits y
44.1kHz de frecuencia de muestreo.

De esta forma, cada uno de las 44100 capturas realizadas contienen un valor
codificado en "x" bits. Cuanto mayor sea la resolucin, ms calidad tendr la
grabacin. Tanto la frecuencia de muestreo como la resolucin tienen
incidencia directa en la calidad de la grabacin y reproduccin de audio digital.
La resolucin, por su parte, tambin tiene incidencia directa en el rango
dinmico o relacin seal-ruido de la grabacin (abreviada S/R o S/N en ingls
y se mide en dB o decibelios). Existe una relacin que indica que esta relacin
S/N es igual al resultado de multiplicar la resolucin de bits por 6. Una
grabacin a 8 bits posee una relacin S/N de 54dB, una de 16 bits 96dB y
144dB a 24 bits. Tengamos en cuenta que estos dB son valores tericos y que
en la prctica bajan sustancialmente debido a los componentes analgicos de
los grabadores tarjetas de sondo, etc... Lo normal es que un grabador a 16 bits
alcance los 90-92dB y lo extraordinario es que efectivamente nos entregue una
S/N de 96dB. Para nosotros, los humanos, un rango dinmico de entre 90 y
100dB es suficiente. Estas cifras salen del propio rango dinmico humano, la
diferencia entre el umbral de dolor y el umbral de audicin
Existe una relacin matemtica entre los bits y la relacin sealruido o rango dinmico: S/N = 6x(resolucin de bits)

Esta web es la nica que permite buscar tarjetas de audio y software por
caractersticas. En este ejemplo el usuario est buscando una tarjeta de audio
con una frecuencia mxima de 48kHz, una resolucin mayor de 16 bits (es
decir, 16, 24 o 32) y que funcione bajo Windows 95/98

El resultado de la bsqueda nos informa de la existencia de todos estos


modelos...sabras decir cual suena mejor? Te ayudar un poco, mejor "rango
dinmico".

3-Rango dinmico / Relacin seal ruido


La relacin seal ruido (S/N) es la diferencia entre el nivel de seal til (msica,
sonido, etc...) y el nivel de ruido (ruido provocado por seales elctricas en el
interior de un equipo electrnico). El ruido se mide sin ninguna seal a la
entrada del equipo. Para calcular este valor se toman mediciones del nivel de
seal cuando se captura o se reproduce audio y se restan de las mediciones al
mismo nivel sin seal alguna en las que puede apreciarse el ruido inherente del
propio aparato. Dicho de otra forma, es la diferencia entre el nivel de la seal
nominal y el nivel de la seal residual, al mismo nivel de trabajo. Una prueba
muy sencilla, al escuchar msica en tu mini-cadena hi-fi, sube el volumen al
mximo (en modo stop) y comprobars como el ruido residual aumenta te
gusta?. Si con el volumen mximo pulsases el "play", el audio se reproducira a
su mximo volumen, la diferencia de volumen entre ese audio "a tope" y ese
ruido residual es la S/N. Cuanto mayor sea la diferencia de volumen entre la
seal til y el ruido, mayor calidad tendr el mismo. Tcnicamente la seal se
mide en voltios y para pasar a dB se calcula el 20log(S/N) donde S es el valor
de la "Seal" y N el valor del "Ruido" o "Noise", en ingls. Cuanto mayor sea el
valor de S/N mayor calidad tendr el audio.
Ahora plantemonos un problema muy interesante. El hombre, como especie
animal, tiene una limitacin en su odo; no podemos or toda la gran gama de
frecuencias generadas en la naturaleza (o por medios artificiales, como esos
antiguos mandos a distancia por ultra-sonidos). A partir de las frecuencias
cercanas a los 20.000Hz, el silencio penetra en nuestro odos. Qu puede
ocurrir si registro una seal de audio con un sonido que va ms all del umbral
humano?
Imaginemos que estamos grabando audio con una frecuencia de muestreo de
44.1kHz y en ese audio se reproducen frecuencias cercanas a los 29.000Hz
(que naturalmente no podemos or). Nuestra grabacin registrar todas las
frecuencias hasta los 22.050Hz pero aparecer un ruido de 15.1Hz (44.1kHz29kHz), algo totalmente audible que en el original no exista. Estas frecuencias
fantasma se llaman "alias", dando nombre a una distorsin conocida como
"aliasing". Para prevenir esto, tanto los sistemas de grabacin de audio como
las tarjetas de sido incluyen un filtro "anti-alisasing" que no permite la entrada
de frecuencias superiores a la mitad de la frecuencia de muestro; estamos
hablando otra vez de Nyquist.

Folleto publicitario del sistema MOTU


1224 a 24 bits. Posee un rango
Folleto publicitario del conversor ADDA dinmico increble, casi 116dB.
de Pro Tools 888-24. Observa sus
Significa eso que es el que mejor
caractersticas..
suena?.

Tarjeta Pulsar de Creamware junto con su panel de configuracin. En esta


ocasin esta trabajando a 44.1kHz .

EL MANUAL DEL AUDIO EN LOS MEDIOS DE COMUNICACION

Captulo 1: Diseo de Sonido


Con el sentido de la vista la idea transmite la emocin. Mientras que con
el sonido la emocin comunica la idea, lo cual es ms directo y por lo tanto ms
poderoso. As lo dijo el notable filsofo y matemtico ALfred North Whitehead.
El renombrado director de cine Akira Kurosawa lo explic de otra manera: El
momento ms excitante es cuando agrego el sonido... (entonces) me
estremezco.
El sonido es una fuerza: emocional, perceptual, fsica. Puede excitar los
sentimientos, expresar intenciones y, si es lo suficientemente alto vibra el
cuerpo. EL sonido es omnidireccional; est en todos los sitios. El ojo humano
solo puede enfocar una visin a la vez. Cuando el ojo se mueve, la visin
original se desplaza. El sonido puede colocarse un sonido puede aadirse a
otro sin desplazarlo. El sonido exige atencin. Cuando las personas se
comunican deben participar activamente para entender la informacin auditiva.
No sucede lo mismo con la informacin visual. La escucha es una actividad
dinmica.
Cuando hablamos decimos ver la televisin o visionar una pelcula. La
radio i las grabaciones se emplean a menudo como fondo de otros medios. EL
sonido se da por hecho o a menudo se ignora. La historia del sonido en el cine
y en los medios electrnicos est repleta de ejemplos de audio y de las
personas que lo producen pero se considera una funcin creativa secundaria.
No era hace tantos aos, por ejemplo, que en la mayora de las pelculas
aparecan en los crditos de pantalla para sonido slo el jefe del equipo de
sonido del estudio, sin tener en cuenta todo el personal que contribua al sonido
de la pelcula. De hecho, durante los primeros cuarenta aos del cine sonoro, la
Academy of Motion Picture Arts and Sciencies otorgaba los Oscars al mejor
sonido al jefe del equipo de sonido del estudio de produccin,
independientemente de su contribucin a la banda sonora de la pelcula
premiada. Similarmente, aunque la televisin daba tradicionalmente crditos de
programas individuales para el sonido, las cadenas eran reacias al
reconocimiento extensivo a todo el presonal de sonido que contribua en una
produccin. En un disco, si que apareca algn crdito de produccin, ste era
el del productor. Incluso la radio, que en su tiempo de apogeo fue un medio
completamente dependiente de todos los tipos de sonido, raramente
identificaba a los responsables de la produccin de audio.
Afortunadamente, han cambiado los tiempos para beneficio artstico y
financiero de los medios y del personal de audio. Desde 1971, cuando los
Oscars fueron los primeros premios para los mezcladores de sonido en
particular, los crditos de cine para la produccin de sonido se ampliaron para
incuir, entre otros, a los operadores de jirafa; tcnicos de grabacin; efectos de
sonido, msica, efectos sala y montadores de dilogos; productores de msica
original; y operadores de repicado y mezclas. Y en el ao 1979 la Academia
reconoci la gran importancia del sonido premiando con un Oscar a un
diseador de sonido especfico. Desde entonces, el termino de diseador de
sonido es una denominacin del oficio de aquellos que estn dedicados a
licencias creativas.

Los crditos de sonido en Televisin tambin son ahora ms generosos.


Adems, la mayora de los discos compactos (CD) ponen el crdito del
productor, mezclador, i del ingeniero de masterizacin. A veces tambin se
colocan en la lista a los ayudantes de grabacin. Los Micro-CDs ahora
acreditan por lo menos al productor. Frecuentemente tambin figura el
ingeniero de grabacin. En la radio pblica muchos programas identufican a los
que han contribuido en la produccin de audio.
Todo esto ha afirmado en principio lo que todos los profesionales de los medios
de comunicacin y la audiencia en general hace tiempo que conocen: que la
planificacin y produccin de un diseo de sonido efectivo merece tanto
reconocimiento como los oficios de guionista, montador, jefe de produccin,
director de fotografa, escengrafo y figurinista. De la misma forma que estas
otras funciones, el diseo y la produccin de sonido requiere talento, arte,
imaginacin, meticulosidad y tiempo. El impacto del sonido en la comunicacin
en los medios, igual que en la vida, es vital, potente y fundamental.
El diseador de sonido
El diseo de sonido representa el estilo artstico global del material
sonoro en una produccin de audio. Similar al director de fotografa que es
responsable del aspecto visual global de un video o de una pelcula, el
diseador de sonido es responsable del sonido en general de un video o
pelcula (despus del productor y del director).Esta responsabilidad puede estar
dirigida por un diseador de sonido el cual coordina las actividades artsticas
del personal de sonido, o puede llevarse a cabo sin un director de sonido
nombrado por los diferentes miembros del personal de sonido. Estas personas
tienen varios titulos y realizan tareas como seleccionar y manejar los
micrfonos, operar la consola de produccin, grabar la produccin, crear y
registrar los efectos sonoros, producir msica, grabar los dilogos, editar y
mezclar.
Normalmente las instalaciones ms pequeas requieren una persona
para realizar ms de una funcin. En las operaciones ms grandes cada
individuo realiza una sola funcin, debido generalmente al contrato firmado con
los sindicatos.
A travs de este libro el trmino diseador de sonido se usa
inclusivamente. Esto no es para restar importancia a las diversas funciones
previamente mencionadas, especialmente a la luz de los hechos de que el
termino no se aplica rutinariamente todava, sino para comprender mejor la
nocin de que la persona implicada en la produccin de sonido,
independientemente de su funcin, est involucrada en el diseo de sonido.
Por ejemplo, suponga que filmando una escena romntica, el director
quiere que exista una sensacin de colapso inevitable de la relacin, sin que se
muestre visualmente con crudeza, esto es, sin que se muestre obviamente, la
incompatibilidad de la pareja. El diseador del sonido puede manejar esto de
muchas formas, segn la eleccin del micrfono, su colocacin, o el uso de la
acstica de la sala.
Los micrfonos (micros para abreviar) pueden afectar la cualidad tonal
de una fuente sonora. Un micrfono puede resaltar un sonido melodioso, otro
puede recalcar la fragilidad, e incluso otro puede darle al sonido ms cuerpo.
En esta escena un micrfono que hiciera que la voz de la pareja sonara ms

penetrante o ms spera le transmitira un punto emocional al dilogo,


independientemente de su contenido.
La situacin del micrfono con relacin a la fuente de sonido tambin
afecta a la calidad del sonido. Un micrfono colocado cerca de la pareja
ayudara a crear un sonido clido e ntimo; en cambio un micrfono alejado
ayudar a crear una sensacin de distancia y quiz de frialdad.
El ajuste de la acstica de la sala es otra forma que puede afectar a la
percepcin auditiva. Una habitacin llena de muebles tapizados y cortinas con
gruesos pliegues absorver el sonido, creando por lo tanto una textura ntima y
confortable. Por lo contrario, para ayudar a ensombrecer la rotura de la pareja,
el espacio donde estn representando la escena romntica debe tener
superficies duras como madera y vidrio, las cuales reflejan el sonido, y por lo
tanto crean una textura auditiva ms dura y menos confortable. Adems, el
diseador del sonido podra usar efectos de sonido, msica y procesado de
seal para obtener el efecto deseado en esta escena.
Un prisionero condenado pasa a travs de una puerta de acero que
chirra cuando se cierra. En lugar de cualquier chirrido, el sonido podra
mezclarse con un gemido humano agonizante.
En otra escena, un futbolista que ha sido despedido del equipo despus
de aos de estrellato. Al dejar los vestuarios, pasea por el campo de juego. Se
le aade un sonido de viento seero para realzar el sentido de soledad. Para
intensificar el efecto, el sonido del viento puede mezclarse, sutilmente con el
fragor de la multitud.
Suponga a un director que quiera comunicar, con el sonido, una
sensacin de alienacin y deshumanizacin en una oficina de alta tecnologa.
Una forma de abordar el tema sera orquestar la escena usando sonidos de los
telfonos resonantes con tonalidades futuristicas, el chorro susurrante de
impresoras lser, los zumbidos de mquina en tempo montono, y Muzac
sintetizado en el fondo.
O en una habitacin de hotel apropiada para una crisis nerviosa un
mosquito zumba y el papel de la pared se despega con un rasgado. Por encima
viene el sonido de un hacha que golpea algo disgustadamente blando. En el
pasillo de afuera, el viento alla como los demonios en una parsecucin de alta
velocidad.*
Un diseo de sonido puede desarrolarse a gran velocidadpara toda una
pelcula, programa de TV, anuncio radiofnico, o grabacion musical. Suponga
que la calidad visual general de una pelcula es difana y el director quiere que
el diseo de sonido complemente el efecto visual. Esto puede obtenerse con un
banda sonora que tenga, por ejemplo, una calidad etrea e impresionista. En
un drama policial televisivo, la intensidad sonora se transmite a traves del
rechinar y del repiqueteo del fondo, del sonido de telfonos, sirenas y chirriar
de neumticos para dar a entender la urgncia en el mundo policial. El diseo
sonoro en un anncio radiofnico comparando afeitadoras elctricas, puede
usar el sonido suave y silencioso de un motor cuando est en marcha la marca
anunciante, y motores que suenan quejumbrosamente cuando funcionan las de
los competidores. Ms an, el guionista podra estar instruido para usar
palabras agradables para la marca del patrocinador y palabras malsonantes
para la marca de los competidores. En una grabacin musical, el productor
puede disear el sonido general para expresar cualquier sensacin: pica,
romntica, simple, densa, rica, saturada, con contraste, abrasiva, triste, heavy,

funky, muro sonoro, melodiosa, etc. Y todo el personal de audio que interviene,
desde las personas que escogen los micrfonos (normalmente la primera etapa
de la produccin de audio despus del plan de preproduccin) hasta la gente
que mezcla el sonido (normalmente la etapa final), afecta al diseo de sonido
de alguna manera.
De todas las capacidades necesarias en la produccin de audio, ninguna
es ms importante que la agudeza perceptual para comformar el sonido que se
desea escuchar. En sonido nada hay ms importante que tener buen odo.
Para esto se necesita por lo menos dos instrumentos bsicos: la habilidad de
escuchar discriminadamente y una comprensin de los efectos fundamentales
del sonido en la comunicacin humana.
Escucha
El estmulo que hace que escuchemos da a da no es un fennmeno
excepcional. Podemos poner especial atencin a un sonido particular, a una
sirena o a una explosin, pero en general la funcin sonora es un poco ms
que el fondo en nuestras idas y venidas. Para un diseador de sonido, sin
embargo, su ignorancia sera profesionalmente ruinosa.
Un diseador de sonido debe ser sensible a todos los sonidos,
agradables o desagradables, excitantes o no excitantes, significativos o no
significativos, bien ejecutados o mal ejecutados. Cuanta mas atencin preste al
sonido, mejor podr articular los requisitos sonoros literales estticos de una
produccin.
La sensibilidad innata al sonido cambia, y todo el mundo no tiene la
misma agudeza perceptiva. Por lo tanto, se puede adquirir cierta habilidad con
el entrenamiento, y las orintaciones para la escucha pueden ser de mucha
ayuda.
Qu es y qu no es la escucha
La escucha es percibir el sonido con cuidado y con discriminacin
sensible. Es el pensar sobre el sonido, analizando su calidad, estilo,
interpretacin y matiz. Es tratar de entender qu motiva un sonido. Es participar
de nuevas experiencias sonoras independientemente de su rareza. Es
examinar la reaccin al sonido en relacin a los sentimientos y emociones.
La escucha es no leer mientras tocan msica. No es hablar o gritar
durante un concierto. No es prestar atencin solamente a la imagen de la
pelcula o del programa de TV. No es andar en bicicleta mientras se escucha
en un Walkman. No es caminar por el campo y obsevar. Si no se escucha, el
sonido permanece como parte del entorno; no llega a ser parte de su
consciencia.
Puede argirse que la mayora de los sonidos son parte del entorno y
que ofrecen muchas pequeas satisfacciones estticas aunque no se
escuchen. Algunos sonidos son bastante molestos. Escuchar msica
desagradable de un apartamento contiguo, en un ascensor, en un
supermercado o en una oficina, o escuchar el sonido de una chchara,
disparos, trfico, avin, un tractor, o un martillo neumtico, puede desensibilizar
la agudeza auditiva y dificultar el placer de un sonido que merece la pena.

Por lo tanto parece razonable concluir que la escucha debe ser


selectiva. Tal conclusin debera ser apropiada para la mayora, pero no se
puede aplicar para el diseador de sonido.
Como y para que se escucha
Decir como y para qu se debe escuchar es una tarea fcil. La parte
dificil -la escucha- es suya; el entrenamiento de los odos exige esfuerzo y
aos de prctica.
Se aprende cmo escuchar prestando atencin al sonido donde y
cuando sucede: en diferentes salas, en el trfico, o en los eventos deportivos;
cuando se ducha, viste, come o pasea; durante una conversacin; en un
concierto; descansando en la cama. Se aprende para qu escuchar analizando
los componentes que forman un sonido y la relacin de un sonido con su
entorno.
Tome el sonido de un perro ladrando. Un ladrido es generalmente un
sonido spero y adrupto. Pero los ladridos varan completamente en tono,
sonoridad, ritmo, y contexto. Por ejemplo, los ladridos de tono grave son m
largos que los ladridos de un tono agudo; algunos ladridos comienzan con un
sonido gutural, otros con un ataque pronunciado. Dentro de un ladrido puede
haber un gemido, gaido, gruido, aullido o un bramido. Tambin algunos
ladridos tienen un ritmo regular mientras cambian el commps y producen un
ritmo irregular. Cada uno de estos sonidos le dice algo sobre el perro y su
situacin.
El sonido que hace un pollito mientras nace puede parecer obvio: la
rotura gradual de la cscara del huevo y luego el piar. Pero la escucha de una
incubacin revela ms. El pollito pa dentro del huevo antes de romperlo; el piar
es sordo. La cscara comienza poco a poco a romperse con cortos sonidos de
tentativa, sonidos intermitentes que aumentan en potencia. Con el aumento de
la fuerza aumenta poco a poco en claridad, potencia y rapidez. La ltima rotura
de la cscara suena ms como destrozos cuando el pollito sale al mundo. Una
vez fuera de la cscara, el piar no es sordo, es claro, y fuerte pero no tan
ruidoso como justo antes de nacer.
El sonido tambien cambia con el entorno. El tamao de la sala, los
muebles, la superficie de la pared y los techos; en campo abierto, en centro de
la ciudad o en la orilla del mar, fro y clido, todo afecta de alguna forma al
sonido.
El sonido de la televisin vara de un programa a otro. Con los crditos,
se puede identificar determinado diseo de sonido con determinados
diseadores de sonido. En los deportes, por ejemplo, se pueden distinguir
diferentes estilos de cmo estn captadas las fuentes de sonido, de qu
sonidos estn bien balanceados, y qu sonidos estn enfatizados. A algunos
diseadores de sonido les gusta mantener los niveles del sonido del gento y la
voz del anunciante parejos para mantener el inters. Otros prefieren mantener
el nivel de la gente relativamente bajo de forma que cuando la accin lo
justifique pueda ser aumentado para mejorar el inters.
La mayora de los diseadores de sonido tienen su estilo propio. Algunos
tcnicos de sonido pueden identificar a quien produjo un sonido particular, la
pelcula o el programa en que se us por primera vez, o la coleccin de sonidos
pregrabados de la que fue sacado.

La escucha de sonido en un discurso. Las palabras pueden tener un


significado, pero el sonido las define, En el papel el significado de las palabras
buenos das es claro. Su significado cambia, por supuesto, cuano la tensin
en ciertas palabras cambia, o cuando se dicen con un tonillo, montono,
quejoso o balbuceando; o dicho por un anciano, un joven o un nio.
El sonido de los discursos conviene que sea de calidad de confidencia,
miedo, ansiedad, arrogancia, humor, auto-estima, e inters. Una persona
puede aparecer confidente en una entrevista, pero si el tono de las frases
suben al final, o si hace unas pausas extraas entre las palabras o frases o
tiene una calidad mala como orador, el discurso de la persona se olvida por la
apariencia.
Quiz la msica presente el mayor desafo en la escucha. Las
combinaciones sonoras son infinitas, y su valor esttico llena las necesidades
humanas. El gusto musical es intensamente personal; dos personas
escuchando la misma msica pueden responder de dos formas muy diferentes,
ambas vlidas.
Una sola nota en una guitarra acstica puede producir una variedad de
sonidos y respuestas que depende de que la cuerda sea de tripa o de acero,
que sea pulsada por el dedo o con un pico, que el pico sea de plstico o de
metal, la fuerza con que se rasga la cuerda, el tipo de madera y acabado usado
para hacer la guitarra, la acstica de la sala y todo lo dems. Los violines
tocados en un aire clido tienen un sonido mejor que los viloines tocados en un
ambiente frio; por lo tanto los violines tocados en un ambiente frio tienen un
sonido ms duro que los violines tocados en un ambiente templado. Dos pianos
grandes de concierto pueden ser de la mayor calidad, pero uno tiene un sonido
ms duro propio para msica Barroca o msica Jazz, mientras que el otro
tiene ms tonalidad, ms recomendado para msica Romntica.
Cuando se escucha la msica, note cmo pequeos cambios en los
arranques y sostenidos afectan en los acentos, cmo acelerando o frenando
las notas por una fraccin de segundo de ms o de menos altera el ritmo, cmo
legeras diferencias de tono cambian el balance de la sonoridad, cmo la lnea
de los bajos, el tambor, el relleno, la lrica, el arreglo, la produccin y la
musicalizacin aaden inters y significado.
Escuche varias grabaciones de, digamos, la Quinta Sinfona de
Beethoven. Trate de conseguir los mejores factores posibles, tales como la
calidad de los discos, el formato de grabacin (estreo, mono, digital,
analgico), el sistema de audio y la sala. Puede quedar sorprendido de todas
las diferencias en el sonido y en la interpretacin. Podr preferir el sonido en
una grabacin y la interpretacin en otra. Lo que no significa que una sea
necesariamente mejor que la otra; lo que significa es que basndonos en su
percepcin, una es preferible a la otra por varias razones. Incluso alguna de
ellas puede ser desagradable.
Porque la respuesta al sonido es personal, es dificil determinar normas
y guas de forma que el escuchar es la clave para captar el discernamiento
auditivo. El odo es capaz de un desarrollo constante en su habilidad de
analizar los sonidos complejos. De la forma que desarrolla su sensibilidad
auditiva as ser su nivel de captacin de auditorio. Una forma de acelerar la
realizacin de esta meta es comprendiendo los elementos de la estructura del
sonido y sus efectos en la respuesta.

Estructura del sonido y respuesta humana


Para la mayora de nosotros, el sonido es elemental en nuestras vidas.
El nos da toda clase de informacin cognoscitiva, informacin relacionada al
proceso mental del conocimiento, razonamiento, memoria, juicio, percepcin e
informacin afectiva, informacin relacionada con la emocin, sentimientos y
modo de ser.
Categorias del sonido
Todo sonido puede agruparse en tres categoras: msica, sonido y
habla. Sobre la msica la filsofa Susanne Langer ha escrito que es un tono
anlogo que forma las relaciones de la respuesta humana, una similaridad
lgica al conflicto y la resolucin, a la velocidad, el arresto, la excitacin
terrorfica, la calma, los vacos del sueo...*. La msica puede sugerir tambin
una localidad, un pueblo, un perodo de la historia. Caractersticas similares
pueden tambin hacerse con los sonidos y el habla.
Un coche de bomberos o de polica corriendo por la calle crea una
sensacin de emergencia aunque no suene la sirena. La sonoridad y el
repiqueteo de una campana de iglesia da una sensacin de celebracin,
distinto a un lento y fijo gong. Un lanzador calentando en su montculo
recuerda con frecuencia la dureza de su lanzamiento por el sonido de la bola al
quedar atrapada en el guante del receptor. De este modo, los lanzadores no
estn acostumbrados a la acstica de un puesto en particular y tienen ms
dificultad en interpretar correctamente el impacto de ese sonido. Algunos
hospitales instalan unos tipos especiales de silbido en los tubos de gas de las
salas de operaciones para que los anestesistas puedan asegurarse de que el
flijo del gas o mezcla de gases es la correcta para el paciente. Por ejemplo el
helio es ms ligero que el oxgeno y por lo tanto su velocidad es mayor, de
forma que el pitido emitido por la vlvula ser mayor para el helio que para el
oxgeno. Una mezcla de los dos gases resultar un pitido entre el alto del helio
y el ms bajo del oxgeno. Una finalidad de la llamada caja negra de los
aviones es la de registrar los sonidos de los motores de forma que una
grabacin del sonido y su ejecucin ser interesante en caso de accidente. Los
vigilantes de pjaros estn a la escucha de un trino especial o gorjeo que indica
la presencia de un pjaro determinado. La mayora de los sonidos nos dicen
algo.
La categora sonora que tiene mayor aprecio de las que nos dan
informacin es la palabra hablada. Pero el aprecio del significado del sonido no
hablado en el habla, o sea, la inflexin, tambin juega una parte importante en
la interpretacin de las palabras habladas. Cuando alguno dice, Sabe de que
le estoy hablando? entendemos lo que la frase quiere decir. Pero poniendo la
inflexin en unas palabras concretas el significado de la sentencia puede
cambiar desde una pregunta, para preocupar, para condescender, para
defensa, para peticin, para enojar. Anteriormente, leimos la frase, Buenos
dias que en el papel significa cordialidad. Pero segn como las palabras
suenen sabremos si tiene un sentido sindero o de compromiso.
Aunque existan diferencias claras en cmo la msica, el sonido y el
discurso se conjugan, ellos constituyen los elementos bsicos fundamentales
para la estructura del sonido y para la derivacin del significado.

Componentes de la estructura del sonido


Entre los elementos comunes ms significantes para los distintos tipos
de sonido son el tono, el volumen, el timbre (o calida tonal), el tiempo, el ritmo,
la duracin, el ataque, y el declive. Cada elemento contiene ciertas
caractersticas que afectan nuestra respuesta para un sonido dado, ya que
estas caractersticas son parte de la msica, del sonido, o del discurso.
El Tono se refire a lo agudo o grave de un sonido. El sonido de tono
agudo sugiere con frecuencia algo delicado, brillante, o elevado; el sonido de
tono grave puede indicar algo siniestro, duro o lleno de paz.
El Volumen describe el sonido en los trminos de sonoridad o debilidad.
El sonido fuerte puede sugerir cercana, fuerza o importancia; el sonido suave
puede describir distancia, debilidad o tranquilidad.
El Timbre (o color del tono) es la caracterstica de la calidad tonal de un
sonido. No solamente identifica una fuente de sonido, aflautada, metlica,
timblica, pero tambin tiene cualidades sonoras tales como riqueza, agudeza,
perfilado, y metlica. Las cualidades tonales aflautadas producidas por un
clarinete u oboe, por ejemplo, pueden sugerir algo deseoso, solitario, o dulce.
Un sonido de metal puede implicar algo fro, duro, feroz, amargo, fuerte,
marcial, o grandioso. Un sonido de un timbal o percusin puede indicar drama,
importancia o poder.
El Tempo se refiere simplemente a la velocidad de un sonido. Los
tempos rpidos pueden agitar, excitar, o acelerar; los tempos lentos pueden
sugerir monotona, dignidad o control.
El Ritmo, que se refiere a un patrn de tiempo sonoro, puede ser simple,
constante, complejo, o cambiante. Un ritmo simple puede indicar deliberacin,
regularidad o un montn de complicaciones. Un ritmo constante puede implicar
estupidez, depresin o uniformidad. El ritmo complejo puede sugerir
complicacin o elaboracin. Ritmo cambiante puede crear sensacin de
incertidumbre, vigor o confusin.
Ataque la manera en que un sonido comienza- puede ser duro, suave,
brusco, o gradual. Los ataques duros o bruscos pueden sugerir violencia,
excitacin o peligro. Los ataques suaves o graduales implican algo gentil, sordo
o aburrido.
La Duracin se refiere a lo que dura un sonido. Un sonido corto en
duracin puede indicar inquietud, nerviosismo o excitacin; los sonidos ms
sostenidos pueden crear el sentido de paz, persistencia o cansancio.
El Decaimiento (la rapidez con la que un sonido baja desde un cierto
volumen) puede ser rpido, gradual o lento. Un decaimiento rpido puede crear
un sentido de confinamiento, encierro o definicin; declive lento puede indicar
distancia, suavidad o incertidumbre.
Otros aspectos del sonido como cambio de tono y volumen e
interferencias acsticas tambin afectan a la respuesta. Por supuesto, todos
estos elementos no se escuchan individualmente sino en combinacin.
Alguien hablando en tono alto, voz potente y a un ritmo rpido indica
excitacin, independientemente del sentido que puedan tener las palabras. El
tono bajo, reduciendo volumen y el tiempo lento tambin pueden indicar
excitacin, pero esta combinacin de sonidos sugiere algo ms profundo. Las
palabras dichas en un tiempo deliberado y en una habitacin con

reverberacin, es decir, acsticamente vivas, pueden indicar un contenido ms


pesado que las mismas palabras en un ambiente acsticamente muerto.
Estos mismos factores pueden ser aplicados a la msica y a los sonidos.
Una trompeta o un violn tocados en un tono alto, con volumen y con rapidez
puede sugerir excitacin, agitacin o alegra, quiz agitacin en acsticas
apagadas y alegra en acsticas vivas.
El golpear en una puerta de madera o metlica puede sugerir agitacin o
alegra. Y de nuevo, bajando el tono, reduciendo el volumen y reduciendo los
cambios del tempo cambia la respuesta a algo ms serio, ya sea la fuente de
sonido una trompeta, un violn, una puerta de madera o un montn de latas de
metal.
Que estas caractersticas sean elementales en la estructura del sonido
no sugiere que el diseo de sonido sea prescriptivo o que se desarrolle
aplicando frmulas. De hecho, todos estos consejos pueden tener muchas
excepciones. Sirven para introducir y definir los bloques constructivos del
sonido a partir de los cuales el diseador de sonido modela la estructura y
significado auditivo. Algunas de estas descripciones no son usadas en los
campos asociados a la ciencia y la ingeniera, cuya correlacin veremos en
captulos 2 y 3.
Puntos principales
El diseo de sonido representa el estilo artstico global de la obra sonora en
una produccin de audio.
Un diseo de sonido puede ser desarrollado y producido por un diseador de
sonido nominado o por varias personas del equipo de sonido, o por ambos.
El personal de sonido tiene varios ttulos y ejecutan sus funciones tales como
operadores de consola de produccin, seleccin y operacin de la jirafa de
micrfono, grabacin de la produccin, produccin y grabacin de efectos de
sonido, produccin de msica, grabacin y regrabacin de dilogos, edicin y
mezcla, tambin aportan el soporte tcnico necesario para poder ejecutar estas
operaciones.
Es esencial que el diseador de sonido est en conocimiento del entorno del
sonido y conozca la escucha, cmo percibir el sonido con atencin cuidadosa y
sensible.
El sonido da informacin cognoscitiva (informacin relacionada con el proceso
mental del conocimiento, razonamiento, memoria, juicio u opinin y percepcin)
e informacin afectiva (informacin relacionada con la emocin, el sentimiento
y el modo de ser).
El sonido se puede agrupar dentro de tres categoras: msica, sonidos, y
palabra.
Los componentes bsicos de la estructura sonora incluyen el tono, el volumen,
el timbre, el tempo, el ritmo, el ataque, la duracin y el decaimiento.

La postproduccin de sonido
Funciones

Procesos: Grabacin, Edicin, Procesado, Mezclas y Masterizacin


Personal tcnico y de produccin
El estudio de postproduccin: digital vs. analgico, video vs. multimedia

Funciones
La funcin de la postproduccin (o "sweetening") es organizar espaciotemporalmente y dar forma definitiva a los diversos materiales sonoros que se
utilizan en una produccin audiovisual. En la postproduccin se combinan
elementos musicales extrados de colecciones especializadas, efectos de
sonido grabados en sala, generados electrnicamente o extrados de
colecciones, locuciones y msicas grabadas expresamente -en estudio o "on
location"-, etc. El objetivo de esa combinacin depende del tipo de produccin
audiovisual, de su soporte, de su gnero, del criterio esttico del realizador, etc.
En algunos casos la banda sonora ser un complemento a la banda visual, en
otros ser la gua de los elementos visuales, en otros servir de refuerzo de la
banda visual, en otros duplicar la informacin que llega a travs de la vista,
etc.
La postproduccin es el ltimo proceso en la creacin de una banda sonora
pero no por ello hay que dejar todas las decisiones para ese momento. La frase
"...eso lo arreglarn en la postproduccin" es tpica, tpica, y desgraciadamente
ms habitual de lo que nos gustara. Con una mejor pre-produccin o con
sesiones de grabacin bien planificadas podran evitarse muchos de los
defectos que hay que subsanar en post-produccin.
Procesos: Grabacin, Edicin, Procesado, Mezclas y Masterizacin
En la postproduccin puede ser necesario registrar en soporte magntico
voces, efectos y msicas. Una vez grabados, puede ser necesario adecuarlos y
ajustarlos (espacial, temporal, y tmbricamente) a las imgenes. Tambin ser
necesario conseguir un determinado equilibrio entre todos los elementos
sonoros empleados en cada momento. Finalmente la mezcla definitiva deber
adecuarse al medio de difusin de la produccin as como a las caractersticas
del soporte en el que se distribuya.
Personal tcnico y de produccin
Realizador: es la persona con la que suele trabajar constantemente el equipo
tcnico de sonido. Conoce la produccin como la palma de su mano, sabe lo
que quiere respecto al sonido, confa en el equipo tcnico de sonido y escucha
y acepta sus sugerencias... Si todo eso se cumple, y el equipo de sonido esta a
su misma altura (humana y profesional) la produccin se sonoriza con xito.
Productor: suele encargarse de los aspectos organizativos y financieros de la
produccin, as que slo lo veremos en contadas ocasiones (cuando los gastos
de sonorizacin rompan el presupuesto, o la postproduccin de sonido dure
ms tiempo del previsto...).
"Creativo": personaje del mundo de la publicidad encargado de suministrar las
ideas subyacentes a la produccin. En algunas ocasiones puede llegar a tomar
decisiones que incumban al equipo tcnico... ya se sabe, los creativos son
unos seres taaan especiales...
Asistente de grabacin: el "chico de los cafs" suele ocuparse de preparar los
micrfonos, de tener el equipo a punto, de seleccionar efectos de sonido de

colecciones, y en algunos casos, de realizar las grabaciones menos


comprometidas.
Msico o Montador musical: se encarga de seleccionar las msicas de
colecciones especializadas y adaptarlas a la produccin, o bien de
componerlas segn las necesidades de cada produccin.

El estudio de postproduccin: digital vs. analgico, video vs. multimedia


En un estudio de postproduccin sonora para video es imprescindible algn
tipo de magnetoscopio (al menos un VHS Hi-Fi, o un U-mtic en el que tener
una copia de trabajo con cdigo de tiempo SMPTE, para "arrastrar" el audio).
La presencia de ordenadores, aunque cada vez ms habitual, no es todava
absolutamente imprescindible (todo el proceso se realiza con magnetofones de
bobina abierta).
En un estudio de postproduccin orientado a producciones multimedia puede
haberse prescindido de los magnetoscopios ya que es posible sonorizar video
a partir de copias digitalizadas de la imagen en formato AVI o Quicktime.
Tampoco es imprescindible una cabina de grabacin (puede alquilarse un
estudio durante unas horas para ello), ni tan siquiera una mesa de mezclas.
Desgraciadamente las condiciones acsticas se suelen cuidar muy poco (la
sala de sonorizacin no est acondicionada ni insonorizada, la escucha se
basa en altavoces y auriculares de baja calidad, etc.)
Soportes y formatos del material sonoro.
Audio de CDs
Audio de DATs. Otros soportes de audio en cinta
Archivos de sonido. Formatos. Cambios de formato, downsampling, i reduccin
de bits
EJERCICIOS
Cuando el audio que ha de integrar una produccin no lo grabemos
directamente en sincrona con las imgenes podemos hallarnos en situacin de
tener que transferirlo desde diferentes soportes:
Audio de CDs
Existe una gran variedad de formatos de CD, no todos ellos necesariamente
ligados al sonido. No es ste el lugar apropiado para detallar todas las
variantes, pues seguramente otras asignaturas han entrado en detalle al
respecto.
El CD-Audio almacena pistas de audio muestreado a 44.1 KHz y codificado en
formato PCM a 16 bits, permitiendo ms de 70 minutos estreo por disco. El
CD-ROM permite almacenar unos 650 Mb de datos informticos de toda ndole
y por tanto es posible utilizarlo como soporte de almacenamiento de archivos
de audio digital. Un CD-ROM no puede ser interpretado correctamente por un
reproductor de CDs musicales (como mucho nos escupir rfagas de clicks o
de ruidos tremebundos); en cambio, un CD-Audio s que puede ser ledo
correctamente por un lector de CD-ROMs.
Para extraer audio de CDs musicales e incorporarlos en un proyecto de
postproduccin digital de sonido se pueden seguir 4 procedimientos,
asumiendo que el resultado lo pretendemos almacenar en el disco duro del

ordenador:
a) Tomar la salida analogica del reproductor (line out) y conectarla a la entrada
analgica de la tarjeta de sonido que utilicemos. Activar la funcin de grabacin
de nuestro programa de grabacin/edicin de sonido
b) Utilizar el lector de CD-ROMs incorporado en el ordenador. La conexin
entre su salida y la entrada de la tarjeta de sonido se realiza a travs de
software.
c) Transferir directamente los datos del CD a archivo de sonido, con ayuda de
programas especficos (CD-grabbers).
d) Transferir digitalmente los datos del CD desde un reproductor con salida
digital hacia una tarjeta con entrada digital.
La opcin c) ser siempre la preferida ya que ahorra la redigitalizacin que
tiene que llevar a cabo la tarjeta en los dos primeros casos, y permite mantener
intacta la calidad original de la grabacin en CD, y adems nos ahorra tener
que editar la grabacin puesto que de hecho no hacemos una grabacin sino
una mera "transferencia". El problema es que los lectores de CD-ROMs no
estn suficientemente estandarizados y un programa de captura que funcione
con un modelo o una marca puede no hacerlo con otro diferente. La opcin d)
tambin sera buena, pero nos obligara a editar el fragmento grabado (para
eliminar silencios antes y despus del fragmento que nos interesaba).
Audio de DATs. Otros soportes de audio en cinta
La extraccin correcta de audio de DATs requiere que la tarjeta de sonido
disponga de entrada digital, ya sea SPDIF (conector RCA) o AES-EBU
(conector XLR o cannon). Si no disponemos de ella siempre queda el recurso
de redigitalizar la seal conectando la salida de lnea del DAT con la entrada de
lnea de la tarjeta, pero no es la opcin ms recomendable ya que perderemos
calidad. La transferencia digital en este caso no nos permite conservar las
marcas de posicin (ndices) que puedan existir en la cinta.
La extraccin de audio en otros soportes de cinta siempre la tendremos que
realizar a travs de los conectores de lnea, de manera que la tarjeta de sonido
ser la que digitalice la seal. Cuando el audio proviene de cintas de cassette
no tiene mucho sentido preocuparse por la calidad de la tarjeta, pues la seal
que entraremos tiene suficientes defectos. Digitalizar audio de una cinta nos
permitir, para empezar, tratar de mejorar la calidad del sonido, eliminando el
tpico "hiss" o ruido de soplido.
Archivos de sonido. Formatos. Cambios de formato, downsampling, i reduccin
de bits
Una vez digitalizado un sonido (recordemos muy de pasada que el proceso
requiere un filtrado pasa-bajos, un muestreo temporal, una cuantizacin de la
amplitud de la onda y una codificacin segn un procedimiento preestablecido
denominado "Modulacin en cdigo de pulsos" o PCM) dispondremos de un
archivo que podremos reproducir en aquellas plataformas capaces de
reconvertir su informacin en impulsos elctricos susceptibles de mover el cono
de un altavoz. El archivo tambin podremos manipularlo de la misma manera
que hacemos con otros tipos de archivos, y con la ayuda de programas
especializados, podremos transformar su contenido sin que la calidad se
degrade lo ms mnimo (ntese que dije podremos: algunos programas de

transformacin pueden llegar a degradar notablemente la calidad sonora de los


archivos).
En un archivo de sonido distinguimos entre la cabecera (o header) y los datos.
La cabecera es la seccin inicial del archivo y en ella suele indicarse si se trata
de un sonido mono o estreo, si contiene puntos de buclaje (o loops), la tasa
de muestreo, la duracin, y otras informaciones respecto a los datos que van a
continuacin. Tales datos representan, muestra a muestra, el valor de la
amplitud de la onda sonora. Cuando utilizamos 16 bits para codificar esa
amplitud necesitamos dos octetos (o bytes) por muestra; el orden de ambos
octetos es diferente para un archivo de un ordenador con procesador Intel (bigendian) que para uno con procesador Motorola (little-endian). Esta es una
cuestin muy importante cuando movamos archivos entre plataformas.
Los formatos ms comunes son:
AIFF y SoundDesigner II, habituales de Macintosh. Las principales diferencias
entre uno y otro son que en el AIFF los datos de cada canal estn separados,
mientras que en el SD-II estn intercalados (interleaved) -o sea, una muestra
de un canal seguida de una muestra del otro...- y que el formato SD-II utiliza
unas estructuras de datos propias de Macintosh denominadas resource forks
que suelen complicar las transferencias a PC.
WAV, propio de PCs.
SND, habitual en plataformas NeXT.
AU, habitual en plataformas Sun.
Un cambio de formato por lo general no debe afectar a la calidad del sonido
(siempre que se mantenga la resolucin y la tasa de muestreo), slo afectar a
la cantidad y tipo de informacin que se almacene en la cabecera. De ah que
con un cambio de formato el tamao del archivo no se altere en exceso.
La reduccin de la tasa de muestreo y/o de la resolucin se plantea como algo
inevitable en muchas producciones multimedia ya que permiten comprimir el
tamao de los archivos de sonido hasta hacerlos 4 veces ms pequeos,
aunque el precio a pagar es siempre la degradacin de la calidad.
Cuando reducimos la tasa de muestreo es importante aplicar un filtro antiimagen o (anti-aliasing) para que no aparezcan -a modo de fantasmascomponentes espectrales de baja frecuencia que no tena el sonido original. El
filtrado anti-imagen elimina todos los componentes situados ms all de la
denominada frecuencia de Nyquist (la mitad de la tasa de muestreo). As pues,
una reduccin de tasa de muestreo tendr impacto principalmente en el timbre
del sonido pues eliminar armnicos y componentes espectrales de alta
frecuencia..
Cuando reducimos la resolucin (de 16 a 8 bits, por ejemplo) el impacto se
produce principalmente sobre el rango dinmico de la seal (cada bit que
perdemos lo reduce unos 6 dB). Por tanto, los cambios de nivel entre una
muestra y otra son ms abruptos, produciendose una rugosidad sonora muy
caracterstica. Para tratar de paliarla podemos intentar reducir la dinmica del
archivo original con ayuda de un compresor.
Recientemente han empezado a implantarse con xito diversos esquemas de
compresin de datos que utilizan sofisticadsimos algoritmos "adaptativos"
(analizan espectralmente la seal, elaboran predicciones de lo que puede venir
a continuacin, utilizan conocimientos de psicoacstica para eliminar
informacin redundante o enmascarada...). Tales algoritmos permiten

reducciones de datos considerables (hasta en proporcin 12:1), y sin degradar


en exceso la calidad. El precio a pagar es que es necesario un proceso de
descodificacin que puede originar un cierto retardo en el inicio de la
reproduccin, o un gasto excesivo de los recursos de clculo del ordenador.
Entre estos algoritmos vale la pena conocer el denominado IMA ADPPCM, que
reduce el audio en una proporcin de 4 a 1 sin que suene tan mal como cuando
reducimos a 22 KHz y 8 bits, y el MPEG-3, que puede comprimir en proporcin
12 a 1 con una calidad notable (casi de CD escuchado a travs de un equipo
multimedia).

EJERCICIOS
Siempre que tratemos de comparar dos archivos supuestamente idnticos
puede ser muy til aprovechar la opcin de cambio de fase (invert) de los
editores de sonido. Supongamos que A y B son archivos supuestamente
iguales. Si fuera as, al invertir de fase B, crearamos una "imagen refleja" de A
respecto al eje de amplitud. As, al mezclar a igual nivel [A]+[B invertido]
obtendramos... silencio total. Pero si B no es totalmente igual que A, al mezclar
[A] + [B invertido] apreciaremos todo aquello que tienen de diferente. Utilizad
esta tcnica en los ejercicios que siguen, siempre que tenga sentido hacerlo.
0. Copiar a vuestra zona o al disco local los archivos tema2*.* que hallis en la
carpeta R:\Recursos\PostAudio.
1. Abrir el archivo tema2-m.wav. Convertir a AIFF, a SND. Comprobar si existe
perdida de calidad. Comprobar si existe variacin de tamao del archivo.
Reconvertir uno de los dos a WAV, volver a comprobar la variacin de calidad y
de tamao. Transferir el AIFF y el WAV a un Macintosh y hacerlos sonar. Qu
problemas surgen? Cmo se pueden solucionar? Transferirlos desde el
Macintosh nuevamente al PC. Qu problemas surgen? Cmo se pueden
solucionar?
2.Convertir a IMA ADPCM (con ayuda de SoundForge) y a MPEG3(con ayuda
de alguna aplicacin especfica que tengis en C:\Winaudio\). Comprobar si
existe perdida de calidad. Comprobar si existe variacin de tamao del archivo.
Reconvertir uno de los dos a WAV, volver a comprobar la variacin de calidad y
de tamao.
3. Convertir el archivo tema2-m.wav a 22 KHz. Generar 2 versiones, una con
filtro anti-aliasing de mxima calidad y otro sin filtro. Compararlos entre s y con
el original. Qu diferencias se notan? Re-muestrearlos de nuevo a 44.1 KHz y
comparar con el archivo original. Hay diferencias? Re-muestrear otra vez
hacia 22 KHz el archivo previamente re-muestreado. Volver a escuchar
notando las diferencias. Volverlo a muestrear otra vez hacia 44.1 KHz y volver
a comparar.
4. Capturar un fragmento de audio desde un CD directamente, y desde la
entrada de lnea de la tarjeta de sonido. Analizar las diferencias. Si es posible,
haced dos copias sobre DAT del fragmento del CD, una por va digital y otra
por va analgica. Transferir cada fragmento desde el DAT al ordenador por las
2 vas posibles. Comparar los resultados entre s, y con los fragmentos
transferidos directamente desde el CD. Existe alguna situacin en la que no
se haya producido ninguna degradacin del sonido?
Edicin de sonido
Visualizacin del sonido. El dominio temporal i el dominio espectral.

Claves visuales que nos ayudan a interpretar el sonido.


Edicin destructiva y edicin no destructiva.
Cortes y encadenamientos. Fundidos de entrada y de salida. Fundidos
cruzados.
Eliminacin de ruidos indeseables.
Ejercicios
La edicin de sonido es el proceso a travs del que convertimos en definitivos
los elementos sonoros "en bruto" que se combinan en una produccin
audiovisual. En este proceso es necesario eliminar silencios, toses, ruidos
molestos, re-ajustar niveles, combinar archivos, equilibrar tonalmente
materiales heterogneos, etc.

Visualizacin del sonido. El dominio temporal i el dominio espectral


Durante ms de 40 aos la edicin de sonido se ha llevado a cabo nicamente
"de odo", manipulando cintas magnticas con ayuda de cuchillas y cinta
adhesiva. No obstante en la actualidad contamos con la ayuda de
representaciones visuales tales como los grficos de formas de onda y los
espectrogramas, y la edicin no se realiza fsicamente sobre el soporte del
audio, sino de manera "virtual" sobre representaciones del sonido..
Los grficos de forma de onda nos presentan las variaciones de amplitud de la
onda sonora a lo largo del tiempo. En el eje horizontal se representa el tiempo,
y en el vertical la amplitud, intensidad o incluso la presin sonora. A menudo en
el eje horizontal tenemos una escala en horas, minutos, segundos y "frames", o
bien en compases y tiempos de comps, mientras que en el eje vertical
tenemos decibelios, valores de amplitud de muestra o porcentaje de amplitud.
Los espectrogramas nos representan la estructura intrnseca del sonido. En el
eje horizontal se ubica la frecuencia, y en el vertical la amplitud. Si repetimos
esas representaciones a lo largo de un periodo de tiempo obtenemos un
espectrograma en cascada, en el que podemos observar las variaciones
temporales de la estructura del sonido. Para analizar el espectro nos valemos
del anlisis de Fourier a corto plazo. Esta tcnica puede requerir que ajustemos
algunos parmetros para obtener unas representaciones fiables y de alta
precisin. Por ejemplo, un tamao grande para la ventana de anlisis nos
permite detectar correctamente bajas frecuencias, pero nos reduce la
resolucin temporal.

Claves visuales que nos ayudan a interpretar el sonido


Algunas claves visuales que nos ayudan a comprender el sonido:
En el dominio temporal:
* Relacin amplitud-intensidad
* Relacin forma de onda con timbre... presencia de ms o menos armnicos.
* Discontinuidades y regularidades excesivas como elementos de ruido y
distorsin
* Ruido versus partes estables, vocales versus consonantes.
En el dominio espectral:
* Armonicidad.
* Regiones de relevancia espectral, formantes.

* Presencia de ruidos como picos espectrales fuera de lugar.


Edicin destructiva y edicin no destructiva
La mayora de programas actuales de edicin permiten trabajar de manera nodestructiva. Ello significa que las transformaciones que realizamos con un
determinado archivo no operan directamente sobre l sino sobre una copia real
(un archivo temporal) o virtual (una serie de punteros y variables que
especifican cmo se transforma el archivo original en el momento de
reproducirlo transformado). La edicin no-destructiva permite siempre "volver
atrs" si tomamos una decisin equivocada.
Una opcin muy interesante en los sistemas de edicin no destructiva es la del
uso de regiones. Una regin es una representacin "virtual" -software- de un
fragmento del archivo. Descomponiendo un archivo en regiones es posible
construir un orden nuevo de sus contenidos sin necesidad de alterarlo
fsicamente, ni de copiar y pegar los fragmentos para construir nuevas
ordenaciones. Para ello elaboramos una lista de reproduccin (o playlist) que
especifica qu regiones hacer sonar en cada momento.
En algunas aplicaciones de edicin de sonido podemos hallar diferentes modos
de edicin. La eleccin de uno o de otro depende de los objetivos de la sesin
o del proceso que tratemos de llevar a cabo. Cuando utilizamos las funciones
de cortar y pegar es posible realizar un "pegado-mezcla" (pegando sobre un
fragmento del archivo que previamente contena sonido), una insercin (el
audio que pegamos hace desplazar hacia atrs el que exista en el punto de
insercin), o una substitucin total (cuando en lugar de un punto de insercin
especificamos una regin). Tambin es posible el pegado a una direccin
especfica de cdigo de tiempo. Otra opcin muy interesante es el recorte (o
crop), mediante el que podemos eliminar todo aquello que rodea al fragmento
que verdaderamente nos interesa. Finalmente, la opcin de simulacin de
bobina permite ajustar un punto de edicin escuchando a velocidad lenta el
sonido existente alrededor de dicho punto. Cada opcin depende, en ltima
instancia, del modo de edicin en el que estemos trabajando.
Cortes y encadenados. Fundidos de entrada y de salida. Fundidos cruzados
Denominamos corte a una edicin de material sonoro en la que el audio
aparece o desaparece bruscamente. Denominamos encadenado a una edicin
de material sonoro en la que se yuxtaponen sin solucin de continuidad y sin
solapamiento dos elementos ms o menos dispares. Cuando hacemos un
encadenado la mayora de aplicaciones profesionales pueden ajustar hasta
cierto punto el enlace para que no se produzca un "click" audible debido a
diferencias de fase y amplitud entre los dos fragmentos.
Un fundido es una transicin gradual desde o hacia el silencio absoluto. En el
primer caso se denomina fundido de entrada" (o "fade in"), mientras que en el
segundo caso hablamos de fundido de salida (o "fade out"). Cuando
yuxtaponemos 2 materiales sonoros diferentes utilizando una combinacin de
fundido de entrada y de salida, es decir, cuando los yuxtaponemos sin "corte"
sino con una transicin paulatina, denominamos al proceso crossfade (o
"fundido cruzado").
En un fundido cruzado coinciden en el mismo momento de tiempo dos
fragmentos sonoros diferentes, probablemente procedentes de archivos
diferentes, que se combinan entre s en una proporcin que vara a lo largo del

tiempo. As hablamos de fundidos cruzados lineales, exponenciales, abruptos.


Siempre que realizamos un fundido cruzado hay que vigilar las alteraciones de
nivel que pueden producirse durante l (un fundido cruzado lineal origina una
prdida de entre 3dB y 6 dB).

Eliminacin de ruidos indeseables


Los ruidos continuos y estables (por ejemplo un zumbido de baja frecuencia, o
el "hiss" o soplido de cinta) pueden reducirse notablemente con ayuda de
sofisticados procesos de filtraje disponibles en algunos editores profesionales.
La estrategia suele implicar la seleccin de un breve fragmento -200 milsimas
suele ser suficiente- de ruido solo, a partir del que el programa obtiene el perfil
espectral de dicho ruido y propone un filtro reductor. A continuacin, operando
por ensayo y error unos cuantos parmetros es posible conseguir una mejora
en la calidad sonora del archivo.
Los ruidos transitorios, abruptos, y poco predecibles (toses, respiraciones,
rozamientos de ropa, "clicks", "pops", etc.), es posible eliminarlos siempre que
no coincidan con material "interesante". Estos ruidos que aparecen en
momentos de silencio pueden eliminarse de manera semi-automtica, con
funciones tipo puerta de ruido, en las que establecemos un umbral de
intensidad por debajo del cual lo que suena se atena o elimina. Adems, es
posible establecer umbrales temporales de manera que la puerta de ruido slo
acte si el ruido no es mayor o menor que un determinado valor. En el caso de
crujidos y "pops" de disco de vinilo existen aplicaciones con funciones
especialmente diseadas para resolver aceptablemente el problema. En el
caso de "glitches" o "clicks", tambin podemos utilizar funciones de "declicking" que permiten substituir la muestras defectuosas por, por ejemplo, un
valor aceptable calculado a partir de las muestras adyacentes.
La eliminacin de ruidos indeseables no siempre debe realizarse "por sistema".
En ocasiones el proceso de eliminacin puede llegar a desvirtuar
caractersticas sonoras importantes, en otras ocasiones determinadas
eliminaciones restarn naturalidad a la banda sonora, o provocarn una cierta
sensacin de extraeza. Es necesario valorar en cada caso la necesidad y el
alcance y lmites de dicho proceso.
EJERCICIOS
0. Copiar a vuestra zona o al disco local los archivos tema3*.* que hallis en la
carpeta R:\Recursos\PostAudio.
1. A partir de los archivos tema3-musica.wav, tema3-voz.wav, tema3ruidos.wav tratar de relacionar y descubrir claves visuales que nos ayuden a
interpretar el contenido sonoro de los archivos. Utilizar las opciones de anlisis
espectral para observar la estructura tmbrica de los sonidos.
2. Con los archivos tema3-a.wav y tema3-b.wav experimentar diferentes tipos
de fundido de salida y de entrada. En qu situaciones puede funcionar mejor
cada tipo de fundido?
3. Enlazar los archivos tema3-a.wav y tema3-b.wav por encadenado, y por
diferentes fundidos cruzados. En qu situaciones puede funcionar mejor cada
tipo de enlace?

4. Experimentar diferentes posibilidades de corte y pegado de fragmentos a


partir de los archivos tema3-a.wav y tema3-b.wav. Elaborar un breve fragmento
musical que los combine de diferentes maneras.
5.Tratar de restaurar el archivo tema3-noise.wav con los diversos recursos que
nos ofrece Sound Forge. Dado que consta de varios fragmentos cuyo ruido
procede de fuentes diferentes, separar el archivo original en regiones, generar
un archivo a partir de cada una de ellas y operar sobre cada uno de ellos con la
estrategia ms apropiada. Finalmente recomponer un archivo "limpio" a partir
de unir los diferentes fragmentos.
Transformacin y procesamiento del sonido
Reverberacin y procesado espacial.
Procesado de dinmica: normalizacin, modificacin de la amplitud,
compresin, limitacin, expansin...
Transformaciones tmbricas basadas en retardos: delay, flanger, chorus...
Transformaciones tmbricas basadas en la estructura de los sonidos. Filtrado.
Reverberacin y procesado espacial
La reverberacin es la suma total de las reflexiones del sonido que llegan al
lugar del oyente en diferentes momentos del tiempo. Auditivamente se
caracteritza por una prolongacin, a modo de "cola sonora", que se aade al
sonido original. La duracin y la coloracin tmbrica de esta cola dependen de:
la distancia entre el oyente y la fuente sonora;
la naturaleza de las superficies que reflejan el sonido.
En situaciones naturales hablamos de sonido directo para referirnos al sonido
que se transmite directamente desde la fuente sonora hasta nosotros (o hasta
el mecanismo de captacin que tengamos). Por otra parte, el sonido reflejado
es el que percibimos despus de que haya rebotado en las superficies que
delimitan el recinto acstico, o en los objetos que se encuentren en su
trayectoria. Evidentemente, la trayectoria del sonido reflejado siempre ser ms
larga que la del sonido directo, de manera que -temporalmente- escuchamos
primero el sonido seco, y unos instantes ms tarde escucharemos las primeras
reflexiones (early reflections); a medida que transcurre el tiempo las reflexiones
que nos llegan son cada vez de menor intensidad, hasta que desparecen.
Nuestra sensacin, no obstante, no es la de escuchar sonidos separados, ya
que el cerebro los integra en un nico percepto, siempre que las reflexiones
lleguen con una separacin menor de unos 50 milisegundos. Esto es lo que se
denomina efecto Haas o efecto de precedencia
Cuando manipulamos un reverberador artificial, los principales parmetros son:
Tiempo de decaimiento: se define como el tiempo que tarda el sonido
reverberado en disminuir 60 dB (a menudo se denomina TR60). Las salas
grandes tienen tiempos largos (un segundo o ms), mientras que las
habitaciones de una casa tienen tiempos muy cortos (menos de medio
segundo).
Retardo de las primeras reflexiones: en salas grandes las primeras reflexiones
tardan en llegar ms tiempo que en salas pequeas, pudiendo sonar incluso
como una especie de eco.
Intensidad de las primeras reflexiones: est determinada por la distancia del
oyente y de la fuente sonora respecto a las superficies reflectantes. Si el oyente

o la fuente sonora estn junto a ellas las primeras reflexiones sonarn con
mucha intensidad.
Manipulando los 3 parmetros anteriores podemos crear la sensacin de
tamao del recinto, y de posicionamiento de fuente y oyente dentro de l. Pero
adems, podemos crear diferentes sensaciones relacionadas con los
materiales de las paredes, suelo y techo con parmetros tales como:
Tipo de reverberacin: una reverberacin tipo hall nos proporciona una
coloracin diferente que una de tipo plate, o de tipo room. Otros tipos de
reverberacin como las gete-reverbs o las reverbs no lineales (en las que la
intensidad de las reflexiones no se va atenuando a medida que pasa el tiempo)
pueden alterar poco la coloracin, pero en cambio provocar sensaciones
extraas (ya que son "anti-naturales").
Densidad de las reflexiones: aumenta en funcin de la cantidad de trayectorias
reflejadas que lleguen al oyente (debido a que hay muchas superficies
reflectantes (paredes con angulaciones cambiantes, objetos interpuestos en la
trayectoria del sonido, paredes de materiales poco absorbentes...).
Absorcin selectiva de determinadas frecuencias: puede simularse aplicando
una determinada ecualizacin; la absorcin est directamente relacionada con
los materiales de las superficies reflectantes (una pared de hormign reflejar
muchas ms altas frecuencias que una cortina gruesa, por ejemplo).
Es importante remarcar que cuando uno empieza a utilizar reverberaciones
suele hacer un abuso de ellas. La mejor manera de evaluar su efectividad
consiste en ajustar el equilibrio entre sonido seco y sonido reverberado
(dry/wet) segn cremoas apropiado, y a continuacin eliminar la reverberacin;
si "aparecen" detalles o instrumentos que en la mezcla no se oan quiere decir
que seguramente estbamos a punto de sobre-reverberar. Para hacer este tipo
de escucha es importante configurar el mezclador de manera que en dos
canales tengamos la seal seca, en los dos contiguos la seal reverberada, y
que el procesador nos entregue 0% de seal original y 100% de procesada.
En los ltimos aos han aparecido equipos e incluso programas que permiten
simular el posicionamiento de una fuente sonora no slo en un espacio
acstico y en un eje horizontal, sino tambin en el eje vertical, as como simular
con credibilidad trayectorias de la fuente dentro de ese espacio. Asmismo, es
posible codificar fcilmente una mezcla en formatos envolventes multicanal
(Surround).
Procesado de dinmica
El margen dinmico de nuestro odo y el que se puede generar a partir de
instrumentos acsticos puede alcanzar los 130 dB SPL. En cambio, los
dispositivos de grabacin no tienen tanto margen: los magnetofones de cinta
apenas superan los 60 dB, las tarjetas de sonido domsticas apenas superan
los 80 dB, tan slo algunos de los equipos digitales profesionales permiten una
dinmica de 120 dB... Por tanto, en algunas situaciones en la que necesitemos
grabar instrumentos acsticos (especialmente una orquesta) necesitaremos
comprimir su dinmica (o aprendernos la partitura para subir o bajar faders
segn haya momentos ppp o fff). Bsicamente un compresor atenuar en una
determinada proporcin (ratio) la intensidad de la seal cuando sta supere
determinado umbral (threshold). Si a partir de determinado nivel no se permite
que aumente la intensidad en absoluto, estaremos utilizando un limitador en
lugar de un compresor. El limitador es de utilidad cuando resulta imprescindible

que una seal de audio no supere un determinado umbral (por ejemplo, en


transmisin de televisin, o en grabacin digital -aunque en este caso el propio
dispositivo de grabacin ya realiza la limitacin, con los desagradables
resultados que todos conocemos-).
Las utilidades ms habituales y obvias de los compresores se centran en
situaciones en las que es necesario minimizar los cambios de nivel debidos a
variaciones de la distancia entre el micro y la fuente sonora, o cuando es
necesario grabar sobre un soporte que no permite tanta dinmica como la
fuente original -y protegernos contra las saturaciones-, o cuando es necesario
suavizar los ataques de fuentes sonoras intensas, o cuando es necesario
conseguir una sensacin de alta intensidad sonora sin llegar a saturar y
distorsionar la grabacin (por ejemplo en emisoras comerciales de FM, o en
spots publicitarios). Cuando utilizamos la compresin hay que pensar que el
nivel de salida del compresor puede ser menor que el de entrada, por tanto
tendremos que compensar la salida aadiendo una ligera amplificacin. Para
eso utilizaremos el parmetro output gain. Por ltimo, hay que ajustar los
parmetros de ataque y liberacin del compresor: el primero determina el
tiempo que el compresor tardar en entrar en accin cuando se haya superado
el umbral; el segundo determina el tiempo que el compresor tardar en dejar de
actuar cuando la seal haya bajado por debajo del umbral. Hay que vigilar el
ajuste de ambos ya que un ataque demasiado corto provocar una prdida de
transitorios en los ataques -y por tanto apagar el sonido, perder "pegada"- o
puede generar "clicks", pero si es demasiado largo es probable que la energa
de los transitorios origine una alteracin grande de nivel. Si el tiempo de
liberacin es demasiado corto y la razn de compresin es grande puede
aparecer el efecto de "bombeo": la subida abrpta de graves justo cuando deja
de comprimir -porque an queda un cierto nivel de seal en la cola del sonido,
y sta ya no est siendo comprimida-; si es demasiado largo, puede estar
comprimindose un ataque que no lo necesita, con la consiguiente prdida de
definicin. El odo es quien nos tiene que guiar en ltima instancia a la hora de
ajustar esos parmetros.
Un tipo de compresin que cada vez se utiliza ms es la compresin por
bandas, de manera que slo se aplica a determinadas frecuencias (por ejemplo
a los graves, o a los 7KHz para reducir la sibilancia o siseo de una voz).
Aunque no nos extenderemos en ellos, los reductores de ruido de cinta (Dolby
B y C, Dolby SR y DBX) son sistemas de compresin/expansin selectiva por
bandas de frecuencia.
Las puertas de ruido "cierran" el paso de toda seal que no supere un
determinado umbral fijado por el usuario. Son muy tiles en situaciones de
"directo" en las que hay multitud de micrfonos que pueden captar lo mismo
que el principal, y tratamos de que la seal slo entre por el principal (por
ejemplo, en un coloquio en el que casi seguro que slo habla una persona al
mismo tiempo). Tambin nos ayudan a "recortar" todos aquellos ruiditos no
deseados que se han colado en una grabacin (toses, respiraciones,
rozamientos de ropas, ruidos de ambiente), siempre que no se mezclen con la
seal principal.
Los expansores de dinmica actan de manera inversa a los compresores. A
partir de un determinado umbral expanden el margen dinmico en una
proporcin fijada por el usuario. Su utilidad puede revelarse especialmente en

situaciones en las que la seal original tiene una dinmica demasiado reducida
(por ejemplo, en la escucha de un disco de vinilo) y nos interesa tratar de
ampliarla un poco, o tambin puede ayudarnos a restaurar seales grabadas
con bajo nivel (aunque necesitaremos aplicar otros procesos adicionales, ya
que el expansor por s solo no bastar).
Cuando necesitemos utilizar varios tipos de procesadores de dinmica hemos
de actuar en primer lugar contra los ruidos indeseables (con una puerta de
ruido, por ejemplo). Despus podemos poner el compresor. Finalmente, a
diferencia del uso de otros procesos (reverberacin, retardos), no suele tener
mucho sentido combinar seal procesada en dinmica con seal seca.
La normalizacin consiste en transformar la amplitud de la seal tomando un
determinado valor como mximo y reajustando en la correspondiente
proporcin toda la seal. As, cuando normalizamos a 0, si el valor mximo que
tenemos en nuestro archivo es de -10 dB estaremos amplificando toda la seal
esa magnitud. El problema ms habitual con la normalizacin es la existencia
de ruido de fondo, el cual, mientras est a una amplitud baja no se percibe tan
molesto como cuando es amplificado en exceso (la explicacin es
psicoacstica). A veces ser preferible normalizar a menos de 0 dB, o
comprimir un poco y aprovechar la ganancia de salida del compresor para
aumentar el nivel definitivo. Aumentar la ganancia y normalizar son dos
maneras de referirse a una misma operacin, aunque en muchas ocasiones
empleamos la expresin "normalizar" slo cuando normalizamos a 0 dB de la
escala digital.

Transformaciones tmbricas basadas en retardos: delay, flanger, chorus...


Eco/Retardo
Cuando las reflexiones de un sonido llegan con retardos superiores a 50
milisegundos respecto de la fuente original aparece lo que denominamos eco.
En otros tiempos el efecto de eco se consegua gracias a los 2 cabezales
(grabacin y reproduccin) de un magnetofn. Inyectando un sonido,
grabandolo y reproducindolo inmediatamente obtendremos un retardo cuyo
tiempo estar determinado por la distancia entre los cabezales y por la
velocidad de la cinta (puede oscilar entre 66 i 266 milisegundos). Actualmente
los ecos se consiguen mediante retardos digitales (delays) que nos permiten
tiempos desde una milsima de segundo hasta 3 4 segundos.
Adems del tiempo de retardo, es posible manipular parmetros como:
Regeneracin: la seal retardada vuelve a retardarse, con una regeneracin al
100% la seal no deja nunca de sonar.
Mltiples lneas de retardo (multi-tap delay): es posible retardar de maneras
diferentes pero simultneas una misma seal (por ejemplo, una lnea atena
progresivamente la seal retardada, otra hace un nmero fijo de retardos, con
una dinmica creciente, y otra hace lo mismo pero con una dinmica y una
distribucin de tiempos de retardo aleatorias.
Panoramizacin: permite hacer sonar las repeticiones alternativamente en uno
u otro lado del espacio acstico, o ir desplazndolas progresimente en una
determinada direccin.
Los retardos no slo se utilizan para simular eco:
Con un retardo muy corto (< 30 milisegundos) y una cierta realimentacin
alteraremos claramente la tmbrica. El sonido se har metlico y adquirir

resonancias muy definidas en determinadas frecuencias. Incluso podemos


simular acordes a partir de esta opcin.
Con un retardo entre 20 y 80 milsimas afectamos principalmente a la
presencia del instrumento, ya que nos aprovechamos del efecto Haas para
"sumar" perceptualmente dos sonidos iguales (y fsicamente separados en el
tiempo), de manera que podemos generar la sensacin de sonido ms
"grueso", o de multiplicacin de instrumentistas.
Con retardos mayores de 80 o 100 milisegundos el efecto principal que
obtenemos es de tipo rtmico, por tanto -al menos en el caso de msicas con
ritmos marcados- hay que ajustar el tiempo de retardo al tempo de la msica,
para lo cual existen tablas muy tiles o puede valernos la frmula:
Tiempo de Retardo = 60000 / (BPM x R),
donde R es 1 si el retardo va a negras, 2 si es a corcheas, 4 si es a
semicorcheas, etc. Por ejemplo, a 100 BPM y 4/4, si queremos un retardo a
semicorcheas (R=4) necesitamos un tiempo de 150 milisegundos.
Flanger
Se trata de un filtrado peridico (en forma de peine) de una serie de
frecuencias determinada por el tiempo de retardo (por ejemplo, con uno de 0.5
milisegundos realzaremos 2KHz y sus armnicos), aunque explicarlo con
palabras es poco efectivo. El origen del flanger es mecnico (hay quien se lo
atribuye a George Martin y a John Lennon): si al grabar una cinta en un
magnetofn presionamos con el dedo de vez en cuando y con fuerza variable
la bobina que entrega cinta originamos micro-frenazos que alteran la seal
original. Si grabamos simultneamente en 2 magnetofones, y en uno aplicamos
el "flanging" manual mientras que en el otro no, generaremos el barrido
caracterstico del efecto de flanger.
El flanger proporciona efectos ms llamativos cuanto ms rico (armnicamente
hablando) sea el sonido. Cuando le aadimos feedback lo equiparamos a un
chorus.
Chorus
Se utiliza para "engrosar" la seal, o para simular la existencia de varios
instrumentos sonando al unsono. En esta situacin, un intrprete puede atacar
con cierto retraso y con cierta desafinacin respecto a otro intrprete; eso es lo
que trata de simular, de manera compacta, este efecto. Dado que su
funcionamiento es similar al del flanger (slo que la seal que sale se filtra y se
realimenta) los parmetros de control tambin son similares.
Distorsin
Transforma en cuadradas las ondas de la seal de entrada. Eso origina que el
resultado tienda a ser desagradable y rasposo (ya que la cuadratura de la onda
implica que aparezcan armnicos impares).
Excitador
Tambin denominado enhancer. Genera armnicos pares -a menudo
medios/agudos- de la seal de entrada, de manera que contribuye a hacer ms
presente esa seal en una mezcla sin necesidad de subir su nivel. Tambin
puede utilizarse para generar subarmnicos con el fin de realzar instrumentos

de tesitura grave, o de proporcionarles ms cuerpo. Finalmente puede utilizarse


satisfactoriamente en restauracin sonora de vinilos o de grabaciones
defectuosas.
Transpositor
Inicialmente las transposiciones mecnicas se basaban en alterar la velocidad
de reproduccin de una cinta respecto de su velocidad en el momento de la
grabacin (reproduciendo al doble obtenemos una transposicin de octava
hacia arriba), pero tambin se alteraba la tmbrica ya que esta transformacin
no preserva las estructuras de formantes propias de muchos instrumentos (por
ejemplo la voz) y de ah los conocidos efectos de "pitufo" o de "ogro", en los
que la voz as procesada poco tiene que ver con la original. Muchos
transpositores digitales an operan en base a esa idea de alterar la velocidad
de reproduccin, aunque en los ltimos aos van apareciendo ms equipos y
programas capaces de transponer, incluso en tiempo real, sin alterar en exceso
las caractersticas del instrumento. Las utilidades de un "pitch-shifter"
comprendend: desafinar ligeramente un instrumento (por ejemplo, convertir un
piano "soso" en un "honky-tonk"), engrosar su sonido -con la ayuda adicional
de un pequeo retardo-), crear imgenes estreo a partir de una fuente mono,
corregir algunas alturas equivocadas en una interpretacin por otra parte
valiosa, crear armonas paralelas, o deformar sonidos "naturales" u "originales"
para crear nuevos timbres (pelculas como La caza del Octubre Rojo, Full Metal
Jacket, o Terminator 2 contienen interesantes ejemplos de uso del
transpositor).
La manipulacin de un transpositor implica bsicamente escoger un intrvalo
de transposicin (o varios, en el caso de necesitar crear acordes). Manipulando
otros parmetros como el tiempo de retardo y el grado de realimentacin
podemos llegar a generar arpegios y otros efectos musicales.
Transformaciones tmbricas basadas en la estructura de los sonidos. Filtrado.
El dispositivo ms utilizado para transformar el timbre de un sonido es el
ecualizador. Un ecualizador permite modificar la seal de entrada de manera
tal que determinados componentes de su estructura o espectro salen de l
atenuados o amplificados. Un ecualizador permite, como mximo, manipular 3
parmetros:
Frecuencia de actuacin o central: para determinar sobre qu zona del
espectro queremos actuar;
Anchura de banda o factor Q: para determinar la regin en torno a la frecuencia
central (cuanto ms estrecha ms precisa ser la modificacin -pero
seguramente ser menos evidente-);
Nivel de atenuacin/amplificacin: para determinar la magnitud en dB que
necesitamos realzar o atenuar la banda sobre la que actuamos.
Un ecualizador puede ser:
Paramtrico: si permite manipular los tres parmetros anteriores;
Semiparamtrico: si la Q est prefijada y slo podemos alterar los otros dos
parmetros (habitual en muchas mesas de mezclas);
Grfico: si consta de un nmero fijo de frecuencias (8, 15, 31) de actuacin,
con una Q fija, de manera que tan slo permite modificar el nivel de
atenuacin/amplificacin (con 31 bandas y una Q de tercio de octava puede ser
el tpico ecualizador utilizado para ajustar tonalmente una sala).

Las transformaciones que podemos conseguir con un ecualizador no son


excesivamente drsticas, aunque nos pueden ayudar a atenuar determinadas
frecuencias molestas o exageradamente presentes, a realzar determinadas
caractersticas tmbricas de una fuente sonora, o, en ltima instancia, a
compensar determinadas deficiencias microfnicas o perceptuales (aunque no
debemos poner muchas esperanzas en que nos arregle una deficiente toma
microfnica). La EQ no se debe utilizar por rutina o sistema sino en funcin de
los objetivos sonoros o musicales (claridad, equilibrio tonal, nfasis en
determinados componentes, etc.).
En una mezcla es importante tratar de plantear siempre en primer lugar una
ecualizacin destructiva (en la que se atenan determinadas zonas para
conseguir el deseado equilibrio tonal) antes que una constructiva (en la que
una amplificacin excesiva puede originar un aumento del ruido); en lugar de
amplificar lo que queremos resaltar podemos obtener el mismo efecto
atenuando todo aquello que no nos interesa resaltar. En cambio, en grabacin,
si es necesario ecualizar deberemos preferir antes una EQ constructiva (que
siempre permita volver a atenuar en mezcla) antes que una destructiva (si
hemos atenuado algo, difcilmente vamos a conseguir que "reaparezca"); ahora
bien, hay que conocer en qu zonas se mueve la energa de los instrumentos
para no cometer el error de enfatizar zonas vacas que lo nico que har ser
aumentarnos el ruido de la grabacin. Tambin es importante ecualizar
"contextualizadamente", es decir, teniendo presente el resto de fuentes sonoras
que van a sonar al tiempo que aquella que tratamos de ecualizar: un
instrumento ecualizado puede sonar fantstico cuando lo escuchamos "solo", y
en cambio, en la mezcla en la que est incorporado, ser un factor de
ensuciamiento o de desequilibrio. La ecualizacin debe permitirnos tambin
asentar los instrumentos en un espacio espectral "vertical", de forma que cada
uno de ellos ocupe un "nicho ecolgico" propio y no exista una feroz
competencia entre varios.
Junto a los ecualizadores los filtros son otra herramienta importante para alterar
la estructura tmbrica de un sonido (de hecho los ecualizadores no son ms
que filtros especiales). Un filtro nos permite eliminar una determinada banda o
margen de frecuencias en torno, por encima, o por debajo, de una cierta
frecuencia de trabajo o frecuencia de corte.
Los filtros ms habituales son:
Pasa-banda: dejan intacta la seal que se halle en torno a una determinada
frecuencia central;
Pasa-bajos: dejan intacta la seal que exista por debajo de una determinada
frecuencia de corte;
Pasa-altos: dejan intacta la seal que exista por encima de una determinada
frecuencia de corte (por ejemplo, el filtro de 80/100 Hz que habitualmente
llevan las mesas de mezcla);
Filtros de rechazo de banda o notch: eliminan la seal que se halle en torno a
una determinada frecuencia central;
Filtros en escaln o shelving: atenan o amplifican la seal a partir de una
determinada frecuencia de corte, pero sin ser tan abruptos como los pasa-altos
y pasa-bajos (los controles de graves y agudos de los amplificadores
domsticos y algunas secciones de los ecualizadores de una mesa de mezclas
suelen ser de tipo escaln);

Adems de estas herramientas bsicas es necesario tener presente las


herramientas de transformacin de la estructura tmbrica a partir de procesos
de anlisis y sntesis, como por ejemplo los porgramas Soundhack, SMSTools,
Lemur, etc. Con esta clase de herramientas podemos operar drsticas
transformaciones impensables slo con ayuda de filtros tradicionales. Es
posible obtener ms informacin sobre esta clase de aplicaciones a partir de
estas pginas:
CTI Music at Lancaster University
Mac programs for computer music
Digital Sound Page
HitSquad
Montaje y mezcla
El entorno acstico que requiere una mezcla.
Mezcladores virtuales.
Procesado habitual en una mezcla.
Automatizacin
El entorno acstico que requiere una mezcla
* Acstica de la sala: se requiere una sala con respuesta plana (sin tendencia a
realzar o atenuar determinadas bandas de frecuencia) y apenas reverberada;
en caso de que no cumpla estas condiciones es necesario acondicionarla
acsticamente, y en ltima instancia, procesar la escucha a travs de un
ecualizador grfico de tercio de octava para equilibrarla tonalmente. Adems, la
sala debe estar convenientemente aislada, de manera que no interfieran en la
escucha sonidos ajenos a la mezcla. Es importante, en este sentido, conseguir
aislar o atenuar ruidos propios de los dispositivos de audio (motores,
ventiladores de ordenadores, etc.), para lo cual suele ser til disponer de una
"sala de mquinas" adyacente al control de escucha.
* Monitores de campo prximo y monitores de estudio: escuchar una mezcla
puede requerir dos tipos de escucha: por un lado la escucha "fina", de
precisin, para captar los matices de un instrumento determinado y los cambios
que sobre su sonido puedan realizarse, y por otro lado la escucha "integrada",
en la que nos queremos hacer la idea de cmo sonar esa mezcla en un
equipo medio similar al de la mayora de consumidores. Tambin es muy
recomendable haber realizado al menos una escucha en mono, para verificar
que no se produzcan cancelaciones de fase.
* Niveles de escucha: la respuesta en frecuencias del odo humano sano no es
lineal, ni mucho menos. Cuando el nivel o sonoridad es bajo tendemos a
"perder" bajas y altas frecuencias, tal y como puede observarse en las tpicas
curvas isofnicas de Fletcher y Munson. La respuesta ms lineal de nuestro
odo se da cuando el nivel de escucha es bastante alto (unos 80 o 90 dB SPL),
de ah que para mezclar una produccin audiovisual se tienda a trabajar con
esos niveles. Debe inisitirse en que un exceso de horas de trabajo en esas
condiciones degradan temporal (e incluso a veces permanentemente la salud
del aparato auditivo). La recomendacin a seguir (segn los organismos de
salud pertinentes) es realizar un descanso de 10 minutos cada hora que se
trabaje a 90 dB SPL; no slo lo agradecen nuestros odos, sino que el resultado
del trabajo acostumbra a ser ms satisfactorio.

Mezcladores virtuales
Un mezclador es un dispositivo que permite combinar simultneamente dos o
ms seales diferentes. Para realizar esas combinaciones las seales
discurren por buses, o lneas de transmisin de audio, de manera que cuantos
ms buses independientes tengamos ms mezclas alternativas simultneas
podremos realizar (pensemos por ejemplo que, en una grabacin de un par de
instrumentistas que tocan sobre una base ya grabada cada uno de ellos
requerir una mezcla diferente en sus auriculares, y nosotros en el control
necesitaremos otra mezcla diferente, y si adems hemos de grabar una mezcla
previa sobre la marcha, necesitaremos elaborarla independientemente de la
que escuchamos, e independientemente tambin de la que enviamos a
grabacin...). Por ello, a la hora de evaluar la utilidad de un mezclador, no slo
cabe tener en cuenta el nmero de canales, sino tambin el nmero y tipo de
buses disponibles.
Los mezcladores virtuales suelen ser programas de gestin de pistas de sonido
con interfases grficos que emulan las superficies de trabajo de una mesa de
mezclas de estado slido. Entendiendo la estructura y funciones de una mesa
de mezclas es fcil utilizar el smil para comprender y operar un mezclador
virtual ya que hasta el momento no parecen existir metforas mejores para
disear sus nterfases de usuario.
En un mezclador cabe distinguir:
Entradas y Salidas principales: a grabacin, a altavoces, a auriculares, a
menudo duplicadas.
Entradas y Salidas auxiliares: generalmente asociadas a buses auxiliares, de
subgrupos, de escucha, de insercin, o de retorno (para ingresar seal
procedente de procesadores).
Canales: dentro del canal cabe distinguir el pre-amplificador (para ajustar la
ganancia de entrada), los filtros y ecualizadores, los potencimetros de envo a
auxiliares, los selectores de envo a otros buses, etc.
Buses auxiliares: generalmente utilizados como envos hacia procesadores de
efectos, o hacia auriculares de la cabina de grabacin).
Buses de subgrupos: generalmente nos permiten agrupar un cierto nmero de
canales en un nico par de salida (por ejemplo para regular el nivel de una
batera sin necesidad de operar sobre los 7 u 8 canales que habitualmente se
utilizan).
Buses de retorno: llevan hacia otros buses seales que ingresaron en la mesa
por entradas diferentes a las de canal.
Buses de monitoraje: utilizados para ajustar el nivel de entrada de seal (en
combinacin con la funcin de escucha antes del fader o PFL.
La ventaja de los sistemas virtuales es que los buses pueden reconvertirse, y
reconfigurarse segn las necesidades de cada proyecto, cosa que con los
mezcladores de estado slido convencionales no es posible (el nmero de
buses est prefijado y no se puede alterar). En los sistemas digitales ms
simples slo existen un par de buses estreo (escucha por cascos y salida de
lnea), aunque gracias a la tecnologa Direct-X algunos programas de audio
incorporan ya otras alternativas (vanse por ejemplo los envos a efectos de
Cakewalk).

Procesado habitual en una mezcla

Como siempre, no hemos de esperar a arreglar defectos de grabacin en una


mezcla. El procesado a utilizar, por tanto, debera ser el justo y necesario para
enfatizar determinados aspectos cruciales que dependen del tipo de produccin
audiovisual que estemos creando, o bien para tratar de conjurar problemas que
se pueden presentar en el momento de la difusin de dicha produccin. La
mezcla que vamos a realizar no ser la misma si el destino final es un video, un
CD, un CD-ROM, o un cassette.
Cuando la respuesta en frecuencias del soporte final est restringida (caso del
video analgico tradicional, que no va ms all de 15 KHz, o de los cassettes,
que tambin se quedan en esa regin), o la dinmica est reducida (en un
vinilo no hay ms de 40 dB, por ejemplo), hay que procesar convenientemente
la mezcla (recortando frecuencias, comprimiendo, etc.).
Los procesos ms habituales en la mezcla son:
Ecualizacin: un mismo instrumento en mezclas diferentes puede requerir
ecualizaciones diferentes. La primera regla de la ecualizacin dice que no hay
reglas para ecualizar. Lo que es importante es conocer en qu regiones del
espectro se halla la energa de cada instrumento para poder decidir a qu
"nicho espectral" asignamos cada uno de ellos.
Panoramizacin: sirve para ayudar a distribuir y localizar en el espacio las
diferentes fuentes sonoras. No hay que olvidar que, en combinacin con
niveles diferenciados y con un buen ajuste de la reverberacin, podemos
conseguir crear planos sonoros diferentes. En el caso de sonorizar imgenes
suele estar en concordancia con la posicin de la fuente sonora en el encuadre
escogido en cada secuencia (salvo que haya muchos saltos, en cuyo caso
puede ser preferible no moverlo continuamente). En el caso de grupos
instrumentales suele escogerse una panoramizacin que refleje las posiciones
espaciales habituales de cada instrumento dentro del conjunto. La posicin
central siempre se reserva para los instrumentos que ejerzan un papel ms
importante. Hay que vigilar bien los casos en los que se panoramiza a los
extremos, ya que podemos estar creando "agujeros en el centro". En cualquier
caso, se aplica la misma regla que en la ecualizacin.
Reverberacin: generalmente es necesario crear la sensacin de que diversos
instrumentos, grabados en condiciones acsticas diferentes, comparten el
mismo o parecido espacio fsico; para ello nos valdremos de la reverb y del
panorama. Hay que vigilar la coloracin que nos aadir la reverb (en algunos
casos puede amplificar graves y emborronar la mezcla, por lo tanto, el retorno
de la reverb podramos recortarlo por debajo de 100 Hz). La combinacin de
delay corto + reverb puede resolver mejor que la reverb sola algunas
situaciones.
Compresin: especialmente necesaria en video o en grabaciones sobre cinta
magntica domstica. En mezcla suele comprimirse toda la mezcla de manera
global (previamente podemos haber grabado algunos instrumentos ya con una
suave compresin, o haberlos regrabado aplicndola entonces). Si tenemos
acceso a una compresin por bandas de frecuencia, con un poco de
experimentacin podremos conseguir resultados ms interesantes que
aplicando la misma compresin a todas las bandas. A veces, tras la etapa de
compresin, y ya justo antes del DAT mster podemos insertar un excitador
psicoacstico que devuelva parte del brilllo que el compresor puede habernos
hecho perder, y tambin para conseguir una mezcla ms "presente".

Automatizacin
Para ahorrarnos la tarea de tener que usar las manos y los pies para conseguir
fundidos simultneos de varios canales a diferentes velocidades (y teniendo en
cuenta que no podemos amaestrar a un pulpo para que nos ayude) debemos
recurrir a la automatizacin de los movimientos de faders y potencimetros de
una mesa, ya sea real o virtual. La automatizacin se consegua antao
mediante la conversin de los datos de posicin de los controles de la mesa a
un determinado formato digital especial, y la grabacin de dichos datos en una
pista del magnetofn "master", pero hoy en da cada vez es ms utilizada la
automatizacin MIDI. Mediante los controladores 7 y 10 (volumen y panorama
respectivamente), o mediante otros controladores no asignados que nos
permitan mayor resolucin y que hayamos asociado (va software) a los
controles de nivel y panorama de cada pista es posible grabar (en varias
pasadas incrementales) una secuencia MIDI con la informacin necesaria para
conseguir la mezcla que haga falta, por compleja que sea. Si adems
disponemos de una superfcie fsica de control como una caja de faders MIDI,
podremos realizar movimientos en varios canales simultneamente. Hay que
advertir que no todos los programas de mezcla multipista permiten dicha
automatizacin (Cakewalk, por ejemplo, s; en cambio CoolPro no).
Generalmente durante una sesin de automatizacin se graba una secuencia
inicial aproximada a la mezcla que se pretende, y luego se insertan
correcciones en determinados puntos crticos, o se sobre-escriben movimientos
que no hayan resultado apropiados. Tambin se suele utilizar una funcin de
"configuracin instantnea" por la que podemos grabar la situacin del
mezclador en un momento dado, y luego, en otro momento, recuperarla
exactamente.
Sincronizacin audio-video. Formatos definitivos.
SMPTE.
Postproduccin informatizada.
El sonido y los formatos audiovisuales ms habituales: AVI, Quicktime,
Betacam...

SMPTE
Las siglas significan Society of Motion Pictures and Television Engineering
(sociedad de ingenieros de cine y televisin) y a menudo se asocian al cdigo
ms utilizado para sincronizar audio y video. Para conseguir esa sincrona es
necesario disponer de un aparato -generalmente un magnetoscopio- que
denominamos master, y de uno o ms aparatos -generalmente multipistas de
audio- que denominamos esclavos (slaves). El master es el que tiene el cdigo
de tiempo que gobierna los esclavos; la funcin de stos es siempre la de
seguir el cdigo que en cada momento est reproduciendo el master -o sea,
posicionar sus sistemas de transporte, reales o virtuales, en el punto que indica
el master.
El cdigo SMPTE es una seal digital -impulsos o ausencia de ellos- (grabada
analgicamente), que contiene una referencia temporal absoluta y que suena a
modo de tono electrnico modulado. La referencia temporal absoluta consiste

en una "direccin" indicada como horas, minutos, segundos y fotogramas,


cuadros, o frames (hh:mm:ss:ff), que se graba de manera reiterada (varias
veces por segundo) en las cintas que necesitan sincronizarse. Puesto que la
cinta contiene una marca temporal diferente por cada frame de imagen (slo
existir un frame cuya direccin sea 1h:05m:22s:04f, por ejemplo), resulta fcil
posicionar la cinta en el punto que interese. A partir de esta seal, y con la
ayuda de un sincronizador que la recibe, la descodifica y controla el mecanismo
de transporte de los dispositivos esclavizados podremos conseguir que un
multipistas de audio desplace su mecanismo de transporte (real o virtual)
siguiendo el cdigo del video. El proceso por el cual los esclavos se dirigen al
punto marcado por el master y se posicionan en l se denomina resolucin
(resolving).
Existen diferentes variaciones del cdigo SMPTE, segn el nmero de frames
con el que trabajan:
El SMPTE puro s el sistema americano en blanco i negro. Trabaja con 30
cuadros por segundo.
El SMPTE "drop frame" o "con eliminacin de cuadro" es el propio del sistema
de video NTSC de los EEUU. Trabaja a 29.97 cuadros por segundo. Para
conseguirlo el cdigo trabaja realmente a 30 cuadros por segundo, pero los dos
primeros cuadros de cada minuto que no sea el 00, 10, 20, 30, 40, y el 50 no se
cuentan -se eliminan- (es decir, que por ejemplo despus de 00:53:59:29
pasamos a 00:54:00:02).
El EBU (European Broadcast Union) es el propio de los sistemas de video PAL
y SECAM. Trabaja a 25 cuadros por segundo. Es el habitual en Europa y a
veces se lo denomina SMPTE/EBU.
Finalmente, en cine se utiliza cdigo de 24 cuadros por segundo.
La eleccin de un sistema u otro se hace en funcin del tipo de producto y de
sus lugares de difusin aunque lo ms habitual es trabajar 25 fps. En cualquier
caso hay que procurar no mezclar formatos diferentes en una misma
produccin, dado que las conversiones entre unos y otros no siempre resultan
triviales.
En algunas ocasiones, al trabajar con cdigo SMPTE puede ser necesario
ajustar el denominado offset o diferencia entre el cdigo del master y el del
esclavo. Supongamos que hemos empezado a sonorizar un video antes de que
nos hayan pasado las imgenes. Nuestro audio empieza en 00:01:00:00, pero
cuando recibimos las imgenes nos damos cuenta de que el audio debera
empezar en 00:02:30:00. Si no es fcil mover en bloque toda la banda sonora
(cuando se trabajaba con multipistas analgicos que tenan SMPTE en la
ltima pista era imposible plantear tal movimiento) podemos recurrir a ajustar el
offset (todos los programas serios tienen una opcin para ello), de manera que
el sistema esclavo, cuando reciba el cdigo 00:02:30:00, empiece la
reproduccin correspondiente a su cdigo 00:01:00:00. Estableciendo un offset
de -00:01:30:00 (ntese que el offset sera negativo en este caso, y algunos
sistemas no pueden trabajar con offsets negativos sino que requieren
establecer el 0 absoluto en 24:00:00:00 de manera que nuestro offset tambin
podra ser 23:58:30:00) habremos resuelto el problema. La frmula
Offset = Tc Esclavo - Tc Master
nos permite calcular el valor de offset. Una recomendacin respecto a los
valores de cdigo SMPTE es la de procurar empezar a trabajar con valores

ms all del cero absoluto (por ejemplo 00:02:00:00) para evitar problemas en
el caso de que haya que aadir elementos (sean de imagen o sean de sonido)
al principio de la cinta. Finalmente, cuando necesitemos sonorizar un video no
debemos olvidar que, adems de necesitar disponer de una copia con el cdigo
SMPTE que gobernar los dispositivos esclavos, necesitamos ver
sobreimpresionado en pantalla ese mismo cdigo. As pues cuando solicitemos
una copia de trabajo para sonorizar hay que acordarse de pedir que nos
sobreimpresionen el cdigo, y antes de empezar a sonorizarla es necesario
verificar que el cdigo sobreimpresionado coincide con el que hay grabado en
la pista de cdigo que usamos para controlar los dispositivos esclavos.
Actualmente en configuraciones de estudio en las que se utilizan dispositivos
MIDI se emplea cada vez ms el Midi Time Code (o MTC), que es la versin
del cdigo SMPTE en formato de datos MIDI (en jerga MIDI se trata de
mensajes comunes de sistema o System Common). As, a travs de un cable
midi real o virtual tambin es posible transmitir una seal de direccionamiento
absoluto de tiempo a diferentes aparatos tales como secuenciadores,
workstations de sntesis, editores de sonido, multipistas digitales, etc. En estos
casos suele existir un dispositivo (como el SMPTE Slave Driver de Digidesign,
o la interfase MIDI 2Port S/E de Opcode) que pueden recibir y generar SMPTE
en formato tradicional y convertirlo a MTC, y viceversa. Cuando se utiliza MTC
en una configuracin MIDI tpica es recomendable disponer de un puerto MIDI
exclusivamente para la transmisin de MTC (al utilizar un mismo puerto para
MTC y para mensajes de canal tpicos podemos colapsar el sistema con cierta
facilidad).
Postproduccin informatizada
La postproduccin informatizada requiere no slo de que dispongamos en
formato digital de todos los elementos de la banda sonora, y de una serie de
programas de edicin, procesado y mezcla, sino tambin de que dispongamos
en formato digital de las imgenes que tenemos que sonorizar.
Uno de los entornos integrados ms conocidos es Premiere, pero est
orientado principalmente a la postproduccin de imgenes (si bien con l
podemos resolver satisfactoriamente tambin sencillas postproducciones de
sonido). Postview, pariente de Protools permite la postproduccin de sonido en
un entorno en el que se integra tambin el video digital. En el mbito de los
PCs, cabe destacar Soundscape y SADIE. En cualesquiera de esos casos es
necesario disponer de un hardware especfico que posibilita una conversin
A/D y D/A de muy alta calidad, y la gestin, edicin y procesado del sonido con
gran eficacia.
Otra opcin interesante en estudios domsticos es la de utilizar un programa
reproductor de video digitalizado que pueda al mismo tiempo generar MTC
(Sound Forge, por ejemplo). Este MTC es llevado va software hacia el
programa de edicin o de mezcla multipista (CoolPro, por ejemplo), el cual
habremos configurado como esclavo de MTC. As, cuando hagamos play en el
reproductor de video digital el programa de audio se pondr en reproduccin
sincronizada. Para hacer uso de esta opcin es imprescindible disponer de una
matriz virtual MIDI o programa de rutaje MIDI que facilite el uso flexible de
puertos MIDI virtuales (adems de los reales que nos proporciona nuestra
tarjeta). Hubi Loopback Device es un shareware imprescindible para crear a

travs de software un MIDI patchbay de 4 entradas x 4 salidas.

El sonido y los formatos audiovisuales ms habituales: AVI, Quicktime,


Betacam...
Betacam
Es un formato de 1/2 pulgada, el ms utilizado actualmente para hacer masters
de video. La seal de video se registra "por componentes", es decir, con pistas
separadas para la crominancia (informacin de color) y la luminancia (cantidad
de luz). En un Betacam normal hay tres pistas longitudinales para grabar audio
analgico: Audio-2 (la ms exterior, en la parte de arriba), Audio-1 (ms hacia
el centro, pero adyacente a la anterior), y Audio-3 (exterior, abajo). Esta ltima
suele ser la utilizada para grabar cdigo de tiempo. La calidad sonora del
Betacam es un poco mejor que la del Umtic, ya que presenta 50 dB de
relacin seal/ruido, y un rango de frecuencias entre 15 y 15000 Hz. La
varietdad conocida como Betacam-SP mejora las prestaciones de audio ya que
incorpora el reductor de ruido Dolby-C, cosa que hace aumentar la relacin
seal/ruido hasta 53 dB. Adems, es posible grabar sonido en 2 pistas
adicionales que se codifican y graban conjuntamente con la crominancia. Estas
pistas ofrecen 68 dB de relacin seal/ruido, y un rango de 20 a 20000 Hz,
pero resultan problemticas cuando se necesita editar la imagen "a posteriori"
as que slo pueden utilizarse si la mezcla definitiva de audio se realiza al
mismo tiempo que el volcado (o "repicado") de la imagen.
VHS
No se trata de un formato habitual para masters, pero s para copias de trabajo
que nos permitan ir sonorizando en casa o en un pequeo estudio, y luego
trasladar nuestro trabajo a otro formato profesional con la seguridad de que las
cosas cuadrarn sin problemas. El VHS es un formato de 1/2 pulgada con 1 2
pistas lineales de audio, i en algunos modelos (HI-FI) dos pistas adicionales de
sonido modulado en frecuencia (AFM) igual que el Betacam SP. No lleva pista
dedicada a cdigo de tiempo as que deberemos sacrificar una pista de audio
para insertar el cdigo de tiempo.
Hi-8
Es un formato en cinta de 8mm que permite disponer de dos pistas digitales de
audio PCM (de calidad inferior a la de un CD ya que se cuantiza a menos de 16
bits). Adems de ellas, dispone de otras 2 pistas de audio modulado en
frecuencia. Las pistas PCM son independientes de la imagen.
AVI
Es un formato de digitalizacin de video desarrollado por Microsoft. En un AVI
el audio y el video se almacenan entrelazados, y el software de presentacin se
encarga de separar los dos componentes a la hora de "proyectar" la pelcula
.(generalmente en formato de 320 x 240 pixels, y a una velocidad de 15 frames
por segundo).
Quicktime
Formato de digitalizacin de video desarrollado por Apple. Permite integrar
imagen mvil y fija, texto, animaciones, audio y midi en un objeto nico y

compacto. No es especfico de plataformas Mac aunque para examinar y editar


el contenido de un Quicktime existen ms herramientas (por ejemplo
MoviePlayer) para Mac que para PC.

DAT con cdigo de tiempo


El formato original de la cinta DAT no permite almacenar informacin de tiempo
con precisin de frames. No obstante algunos fabricantes han llegado a
soluciones satisfactorias a base de utilizar el espacio destinado a subcdigos
(donde se graban las marcas de inicio de programa, de salto, de fin de cinta,
etc.) pero para ello son necesarios grabadores/reproductores de DAT
especialmente adaptados (cosa que triplica su precio de coste). Un aparato de
estas caractersticas es capaz de generar SMPTE, de leerlo en cualquier
formato, y de actuar de esclavo o de master segn convenga.
Tambin a finales de los 80 se desarrollaron formatos multipista de audio digital
con soporte en cintas de video S-VHS (por ejemplo, ADAT de Alesis) o 8 mm
(DA-88 de Tascam, por ejemplo) en los que es posible disponer de cdigo
SMPTE alojado en una de las pistas normales (caso del ADAT) o en una pista
especial (caso del DA-88).
Fuentes sonoras a incorporar en una produccin audio-visual (I): voces.
Caractersticas sonoras de las voces.
Rudimentos de microfona para voces.
Caractersticas sonoras de las voces
La voz humana cantada tiene una tesitura que oscila entre los 80 y los 1000
Hercios, aunque la mayor parte de la energa se sita entre los 200 y los 700
Hz.. Segn la ubicacin y rango de la tesitura de una voz cantada distinguimos
como mnimo entre voces de bajo (82/293 Hz), tenor(146/523 Hz), contralto
(174/659 Hz) y soprano (261/1046 Hz). Los armnicos de un cantante pueden
llegar a los 12 o 14 KHz en el caso ms agudo. En cambio, la tesitura de la voz
de un locutor o de un actor no cubre tan amplio espectro, y debemos esperar
que se site entre los 100 y los 500 Hz, mientras que sus armnicos
probablemente no superen los 10 KHz.
Otra caracterstica importante de la voz es que las vocales presentan zonas en
las que se concentra la energa: son lo que denominamos los formantes de la
voz. El nmero de formantes y su ubicacin son diferentes para cada vocal y
para cada registro de voz, aunque no varan en exceso entre cantantes
diferentes de un mismo registro (vara la fundamental, pero no la ubicacin de
los formantes). El primer formante lo hallamos entre 250 y 700 Hz, mientras
que el segundo se sita entre 700 y 2500 Hz. Los buenos cantantes de tesitura
grave y media presentan el denominado "formante del cantante", una zona de
energa especialmente realzada entre 2.5 y 3 KHz que les sirve para poder
sobresalir en medio de una orquesta.
En cuanto a los sonidos que una voz puede generar, en el caso del canto
predominan las vocales, que son sonidos estables, armnicos, de altura
definida... En cambio en el habla existe una mezcla de sonidos voclicos con
consonantes, que son sonidos inarmnicos, transitorios, sin altura definida la
mayora de las veces. Los sonidos de consonantes tienen un espectro de
energa mucho ms ancho (puesto que son ruidos) aunque algunas de ellas
presentan zonas especialmente intensas: la "s" tiene mucha energa entre los 7

y los 8 KHz; la "j" presenta alta energa por encima de los 4.6 KHz; la "r", en
cambio tiene una distribucin mucho ms uniforme.
El momento del da que elijamos para grabar una voz puede determinar en
gran medida su calidad: siempre hay que preferir la tarde o la noche (si por la
maana no se ha sometido la voz a esfuerzos), aunque eso a menudo no lo
podemos controlar nosotros.
En el caso de voces de locutores (y en general, de cualquier voz que no cante actores, por ejemplo-) hay que valorar en primer lugar la inteligibilidad, ya que
un locutor suele decir algo para que sea entendido por los espectadores. La
inteligibilidad depende de diversos factores: prominencia de las consonantes,
caractersticas espectrales de la voz, ritmo, articulacin, vocalizacin... Puesto
que las consonantes son bsicamente ruidos y de ellas depende en primer
lugar la inteligibilidad, cualquier interferencia o ruido que aparezca en una
grabacin puede afectar gravemente su inteligibilidad debido a un efecto de
enmascaramiento.
Las cualidades tonales de una voz suelen determinar su eleccin o no para
determinados roles. Por ejemplo, dado que una voz grave tiende a ser tomada
como ms creible (existe evidencia emprica al respecto, no se trata de
suposiciones), esas voces sern las preferidas en spots comerciales que
pretendan ofrecer datos que orienten las decisiones de los consumidores. En
este mismo sentido, debemos considerar desacertadas determinadas voces
aparentemente infantiles que se utilizan en otros tipos de spots, pues al no ser
identificadas como tales producen efectos contrarios a los deseados.
Finalmente, otras caractersticas a valorar pueden ser que no tenga un exceso
de sibilancia (o sea, que los sonidos de "eses" no sean excesivamente
prominentes) y que no tenga unas plosivas explosivas (o sea, que los sonidos
de "bes" y "pes" no hagan que saltemos de la silla), aunque estos dos defectos
pueden paliarse con ayuda de la tecnologa.
Rudimentos de microfona para voces
El primer factor a controlar en una grabacin de voces es la comodidad del
cantante o del locutor. Si no se siente bien, confortable, en un ambiente
positivo destinado a extraer lo mejor que pueda dar de s, por muy bueno que
sea l o ella, y por muy extraordinario que sea nuestro equipamiento, no
conseguiremos un resultado decente. En la comodidad juega un papel
importante la comunicacin, no slo la verbal (ayuda mucho que el productor
sepa lo que la voz debe hacer y cmo, y que se lo sepa transmitir), sino
tambin la no verbal (l o ella vern a travs de una ventana las caras que
ponemos en el control); tambin es importante que reciba una buena mezcla de
referencia, con el equilibrio y el nivel que desee, y en unos auriculares
cmodos; y que pueda pedirnos en cada momento lo que necesite, tanto en
cuestiones sonoras como a otros niveles (descanso, atenuar la refrigeracin,
beber...). Si todo esto lo hemos cuidado al mximo, tendremos un 30% del
xito garantizado.
Cuando la grabacin se realice en un lugar cuyas caractersticas acsticas
sean beneficiosas para la voz, y nos interese aprovecharlo, ser preferible un
diagrama polar omnidireccional pues captaremos en mayor medida que con
micrfonos direccionales la reverberacin y la coloracin del recinto. En estos
casos, adems, puede ser recomendable el realizar una toma estereofnica,
que an preservar ms tales caractersticas. Si no nos interesa la acstica del
recinto, adems de utilizar un micro direccional podemos ayudarnos de

pantallas aislantes y/o atenuadoras de reflexiones para garantizar una toma


con el mnimo de coloracin debida al recinto (aunque su uso contribuye a
disminuir la comodidad del cantante o locutor).
En el caso de grabar voces en exteriores hay que prestar especial atencin a
los ruidos de ambiente: podemos reducirlo considerablemente con micrfonos
direccionales (especialmente de diagrama polar hipercardiode o
supercardioide) y ubicando -siempre que sea posible- la fuente sonora de
frente a las fuentes de ruido (para captarla de espaldas a l). Tambin el uso
de un filtro de graves (pasa altos ajustado entre 80 y 100 Hz) es una opcin til
a considerar para reducir el ruido de trfico, manipulacin del micro, roces de
ropa, etc.
La eleccin de un micrfono u otro es materia bastante personal, e implica un
conocimiento profundo del comportamiento de los micros que haya a nuestra
disposicin. En estudios, especialmente para postproduccin de video, se suele
trabajar con un micro de condensador de diafragma grande (tipo Neumann U87
o U47) colocado a un palmo de la boca, para cantantes pop y actuaciones en
directo se prefieren micros dinmicos como el clsico Shure SM58, y en
determinado tipo de rodajes o de programa de TV alguno de tipo lavalier (micro
de solapa). Adems del micro elegido, y de su ubicacin (podemos alejarlo si
se trata de grabar locuciones que luego irn en segundo plano), juega un gran
papel en el sonido final el pre-amplificador (o previo) utilizado. Siempre que
dispongamos de un previo decente externo a la mesa de mezclas es
aconsejable utilizarlo. El principal objetivo del previo es amplificar la seal del
micro lo necesario para que sea grabada con el nivel ptimo, pero adems, el
previo introduce coloraciones que en muchos casos son intencionadamente
buscadas. Los previos a vlvulas "aejos" parecen dar mayor calidez a la voz
que los previos digitales ms modernos (pero tambin pueden introducirnos
ms ruido e interferencias). En el caso de utilizar micros direccionales debe
prestarse especial atencin al efecto de proximidad: a medida que la fuente
sonora se aproxima al micro se realzan ms las frecuencias graves.
Los objetivos de la grabacin que ms debemos cuidar son:
Obtener una calidad tonal lo ms parecida al original, al tiempo que resaltamos
aquello que la voz pueda tener de peculiar e interesante (para hacer la
comparacin es conveniente el ejercicio de escuchar la voz "al natural", en la
propia cabina de control o en la sala de grabacin si es tonalmente neutra y
"guardarnosla en la memoria" para hacer comparaciones cuando ajustemos el
micro, o cuando la ecualicemos).
Obtener una serie de ellas con suficiente coherencia tonal, estabilidad de
niveles, calidad y claridad sonora entre ellas, de manera que aunque la banda
sonora contenga fragmentos grabados en momentos diferentes ello no sea
aparente.
Especialmente en el caso de dilogos y locuciones, obtener tomas con el
mximo grado de inteligibilidad posible. Podemos mejorar la inteligibilidad
amplificando un poco la banda en torno a los 2 KHz (o en general amplificando
3 o 4 dB por encima de esa frecuencia), pero tambin nos puede ayudar el
enlentecimiento artificial del ritmo de pronunciacin (cuando ello sea posible).
Tambin la eleccin de una reverb bastante corta, poco prominente, e incluso
con un predelay de unos 35 ms (para engrosar el sonido gracias al efecto
Haas) puede jugar en favor de una mejor inteligibilidad.

Para paliar la sibilancia pueden utilizarse de-essers, una especie de


compresores especializados que se encargan de recortar la banda en torno a 7
u 8 KHz. cuando existe un exceso de energa en ella (de hecho con muchos
compresores normales es posible conseguir dicha funcin an cuando no se
especifique en su panel de control). El problema de las plosivas puede paliarse
con ayuda de un filtro anti-pop (no quiere decir que elimine a los cantantes pop)
o en su defecto con una pantalla elaborada con ayuda de alambre y una media
o panty, que se colocan justo ante el micro, entre l y el/la vocalista. Tambin
puede ser til en este caso descentrar ligeramente el micro, de forma que en
lugar de apuntar al centro de la boca apunte a la mejilla o a la barbilla. Las
respiraciones exageradas habr que eliminarlas "a mano" o con ayuda de una
puerta de ruido a posteriori (si hemos hecho la grabacin sin utilizarla).
Respecto al procesado, casi siempre es preferible aplicarlo "a posteriori" pues
al aplicarlo en grabacin resultar imposible o muy difcil restaurar el original no
procesado si ello es necesario. En todo caso, una puerta de ruido y una ligera
compresin (dado el gran margen dinmico de la voz) son los tipos de
procesado que s pueden recomendarse en muchas ocasiones en las que hay
que grabar una voz. En caso de usar compresin en la grabacin suele
preferirse un buen compresor analgico "aejo" o "con solera" (vintage) que
aada calidez a la grabacin digital, en lugar de uno de calidad media o
incorporado en la mesa o en el sistema de grabacin. Tambin puede ser util
en contadas ocasiones, siempre que no se abuse, el ayudarse de un
transpositor para corregir desafinaciones.
Finalmente, si somos los responsables ltimos del sonido debemos asumir
dicha responsabilidad exigiendo repetir las tomas tantas veces como sea
necesario para disponer de al menos una que sea satisfactoria (verdad que se
hace lo mismo con la imgen y nadie pierde la calma?) siempre que la
deficiencia en las tomas no se nos puedan achacar a nosotros mismos y a
nuestros aparatos.
Fuentes sonoras a incorporar en una produccin audio-visual (II): efectos
Tipologias de efectos.
Estrategias de creacin de efectos.
Colecciones de efectos. Recursos disponibles en Internet.
Una primera definicin, algo reduccionista, de efecto de sonido sera la de
considerar como tal cualquier reproduccin de sonido que trate de acompaar
a la accin y proporcionar realismo a una produccin audiovisual. Los efectos
pueden representar objetos, movimientos en el espacio o en el tiempo, estados
emocionales, procesos de pensamiento, contacto fsico entre objetos,
escenarios, entidades irreales... En algunos casos los efectos pueden servir
para ahorrar escenas peligrosas, econmicamente costosas o muy difciles de
filmar; es lo que se denomina funcin elptica del efecto de sonido.
En general los efectos ms utilizados a lo largo de la historia del teatro eran
principalmente aquellos encargados de simular sonidos de la naturaleza (ya los
griegos utilizaban efectos de sonido en sus obras de teatro, por ejemplo hacan
sonar "truenos" cuando apareca el dios Jpiter airado), y ms adelante
aquellos destinados a reforzar situaciones cmicas. A partir de la expansin de
la radio en los aos 30 los efectos de sonido recibieron un nuevo impulso: era
necesario conseguir el mximo realismo en un medio dramtico que no
contaba con la imagen como factor principal para ello, y tambin era necesario
eliminar los fatdicos silencios muertos que daban la sensacin de que la

emisora no funcionaba bien. Los "efectistas" de la poca, adems de los


mecanismos tradicionales de generacin de efectos (planchas metlicas,
muelles, instrumentos de percusin, bocinas, silbatos, etc.) podan disponer de
efectos previamente grabados en discos de piedra o bakelita (incluso haba
tocadiscos especiales de 2 brazos para reproducciones simultneas de 2
efectos!). Finalmente, los efectos de sonido llegaron al cine y a partir de la
pelcula Aleluya de King Vidor (1929) fueron utilizados de manera dramtica y
no como simple contrapartida aural de la imagen.
Tipologias de efectos
Considerados segn su origen pueden ser:
Efectos originales, procedentes de las tomas de sonido directo o sonido de
produccin. Estos efectos pueden ir en sincrona con determinadas imgenes o
ser independientes de ellas, si bien su origen sigue siendo los lugares del
rodaje. Cuando la planificacin de la produccin establece la grabacin de
sonidos originales hay que conseguirlos con la mxima nitidez sonora posible
(si es necesario hay que aprovechar los ratos de descanso o cuando an no ha
empezado la sesin de filmacin). En situaciones de rodaje tambin hay que
prever la grabacin correcta de aquellos sonidos cuya generacin no puede
repetirse (destrucciones de elementos, multitudes, etc.), as como de aquellos
sonidos de ambiente que pueden ayudarnos a establecer un determinado
entorno acstico durante la postproduccin (esta grabacin de sonidos
probablemente tiles, pero no indicados en el guin, se denomina wildtracking).
Los efectos originales tienen los inconvenientes de que es difcil hallar lugares
lo suficientemente tranquilos y silenciosos que garanticen una buena
grabacin, y que muchos eventos naturales son poco controlables y
difcilmente repetibles. Por todo ello los efectos originales a menudo requieren
de algn tipo de post-procesado antes de incluirlos en la banda sonora.
Efectos de sala (en ingls se denominan foley en honor de uno de los pioneros
en su creacin: George Foley). Son sonidos que reemplazan los sonidos de
ambiente y los efectos que se pierden cuando se doblan dilogos o se graban
en directo. En general los efectos de sala acostumbran a ser pasos, roces de
ropa, ruidos domsticos, puertas que se abren y se cierran, etc, y para su
grabacin los estudios disponen de suelos de superficie variable (un metro
cuadrado de grava, otro de arena, otro de cemento, otro de hojas secas...) as
como de salas de almacenaje de elementos tiles (fragmentos de metal, latas,
zapatos, vidrios, etc.). Efectos tpicos de sala son los pasos de un caballo
creados a partir de golpear cocos contra un suelo de tierra o de grava, la lluvia
creada a partir de volcar tierra sobre un papel situado encima del micrfono, los
sonidos de comida frindose creados a partir de poner trapos mojados sobre
una superficie ardiente, los truenos creados a base de sacudir un globo lleno
de perdigones o bolitas de plomo, o el fuego creado arrugando papel celofan.
Los efectos de sala no siempre tienen que ser lo que definitivamente vaya a
sonar: posteriormente pueden procesarse o acumularse unos sobre otros hasta
conseguir el tipo de sonido que mejor se adece.
Efectos de colecciones o de bibliotecas. Las colecciones en CD y CD-Rom son
el recurso ms utilizado a la hora de construir la banda sonora de una
produccin audiovisual. Suelen estar organizadas temticamente (con
categoras tales como: militares, transporte, naturaleza, domsticos,
electrnicos, exteriores, humanos, etc.) y cuentan con diversas opciones de
indexacin para facilitar su bsqueda (por nombres, categoras, elementos

relacionados, sinnimos, etc.) que cada vez ms se valen de la ayuda de un


soporte informtico (algunas colecciones incluyen un programa de gestin de
bases de datos y una base de datos relativa a los sonidos que componen la
coleccin). Adems de poderlos utilizar "tal cual", podemos tomarlos como
punto de partida y refinarlos, a base de edicin y procesado, hasta que se
ajusten a lo que necesitamos exactamente. Los inconvenientes de muchas de
estas colecciones son: su precio, ya que para poder ofrecer unos sonidos
completamente libres de derechos de autor es necesario pagar hasta 8000
pesetas por CD, y su variedad, que exige invertir muchas horas en escucharse
y conocerse lo que contienen (cosa que en muchos estudios es trabajo propio
de los asistentes de grabacin) ya que guiarse slo por los ttulos de las pistas
no garantiza la explotacin de la coleccin al 100%. Colecciones interesantes
son las de CBS, Hanna-Barbera, Lucasfilms, BBC, Valentino, Prosonus,
Hollywood Sound Ideas (una parte de la cual est disponible previa solicitud en
el IUA), Audivis (tal vez la ms asequible en Espaa, pues hasta en los
grandes almacenes podemos hallar sus discos), o Network Production Music
(tal vez la ms extensa: 12000 efectos que ocupan 64 discos). Algunas de
dichas colecciones ofrecen un servicio "a la carta", de manera que slo
adquirimos exactamente aquellos sonidos que necesitamos.
Efectos electrnicos o sintticos. Podemos considerar que la pelcula Dr Jeckyll
& Mr. Hyde de Reuben Mamoulian (1937) fue la pionera en el uso de dichos
efectos (se utilizaron tcnicas desarrolladas por Fischinger que consistan en la
manipulacin de la pista ptica de la pelcula -pintndola a mano, por ejemplo-).
Ya en los aos 50 algunos creadores de efectos de sonido se construan
mquinas especiales para generar determinados tipos de efectos (como la
Foster Gun, que generaba sonidos de pistolas, caonazos, explosiones...), y
tambin son de aquella poca los primeros sonidos verdaderamente sintticos:
la banda sonora de Forbidden Planet es un ejercicio pionero pues consta
ntegramente de sonidos electrnicos generados por los compositores Lois y
Bebe Barron. No obstante, habr que esperar hasta los aos 70 para que los
sintetitzadores y otros dispositivos electrnicos se conviertan en una
herramienta importante en la creacin de efectos de sonido. Aparte del uso del
sintetizador como generador de tonos y texturas electrnicas o
pseudoacsticas, es muy importante la adopcin del sampler como herramienta
universal de edicin, combinacin, procesado y colocacin "en vivo" de efectos.
Considerados segn su relacin con la imagen a la que acompaan
distinguimos entre:
Sonidos Naturales: cuando el efecto es el sonido del objeto que est sonando.
El sonido natural es un sonido real, sin ornamentos. Son ms propios de
documentales y de reportajes. En cambio en producciones de ficcin las
expectativas del pblico hacen que se tienda a substituir los sonidos naturales
por otros que no lo son (ya que el sonido original -de una pistola del 38, por
ejemplo- nunca es suficientemente potente, agresivo o contundente, y debido
tambin a que en experiencias previas el pblico ya se ha acostumbrado a
aceptar esa falsificacin de la realidad como algo normal y necesario para
incrementar el disfrute de la produccin audiovisual). Cundo llegaremos al
punto en el que el sonido no tendr nada que ver con la fuente que lo genera
en la pantalla?
Sonidos Caractersticos: cuando el efecto es una imitacin de lo que sera el
sonido natural del objeto que est sonando. Un sonido caracterstico puede

reconocerse, pero no es el original de la fuente sonora sino aqul que se


supone, o que se supone que el oyente puede suponer, que ha de tener la
fuente sonora. La deformacin o imitacin de un sonido caracterstico se hace
con el fin de intensificar el impacto sobre el espectador. Un ejemplo: durante
muchos aos los anuncios de automviles en USA utilizaban todos el mismo
sonido, el de un Deusenberg del 35, debido a que su timbre no enmascaraba
las voces de los locutores; para el oyente -especialmente si no era demasiado
entendido en sonidos de coches- el efecto utilizado era apropiado, aunque no
fuera el que corresponda en realidad al auto que se publicitaba.
Los sonidos caractersticos podemos subdividirlos en:
Sonidos imitativos: aquellos que tienen propiedades fsicas similares a las del
sonido al que tratan de imitar, y se generan de manera parecida a ellos. Por
ejemplo: los pasos de caballo obtenidos a base de golpear cocos, o los pasos
sobre la nieve obtenidos a base de pisar un suelo especial cubierto de harina
de trigo.
Sonidos interpretativos: aquellos que no guardan ninguna semejanza con el
sonido que tratan de substituir. Por ejemplo, un trozo de corcho empapado en
keroseno puede servir para caracterizar un grito de una rata. Es en la habilidad
para la creacin de esta categora de sonidos donde podemos distinguir a los
autnticos especialistas: ellos son los que viendo un determinado objeto o
material pueden imaginar que tipos de sonidos pueden llegar a crear.
Segn su funcin en una produccin audiovisual, distinguimos entre:
Sonidos objetivos: aquellos que suenan a consecuencia de la aparicin de la
imagen de un objeto que emite el sonido. Un sonido objetivo suena como se
supone que sonar el objeto que aparece en la imagen (no necesariamente
suena exactamente como lo hace en la realidad).
Sonidos subjetivos: aquellos que apoyan una situacin anmica o emocional de
la trama o de los personajes, sin que necesariamente el objeto productor del
sonido aparezca en la imagen.
Sonidos descriptivos: aquellos que no representan a ningn objeto de los que
aparecen en la imagen, sino que son abstracciones o idealizaciones de los
sonidos supuestamente originales (aquellos que podramos escuchar).
Podemos considerarlos como sonidos metafricos.
El silencio podemos entenderlo como un tipo de sonido especial. Su uso
dosificado puede generar expectacin, o un impacto emotivo fuerte cuando el
desarrollo lgico de la escena hace esperar un sonido fuerte. Al igual que
sucede con el resto de efectos sonoros podemos considerar dos funciones del
silencio:
Objetiva: corresponde a la ausencia real de sonido en la narracin (situacin
que estrictamente considerada resulta muy poco habitual... salvo que la accin
transcurra en el espacio -pensemos en 2001 una odisea del espacio- o en una
cmara anecoica, o que el protagonista est sorodo, siempre existir un ruido
de fondo, un ambiente...).
Subjetiva: cuando el silencio se utiliza para crear un ambiente emocional
concreto. Hay que vigilar y no abusar de esta funcin porque el espectador
puede llegar a pensar que existe alguna deficiencia en la banda sonora, o en
los dispositivos de amplificacin del sonido del lugar en el que se exhibe la
produccin. Adems de generar expectacin o de contrastar escenas o
mensajes visuales puede llegar a comunicar situaciones de desolacin, muerte,

emociones desagradables... pero tambin tranquilidad.


Estrategias de creacin de efectos
En los escenarios de la accin es recomendable grabar todos los sonidos que
puedan parecer interesantes. En caso de hacer wildtracking es preferible
utilizar pistas diferentes de las que utilicemos para grabar los dilogos o los
efectos sincrnicos, o incluso cintas diferentes. Tambin es util captar en los
escenarios de la accin los denominados room tones o sonido de ambiente.
Hay que pensar que incluso una habitacin aparentemente tranquila y
silenciosa tiene un room tone. Disponer de esos sonidos puede ayudar a
homogeneizar la sonoridad de la banda sonora, a minimizar diferencias tonales
cuando los dilogos procedan de tomas diferentes, y en generar,
proporcionarn un mayor realismo. Cuando no dispongamos de esos sonidos
es recomendable crear un sutil colchn sonoro a base de trfico distante (si la
accin es urbana), o zumbidos y rumores domsticos (si la accin es en
interiores), aderezado con ruidos espordicos "ad hoc". Finalmente, an
cuando los grabemos juntamente con dilogos, es interesante que tratemos de
conseguir los efectos sincrnicos aislados. De esa manera podremos
mezclarlos con los dilogos al nivel necesario y no al nivel determinado por la
posicin y ubicacin de los micrfonos en el momento de captar el dilogo. En
todos estos casos debemos ir documentando y marcando debidamente las
pistas que grabamos para facilitar la posterior bsqueda y gestin de todo ese
material.
Cuando necesitamos crear efectos "de la nada", es recomendable tratar de
partir de algn sonido vagamente parecido o relacionado con el que
necesitamos. A partir de l siempre es posible experimentar con algunas
estrategias para convertirlo en un autntico efecto:
Variar la velocidad de reproduccin o la altura.
Comprimirlo y expandirlo en el tiempo.
Filtrarlo o ecualizarlo selectiva y drsticamente.
Transformarlo con procesos basados en retardos (flanger, chorus, phaser...).
Editarlo en fragmentos pequeos y re-ensamblarlo a modo de mosaico.
Acumular varias capas de sonidos similares o no, para generar uno de nuevo y
diferente.
A la hora de generar efectos debemos pensar en el gnero al que pertenece la
produccin que sonorizamos pues no es lo mismo crear un disparo casual para
una comedia que crear uno para una pelcula policiaca. En general ser util
tratar de comprender las convenciones propias del gnero (por ejemplo:
exageraciones y sonidos pasados de vuelta para dibujos animados, sonidos
etreos, electrnicos para fantasa, efectos vulgares y manidos para comedias
de situacin de infinitos captulos...). Tambin puede ser de gran ayuda el
pensar en trminos de sensaciones, en lugar de tratar de preservar a toda
costa el realismo (en otras palabras: disociar el nombre del efecto de su
contenido sonoro): si la sensacin conseguida por el efecto es acorde con el
tono de la accin y con el objetivo del director el efecto puede ser aceptable
(por ejemplo, para sonorizar una explosin atmica puede llegar a servir el
ruido de unas grandes cataratas), y el espectador no se apercibir de que el
origen del sonido no se corresponde con lo que ve. Siguiendo con esta misma
lnea de recomendaciones, es til plantearse si el efecto que necesitamos
posee alguna caracterstica sonora distintiva, primordial (un tipo de ataque, un

ritmo determinado...); si es as podemos tratar de centrarnos en esa


caracterstica (y buscar en una coleccin otros sonidos que la compartan) pues
una vez hallada ser ms sencillo acabar de redondear el efecto con otros
sonidos que a priori no pareceran encajar. En el caso de necesitar re-crear
sonidos naturales es til descomponer la situacin en la que se generan ya que
suele poderse distinguir diversas fases o sonidos "base" que se van integrando
o desintegrando a lo largo de esa evolucin temporal: es la estrategia de divide
y vencers. Finalmente, antes de descartar un sonido, hay que escucharlo con
la perspectiva propia que debiera tener en la banda sonora (tal vez a volumen
mximo no nos convenza, pero integrado en el ambiente de fondo, tal y como
se podra deducir de las imgenes, s que resulte apropiado).
Por lo que respecta a la organizacin del material es conveniente tener a mano
los ambientes y room tones que se prevean ms necesarios habilitando para
ellos un par de pistas (seguramente habr puntos en los que se solapen) o
bien, si trabajamos con sampler, fragmentos con loop de diversas duraciones.
Tambin hay que habilitar suficientes pistas (o configurar el sampler) para
generar rpidamente stacks o efectos multicapa. La ventaja de disparar los
efectos con ayuda de un sampler y un teclado MIDI es que variando la
velocidad de pulsacin podemos verificar rpidamente la adecuacin de cada
capa. Finalmente, para ubicar sonidos cuya sincrona es crucial puede ser ms
acertado adelantarlos entre 1/4 y 1/2 frame, en lugar de clavarlos a la imagen
(especialmente si la produccin se va a exhibir en salas grandes: a 7 metros de
distancia de la pantalla el sonido ya se ha retrasado 20 milisegundos respecto
de la imagen).

Fuentes sonoras a incorporar en una produccin audio-visual (III): msicas.


Funciones de la msica en una produccin audiovisual.
Criterios bsicos de montaje musical.
Colecciones de msicas versus msicas "a medida".
Funciones de la msica en una produccin audiovisual
Las funciones de la msica varan segn sea su origen. En este sentido
diferenciamos entre:
Msica diegtica: aquella que pertenece al mundo de los personajes (por
ejemplo, en una escena de baile en una pelcula de los aos 50, la msica de
la orquesta que toca en la sala).
Msica no-diegtica: la que existe fuera del mundo de los personajes, y por
tanto ellos no la pueden or.
Aunque la funcin principal de la msica diegtica es la de suministrar apoyo y
coherencia a aquello que se nos muestra en la imagen (si se ve una orquesta
tocando, hay que oirla tocar algo de la poca en la que se desarrolla la
pelcula) el hecho de hacerla necesaria puede ir ligado a unas intenciones ms
complejas del realizador (y no olvidemos que los grandes realizadores
consiguen subvertir esta dicotoma -una msica diegtica se funde en una nodiegtica; un personaje comenta la no-diegtica...-). Sea o no necesaria, la
msica de una produccin audiovisual puede cumplir alguna de las siguientes
funciones:

Suministrar informacin: la letra de una cancin puede explicarnos cosas que


pasan, sentimientos de los personajes, etc.; tambin el estilo musical nos
puede informar de la poca y el lugar en el que se desarrolla la accin.
Captar la atencin del espectador: a base de golpes orquestales, fanfarrias,
sintonas de programas
Establecer o potenciar un estado de nimo: existen libros que llegan a detallar
una serie de emociones bsicas y las caractersticas musicales que las
potencian (por ejemplo: MALDAD - Timbre spero u opaco, tesitura media o
grave, armona en modo menor o atonal, fraseo con repeticiones irregulares,
movimiento lento, orquestacin simple, ritmo irregular). Estas clasificaciones no
hacen ms que potenciar tpicos.
Establecer el ritmo: de la edicin de la imagen (por ejemplo, Koyaanisqatsi), y/o
del dilogo.
Mantener el flujo y la continuidad de la accin: la persistencia de una msica
suavizar cortes abruptos, rupturas de raccord visual.
Existen determinados formatos musicales destinados a cumplir funciones
especficas:
Sintona: caracteriza inequvocamente un programa o produccin audiovisual;
avisa de su inicio o final.
Rfaga: fragmento de msica sin otra finalidad que la de introducir variacin o
distraccin sonora.
Cortinilla: fragmento breve utilizado para delimitar y separar secciones de una
misma produccin.
Fondo o ambiente: msica incidental, que suele ir mezclada con dilogos o
efectos importantes, y que contribuye a mantener una continuidad anmica o
estructural.
Banda Sonora: suele identificarse como tal la banda musical pero incluye
tambin la banda de efectos y la de dilogos.
Criterios bsicos de montaje musical
Se recomienda utilizar una escaleta u hoja de registro en la que, por ejemplo,
en una columna indicamos tiempos SMPTE de puntos clave, en otra una
palabra resmen de la imgen, en otra la msica que debe sonar, y en otra el
tipo de entrada o salida de la msica, o si hay que hacer alguna manipulacin
en tiempo real de niveles o de otro tipo.
Los encadenados deben ser suaves o enrgicos, pero deben realizarse en el
momento oportuno, sin vacilaciones de nivel. Las transiciones abruptas es
mejor realizarlas justo antes de los acentos... Especialmente importante es que
las ediciones no alteren el ritmo de una forma antinatural (salvo que esa
antinaturalidad vaya en paralelo con la imagen), y dado que el odo del
espectador medio est ms acostumbrado a los acordes y armonas
"consonantes", las ediciones deben hacer lo posible para mantener esa
sensacin de consonancia (incluso si conviene, es preferible transponer un
pasaje o una nota si con ello nos aseguramos que el espectador no notar la
edicin). El ltimo elemento a igualar es la textura.
El volumen mximo de la msica no debe superar el 80% del margen dinmico
cuando suena sola, de esta manera cuando haya efectos o dilogos stos
podrn estar por encima de ella sin necesidad de que bajemos su nivel.

Pensar en el soporte final del producto: es muy probable que pierda altas
frecuencias, por tanto, no obcecarse en ellas y en todo caso tratar de enfatizar
la zona prxima a la frecuencia de corte del soporte final.
Cuando mezclamos msica y voz, cuidar de que la voz se entienda y su timbre
no quede completamente enmascarado por la msica.
Cuando mezclemos msica y efectos, cuidar de que prevalezca el que por
intencin expresiva sea ms conveniente; si mezclamos al 50% generalmente
obtendremos un batiburrillo incomprensible. Cuando un efecto va despus de
una msica (o al revs), es preferible un pequeo solapamiento entre ambos
elementos (siempre que sonora y visualmente no haya otros motivos que lo
desaconsejen).
Utilizar el silencio como un elemento ms de la banda sonora. A menudo puede
ser el ms importante.
Colecciones de musicas versus musicas "a medida"
Las msicas de coleccin suelen organizarse temticamente, segn estilos
(clsica, country, jazz, rock, vocal...) o contextos para las que parecen
apropiadas (electrnico, patritico, terror, histrico...). A diferencia de los
efectos de sonido, que una vez adquiridos estn libres de derechos y los
podemos utilizar tantas veces y en tantas producciones como queramos, las
piezas musicales de colecciones suelen requerir la firma de determinados tipos
de licencia:
Contrato de compra (buyout): permite el uso ilimitado de las msicas una vez
se ha pagado por la coleccin (igual que sucede con los efectos).
Contrato de alquiler anual (annual blanket): permite el uso ilimitado de la
coleccin durante un ao, pagando slo una cuota al iniciarse el perodo de
disfrute.
Contrato por produccin: permite el uso de una coleccin, o de una seleccin
de piezas, en una sola produccin, pagando una determinada cuota que
depende del tamao y tipo de audiencia a la que se dirige la produccin, el
medio de distribucin (video, cine, TV, CD-ROM...) y la duracin de la
produccin (serie diaria, telefilm, programa nico...).
Contrato de cuota por tema: se utiliza cuando una determinada pieza se
necesita en diversos proyectos relacionados (por ejemplo, al hacer jingles de
radio y spots de TV del producto X).
Contrato por veces de utilizacin (needle drop): permite utilizar una misma
pieza varias veces en momentos diferentes de la produccin; cada vez que se
usa se aplica una determinada cuota.
Respecto a los derechos, cabe distinguir entre
Derechos de reproduccin: autorizan a reproducir la obra en determinados
medios, y bajo determinadas circunstancias. Lo percibe la editora de la obra.
En el precio de compra de un CD hay una parte destinada a pagar esos
derechos.
Derechos de pblica comunicacin o difusin: se percibe en funcin de las
veces que se haya difundido la obra en un medio pblico. En el precio de una
entrada a un concierto hay una parte destinada a pagar esos derechos.
Derechos de comercializacin: es aplicable cuando un determinado producto
incluye obras sujetas a derechos (por ejemplo una banda sonora de pelcula).
En ese caso, el autor debe conceder al propietario del producto el permiso para
que utilice su obra dentro del producto comercial elaborado.

Con tantas opciones de compra y de pago de derechos, el uso de msicas de


libreria debe dirigirse a optimizar el coste de su acceso. Hay que vigilar la letra
pequea de los CDs de colecciones ya que su posesin (a travs de una
compra) no siempre garantiza su uso indiscriminado. Una opcin interesante en
producciones pequeas es la subcontratacin del uso de libreras a estudios
potentes que disponen de ese servicio. Recientemente algunas revistas
musicales (como Future Music) "regalan" CDs con fragmentos musicales y
loops libres de derechos que, en determinados contextos, pueden ayudarnos a
resolver gilmente alguna banda sonora. Otra opcin interesante es la de
desarrollar nuestra propia coleccin a base de fragmentos sueltos, retales que
no casan en otros proyectos, impromptus grabados sobre la marcha, etc. En
este sentido, los estudios de sonido suelen contar con la figura del msico de
estudio, una de cuyas funciones principales puede llegar a ser la de elaborar
msicas funcionales ajustadas a una produccin audiovisual concreta.
Desde la pgina de links (an no publicada) puedes acceder a informacin
sobre colecciones de msicas.

Convertir WAV (o MP3) a MIDI y viceversa


Los archivos WAV y MIDI no son formatos convertibles; tienen tanto que
ver entre s como el sol y la luna. Que nadie se asuste, porque luego daremos
solucin a esto; pero es vital marcar diferencias y conceptos antes de empezar.
Cuando hablamos de convertir formatos en informtica nos referimos a
adaptar un archivo diseado para una aplicacin, de manera que pueda leerse
en otra correctamente. Para que esto pueda hacerse, deben darse unas
similitudes fundamentales entre los formatos que usan esas dos aplicaciones;
por ejemplo, podemos convertir un archivo de WordPerfect en uno de Word.
Esto es as porque ambos son formatos de texto, y las nicas diferencias reales
entre los dos se deben a la manera que tiene cada programa de leerlos y
tratarlos. Lo mismo sucede con formatos de imgenes digitales, como BPM,
JPG o GIF. Todos comparten algo: son imgenes digitales. Unos formatos son
comprimidos, otros usan ms o menos colores, pero en realidad todos estn
leyendo informacin digital de un grfico.
Dando un ejemplo an mas palpable, convertir un documento de WordPerfect a
Word sera como coger una camisa verde y teirla de rojo. Pero "convertir"
MIDI a WAV, o al revs, sera pura alquimia, como transformar la camisa en
unos pantalones. Alguien dir "pero en qu se diferencian tanto el WAV y el
MIDI? Si reproduzco un MIDI escucho sonidos, y si pincho un WAV tambin!".
Pues no es del todo cierto...
El MIDI es un protocolo de comunicacin
entre aparatos musicales. El MIDI en s
mismo no produce sonido alguno; consiste en
mensajes que se dirigen unos dispositivos
MIDI a otros, indicando qu nota debe sonar, a

qu volumen, etc. Por ejemplo, un secuenciador manda mensajes de notas a


un sintetizador y este obedece y suena. Aqu entra otro elemento de confusin.
Mucha gente cree que un midifile suena porque s, que lleva los sonidos
"dentro", dado que ellos "no tienen un sintetizador en casa, slo el ordenador".
Pues tampoco es verdad. Todos los ordenadores actuales llevan
sintetizadores-samplers incorporados, ya sea en su tarjeta de sonido o virtuales
(como el que implanta Microsoft en sus ltimos sistemas operativos). Cuando
reproduces un midifile, ste le indica al sintetizador de tu ordenador cmo debe
sonar, al igual que en el ejemplo anterior con los sintes hardware. Por eso, si
cambias de tarjeta de sonido, o usas otro sintetizador virtual diferente, los
midifiles sonarn diferentes. [Arriba a la derecha, datos MIDI de notas
presentados por el secuenciador Logic Audio)

El WAV es un formato de audio digital. Si colocaras un


microscopio sobre un WAV (figuradamente, claro), slo veras
cadenas de ceros y unos; el WAV es una fotografa digital del
sonido real. El ordenador convierte los impulsos elctricos de una
seal sonora en datos que l pueda leer. As pues, cualquier
reproductor de WAVs har sonar la misma imagen del sonido
original. Aqu no hay ningn protocolo o lenguaje que le diga a
ningn dispositivo cmo debe sonar; el WAV en s mismo es el
propio sonido capturado, no una cadena de mensajes que se
envan a un sintetizador o sampler, como el MIDI. Avisamos ya
aqu que todo lo que diremos sobre el WAV se aplica al MP3 (que es un
simplemente un WAV comprimido) [A la izquierda, representacin grfica de un
WAV en el editor de audio Wavelab]
Hemos sido tajantes: no se pueden convertir WAVs y midifiles entre ellos. Pero
s hay maneras de hacer algo muy parecido. Sigue leyendo...

Lo fcil: grabando un midifile en formato audio


Hemos dicho que un WAV es una captura digital del sonido real, y que el MIDI
hace sonar un sintetizador o sampler mediante un protocolo de mensajes. Pues
bien, para tener los sonidos que produce un midifile en formato WAV, la cosa
es sencilla... slo tenemos que grabar digitalmente esos sonidos.
Si tenemos un sintetizador o sampler externo que reproduce los midifiles, la
cosa est bien clara: slo hay que encaminar las salidas de audio del aparato a
la entrada de lnea de nuestro ordenador, y utilizar un grabador para registrar
esa seal. Muchos programas pueden grabar audio; cualquier secuenciador
MIDI-Audio lo hace, y editores como Wavelab o Sound Forge, Cool Edit o
Goldwave tambin cumplirn la tarea. Solo hay que seleccionar en el programa
la entrada de lnea de la tarjeta de sonido, y grabarla.
Si slo dispones del sintetizador-sampler de tu ordenador (ya sea virtual, por
software, o incorporado a la tarjeta de sonido), sigue siendo fcil la solucin.

En el caso de la tarjeta de sonido, el sistema


que utilizaremos depender de si sta puede
"autograbarse", es decir, si dispone de un circuito
especial que reenve toda la seal que genera de
nuevo hacia el ordenador. Muchas tarjetas hacen
esto; por ejemplo, la famosa Sound Blaster Live!
(en la foto) o la Audigy. Diremos como se hace con
la Live!, y si tienes otra tarjeta, seguro que no te
ser difcil trasladar la tcnica. Lo que debes hacer es abrir el mixer de
Windows (el control de volmenes), ir a las opciones y ponerlo en modo
"grabacin". Eso har que veas los niveles de grabacin de las distintas
fuentes posibles, y cul est seleccionada para ser grabada en ese momento.
Pues bien; slo debes escoger como fuente el sintetizador de la Live!, y usar
(como en el caso anterior) un grabador para recoger la seal.
Si tu tarjeta no puede "autograbarse", tendrs que hacer una pequea
chapucilla: une la salida de audio de la tarjeta con su entrada de lnea usando
un cable de audio apropiado, y elige como fuente de grabacin esa misma
entrada de lnea. Ten cuidado aqu con los volmenes de salida y entrada; ya
no ests en el dominio digital y puedes distorsionar la seal si te pasas.

Para grabar la seal de un sintetizador o sampler virtual, el procedimiento


es anlogo: si la tarjeta dispone de un circuito que permita grabar internamente
la seal de audio que ella misma produce, solo has de elegir la fuente
adecuada para la grabacin (suele ser la fuente "WAV" o "Directsound" en
muchos casos). Si careces de esta posibilidad, tendrs que hacerte con el
cable ya citado y realimentar a la tarjeta con su propio sonido.

Lo difcil: descomponiendo un WAV en mensajes MIDI


Esto es otro cantar. Grabar la salida de un sinte o sampler (hardware, software
o de tu tarjeta de sonido) es un procedimiento obvio y sencillo. Pero si
queremos obtener un midifile a partir de un WAV, las cosas se complican hasta
el extremo...
La razn para esto es que un WAV rene informacin muy compleja sobre
frecuencias, volmenes, resolucin, etc, y toda ella aparece mezclada,
especialmente si el WAV es de una cancin normal, en la que puede haber
percusin, bajo, voces, acompaamientos... El WAV no entiende de notas ni de
escalas, slo de frecuencias y de sonido puro. Ya sabemos que el MIDI
consiste precisamente en mensajes que indican a un dispositivo cmo
interpretar msica, as que convertir un WAV en un midifile sera algo as como
cocinar una tarta y luego pretender separar los huevos, la leche y la harina.
As pues, estamos en un atolladero. Pero hay alguna esperanza. Al igual que
existen programas de reconocimiento de caracteres (OCR) que intentan "leer"

un grfico de un texto y convertirlo en datos reconocibles para un procesador


de textos, existen programas que identifican los tonos de un WAV y, a
partir de ellos, generan un archivo MIDI. Por desgracia, esta tcnica tiene
mucho ms xito con las letras que con el sonido ya que, como habrs
imaginado, un WAV es algo mucho ms complejo que una foto de la pgina de
un libro, donde slo hay caracteres de color negro sobre un fondo blanco,
ntidos y fciles de identificar para un programa de reconocimiento
mnimamente inteligente. Identificar todos los tonos de un WAV, sus
volmenes, y an ms all, los tonos y volmenes de todos los instrumentos
por separado, es una tarea imposible. Adems, cmo un programa de
ordenador podra diferenciar entre el timbre de un violn y el de una guitarra?

Sin embargo, algo se ha avanzado en los ltimos aos. Actualmente uno puede
conseguir un MIDI ms o menos aceptable a partir de un WAV monofnico no
muy complicado. Por monfonico entendemos aquel sonido que slo contiene
un tono a la vez, por ejemplo la voz humana o una flauta (ninguna de las dos
puede hacer sonar dos notas al mismo tiempo). Al haber slo una lnea
meldica sin acordes ni notas superpuestas se hace ms fcil identificar los
tonos y crear mensajes MIDI a partir de ellos. Algunos programas presumen de
identificar incluso acordes y lneas ms complejas, pero su eficacia es bastante
dudosa. Por ello te recomendamos que en vez de complicarte la vida con
conversiones imposibles, busques directamente el midifile de la cancin que
desees; seguro que alguien en alguna parte ha secuenciado ese MIDI para que
lo puedas bajar.
Hay una variedad de programas especializados en "convertir" WAV a MIDI
(pulsa sobre ellos para visitar sus webs):
Digital Ear (en la foto de arriba)
Sound2MIDI y Wav2MIDI de Audioworks
TS-AudioToMIDI (freeware).

Das könnte Ihnen auch gefallen