Sie sind auf Seite 1von 37

Angel Rodrguez Bravo

La dimensin sonora del lenguaje audiovisual


Captulo 7

El sonido en la narracin audiovisual

Apunte de uso interno. Profesor: Ernesto Figge Ctedra: Sonido y Tecnologa Escuela Provincial de Cine y TV de Rosario

7.1. Sobre la superioridad de la visin


En la literatura sobre comunicacin suele asignarse a la visin, y en consecuencia a la imagen, un papel muy preponderante sobre los otros sentidos, especialmente en su comparacin con el de la audicin. No obstante, a nuestro modo de ver, esta primaca del sentido de la vista no tiene, en absoluto, una base perceptiva, sino que se sustenta fundamentalmente en motivos histricos y metodolgicos. Aclararemos esto. Desde la prehistoria, el hombre ha sido capaz de desarrollar tcnicas de dibujo que le permitan fijar en mayor o menor grado las sensaciones proporcionadas por el sentido de la vista. En cambio, la capacidad para fijar sonidos no aparece hasta la invencin de la escritura, es decir, mucho ms tardamente. Aun as, la escritura se limita slo a fijar las sensaciones sonoras vinculadas a la lengua, pero resulta un instrumento limitadsimo para fijar otro tipo de sonidos. Mientras el naturalismo crece y se desarrolla progresivamente en la pintura desde el siglo XII al siglo XIX, y con l el conocimiento sobre las sensaciones visuales y las tcnicas para su reproduccin, hasta bien entrado el siglo XX no aparecen sistemas fiables que permitan fijar y reproducir los sonidos. A esto hay que sumar que desde que se crean las unidades de medida, de longitud y de superficie es posible aplicarlas sobre la forma objetiva de una imagen reproducida en dibujos o pinturas. Contrariamente, el sonido fluye en el tiempo y se escapa a la capacidad de anlisis objetivo hasta que a mediados del siglo XX la informtica da un impulso definitivo a la sonografa y a la espectrografa. An hoy es mucho ms fcil para los estudiosos analizar una imagen que analizar un sonido. Fijar y medir una imagen est, ahora, al alcance de cualquier persona que disponga de una cmara fotogrfica o de un magnetoscopio; en cambio, la posibilidad de fijar espectrogrficamente o sonogrficamente un sonido slo es posible para el grupo reducido de expertos que disponemos del material y de los conocimientos adecuados para hacerlo. Todo esto ha hecho avanzar el conocimiento sobre la percepcin y la narracin visual mucho ms rpidamente que el conocimiento sobre la narracin sonora. Como consecuencia, los estudiosos de la comunicacin disponen de ms material, de ms facilidades, y se sienten ms atrados por el estudio de la imagen que por el del sonido. El resultado global: el sonido se abandona y se transforma progresivamente en el sentido de segunda categora que parece ser hoy. El punto de apoyo fundamental de las argumentaciones que relegan el sonido a una segunda categora respecto a la audicin, suele tener una base fisiolgica puramente numrica. Es cierto que el nervio auditivo est constituido por unas 30.000 fibras, mientras que el nervio ptico lo constituyen 1.000.000 de fibras (vase Lieury, 1992). Si nos fiamos exclusivamente de este dato podramos deducir que el odo enva al cerebro slo un 30 % de la informacin que es capaz de enviar el ojo. En realidad no se dispone de comparaciones experimentales fiables que puedan demostrar esta idea de preponderancia visual, que est demasiado arraigada en nuestra escasa tradicin sobre comunicacin audiovisual, as que para apoyar esta idea de preponderancia de la visin suele argumentarse lo siguiente: a) las personas pueden asimilar ms informacin por va visual que por va auditiva; b) el sistema auditivo se rige por el sistema visual; c) la visin acta simultneamente en distintas dimensiones mientras la audicin es bsicamente llana y lineal. Cada uno de estos tres argumentos es fcilmente rebatible. Respecto a la cantidad de informacin resulta revelador observar, por ejemplo, que el ojo humano puede ser cerrado, y descansa aproximadamente durante una tercera parte de la vida del ser humano (sueo). Contrariamente, el odo permanece en funcionamiento activo, noche y da a lo largo de toda la vida. Especialmente en los perodos de descanso, el odo es el sentido que permanece vigilante enviando al cerebro informacin sobre cualquier cambio del entorno para que nos despierte y nos devuelva al estado de actividad global de la vigilia. Respecto a que el sistema visual es el que rige al auditivo, es tambin muy revelador recordar que, precisamente, una de las funciones de la audicin es indicar la presencia de estmulos en las zonas que normalmente no son cubiertas por la visin. En tanto que el odo cubre constantemente los 360 grados del entorno humano, y puede hacerlo sin depender de la posicin del cuerpo, ni de la cantidad de luz presente, la vista slo cubre 180 grados y depende de la luz y de la postura del receptor. A partir de los estmulos sonoros captados de toda esa zona a la que nunca tiene acceso la visin, el odo indica al sistema perceptivo el lugar de donde provienen informaciones que slo despus de ser odas pasan a 2

ser revisadas inmediatamente por el sentido de la vista: moviendo el cuerpo, abriendo los ojos, iluminando un espacio concreto, etc. La fenomenologa del doblaje demuestra, tambin, lo fcil que es engaar desde el odo al sentido de la vista. Finalmente, respecto a la idea de que la audicin es llana y lineal, es especialmente sencillo rebatirla apelando a la capacidad del odo para percibir perspectivas (sensacin de profundidad) a partir de la diferencia de intensidades entre distintos objetos sonoros; y espacialidad (orientacin izquierda derecha), utilizando las diferencias de tiempo que tarda en llegar un sonido a un odo o a otro. Esto supone sensacin de profundidad y de direccin. Estas dos percepciones son, adems, simultneas en el tiempo. El odo humano, como hemos visto ya, es perfectamente capaz, adems, de realizar tres funciones distintas simultneamente en el tiempo: 1) anlisis de la complejidad frecuencial (timbre), 2) anlisis de la evolucin de la dinmica (variaciones de intensidad), y 3) anlisis de la evolucin del tono (entonacin y meloda). Adems, cada una de estas tres funciones puede actuar observando simultneamente varios niveles estructurales. Vemoslo esquemticamente tomando como referencia las operaciones de captacin de informacin que realiza el odo de cualquier individuo mientras est escuchando a un locutor que le habla en su propia lengua. Timbre: 1. Timbre de la voz del locutor. 2. Timbre fonemtico (reconocimiento de las vocales). 3. Reconocimiento de las resonancias de la sala. 1. Reconocimiento de la distancia locutor-oyente. 2. Reconocimiento de la intensidad a la que habla el locutor. 3. Reconocimiento de las diferencias de intensidad entre odos. 1. Tono natural del locutor. 2. Entonacin del discurso. 3. Variaciones micromeldicas emocionales.

Intensidad:

Tono:

En suma, sin hacer demasiado esfuerzo podemos contabilizar, por lo menos, nueve niveles simultneos de captacin y procesamiento de informacin acstica en la escucha de una simple conversacin. Frente a todo esto, es necesario plantearse, cuanto menos, que es un error enfrentarse a una discusin que divide entre sentidos prioritarios o importantes y sentidos de segunda categora o menos importantes. Este tipo de discusin que sita la vista por encima del odo, ignora las funciones especficas de cada uno de los sentidos y la necesidad imprescindible de su actuacin conjunta complementaria y, en consecuencia, se enfrenta a ellos desde una perspectiva apriorstica y equivocada.

7.2. Qu aporta el sonido a lo audiovisual?


El papel del sonido en la narracin audiovisual no es, ni mucho menos, el de un acompaamiento redundante. Michel Chion afirma que la asociacin del sonido y la imagen genera una percepcin completamente distinta a la que produce cada uno de ellos por separado; y concreta esto tericamente proponiendo el concepto de valor aadido-, que l mismo explica diciendo: Por valor aadido designamos el valor expresivo e informativo con el que un sonido enriquece una imagen dada (Chion, 1993, pg. 16). Esa idea define con claridad cul es a los ojos de Chion la aportacin que el sonido hace al sentido audiovisual. Nuestra propia concepcin sobre la importancia del audio es bastante ms radical que la de Michel Chion. Pensar que el papel del sonido en una narracin audiovisual es enriquecer la imagen supone, en realidad, seguir dndole la primaca absoluta al sentido de la visin. En el contexto del lenguaje audiovisual, el sonido no enriquece la imagen sino que modifica la percepcin global del receptor. El audio no acta en funcin de la imagen y dependiendo de ella, sino que acta como ella y a la vez que ella, aportando informacin que el receptor va a procesar de manera complementaria en funcin de su tendencia natural a la coherencia perceptiva. Nuestros odos no dependen en absoluto de nuestros ojos para procesar informacin, actan en sincrona y en coherencia con ellos. Han sido los realizadores y los estudiosos los que han supeditado el sonido a la imagen y no el sistema perceptivo. El mayor costo econmico de la produccin de imgenes y su complejidad tecnolgica superior suele obligar a los realizadores a comenzar el trabajo por ellas. Siempre es tcnicamente ms fcil y, adems, ms barato adaptar el sonido a la imagen que hacerlo a la inversa. Si a eso se suma la larga tradicin y la mayor facilidad que existe para desarrollar anlisis de imgenes, entenderemos por qu los estudiosos de la comunicacin tambin han secundado de una manera muy generalizada esa tendencia a anteponer lo visual a lo sonoro. El sonido debe ser resituado dentro de la investigacin y de la cultura productiva audiovisual en un lugar mucho ms ajustado al papel que realmente desarrolla. Invitamos al lector a que practique la experiencia de ver narraciones audiovisuales eliminando el sonido y orlas eliminando las imgenes. Ese pequeo experimento personal tiene siempre una fuerza reveladora sorprendente, aumenta la conciencia sobre la importancia del audio y equilibra el valor de ambas materias expresivas. La experiencia resultar tanto ms interesante cuanto ms lejos estn los materiales con los que se realice de los gneros de ficcin. Al eliminar el sonido, la publicidad, los documentales y los informativos llegan a resultar, con frecuencia, absolutamente incomprensibles. La importancia del sonido en la interpretacin de la narracin audiovisual no es una cuestin genrica y balad, su trascendencia es sistemtica y responde a una lgica que es posible investigar y poner de manifiesto. El audio acta en la narrativa audiovisual siguiendo tres lneas expresivas bien definidas: 1. Transmite con gran precisin sensaciones espaciales; 2. Conduce la interpretacin del conjunto audiovisual; 3. Organiza narrativamente el flujo del discurso audiovisual. Pero expliquemos con algo ms de detalle los recursos narrativos que abarca cada una de esas lneas expresivas. 1. Transmisin de sensaciones espaciales. Nuestra experiencia en el anlisis acstico y en la manipulacin narrativa del sonido hace que no podamos estar de acuerdo con Mitry ni con Chion en restringir exclusivamente a la vista la percepcin de las relaciones espaciales (vanse Mitry, 1989, tomo-1, pg. 405; y Chion, 1993, pg. 22). Ambos estudiosos relegan la sensacin auditiva del espacio casi exclusivamente a la percepcin de distancias mediante la intensidad, y hablan slo de manera residual de la direccionalidad que genera la estereofona. Los dos autores parecen olvidarse por completo de la gran capacidad que tiene el odo para identificar formas y volmenes espaciales reconociendo las reflexiones del sonido y su envolvente espectral. De hecho, la radio y el cine sonoro han utilizado profusamente esa capacidad auditiva para introducir 4

acsticamente al espectador en cuevas, criptas, pozos y salones palaciegos. Esa vieja tradicin, con la ayuda de las tcnicas del Surround1 y el Dolby-Stereo, ha desembocado finalmente en un cine que da cada vez ms importancia a la construccin de espacios sonoros, a sus detalles y a su exactitud acstica. 2. Conduccin de la interpretacin audiovisual. Esta lnea expresiva del sonido es la que emana ms directamente de la naturaleza unificadora y coherente del sistema perceptivo. Cuando a una propuesta narrativa sonora se le aade una imagen, o a una visual se le aade un sonido, la simbiosis de ambas configura un mensaje nuevo, completamente distinto del que transmiten aisladamente cada una de ellas. Ciertamente, el realizador suele iniciar siempre su trabajo con una propuesta visual, pero luego, consciente del poder narrativo del audio, recurre al sonido para conseguir los efectos perceptivos que no ha logrado desencadenar slo con la imagen. As, mediante la simbiosis imagen-sonido reorienta su propuesta narrativa inicial conduciendo al espectador hacia la interpretacin correcta. De ah la necesidad de recurrir a la msica para contar, pongamos por caso, que es justo al acercarse a la tercera puerta de un largo pasillo cuando el hroe est corriendo un peligro inminente, mientras que en las dos puertas anteriores, que eran exactamente iguales, no pasaba nada. O la necesidad de introducir un grito desgarrador de la protagonista dos fotogramas antes de que el espectador vea cmo surge bruscamente el temido vampiro: sin el grito, la aparicin repentina del monstruo sanguinario carece por completo de todo impacto emotivo. 3. Organizacin narrativa del flujo audiovisual. La organizacin de la cadena audiovisual es, probablemente, el uso ms racional que el realizador hace del sonido. No obstante, su fundamento sigue teniendo la base en la coherencia perceptiva. En virtud del principio de la regularidad,2 nuestro sistema sensorial sabe que todo cambio brusco en el sonido supone el final de un fenmeno y el comienzo de otro y nos lo hace percibir as. Los realizadores son conscientes de ese mecanismo perceptivo y agrupan o separan los materiales visuales en secuencias coherentes utilizando el audio. Es por eso que un mismo grupo de varios planos visuales puede ser comprendido como una secuencia nica o como varias secuencias separadas segn se haya manejado el sonido. Los espots publicitarios y los videoclips son ejemplos paradigmticos de conjuntos de materiales visuales que sin el sonido se suelen convertir en cascadas de imgenes completamente desordenadas que slo tienen entre ellas algunas conexiones visuales absolutamente vagas y confusas.

7.3- El espacio sonoro


La percepcin auditiva del espacio es, despus del habla, la informacin sonora ms importante y compleja de las que procesa el sistema auditivo. Y, dentro del conjunto de las formas sonoras primarias, es una categora perfectamente bien definida que el ser humano explota constantemente para identificar su entorno y desenvolverse en l. La narrativa audiovisual ha sido consciente de eso desde el primer momento en que comenz a utilizar el sonido y, constantemente, ha intentado imitar, reconstruir o crear sensacin de espacio sonoro. La radio, en su etapa de esplendor entre los aos treinta y los sesenta, desarroll una sofisticada tcnica de tratamiento del sonido orientada a la reconstruccin narrativa de sensaciones espaciales. Las emisoras de radio solan disponer de estudios con paredes acolchadas para recrear espacios abiertos, y estudios de paredes duras para reproducir la sensacin de espacios interiores. Se utilizaban locutorios con paredes mviles para poder controlar el nivel de reverberacin de los sonidos, sugiriendo as espacios ms grandes o ms pequeos segn las necesidades de la narracin en cada momento; y se planificaban cuidadosamente las distancias entre los locutores y los micrfonos. El cine actual es heredero directo de toda esa sofisticada tcnica de reconstruccin sonora del espacio, aunque ayudado ya por las inagotables posibilidades que aporta el tratamiento informtico electrnico del sonido. Como hemos mencionado ya en varias ocasiones, la tecnologa cinematogrfica del Dolby Stereo ha abierto un campo extraordinario en el trabajo con la espacialidad acstica, y en todas las grandes producciones actuales se trabaja a fondo con las sensaciones de espacio auditivo para aumentar el grado de realismo. En el entorno profesional incluso se ha acuado el trmino supercampo (vase Nieto, 1996, pg. 180) para hablar de ese territorio que est fuera de la pantalla y al que slo se accede perceptivamente mediante el tratamiento espacial del sonido. La incorporacin generalizada de la estereofona a los televisores acabar llevando el trabajo detallado sobre espacios sonoros tambin a ese medio. Aunque, por desgracia, los vertiginosos ritmos productivos de la televisin hacen que la tendencia en ese mbito sea bastante menos acusada que en el caso del cine. La reconstruccin auditiva del espacio es, pues, un recurso constante y creciente dentro de la narrativa audiovisual. La labor que se desarrolla en este terreno por los realizadores es todava muy intuitiva; no obstante, quien escribe estas lneas est convencido de que la reconstruccin de espacios sonoros en el mbito de la narracin audiovisual debe y puede dejar de ser un proceso de creacin puramente intuitivo para pasar a apoyarse en una serie de conocimientos tcnicos y cientficos ya contrastados. Siendo consecuentes con esa ltima afirmacin, en este apartado aplicaremos los conocimientos de acstica y de psicologa de la percepcin revisados a lo largo de esta obra, al problema concreto de la reconstruccin del espacio sonoro en el mbito de la narracin audiovisual. Se trata, en definitiva, de desarrollar una teora del espacio sonoro que permita explicar y resolver los problemas cotidianos que se plantean en la manipulacin del audio.

7.3.1. La necesidad de una teora del espacio sonoro


En la memoria auditiva de cualquier persona est presente la experiencia de una asociacin inmediata y lgica entre el alejamiento o acercamiento de las fuentes sonoras y la intensidad de los sonidos que emanan de ellas. Tambin es habitual recordar la relacin que existe entre los movimientos laterales de las fuentes sonoras y la sensacin de direccionalidad del sonido, o la asociacin entre el volumen del lugar donde se encuentra la fuente sonora y la sensacin de reverberacin o de eco en el sonido. Pero esta fenomenologa se complica considerablemente cuando ha de ser reproducida en las narraciones audiovisuales. Al intentar una reproduccin audiovisual realista, el narrador se encuentra con un serio problema cada vez que ha de tomar decisiones sobre la situacin del micrfono. La narracin visual televisiva y cinematogrfica est actualmente en movimiento constante. Para narrar una misma situacin se 6

intercalan continuamente planos cortos y cercanos con planos generales alejados, tomas fijas con la cmara quieta con tomas en movimiento circular o con movimiento ascendente y descendente, travellings que desplazan el punto de vista junto a una situacin en movimiento con tomas de cmara quieta contemplando ese mismo movimiento desde un punto fijo. La reconstruccin sonora de esos cambios de punto de vista, de manera que suenen tal como los escuchara un ser humano que mira sufriendo las mismas variaciones de posicin que la cmara, supone tantas alteraciones del paisaje sonoro como cambios haya de plano visual. Aparece, entonces, el problema de dnde colocar el micro en cada momento: debe ajustarse la toma de sonido a un criterio naturalista estricto y, por tanto, seguir sistemticamente pegado a la cmara y al tipo de plano? O, por el contrario, el micrfono debe independizarse y utilizar una lgica distinta de la que sigue la captacin de imagen? El primer criterio obliga a una simplificacin considerable de los movimientos del punto de vistaaudicin. Cuando percibimos en poco tiempo un nmero muy alto de variaciones sincrnicas de imagen y sonido que estn asociadas narrativamente, el efecto resulta enloquecedor. El cine de los aos treinta es un buen ejemplo de lgica narrativa con relacin sonido-imagen estrictamente naturalista. En las producciones de esa poca se observa una gran austeridad de cambios o movimientos del punto de vista (vase Altman, 1989). Se haca un tipo de cine en el que la alternancia de planos cercanos y alejados para narrar una misma situacin slo se utilizaba cuando los contenidos sonoros eran muy poco relevantes y, por tanto, no era grave alterarlos de manera antinatural. Ms tarde, se observ que cuando el micro se dejaba quieto muy prximo a la situacin, aunque la cmara se moviese constantemente, todo se comprenda mucho mejor. Se descubre, tambin, que esa tcnica narrativa es aceptable solamente dentro de un orden limitado y que hay que regresar con bastante frecuencia a la coherencia natural estricta entre sonido e imagen para que la relacin audiovisual sea perceptivamente aceptable. Visto desde la perspectiva del realizador, lo que se descubre, en realidad, es que la independencia entre imagen y sonido facilitada por la tecnologa permite desarrollar dos lneas distintas de trabajo narrativo, una de audio y otra de vdeo, que al ser cohesionadas con una cierta frecuencia mantienen el efecto global de la lgica perceptiva humana. A partir de este momento, la narracin audiovisual comienza a bucear en las posibilidades expresivas de la acusmatizacin. Y esta trayectoria de trabajo libera todas las posibilidades expresivas del montaje visual, que deja de estar sujeto al sonido, y evoluciona con la tcnica del doblaje3 hasta la separacin tcnica casi absoluta entre el sistema visual y el sistema sonoro. Esta forma de produccin que separa vdeo y audio casi por completo nos lleva a un universo narrativo totalmente nuevo en el que es imprescindible conocer a fondo la lgica espacial del sistema auditivo para poder asociar sonidos e imgenes que, en principio, no tienen nada que ver entre s. El problema actual es mantener un nivel suficiente de coherencia narrativa audiovisual que responda a la lgica perceptiva del espectador-oyente. Actualmente, los ejemplos ms claros de este tipo de estructura narrativa son los spots publicitarios y los videoclips. En estos gneros audiovisuales, a menudo, no existe ningn tipo de relacin original entre sonido e imagen. No obstante, la coherencia narrativa entre ambos sistemas es evidente y est especialmente trabajada. Tras este proceso histrico llegamos al punto actual de la narracin audiovisual, en el que la tecnologa y las tcnicas de produccin industrial obligan al narrador a trabajar diseando piezas visuales y sonoras aisladas, que luego se montarn como un sistema global que ha de encajar perfectamente. Imaginar esa fragmentacin previa del producto audiovisual crea unas condiciones generales de trabajo, tanto a nivel productivo como narrativo, sumamente confusas. Desde el punto de vista productivo: Las situaciones de la realidad referencial que actan como fuentes de imgenes para las narraciones audiovisuales, a menudo no son las fuentes sonoras de las que se capta el sonido. Se trabaja frecuentemente con sonidos ya grabados a priori, que originalmente no tenan ningn tipo de relacin con la narracin concreta que se est produciendo. Los sonidos se manejan como objetos independientes de las fuentes sonoras que los originaron. Desde el punto de vista narrativo: 7

Sonidos e imgenes actan como dos sistemas narrativos con lgicas distintas, pero deben ser montados con una coherencia global que se apoyar bsicamente en la sincrona. Los espacios sonoros son totalmente artificiales, pero han de responder a la lgica perceptiva y deben ser completamente coherentes con la imagen en los fragmentos de la narracin en los que hay coherencia audiovisual estricta. El sonido se utiliza normalmente como un instrumento cohesionador que contrarresta la gran disgregacin perceptiva comportada por el montaje visual. En suma, en la narracin audiovisual, las imgenes que vemos no son las fuentes que han producido el sonido, el espacio que escuchamos no es siempre el espacio que vemos, las distancias que escuchamos a menudo no se corresponden con las que vemos. Y, finalmente, el espacio que vemos y omos no existe. No existen los objetos, ni el espacio, ni distancia entre ellos y el receptor. Slo existe una serie de sonidos organizados que configuran un paisaje sonoro que tiene que ser interpretado. A que lgica responde todo esto? De acuerdo con qu modelos organizamos en nuestra mente todo este fenmeno? Parece evidente que para construir este universo narrativo no basta con la intuicin del narrador, y que es necesario estudiar y sistematizar con todo el detalle posible algunos instrumentos conceptuales que puedan ayudarnos a navegar en la complejidad del espacio sonoro audiovisual.

7.3.2. El concepto de espacio sonoro


Hemos visto ya que nuestra memoria y nuestra experiencia auditivas nos permiten: a) reconocer distancias que existen entre las fuentes sonoras y nosotros como receptores; b) reconocer la direccin de la que provienen los sonidos; y c) reconstruir el volumen espacial del lugar donde est situada una fuente sonora. Estos tres mecanismos perceptivos configuran una sensacin global que podemos definir perfectamente como sensacin espacial. El funcionamiento simultneo de estos tres procesos nos proporciona auditivamente una informacin muy clara de nuestra ubicacin espacial, de nuestro propio movimiento en el espacio y del movimiento en el espacio de los objetos que nos rodean. Es cierto que estos mecanismos perceptivos son simultneos a los de la visin, y que actan complementando las informaciones espaciales que nos proporciona el sentido de la vista. Pero es igualmente cierto que cuando cerramos los ojos, o cuando nos movemos en un espacio sin luz, esta percepcin espacial auditiva sigue funcionando con eficacia. La conclusin es que resulta pertinente hablar de espacio sonoro, y que ste debe ser definido como un concepto especfico y diferenciado de las otras concepciones espaciales. Vamos a proponer, en consecuencia, la siguiente definicin de espacio sonoro:
Definiremos espacio sonoro como la percepcin volumtrica que surge en la mente de un receptor, a medida que va procesando sincrnicamente todas las formas sonoras relacionadas con el espacio. Estas formas sonoras llegan regularmente al oyente como parte de la informacin acstica que recibe su sistema auditivo.

La definicin propuesta no perfila una definicin fsica de espacio sonoro objetivable y cuantificable como tal, sino que sita el concepto de espacio sonoro en la mente del receptor. Los estmulos que configuran la percepcin espacial son formas sonoras generadas por la reflexin acstica en un volumen de aire situado entre obstculos. El sentido humano de la audicin reconoce las formas sonoras asociadas a cada volumen y lo reconstruye perceptivamente. Es decir, recompone mentalmente volmenes que estn acotados por objetos fsicos concretos (muros, techos, tneles, pozos, etc.) y recompone, tambin, las distancias, movimientos y perspectivas que producen las fuentes sonoras al ubicarse o moverse en estos volmenes; todo ello con una precisin considerable. La percepcin de espacio sonoro aparece en la mente del oyente en el momento en que ste reconoce alguna de las formas acsticas vinculadas a la influencia del espacio: diferencias o 8

variaciones coherentes de intensidad, reverberacin, direccionalidad, etc. Es decir, en el momento en que el sonido proveniente de los altavoces de la radio, la TV o el cine se transforma en un ente acstico. A partir de entonces, los sonidos adquieren valor por s mismos dentro de la narracin audiovisual, y actan sobre la percepcin como si fuesen objetos fsicos reales situados en el espacio (vase apartado 2.3.4.). La fenomenologa espacial auditiva en su sentido ms puro se da en el universo de la composicin musical, en el que el espacio ocupado por las formas sonoras existe y tiene valor por s mismo y no slo como un ndice asociado sistemticamente a sus fuentes sonoras y a los obstculos que stas encuentran. Finalmente, sealaremos que el concepto de espacio sonoro es distinto del concepto de paisaje sonoro (vase Moles, 1981). El concepto de paisaje sonoro propuesto por Moles comprende cualquier tipo de conjunto sonoro que perciba el oyente, suponga ste una recomposicin espacial, o no. Desde el punto de vista de la narratividad audiovisual esta diferenciacin es importante. En las composiciones sonoras audiovisuales que distribuyen los medios de comunicacin de masas, a menudo recibimos composiciones sonoras en las que no se hace ningn tipo de tratamiento espacial en el sentido de recomposicin volumtrica del entorno. Por ejemplo, en todos los programas informativos radiofnicos o televisivos se configuran, efectivamente, paisajes sonoros, pero su composicin desde el punto de vista espacial es absolutamente plana. No existe voluntad de construccin de espacio: todas las voces y las msicas que configuran la informacin estn tratadas tcnicamente de manera que generan casi exactamente el mismo nivel de intensidad; se procura eliminar, adems, todo tipo de reverberacin instalando materiales absorbentes en las paredes, techo y suelo de los estudios. Dicho de otra manera: en los programas informativos se tiende a destruir todas las formas sonoras vinculadas al espacio. La nica posibilidad, entonces, de que el odo del receptor perciba sensaciones espaciales en este tipo de gneros audiovisuales suele ser a travs de alguna de las grabaciones de sonido realizadas en malas condiciones fuera de los estudios. En esas grabaciones externas s suele haber diferencias de intensidad y resonancias que sern percibidas por el receptor como sensaciones espaciales, apareciendo, entonces, dentro del conjunto global de los paisajes sonoros del informativo, algunos espacios sonoros concretos. Tomemos ahora las pelculas de terror como ejemplo contrario. En este gnero audiovisual se trabajan con detalle las formas acsticas espaciales para construir espacios sonoros grandes y vacos: stanos, cavernas, criptas, catedrales... En estos casos el paisaje sonoro transmite de una forma muy clara sensaciones volumtricas, es decir, compone espacios sonoros. As, el concepto molesiano de paisaje sonoro es mucho ms amplio y menos preciso que el de espacio sonoro. Mientras un paisaje sonoro es cualquier mezcla de sonidos que llega al odo, el espacio sonoro es una sensacin volumtrica que slo puede producir en el oyente un tipo muy determinado de paisajes sonoros.

7.3.3- El espacio sonoro en el contexto audiovisual


La percepcin del espacio sonoro se rige por unas leyes perfectamente diferenciadas de las del espacio visual y, lgicamente, el conocimiento de estas leyes puede transformarse en un instrumento muy til en el contexto de la narracin audiovisual. En el contexto audiovisual, la posibilidad de dominar los mecanismos que rigen la percepcin del espacio sonoro es una aportacin esencial que nos permite construir y dominar artificialmente las percepciones auditivas espaciales de nuestra audiencia, sin que sea necesario que exista en el universo referencial el espacio que debera generarlas. La posibilidad de acusmatizar los sonidos que nos da la tecnologa del audio, sumada a las posibilidades de manipulacin tcnica de la intensidad, de la reverberacin 4 y de la direccionalidad,5 nos permiten controlar con mucha eficacia la reconstruccin de cualquier tipo de efectos acsticos espaciales. Hemos visto que ciertas formas sonoras actan como ndices sgnicos que nos remiten a una determinada configuracin espacial donde estn ubicadas las fuentes sonoras que estamos escuchando. Y hemos visto, tambin, cmo la tecnologa audiovisual nos permite generar y manipular artificialmente formas sonoras que estn relacionadas con el espacio. La consecuencia inmediata de estas dos observaciones es la posibilidad de generar espacios sonoros virtuales en la mente de nuestros 9

receptores, que actan con una extraordinaria fuerza realista. En suma, partiendo de un conocimiento detallado del tipo de alteraciones acsticas que producen en el sonido determinados obstculos y volmenes, es perfectamente posible reconstruir artificialmente la sensacin espacial. Es decir, es perfectamente posible manipular un sonido concreto de modo que ste transmita acsticamente a cualquier oyente la sensacin de que su fuente sonora est ubicada en un tnel, un pozo, una sala abovedada, frente a una pared, en un espacio abierto, en una habitacin pequea...; o que comunique distancias, perspectivas y movimientos, a voluntad del narrador. A partir de aqu, revisaremos una serie de modelos bsicos de conocimiento acstico, acsticovisual y acstico-narrativo que nos permitirn explicar y sistematizar este tipo de trabajo expresivo desde el sonido.

7.3.4. Acstica de la sensacin de distancia


Reproducir acsticamente la sensacin de distancia entre una fuente sonora y el receptor que la escucha es la forma aparentemente ms simple y, sin duda, la ms utilizada para crear espacios sonoros. El modo de controlar la sensacin de distancia entre los oyentes y un ente acstico (vase apartado 2.3-4) es manipulando tcnicamente su intensidad. En una primera aproximacin, parece pertinente afirmar que cuanto mayor es el nivel de amplificacin de la intensidad, el ente acstico se percibe como ms cercano; y que cuando la intensidad se reduce, percibimos que el ente acstico se aleja. A lo largo del presente apartado y del siguiente, el lector podr comprobar que este primer planteamiento sobre la relacin entre intensidad y distancia es, a todas luces, demasiado simplista. Es necesario conocer mucho ms a fondo la acstica de la sensacin de distancia para no cometer graves errores narrativos al construir espacios sonoros utilizando slo el control artificial de la intensidad En el apartado 4.2.4 vimos con detalle que el aumento de la distancia entre la fuente sonora y el punto de audicin, o el punto de ubicacin del micro, determina una variacin de la sensacin de intensidad. Cuando una fuente sonora se aleja, la intensidad disminuye en 6 dB cada vez que duplicamos la distancia entre ella y nosotros; y siguiendo la misma lgica, cuando la distancia entre la fuente sonora y el punto de audicin se reduce a la mitad la intensidad aumenta en 6 dB. En el apartado 4.2.5 vimos, tambin, que este fenmeno perceptivo es directamente utilizable en el sentido inverso. O sea, al manipular tcnicamente la intensidad se consigue de manera artificial la sensacin de que la fuente sonora se est alejando o acercando de acuerdo con un mecanismo perceptivo que hemos bautizado como la -regla de los 6 dB". Este recurso expresivo es, sin duda, el ms popular y generalizado de todos los que pueden utilizarse en el mbito audiovisual para conseguir la creacin de sensaciones espaciales. Una vez que elegimos algn suceso sonoro concreto y lo tratamos como un ente acstico, ste genera un espacio sonoro y puede ser situado en cualquier punto de este mismo espacio (cerca o lejos del oyente) con mucha precisin. En el apartado 4.2.5 exponamos algunos ejemplos de cmo es posible controlar la sensacin de ubicacin en el espacio sonoro manipulando tcnicamente el nivel de intensidad. El efecto virtual de alejamiento o acercamiento que produce la manipulacin tcnica de la intensidad se explica porque la amplificacin electrnica del sonido crea un efecto acstico muy parecido al que produce la variacin real de distancia entre fuente sonora y punto de audicin. De todas formas, la sensacin de intensidad nunca se presenta aislada, sino como una parte del sistema intensidad-tono-timbre-tiempo. As, cuando observamos el sonido en su globalidad y con suficiente detalle, aparecen siempre diferencias muy claras entre la sensacin que produce una amplificacin artificial del sonido y las sensaciones producidas por la variacin de distancia entre fuente sonora y el odo, o entre fuente sonora y micrfono. Veamos cules son estas diferencias. La amplificacin electrnica de un sonido no altera ninguna de las dimensiones de su timbre. Simplemente aumenta o reduce de manera homognea la intensidad de todas las frecuencias que componen ese sonido, dejando el perfil de su espectro exactamente igual que estaba inicialmente. No es ste, en cambio, el modo en que la distancia acta sobre el espectro. Cuando una fuente sonora se aleja del punto de audicin, el efecto acstico global que se produce en el lugar de escucha es, efectivamente, la atenuacin de todas las intensidades que componen su sonido por efecto de la energa gastada en recorrer el espacio. Pero esta atenuacin nunca es homognea. La composicin 10

espectral queda afectada por el alejamiento de dos formas distintas: 1. la intensidad de las frecuencias graves se atena con mucha ms rapidez que la de las frecuencias agudas, de manera que el sonido produce al odo una impresin espectral cada vez ms clara a medida que la fuente se aleja del punto de audicin; 2. si el sonido se produce en un espacio cerrado, la diferencia entre la intensidad del sonido que proviene directamente de la fuente y la del sonido reflejado en las paredes es cada vez menor, de modo que cuanto ms se aleja la fuente sonora del punto de audicin es ms perceptible para el odo la reverberacin de ese espacio. El resultado de todo esto es que cuando en el interior de un estudio de grabacin un locutor se aleja del micro, el sonido de la voz que llega al control de grabacin no slo se oye globalmente con menos intensidad, sino que tambin se oye menos definida, ms brillante y con algo de resonancia. En cambio, si situamos ese mismo locutor a 20 centmetros del micrfono y lo escuchamos atenuando artificialmente su intensidad desde la mesa de mezclas, el sonido de la voz ser, efectivamente, ms dbil, pero no va a sonar con los otros tres matices acsticos del alejamiento. Es decir, no vamos a escuchar la prdida de definicin, ni la mayor atenuacin de las frecuencias graves, ni la ligera resonancia de la sala. Vemos, pues, que la intensidad es, ciertamente, el parmetro dominante en la sensacin de distancia. No obstante, esta dimensin no aparece nunca aislada, sino que se vincula sistemticamente a otros aspectos acstico-perceptivos. Desarrollaremos algn ejemplo concreto que permita al lector valorar cul es el alcance narrativo de esos matices acsticos que acompaan siempre a las variaciones de intensidad. Imagine el lector que estamos sonorizando una telenovela, y hoy nos toca doblar la secuencia del encuentro final entre un padre y su hijo en el puerto de una ciudad pesquera. Las imgenes a las que hemos de aadir sonido muestran un espacio visual completamente abierto. El padre est an en el pequeo barco de pesca y ve a su hijo a lo lejos, esperndole en el puerto. La imagen toma el punto de vista del padre y vemos cmo el nio grita a lo lejos, en el puerto, entusiasmado y feliz. Con objeto de conseguir un efecto realista de lejana al sonorizar esa situacin, decidimos que el actor de doblaje que interpreta la voz de nio se aleje hasta el extremo opuesto del locutorio que est a unos 8 metros del micro para gritar el texto. Procedemos a la grabacin y comprobamos los resultados. La sincrona es buena y la interpretacin perfecta, pero el efecto global resulta absolutamente inverosmil y absurdo. Mientras estamos viendo un plano de gran espacio abierto, omos la voz reverberante del nio que suena a metida en una sala cerrada. El ligero nivel de reflexin sonora del locutorio ha sido ms que suficiente para que la falta de relacin lgica entre sonido e imagen impida que se produzca el efecto final de coherencia perceptiva que es imprescindible en cualquier narracin audiovisual. Ser necesario volver a realizar la grabacin, ahora con el actor siempre cerca del micrfono, y conseguiremos el efecto de lejana mediante la manipulacin tcnica de la intensidad. Al estar el locutor junto al micro, el sonido directo de la voz sonar mucho ms fuerte que las dbiles reflexiones producidas por las paredes insonorizadas y absorbentes del locutorio. Luego, al atenuar tcnicamente la intensidad de todo el conjunto para reconstruir la sensacin de que el nio est lejos, quedar definitivamente eliminado el ligero sonido de reverberacin de la sala, que en el proceso anterior haba aumentado espectacularmente. Como resultado final tendremos una voz que suena muy dbil (como a lo lejos) y sin ninguna reverberacin (como en un espacio abierto). Pensemos, ahora, que nuestro problema es poner la voz a otra secuencia de la telenovela donde predominan los primeros planos del rostro desencajado de un hombre que piensa en su propia desesperacin. La cara no mueve los labios as que la voz ha de sugerir un monlogo interior desesperado y dramtico. Para que el sonido de la voz transmita la sensacin de monlogo interior, ha de sonar como si la escuchsemos desde dentro mismo del personaje. El referente acstico de esta situacin es ese sonido caracterstico de cuando uno se habla a s mismo. Imagine el lector, por ejemplo, que al ir a pasar la pgina de un viejo libro al que tiene mucho aprecio lo hace con tanta energa y descuido que la plana se rompe por la mitad, este pequeo accidente seguramente desencadenar una exclamacin sonora muy enrgica y de poca intensidad, algo as como un: ostras..., me lo he cargado!!, muy flojito y desconsolado. se es el sonido de monlogo interior que hemos de conseguir para nuestro personaje 11

solitario: el sonido de escucharnos la voz desde dentro de nuestro propio cuerpo. Para conseguir ese efecto de proximidad extrema pediremos al actor de doblaje que se acerque mucho al micrfono porque slo de ese modo es posible recoger los matices acsticos ms dbiles de las frecuencias que componen su voz. Si el locutor se sita a la distancia habitual (a unos 20 cm del micro) estas frecuencias de baja intensidad no son recogidas por el micrfono, pero s que lo son cuando la boca del locutor se sita a 1 o 2 cm del micrfono. En una comunicacin interpersonal, las frecuencias dbiles de la voz slo son audibles cuando alguien nos habla con la boca pegada al odo, o cuando nos escuchamos a nosotros mismos. As, cuando omos esas frecuencias caractersticas de la cercana en una narracin audiovisual, tendemos automticamente a interpretarlas de una de estas dos maneras: a) alguien me habla al odo, b) estoy escuchando la voz de alguien como si la escuchara desde dentro de l mismo. Es cierto que al acercarse el doblador hasta 1 cm del micrfono, este acercamiento produce un aumento de la intensidad que ser recogido en la mesa de mezclas, y que a eso se le suele denominar un primersimo primer plano. Pero ese mismo aumento de la intensidad global se podra haber conseguido con el locutor colocado a 20 cm del micrfono y aumentando tcnicamente la ganancia acstica desde el control de audio. La especificidad del matiz sonoro de ese mal llamado primersimo primer plano no est en la intensidad sino en la dimensin tmbrica que hemos denominado definicin.11 Cuanto ms se acerca un locutor al micro, ms se ampla la gama de frecuencias de la voz recogidas, puesto que hay una serie de frecuencias de muy poca energa que antes no llegaban al diafragma del micrfono y ahora s pueden llegar. El resultado perceptivo es, entonces, un aumento caracterstico de la sensacin de precisin y de matiz, o sea un aumento de la definicin. La voz se oye enriquecida con una serie de pequeos ruidos caractersticos del aparato fonador que antes no escuchbamos: ligera friccin del aire, leves ruidos de los labios y la lengua, algn crujido de la saliva, etc. De momento, hemos conseguido la sensacin de monlogo interior mediante el acercamiento al micro, pero pasemos a la problemtica que se produce en el interior del control de grabacin. Cuando un actor se acerca tanto al micrfono se produce inmediatamente un problema de saturacin de niveles de potencia en la cadena de grabacin que puede ser resuelto de dos maneras: 1. bajando tcnicamente la intensidad al reducir la ganancia acstica desde la mesa de mezclas; 2. siendo el propio locutor quien baje la intensidad de su voz controlando la fonacin. Si aplicamos la solucin tcnica -solucin 1)-, enseguida nos damos cuenta de que la voz vuelve a sonar alejada, perdindose la sensacin de monlogo interior. La disminucin global y homognea de intensidad en todo el espectro que produce el potencimetro de la consola de mezclas hace desaparecer las frecuencias de menor intensidad, que eran, precisamente, las responsables de expresar la sensacin de voz oda desde dentro del actor. En cambio, cuando es el locutor el que controla fonolgicamente la intensidad de su voz -solucin 2)-, sta sigue sonando con todos sus matices de proximidad. Al seguir la boca del doblador junto al micro, ste sigue recogiendo todas las frecuencias de poca intensidad que son caractersticas del efecto de cercana. Ahora sabemos ya que para reconstruir el sonido de monlogo interior es necesario que el actor de doblaje se site muy cerca del micrfono y, adems, que desde el control de audio se mantenga un nivel de amplificacin fuerte, con objeto de que las frecuencias menos intensas de la voz, que son las responsables de la sensacin de gran proximidad fsica, sean perfectamente audibles. Y hemos llegado, tambin, a la conclusin de que para que eso sea tcnicamente posible es necesario que el locutor lleve la intensidad de su voz a niveles muy bajos a fin de evitar saturacin de potencia en la cadena de grabacin. El ltimo problema que quedara por resolver depende de la capacidad del actor de doblaje para mostrarse desesperado a 1 cm del micro y manteniendo su voz a baja intensidad, pero, evidentemente, eso escapa ya a las posibilidades del realizador. Intentemos ahora sistematizar toda esta informacin fenomenolgica en torno a la sensacin auditiva de distancia que hemos expuesto hasta ahora. Decamos que la intensidad sonora es el parmetro fundamental que influye sobre la sensacin de 12

distancia, pero tambin hemos visto con detalle, a travs de los ejemplos revisados, que en cada situacin concreta la alteracin de la intensidad va siempre acompaada con otro tipo de variaciones acsticas que son las que aportan informacin sobre el estado de la fuente sonora, o sobre el tipo de espacio en el que est ubicada. As que si reducimos la construccin de la sensacin de distancia exclusivamente a la manipulacin tcnica de la intensidad estamos empobreciendo enormemente sus posibilidades expresivas. Por otra parte, hemos visto, tambin, que no todas las variaciones tcnicas de la intensidad expresan cambios de distancia, ni todos los cambios naturales de intensidad se deben al acercamiento o alejamiento de una fuente sonora. Es cierto que cuando nos enfrentamos a la acstica de la distancia desembocamos sistemticamente en la intensidad, pero percibimos y sabemos que la intensidad no es fsicamente aislable, sino que es parte de un sistema. En consecuencia, al buscar una explicacin a la sensacin auditiva de distancia, se configuran junto a la variacin de intensidad una serie de entornos que son perfectamente diferenciables entre s por sus distintas fenomenologas acsticas y perceptivas. Estos entornos de la variacin de la intensidad son concretamente tres y dependen del tipo de tratamiento con el que se controla en cada momento el nivel de intensidad. Genricamente, los tratamientos que permiten controlar la intensidad son los siguientes: 1) el control de la energa vibratoria de la fuente,7 2) el control de la distancia entre fuente sonora y punto de audicin, y 3) el control del nivel de amplificacin electrnica. Puesto que cada uno de estos tratamientos de la intensidad genera su propio entorno acsticoperceptivo, nombraremos cada entorno de modo que quede directamente relacionado con la correspondiente manipulacin de la intensidad que lo origina: Control de la energa vibratoria de la fuente: Entorno de la fuente. Control de la distancia entre fuente sonora y el punto de audicin.-Entorno de la distancia. Control del nivel de amplificacin electrnica: Entorno tcnico. Terminaremos, pues, este apartado proponiendo la clasificacin sistemtica de todos los fenmenos acstico-perceptivos que estn vinculados al tratamiento de la intensidad en tres entornos claramente diferenciados: el entorno de la fuente, el entorno de la distancia y el entorno tcnico.
El entorno de la fuente. Este entorno hace referencia de manera intrnseca y exclusiva a la amplitud de las vibraciones que emanan de las fuentes sonoras y no tiene ninguna relacin directa con la distancia ni con el tratamiento artificial de la seal de audio. La fenomenologa perceptiva que depende de la amplitud de las vibraciones naturales de una fuente sonora est vinculada a la propia estructura fsica de esa fuente, y no puede ser reconstruida mediante la amplificacin electrnica, ni variando la distancia entre fuente y punto de audicin. Cuando una misma fuente sonora es estimulada de manera natural con ms o menos fuerza, vibra con mayor o menor amplitud; no obstante, la composicin espectral y la evolucin temporal de esta vibracin tienden a variar de manera diferente segn sea la energa aplicada. Por ejemplo, el sonido que produce un golpe dbil en una campana es completamente distinto del que produce sobre esa misma campana un golpe muy fuerte. Mientras el golpe dbil extrae de la campana una forma sonora corta, casi sin cuerpo y con una cada blanda y homognea; un golpe muy fuerte hace que emane de la campana una forma sonora mucho ms larga, de cuerpo definido y con una cada oscilante extremadamente lenta. Esta fenomenologa acstica vinculada a la estructura fsica de la campana y que depende de sus variaciones naturales de intensidad, no puede ser reproducida por la amplificacin electrnica. Del mismo modo, cuando un locutor emite su voz con poca o con mucha fuerza, adems de actuar sobre la intensidad est influyendo sobre la composicin espectral del sonido que produce. Mientras que al emitir la voz con poca energa, el espectro acstico de la voz resulta poco rico y suena al odo con una impresin espectral mate; cuanto mayor sea la presin de aire subgltica que apliquemos a la laringe para hacer vibrar los pliegues vocales, el espectro aumentar su intensidad en la zona de frecuencias agudas, produciendo una percepcin auditiva mucho ms brillante.

13

Tampoco esto puede ser reproducido mediante una simple amplificacin electrnica. Amplificando un taido dbil de campanada, o un murmullo oral no vamos a conseguir que el golpe del badajo parezca fuerte ni que el murmullo se vuelva un grito, lo nico que lograremos es que campana y voz suenen como si estuviesen mucho ms cerca del receptor. El entorno de la distancia. Es un entorno configurado por la fenomenologa perceptiva que depende exclusivamente de la distancia entre la fuente sonora y el punto de audicin. Como hemos visto ms arriba en este mismo apartado, la distancia acta a la vez sobre el sonido directo y sobre el sonido reflejado, produciendo en el punto de audicin un sonido resultante que difiere del original en intensidad, composicin espectral y estructura temporal. Mediante la amplificacin artificial es posible reproducir la influencia de la distancia sobre la intensidad, pero no podemos reconstruir el efecto que producen las reflexiones sonoras en el espectro (impresin espectral) y en la forma temporal (reverberacin). Toda fuente sonora natural, mientras est emitiendo sonido, se encuentra ubicada en un lugar en el que existe una cierta cantidad de obstculos que generan reflexiones. Las vibraciones que provienen directamente de la fuente y las vibraciones reflejadas se suman componiendo un sonido resultante que el oyente reconoce como caracterstico del espacio. En los espacios cerrados, mientras la intensidad del sonido directo cambia, aumentando o disminuyendo con la distancia, la intensidad del sonido reflejado se mantiene constante. De ese modo, cuanto ms se aleja la fuente sonora del punto de audicin, mayor es la presencia auditiva de las reflexiones y menor la del sonido directo. Cuando la fuente se acerca el fenmeno se invierte. Por otra parte, las reflexiones influyen en el espectro, de manera que al sumarse stas con el sonido directo queda alterada la impresin espectral que percibe el oyente. As, una sala de paredes duras potenciar los agudos haciendo que la impresin espectral sea ms brillante. Y, adems, aumentar la fuerza de las reflexiones haciendo que el sonido siga oyndose mientras rebota de una pared a otra aun despus de que la fuente haya dejado de sonar. Resumiendo, al aumentar la distancia entre fuente y punto de audicin, pongamos por caso en una sala cerrada de paredes duras, se producen los siguientes efectos perceptivos: a) disminuye la intensidad global, b) el sonido se hace ms brillante y c) aumenta la sensacin de reverberacin. La amplificacin electrnica, efectivamente, reconstruye un aumento o una disminucin de la intensidad similar al que produce el acercamiento o el alejamiento de una fuente sonora, pero en ningn caso alarga o acorta la reverberacin, ni altera la impresin espectral. Es fundamental, pues, tener presente que el efecto perceptivo de la distancia slo ser idntico al que produce el tratamiento tcnico de la intensidad cuando estemos simulando un espacio abierto, es decir, cuando trabajemos con formas sonoras sin ningn tipo de reflexin espacial. El entorno tcnico. Este ltimo entorno hace referencia exclusiva al mbito tecnolgico de la manipulacin de la intensidad. Hemos dicho ya con todo lujo de detalles que cuando amplificamos electrnicamente un sonido aumenta la intensidad de todas las frecuencias que componen su espectro sonoro de manera homognea. Contrariamente, los fenmenos naturales influyen siempre sobre la intensidad de los sonidos de manera selectiva, actuando slo sobre una parte limitada del espectro.

Todo narrador audiovisual debera, pues, tener eso muy en cuenta y no confundir en ningn caso el efecto acstico de la amplificacin electrnica, con el que depende de la distancia, o del aumento de la energa de un cuerpo vibrante. Es cierto que con la tecnologa actual tambin resulta perfectamente posible reconstruir el efecto acstico de la reverberacin, o aumentar la brillantez de un sonido, pero el problema que plantea este tipo de manipulaciones ya no tiene nada que ver con la simple amplificacin. Para imitar la reverberacin de una sala utilizando un procesador de tiempos, o para copiar la impresin espectral que produce una voz agresiva usando un ecualizador grfico, es necesario hacer una aproximacin analtica al sonido; y eso exige un conocimiento bastante ms profundo que el que se necesita para ajustar el nivel general de intensidad con uno de los potencimetros de la mesa de mezclas. En cualquier caso, toda manipulacin tcnica del sonido est orientada a reproducir o a recomponer los efectos acsticos y perceptivos que producen los fenmenos naturales. As, es fundamental que los fenmenos acsticos y perceptivos originales no sean confundidos con su recomposicin artificial a travs de medios tecnolgicos. En el caso concreto de la relacin entre distancia e intensidad, la 14

conclusin evidente es que nunca debe ser confundida la acstica real y compleja que desencadena la variacin de distancia entre fuente sonora y punto de audicin,8 con la simple manipulacin tcnica de la intensidad.

7.3.5. Sobre el concepto de plano sonoro


En realidad, la confusin que criticamos al final del apartado anterior es bastante frecuente y, a menudo, la distancia y la manipulacin tcnica de la intensidad se tratan como si fuesen isomrficos o, incluso, como si fuesen la misma cosa. Balsebre, por ejemplo, unifica intensidad y distancia hablando solamente de plano sonoro sin llegar a diferenciar entre tratamiento tcnico y sensacin espacial (vase Balsebre, 1994, pgs. 148-149). Cebrin Herreros va algo ms all que Balsebre y dice que los planos indican al oyente el alejamiento o aproximacin de las fuentes sonoras, especificando que no debe confundirse la intensidad con la presencia sonora. Luego, explica que la intensidad se refiere a la fuerza o debilidad de los sonidos y que la presencia sonora hace referencia al plano; asociando as el concepto de plano a la distancia entre fuente sonora y micrfono (vase Cebrin, 1994, pgs. 324 y 327). No obstante, tampoco Herreros clarifica en ningn momento cul es la diferencia entre la sensacin de plano y la de presencia sonora, con lo que la distincin entre el entorno tcnico y el entorno de la distancia sigue sin quedar clara. A nuestro modo de ver, el trmino /plano/, ya clsico en la terminologa radiofnica como un concepto vinculado a la relacin distancia-intensidad, debe tener un uso mucho ms matizado. Es evidente que el concepto de plano sonoro est inspirado en el de plano visual en su acepcin de punto de vista: plano corto, plano medio, plano americano, etc. Y que recoge claramente de ste la idea de proximidad o lejana entre la fuente y el observador. Pero si comparamos con detalle la mecnica productiva en ambos contextos audiovisuales veremos que entre ellos hay diferencias importantes. En la produccin de imgenes, normalmente el objeto, o el personaje a fotografiar, estn insertados en un decorado o en un contexto visual ms amplio; y como consecuencia de eso, la manipulacin de la cmara es siempre la que determina el plano, con lo que el trmino adquiere un sentido muy claro. En cambio, en el mbito de la produccin sonora, la fuente de la que se ha de recoger el sonido se suele tratar de manera aislada; trabajndose slo con una voz, con un ruido, o con un instrumento musical, cuyo sonido, una vez grabado, ser mezclado con otros que tambin han sido recogidos aisladamente. En esta situacin, el plano sonoro puede venir determinado indistintamente tanto por la situacin de la fuente respecto al micrfono (la fuente se aleja o se acerca del micro), como por el nivel de amplificacin que decide el tcnico desde la mesa de mezclas (el operador de control baja o sube la intensidad moviendo un potencimetro). Esta duplicacin de posibilidades crea un nivel de confusin importante, que se hace ms grave cuando la sala de grabacin es reverberante, o cuando la fuente sonora genera cambios importantes de intensidad. Imaginemos que estamos grabando la voz de un actor. El sonido est llegando desde lejos, con una intensidad muy dbil es decir, en un plano de fondo o tercer plano. Tcnicamente la situacin es la siguiente: el actor est a 2 metros del micrfono y el potencimetro del canal por el que entra la voz en la consola est slo a un tercio de sus posibilidades de amplificacin. En el apartado anterior vimos que cada entorno de la intensidad desencadena unos resultados expresivos radicalmente diferentes, as que no va a sonar igual el paso del plano de fondo a primer plano si lo conseguimos acercando al actor al micro, que si lo conseguimos aumentando la ganancia acstica desde la mesa de mezclas. Mientras en el primer caso las resonancias de la sala se reducen, en el segundo aumentan. Naturalmente, la decisin sobre cmo queremos realizar el primer plano de esa voz depender de los resultados que busquemos; no obstante, es absurdo que se nombren del mismo modo dos cosas que van a generar resultados sonoros muy distintos. Si la acstica de la aproximacin no es la misma que la acstica de la amplificacin, est claro que debemos denominar cada tipo de tratamiento de una manera diferente. Nos parece, entonces, mucho ms lgico y preciso seguir nombrando la separacin entre fuente sonora y micrfono utilizando su acepcin natural, es decir, la de: distancia; y reservar el concepto de plano sonoro para concretar el nivel de amplificacin que se consigue electrnicamente. En suma, cuando en una realizacin sonora se pretende dar sensacin espacial de cambio de distancia, es ne15

cesario diferenciar entre el efecto expresivo que produce un cambio de la separacin entre fuente y micrfono, del que producir un cambio en el nivel de amplificacin. As, es necesario, tambin, que concretemos terminolgicamente llamando distancia a la separacin entre fuente y micrfono, y plano sonoro al nivel de amplificacin artificial. Concluiremos, pues, afirmando que ambos recursos, manipulacin de la distancia y manipulacin del plano sonoro, son dos tcnicas perfectamente diferenciadas que el realizador utiliza a.la vez para tratar ciertos sonidos, creando una determinada sensacin de distancia espacial. Dicho de otro modo: son dos tcnicas distintas de realizacin que permiten situar a los entes acsticos en el espacio sonoro, a cualquier distancia del receptor.

7.3-6. Movimientos en el espacio sonoro


La posibilidad de variar progresivamente la amplificacin mediante los potencimetros de la consola permite reproducir el efecto acstico-perceptivo de una fuente sonora que se mueve. ste es un recurso narrativo clsico que supone construir artificialmente la sensacin auditiva de que los entes acsticos se estn acercando o alejando del oyente Explicaremos esto ms detalladamente recurriendo a algunos ejemplos. Pensemos de nuevo en el ente acstico/planta saltadora/'del que hablbamos en el apartado 2.3.4. Como el lector recordar, se trataba de una forma sonora similar a la que emana de un muelle (un Ipooooiiing/}, que quedaba asociada a lo largo de la narracin a los movimientos de una planta animada con capacidad para desplazarse dando saltos. Si a medida que se sucede la reproduccin de los /poooiiing/ grabados previamente vamos manipulando el nivel de amplificacin, disminuyndolo lenta y progresivamente, estaremos expresando un alejamiento de la planta dentro del espacio sonoro. Naturalmente todo este fenmeno es puramente virtual ya que, en realidad, no existen ni la planta ni el espacio. Siguiendo exactamente el mismo proceso, ahora a la inversa, es decir, aumentando el nivel de amplificacin, por ejemplo del ruido de un automvil en marcha, podremos reproducir con toda precisin el efecto perceptivo de que el vehculo se est acercando. La fenomenologa acstica responsable de la sensacin de que una fuente sonora se mueve acercndose o alejndose es prcticamente idntica a la que desencadena la sensacin de distancia; la nica diferencia entre ellas es que la intensidad y su correspondiente entorno acstico-perceptivo, en lugar de permanecer estables, varan de manera progresiva. Si para expresar una determinada situacin fija en el espacio sonoro, por ejemplo un automvil parado, procedemos a elegir un nivel concreto de intensidad y lo mantenemos sin variaciones; para expresar acercamiento o alejamiento en el mismo espacio sonoro lo que se ha de hacer es alterar progresiva y lentamente el nivel de intensidad del ente acstico que queremos mover. Pero la manipulacin de la intensidad no slo posibilita recrear el movimiento de las fuentes sonoras en la dimensin de la distancia. Cuando el tratamiento de la intensidad se distribuye de la forma adecuada entre dos altavoces (estereofnicamente) aparece la sensacin de movimiento lateral. La tcnica de la estereofona9 permite al realizador de audio controlar el movimiento de los entes acsticos, de manera que, adems de moverse hacia delante y hacia atrs, puedan moverse, tambin, a la izquierda y la derecha. O sea, permite crear el efecto perceptivo de que una fuente sonora se desplaza de izquierda a derecha, o de derecha a izquierda, siendo posible situarla lateralmente, en cualquier punto frente al oyente. La capacidad para transmitir sensacin de movimiento lateral que tienen los sistemas estereofnicos, se basa en la produccin simultnea de dos formas sonoras ligeramente distintas entre s y que provienen de la misma fuente; de manera que cada una de ellas se dirige a uno de los odos del receptor. La sensacin de direccionalidad lateral proviene de las distintas condiciones acsticas en que llega a cada odo del receptor el sonido de una fuente sonora no situada frontalmente. Imaginemos que al cruzar una calle notamos que una motocicleta se nos acerca por el lado derecho, esa clara sensacin de lateralidad se debe a que el sonido de la moto, al provenir del lado derecho y avanzar de derecha a izquierda, alcanza antes y con mayor intensidad al odo derecho que al izquierdo. La capacidad de resolucin temporal del sistema auditivo humano (entre los 2 y 7 milisegundos) localiza el desfase temporal que hay entre los dos odos. Igualmente, la capacidad para percibir variaciones de intensidad 16

entre 2 y 3 dB hace que el sistema auditivo detecte la diferencia de volumen que hay entre el odo derecho, al que el sonido de la moto le llega directo, y el izquierdo, que lo recibe ya ligeramente atenuado por la energa gastada para rodear la cabeza. Estas diferencias de tiempo e intensidad son las dimensiones acsticas que traducimos perceptivamente como sensacin sonora de lateralidad. La tcnica de la produccin estereofnica sigue, normalmente, una estricta lgica naturalista. Su proceso, a grandes rasgos, es el siguiente: se capta el sonido con dos micrfonos independientes a la vez, y se envan sus respectivas seales a dos canales distintos que las grabarn separadamente, recogiendo las mismas vibraciones sonoras desde dos puntos distintos y de un modo muy similar a como lo hacen los dos odos de una persona. Los dos micros se montan sobre un adaptador que los mantiene a una distancia y a un ngulo determinados10 (vase Bar-tlett, 1995). Cada configuracin de doble micrfono, una vez diseada, se mantiene siempre de la misma forma y se usa como si fuese un micro nico que capta el sonido desde dos puntos de audicin a la vez, uno desde el lado izquierdo y otro desde el lado derecho. Luego, el material recogido en esos dos puntos de audicin tambin se reproduce separadamente: el primero por un altavoz dirigido al odo izquierdo y el segundo por otro altavoz dirigido hacia el odo derecho. Mediante esa tcnica, cuando un oyente est adecuadamente situado entre los dos altavoces recibe en sus odos la misma composicin acstica que le llegara si hubiese estado en el mismo lugar donde se situ al par de micrfonos. Es decir, la misma seal sonora compleja llega a cada odo con una intensidad distinta y con una ligera diferencia temporal; o sea, exactamente como fue captada por cada uno de los dos micros configurados para crear el efecto estreo. El sistema auditivo unifica, entonces, esas dos composiciones de formas sonoras ligeramente diferentes, percibindolas como un nico ente acstico que est situado ms o menos a la izquierda o la derecha, segn sean las diferencias de tiempo e intensidad entre ambos altavoces. Basta, pues, por ejemplo, grabar situando el par de micros estreo a la izquierda de la fuente, y cada vez que los altavoces reproduzcan esa grabacin el receptor percibir que hay un ente acstico colocado a su derecha. Hasta aqu hemos estado revisando la estereofona como un proceso que permite copiar de manera naturalista la direccionalidad espacial del sonido, no obstante, esta tecnologa abre tambin la posibilidad de crear artificialmente la sensacin de direccionalidad y de movimiento lateral. Un diseador de sonidos que trabaje en cine fantstico puede asociar sonidos sintticos a mquinas o a personajes creados infogrficamente, y reconstruir acsticamente sus movimientos a izquierda y derecha de la pantalla. El secreto del movimiento sonoro consiste, entonces, en duplicar el sonido artificial estereofnicamente, controlando la diferencia de intensidad y de desfase temporal entre los dos canales de modo artificial. Segn Alten, el sistema auditivo utiliza dos sistemas distintos para identificar la direccin de la que viene el sonido: en las frecuencias altas reconoce la direccin mediante la diferencia de intensidad entre los odos, y en las frecuencias bajas recurre a la diferencia temporal (vase Alten, 1994, pg. 33). De todas formas, la reconstruccin artificial de la lateralidad sonora suele realizarse manipulando solamente la diferencia de intensidad entre los altavoces, en tanto que ste es un tipo de tratamiento mucho ms simple que el de la manipulacin del desfase temporal. Probablemente el lector habr comprobado ya ms de una vez lo sencillo que resulta manipular el balance" de su equipo estreo para controlar la sensacin de direccionalidad, eligiendo as a voluntad, por ejemplo, el punto del espacio entre los dos altavoces en el que quiere situar a su cantante favorito. Resumiendo: para controlar artificialmente la sensacin de lateralidad sonora que pretendemos que perciba un receptor, hemos de duplicar el sonido de manera que sea reproducible paralela y simultneamente en dos canales direccionados respectivamente a la izquierda y la derecha, y tratar, luego, el sonido de cada canal por separado de la forma adecuada. El trabajo artificial de mover los entes acsticos a la izquierda o a la derecha se hace hoy de manera esencialmente intuitiva, siguiendo un mtodo iterativo: el realizador manipula el balance y los desfases temporales, escucha los resultados, los corrige, los vuelve a escuchar y los vuelve a corregir..., reiterando el ciclo hasta que considera, finalmente, que ha obtenido los efectos deseados. Es evidente, no obstante, que en este campo resultara muy til investigar cules son los mrgenes de variabilidad perceptiva (temporal y dinmica) entre un altavoz y otro, a fin de poder concretar con precisin cules son los efectos de cada combinatoria de diferencias entre el sonido de ambos altavoces sobre las sensaciones acstico-espa-ciales. Este tipo de investigacin sera especialmente interesante para las aplicaciones multimedia que trabajan con espacios virtuales muy precisos, que 17

podran as reproducir sensaciones espaciales de lateralidad de manera muy simple, recurriendo slo al tratamiento numrico de las seales de audio.

7.3.7. El efecto de profundidad o perspectiva


Cuando en lugar de trabajar con un solo ente sonoro situado en el espacio acstico trabajamos simultneamente con dos o ms, se abre una nueva posibilidad narrativa: la de la construccin de perspectivas espaciales. Mediante la manipulacin organizada y coherente del tamao de las formas visuales que representan objetos, los pintores renacentistas consiguieron reproducir el efecto perceptivo de la profundidad visual. De un modo muy similar, la manipulacin coherente de las intensidades posibilita la reconstruccin del efecto perceptivo de profundidad sonora. Al tratar cada ente acstico con una intensidad diferente podemos situarlos en lugares distintos del espacio sonoro. Cuando el receptor escucha una composicin, por ejemplo, de tres entes acsticos sonando simultneamente con intensidades diferentes aplica de una forma automtica la tendencia natural a la coherencia perceptiva y la reconoce globalmente como un nico espacio en el que hay tres objetos que suenan situados en lugares diferentes. Es decir, escucha la profundidad espacial que hemos construido mediante un tratamiento perspectivista de la intensidad, situando ms lejos los entes que suenan con menor intensidad y ms cerca los que suenan ms fuerte. Una vez construido ese efecto perceptivo de profundidad, otros entes acsticos pueden moverse perfectamente a travs de l recorrindolo en los dos sentidos: hacia el oyente o hacia el fondo. Para que ese efecto perceptivo se produzca basta con mantener dos de los entes acsticos que definieron la perspectiva espacial con su intensidad estable y manipular la intensidad del tercero. Reconstruiremos esto en un ejemplo. En primer lugar definiremos la perspectiva espacial. Para ello manejaremos el siguiente material sonoro: a) un ambiente grabado de feria (msicas, ruidos, risas, etc.), b) la voz de un locutor (interpreta al portero de una atraccin promocionan-do a voz en grito un espectculo de serpientes venenosas), y c) una conversacin entre tres locutoras (interpretan a tres muchachas adolescentes entusiasmadas con la feria). Cada uno de estos materiales debera entrar por un canal diferente a la mesa de mezclas, de modo que actuasen como fuentes sonoras independientes, para ello bastara con situar a las locutoras en un micrfono, al locutor en otro y entrar la seal de cada uno de ellos a la consola por un canal distinto; el ambiente de feria entrara por un tercer canal proveniente de un magnetfono. La composicin inicial podra ser la siguiente: tratamos con los potencimetros la intensidad del locutor de modo que sta quede muy dbil, al fondo; el ambiente de feria lo amplificamos algo ms, de manera que quede ubicado tcnicamente en un segundo plano; y finalmente manipulamos la intensidad de la conversacin de las chicas dejndola en un claro primer plano. Ahora tenemos definido un espacio que producir en el receptor sensacin de profundidad. El efecto auditivo para el oyente ser que se encuentra situado junto a las muchachas, en un espacio rodeado por gente y atracciones de feria, y que al fondo, a lo lejos, est la atraccin de las serpientes. Cada sonido se ha transformado en un ente acstico situado en el espacio sonoro, de manera que ya no tiene nada que ver con su ubicacin real en el estudio. Finalmente, cuando siguiendo el texto del guin, las locutoras reparan en la atraccin de las serpientes, y deciden ir a verlas, comenzamos a bajar progresivamente el potencimetro de su canal, mientras ellas siguen hablando sin parar, de modo que la intensidad de la charla vaya bajando poco a poco hasta llegar al mismo plano en el que tenemos amplificado el canal del locutor. Este ltimo tratamiento transmitir al oyente la sensacin inequvoca de que el grupo de chicas se mueve hacia el fondo del espacio sonoro en direccin hacia la atraccin de las serpientes venenosas.

7.3-8. Acstica del volumen espacial


La sensacin de volumen espacial viene determinada por la combinacin del efecto perceptivo de distancia con el efecto perceptivo que producen las reflexiones sonoras. Cuando estudibamos la percepcin temporal de los sonidos, vimos cmo la gran resolucin temporal del sentido del odo (de 18

2 a 7 milisegundos) permita diferenciar con mucha exactitud los sonidos directos de los reflejados. Esta capacidad es utilizada por el sistema perceptivo humano para recomponer los espacios que actan como caja de resonancia de los sonidos reflejados. Acsticamente, las reflexiones sonoras son una serie de repeticiones idnticas a una forma sonora originaria, pero que aparecen con un cierto retardo respecto a ella y con menor intensidad. Esta configuracin acstica tambin puede ser reproducida tcnicamente. Para ello es posible utilizar dos mtodos: la retroalimentacin mediante un magnetfono de dos cabezales, o la retroalimentacin mediante un sistema electrnico de procesamiento de tiempos. En ambos casos, se realizan las mismas funciones con instrumentos diferentes: se generan repeticiones de un sonido original controlando la intensidad de las repeticiones y, tambin, el tiempo de separacin entre stas y el sonido inicial. Pero antes de seguir avanzando en las posibilidades narrativas que tiene la manipulacin artificial de reflexiones sonoras, igual que hemos hecho en otras ocasiones, revisaremos los conocimientos psicoacsticos disponibles sobre este tema y el modo en que pueden ser aplicados a la expresin acstica. Existen distintas categoras de reflexiones; no obstante, el tipo de reflexin que, sin duda, resulta ms interesante para la narrativa audiovisual es la reflexin directa y mltiple, caracterstica de los espacios cerrados. A este tipo de reflexin se la denomina reverberacin. Esta clase de reflexiones transportan una informacin acstica que determina la percepcin auditiva del volumen espacial. La reverberacin se origina cuando las vibraciones sonoras producidas en el interior de una sala cerrada son reflejadas muchas veces al rebotar de una pared a otra. Este fenmeno acstico tiene tres dimensiones bien definidas: a) el tiempo que tarda la primera reflexin en volver al punto donde est la fuente sonora que produce el sonido (tiempo hasta la primera reflexin); b) el tiempo que tarda en extinguirse el sonido despus de que la fuente haya dejado de sonar (tiempo de reverberacin); y c) la relacin entre las frecuencias del sonido original que son absorbidas por las paredes y las que son reflejadas (coeficiente de absorcin sonora). Las dos primeras dimensiones estn directamente asociadas al tamao de la sala donde se emite el sonido, y la tercera a la dureza de sus paredes. Cuanto mayor es la distancia entre las paredes de una sala, ms tarda un sonido emitido dentro de ella en retornar a su punto de partida, o lo que es lo mismo, ms largo es el tiempo desde que deja de sonar la fuente hasta que la primera reflexin vuelve reflejada al lugar de origen. Paralelamente, cuanto mayor es la dureza de las paredes de la sala donde se produce el sonido, ms tiempo permanece el sonido reflejndose de una pared a otra despus de que la fuente sonora haya dejado de vibrar (mayor tiempo de reverberacin). En consecuencia, el tiempo de reverberacin depende, a la vez, del tiempo hasta la primera reflexin y del coeficiente de absorcin sonora. A nivel prctico, las tres dimensiones suelen resumirse en una sola que es el tiempo de reverberacin. Utilizando este concepto se han desarrollado tablas que asocian tiempo de reverberacin y necesidades acsticas de la sala. Establecindose, por ejemplo, que el tiempo ptimo de reverberacin para una sala en la que han de realizarse emisiones de voz est entre 0,25 y 0,75 segundos, que el de un saln en la que ha de interpretarse msica de cmara est entre 1,00 y 1,75 segundos, y que el tiempo de reverberacin que ha de producir un local en el que suene un gran rgano de viento debe estar entre 2 y 3 segundos. De hecho cada tipo de espacios tiene un tiempo de reverberacin caracterstico. Se suele establecer la siguiente tabla indicativa de tiempos de reverberacin: Tipo de espacio Estudios de grabacin Aulas Salas de conferencias Cines Teatros pequeos Salas de conciertos Iglesias Catedrales Tiempo 0,4 - 0,6 0,5 - 0,9 0,8-1,2 0,7 - 1,3 1,1-1,5 1,1-2,3 1,8-2,5 2,4-3,3

19

Existe, pues, una relacin fsica directa entre el volumen del espacio donde se emite un sonido y el tipo de reflexiones que ste genera: a mayor volumen, mayor tiempo de reverberacin. Y como consecuencia de esa vinculacin fsica directa, nuestra memoria auditiva tambin asocia automticamente el tiempo de reverberacin con el volumen espacial, hacindonos sentir que cuanto ms larga es la reverberacin percibida, tanto mayor es el tamao de la sala que omos resonar. Revisemos ahora con ms detalle el coeficiente de absorcin sonora. Este coeficiente puede variar de 1,0 a 0,0 y se calcula para cada banda de octava, a lo largo de todo el espectro de frecuencias audible. Si decimos, por ejemplo, que un material tiene un coeficiente de absorcin sonora de 1,0 en la banda de 125 Hz, eso significar que absorbe todo el sonido de la octava que corresponde a esa frecuencia. En cambio, cuando el coeficiente de absorcin a 125 Hz es de 0,0 significa que el material en cuestin reflejar totalmente esa banda de frecuencias. En las superficies habituales de nuestro entorno cotidiano (oficinas, aulas, tiendas, viviendas, etc.) las superficies estn, a menudo, recubiertas con materiales que tienen un coeficiente de absorcin sonora importante (moquetas, cortinas, alfombras, etc.). No obstante, la absorcin que realiza este tipo de materiales porosos slo resulta efectiva en las frecuencias altas, porque el tamao de sus poros slo permite que penetren las vibraciones con longitud de onda muy corta. As, cuanto ms blandas son las superficies de la sala donde se produce una reverberancia, suele haber menos frecuencias agudas reflejadas; y a la inversa, cuanto ms duras son las paredes de la sala, mayor es la cantidad de frecuencias altas que se reflejan y que enriquecen la reverberacin. Pues bien, perceptivamente, la cantidad de frecuencias que refleja una superficie est directamente relacionada con la impresin espectral que adquiere el sonido al mezclarse con sus propias reflexiones. Cuando las paredes son duras, las reflexiones incluyen las frecuencias agudas, y eso hace que la reverberacin d al sonido un matiz tmbrico brillante. A medida que las superficies son ms blandas y porosas, se van reflejando solamente las frecuencias de mayor longitud de onda, que son, obviamente, las graves, entonces la reverberacin produce una impresin espectral mucho ms oscura y mate. El lector habr comprobado muchas veces cmo el matiz que toma su voz al resonar en una sala de paredes lisas y duras, por ejemplo un gran cuarto de bao alicatado, es muy diferente del que adquiere cuando resuena en un saln con alfombras y cortinas. La dureza de las paredes del bao tienen un coeficiente de absorcin sonora muy bajo, en consecuencia, la reverberancia es rica en frecuencias agudas y la voz toma un matiz sonoro brillante. En cambio, las superficies porosas del saln absorben un buen porcentaje de las frecuencias ms altas, con lo que la voz slo se colorea con las frecuencias graves produciendo una impresin espectral mucho ms oscura que en el cuarto de bao. As, cuando escuchamos una reverberacin de impresin espectral brillante, inmediatamente la asociamos a lugares de paredes duras; y si la impresin espectral es oscura asociamos el sonido a un lugar de paredes blandas. Volvamos, ahora, de nuevo, a la dimensin expresiva. Como siempre, lo interesante para la narrativa audiovisual es la posibilidad de reproducir en el estudio, de manera artificial, las mismas sensaciones acsticas que emanan de los espacios reales; y todo lo que acabamos de estudiar sobre la acstica del volumen espacial nos proporciona medios concretos para eso. Evidentemente, al generar una repeticin mltiple y retardada del sonido, por ejemplo con un magnetfono, estaremos produciendo un efecto acstico muy similar a la reverberacin real que se produce en una sala cerrada. Entonces, controlando artificialmente la velocidad de la cinta magnetofnica, se controla el tiempo que hay entre el sonido originario y las primeras repeticiones. Y ese tiempo de separacin entre sonido original y repeticiones artificiales simula el tiempo hasta la primera reflexin, de una reflexin real. A mayor velocidad de la cinta, el tiempo entre el sonido originario y las primeras repeticiones se acorta, y el efecto es de espacio pequeo. Si hacemos lo contrario y la cinta va ms lenta, el tiempo hasta las primeras repeticiones artificiales se alarga, con lo que el efecto es de un espacio mucho mayor. Por otra parte, al controlar la intensidad de la reverberacin artificial, influimos tambin sobre la sensacin de volumen espacial. Cuanto mayor es la intensidad de las repeticiones, ms lenta es la cada del sonido reverberado y, en consecuencia, ms se alarga el tiempo que dura la reverberacin artificial. Dicho de otra forma: cuanto ms amplifiquemos la intensidad del canal por el que entra la reverberacin artificial, ms dura sta y, en consecuencia, la sensacin generada es que el ente acstico que escuchamos est en un lugar cerrado de gran volumen espacial. 20

Finalmente, una vez controlada la sensacin de volumen espacial a voluntad del narrador audiovisual, podemos, tambin, controlar artificialmente la sensacin de dureza de las paredes de nuestro espacio virtual. As, mediante un ecualizador, 12 que nos permita manipular el espectro de la seal sonora en tercios de octava, no tiene ninguna complicacin crear artificialmente impresiones espectrales ms o menos brillantes u oscuras. Con lo que el realizador puede, tambin, transmitir al oyente la sensacin de que las paredes del espacio resonante son ms o menos duras de acuerdo con las necesidades de la narracin. Vemos, pues, que existen mltiples posibilidades combinatorias entre la manipulacin del tiempo de reverberacin y la ecualizacin de la mezcla resultante, para conseguir espacios sonoros virtuales de las ms diversas caractersticas volumtricas. Respecto a las reflexiones sonoras suele existir un cierto nivel de confusin terminolgica entre los conceptos de eco y de reverberacin que creemos que es conveniente aclarar aqu. Debe utilizarse el trmino reverberacin mientras las reflexiones sonoras se perciben como parte integrante del sonido, o sea, cuando se oyen como un alargamiento que est pegado al sonido inicial. Este fenmeno perceptivo se produce cuando el tiempo hasta la primera reflexin oscila entre los 10 y los 40 milisegundos, o lo que es lo mismo, cuando la distancia a la que se encuentra la primera pared reflectante est a menos de 17 metros del punto de emisin y audicin. En esta situacin, nuestro sistema auditivo, siguiendo el principio de la regularidad (vase apartado 5.2.4) nos hace percibir el sonido inicial y sus reflexiones unidos como una misma forma sonora. En cambio, debe hablarse de eco cuando las reflexiones sonoras ya no son percibidas como un alargamiento, sino como repeticiones claramente separadas de la forma sonora originaria, es decir, como formas sonoras distintas. Esta percepcin se produce cuando el tiempo hasta la primera reflexin supera los 50 milisegundos. Explicndolo de otro modo: cuando la primera pared que refleja el sonido est a ms de 17 metros del lugar de emisin y audicin. Para concluir este apartado, desarrollaremos una ltima reflexin que da coherencia a todo lo que hemos revisado hasta aqu sobre la construccin auditiva del volumen espacial. Si mediante el tratamiento adecuado de la intensidad de dos entes acsticos (pensemos por ejemplo en personas) estoy explicando la distancia que hay entre ellos, y a la vez, entre ellos y el oyente, es decir, estoy construyendo un claro y concreto efecto de profundidad; al aadir un efecto sonoro de reflexin con un retardo importante, estoy creando unas paredes que el oyente percibe como muy alejadas de los personajes. As, el volumen espacial percibido globalmente por el receptor ser el resultado de articular la distancia entre los dos personajes, y entre ellos y el oyente; con la distancia de los personajes hasta los muros que reflejan su voz, que depende del tiempo de reverberacin. A esta construccin es posible aadir el efecto direccional que es posible generar mediante la estereofona (diferencias de intensidad entre ambos odos) y el efecto de dureza de las paredes que es posible inducir perceptivamente mediante el control de la impresin espectral. El resultado es una construccin espacial considerablemente precisa y muy compleja. En suma, uniendo todas estas posibilidades de reconstruccin de la acstica del volumen espacial, disponemos de una gran capacidad para la narracin del espacio sonoro. Es decir, para la construccin de volmenes espaciales virtuales que se pueden aproximar con extraordinaria exactitud a como sonaran estos mismos espacios en la realidad referencial.

7.3-9. El punto de audicin


Cuando un oyente escucha un paisaje sonoro de la realidad referencial, lo est oyendo siempre desde un lugar concreto, desde un punto especfico del espacio. En este punto estn situados sus odos, y todos los sonidos que percibe son predeterminados y alterados perceptivamente por lo que podramos denominar el efecto del punto de audicin. Las fuentes sonoras ms alejadas son percibidas, entonces, con menos intensidad que las ms cercanas; se percibe la lateralidad de la fuente sonora mediante las diferencias de tiempo e intensidad entre odos, etc. Imagnese a s mismo el lector, por ejemplo, en la siguiente situacin: est en el centro de una plaza amplia y arbolada escuchando la actuacin de unos msicos callejeros, alrededor de la plaza hay circulacin de vehculos que percibe como un rumor sordo de fondo. Y algo ms dbiles que la 21

meloda de los msicos, pero ms fuertes que el rumor de los coches, escucha tambin el trino de los pjaros que estn en las copas de los rboles de la plaza, ms all de los msicos. Pasan unos minutos y usted decide reanudar su camino, as que se aleja de los msicos acercndose a la calzada que rodea la plaza para cruzarla y dirigirse hacia la parada de autobs ms cercana. Justo en el momento en el que va a cruzar la calle sigue escuchando la msica, pero sta suena ya alejada; en cambio, el ruido de los automviles, que antes era slo un rumor, suena ahora mucho ms fuerte que la msica. El trino de los pjaros ya es casi imperceptible. La situacin objetiva desde el punto de vista fsico es exactamente la misma, todas las fuentes sonoras siguen en el mismo lugar. Para las personas que an siguen frente a los msicos, en el centro de la plaza, todo sigue sonando exactamente igual. No obstante, el espacio sonoro que estara usted percibiendo sera ya radicalmente distinto, a pesar de que sigue todava en la plaza y oyendo exactamente las mismas fuentes sonoras. En suma, el punto desde donde se escucha una determinada organizacin de fuentes sonoras que emiten sonido simultneamente, determina de una forma radical la sensacin de espacio sonoro y de perspectiva, ya que la composicin acstica es distinta en cada punto de audicin. Esta fenomenologa perceptiva configura, pues, el efecto del punto de audicin como una clave narrativa fundamental para la creacin virtual de espacios sonoros. Cambiemos ahora de terreno, abandonando el universo referencial y saltemos de nuevo a los espacios sonoros virtuales de la narrativa audiovisual. Hemos visto ya cmo la ubicacin ordenada de entes acsticos en el espacio sonoro nos permita controlar la sensacin de perspectiva y construir el efecto de profundidad sonora. Pues bien, teniendo en cuenta el efecto perceptivo que introduce el lugar desde donde se escucha un espacio sonoro, es posible organizar los entes acsticos en funcin de un punto de audicin concreto y definido a priori. El objetivo es reconstruir artificialmente las sensaciones auditivas de un receptor que se desplaza por un espacio sonoro virtual. Evidentemente, si disponemos de grabaciones con los tres sonidos que mencionbamos antes {/ruido de circulacin de automviles/, /trino de pjaros/'y /msicos callejeros/) podemos tratarlos tcnicamente en el estudio de audio de modo que transmitan de forma artificial exactamente las mismas sensaciones que describamos un poco ms arriba. Lo que estamos haciendo ahora es organizar los entes acsticos en funcin de un punto de audicin concreto, para construir el espacio sonoro siguiendo la lgica perceptiva natural. La definicin precisa de punto de audicin sera la siguiente:
Punto de audicin es el punto de referencia espacial a partir del cual se construye toda perspectiva sonora. Emula el punto del espacio referencial desde donde un oyente escucha cualquier conjunto de fuentes sonoras.

Ciertamente, hablamos del mismo concepto al que hizo referencia en su momento Fuzellier llamndolo point ici, y que luego retoma Balsebre traducindolo como punto aqu (vanse Fuzellier, 1965, pgs. 34-37 y Balsebre, 1994, pgs. 152-153), no obstante, nos parece ms adecuado nombrarlo como punto de audicin en tanto que, en realidad, no estamos haciendo referencia al lugar donde est colocado fsicamente el receptor, sino a un punto de referencia virtual a partir del cual hemos de imaginar una determinada composicin sonora que ha de seguir la misma lgica acstica que la realidad referencial. En esta misma lnea est tambin el concepto de punto de escucha que propone Michel Chion; de todas formas, el planteamiento de Chion es estrictamente cinematogrfico y est, a nuestro modo de ver, demasiado ligado a la imagen en tanto se plantea como directamente dependiente de ella (vase Chion, 1993, pgs. 90-94). Es por eso que hemos preferido mantener una diferencia terminolgica y conceptual respecto a su propuesta. Nosotros entendemos el punto de audicin como un punto de referencia terico concreto y, sobre todo, estrictamente auditivo. Pero regresemos a nuestro ejemplo. Para crear la sensacin auditiva de desplazamiento a travs de la plaza bastara con meterse en ella cargando un magnetfono porttil y un micrfono adecuado, y grabar los sonidos mientras caminamos haciendo el recorrido descrito. Pero de ese modo realizaramos lo que se suele llamar un travelling sonoro, es decir, sera simplemente copiar. Lo que resulta ms interesante para la narracin audiovisual es, precisamente, la posibilidad de crear espacios que en realidad no existen, situar en ellos entes acsticos inventados, y lograr, luego, que el receptor perciba las mismas sensaciones auditivas que tendra si se desplazase realmente a travs de ese espacio virtual. Para conseguir eso es imprescindible partir de un punto que nos permita organizar 22

el espacio, o lo que es lo mismo, tomar siempre como referencia un punto de audicin concreto. La pelcula de la Walt Disney Company: Toy Story, que fue enteramente desarrollada a partir de imgenes infogrficas, es un buen ejemplo para ilustrar este tipo de posibilidades expresivas del sonido. Evidentemente, ninguno de los espacios en los que se desarrolla esta historia existe como paisaje sonoro real, as que fue necesario crearlos todos artificialmente desde el principio hasta el final. Tomaremos, pues, prestada una de las situaciones de esta historia para estudiar de qu modo es posible narrar el desplazamiento por un espacio sonoro virtual. Uno de los momentos crticos de Toy Story, es cuando Buzz, el juguete astronauta, y Woody, el juguete vaquero, huyendo de un perro que los persigue a travs de la escalera y el pasillo, se esconden cada uno en una habitacin. Casualmente, Buzz entra en una habitacin en la que hay un televisor en marcha, justo en el momento en el que transmiten un espot publicitario sobre l. Para construir el sonido en esta situacin son necesarios tres entes acsticos: el /perro/(ladridos, gruidos y jadeos), el /televisor/(voces, msicas, efectos, etc., tratados con una definicin sonora reducida) y /Buzz/(voz del juguete-astronauta). En el momento en que el juguete-astronauta entra en la habitacin del televisor, el receptor entra con l y, por tanto, ha de escuchar el espacio sonoro del mismo modo que lo escuchara Buzz. Es decir, con el punto de audicin situado dentro de la habitacin. El tratamiento de los entes acsticos es, entonces, el siguiente: la voz del juguete suena en primer plano (estamos junto a l), y los sonidos del televisor y del perro se oyen ambos en segundo. El perro sigue en el pasillo ladrando a la puerta cerrada de la habitacin en la que se ha refugiado Woody, y Buzz esta escondido en la habitacin de la tele (que tiene la puerta entreabierta) a medio camino entre el perro y el televisor. Esta situacin puede tratarse estereofnicamente situando al perro en los altavoces de la izquierda y el sonido del televisor en el de la derecha. Puede tambin matizarse el sonido del perro, hacindolo sonar con algo de reverberacin y tratando su timbre de manera ms brillante para sugerir el volumen espacial del pasillo en el que est. Y el audio del televisor queda perfectamente diferenciado al tener reducida su definicin, de modo que suena con un efecto caracterstico de altavoz de baja calidad. Ahora hemos definido un espacio sonoro y estamos en condiciones de mover el receptor a travs de l. Buzz descubre que en la tele hablan de l y se acerca al televisor. Si la imagen adopta un punto de vista subjetivo y se acerca a la pantalla como si visemos por los ojos del mueco, el tratamiento del sonido debe responder a ese movimiento y, por tanto, el punto de audicin debe desplazarse por el espacio sonoro acercndose al televisor. Nada ms sencillo. Para sugerir acsticamente ese movimiento bastar con variar progresivamente, y en sentido contrario, la intensidad de los dos entes acsticos que proporcionan la referencia espacial. O sea, mientras aumentamos lenta y progresivamente la intensidad del sonido del televisor, iremos bajando tambin la intensidad de los gruidos del perro en la misma proporcin. De esa manera, el receptor percibe auditivamente el efecto de que est desplazndose por el espacio sonoro. Cuando aparece la voz de Buzz, sta debe seguir sonando en primer plano, puesto que el punto de audicin se ha desplazado con l. Imaginemos que el mueco astronauta regresa hacia la puerta para mirar el perro y estudiar la situacin. Pero ahora el punto de vista se queda junto al televisor y contemplamos cmo Buzz se aleja desplazndose hasta el fondo del espacio. La construccin sonora de esta situacin deber hacerse manteniendo idnticas las intensidades a las que habamos llevado el televisor y el perro. La forma de contar acsticamente el movimiento del mueco sera reduciendo solamente la intensidad de su voz mientras que se aleja del punto de audicin. Vemos, pues, que la forma de explicar que el punto de audicin est quieto, a pesar de que algn ente acstico est desplazndose a travs del espacio sonoro, es manteniendo estables (sin variacin de intensidad) los entes acsticos que actan como referencia espacial. Una ltima situacin. Se produce un nuevo cambio visual y la imagen pasa directamente a mostrar el punto de vista subjetivo de Buzz. Los espectadores ven, ahora, al perro desde muy cerca. Todo el paisaje sonoro debe cambiar de nuevo, pero bruscamente, ya que el punto de audicin tambin ha cambiado repentinamente de lugar. El modo de tratar acsticamente el espacio sonoro para conseguir ese efecto ser invirtiendo de un salto la relacin de intensidades del perro y el televisor. El sonido del perro ha de pasar a primer plano, y el de la televisin a tercero. Y puesto que el punto de audicin vuelve a estar junto a Buzz, su voz debe pasar, tambin bruscamente, a sonar en primer plano. Las situaciones que hemos propuesto muestran las dos posibilidades que existen de desplazamiento del punto de audicin, y que denominaremos como: 23

a) punto de audicin mvil, b) cambio de punto de audicin.

El punto de audicin mvil transmite al receptor la sensacin auditiva de desplazamiento progresivo a travs de un espacio sonoro previamente creado. El cambio de punto de audicin expresa un salto brusco de un lugar a otro en un mismo espacio sonoro, o un salto repentino de un espacio sonoro a otro completamente distinto. Es importante recordar que en este ejemplo las imgenes son completamente virtuales y, por tanto, nunca actuaron como fuentes cuya emisin sonora pudiese ser reproducida. En consecuencia, todas las sensaciones de movimiento por el espacio sonoro son el resultado sistemtico de una manipulacin racional de los entes acsticos. Para acabar, queremos insistir en que este tipo de mecanismos expresivos sonoros puede actuar con absoluta independencia de cualquier representacin visual. A lo largo del ejemplo exista coherencia entre punto de vista y punto de audicin. No obstante, tambin podemos perfectamente transmitir al receptor la sensacin de desplazamiento a travs del espacio sonoro trabajando slo con sonidos. De hecho, en la tradicin dramtica radiofnica ste ha sido un recurso muy utilizado: tanto Fuzellier como Balsebre, cuando se refieren al punto de audicin, lo hacen desde el estudio de la ficcin radiofnica. Ciertamente, lo lgico en la narracin audiovisual es que punto de vista y punto de audicin coincidan, ya que los ojos y los odos estn situados en el mismo lugar del cuerpo y, normalmente, ambos sistemas perceptivos actan a la vez. Pero no olvidemos que cuando la luz se apaga, cuando los ojos se cierran, o cuando la visin se pierde, los odos nos siguen informando sobre el espacio que nos rodea y sobre cmo nos movemos a travs de l.

24

7.4. El papel narrativo de la sincrona imagen-sonido


Para enfrentarnos a la fenomenologa generada por la suma de la imagen y el sonido hemos de acotar dos clases de fenmenos distintos:
1. La tendencia natural del receptor a la coherencia perceptiva. 2. La bsqueda y la construccin por parte del narrador de relaciones formales entre el material visual y el material sonoro.

Vimos que el entorno natural genera, normalmente, informaciones perceptivas sonoras y visuales que son coherentes entre s, porque vinculan sistemticamente fuentes sonoras y sonidos; en consecuencia, cuando un receptor se enfrenta a cualquier tipo de formas perceptivas sonoras y visuales simultneas, tiende de una forma natural a buscar conexiones entre ellas. En el apartado 6.3.2 estudiamos que la comunicacin audiovisual se apoya en esta tendencia a la coherencia perceptiva para producir sus discursos. As, la clave para conectar entre s un discurso sonoro y otro visual que originariamente no han tenido ningn tipo de relacin natural entre ellos, es proporcionar al receptor un nmero de relaciones formales entre sonido e imagen que los vincule rgidamente entre s. Normalmente, ese esfuerzo de conexin no ha de ser demasiado grande. Una vez conseguido el efecto de conexin entre la imagen de la pantalla y el sonido que emana de los altavoces, el espectador siente con mucha fuerza que las vibraciones sonoras provienen de la imagen que contempla proyectada. A partir de ese momento, el narrador est en condiciones de conducir la percepcin visual de su espectador manipulando el audio, porque el receptor procesa ya la informacin sonora y la informacin visual como un todo unvoco y coherente. Eso significa, por ejemplo, que si la energa de una fuente sonora est vinculada al nivel de intensidad de su sonido, una vez que hayamos conseguido conectar, pongamos por caso, la imagen de un cristal luminoso a un zumbido, bastar con hacer sonar el zumbido cada vez ms fuerte para que el receptor sienta que est aumentando la energa de aquella cosa centelleante y transparente; o al contrario, ser suficiente con hacer que el zumbido se debilite para que nuestro engaado espectador perciba que la energa del cristal est disminuyendo. Podemos tambin invertir esta lgica, y asociar la imagen de un androide luminoso a un sonido de voz inexpresivo y lineal, para contar luego al espectador que el grado de energa del androide crece cuando aumentamos la luminosidad que ste desprende. En suma, una vez establecida la asociacin sonido-imagen, todo nuestro saber sonoro puede ser aplicado a dirigir la percepcin de la imagen, o todo nuestro saber visual puede aplicarse a conducir la percepcin del sonido. Pero de qu manera se establece esa conexin previa sonido-imagen? Cmo es posible que unifiquemos perceptivamente una serie de imgenes lumnicas que se mueven en una pantalla con los sonidos que provienen de una serie de cajas oscuras escondidas detrs de la pantalla y colgadas en la pared? En principio, se podra pensar que la situacin de los altavoces detrs de la pantalla en el cine, o justo a su lado en el televisor, es un elemento esencial de esa unificacin. No obstante, que el sonido provenga de la misma direccin que la fuente propuesta visualmente no es, en absoluto, el elemento de relacin formal que determina la fusin perceptiva audio-visual. Ya vimos en el captulo 5 que nuestro sistema auditivo est perfectamente preparado para discriminar entre sonidos generados por distintas fuentes sonoras sin depender de su direccin. La fusin perceptiva audio-visual se apoya bsicamente en la explotacin de la coincidencia o no coincidencia temporal entre el sonido y la imagen. Es decir, en los principios de la sincrona (vase apartado 5.2.5).

7.4.1. El concepto de sincrona


En el caso de la relacin sonido-imagen, el principio de la sincrona responde a la siguiente lgica natural: es altamente improbable que el inicio y el final de un fenmeno sonoro coincidan exactamente en el tiempo con el inicio y el final de un fenmeno visual, solamente por casualidad. 25

A medida que acumulamos experiencia sensorial y perceptiva al desenvolvernos en nuestro entorno cotidiano, aprendemos que los fenmenos sonoros y los visuales solamente tienden a coincidir en el tiempo cuando ambos provienen de la misma fuente. Entonces, al recibir una coincidencia precisa en el tiempo entre lo sonoro y lo visual, nuestro sistema sensorial conecta entre s los estmulos acsticos y lumnicos, y se desencadena lo que Chion denomina sinresis (vase Chion, 1993, pg. 65) y que a nosotros nos parece ms descriptivo nombrar como: fusin perceptiva audiovisual. Una vez que se ha logrado esa fusin, percibimos, aun a pesar de nuestro conocimiento racional del fenmeno, que entre la imagen proyectada en la pantalla y el sonido que sale de los altavoces hay una relacin sonido-fuente, que mantiene unidos ambos fenmenos perceptivos. Proponemos definir la sincrona del siguiente modo:
Se denomina sincrona la coincidencia exacta en el tiempo de dos estmulos distintos que el receptor percibe perfectamente diferenciados. Estos dos estmulos pueden ser percibidos por el mismo sentido {odo: sincrona entre distintos instrumentos musicales) o por sentidos distintos (vista y odo-, sincrona audiovisual).

As, cuando nuestros rganos auditivos y visuales reciben sendos estmulos sincronizados, el sistema perceptivo nos hace sentir automticamente que ambos estn directamente relacionados entre s como si los hubiese generado la misma fuente fsica, o como si proviniesen de fuentes distintas que han entrado en relacin fsica directa (por ejemplo mediante un choque). sa es, pues, la forma esencial de conseguir la conexin entre sonido e imagen: la sincrona. Es ms, el efecto perceptivo de fusin audio-visual que se consigue sincronizando formas sonoras con formas visuales es tanto ms fuerte, cuanto ms fina y precisa sea esa coincidencia temporal. Siendo ms concretos: cuanto ms limitada est en el tiempo la posibilidad de coincidencia de los estmulos; o lo que es lo mismo, cuanto ms breves son los estmulos que coinciden en el tiempo, ms fuerte es el efecto de fusin que produce la sincrona entre ellos. De hecho, cuando un receptor percibe sincrnicamente dos fenmenos diferenciados caben.tres posibilidades de descodificacin en funcin del nivel de precisin de la coincidencia temporal:
1. Cuando la sincrona es permanente y muy precisa, el receptor percibe que los dos fenmenos provienen de la misma fuente, o de fuentes que estn en relacin directa (se produce la unificacin). 2. Cuando la sincrona es extensa en el tiempo, pero hay un margen de precisin escaso al tomar puntos concretos de referencia, el receptor percibe los dos fenmenos como provenientes de fuentes distintas que buscan armonizar su evolucin en el tiempo. Este tipo de sincrona produce un fuerte efecto de fascinacin en el receptor (se produce una sincrona esttica). 3. Cuando la sincrona es puntual, espordica e imprevisible, el receptor percibe los dos fenmenos como totalmente independientes, decidiendo racionalmente que su coincidencia en el tiempo es puramente accidental (se produce una sincrona casual).

Tambin Chion hace referencia a distintos grados de sincrona, y habla de sincronismo amplio, medio y estrecho (vase Chion, 1993, pg. 66). No obstante, no vincula esas denominaciones a efectos narrativos o perceptivos sino que, simplemente, menciona tres estilos diferentes de usar la sincrona en funcin de tres grados distintos de precisin, que tampoco llega a concretar. Sabemos que la sincrona se detecta sistemticamente en las coincidencias temporales entre los mximos de intensidad sonora o en el principio y el final del suceso sonoro, con cualquier otro estmulo sensorial claramente definido en el tiempo; por ejemplo el principio y el final de un movimiento visual. De todos modos, conocemos todava muy pocas cosas sobre las respuestas de nuestro sistema perceptivo al fenmeno de la sincrona, y hay todava muchas preguntas a las que necesitamos encontrar respuesta; sobre todo si tenemos en cuenta que la sincrona es hoy un fenmeno absolutamente fcil de manejar de forma artificial. De hecho, la tcnica de la sincrona permite, hoy, llevar el engao televisivo y cinematogrfico a un grado de verosimilitud tan extraordinario, que hace de las mentiras narrativas algo absolutamente inextricable por la percepcin humana, y esto nos parece demasiado importante y complejo para dejarlo exclusivamente en manos de la intuicin.

26

7.4.2. La sincrona como recurso narrativo


Definida ya la sincrona desde el punto de vista perceptivo, vayamos de nuevo a estudiar su papel dentro del universo de la narratividad audiovisual. Estamos totalmente de acuerdo con Chion en que la sinresis, es decir, la fusin audio-visual, es la funcin bsica de la sincrona en el universo audiovisual. Gracias a la coincidencia exacta en el tiempo entre imgenes y sonidos, percibimos como una unidad indivisible estmulos que originariamente no tenan nada que ver entre s. La lnea bsica de descodificacin de la sincrona en el universo audiovisual es, consecuentemente, la unificacin. Desde la perspectiva de la narracin audiovisual existen diferentes grados de necesidad de rigor sincrnico para que sonido e imagen sean captados por el receptor como unificados. Por ejemplo, para que un material sonoro musical y otro visual sean aceptados perceptivamente por el receptor como coherentes slo es necesario que aparezca algn punto de sincrona cada varios segundos (cada 2 o 3 segundos). Este umbral no ha sido estudiado. El umbral vara en los fenmenos a los que estamos mucho ms habituados, como por ejemplo el habla y la imagen de la gesticulacin de la boca. Para estos fenmenos muy cotidianos la exigencia de frecuencia sincrnica es mucho ms alta. No obstante, parece que existen siempre unos mrgenes de tolerancia bastante amplios. La sincrona audiovisual permite unificar sonidos de distinto origen, generando entes audiovisuales completamente nuevos y de gran impacto expresivo. Utilizando los valores informativos que tienen en nuestra memoria auditiva determinadas formas sonoras, el narrador audiovisual puede crear y conducir con mucha eficacia los nuevos entes que surgirn en la mente del receptor al asociar imagen y sonido. Existen muchas muestras interesantes de esa capacidad para generar nuevos valores expresivos a travs de la sincrona audiovisual, que no estn originariamente ni en la imagen ni en el sonido. Un ejemplo ya clsico es el sonido de sanda aplastada que se utiliz en La piel de Liliana Cavani (1981) para contar acsticamente el momento en que un tanque aplasta accidentalmente a un muchacho, la fusin audio-visual genera, en este caso, una espeluznante sensacin de huesos y vsceras aplastadas, que es en realidad un ente audiovisual nuevo. El receptor, difcilmente, tendr en su memoria perceptiva una situacin similar con la que poder comparar esa propuesta audiovisual. Un ejemplo ms reciente es el interesante dragn creado en la pelcula Dra-gonheart que dirigi Rob Cohn en 1996. En este caso, la sincrona conecta un personaje fantstico creado mediante ordenador, con la voz entraable de un actor muy conocido: Sean Connery en el doblaje norteamericano y Francisco Rabal en la versin espaola. Tras el breve rechazo inicial que se produce al recordar la imagen del propietario de la voz, el efecto perceptivo de la sincrona rebasa ampliamente el de nuestra memoria y las caractersticas sonoras del actor quedan completamente transferidas a la imagen del dragn. Entonces se produce el milagro, y ese ser inexistente se reifica y adquiere una sorprendente consistencia frente a nuestro sistema perceptivo, convirtindose en un ente audiovisual completamente nuevo que ya no tiene nada que ver con la imagen sinttica aislada, ni con la voz del actor. Ahora es Draco, en la versin espaola: un personaje nada terrible, viejo, sabio, entraable y un poco torpe. Unas caractersticas que le descubrimos enseguida, mucho antes de que el personaje tenga tiempo para desarrollarse a lo largo de la historia. se es el carcter que Draco debe a la inconfundible voz del ya veteransimo Paco Rabal. Siempre tomando como punto de partida el efecto de fusin audio-visual que produce la sincrona, pero ahora desplazndonos ya hacia los umbrales de tolerancia de nuestra percepcin de ese fenmeno, nos encontramos con dos recursos narrativos habituales que nombraremos como: 1) control del impacto emocional, y 2) conduccin de la atencin visual.
1.Control del impacto emocional. El desfase temporal entre sonido e imagen es un recurso expresivo clsico que aprovecha el margen de variabilidad que tiene la percepcin humana respecto a la sincrona. Los profesionales de la narracin cinematogrfica saben muy bien que nuestro sistema perceptivo tolera cierto desfase de la sincrona entre imagen y sonido sin que se deje de desencadenar el efecto de fusin audio-visual {vase Nieto, 1996, pg. 139); y que manipulando ese desfase es posible controlar el grado de impacto emocional que produce en el espectador una situacin determinada. As, cuando un montador quiere reforzar el impacto emocional de la aparicin sbita del monstruo de la historia, slo debe hacer entrar su rugido en el fotograma anterior al de la aparicin. Si tenemos en cuenta que

27

cada fotograma tiene un tiempo aproximado de exposicin de 0,04 segundos, deduciremos que se es el margen con el que cuenta el narrador para asustar ms o menos al espectador manteniendo el efecto de fusin audio-visual. Entonces, cuanto ms se adelanta el sonido respecto a la imagen, mayor ser el impacto que la aparicin del monstruo produce13 en el receptor. Se utiliza tambin el efecto inverso. Si el sonido se atrasa respecto a la visin de la fiera, el impacto emocional del monstruo desaparece por completo, y eso ocurre a pesar de todo lo repentina y terrible que pueda ser visualmente la citada aparicin. Al parecer, a pesar de que nosotros no seamos racionalmente conscientes de ello, nuestro sistema perceptivo nos alerta con ms o menos fuerza sobre un estmulo audiovisual, segn vaya la sensacin sonora respectivamente antes o despus de la sensacin visual. 2.Conduccin de la atencin visual. Sabemos que las sensaciones sincrnicas producen una impresin sobre el sistema perceptivo mucho ms fuerte que la que ejercen esas mismas sensaciones cuando no coinciden en el tiempo. Pues bien, se es, tambin, un fenmeno ampliamente aprovechado en la narracin audiovisual. As, un recurso que se utiliza para conducir la atencin del receptor sobre alguna de las formas visuales que aparece en la pantalla es, precisamente, la sincronizacin de los movimientos de esa forma concreta, con estmulos acsticos que suenan ms intensos y mejor definidos que todos los dems. Un ejemplo caracterstico de esto seran las imgenes que componen la secuencia de una batalla. Los planos de una batalla, especialmente en las narraciones ambientadas en la Edad Antigua o en la Edad Media, suelen estar compuestos por una gran confusin de personas armadas con espadas, lanzas, hachas, puales, y dems herramientas de guerra, que luchan entre s movindose por toda la pantalla. Mientras vemos esto, omos tambin una gran confusin de gritos, golpes sordos, pasos, golpes metlicos, cadas, etc. De los sonidos que omos, algunos sincronizan con lo que vemos, y otros muchos no. Se supone, entonces, que estamos escuchando los soldados que podemos ver, y adems, a otros muchos que quedan fuera del campo visual que muestra la pantalla. Entonces, cuando el realizador quiere destacar al hroe entre el confuso grupo de 20 o 30 guerreros que se muestran en la pantalla luchando a muerte entre s, recurre a la sincrona. Para hacerlo, trata el sonido de modo que algunos gritos y golpes concretos destaquen con ms intensidad que los dems, y ese sonido destacado se sincroniza con los movimientos del protagonista. De ese modo la atencin del receptor queda claramente dirigida hacia l. Es decir, se tratan los estmulos sonoros y visuales que configuran al hroe, de manera que sean precisamente stos los que llamen con ms fuerza la atencin del receptor.

7.4.3. Ritmo musical y movimiento visual


Si entendemos el ritmo musical como las sensaciones que emanan de la organizacin de las formas acsticas en el tiempo, y que el movimiento visual supone, tambin, organizar desplazamientos de formas lumnicas en el tiempo, deduciremos sin dificultad que el instrumento evidente de relacin es la sincrona. Es decir, la coincidencia exacta en el tiempo de determinadas formas sonoras con determinadas formas visuales. La investigacin en este campo es tambin muy escasa; haremos, no obstante, una aproximacin a la fenomenologa perceptiva que desencadena la relacin sincrnica entre la msica y el movimiento visual diferenciando entre sus dos utilidades expresivas ms conocidas: 1) el control del efecto de agradabilidad-desagradabilidad y 2) el control del ritmo visual.
1. Control del efecto de agradabilidad-desagradabilidad. Cuando trabajamos con una organizacin visual bien definida en el tiempo (cambios regulares de plano, movimientos bien definidos de un personaje, etc.), el hecho de que el ritmo de la msica sincronice o no con el movimiento visual determina la agradabilidad o desagradabilidad del resultado.

28

El uso publicitario de la msica es un ejemplo caracterstico de coherencia sincrnica que busca claramente el efecto de agradabilidad. Contrariamente, las situaciones de gran tensin dramtica-violenta suelen estar construidas en base a estructuras rtmicas audiovisuales muy desordenadas, sin sincrona entre msica e imagen; como consecuencia, se genera sensacin de desagradabilidad y un fuerte deseo de que finalice la situacin narrada. Si las mismas situaciones violentas se trabajan a partir de relaciones sincrnicas sonidoimagen, se consigue un fuerte efecto de fascinacin por la situacin de violencia. El efecto perceptivo que desencadena la ltima secuencia de Apocalypse Now,u mientras se desarrolla el bombardeo con las explosiones perfectamente sincronizadas con la msica y a medida que van saliendo los crditos, seran un interesante ejemplo de este ltimo recurso. 2.. El control del ritmo visual. La sensacin de adecuacin o no de una msica a una imagen en movimiento depende de que el tempo musical sincronice con alguno de los movimientos perceptibles visualmente. Cuando se consigue esta sincrona la msica se percibe como adecuada a la imagen.

Una vez conseguido este efecto de coherencia, si los movimientos visuales son complejos y mltiples, los puntos de sincrona con el sonido actan como un recurso de focalizacin de la atencin perceptiva. Hemos visto ya que de todo el conjunto de movimientos observables, el receptor slo repara, u observa como esenciales, aquellos que estn marcados por la coherencia sincrnica sonidoimagen. Naturalmente, esto es directamente aplicable a la sincrona rtmica. As, eligiendo un tipo de sincrona msica-imagen u otra, el narrador puede conducir la atencin del receptor fijndola en una parte concreta u otra del conjunto de movimientos visuales. La manipulacin de la msica proporciona, entonces, ndices muy claros que dirigen la percepcin visual del receptor. La eficacia de este recurso es de un alcance sorprendente, llegando hasta el punto de alterar el efecto de velocidad de los movimientos de la imagen. Tras unas conversaciones sobre este tema, el compositor espaol Jos Nieto15 hizo llegar a mi poder un interesantsimo experimento al respecto. Nieto haba ambientado una de las secuencias de la serie Capitn Cook con dos msicas distintas, obteniendo un resultado perceptivo impresionante. Las imgenes muestran el enfrentamiento de Cook y algunos de sus soldados ingleses contra una tribu de indgenas en una playa tropical. El movimiento visual de las imgenes, como en cualquier otra batalla audiovisual, contiene muchos tipos de movimiento distintos. En este caso, podemos destacar una lnea de movimientos cortos y rpidos, constituida por los indgenas agitando las lanzas y saltando en actitud agresiva, los movimientos de los labios y la boca gritando, los fogonazos de los disparos, saltos, movimientos bruscos de agresin, etc. Y una segunda lnea de movimientos mucho ms lentos, constituida por las cadas atormentadas de los heridos, desplazamientos suaves para acercarse cautelosamente al enemigo, movimientos largos de los brazos, bocanadas de humo de los disparos, etc. Nieto msico la secuencia en primer lugar con una base rtmica de percusin rpida muy dominante y, luego, con una msica de base meldica con notas muy largas sin demasiados cambios y sin ningn tipo de percusin. El efecto perceptivo del primer montaje sonido-imagen es de una situacin tensa en la que todo el mundo se mueve nerviosamente y con rapidez. En cambio, cuando la misma secuencia visual se observa con la segunda msica, el efecto es radicalmente distinto. La primera vez que me somet al experimento llegue a pensar que la imagen del montaje con la msica meldica haba sido ralentizada. Naturalmente, no era as. Era la msica la que desencadenaba ese efecto de ralentizacin global. Luego, he sometido a mis alumnos en varias ocasiones a la experiencia, siempre con el mismo resultado: en la segunda versin de la secuencia aparece la sensacin en que todo sucede ms lentamente que en la primera. Que es lo que ocurre? A que se debe ese cambio perceptivo? En la primera versin, el ritmo rpido de la percusin sincroniza con la primera lnea de movimientos; entonces, nuestra atencin es conducida auditivamente hacia las acciones rpidas, dominando stas completamente la percepcin global de la informacin audiovisual recibida. En cambio, en la segunda versin, los principios y finales de las formas sonoras que constituyen las notas, tienden a sincronizar mucho mejor con la segunda lnea de movimientos lentos, hacindolos sensorial-mente ms importantes y centrando sobre ellos la atencin del receptor. La forma en que se perciben los disparos de los caones y los fusiles decimonnicos en funcin de la msica utilizada es quizs el ejemplo ms revelador. Mientras la msica rtmica hace recaer la 29

atencin visual sobre los fogonazos de los disparos, la msica meldica da un relieve perceptivo insospechado a cada bocanada de humo que sale de las armas

7.4.4. Otras formas de relacin sonido-imagen


A pesar de que el instrumento expresivo ms poderoso para conseguir el efecto de fusin audiovisual es, sin ninguna duda, la sincrona, existen otros recursos que permiten relacionar formalmente imagen y sonido, aprovechando la tendencia de nuestro sistema sensorial a la coherencia perceptiva. Quizs el uso ms obvio de la relacin entre imagen y sonido sea el que se establece entre intensidad y energa de la accin. As, tanto los monstruos poderosos como las mquinas de gran potencia suelen estar asociados a intensidades acsticas que bordean el centenar de decibelios. Y lo mismo ocurre con las situaciones de fuerte carga emocional, que son asociadas sistemticamente a pasajes musicales interpretados con una intensidad muy alta. Naturalmente se hace tambin el uso inverso, asociando la extincin de la energa con la disminucin de la intensidad sonora. Se suele establecer, tambin, una relacin directa entre intensidad sonora y el tamao de su fuente visual. Cuanto mayor es fsicamente la fuente sonora que se presenta en la pantalla, mayor suele ser la intensidad de las formas sonoras que se le asocian; cumplindose tambin el efecto contrario: a menor tamao menos intensidad. Un ascenso tonal en la banda sonora suele aparecer asociado a ascensos visuales, y el descenso tonal va unido a las bajadas o cadas. Un ejemplo absolutamente tpico es el de los dibujos animados, en cuyas historias todo lo que sube se asocia a tonos ascendentes y lo que baja a tonos descendentes. Esta relacin se cumple, tambin, con la modificacin de la impresin espectral. Por ejemplo, con el zumbido de un avin, o con el ruido de un helicptero. Cuando la mquina volante en cuestin asciende visualmente por la pantalla, se la asocia a una envolvente espectral con mas intensidad en los tonos agudos; es decir, a un ruido de impresin espectral ms brillante. En cambio, si el aparato volador baja, este movimiento se asocia a un espectro que aumenta de intensidad en la zona de graves; o sea, a una impresin espectral ms oscura. Finalmente, todo cambio sonoro suele estar siempre asociado a un cambio visual, y viceversa. La base de esta vinculacin se debe, sin duda, a la explotacin perceptiva de los principios de la estabilidad (vanse apartados 5.2.2 y 5.2.3). As, todo cambio sonoro de intensidad, tono, espectro, presencia-ausencia, etc., acostumbra a estar vinculado con cambios visuales como acercamientos, ascensos, descensos, cambios de color, cambios de plano, etc.

30

7.5. El sonido como instrumento organizador de la narracin


El sonido cubre un papel esencial en la narrativa audiovisual como elemento de organizacin, unificando o separando estructuralmente secuencias visuales compuestas por mltiples movimientos y cambios del punto de vista. Este uso del sonido como instrumento organizador tiene, tambin, una relacin muy directa con la lgica perceptiva humana. Que el sentido de la audicin sea mucho ms estable en el tiempo que el de la vista es la razn perceptiva que explica el papel estructurador del sonido. Para explicar esto con detalle invitamos de nuevo al lector a utilizar su propio sistema perceptivo. Mientras lee estas lneas, tendr sus ojos fijos en la hoja del papel en el que estn impresas y, a la vez, estar oyendo un determinado paisaje sonoro ms o menos estable. Ahora, el lector debera levantar la vista y apartarla de esta hoja para mirar a su alrededor, fijando la atencin sucesivamente en cuatro cosas distintas: 1) en la portada de este libro, 2) en el paisaje visual que lo rodea, 3) en cualquier objeto cercano que no sea el libro, y 4) en el objeto ms alejado que haya frente a usted. Al desarrollar este pequeo experimento, observar cmo, a pesar de los grandes cambios visuales que percibe, la informacin sonora que le proporciona su sentido del odo se mantiene prcticamente sin variaciones. O sea, mientras que visualmente usted ha experimentando unos cambios perceptivos muy importantes, el odo le ha mantenido informado de que, en realidad, en su contexto inmediato todo segua igual. El resultado global es la sensacin de que sigue en el mismo espacio y que ha sido simplemente su voluntad de fijar la vista en un lugar o en otro lo que le ha comunicado sensaciones visuales distintas. Supongamos ahora que escucha un zumbido a lo lejos, se vuelve a mirar hacia la direccin de la que proviene, y al mirar hacia una ventana que hay al fondo de un pasillo se da usted cuenta de que un moscardn negro y grande est intentando salir al exterior golpendose una y otra vez contra el cristal. Tras mirarlo unos minutos desde lejos, decide ir a abrir la ventana para que salga, as que se levanta, recorre el pasillo y llega donde est el moscardn. En este momento, efectivamente, ha cambiado su visin del insecto, pero tambin ha cambiado radicalmente el paisaje sonoro que escuchaba al principio. Los sonidos que percibe junto a la ventana son completamente diferentes de los que escuchaba mirando el moscardn de lejos: ahora lo oye mucho ms fuerte, en el zumbido percibe la pulsacin del aleteo y nota claramente el ataque blando y el timbre mate de los golpes contra el vidrio. En suma, nuestra sensacin visual cambia constantemente, percibimos puntos de vista cercanos, lejanos, quietos y en movimiento, de objetos completamente distintos, continuamente, uno tras otro; obedeciendo, simplemente, a nuestra voluntad de observacin. En cambio, el sentido de la audicin acta de manera mucho ms estable, hacindonos percibir cambios sonoros importantes solamente cuando estos cambios se producen, tambin, fsicamente en nuestro entorno. Por ms atencin que prestemos a algo, nuestra percepcin auditiva se mantiene prcticamente idntica, y los giros de cabeza para poder escuchar mejor una fuente concreta no nos dan ms que una sutil sensacin de mejora en la percepcin de la direccionalidad del sonido. Esta misma lgica es la que aplican hoy los narradores audiovisuales para el uso del sonido. Actualmente, la cmara es tan libre y gil como la mirada misma. Entonces, el narrador, para contrarrestar la gran fragmentacin perceptiva que emana de las secuencias con imgenes continuamente cambiantes, recurre al sonido y lo usa de acuerdo con su propia lgica perceptiva. Es decir, unificando con la informacin sonora todo aquello que considera como un espacio comn y un tiempo continuo. Para conseguir esto, el diseador del sonido construye un solo espacio sonoro que englobe todos los puntos de vista de la secuencia y que desencadene la sensacin de un nico tiempo lineal coherente. O lo que es lo mismo, construye varios espacios sonoros, agrupando ese mismo material visual en varias unidades menores, que producirn, tambin, la sensacin de varios tiempos diferenciados De hecho, el sonido suele utilizarse para organizar la narracin audiovisual de tres formas concretas:
1. Haciendo que el sonido correspondiente a un plano determinado se alargue en el tiempo ms all del momento en que aparece el plano siguiente (efecto de encabalgamiento u -overlapping)- El resultado es una ligera sensacin formal de unin entre los planos, a pesar de que las imgenes sean completamente distintas.

31

2. Utilizando una msica de modo que sta se extienda deforma homognea y sin rupturas formales bruscas, a lo largo de distintos planos con contenidos visuales distintos. El resultado cohesiona perceptivamente esos planos, produciendo un efecto narrativo de accin o situacin unitaria. 3. Manteniendo estable el punto de audicin, a lo largo de toda una serie de planos visuales con puntos de vista muy diferentes. Este tercer recurso produce el efecto perceptivo de insertar la citada serie de planos en un mismo espacio sonoro y en un tiempo continuo.

El efecto unificador del segundo recurso (utilizacin de una msica) es bastante ms fuerte que el primero, y suele utilizarse para reforzar el efecto de relacin entre dos planos visuales, cuando entre ellos hay un salto evidente en el tiempo. Ilustraremos esto con un experimento muy revelador preparado tambin por el compositor Jos Nieto. Una misma narracin audiovisual compleja fue tratada acsticamente de dos formas distintas para comprobar cmo actuaba la msica sobre ella: en primer lugar solamente con el sonido ambiente; luego, se le aadi una meloda que se extenda por toda la secuencia. El contenido de la secuencia era el que sigue. Aparece primero una persona en un exterior que apunta a alguien con una pistola. La siguiente imagen es ya en el interior de una habitacin, contemplamos cmo se abre una puerta y comienza a entrar un hombre, mientras, se oyen los gemidos y jadeos de una pareja haciendo el amor. En el rostro del hombre que entra vemos claramente un cambio de actitud que expresa su sorpresa. En contraplano se muestra frontalmente a una pareja acaricindose en una ducha. Nueva imagen del que entraba que cierra lentamente la puerta, lo vemos ahora desde fuera, acaba de cerrar, se gira y se lleva las manos a la cara en actitud de angustia. La imagen que sigue es ya, de nuevo, el espacio inicial, el exterior con un hombre apuntando a alguien con su pistola. En contraplano aparece, ahora, el amenazado; es otro hombre, y lo identificamos como la misma persona que haca el amor con una mujer en la ducha. Quien tiene la pistola, se parece tambin al engaado de la puerta, pero ahora lleva barba y no es claramente reconocible. Para los receptores que se sometieron al experimento la diferencia entre las dos versiones enseguida fue evidente. En la versin sin msica era difcil decidir si las dos situaciones visuales tenan o no una relacin directa. En cambio, cuando se contemplaba la secuencia con el teln de fondo musical no haba ninguna duda sobre la interpretacin. Resultaba evidente que quien tena la pistola en la mano era el hombre engaado, ya visiblemente envejecido, que consegua, por fin, vengarse del amante de su mujer. El efecto cohesionador de la msica resultaba, entonces, absolutamente evidente. El fondo sonoro homogneo de la msica une todo el material visual haciendo que sea interpretado sin problemas como un flash-back. El marido engaado, mientras apunta al amante de su mujer, recuerda cundo descubri el adulterio. El tercer recurso (.mantenimiento de un punto de audicin estable) es, sin duda, el que tiene mayor poder de unificacin en el tiempo y el espacio. Sera, por ejemplo, el caso de una serie de planos visuales mostrando a una pareja de enamorados en un parque que, por fin, se han reunido tras muchos meses de separacin. Las imgenes alternan tres puntos de vista: a) primeros planos de las dos caras una muy cerca de la otra; b) planos de un travelling circular; y c) planos muy generales en los que se ve a la pareja a lo lejos en el contexto del parque. El constante cambio visual queda contrastado con una banda de audio homognea en la que se oye la conversacin de la pareja tratada todo el tiempo con un primer plano sonoro, y un fondo de pjaros y rumor de hojas. La homogeneidad de ese sonido produce un claro efecto unificador. Este tipo de banda sonora hace que la sucesin alternada de los tres puntos de vista sea interpretada como un nico paquete narrativo que muestra siempre a la pareja como objeto central de atencin. Imaginemos, ahora, que cada vez que aparece el punto de vista c) (planos mostrando la pareja alejada en el contexto del parque) ya no omos a la pareja y los pjaros, sino que el fondo sonoro cambia bruscamente, y en vez de orse las voces, los pjaros y el rumor de hojas, lo que se escucha, ahora, es una fuerte respiracin junto a un fondo de chicharras y croar de ranas. Automticamente deduciremos que alguien est observando a nuestra pareja de enamorados desde otro lugar del parque. As, a partir del sonido, el mismo material visual, presentado exactamente en el mismo orden, queda agrupado de otra manera; y cada vez que aparece el punto de vista c) con los nuevos sonidos, tenemos la sensacin de estar junto a alguien que observa desde lejos a la pareja. Es decir, quedan organizados dos paquetes narrativos perfectamente diferenciados: el que nos muestra a la pareja (pla32

nos desde el punto de vista a) y b)), y el que nos muestra la mirada de un observador (planos desde el punto de vista c)). Lgicamente, del mismo modo que el sonido acta como instrumento unificador puede utilizarse, tambin, como instrumento separador.

33

7.6. Sobre el papel del habla en el lenguaje audiovisual


Hasta aqu hemos estudiado la expresin acstica desde una perspectiva sgnica bsicamente indexativa. Es decir, contemplando un uso de las formas sonoras como ndices realistas del universo referencial. No obstante, no podemos olvidar que en cualquier narracin audiovisual el contenido semntico del discurso lingstico es uno de los instrumentos expresivos fundamentales. En realidad, las estructuras lingsticas estn presentes constantemente en el universo audiovisual, tanto en su forma sonora como en su forma escrita Cul es, entonces, el papel de los contenidos semnticos del habla en el lenguaje audiovisual? O dicho de otro modo: cmo se estructura y se articula la informacin semntica que emana de la lengua con las otras dimensiones de la expresin acstica? Cuando construimos una narracin audiovisual en la que se elaboran minuciosamente todas las formas de expresin acstica, el texto lingstico deja de ser imprescindible para su descodificacin, en tanto que la propia informacin sonora permite una descodificacin eficaz. Contrariamente, en las narraciones audiovisuales en las que el trabajo sobre las formas sonoras es pobre y poco cuidado, el papel del contenido semntico del habla pasa a ser algo fundamental para que pueda ser comprendida la significacin global del discurso. A menudo, contemplamos narraciones audiovisuales que han sido construidas acsticamente de modo muy elemental, con formas sonoras incompletas, o poco ajustadas a la informacin visual. Por ejemplo, con una definicin demasiado baja, con una resonancia sonora que no corresponde al espacio que presenta la imagen, o con una clara falta de correspondencia entre la intensidad del sonido que omos y la distancia a la que se sita la fuente sonora propuesta visualmente. En las narraciones que contienen este tipo de problemas, el contenido semntico del texto es fundamental para que la descodificacin del discurso audiovisual sea la correcta. El contenido semntico del texto acta, entonces, con la funcin de ancladero segn la propona R. Barthes en su histrico artculo sobre retrica de la imagen (vase Barthes, 1964, pgs. 40-51). Es decir, el contenido lingstico es el que proporciona al receptor la referencia de cmo ha de ser percibido todo aquello que estamos viendo y oyendo, con objeto de que la descodificacin no vaya a la deriva. Vemoslo ahora de otro modo. Cuando la informacin acstica que intentamos reconocer es pobre, la narracin audiovisual resulta ambigua y no atinamos a encontrar exactamente cul es el camino a tomar para interpretarla. Pensemos, por ejemplo, en la siguiente escena: contemplamos en la pantalla la imagen subjetiva de un paisaje nevado, abierto, vaco e inmenso que se mueve como si la pantalla estuviese caminando. Suenan unos pasos lentos y se oye ruido de viento (no suena nada ms). Evidentemente, la propuesta narrativa es que vemos por los ojos de alguien que anda solo por el desierto nevado. Pero en qu estado est el explorador? Tiene algn problema o sencillamente camina tranquilamente disfrutando del paisaje? Imaginemos, ahora, que suena ahora tambin una voz en primersimo primer plano que dice con una actitud agotada: -No hay nada... nada... Ya no puedo ms! A partir de ahora ya sabemos cmo interpretar los pasos lentos, y los aceptamos como correctos a pesar de que, en principio, no fuesen identificables como pasos de una persona agotada. La alternativa sera no utilizar un texto hablado, y en su lugar sustituir el anclaje semntico por un conjunto de formas sonoras mucho ms minucioso y preciso. Por ejemplo con la siguiente composicin: escuchamos pasos lentos con el crujir caracterstico de estar pisando la nieve, el sonido de arrastrar los pies pesadamente al moverlos para dar cada nuevo paso y, a la vez, una respiracin muy fatigada; los distintos ruidos de ese caminar extenuado estn perfectamente sincronizados con todos los movimientos del inmenso paisaje nevado. Si disponemos de este tipo de informacin sonora no ser necesario enunciar un texto lingstico que acte como ancladero semntico porque los sonidos utilizados nos informarn perfectamente del penoso estado del caminante. Ciertamente, a lo largo de esta obra hemos mostrado en repetidas ocasiones y desde distintas perspectivas cmo el sonido puede facilitar y conducir la interpretacin de los mensajes audiovisuales complejos. No obstante, tampoco debemos olvidar que el gran conductor de la expresin audiovisual es el habla; es decir, el discurso lingstico de la voz. El texto oral es capaz de estructurar tanto la visin como la audicin, y sus contenidos suelen ser los que determinan, en ultima instancia, cul es el tipo de descodificacin que van a hacer nuestros sentidos. Pero cual es la razn que da esa hegemona a los contenidos lingsticos dentro del lenguaje 34

audiovisual? y cul es el lmite de empobrecimiento sonoro que debemos tolerar en la expresin audiovisual, cuando narramos apoyndonos slo en los contenidos orales? A medida que evoluciona el proceso de aprendizaje de una persona, los lenguajes arbitrarios adquieren una prioridad extraordinaria sobre todos los dems niveles de reconocimiento sonoro. De hecho, los, seres humanos educados en culturas desarrolladas adquirimos los conocimientos fundamentales sobre la identificacin del entorno inmediato en los tres o cuatro primeros aos de nuestra vida. Luego, a partir del momento en que aprendemos a hablar, se nos inicia ya en un nueva etapa de formacin completamente distinta, que est vehiculada muy prioritariamente por las formas sonoras y escritas del habla, y que se alargar entre diez y veinte aos ms. A partir de entonces, todo lo que nos rodea ser ya siempre nombrado, explicado, interpretado, ordenado, estudiado, clasificado, aceptado, rechazado, narrado, almacenado... a travs del lenguaje arbitrario ms hegemnico e imperialista que existe: la lengua. Esta dursima programacin psicolgica har que el sistema auditivo humano anteponga los contenidos del discurso oral a cualquier otra cosa. As, cuando en la pantalla de un cine un agricultor dice a su esposa que la plaga de langosta est todava a 50 kilmetros de la granja, aunque en el plano siguiente se nos muestren miles de langostas devorando un campo de trigo, no ponemos en duda ni un momento la informacin verbal, y deducimos que para ver las langostas el narrador nos ha llevado a 50 kilmetros de la granja. Y cuando, en una pelcula, un caballero medieval explica a su rey que durante los ltimos seis meses ha conseguido reclutar los mejores cazadores de todo el reino para formar un gran ejrcito, los espectadores aceptamos inmediatamente que el reino existe y que debe ser muy grande, a pesar de que ese gran reino no se nos haya mostrado por ninguna parte. Desgraciadamente, este efecto prioritario del habla sobre el resto de los recursos de la expresin acstica produce, con frecuencia, un empobrecimiento sonoro de la narrativa audiovisual. Es cierto que el predominio del discurso lingstico determina en muchas ocasiones la comprensin ltima de nuestras propias percepciones. No obstante, todo narrador audiovisual debe tener muy presente que el aprendizaje de los lenguajes arbitrarios, y el funcionamiento de la lengua misma, se sustentan en un proceso fundamental de identificacin del entorno inmediato y de reconocimiento acstico de formas sonoras primarias. Y que el efecto de verosimilitud del lenguaje audiovisual depende, precisamente, de estas etapas bsicas del proceso de aprendizaje perceptivo. Efectivamente, el aprendizaje perceptivo y expresivo en torno a los sonidos, desemboca en sistemas de formas sonoras cuya mxima expresin es la lengua. Pero, en el contexto del lenguaje audiovisual, es fundamental no olvidar en ningn momento que el sistema de los mecanismos de escucha no est, en absoluto, limitado a los contenidos semnticos que emanan de la lengua, sino que acta siempre en toda su globalidad como un sistema multidimensional. 16 Y que la expresin oral misma es un complejo trenzado de mltiples niveles de expresin acstica. Sin duda, el ejemplo que muestra ms claramente la importancia que tienen los niveles primarios de expresin y reconocimiento acstico en el lenguaje audiovisual, es el desarrollo de la tecnologa que les da soporte. En la ltima dcada, las emisoras de TV han comenzado a enviar el sonido en estreo y con mayor ancho de banda, los televisores se promocionan comercialmente como equipos con sonido de alta fidelidad, las principales productoras cinematogrficas han decidido exigir a sus exhibidores un nivel de calidad homologado tanto en la reproduccin del sonido como en la acstica de las salas de proyeccin, y la empresa cinematogrfica IMAX recurre a un sistema digital de seis canales de audio para distribuir el sonido por la pantalla con ms realismo. Si tenemos en cuenta que para el reconocimiento completo de los contenidos del habla basta simplemente con una calidad sonora como la del telfono, parece evidente que los grandes narradores industriales piensan, como nosotros, que la capacidad expresiva del lenguaje audiovisual depende extraordinariamente de la expresin acstica en su sentido ms global.

35

Referencias:
1. Tcnica cinematogrfica de audio que distribuye sonido desde altavoces situados en las paredes laterales y posterior de la sala del cine. 2. Vase el apartado 5.2.4. 3. No nos referimos aqu al doblaje como instrumento de traduccin lingstica sino a la sonoriza cin que se realiza despus de la produccin de las imgenes, y que se desarrolla en funcin de stas para montar de forma definitiva la voz de los actores en la versin original de la pelcula. 4. Efecto de repeticin de los sonidos controlando a voluntad el tiempo de separacin entre ellos. 5. Actualmente es posible controlar artificialmente el efecto de direccionalidad de los sonidos con mucha precisin mediante los sistemas de grabacin y reproduccin estereofnicos, cuadrafnicos, etc. 6. Vase el apartado 3.3.3. 7. Por ejemplo: gritando ms o menos, o golpeando ms o menos fuerte una campana. 8. Al margen de las diferencias de sensibilidad acstica que puedan existir entre el odo y cada micrfono concreto, el concepto de punto de audicin es vlido tanto para la ubicacin de un oyente como para la situacin de un micro, en tanto que la fenomenologa acstica que se desencadena en ambos casos es la misma. (Vase apartado 7.3-9) 9. Tcnica que utiliza dos sistemas paralelos y simultneos de grabacin, tratamiento y reproduccin del sonido, orientados a izquierda y derecha. El sistema permite simular con mucha eficacia el procesamiento de captacin bi-aural del odo humano. 10. El ngulo y la distancia que configuran el sistema de micrfonos estreo varan en funcin de las caractersticas tcnicas que tienen los micros que componen cada par. 11. Botn que controla la relacin de intensidad entre los dos altavoces en un sistema esterofnico. Al girar el botn en el sentido de las agujas del reloj disminuye la intensidad de la seal que reproduce el altavoz izquierdo y aumenta en la misma proporcin la del altavoz derecho. Si el botn se gira en sentido contrario la variacin de intensidades se produce al revs. 12. Se denomina ecualizador a un sistema de filtros de paso de banda organizados en paralelo, de modo que dividen el espectro sonoro en un nmero determinado de bandas de frecuencia, y que permite tratar por separado la intensidad de cada una de esas bandas, normalmente en 12 dB. 13.La pelcula Alien, el octavo pasajero dirigida en 1979 por Ridley Scott utiliza este recurso con profusin para hacer ms impactantes las apariciones de su infernal aliengena. 14. Dirigida por FrancisF.Coppola en1979. 15. Jos Nieto, entre otras muchas, ha compuesto la msica de pelculas como El bosque animado, El maestro de esgrima, o La pasin turca y la de series documentales como Ciudades perdidas o ltimos refugios. 16.Vase apartado 6.3.1

36

CONCLUSIONES

El trabajo sobre esta obra nos ha llevado a establecer algunas conclusiones que nos parecen fundamentales y que sealaremos a continuacin: 1. Igual que el lenguaje musical se estudia como disciplina independiente del instrumento que se toca, el lenguaje audiovisual debe ser estudiado como una disciplina amplia que rebasa la tecnologa y que es independiente del medio de comunicacin con que se narra. 2. Existe una categora sgnica sonora especficamente audiovisual: el ente acstico. Un ente acstico es cualquier sonido separado de su fuente sonora, que acta narrativamente como si fuese un objeto fsico real. 3. Es necesario romper con la idea de que la intuicin es la herramienta exclusiva del narrador. En esta obra se demuestra la gran utilidad de aplicar los instrumentos de medicin acstica a la narrativa audiovisual. 4. Es necesario aplicar a la investigacin del lenguaje audiovisual la misma concepcin de la subjetividad que maneja la psicologa de la percepcin. La subjetividad no debe ser entendida como algo incontrolable y nico inherente a cada individuo, sino como aquellos fenmenos de sensacin y sentido que son objetivables y sistematizables, porque ocurren dentro de todo ser humano siguiendo el mismo proceso y con un resultado muy similar. 5. Para avanzar en el conocimiento sobre la expresin acstica es imprescindible establecer una terminologa unificada que nos permita nombrar los sonidos con la suficiente precisin. En esta obra se propone una taxonoma sobre las formas sonoras simples que pretende ser el primer paso hacia ella. 6. Los mecanismos sensoriales del ser humano tienden a la coherencia perceptiva. Es decir, nuestro sistema perceptivo nos informa y nos hace interpretar la realidad, dando prioridad a los estmulos coherentes que provienen de varios sentidos a la vez. 7. No es posible afirmar que el sentido de la vista sea superior al sentido de la audicin.

37

Das könnte Ihnen auch gefallen