Sie sind auf Seite 1von 328

Msica y espacio:

ciencia, tecnologa y esttica

UNIVERSIDAD NACIONAL DE QUILMES


Rector
Gustavo Eduardo Lugones
Vicerrector
Mario E. Lozano

Gustavo Basso
Oscar Pablo Di Liscia
Juan Pampin
(compiladores)

Msica y espacio: ciencia,


tecnologa y esttica
Joseph Anderson / Gustavo Basso / Pablo Cetta /
Mariano Cura / Oscar Pablo Di Lisia / Robert Dow /
Pablo Fessel / Gary S. Kendall / Martn Liut /
Dave Malham / Juan Pampin

Bernal, 2009

Coleccin Msica y Ciencia


Dirigida por Oscar Pablo Di Liscia

Basso, Gustavo
P
isbn 987-5581. P
CDD

Gustavo Basso. 2009


Universidad Nacional de Quilmes. 2009
Roque Senz Pea 352
(B1876BXD) Bernal
Buenos Aires
http://www.unq.edu.ar
editorial@unq.ed.ar

ISBN: 987-558ISBN-13: 978-987-558Queda hecho el depsito que marca la ley 11.723

Esta edicin de 1.000 ejemplares se termin de imprimir en

ndice

Presentacin. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
Los autores. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
Captulo i. Audicin espacial de sonido: conceptos bsicos y estado
actual de la cuestin
Gustavo Basso, Oscar Pablo Di Liscia . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
Representacin geomtrica del espacio. . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Indicios de ubicacin esp acial de sonido . . . . . . . . . . . . . . . . . . . . . . . . . . .
Indicios relativos a la localizacin angular. . . . . . . . . . . . . . . . . . . . .
Indicios relativos a la distancia. . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Directividad de la fuente acstica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Percepcin de la directividad de las fuentes acsticas. . . . . . . . . . . .
Una revisin de los indicios de localizacin y de los factores
que determinan su prominencia. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Confiabilidad de los indicios. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
El rol del conocimiento a priori de las caractersticas de la fuente. .
El contenido de frecuencia de la seal. . . . . . . . . . . . . . . . . . . . . . . .
Realismo de los indicios o plausibilidad. . . . . . . . . . . . . . . . . . . . . . .
El rol de los movimientos de la cabeza en la localizacin . . . . . . . . .
Efectividad de los indicios relacionados con la distancia. . . . . . . . . .
Otros indicios que afectan la audicin espacial. . . . . . . . . . . . . . . . . . . . . . .
Efecto Doppler. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Efecto Haas o efecto de precedencia. . . . . . . . . . . . . . . . . . . . . . . . . .
Bibliografa. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

24
25
25
33
40
51
52
53
54
54
55
56
56
57
57
59
59

Captulo ii. Percepcin espacial del ambiente acstico


Gustavo Basso. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
Percepcin auditiva del ambiente . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Efecto de precedencia. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Perspectiva auditiva. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Acstica de salas. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Desarrollo histrico hasta el siglo xix. . . . . . . . . . . . . . . . . . . . . . . . .
Trabajos de Wallace Sabine. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Proliferacin de parmetros acsticos temporales . . . . . . . . . . . . . . .
Aparicin de los criterios espaciales. . . . . . . . . . . . . . . . . . . . . . . . . .
Respuestas espaciales desde la arquitectura. . . . . . . . . . . . . . . . . . .
Dos ejemplos clebres. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Apndice: descripcin de los parmetros citados. . . . . . . . . . . . . . . . . . . . .
Tiempo de reverberacin (tr) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Reverberacin temprana (edt, Early Decay Time). . . . . . . . . . . . . . .
Retardo de la reflexin principal (itdg2). . . . . . . . . . . . . . . . . . . . . .
Respuesta al impulso. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Funcin de autocorrelacin (()). . . . . . . . . . . . . . . . . . . . . . . . . . .
Amplitud equivalente de las reflexiones (a) . . . . . . . . . . . . . . . . . . .
Fraccin lateral de energa (le) . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Coeficiente de correlacin cruzada interaural (iacc). . . . . . . . . . . . .
Funcin de crecimiento de la energa. . . . . . . . . . . . . . . . . . . . . . . . .
Definicin (Thiele, 1953). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Claridad a 80 ms y a 50 ms (Reichardt, 1974). . . . . . . . . . . . . . . . . .
Relacin seal /ruido (Lochner y Burger, 1961) . . . . . . . . . . . . . . . .
Centro de tiempo (Dietsch y Kraak, 1986) . . . . . . . . . . . . . . . . . . . .
Bibliografa. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

61
62
63
65
65
67
72
74
81
88
92
92
92
92
92
93
93
94
94
94
94
95
95
95
96

Captulo iii. Tcnicas de localizacin espacial de sonido


con altoparlantes usando indicios de intensidad y tiempo
Oscar Pablo Di Liscia. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99
Introduccin. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99
Tcnicas de espacializacin basadas en indicios de intensidad. . . . . . . . . . 100
Simulacin de la ubicacin angular en dos dimensiones . . . . . . . . 100
por medio del panormico de intensidad. . . . . . . . . . . . . . . . . . . . . 100
Simulacin de la distancia mediante indicios de intensidad. . . . . . 103

Simulacin de la ubicacin angular en tres dimensiones


por medio del panormico de intensidad . . . . . . . . . . . . . . . . . .
Simulacin de la directividad de la fuente acstica
mediante indicios de intensidad. . . . . . . . . . . . . . . . . . . . . . . . .
Tcnicas de espacializacin basadas en indicios de tiempo. . . . . . . . . . . . .
Simulacin de las caractersticas de recintos mediante indicios
de intensidad y tiempo. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Introduccin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Simulacin de ecos tempranos. . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Conclusiones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Bibliografa. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

106
110
115
117
117
118
124
124

Captulo iv. Transformadas clsicas de la imagen estreo. Un anlisis


Joseph Anderson. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 127
Introduccin. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Ley de panormico seno-coseno y el dominio ms . . . . . . . . . . . . . . . . . . . .
Ley de panormico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
El dominio ms. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Las transformadas estreo. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Rotacin-panormico estreo. . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Panormicos ms all de +/-45. Movindose ms all
de los altoparlantes. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Ancho. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Balance . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Panormico medio. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Asimetra. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Panormico izquierdo y derecho. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
R-pan. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
L-pan. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Direccin-abilidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Transformadas dependientes de la frecuencia. . . . . . . . . . . . . . . . . . . . . . .
Ecualizacin espacial. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Dispersin estreo. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Otras transformadas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
conclusiones. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Bibliografa. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

127
129
129
130
132
132
134
137
140
142
145
147
147
148
150
152
153
154
155
157
158

Captulo v. El espacio acstico tridimensional y su simulacin


por medio de Ambisonics
Dave Malham. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 161
Consideraciones fisiolgicas. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Mecanismos de percepcin de la direccin . . . . . . . . . . . . . . . . . . .
Mecanismos de percepcin de la distancia. . . . . . . . . . . . . . . . . . . .
Cuestiones perceptivas. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Ambisonics, sistemas de primer orden. . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Manipulaciones del campo sonoro. . . . . . . . . . . . . . . . . . . . . . . . . .
Ambisonics y la compatibilidad estreo. . . . . . . . . . . . . . . . . . . . . .
Bounce-back. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Criterios para una decodificacin ptima. . . . . . . . . . . . . . . . . . . . .
El efecto de la acstica del espacio de ejecucin. . . . . . . . . . . . . . .
Sistemas Ambisonics de orden ms alto . . . . . . . . . . . . . . . . . . . . . . . . . . .
Armnicos esfricos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Matrices de rotacin. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Dominancia. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Sistemas de orden ms alto. desarrollos recientes. . . . . . . . . . . . . . . . . . . .
Bibliografa. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

161
161
162
165
169
173
178
182
185
187
190
190
195
197
197
199

Captulo vi. Sistemas de sonido multicanal para la industria audiovisual


Mariano Martn Cura. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 203
Introduccin. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Estandarizaciones de sonido surround. . . . . . . . . . . . . . . . . . . . . . . . .
Especificaciones de canales. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Sistemas propietarios. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Canal de efectos de baja frecuencia . . . . . . . . . . . . . . . . . . . . . . . . .
Sistema de administracin de bajas frecuencias. . . . . . . . . . . . . . . .
Sistemas multicanal matriciales . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Codificacin perceptual . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Estreo de tres canales (3-0 stereo) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Sonido cuadrafnico. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Surround de cuatro canales (3-1 stereo). . . . . . . . . . . . . . . . . . . . . . .
Dolby stereo optical. Dolby surround pro logic. . . . . . . . . . . . . . . . . . . . . .
Surround de 5.1 canales (3-2 stereo). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
El canal de efectos de baja frecuencia y el uso de subwoofers. . . . . .
Descripciones y asignacin de pistas. . . . . . . . . . . . . . . . . . . . . . . . .

203
203
204
204
204
204
205
205
205
206
206
208
210
211
212

Dolby Digital, Dolby Pro Logic ii. . . . . . . . . . . . . . . . . . . . . . . . . . .


dts. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Surround de 6 canales. Dolby stereo 70 mm. . . . . . . . . . . . . . . . . . . . . . . .
Surround de 6.1 canales. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Dolby Digital Surround EX. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
CI CD. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Dolby Pro Logic IIx. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
dts-es. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Surround de 7.1 canales. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
CI CD. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Sony sdds . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Dolby Digital Plus. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Dolby Digital True hd. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
dts-hd. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Surround de 10.2 canales. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Surround de 22.2 canales. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
thx . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
mpeg . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
mlp . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
dvd-audio. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Super audio cd . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Otros formatos multicanal. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Bibliografa. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

212
214
214
215
215
215
216
216
217
217
218
219
219
220
220
221
222
222
223
223
225
225
226

Captulo vii. El sonido multicanal en la composicin acusmtica


Robert J. Dow. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 227
Presentacin. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Prembulo. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Ejecucin. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Formatos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Estereofona con dos altoparlantes. . . . . . . . . . . . . . . . . . . . . . . . . .
Estreo 3-2 (5.1 canales envolventes) . . . . . . . . . . . . . . . . . . . . . . .
Octofona. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Ambisonics . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Sntesis de campo de onda (wfs). . . . . . . . . . . . . . . . . . . . . . . . . . .
Conclusiones. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Agradecimientos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Bibliografa. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

227
227
229
230
231
232
234
236
237
238
239
239

Captulo viii. La interpretacin de la espacializacin electroacstica:


atributos espaciales y esquemas auditivos
Gary S. Kendall. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 241
Atributos espaciales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
El contexto de la msica electroacstica . . . . . . . . . . . . . . . . . . . . .
Atributos espaciales y anlisis de la escena auditiva . . . . . . . . . . . .
Esquemas auditivos espaciales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Esquemas auditivos espaciales. . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Anlisis de la escena en funcin de los esquemas auditivos
espaciales segn Rumsey. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
El juego artstico con la organizacin espacial. . . . . . . . . . . . . . . . . . . . . . .
Juego con el agrupamiento perceptivo. . . . . . . . . . . . . . . . . . . . . . .
Atributos inmersivos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Juego con los esquemas auditivos espaciales. . . . . . . . . . . . . . . . . . .
Conclusin. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Agradecimientos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Bibliografia. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

242
242
243
247
247
248
249
249
253
255
257
257
258

Captulo ix. Descentramiento y concrecin del espacio en la msica


del siglo xx
Pablo Fessel. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 261
Introduccin. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
El espacio inmanente. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
La crisis en el sistema de categoras estilsticas . . . . . . . . . . . . . . . . . . . . . .
La textura. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Emancipacin de la textura. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Hacia una esttica de la heterogeneidad y de la concrecin. . . . . . . . . . . .
Bibliografa. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

261
261
263
264
265
267
269

Captulo x. Integracin de la msica al espacio virtual


Pablo Cetta. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 271
Bibliografa. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 286

Captulo xi. Msica para sitios especficos: nuevas correlaciones


entre espacio acstico, pblico y fuentes sonoras
Martn Liut. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 287
Sonidos especficos y arquitectura aural. . . . . . . . . . . . . . . . . . . . . . . . . . . .
Pblico y fuentes sonoras. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
En movimiento. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Zonas de audicin. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Conclusiones. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Bibliografa. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

288
290
292
293
297
299

Captulo xii. Espacio y materia, de lo auditivo a lo corporal.


Apuntes sobre la composicin de uom y Entanglement
Juan Pampin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 301
Introduccin. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
uom. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Especificidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Dispositivo. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Espacio y materia. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Transformacin. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Reflexiones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Entanglement. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Lugar . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Flujo. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Perturbacin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Teleausencia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Conclusiones. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Bibliografa. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

301
302
303
304
306
310
312
313
314
315
316
320
320
322

Presentacin

Este libro explora los aspectos ms relevantes del estado actual del arte en el
estudio de las relaciones entre espacio, sonido y msica. Dada la extensin del
tema y sus numerosas ramificaciones en reas diversas (tales como acstica,
psicoacstica, percepcin sonora, tecnologa de audio, arte sonoro y msica,
por mencionar solo algunas), resulta necesario abordarlo desde una pluralidad
de perspectivas que asegure una cobertura amplia y sistemtica. Para lograr
este objetivo, el libro organiza sus captulos en tres secciones principales: la
primera examina los aspectos bsicos de la audicin espacial, la segunda sondea las tcnicas y tecnologas comprometidas en la simulacin e implementacin del sonido espacial, y la ltima plantea la problemtica de la espacialidad
en la produccin musical y sonora, tanto desde el punto de vista del anlisis
como desde la composicin musical.
Los dos primeros captulos desarrollan las nociones bsicas necesarias
para comprender la percepcin espacial del sonido. En el primero, a partir
de las seales que se originan directamente en las fuentes acsticas (Basso y
Di Liscia) y en el segundo, desde el ambiente acstico que rodea al oyente
(Basso). Este ltimo, adems, introduce los principios fundamentales de la
acstica arquitectnica desde una doble perspectiva, histrica y tcnica. Estos
dos captulos son de lectura insoslayable para el lector que no est familiarizado con la audicin espacial de sonido y constituyen la base sobre la que se
desarrollaron muchas de las tcnicas de espacializacin que se tratan en el
resto del libro.
Siguen luego cuatro captulos dedicados a las tcnicas de espacializacin
corrientemente utilizadas en la msica por computadoras y en la industria
del audio. El captulo iii (Di Liscia) analiza las tcnicas de simulacin de
localizacin de sonido usando indicios de intensidad y tiempo. El captulo iv
(Anderson) realiza una profunda exploracin de los aspectos tcnicos y de las
aplicaciones prcticas de las transformadas de la imagen estreo en la ingeniera de audio. El captulo v (Malham) desarrolla extensamente la tcnica de
espacializacin Ambisonics en sus aspectos bsicos y en sus actuales extensio15

nes. Malham tambin estudia en este captulo algunos aspectos de audicin


espacial, y discute los lmites y la naturaleza de lo que debe considerarse una
imitacin de la realidad sonora espacial. El captulo vi (Cura) realiza una
resea histrica y un anlisis tcnico de las implementaciones para sonido
surround (envolvente) en la industria de audiovisual (principalmente en
el cine) y en su uso hogareo. El captulo vii (Dow) desarrolla la transicin
desde la visin tcnica/tecnolgica hacia la implementacin concreta de la
espacializacin en la msica electroacstica, centrndose en la problemtica
esttica y prctica que surge en la difusin de la obra electroacstica.
Los siguientes dos captulos presentan propuestas que se orientan hacia el
anlisis esttico y tcnico-musical de la espacialidad en la msica. El captulo
viii (Kendall) propone un marco conceptual para el anlisis de la espacialidad
en la msica electroacstica desde la perspectiva de la psicologa cognitiva.
Concretamente, este enfoque est basado en los conceptos de atributos espaciales y de esquemas auditivos. El captulo ix (Fessel) aborda la espacialidad
del sonido desde el ngulo de la msica instrumental del siglo xx. Es la nocin
de textura, que segn Fessel comienza a desarrollarse de manera significativa
en la msica del siglo xx, la que provee las tendencias bsicas (descentramiento y concrecin) a partir de las que es posible pensar en un espacio musical
segmentado, mltiple y particular.
Finalmente, los tres ltimos captulos tratan diferentes casos de puesta
en obra de la espacialidad de la msica y el sonido, de manera general uno de
ellos, y de forma especfica los otros dos. En el captulo xi, Liut enfoca la espacialidad en la produccin sonora desde la perspectiva de su correlacin con los
espacio-entornos. En dicho enfoque se tienen en cuenta tanto las cuestiones
fsicas como la carga semntica y la disposicin de los oyentes, que surgen de
o sugieren los diferentes entornos. En el captulo x, el autor considera algunas instancias generales pero, sobre todo, las especficas a su obra Interiores, a
partir de lo que denomina una integracin de la msica al espacio virtual.
Finalmente, en el captulo xii Pampin desarrolla los aspectos tecnolgicos y
estticos de la espacialidad en dos de sus obras (uom y Entanglement) y provee
una base conceptual para la vinculacin de estos aspectos con la carga referencial e histrica de los entornos de audicin.
La complejidad conceptual y tcnica de los artculos originales en ingls
requiri una revisin detallada de sus traducciones, tarea que estuvo a cargo
de Juan Pampin. Los compiladores, adems, desean agradecer muy especialmente al licenciado Emanuel Bonnier (aka Lord-of-the-graphic-vectors), cuya
pericia y dedicacin posibilit la confeccin de las imgenes que ilustran los
captulos i, ii y vi.
Vale la pena destacar que los autores que participan en este libro, adems
16

de ser especialistas en los aspectos cientfico-tecnolgicos del rea que los


ocupa, son msicos formados y activos. Esto ltimo asegura que, por tcnico
que sea el tratamiento de cada tema, siempre est enlazado con la produccin
y la performance musical-sonora. Resulta difcil sugerir un lector ideal pensando en disciplinas o reas de formacin tradicional, cristalizada y estanca.
Antes bien, una de las cualidades imprescindibles del lector que esperamos,
debera ser su disposicin a explorar uno de los aspectos ms concretos y, a la
vez, ms misteriosamente inasibles de la msica, el espacio, sin confinarlo a
una disciplina aislada.
Gustavo Basso
Oscar Pablo Di Liscia
Juan Pampin

17

Los autores

Joseph Anderson (Escuela Scarborough de Electroacstica, Artes y Nuevos


Medios, Universidad de Hull, Gran Bretaa). Obtuvo su Ph.D. en la
Universidad de Birmingham. Tiene una amplia formacin en las aplicaciones
creativas e industriales de las tecnologas de la msica. Ha trabajado como
ingeniero y consultor de mezcla surround, productor de radio y desarrollador
de algoritmos para procesos de seal digital. Sus campos especficos de investigacin incluyen el sonido surround Ambisonics, la imagen sonora en la msica
acusmtica y la composicin acusmtica. En 1997 obtuvo el Grand Prix en el
Concurso de Msica Electroacstica de Bourges por su obra Changes Music,
e instituciones tales como la bbc Radio 3 y la Sociedad para la Promocin
de Nueva Msica le han comisionado composiciones. Su ciclo Epiphanie
Sequence ha sido editado recientemente por Sargasso (SCD28056).
Gustavo Basso (Facultad de Bellas Artes, Universidad Nacional de La Plata,
Argentina). Ingeniero y msico, es profesor de acstica musical en las universidades de La Plata y Buenos Aires. Dirige proyectos de investigacin en
temticas relacionadas con la percepcin auditiva y la acstica musical, y se
dedica al diseo de espacios acsticos, en particular teatros y auditorios de
msica. Entre sus recientes y ms significativas producciones figuran los libros
Anlisis espectral: la transformada de Fourier en la msica (1999) y Percepcin
auditiva (2006). Actualmente trabaja en el diseo acstico de la Ciudad de la
Msica y del Centro Cultural Bicentenario, y participa en la restauracin del
Teatro Coln de Buenos Aires.
Pablo Cetta (Facultad de Artes y Ciencias Musicales, Universidad Catlica
Argentina. rea de Artes Multimediales, Instituto Universitario Nacional del
Arte, Argentina). Es compositor y docente-investigador, secretario acadmico
del rea de Artes Multimediales del Instituto Universitario Nacional del Arte.
Sus obras han recibido importantes distinciones nacionales e internacionales.
Asimismo, ha realizado numerosas publicaciones, investigaciones y desarro19

llos en aplicaciones informticas para msica y audio digital, esttica y teora


compositiva.
Mariano Cura (Universidad Nacional de Quilmes. rea de Artes
Multimediales del Instituto Universitario Nacional del Arte, Argentina).
Es compositor, pianista y docente-investigador. Se gradu como Licenciado
en Composicin con Medios Electroacsticos en la Universidad Nacional
de Quilmes. Actualmente dirige esa carrera, se desempea como docente en
dicha universidad y en el Instituto Universitario Nacional del Arte, y dirige
un proyecto de investigacin que forma parte del programa de investigacin
Teatro acstico de la unq. Entre otras actividades de produccin musical y
sonora se destaca su participacin en el grupo Buenos Aires Sonora.
Oscar Pablo Di Liscia (Universidad Nacional de Quilmes. rea de Artes
Multimediales del Instituto Universitario Nacional del Arte, Argentina). Es
compositor y docente-investigador especializado en msica por computadoras.
Actualmente dirige un proyecto de investigacin en espacializacin de sonido
(integrado al programa de investigacin Teatro acstico de la unq) y otro
en composicin musical (en el Instituto Universitario Nacional del Arte).
Es profesor titular en ambas instituciones y director de la coleccin Msica
y Ciencia de la Editorial de la unq. Ha publicado artculos sobre esttica
y tcnica de la msica y las nuevas tecnologas, y desarrollado software para
proceso de sonido y msica, anlisis musical y composicin.
Robert Dow (Escuela de Artes, Cultura y Medio Ambiente, Universidad de
Edimburgo, Gran Bretaa). Se gradu en Ciencias, Msica, Leyes y Estudios
Cinematogrficos en las universidades de Edimburgo y Birmingham. Vive
actualmente en Escocia. Es un compositor muy activo que presenta obras en
la mayora de los festivales de todo el mundo. Es investigador senior en la
Universidad de Edimburgo y se especializa en teora del sonido y en la composicin y performance de msica electroacstica.
Pablo Fessel (conicet; Universidad de Buenos Aires, Argentina). Es investigador del Consejo Nacional de Investigaciones Cientficas y Tcnicas en
el rea de musicologa histrica y director de un proyecto de investigacin
sobre msica contempornea argentina en la Facultad de Filosofa y Letras
de la Universidad de Buenos Aires. Ha publicado escritos sobre el concepto
de textura, y sobre la msica de Beethoven, Gandini, Ives y Ligeti en revistas
especializadas de la Argentina, Brasil y Mxico. Ha editado la compilacin
Nuevas poticas en la msica contempornea argentina. Escritos de compositores.
20

Gary S. Kendall (Escuela de Msica y Artes Sonoras, Centro de Investigacin


en Artes Sonoras, Queens University, Belfast, Irlanda del Norte). Obtuvo
su Ph.D. en la Universidad de Texas, Austin, en 1982. Luego fue profesor
asociado y jefe del programa en Tecnologa de la Msica en la Northwestern
University. Desde 2008 es profesor invitado en el Centro de Investigacin en
Artes Sonoras de la Queens University. Ha publicado numerosos artculos
sobre audio 3D y espacializacin de sonido, entre otros, en Computer Music
Journal, Organised Sound y la icmc. Sus investigaciones se han presentado en
la Electroacoustic Music Studies Conference, seamus, la Audio Engineering
Society y la Acoustical Society of America. Sus composiciones se han
difundido en seamus, el festival Spark y el Florida Electroacoustic Music
Festival.
Martn Liut (Universidad Nacional de Quilmes. Universidad de Buenos
Aires, Argentina). Compositor y docente-investigador. Es director del proyecto Espacio y forma musical, que integra el programa Teatro acstico (dirigido por Oscar Edelstein), con sede en la unq. Integra el proyecto Textura y
forma en la msica contempornea argentina (1972-2006), que dirige Pablo
Fessel en la uba. Es autor de obras de cmara electroacsticas puras y mixtas,
como as tambin de obras de arte radiofnico. Es fundador y director de
Buenos Aires Sonora, grupo que, desde 2003, realiza intervenciones sonoras
a gran escala en espacios pblicos urbanos.
Dave Malham (Centro de Investigacin en Msica, Universidad de York,
Gran Bretaa). Es ingeniero de audio y miembro del comit directivo del
Grupo de Tecnologa Musical de la Universidad de York. Malham es uno
de los ms prestigiosos y activos especialistas actuales en el sistema surround
Ambisonics. Es autor de numerosas publicaciones y desarrollos que incluyen
la ingeniera de audio (diseo de hardware), programacin de audio, grabacin
de audio y los sistemas de proyeccin de sonido surround.
Juan Pampin (Centro de Artes Digitales y Medios Experimentales, Universidad
de Washington, Seattle, Estados Unidos). Es compositor y artista sonoro.
Vive y trabaja en Seattle, donde es profesor de composicin en el Centro
de Artes Digitales y Medios Experimentales (dxarts) de la Universidad de
Washington, del que es miembro fundador. En dicho centro realiza, adems,
investigacin en anlisis espectral y espacializacin de sonido. Sus composiciones han sido programadas en importantes festivales de Amrica, Europa y
Asia, y grabadas por destacados ensambles y solistas internacionales.

21

Captulo i
Audicin espacial de sonido: conceptos bsicos
y estado actual de la cuestin
Gustavo Basso
Oscar Pablo Di Liscia

Utilizamos la informacin espacial del sonido constantemente en nuestra vida


cotidiana. Basta cerrar nuestros ojos y analizar, aunque ms no sea intuitivamente, la escena auditiva que nos rodea, para tomar conciencia de la cantidad
y relevancia de la informacin espacial que se nos presenta. Por otra parte,
las aplicaciones de la investigacin en audicin espacial son numerosas y muy
relevantes. Una lista no exhaustiva pone en evidencia su importancia: diseo
de dispositivos de difusin, tcnicas de procesamiento de seales de audio con
la finalidad de simular cualidades espaciales, diseo de recintos de audicin,
uso de sistemas de difusin y la segregacin-fusin e inteligibilidad de flujos
sonoros. Muchas de estas aplicaciones, as como las tcnicas y tecnologas
que comprometen, sern objeto de un estudio detallado en los captulos
subsiguientes de este libro. Sin embargo, para su comprensin acabada, es
imprescindible el conocimiento de la manera particular en que nuestro sistema auditivo procesa la informacin espacial, tema que se desarrollar en el
presente captulo.
Al analizar la espacialidad del sonido, nuestro sistema auditivo considera
informacin que se puede clasificar en tres grupos: 1) informacin relacionada
con el mbito o entorno fsico en el que se encuentra una fuente acstica; 2)
informacin relacionada con la localizacin y/o el movimiento de una fuente
acstica respecto del mbito o entorno fsico en el que se encuentra o respecto
de la cabeza del oyente; 3) informacin relacionada con la directividad de la
fuente acstica.
Asimismo, esta informacin es combinada con la que proviene de otros
sentidos (principalmente la vista), y de nuestro conocimiento previo del comportamiento de la fuente acstica. Nuestra percepcin de la espacialidad del
sonido es, entonces, holstica.
En lo que sigue, se tratarn las particularidades de la audicin espacial
que se relacionan con la ubicacin-movimiento y con la directividad de las
fuentes acsticas (puntos 2 y 3), dado que aquellas que se relacionan con el
23

mbito o recinto se tratan extensamente en el captulo ii. Sin embargo, dado


que todas las particularidades de la audicin espacial son interdependientes y
que es prcticamente imposible tratar a una de ellas de manera completamente aislada de las otras, se realizan algunas menciones a la audicin de recintos
cuando resulta imprescindible.

Representacin geomtrica del espacio


En este captulo, el espacio tridimensional se representar mediante una esfera
cuyo radio es la unidad (esfera-unidad) e integrado por tres planos, siendo cada
uno de ellos diferentes secciones de dicha esfera. Los tres planos mencionados
se denominan: frontal, horizontal y medio.
Para referirse a cualquier punto de esta esfera terica, pueden usarse tanto
coordenadas esfricas como cartesianas. Si usamos coordenadas cartesianas,
tres valores son necesarios para definir un punto determinado: x (izquierdaderecha), y (frente-atrs) y z (arriba-abajo). Cuando usamos coordenadas esfricas, dos ngulos (azimut y elevacin) y un escalar de magnitud (distancia)
son necesarios (vase la figura 1).
La localizacin angular (direccin) de una fuente acstica puede pensarse
como si esta fuente se ubicara en un punto determinado de la superficie de la
esfera terica cuyo centro es la cabeza del oyente. La distancia puede pensarse
en analoga con el tamao de la esfera imaginaria antes mencionada, determinado por su radio.

Plano
medio

Plano
frontal
Atrs

Plano
horizontal

Figura 1. Los tres planos esfricos

24

Adelante

Indicios de ubicacin espacial de sonido


Se usar la denominacin indicios de ubicacin espacial para hacer referencia a
aquellos rasgos o caractersticas del sonido que son considerados por nuestro
sistema auditivo como portadores de informacin relevante en lo que hace
a la localizacin de una fuente acstica. Los indicios que utiliza el sistema
auditivo en la audicin espacial de sonido son bien conocidos desde hace
tiempo y han sido tratados extensamente en ms de un trabajo.1 Por otro lado,
parece estar bastante bien determinado que el sistema auditivo evala estos
indicios y, si alguno de ellos presenta resultados inconsistentes o poco fiables,
no lo toma en cuenta, o le asigna menor importancia como determinante de
localizacin.
Se puede clasificar a los indicios de ubicacin o localizacin espacial
en: a) indicios relativos a la direccin desde la que llega la seal de la fuente
(localizacin angular); b) indicios relativos a la distancia entre la fuente y el
oyente.
Indicios relativos a la localizacin angular
Previamente a su tratamiento debe aclararse que, en general, se producen dos
fenmenos respecto de la direccin percibida de la fuente. El primero de ellos
se denomina lateralizacin y designa la sensacin de ubicacin de la fuente
respecto de la cabeza del oyente. Esto se produce en la situacin tpica de audicin con auriculares en la que, cuando el oyente mueve la cabeza, la imagen
sonora queda pegada a esta. El otro fenmeno se denomina localizacin.
En este, el oyente percibe la direccin de la fuente respecto de un espacio
externo a su cabeza, y los eventuales movimientos de esta son independientes
de la ubicacin de la fuente.
Los indicios relativos a la localizacin angular que se tratarn son los
siguientes: itd (Interaural Time Difference, diferencia interaural de tiempo);
iid (Interaural Intensity Difference, diferencia interaural de intensidad); e indicios espectrales hrtf (Head Related Transfer Functions, funciones de transferencia relativas a la cabeza).
itd

(diferencia interaural de tiempo)

La diferencia interaural de tiempo (itd) consiste en la diferencia en el tiempo


de arribo de la seal a los dos odos y orienta al oyente en la ubicacin de la
1

A modo de ejemplo clebre, vase Blauert (1983).

25

fuente acstica en el ngulo horizontal. Vara entre 0 y 690 s para seales


cuyos ngulos de azimut corresponden a 0 y 90, respectivamente. Como
una onda acstica que se propaga en el aire tarda aproximadamente 30 s en
recorrer 1 cm, para ir de un odo al otro necesita aproximadamente 690 s.2
Si las seales son estrictamente sinusoidales, una diferencia de tiempo
equivale a una diferencia de fase. A bajas frecuencias la informacin contenida en la diferencia de fase es significativa, pero a altas frecuencias la longitud
de onda es menor que la distancia entre odos y la diferencia de fase provee
datos ambiguos. A una longitud de onda de 23 cm, similar a la distancia
promedio entre odos, le corresponde una frecuencia de 1.500 Hz. Si la seal
posee 10 kHz entran varios ciclos completos en esa distancia y la fase deja de
aportar informacin espacial unvoca. En la figura 2 se pueden apreciar estas
dos situaciones.

a)

Baja frecuencia
F1

b)

F1

F2

Alta frecuencia

Figura 2. Prdida de efectividad de la itd a alta frecuencia por confusin de fase. El


mecanismo no puede distinguir entre la localizacin de las fuentes F1 y F2 si emiten a alta
frecuencia
2

Se considera aqu una cabeza de tamao promedio (aproximadamente 23 cm de dimetro).

26

En este caso, los movimientos de la cabeza reducen en parte la ambigedad de


fase, pero sta resulta muy grande para frecuencias por encima de los 1.500 Hz
y el mecanismo de itd pierde toda efectividad.
En la figura 3 se aprecia la diferencia de recorrido en funcin del ngulo
de entrada de las seales que llegan a los odos.

sen

Figura 3. Clculo de la diferencia de recorrido entre las seales que llegan a ambos odos

Si denominamos r al radio de la cabeza, la diferencia de recorrido d es:


d = r + r sen

Diferencia interaural de tiempo (ms)

En la figura 4 se puede ver el grfico de las diferencias temporales de llegada


en funcin del ngulo . La curva se quiebra a 90 por simetra bilateral.

0,6
0,5
0,4
0,3
0,2
0,1
0,0

20

40

60

80 100 120 140 160 180

ngulo horizontal desde el frente (azimut)

Figura 4. Diferencia interaural de tiempo (itd) en funcin del azimut

27

iid

(diferencia interaural de intensidad)

6000
5000

Fecuencia (Hz)

4000
3000
2500
1800
1000
500
200

Diferencia interaural de intensidad (dB)

La diferencia interaural de intensidad (iid) consiste en la diferencia de intensidad de las seales en los dos odos y orienta al oyente en la ubicacin de la
fuente acstica en el ngulo horizontal. En la mayora de los casos, la iid no
es provocada por la desigualdad de recorrido entre la fuente y cada odo, sino
por la sombra acstica que causa la cabeza al interponerse entre la fuente y el
odo ms alejado.
En la figura 5 se puede ver la diferencia interaural de intensidad (iid)
en funcin del azimut. La frecuencia de la seal sinusoidal generada por la
fuente se emplea como parmetro de la familia de curvas.

30
20
10
0
10
0
10
0
10
0
10
0
10
0
10
0
10
0
10
0

30

60

90

120

150

180

ngulo horizontal desde el frente (azimut)

Figura 5. Diferencia interaural de intensidad (iid) en funcin del azimut y de la frecuencia

Ya se mencion que una cabeza humana promedio se puede aproximar a una


esfera de alrededor de 23 cm de dimetro. A causa del fenmeno de difraccin
la cabeza no provoca una sombra acstica ntida por debajo de 1.700 Hz y
resulta acsticamente transparente por debajo de 500 Hz. Como puede verse
con claridad en la figura 4, la iid es nfima a frecuencias por debajo de los 500
Hz, pero puede llegar hasta 20 dB a frecuencias elevadas. En otros trminos,
la difraccin de las ondas en la cabeza limita la eficacia del mecanismo de
28

deteccin de diferencias interaurales de intensidad a la parte superior del


espectro audible.
En cuanto al mnimo cambio detectable en la iid, se ha comprobado que
llega a 1 dB para seales frontales siempre que la frecuencia de la seal supere
los 1.000 Hz.
Un buen ejemplo relacionado con la iid lo provee la reproduccin estereofnica, en la que toda la informacin espacial est codificada nicamente
en trminos de diferencias de intensidad (en los registros de audio ms cuidados, sin embargo, se contempla tambin la informacin de fase).
Indicios espectrales: hrtf (funciones de transferencia relativas a la cabeza)
Como ya se mencion, cuando la fuente acstica est ubicada en cualquier
punto del plano medio, las pistas suministradas por la itd y la iid son coincidentes. En este caso, el efecto complejo de filtrado que se produce por
accin de nuestro torso superior, cuello, cabeza y orejas es principalmente
responsable de suministrar la informacin necesaria para determinar la ubicacin de la fuente acstica. Debe ser sealado tambin que la informacin
entregada es til tanto para determinar la elevacin de la fuente como para
saber si est detrs o delante de nosotros. Dado que esta informacin es diferente cuando el ngulo horizontal cambia, la hrtf refuerza a las itd y las iid
segn corresponda. Sin embargo, algunos experimentos han demostrado que
los oyentes no mejoran su percepcin de la direccin en el plano horizontal si
a los indicios de itd e ild se les suman los de las hrtf. Los indicios espectrales
se clasifican en monoaurales y binaurales. Se tratarn unos y otros en las dos
secciones que siguen.

Diferencias espectrales monoaurales
En 1969 Butler sugiri que el pabelln auricular provee informacin sobre
la localizacin vertical y sobre la discriminacin entre los campos acsticos
anterior y posterior. Es decir, permite localizar fuentes ubicadas en el plano
medio, imposibles de resolver con la iid y la itd (Butler, 1969).
Hoy est aceptado que el pabelln auricular modifica el espectro del
estmulo en funcin del ngulo de incidencia de la onda en relacin con
el eje medio de la cabeza. Esta accin, anloga a la de un filtrado, se mide
comparando el espectro del estmulo exterior con el espectro de la seal en
la entrada del canal auditivo externo. La razn, expresada en dB, se conoce
como funcin de transferencia de la cabeza (hrtf) y se puede apreciar en
la figura 6.
29

Amplitud 10dB
0
18

0
18

36

36

54

)I

54

72

72

90

IH (

90
106

106

126

126

144

144

162

162

180

180

0,2

0,5

10 15

Frecuencia (kHz)

Figura 6. Funciones de transferencia desde el campo externo hasta la entrada del canal
auditivo externo (hrtf) con el ngulo horizontal como parmetro

La informacin provista por el pabelln auricular, dado su tamao unos 27


cm2 es efectiva a frecuencias por encima de los 6 kHz. Entre 500 Hz y 6 kHz
la cabeza, que acta como pantalla, funciona de manera similar.
En experimentos con ruido de banda angosta, la elevacin aparente
deriva de la coincidencia entre los picos de la hrtf y la frecuencia central
del ruido. Por ejemplo, un ruido ditico centrado en 8 kHz se oye arriba al
margen de su ubicacin real, pues en esa posicin la funcin de transferencia
posee un pico de amplitud.3
Para que el oyente haga un uso eficiente de los datos espectrales asociados con la direccin de la fuente acstica, es necesario que distinga entre los
picos y valles relacionados con la direccin (hrtf), y los propios de la fuente
y de las reflexiones generadas en las superficies cercanas. Esto significa que el
3

Cuando las seales que llegan a los dos odos son idnticas se dice que el estmulo es ditico, y cuando son diferentes se lo llama dictico.

30

conocimiento previo de la fuente y de las condiciones acsticas del ambiente


es relevante. Sin embargo, como cada pabelln auricular provee filtros diferentes y conocidos, se los puede separar de los datos espectrales externos.4 G.
Plenge present evidencia de que cuando un sujeto no est familiarizado con
las caractersticas de la fuente y del ambiente acstico la localizacin monoaural se degrada (Plenge, 1974). Pero en compensacin se requieren muy pocos
segundos para habituarse a la nueva situacin. Esta acomodacin espacial es de
gran importancia en la audicin y ejecucin de msica en vivo.
Indicios espectrales binaurales
Cuando se comparan los espectros de la seal entrante en cada uno de los odos
se descubren significativas diferencias entre estos. De manera anloga al caso
de las hrtf monoaurales, estas diferencias se deben al efecto complejo de filtrado debido a la accin del torso superior, cuello, cabeza y, particularmente
en este caso, los pabellones auditivos de los oyentes en funcin del ngulo de
incidencia del frente de onda. Las diferencias espectrales binaurales son usadas
por el sistema auditivo para la determinacin de la posicin de la fuente acstica en tres dimensiones (particularmente en el plano medio y en la discriminacin frente-atrs, que es en donde los indicios de itd e iid son ineficaces). La
figura 7 muestra el espectro de la respuesta a impulso en cada uno de los odos
de un individuo para una ubicacin espacial hacia la izquierda de este.
Las mediciones de las hrtf se obtienen realizando los productos de la
funcin de transferencia de la fuente y del equipo de grabacin con el odo
contralateral y el odo ipsilateral respectivamente.
A despecho de que existen sutiles variaciones entre los diferentes individuos debido a sus constituciones fsicas,5 se pueden establecer ciertos rasgos
comunes en las hrtf binaurales que son independientes de estos factores. Por
ejemplo, en lo que respecta a la magnitud no hay duda de que las diferencias
son ms marcadas en la regin de frecuencia por arriba de 1.500 Hz, y esto
se explica en virtud de que es a partir de esta frecuencia hacia arriba que la
cabeza (por su tamao en comparacin con la longitud de onda de los componentes de frecuencia de la seal) acta de manera ms efectiva produciendo
una sombra acstica. De hecho, se puede pensar a las diferencias espectrales
binaurales como un posterior refinamiento de las iid, que constituira su
4

Un ejercicio interesante consiste en aplastar los pabellones contra la cabeza y salir a dar
una caminata. Es notable como se altera nuestra percepcin acstica del espacio al modificar levemente los filtros hrtf.
5 Y aun debido a sus vestimentas!

31

Figura 7. Grfico de magnitud del espectro de la respuesta a impulso de los odos izquierdo y derecho de una cabeza artificial, para una seal ubicada a un ngulo horizontal de
45 y de altitud de 0. Se realiz una fft de 256 muestras con una ventana BlackmanHarris*
* El grfico se gener con las respuestas a impulso medidas a partir de grabaciones binaurales realizadas con la cabeza artificial Kemmar (informacin detallada en: <http://sound.
media.mit.edu/KEMAR.html>).

32

medicin por bandas de frecuencia diferentes. Tambin se observan (Kendall,


1995) picos significativos en la regin de 3.000 Hz (debidos a la resonancia
del canal auditivo) y valles producidos por la interferencia de ondas directas y
reflejadas en el torso (debajo de los 2.000 Hz) y en los pabellones auriculares
(arriba de los 4.000 Hz). Cuando la fuente de sonido se mueve desde el frente
hacia atrs, se observa que el ancho de banda del valle cercano a los 3.000 Hz
crece y que un valle cerca de los 8.000 Hz se traslada hacia arriba. En lo que
respecta a la fase, tambin existen diferencias significativas entre un odo y
otro. Dado que estas diferencias son especialmente sensibles al tamao de la
cabeza de los individuos, varan significativamente de uno a otro y, particularmente, de nios a adultos.
Deteccin angular en fuentes mviles: La habilidad para percibir el movimiento
lateral de una fuente acstica se mide empleando el mnimo ngulo de movimiento audible (mama). Los experimentos han mostrado que el sistema auditivo
es poco sensible al movimiento de las fuentes acsticas, aunque se comporta
mejor ante movimientos lentos. Para desplazamientos angulares del orden
de los 15/s, el mama es de 5. Pero para movimientos angulares veloces, del
orden de los 90/s, el mama crece hasta llegar a 21. Estos valores son mucho
mayores a los de la mnima variacin angular detectable en fuentes fijas,
que puede llegar a solo 1 para fuentes de banda ancha ubicadas en el plano
medio.
Indicios relativos a la distancia
Los indicios relativos a la distancia que se tratarn son los siguientes: 1) intensidad global del sonido; 2) proporcin entre la seal reverberada y la seal
directa; 3) absorcin de altas frecuencias; y 4) efecto de proximidad.
Intensidad del sonido
La intensidad acstica disminuye o aumenta proporcionalmente con el cuadrado de la distancia a la fuente. Esto implica que, por ejemplo, una seal acstica
cuya intensidad es igual a 1 (en unidades lineales arbitrarias) y se emite a un
metro del punto de audicin, llegar a ese punto con una intensidad de 0,25
(-6 dB) si la fuente se desplaza a 2 metros del punto de audicin, y con una
intensidad de 0,125 (-12 dB) si se emite a 4 metros del punto de audicin.
Generalizando, una fuente acstica de potencia W producir, en un
punto del espacio situado a una distancia d, una intensidad I definida por la
expresin I = W / d2 (vase la figura 8).
33

Figura 8. Amplitud de la seal directa y de la reverberada

Proporcin entre la seal reverberada y la seal directa


Cuando una fuente acstica se encuentra en un recinto cerrado, adems de su
seal directa se producen otras por la reflexin de esta en los elementos fsicos
del recinto. A estas ltimas se las denomina reverberacin.6 Se ha visto en el
punto anterior que la seal directa llega al punto de audicin con una intensidad que es proporcional a la distancia que lo separa de la fuente. No ocurre
as con la seal reverberada, que llega al punto de audicin con una energa
ms o menos constante aunque la distancia entre la fuente y ste cambie. Por
lo tanto, lo que cambia cuando una fuente acstica que emite una seal de la
misma energa se aleja o acerca al punto de audicin es la proporcin entre la
seal directa y la seal reverberada. Este parece ser el principal indicio responsable para la evaluacin de la distancia en ambientes con reverberacin y/o
ecos. Si la intensidad de la seal reverberada fuese mucho mayor que la de la
directa, podra llegar a enmascararla, pero el llamado efecto de precedencia
(que trataremos ms adelante) mitiga los efectos del enmascaramiento por
intensidad.
La figura 8 muestra la comparacin entre cuatro seales directas emitidas
con la misma intensidad por una fuente desde ubicaciones sucesivamente
cada vez ms alejadas (1 m, 2 m, 4 m y 8 m) del punto de audicin. La lnea
entera muestra la amplitud de la seal directa en el punto de audicin, la
6

Este tema se trata en detalle en el captulo siguiente.

34

lnea punteada muestra la amplitud de la reverberacin. Puede observarse que


esta ltima se mantiene constante. Como consecuencia de esto, la proporcin
entre la intensidad de la seal directa y la reverberada en el punto de audicin
cambia. En el tercer caso ambas son iguales mientras que, en el cuarto caso, la
reverberacin tiene mayor intensidad que la seal directa.
Absorcin de altas frecuencias
Debido a la absorcin de los gases y la humedad del aire, la energa acstica
de los componentes de alta frecuencia es atenuada de manera directamente
proporcional a la distancia. Este efecto es similar a un filtro pasabajos, y es
considerado relevante nicamente para distancias superiores a 30 metros. Esta
atenuacin selectiva en frecuencia no responde a una funcin sencilla, ya que
es afectada tambin por la humedad y la temperatura del aire. Para muy poca
humedad, la absorcin es casi nula (vase Rossing, 1998, pp. 165-166).
La figura 9 da cuenta de la complejidad del fenmeno:

Figura 9. Absorcin en el aire cada 10 m de recorrido y a 20 en funcin de la humedad


relativa (basado en Harris, 1979)

Como se aprecia en la figura 9, la absorcin en el aire es significativa a partir


de 4 kHz y presenta un mximo a una humedad relativa cercana al 20%.
Un clculo simplificado de este tipo de absorcin se encuentra en Moore
(1990, p. 523). Segn la fuente citada, la atenuacin A, en dB por metro de
distancia sobre un componente de frecuencia f de una seal acstica equivale
aproximadamente a:
35

A(f) = f / 100.000
La frmula anterior indica que, por ejemplo, un componente de frecuencia de
500 Hz de una seal emitida por una fuente a una distancia de 50 m ser atenuado en 0,25 dB, mientras que otro de 10.000 Hz ser atenuado en 5 dB.
Cuando se disean salas de ms de 500 espectadores y segn la geometra
del espacio cubierto, es necesario tomar en cuenta la absorcin en el aire. Al
aire libre tambin es necesario tomar en cuenta el viento y las caractersticas
acsticas del suelo. Como ilustracin, en la siguiente tabla se muestran los
cambios en la atenuacin a 500 y 1.000 Hz a 100 m de distancia al variar
dichos factores ambientales:
Tabla 1. Atenuacin al aire libre en dB para una seal a 500 y 1.000 Hz en funcin del
viento y el tipo de cobertura del terreno
Tipo de atenuacin
Perfil del viento

Cobertura del terreno

500 Hz

1.000 Hz

Arriba

Mnimo

Mnimo

Abajo

Hasta 30 dB

Hasta 30 dB

Pasto ralo

3 dB

3 dB

Pasto tupido

5,4 dB

7,4 dB

rboles

8 dB

10 dB

Es fcil deducir que para que el indicio de absorcin de altas frecuencias se


manifieste, la fuente debe tener energa significativa en altas frecuencias.
Tambin es evidente que este indicio depende en gran medida del conocimiento a priori de las caractersticas de la fuente.
Efecto de proximidad
Una atenuacin similar a la explicada en la seccin anterior ocurre cuando la
fuente acstica se aproxima mucho a un odo. Se oye un aumento relativo de las
bajas frecuencias que se suele denominar efecto de proximidad. Aunque este efecto est relacionado directamente con la curva de audibilidad del odo humano,
tambin ocurre con algunos micrfonos. Para explicarlo, se usar la descripcin
de un micrfono direccional, ms sencilla porque funciona como un dispositivo
sensible al gradiente de presin entre ambas caras de un diafragma.
36

Supongamos que la diferencia de recorrido de la onda al alcanzar la cara


frontal y la posterior del diafragma sea de 10 mm. Como la longitud de onda es
funcin de la frecuencia, a igual intensidad habr mayor diferencia de presin
a altas frecuencias. Esto se puede apreciar esquemticamente en la figura 10.

Figura 10. Forma de onda de dos seales. En la seal de baja frecuencia, la diferencia de
presin en lneas gruesas es menor que en la de alta frecuencia

Esta dependencia entre la presin y la frecuencia genera una curva que crece
a razn de 6 dB/octava, como se muestra en la figura 11.
El otro componente que produce el gradiente de presin a ambas caras
del micrfono es la diferencia de intensidad provocada por la distancia a la
fuente y que sigue, como ya se explic, la ley del inverso del cuadrado de la
distancia. La combinacin de ambos factores (presin y distancia) se puede
ver en la figura 12.
37

Figura 11. Aumento de la presin entre ambas caras del diafragma de un micrfono en
funcin de la frecuencia

Figura 12. Combinacin de los componentes responsables de la diferencia total de presin


(- - - - = distancia; = presin; = combinacin de ambas)

Obviamente, un micrfono con semejante respuesta no sera aceptable. Por


ello, para compensar su respuesta general en frecuencia se lo atena con un filtro con una pendiente que decrece a -6 dB/octava, lo que produce la respuesta
casi plana que se grafica en la figura 13.

38

Figura 13. Resultado de la aplicacin de una atenuacin de -6 dB/octava para una fuente
alejada

Mientras la fuente quede lejos del micrfono, la respuesta resulta casi plana.
Pero si la fuente se acerca mucho, debido a la ley del cuadrado de la distancia,
su componente crece significativamente y empuja la curva resultante hacia
arriba, como se aprecia en la figura 14.

Figura 14. Resultado de la aplicacin de atenuacin de -6 dB/octava para una fuente


cercana

39

Se produce as el llamado efecto de proximidad. Su magnitud depende


del diseo del micrfono, pero es generalmente mayor en los direccionales por
gradiente de presin, y nulo en los omnidireccionales.
La curva de audibilidad del odo humano posee una atenuacin hacia las
altas frecuencias, similar a la descripta. Es por eso que el efecto se percibe directamente al acercar una fuente acstica a unos pocos centmetros del odo. Sin
embargo, el efecto no es tan pronunciado como en el caso de un micrfono de
gradiente de presin. Una situacin comn en la que omos el efecto de proximidad es cuando se enfatizan las bajas frecuencias de la voz de un locutor.

Directividad de la fuente acstica


Se denomina directividad o patrn de radiacin de una fuente acstica al
modo particular en el que dicha fuente irradia en el espacio la seal acstica
que produce.
Una fuente acstica que irradia la misma seal hacia todas las direcciones es considerada omnidireccional. El modelo de radiacin omnidireccional
(anlogo al de una esfera que crece) es ideal, ya que no se corresponde estrictamente con el patrn de radiacin de ninguna fuente acstica real. Las fuentes acsticas reales tienen patrones de radiacin distintos al omnidireccional
y, por consiguiente, la seal que irradian cuando apuntan hacia el oyente es
distinta de la que irradian cuando apuntan hacia otra ubicacin. Este comportamiento, que es en general muy complejo, se debe a la constitucin fsica
propia de las fuentes acsticas.
Nuestra experiencia cotidiana con la radiacin de la luz nos provee una
analoga que resulta til para comprender este fenmeno: una esfera que radia
luz en todas las direcciones produce un efecto diferente al de una linterna o
un reflector, que proyectan ms luz hacia la direccin a la que apuntan. De
manera anloga con los objetos iluminados, las paredes, techo y piso de un
recinto producirn diferentes ecos y reverberacin segn las caractersticas
direccionales de la fuente acstica y de su orientacin. La situacin es aun ms
complicada, dado que los montos de energa de la seal que irradia una fuente
son tambin dependientes de la frecuencia.
Todo lo antedicho indica que la seal que emite una fuente acstica cuyo
patrn de radiacin no es omnidireccional cambia en espectro y energa de
acuerdo a sus caractersticas de directividad y a su orientacin.
La figura 15 muestra un esquema en dos dimensiones de la radiacin de
dos fuentes acsticas con caractersticas direccionales contrastantes. La que se
encuentra a la derecha del oyente es omnidireccional, es decir, irradia montos
40

iguales de energa acstica en todas las direcciones. La que se encuentra al


costado izquierdo es altamente direccional, con un patrn que suele denominarse hipercardioide. En ambos casos, las flechas marcan la magnitud de la
radiacin de la energa acstica hacia la direccin a la que apuntan (simbolizan vectores de radiacin).

Figura 15. Esquema bidimensional de radiacin de dos fuentes acsticas, a la derecha del
oyente una fuente omnidireccional, y a la izquierda una fuente direccional con patrn
hipercardioide

Numerosos autores por ejemplo Martin y Meyer midieron cuidadosamente


las caractersticas direccionales de instrumentos musicales, voces y altavoces.
En la figura 16 (a-d) se pueden apreciar los diagramas polares de un violn,
una tuba, un piano y un corno francs, respectivamente. Dado que, como
es de esperar, cada instrumento presenta sus caractersticas direccionales en
funcin de la frecuencia, las mediciones que se muestran fueron tomadas en
cinco diferentes frecuencias.
Los grficos con diagramas direccionales son herramientas tiles para el
diseo preciso de un sistema de sonido. Sin embargo, muchas veces se necesita
mucho menos informacin que la que estos proveen y se emplea un factor a
nmero nico para cada frecuencia. A este factor se lo denomina factor de
directividad, Q(f), y se obtiene dividiendo la intensidad sobre el eje de mxima radiacin de la fuente a una distancia r por la intensidad que producira a
la misma distancia una fuente omnidireccional de la misma potencia que la
fuente a caracterizar. El ndice de directividad, di(f), de uso ms habitual que
el factor de directividad, se calcula directamente a partir de este ltimo en
base a la siguiente ecuacin:
41

a. Caractersticas direccionales del violn


para cinco frecuencias diferentes

Figura 16. Caractersticas direccionales de algunos instrumentos musicales (basado en


Davis y Davis, 1997, p. 602)

42

b. Caractersticas direccionales de la tuba


para cinco frecuencias diferentes

Figura 16. (Continuacin)

43

c. Caractersticas direccionales de un piano de cola


para cinco frecuencias diferentes

Figura 16. (Cont.)

44

d. Caractersticas direccionales del corno


para cinco frecuencias diferentes

Figura 16. (Cont.)

45

di(f) = 10 log10 Q(f)


Como se puede inferir de la ecuacin anterior, a una fuente perfectamente
omnidireccional le corresponde un di = 0.
En la figura 17 se pueden apreciar los diagramas direccionales y el ndice
de directividad en funcin de la frecuencia para un altavoz de 30 cm de dimetro colocado en una caja de suspensin acstica.
El aumento del ndice de directividad en funcin de la frecuencia constituye una caracterstica habitual en la mayora de las fuentes acsticas. Las
consecuencias de la variacin de la directividad con la frecuencia son importantes. En la figura 18 se aprecia el espectro que recibe un oyente ubicado en
distintas posiciones relativas respecto del eje del altavoz.

Diagramas de direccionalidad medidos en un altavoz de radiacin directa tpico de 30,5


cm de dimetro, en una caja rectangular de 82 x 51 x 30 cm. Se indican los ndices de
directividad para F = 00 y un ngulo de ndice de directividad cero.

Figura 17. Diagramas direccionales e ndice de directividad en funcin de la frecuencia


para un altavoz de 30 cm de dimetro colocado en una caja de suspensin acstica

46

Figura 18. Efecto espectral de la directividad de un altavoz (basado en Ballou, 1991, p. 555)

Como se puede apreciar en la figura 18, solamente el oyente ubicado en el eje


del altavoz percibir el sonido sin coloracin, es decir con el espectro intacto.
Los dems oyentes percibirn una prdida de energa de alta frecuencia que se
har ms significativa en la medida en que se alejen del eje. Para evitar este
defecto, los grandes sistemas de refuerzo electroacstico se calculan cuidadosamente. Para empezar, los diagramas direccionales se miden y dibujan en 3D,
como se muestra en la figura 19.
Este diagrama 3D se aplica, mediante un software especfico, al caso
particular a tratar. Por ejemplo, en la figura 20 se puede ver la forma en que
un altavoz pinta la platea de un estadio de ftbol que se va a usar para un
recital de rock.
Por lo general, un solo altavoz no puede cubrir eficazmente una gran rea.
Por ello, para lograr el efecto que se describi en la figura 20, se emplean combinaciones de varios altavoces con la superposicin de diagramas direccionales cuidadosamente estudiada. En la figura 21 se pueden ver dos conjuntos
caractersticos.
47

Figura 19. Diagrama direccional en 3D de un altavoz (realizado con el software CATTAcoustic)

Figura 20. Aplicacin del diagrama direccional 3D a una platea horizontal

48

Figura 20. (Continuacin)

49

Figura 21. Arreglo vertical y cluster central de altavoces

50

Si el diseo que se explic se realiza de la manera adecuada, es posible asegurar


que cada uno de los espectadores recibir una cantidad adecuada de energa
acstica sin grandes distorsiones de espectro o fase.
Percepcin de la directividad de las fuentes acsticas
La directividad de las fuentes acsticas se percibe a partir de la variacin de
alguno de los rasgos del sonido que producen. Por ejemplo, si una trompeta
dirige su pabelln hacia un espectador y luego hacia el piso del escenario, el
espectador puede reconocer cambios en la sonoridad, en el timbre y, eventualmente, en la claridad y la localizacin de la fuente.
La disposicin en el escenario de los instrumentos de una orquesta es
funcin, entre otras cosas, de sus respectivas caractersticas de directividad.
Los instrumentistas muchas veces las modifican de acuerdo a las necesidades
de la pieza interpretada. Por ejemplo, un trompetista puede alzar o bajar su
instrumento para modificar la intensidad y el brillo del sonido; los cornos
pueden alzar el pabelln para tocar un pasaje modificando notablemente la
directividad;7 un solista de violn puede inclinar hacia adelante su instrumento para llegar con mayor claridad y presencia a los oyentes en platea. Y
un ejecutante de platillos abre las dos partes de su instrumento variando
dinmicamente la directividad en el tiempo que dura un solo golpe.
Respecto del impacto perceptivo de la directividad de las fuentes acsticas, baste citar esta opinin de uno de sus investigadores ms destacados:
Es obvio que oyentes en diferentes ubicaciones escucharn un timbre o cualidad tonal bien diferente debido a la directividad de estas diferentes radiaciones. Dentro de una sala de concierto, por supuesto, las reflexiones de las
paredes, techo, piso y otras superficies mezclan a los sonidos, y la directividad del timbre no es tan evidente para el oyente. Diferencias sutiles y a
menudo sorprendentes existen, sin embargo, y modifican la cualidad de la
interpretacin musical (Rossing, 1996).

En una de las investigaciones ms recientes sobre la percepcin de la directividad de los instrumentos acsticos y su influencia en la percepcin de ambientes8 se tomaron grabaciones de una trompeta, un clarinete y un corno mediante
un arreglo tridimensional de micrfonos en una sala anecoica (Kirkwood,
2003). Los micrfonos fueron dispuestos con una separacin de 45, tanto en el
7
8

Este efecto es denominado campana in aria.


Realizada en 2002-2003 en el marco del proyecto DoReMi9.

51

plano horizontal como en el vertical. Cada instrumentista tocaba notas cortas


aisladas que fueron grabadas filtrndolas por bandas de octava, desde 125 Hz
hasta 8.000 Hz. Se registraron as las variaciones de directividad en funcin
de la frecuencia de cada instrumento y se calcul su promedio. Se comprobaron significativas disparidades en ambas, pero en la dimensin vertical las
variaciones fueron ms prominentes (Causse, 2002). Mediante un software
especial de simulacin de acstica de salas se realiz un modelo de una conocida sala de conciertos de Suecia.9 Los parmetros acsticos que se tuvieron
en cuenta en tal simulacin fueron: nivel de presin sonora (spl), factor de
claridad (C80), fraccin de energa lateral (LF80) y tiempo de decaimiento
temprano (edt).10
Se usaron tanto notas especficas de cada instrumento (DO4 para la
trompeta, SI3 para el corno y DO#4 para el clarinete) como su directividad
promedio en todo el rango de su registro. El anlisis de los resultados mostr
como era de esperarse claras diferencias de distribucin espacial en el
recinto que son atribuibles a la directividad de cada instrumento usado. Las
ms significativas fueron las de spl y C80, menos pronunciadas para LF80 y
prcticamente nulas para edt.
Tambin se realizaron experimentos de audicin con once oyentes entrenados previamente y que estaban acostumbrados a escuchar en la sala real
que fue simulada. Se realizaron auralizaciones de melodas breves (aproximadamente 10 segundos) y se les presentaron a los oyentes de a pares para
que realizaran una eleccin cualitativa forzada entre ambas en base a cinco
parmetros subjetivos: sonoridad, reverberacin percibida, claridad, facilidad
de localizacin y naturalidad del timbre instrumental.
El estudio estadstico de los resultados de los test dio como resultado que
el parmetro perceptual favorecido fue la sonoridad (todos los sujetos pudieron
percibir la diferencia de intensidad debida a la directividad especfica de cada
fuente), luego la reverberacin (fue distinguida en dos de los tres instrumentos),
la claridad solo fue importante para el corno, mientras que tanto las diferencias
en la audibilidad de la localizacin como del timbre fueron irrelevantes.

Una revisin de los indicios de localizacin y de los factores


que determinan su prominencia
Algunos investigadores en audicin espacial han intensificado sus esfuerzos
9

Se trata del software Odeon, vase <http://www.dat.dtu.dk/~odeon>.


Para una explicacin de estos factores, vase el captulo ii de este libro.

10

52

hacia la determinacin de cules son los rangos de variacin perceptibles de


un indicio, en qu medida nuestro sistema auditivo tiene en cuenta la informacin que proporciona, y cules son las condiciones que debe cumplir la
seal acstica para ser portadora de esa informacin.
Dentro de los ms significativos trabajos en este sentido se cuenta el
de Wightman y Kistler (1995). En l sus autores realizan una clara resea
y clasificacin previa de los indicios utilizados por nuestro sistema auditivo
en la localizacin angular de sonido y luego describen los experimentos que
realizaron para juzgar cules indicios, y en qu condiciones, son considerados
ms relevantes por nuestro sistema auditivo en una situacin dada.
La clasificacin de Wightman y Kistler se basa en dos criterios combinados: a) las seales consideradas (binaural o monoaural); y b) la informacin
evaluada (temporal o espectral). La tabla 2 ilustra esquemticamente los
indicios y su clasificacin.
Tabla 2. Clasificacin de los indicios de localizacin espacial angular, segn Wightman y
Kistler

Temporal

Espectral

Monoaural

Fase monoaural
(Batteau, 1976)

1. Nivel general

Binaural

itd

2. Indicios espectrales monoaurales


1.

iid

2. Diferencias espectrales binaurales

En este trabajo, los autores descartan prcticamente la comparacin monoaural de fase en la evaluacin de su efectividad. Luego de esto, tratan los factores
que determinan la prominencia de los indicios restantes. Segn ellos, los
factores son: a) confiabilidad de los indicios, o consistencia; b) dependencia
del conocimiento a priori de las caractersticas de la fuente; c) contenido de
frecuencia de la seal; y d) realismo de los indicios o plausibilidad.
Confiabilidad de los indicios
A su vez, la confiabilidad de los indicios surge de la evaluacin de: hasta qu
punto el indicio depende de las caractersticas de la fuente; hasta qu punto
provee la misma informacin en todas las bandas a lo largo del espectro de
frecuencias; hasta qu punto la informacin es aproximadamente la misma
53

de oyente a oyente (un indicio altamente idiosincrsico, como las hrtf, es


menos confiable) y en qu medida la informacin provista por el indicio no
es ambigua.
Las conclusiones generales respecto de la confiabilidad favorecen a la itd
en primer lugar, y luego a la iid. Sin embargo, se deben remarcar las observaciones de los autores respecto de la magnitud de la ambigedad, en el sentido
en que, tanto la itd como la iid son ambiguas, dado que una determinada itd
o iid no es indicio de una sola posicin espacial. Como un simple ejemplo de lo
antedicho, pinsese en una fuente acstica que se mueve en el permetro de un
crculo en el plano medio, con la cabeza del oyente en el centro. En este caso,
tanto las itd como las iid que se registren sern iguales a cero y, por lo tanto,
deberemos recurrir a otros indicios para determinar la posicin de la fuente en
el ngulo de elevacin.
El rol del conocimiento a priori de las caractersticas de la fuente
Cuanto ms dependa un indicio en el conocimiento a priori que tiene el oyente
de la fuente acstica involucrada, menos importancia puede tener. Ntese que
si bien esta consideracin adquiere un especial sentido en la audicin de msica,
tambin es pertinente en oyentes no adiestrados en un lenguaje sonoro especfico, y en oyentes no msicos habituados a un escenario sonoro por razones
de profesin o trabajo.11 La conclusin general es, por supuesto, que aquellos
sonidos provenientes de fuentes de las que el oyente no tiene un conocimiento
a priori son difciles de localizar usando indicios que dependen fuertemente de
este conocimiento. Obsrvese la pertinencia en la utilizacin del concepto de
comportamiento de la fuente acstica, dado que la percepcin es holstica, y
que los sonidos que emite una fuente constituyen una coleccin extensa, cuyas
caractersticas cambian en funcin de muy diferentes variables. Por dar un solo
ejemplo, el caso de un instrumento musical que puede tocarse con diversas
velocidades, articulaciones, registros, tipos de toque, etc. que influyen de manera decisiva en los parmetros de la seal resultante. Otra vez, las itd y las iid
vuelven a ser los favoritos, dado que no dependen fuertemente de nuestro conocimiento a priori del comportamiento de las fuentes acsticas involucradas.
El contenido de frecuencia de la seal
Como conclusin general, Wightman y Kistler establecen que ...la localizacin precisa de sonido es posible slo con fuentes de sonido de banda ancha...,
11

Como podra ser el caso tpico de los mecnicos.

54

dado que los ...estmulos de banda angosta proveen un conjunto tpicamente


ambiguo y empobrecido de indicios.... En la consideracin especfica de las
regiones del espectro en las que cada indicio opera con mayor intensidad, es
importante observar que los principales indicios alcanzan mayor efectividad
en diferentes regiones del espectro, compensando de esta manera las limitaciones de los otros. La tabla 3 muestra un resumen de las conclusiones:
Tabla 3. Los indicios de localizacin y la regin de frecuencia en la que son ms prominentes, segn Wightman y Kistler (1995)
Indicio

Regin del espectro en la que es ms efectivo

itd

A partir de aproximadamente los 1.500 Hz y para estmulos sinusoidales,


su prominencia disminuye, debido a la confusin en la comparacin de
fases a altas frecuencias. Este lmite que corresponde a componentes
de frecuencia cuya longitud de onda equivale aproximadamente al doble
de la distancia entre nuestros odos vara de acuerdo con las caractersticas espectrales y el tipo de ataque de las seales involucradas.

iid

Disminuye a partir de 1.500 Hz hacia abajo, por debajo de aproximadamente 500 Hz prcticamente no opera, debido a la difraccin de las
frecuencias ms graves.

hrtf

monoaural
hrtf

binaural

Su prominencia aumenta a partir de aproximadamente 4.000 Hz debido


a que los picos ms significativos de las funciones de transferencia se
ubican a partir de ese lmite.
Como es la evaluacin de los iid en funcin de bandas de frecuencias,
est sujeta a los mismos lmites.

Realismo de los indicios o plausibilidad


En los sonidos producidos naturalmente, no puede ocurrir que los datos de
un indicio en una banda de frecuencia sean contradictorios con los datos que
produce el mismo indicio en otra banda de frecuencia de la misma seal. Son
distintos, pero no contradictorios, en el sentido en que, por ejemplo, dada una
seal acstica producida por una fuente localizada en una determinada posicin, no podra ocurrir nunca que la iid evaluada en una banda de frecuencias
indique que la fuente acstica est de un lado de la cabeza, mientras que la iid
evaluada en otra banda de frecuencias indique que la fuente acstica est del
otro lado. Lo mismo ocurre con la itd.
55

Sin embargo, en las seales acsticas producidas artificialmente es completamente posible lograr, para distintas bandas de frecuencias, datos contradictorios en el mismo indicio. Wightman y Kistler, a travs de numerosos tests,
comprueban que nuestro sistema auditivo es capaz de seguir al indicio plausible
y descartar aquellos que no lo sean. Los datos de sus experimentos son muy significativos, porque demuestran que basta un solo dato respecto de un indicio en
una banda de frecuencia que sea inconsistente con los datos del mismo indicio
en otras bandas de frecuencias para que el sistema auditivo debilite totalmente
la importancia de ese indicio y siga a otros que sean consistentes.
El rol de los movimientos de la cabeza en la localizacin
Los experimentos de Wightman y Kistler tambin demuestran que nuestra
habilidad para girar la cabeza y orientarla hacia donde suponemos que proviene el sonido es decisiva para la resolucin de confusiones frente-atrs. Luego
de probar extensamente con la audicin de indicios en tests de diferencias
frente-atrs (a travs del agregado de ecos, y a travs de la exageracin de
indicios de hrtf) en experimentos con oyentes en situacin de cabeza estacionaria, lograron significativos resultados simplemente realizando los experimentos en situacin de cabeza mvil.
Lo antedicho sugiere que, por fuertes que sean los indicios, determinadas
posiciones o localizaciones no pueden ser resueltas de manera precisa por el
sistema auditivo sin que se comprometan otros recursos.
Efectividad de los indicios relacionados con la distancia
A pesar de que el trabajo ya citado de Wightman y Kistler no provee una
evaluacin de los indicios relacionados con la distancia, el conocimiento de
estos permite exponer algunas consideraciones al respecto.
En general, los juicios auditivos sobre la distancia a la que se encuentra
una fuente acstica son relativamente imprecisos, y los errores con relacin a
la distancia fsica son del orden del 20% en situaciones normales.
A pesar de su aparente simplicidad, la intensidad del sonido no parece ser un indicio fiable para juzgar la distancia entre la fuente y el oyente.
Fsicamente hablando, es bien sabido que la intensidad acstica disminuye
proporcionalmente con el cuadrado de la distancia. La intensidad no es
ambigua (un valor de intensidad acstica se corresponde con un valor de
distancia), y entrega proporcionalmente la misma informacin en todas las
bandas de frecuencia (i.e., no necesita energa en una zona en particular del
espectro para manifestarse). Sin embargo, la sonoridad (cuya relacin con la
56

intensidad acstica de la seal no es lineal) depende fuertemente del conocimiento a priori de las fuentes acsticas involucradas. De hecho, no se piensa
que el sonido producido por una persona susurrando cerca del oyente es ms
fuerte que el sonido producido por una persona gritando lejos, aun cuando la
primera seal superara en energa intensidad a la segunda.
Las diferencias espectrales que se producen por el efecto del aire en funcin de la distancia de la fuente son solo efectivas a distancias mayores de
30 m y requieren por parte del oyente un conocimiento de las caractersticas
de la fuente acstica.
El indicio ms efectivo en la apreciacin de la distancia entre la fuente
acstica y el oyente es la proporcin entre reverberacin y sonido directo. Sin
embargo, ya que tal indicio slo se manifiesta en recintos, es interesante describir lo que ocurre cuando los oyentes son privados de estos indicios. Por ejemplo,
en el campo libre no acta el sistema de evaluacin de la perspectiva relacionado con la reverberacin, y la precisin de los juicios con relacin a la distancia
se reduce significativamente. Estas situaciones se han estudiado en experiencias
de laboratorio, con fuentes sinusoidales ubicadas en cmaras anecoicas, en las
que se preserva solamente la informacin relacionada con la intensidad fsica.
Un estudio relativamente reciente (Zahorik, 2002) revela que existe
en el sistema auditivo una tendencia a subestimar distancias grandes (i.e.,
percibir que una fuente lejana est ms cerca de lo que en realidad est) y
sobreestimar distancias pequeas (i.e., percibir que una fuente cercana est
ms lejos de lo que en realidad est). Adems de ello, en dicha investigacin
se demuestra que la importancia asignada a los dos indicios que se estudiaron
(intensidad y proporcin entre sonido directo y reverberacin) vara significativamente en funcin de los dos estmulos usados (ruido y habla) y de la
posicin angular de la fuente en el plano medio (0 a 90).
Consecuentemente, todo lo antedicho puede constituir la causa por la que
la apreciacin que realiza nuestro sistema auditivo de la distancia entre la fuente
acstica y el oyente no sea muy precisa.

Otros indicios que afectan la audicin espacial


Efecto Doppler
El efecto Doppler, responsable por ejemplo del cambio de altura en las sirenas de las ambulancias cuando pasan a nuestro lado, es una importante fuente
de informacin sobre el cambio en el sentido del movimiento relativo entre el
emisor acstico y el oyente. El efecto Doppler es un fenmeno fsico que hace
57

que la frecuencia aparente en el punto de recepcin aumente si este se acerca


a la fuente, y que disminuya si se aleja de ella. En la figura 22 se ilustra el caso
con una fuente acstica en movimiento hacia un receptor en reposo.
Si la fuente se encuentra quieta la onda acstica llenar la distancia FR
que la separa del receptor en un tiempo t = FR/c, con c como la velocidad del
sonido en el aire. La longitud de onda en este caso es = FR / f t. Pero si la
fuente se desplaza hacia el receptor a velocidad vF la onda acstica recorrer
en el mismo tiempo una distancia menor FR. La fuente se habr movido en
ese lapso una distancia FR FR = vF t y la nueva longitud de onda ser
= FR / f t. Tomando en cuenta la relacin general v = f y luego de algunas
operaciones algebraicas sencillas se tiene que:
f =

c - vF
f
c

En la ecuacin anterior f es la frecuencia de la seal emitida por la fuente y f


es la frecuencia aparente en el punto de recepcin. Si se considera tambin la
posibilidad de movimiento del receptor a velocidad vR la ecuacin se modifica
levemente:
f =

c - vF
f
c - vR

La simulacin del efecto Doppler tiene un impacto significativo en la plausibilidad de los efectos especiales para cine y multimedia y se emplea desde
hace tiempo en msica electroacstica a partir de mdulos especficos de
procesamiento.12

Figura 22. Efecto Doppler con una fuente F en movimiento a velocidad vF hacia un receptor R en reposo
12

La obra electroacstica Turenas (1972) del compositor estadounidense John Chowning


es la primera en utilizar este efecto por medio de programas informticos especialmente
diseados a tal efecto por su autor.

58

Efecto Haas o efecto de precedencia


Sabemos que el sentido de la audicin, a diferencia de la vista, se concentra
en las fuentes acsticas antes que en las reflexiones provocadas por los objetos
del entorno. Un ejemplo cotidiano ocurre al localizar la ubicacin de una
fuente acstica en una sala reverberante donde la mayor parte de la energa
proviene de reflexiones. H. Wallach y H. Haas investigaron este fenmeno
con dos seales asincrnicas (vanse Wallach, Newman y Rosenzweig, 1949
y Haas, 1951).
El efecto de precedencia y su importancia en la acstica de recintos se trata
en el captulo siguiente de este libro. Baste mencionar aqu que, en general,
consiste en un mecanismo que ayuda a la discriminacin entre la seal directa y
reverberada o sus reflexiones, a travs de las diferencias temporales entre estas.

Bibliografa
Ballou, G. (ed.) (1991), Handbook for Sound Engineers, Indiana, Howard W.
Sams & Co.
Basso, G. (2006), Percepcin auditiva, Bernal, Editorial de la Universidad
Nacional de Quilmes.
Batteau, D. W. (1976), The role of the pinna in human localization,
Proceedings of the Royal Society, Ser. B 168, pp. 158-180.
Blauert, J. (1983), Spatial Hearing, Cambridge, mit Press.
Butler, R. A. (1969), Monaural and binaural localization of noise bursts vertically in the median saggital plane, Journal of Auditory Research, vol. 3.
Causse, Rene et al. (2002), Directivity of musical instruments in a real performance situation, Proceedings of the International Symposium of Music
Acoustics.
Davis, D. y C. Davis (1997), Sound System Engineering, Boston, Focal Press.
Fletcher N. y T. Rossing (1998), The physics of musical instruments, Springler.
Haas, H. (1951), ber den einfluss eines einfahechos auf die hrsamkeit
von sprache, Acustica, vol.1, pp. 49-58 [traduccin al ingls: The
influence of a single echo on the audibility of speech, Journal of the Audio
Engineering Society. 20, 1972, pp. 146-159].
Harris, C. M. (ed.) (1979), Handbook of Noise Control, Nueva York, McGrawHill Book Company.
Kendall, G. S. (1995), A 3-D Sound Primer: Directional Hearing and Sound
Reproduction, Computer Music Journal, vol.19, N 4, Cambridge, mit
Press.
59

Kirkwood, B. et al (2003), Perceived influence of changes in musical instruments directivity representation, SMAC03 Proceedings, Estocolmo,
Stockholm Music Acoustics Conference.
Moore, F. R. (1990), Elements of Computer Music, Nueva Jersey, Prentice
Hall.
Plenge, G. (1974), On the difference between localization and lateralization, Journal of the Acoustical Society of America, vol. 56.
Rossing, T. (1996), Modes of Vibration and Directivity of Percussion
Instruments, en <http://www.acoustics.org/press/131st/lay10.html>.
Wallach H., E. Newman y M. Rosenzweig (1949), The precedence effect in
sound localization, American Journal of Psychology, 52, pp. 315-336.
Wightman F. y D. Kistler (1995), Factors Affecting the Relative Salience
of Sound Localization Cues., en Gilkey, R. H. y T. R. Anders (eds.)
(1997), Binaural and spatial hearing in real and virtual environments, Nueva
Jersey, Laurence Erlbaum Associates, pp. 1-23.
Zahorik, Pavel (2002), Assessing auditory distance perception using virtual
acoustics, Journal of the Acoustical Society of America, N 111 (4).

60

Captulo ii
Percepcin espacial del ambiente acstico
Gustavo Basso

En el captulo i se ha visto cmo se localiza y lateraliza una fuente acstica en


el espacio que rodea al oyente. Otra operacin perceptual de gran importancia
es la evaluacin auditiva que realizamos acerca de la naturaleza misma del
ambiente acstico en el que el oyente est inmerso. Este ambiente acstico
es, la mayora de las veces, comn a fuente y receptor.
A lo largo de la historia se han empleado y construido espacios destinados
especficamente a la audicin de msica y palabra, y se ha invertido gran cantidad de tiempo y de recursos en el intento por comprender sus caractersticas
y modos de funcionamiento. Para analizar nuestra percepcin espacial de los
ambientes acsticos debemos, por lo tanto, examinar en detalle dichos trabajos y a ello nos vamos a dedicar en el presente captulo.

Percepcin auditiva del ambiente


Albert Bregman llam anlisis auditivo de escenas al proceso que permite reunir
en una unidad perceptiva el conjunto de datos provenientes de una fuente
acstica externa (Bregman, 1994). Una fuente acstica es una entidad fsica
que genera ondas en el aire. Un agregado auditivo es un percepto causado por
un grupo de elementos sonoros que se experimenta como un todo y que parece
emanar de una nica fuente acstica externa. Normalmente, las propiedades
emergentes que definen cada agregado estn correlacionadas con las propiedades de los objetos fsicos asociados.
Resulta interesante comparar las estrategias de agrupamiento y segregacin de datos que operan en los sentidos de la visin y de la audicin. Existe
una diferencia crucial en el modo en que usamos la energa acstica y la lumnica para obtener informacin del mundo exterior. Cuando analizamos auditivamente un espacio hacemos uso de la energa emitida por ciertos objetos
fsicos (las fuentes acsticas) y casi no tomamos en cuenta la energa reflejada
61

en otros objetos fsicos. En una situacin normal existe la misma cantidad


de agregados auditivos, que podramos denominar tambin objetos sonoros,
y de fuentes acsticas fsicas. Las reflexiones que cambian en funcin del
contexto espacial degradan la informacin que nos llega de cada una de las
fuentes. En consecuencia necesitamos atenuar la informacin que llega por
reflexin y colocar en primer plano la que nos llega directamente (en una sala
de conciertos situamos auditivamente el piano en el escenario, aun cuando
gran parte de su energa nos llega por reflexin desde las paredes y el cielorraso
de la sala). Por el contrario, la informacin visual est causada principalmente
por la reflexin de la luz en los objetos de inters. Encendemos una lmpara
no porque nos interese mirarla, sino para ver por reflexin los objetos de la
sala. A diferencia de la gran cantidad de fuentes acsticas que nos acompaan
desde siempre, hubo una sola fuente de luz a la vez a lo largo de gran parte
de nuestro recorrido evolutivo. En resumen, los datos auditivos y visuales son
diferentes y se complementan para brindarnos un panorama verosmil del
mundo exterior.
Las caractersticas acsticas del ambiente, que pueden tomar la forma
de reflexiones discriminables o de reverberacin difusa, pueden percibirse
separadas de la fuente acstica o pueden integrarse alterando de algn modo
su calidad sonora. El efecto de precedencia describe las circunstancias que
determinan la emergencia de una de estas dos alternativas.
Efecto de precedencia
Hans Wallach y Helmut Hass investigaron lo que ocurre al intentar localizar
la ubicacin de una fuente acstica en una sala reverberante donde la mayor
parte de la energa proviene de reflexiones (Wallach et al., 1949; Hass, 1951).
El efecto de precedencia, o efecto Hass establece, entre otras cosas, que dos sonidos sucesivos se perciben como uno slo si el intervalo temporal entre ellos
es lo suficientemente corto. Si esto sucede el sonido resultante de la fusin se
ubica espacialmente en la locacin correspondiente a la del sonido individual
que llega primero.1
En la figura 1 se puede ver con claridad la regin de validez del efecto de
precedencia con relacin a la intensidad y el retardo de las reflexiones.
El efecto de precedencia no involucra una completa supresin de la informacin que contienen las reflexiones. El oyente puede distinguir cualitativamente cualquier cambio en el patrn temporal de los estmulos, que aporta
informacin sobre la sala y la posicin de los objetos y paredes en ella. En la
1

El efecto de precedencia se desarrolla en detalle en Basso (2006).

62

Figura 1. Regin de validez del efecto de precedencia

regin superior de la figura 1 las reflexiones superan los lmites del efecto de
precedencia llegan muy retrasadas o con demasiada intensidad con relacin
a la seal directa y se las percibe como ecos aislados; en la parte intermedia las reflexiones aportan informacin del entorno acstico en la forma de
ensanchamiento de la imagen auditiva o de sensacin de espacialidad; y en la
regin inferior las reflexiones se vuelven inaudibles.
El efecto de precedencia se usa, entre otras aplicaciones, para preservar
la localizacin espacial de la fuente fsica cuando se emplean varios altavoces
separados por distancias significativas (Basso, 2006).
Perspectiva auditiva
La perspectiva auditiva, al igual que su contraparte visual, es una importante
fuente de informacin ambiental.2 Por ejemplo, el ancho acstico aparente
de una orquesta sinfnica, muy grande en las primeras butacas de la platea,
disminuye a unos pocos grados al orla a 300 m de distancia en un parque.3 El
efecto es equivalente al efecto visual de las lneas paralelas que convergen en
2

Este tema se desarrolla en detalle en Basso (2006).


El parmetro perceptual empleado en acstica de salas se denomina ancho aparente de la
fuente (aws), bien correlacionado con el parmetro fsico de espacialidad (1-iacc), como
veremos ms adelante.
3

63

el infinito. Si continuamos desarrollando la analoga con el sentido de la vista,


se podra decir que la sonoridad disminuye con la distancia tal como ocurre
con el tamao aparente de los objetos, y que la definicin tmbrica se atena
de modo similar al gradiente de color en la visin. La distancia aparente de
la fuente acstica que define la perspectiva auditiva compone una importante
dimensin psicoacstica, aunque no siempre es reconocida como tal. Los
investigadores que desarrollan dispositivos acsticos para cine y sistemas multimedia han concentrado gran parte de su inters en el perfeccionamiento de
modelos virtuales de perspectiva auditiva.
En el dominio de la audicin la constancia de la sonoridad funciona de
modo anlogo a la constancia de tamao para el sentido de la vista. Si una
fuente acstica de intensidad constante se aleja de nosotros, la intensidad fsica que nos llega disminuye proporcionalmente con el cuadrado de la distancia. No debe sorprendernos entonces que una fuente cuya intensidad decrece
parezca alejarse. Sin embargo, tambin podemos experimentar la sensacin de
or una fuente acstica que disminuye de intensidad sin alejarse un instrumento musical en decrescendo, cuyo equivalente en el campo visual podra
ser un globo que se desinfla.
La figura 2 sintetiza los trabajos de John Chowning a partir de una gran
cantidad de experimentos sobre la perspectiva auditiva (Chowning, 1999).
Representa una generalizacin del cambio de la composicin espectral de una
seal de banda ancha en funcin de la altura tonal, la dinmica y la distancia.
A causa de la gran cantidad de dimensiones necesarias para describir los datos
fsicos se han incluido espacios bidimensionales (espectros de potencia) dentro de un espacio tridimensional cerrado.
Una fuente de informacin adicional sobre la distancia aparente de
la fuente la proporciona la reverberacin del recinto. La percepcin de la
reverberacin de un campo acstico se puede considerar un caso especial
de integracin auditiva. El tiempo de reverberacin de un espacio abierto
o cerrado aporta informacin sobre sus caractersticas generales: materiales, forma, volumen, distancia a la que se encuentra la fuente acstica,
etctera.
La relacin entre la intensidad de la onda directa y la de la reverberacin es interpretada por el oyente como un ndice de distancia. En un
espacio cerrado tpico la intensidad del campo reverberante no vara con
la distancia a la fuente, mientras que el sonido directo s lo hace. Sabemos,
por experiencias previas, que el nivel del campo reverberante depende de
la intensidad de la fuente que lo excita y usamos este conocimiento para
evaluar la intensidad y distancia de las fuentes acsticas en recintos cerrados
(Basso, 2006).
64

Figura 2. Espacio distancia-intensidad-frecuencia segn Chowning

Acstica de salas
Para comprender en toda su magnitud la importancia de la percepcin espacial del ambiente acstico es necesario analizar el desarrollo de la acstica
de las grandes salas para teatro y msica, tema que ha recibido la atencin
creciente de investigadores, msicos y pblico durante los ltimos cien aos.
Desarrollo histrico hasta el siglo

xix

Aunque la mayora de las culturas de la antigedad disponan de espacios


destinados a las reuniones y representaciones colectivas, el inicio histrico
reconocido de la acstica de salas coincide con el desarrollo del teatro griego.
A partir de su estructura se derivan el teatro romano y los anfiteatros latinos,
cuyos detalles de diseo acstico conocemos gracias a los 10 tomos del tratado
De architectura de Vitrubio (c. 70 a.C. - c. 25 a.C.).
En el Renacimiento y la Edad Moderna los avances tericos de la ciencia
acstica fueron notables gracias a los trabajos de Galileo, Mersenne y Euler.
Sin embargo, la comprensin de los principios que gobiernan la acstica de
65

salas no haba progresado y el tratado de Vitruvio segua siendo la referencia


obligada. Los intentos por reunir teora y prctica llevaron a la creacin
de complicados sistemas de imposible realizacin. El maravilloso tratado
Musurgia Universalis, editado en 1650 por Athanasius Kircher, es el mejor
ejemplo que nos ha llegado del intento moderno por derivar la acstica de
salas de principios geomtricos simples.
En forma paralela, la construccin de espacios destinados a representaciones teatrales y lricas segua las reglas empricas que permitieron el desarrollo
que va desde el teatro circular medieval hasta el teatro de pera en herradura,
una de las tipologas arquitectnicas ms exitosas de la historia. Pero, mas all
de dichos procedimientos empricos, no exista una comprensin profunda de
los principios que rigen la acstica de salas. Vale a modo de ejemplo la conclusin de Charles Garnier, el arquitecto que dise la pera de Pars en la
dcada de 1870. Luego de revisar casi por completo la literatura sobre acstica
de salas de su poca, declar que la acstica le resultaba una ciencia extraa,
en la que las reglas y los principios se contradecan entre s.
A fines del siglo xix se haban consolidado dos tipologas arquitectnicas que llevaron a la creacin de las dos grandes formaciones instrumentales
dominantes durante el perodo: la orquesta sinfnica romntica y la combinacin de orquesta y canto en la gran pera.
En el caso de la pera la tipologa arquitectnica provena en lnea directa de los teatros en herradura italianos del siglo xviii (Alla Scala de Miln,
La Fenice de Venecia), con algunas variantes locales como en los casos de la
planta circular de la pera de Pars o el ejemplo solitario del teatro del festival
de Bayreuth diseado por Richard Wagner.
En cuanto a la msica sinfnica, la necesidad de albergar la mayor cantidad posible de espectadores convertida en exigencia a partir de la revolucin
francesa determin la tipologa estndar de los auditorios. El ancho quedaba
determinado por las vigas transversales de madera ms largas necesarias para
sostener el techo entre 20 m y 24 m, el largo por la distancia mxima desde
la que se pueden ver con un tamao razonable los msicos en el escenario. La
altura deba permitir la renovacin del aire por conveccin. Naci as la caja
de zapatos caracterstica de la mayora de los auditorios del siglo xix y de alguna
de las salas del siglo xx. Si a esta caja le agregamos las caractersticas de estilo
propias de la poca, como casetones, nichos, alto y bajo relieves, esculturas
y otros ornamentos de texturas difusoras, tenemos los elementos bsicos que
definen, por ejemplo, al Konzerthaus de Berln, inaugurado en 1821.
En la actualidad se ha retomado esta tipologa arquitectnica, hecho que
no debe sorprendernos. La orquesta sinfnica romntica pensemos en las
sinfonas de Brahms o de Tchaikovsky naci y se ajust en su interior. El
66

Figura 3. Konzerthaus de Berln

balance de sonoridades, traducido en cantidad de instrumentos por fila las


cuerdas, por ejemplo, incluyen alrededor de 16 primeros violines, 14 segundos
violines, 12 violas, 10 cellos y 8 contrabajos, es consecuencia de las condiciones acsticas particulares de esta clase de salas. Es razonable suponer que el
balance instrumental se conservar mejor en espacios similares a la caja de
zapatos original. Lo anterior no es vlido, por supuesto, para otros gneros y
estilos musicales.
A principios del siglo xx comenz una tendencia, que se mantendra
hasta nuestros das, que consiste en tratar de imitar la acstica de las salas
del siglo xix sin copiar su arquitectura. Los profundos cambios en el estilo
arquitectnico ocurridos durante los ltimos 100 aos, que comprenden tanto
la geometra como los materiales, dieron lugar a nuevas tipologas arquitectnicas entre las que se encuentran las salas con planta en abanico, las arenas y
los auditorios asimtricos.
Trabajos de Wallace Sabine
El estudio cientfico de la acstica de salas para msica naci con los trabajos
realizados por Wallace Clement Sabine (1868-1919) a fines del siglo xix. En
67

1895, Sabine, entonces un joven fsico de Harvard, fue comisionado para


corregir la acstica deficiente del saln de lectura del Fogg Art Museum.
Tras dos aos de estudio y experimentacin pudo mejorar considerablemente
la sala. En el ao 1900, a raz de este logro, fue contratado como consultor
acstico para la construccin de un nuevo music hall en la ciudad de Boston,
la primera sala en la que se aplicara desde el comienzo una teora acstica
cuantitativa. El diseo de Sabine fue un gran xito, y el Boston Symphony
Hall es considerado desde entonces como una de las mejores salas del mundo
para msica sinfnica.
Durante los aos de investigacin dedicados tanto al Fogg Art Museum
como al Boston Symphony Hall, y los que le siguieron en los Riverbank
Laboratories, Sabine pudo establecer la relacin que existe entre el tamao
del recinto, la cantidad de material absorbente y la calidad acstica del mismo.
Introdujo el concepto de tiempo de reverberacin, definido como el tiempo que
tarda el sonido en extinguirse al cesar la fuente acstica.4 El tiempo de reverberacin se constituy, a partir de ese momento, en el principal parmetro
a considerar en el proyecto de una sala para msica. Los trabajos de Sabine,
consolidados por el xito alcanzado con el Symphony Hall de Boston, dieron
inicio a una nueva era en el diseo cientfico aplicado a la arquitectura.
Modelo de Sabine
El modelo de Sabine establece que la calidad acstica de una sala para msica
depende de solo tres parmetros independientes: la sonoridad, el balance y la
reverberacin (Sabine, 1922). La sonoridad est relacionada directamente con
la cantidad de energa acstica puesta en juego en el sistema y depende de
la potencia de la fuente y de las caractersticas fsicas del recinto. El balance
involucra a un conjunto de condiciones temporales y espectrales que tienen
que ver con la preservacin del timbre de los sonidos. La mayor contribucin
de Sabine fue, sin duda, su teora de la reverberacin.
Segn la definicin clsica, el tiempo de reverberacin (tr) es el tiempo,
medido en segundos, que tarda el nivel de presin sonora en caer 60 dB a partir del momento en que cesa la fuente de seal. Sabine dedujo una frmula de
clculo a partir de una hiptesis estadstica que supone que la distancia media
entre reflexiones es de 4 V/S, expresin en la que V es el volumen cbico del
recinto y S la suma de sus superficies interiores. Aunque queda claro que no
todas las posibles geometras cumplen con esta condicin estadstica, s lo
4

En el apndice al final del captulo se transcriben las expresiones formales de este y de


otros conceptos citados.

68

hacen las salas estndar en las que ninguna dimensin supera ampliamente a
las otras dos. Por ejemplo, no se la puede aplicar a salas muy largas y angostas,
o con cielorrasos excesivamente bajos.
A partir de esta hiptesis estadstica Sabine defini el tiempo de reverberacin:
tr = 0,16 V/A

[s]

En esta expresin, V es el volumen cbico del recinto [m3] y A la absorcin


acstica total en sabinios mtricos [m2].5
Es comn describir el tr en funcin de la frecuencia (en bandas de octava
o de 1/3 de octava) considerndose el correspondiente a 1.000 Hz como el de
referencia cuando se consigna un solo valor.
El modelo de Sabine pareca cumplir con todas las condiciones deseables:
comprenda un marco terico consistente, suministraba las reglas de aplicacin prctica a la arquitectura y, como remate perfecto, exhiba el mejor de
los resultados posibles, el Boston Symphony Hall.
Durante la primera mitad del siglo xx se disearon gran cantidad de
salas partir del modelo de Sabine y se realizaron numerosos experimentos
psicoacsticos en los que se analizaron las respuestas de los oyentes frente a
los distintos valores posibles de reverberacin. Se obtuvieron tablas de correlacin cuyas variables por lo general comprendan el tiempo de reverberacin,
el volumen cbico de la sala, la absorcin acstica de los materiales y el estilo
de la msica involucrada. En un trabajo clsico de esa poca, Kuhl aconsejaba
los siguientes valores de tr en funcin del estilo musical (Kuhl, 1954):
Autor

tr

ptimo

Mozart

1,5 s

Brahms

1,8 s

Stravinsky

1,4 s

El trabajo del consultor acstico nunca fue tan sencillo: solo haba que
establecer el tipo de msica que se interpretara en la sala, seleccionar el tr
5

La anterior es la frmula de Sabine para calcular la reverberacin. Existen otras frmulas


diferentes, entre las que se destacan las de Eyring, Millington, Fitzroy y Poujoule.

69

ptimo de tablas como la de Kuhl y aplicar la frmula de Sabine al diseo


arquitectnico definitivo. El resultado, tal como aseguraban los textos de
poca, no debera diferir mucho del logrado por Sabine en Boston.
Crisis del modelo de Sabine
En la prctica, sin embargo, la situacin era diferente. A mediados del siglo
xx las salas nuevas, diseadas de acuerdo a la secuencia del prrafo anterior,
resultaban decididamente malas. Entre las escasas excepciones figura la
Philharmonie de Berln, acierto que no alcanzaba para compensar la secuencia de fracasos que ya se contaban por centenares.
Enfrentados con tal estado de cosas, las sospechas de los investigadores en
acstica se dirigieron a una de las hiptesis centrales del modelo de Sabine,
que postulaba la existencia de un decaimiento exponencial de la energa
acstica. En el modelo se supone un campo acstico perfectamente difuso,
en el que todas las direcciones de propagacin son igualmente probables. El
resultado temporal de esta difusin es un rgimen ideal de extincin exponencial como el que se aprecia en la figura 4, que se ve como una lnea recta
por el carcter logartmico del nivel de presin sonora (nps). Las salas reales,
sin embargo, no poseen semejante comportamiento. En la figura 5 se puede
apreciar el decaimiento de la energa en una sala real de baja difusin.
Los investigadores postularon entonces que los fracasos de aplicacin del
modelo de Sabine se deban a la divergencia entre los campos acsticos reales
y la condicin exponencial exigida por el modelo terico. Como el tiempo
de reverberacin se puede definir nicamente en un sistema con decaimiento
exponencial, se puso en evidencia que el tr no bastaba para describir completamente la situacin acstica de una sala real. La ausencia de otros parmetros

Figura 4. Decaimiento exponencial terico del nivel de presin sonora en una sala de alta
difusin

70

Figura 5. Medicin del nivel de presin sonora en una sala de difusin media

de descripcin complementarios explicara por qu muchas salas con valores


de tr ptimos se comportaban decididamente mal. A pesar de su innegable
utilidad, el tr no alcanzaba para describir por s solo la complejidad de un
campo acstico real.
Sin embargo, la frmula de Sabine permaneci, con ciertas modificaciones, como la base de la moderna ciencia acstica. Ms de sesenta aos
despus de los trabajos de Sabine, un texto sobre acstica arquitectnica de
1958 admita que la reverberacin era la nica cualidad acstica que poda
ser medida objetivamente. En las dcadas de 1950 y 1960 Leo Beranek intentara llevar la disciplina ms all de este lmite.
La catstrofe del Philharmonic Hall
La teora de Sabine tuvo su momento de inflexin con los trabajos de Leo
Beranek, desarrollados durante las dcadas de 1950 y 1960. Al ser comisionado para disear un nuevo auditorio para la ciudad de Nueva York, Beranek
analiz la acstica de 54 salas del mundo. Sus mediciones, encuestas y conclusiones se publicaron en un libro en el ao 1962 (Beranek, 1962), casi en
sincrona con la inauguracin de la nueva sala, el Philharmonic Hall en el
Lincoln Center de Nueva York. De acuerdo con Beranek, en el proceso de
diseo se haba aplicado el modelo de Sabine ampliado. Entre otros factores,
le asign especial importancia al retardo de la primera reflexin significativa
que llega a cada oyente.6
Ya en el concierto inaugural, en el otoo de 1962, los msicos y el pblico
se manifestaron decepcionados con la acstica. El crtico Harold Schonberg
6

Beranek lo llam itdg (initial time delay gap).

71

coment que la impresin general era que la sala sonaba como un gran
limn amarillo de 16 millones de dlares. George Szell, director estable de la
Orquesta de Cleveland, se mostr francamente desanimado. Los juicios ms
frecuentes hablaban de la falta de bajos, del sonido plano y de la dificultad de
ejecucin instrumental en el escenario. En la actualidad, Beranek admite que
el caso result una enorme humillacin profesional, pero que algo de responsabilidad les cabe a los arquitectos que modificaron el diseo original.7
Aunque la sala se redise en la dcada de 1980 a cargo de Cyril Harris
y hasta cambi su nombre original por el de Avery Fischer Hall, se la sigue
considerando insatisfactoria. En la actualidad existen nuevos proyectos de
modificacin.
Sin embargo, el Philharmonic Hall cumpla todos los requisitos exigidos
por la teora de Sabine. La crisis fue tan grande que hasta se habl de una
catstrofe de la acstica clsica. Sin embargo, el fracaso del auditorio no
fue infecundo: de su autopsia se obtendra nuevo y valioso conocimiento, al
brindar a otros acsticos la gran oportunidad de testear sus propias teoras para
explicar qu fue lo que estuvo mal.
Proliferacin de parmetros acsticos temporales
Los fracasos registrados en gran cantidad de auditorios a lo largo del siglo xx,
algunos de ellos resonantes como el caso del Philharmonic Hall, convencieron a un grupo de investigadores sobre la necesidad de revisar por completo
la teora de Sabine. A fines de la dcada de 1960 varios autores intentaron
corregir el modelo de Sabine incorporando nuevos parmetros temporales
complementarios. En la figura 6a se puede ver un esquema que representa la
energa acstica que le llega a un oyente desde una fuente acstica impulsiva
en el interior de una sala. La distancia entre emisor y receptor, la geometra
de la sala y las caractersticas acsticas de las superficies determinan el retardo,
la intensidad y la composicin espectral de cada reflexin. En el reflectograma
de la figura 6b se ve que la seal directa es la primera en llegar, luego aparecen
las seales que se han reflejado unas pocas veces en las superficies, y al final
llega una gran cantidad de reflexiones apenas separadas entre s. Solamente en
esta porcin tarda del reflectograma, en la que la cantidad y la distribucin
estadstica de las reflexiones permiten aproximar la curva a un decaimiento
exponencial, es posible definir un tiempo de reverberacin como el de Sabine.
El patrn total de reflexiones, sin embargo, es claramente no exponencial.
7

En la dcada de 1990 Beranek retom la investigacin en acstica y dise las salas del
Tokyo Opera City.

72

a)

b)

Figura 6. Esquema del patrn de reflexiones en una sala tpica y reflectograma en un sector
de la platea

La cantidad de informacin que contiene un reflectograma como el de la


figura 6 es muy grande.8
A partir de la respuesta al impulso se pueden definir otros parmetros
acsticos temporales. Un temprano informe de Atal, Schroeder y Sessler
estableci una correlacin significativa entre el tiempo de reverberacin
temprano (tomado en los primeros 160 ms) y la reverberacin subjetiva
que perciben los oyentes (Atal, Schroeder y Sessler, 1965). Tiempo despus
Jordan propuso la reverberacin temprana o edt tiempo que tarda la energa
en decaer los primeros 10 dB (Jordan, 1970). Se ha comprobado experimentalmente que el edt est mejor correlacionado que el tr con la reverberacin percibida por el pblico en una sala. Qu importancia tenan estos
hallazgos? El tr de Sabine no depende de la forma de la sala sino de ciertas
caractersticas generales como el volumen, la superficie total y la absorcin
8

La expresin detallada de la respuesta al impulso se puede ver en el apndice.

73

acstica promedio de las superficies. En teora pueden realizarse modificaciones en cualquier lugar de la sala con idnticos resultados. En cambio, la
reverberacin temprana (edt) es muy sensible a la variacin en las primeras
reflexiones que ocurren en la zona prxima a la fuente acstica. A partir del
edt el campo acstico de una sala para msica se polariz definitivamente y
la zona cercana a las fuentes adquiri entidad propia.
Una enumeracin de los parmetros acsticos temporales que se utilizan
en el diseo acstico contemporneo debera incluir el tiempo de reverberacin
(tr) (Sabine, 1922; Eyring, 1930); la reverberacin temprana (edt) (Atal,
Schroeder y Sessler, 1965; Jordan, 1970); el retardo de la primera reflexin
(Beranek, 1962); la funcin de crecimiento de la energa; la definicin (Thiele,
1953); la relacin seal /ruido (Lochner y Burger, 1961); la claridad a 80 ms
y a 50 ms (Reichardt, 1974); el centro de tiempo (Dietsch y Kraak, 1986); y
muchos otros que, aunque resultan tiles en diferentes contextos, poseen una
caracterstica comn: son monofnicos.9
Aparicin de los criterios espaciales
De a poco se fue instalando la hiptesis de que la distribucin espacial de la
energa resultaba tan importante como su comportamiento temporal. Algunos
investigadores, entre ellos Marshall, Barron, Blauert, Schroeder y Ando, crearon campos acsticos tridimensionales en laboratorios especializados con el
fin de resolver el problema de las grandes salas para msica.
La situacin se mantuvo relativamente estancada hasta el ao 1974, en
el que Manfred Schroeder public un trabajo que cambiara la concepcin y el
diseo de las salas de msica (Schroeder, Gottlob y Siebrasse, 1974). Schroeder
y su equipo describieron las preferencias perceptuales de un conjunto de oyentes ante un grupo de salas de concierto europeas, e intentaron correlacionarlas
con las caractersticas geomtricas y acsticas de cada una de las salas. Para
la evaluacin perceptual (subjetiva segn Schroeder) se utiliz un mtodo
complejo que involucr cuatro etapas: 1) se grabaron fragmentos musicales con
una orquesta sinfnica en una cmara anecoica; 2) se reprodujeron dichos fragmentos a travs de altavoces colocados en los escenarios de cada sala a evaluar;
3) se registraron las respuestas de la sala en diferentes locaciones a travs de dos
micrfonos uno por odo colocados en una cabeza artificial; 4) los registros
se reprodujeron con altavoces en una cmara anecoica de modo tal que cada
sujeto recibiera las mismas seales que la cabeza artificial en las salas.
9

La definicin formal de estos parmetros se muestra en el apndice al final de este


captulo.

74

Este mtodo permiti la casi instantnea comparacin entre la acstica


de dos salas diferentes o de dos butacas de la misma sala con la misma fuente
acstica y la misma pieza de msica. Los sujetos podan comparar las salas con
su memoria de corto trmino, cosa imposible de realizar con las salas reales.
Si se utiliza el mtodo de eleccin forzada entre dos alternativas, en el que el
oyente est obligado a elegir una sala de cada par que se le presenta, es posible
establecer un orden de preferencia perceptual. Es decir, se puede construir una
escala de calidad acstica comparativa.10
Los datos obtenidos fueron sometidos al anlisis de factores multidimensionales, y los resultados de las preferencias perceptuales (subjetivas
segn Schroeder) se correlacionaron con diferentes parmetros acsticos
fsicos (objetivos segn Schroeder). En la conclusin del estudio los autores
propusieron la utilizacin de un parmetro binaural no monofnico como
principal criterio para la evaluacin de las bondades acsticas de una sala. Este
parmetro, el coeficiente de correlacin cruzada interaural (iacc), cuantifica la
diferencia entre las seales que llegan a los dos odos del oyente y se relaciona
con la impresin espacial que este percibe.11 Schroeder propuso al iacc como
el parmetro ms destacado para la evaluacin de la calidad acstica de una
sala, aun por encima del tiempo de reverberacin clsico. A partir de ese
momento el tr dej de ocupar la posicin de privilegio que haba mantenido
desde los trabajos iniciales de Sabine.
El iacc da una medida de las diferencias entre las ondas que llegan a los
dos odos. Si estas son iguales toma el valor 1, y si las dos ondas son estadsticamente independientes vale 0. A partir del iacc, Leo Beranek (1996) defini
el factor de espacialidad (1iacc) que se emplea en la actualidad. Cuando un
oyente est inmerso en un campo acstico de alto factor de espacialidad se
siente rodeado por el sonido, y dicha sensacin de inmersin en un ambiente que incluye tanto a la fuente como a su entorno cercano es uno de los
factores ms apreciados a la hora de evaluar la calidad acstica de una sala
para msica.
A modo de ejemplo, en la figura 7 se pueden ver las respuestas al impulso
presentes a los odos derecho e izquierdo de un oyente situado en la segunda
bandeja de la Sala Ginastera del Teatro Argentino de La Plata.
10

Se pueden realizar varias crticas al mtodo, que soslaya el juego dinmico establecido
durante la ejecucin de msica en vivo al eliminar la sensibilidad de la fuente frente al
flujo de informacin proveniente del recinto. Sin embargo, su capacidad para enfrentar casi
simultneamente dos salas diferentes constituye un mrito imposible de negar.
11 La descripcin matemtica de este parmetro se encuentra en el apndice de este captulo.

75

Figura 7. Ecogramas simulados en computadora para la segunda bandeja de la Sala


Ginastera del Teatro Argentino de La Plata

El coeficiente de correlacin cruzada interaural, iacc, se puede extraer de los


ecogramas anteriores con facilidad, calculando la correlacin cruzada entre
ambas seales. En la figura 8 se puede ver la funcin de correlacin entre dos
seales genricas y el valor del iacc. El tiempo mximo de desajuste entre
las dos seales es de 1 ms, aproximadamente el tiempo que le lleva a una onda
lateral ir de un odo al otro.

Figura 8. Correlacin cruzada entre dos seales y definicin del iacc. En abscisas se indica
el tiempo de retardo de la seal entre ambos odos

76

El iacc da cuenta de las pequeas diferencias entre ambas seales. En el caso


de la figura 7, el iacc de la segunda bandeja del Teatro Argentino result de
0,26 y el factor de espacialidad (1iacc), de 0,74. Como referencia, el criterio
de Ando, Barron e Hidaka establece que el factor de espacialidad debe ser
mayor que 0,60 en una buena sala.12
No hay que confundir este verdadero parmetro espacial con la fraccin
lateral de energa (le) (Barron, 1971) que, aunque correlacionado con el
iacc, es un parmetro monofnico que compara la salida de un micrfono de
diagrama bidireccional (con lbulos en forma de 8) con la de un micrfono
omnidireccional (Ando et al., 1997).13
Desde la llegada de los criterios espaciales se incorporaron al diseo de
salas gran cantidad de elementos difusores de sonido entre los que se destacan los estocsticos y los basados en la teora de los residuos cuadrticos
(Schroeder, 1979 y 1980). En las salas construidas durante los siglos xviii y
xix la profusin de estatuas, columnas y adornos de gran tamao contribua al
establecimiento de campos acsticos difusos.
Aplicacin de los criterios espaciales
Las seales que llegan desde el plano medio (las diferencias interaurales de
tiempo t y de intensidad I son nulas) son las que generan mayores valores
de iacc y menores factores de espacialidad. Las salas simtricas con cielorrasos
planos, que suponen diferencias t y I 0 son, en consecuencia, las de peor
comportamiento en ese sentido. Sin embargo, aumentar el factor de espacialidad (1iacc) no significa simplemente correr la seal de un odo al otro.
Por ejemplo, si la seal llega antes y con mayor intensidad al odo derecho en
cuyo caso las diferencias interaurales de tiempo t y de intensidad I no son
nulas, no implica necesariamente que est decorrelacionada. Como el tiempo mximo de desajuste permitido entre las seales es de 1 ms, el iacc podra
tomar un valor cercano a 1.14 Es decir, si las dos seales son muy parecidas y
estn solo desfasadas el factor de espacialidad no aumenta necesariamente.
Sacar provecho de estos principios tericos no es sencillo. La aplicacin
prctica de los criterios acsticos espaciales se puede dividir para su estudio
en dos grupos: los que se basan en el diseo geomtrico del recinto y los que
parten de la eliminacin de las reflexiones especulares.
12

Los clculos se realizaron con los programas Matlab y Mathematica.


La descripcin matemtica de este parmetro se encuentra en el apndice de este
captulo.
14 A una onda acstica le lleva aproximadamente 1 ms viajar de un odo al otro.
13

77

Factor de espacialidad y geometra


Un cielorraso horizontal plano es un generador de reflexiones casi idnticas
para ambos odos. En la figura 9 se aprecia su efecto en dos lugares diferentes
de una platea de una sala genrica.
Por lo general, aquellas salas con cielorrasos planos, en los que el cielorraso provee gran cantidad de energa por reflexin, presentan un factor de
espacialidad reducido.
Una solucin muy sencilla, manteniendo grandes planos de reflexin
especular, es quebrar en dos o ms planos el cielorraso anterior. Por ejemplo,
si se construye algo as como una estructura a dos aguas, salvo en el caso
particular de la fuente y el oyente debajo del eje de simetra, el factor de espacialidad aumenta considerablemente con relacin al caso de la figura 9. En la
figura 10 se aprecian dos ejemplos de estas caractersticas.
Aunque en los ejemplos de la figura 10 las reflexiones son tambin especulares, la diferencia entre los recorridos de las seales que llegan a cada odo
provoca retardos mayores que 1 ms y se las oye como si estuvieran decorrelacionadas. El factor de espacialidad, en consecuencia, es mayor que en caso del
cielorraso horizontal de la figura 9.

Figura 9. Efecto acstico de un cielorraso plano sobre el iacc en platea

78

La orientacin relativa de las paredes, por otra parte, incide notablemente sobre el valor del factor de espacialidad. En la figura 11 las paredes paralelas
contribuyen significativamente al total de energa que le llega lateralmente
al espectador.
En cambio, en una sala con paredes que se abren hacia el fondo caracterstica de muchos auditorios y cines construidos en las dcadas de 1950 y
1960, las paredes no aportan energa lateral. El factor de espacialidad en esta
clase de salas es, de no mediar algn factor compensatorio, muy bajo.

Figura 10. Efecto acstico de cielorrasos planos a dos aguas

Figura 11. Energa lateral en una sala de paredes paralelas

79

Figura 12. Energa lateral en una sala con planta en forma de abanico

Reflexiones difusas
Otra posibilidad es suplantar las reflexiones especulares de gran intensidad generando, en su lugar, una profusin de reflexiones decorrelacionadas entre s.
Una superficie difusora es aquella que devuelve la energa incidente de
modo parejo en todas las direcciones posibles. En la figura 13 se puede ver la
diferencia entre la reflexin especular y la reflexin difusa.

Figura 13. Reflexin especular

Figura 14. Reflexin difusa

80

Una superficie difusora devuelve la energa en un abanico de direcciones


diferentes. En general, la modulacin volumtrica de una superficie difunde
las seales que posean longitudes de onda del orden de su tamao. Cuanto
ms grandes las irregularidades molduras, casetones, columnzas, esculturas,
altorrelieves, etc., ms baja ser la frecuencia a partir de la cual la superficie
comienza a comportarse como difusora.
Los estilos arquitectnicos de los siglos xviii y xix presentaban gran cantidad de elementos difusores. En contraste, durante gran parte del siglo xx prevalecieron las grandes superficies lisas. Al descubrirse la gran importancia de la
difusin espacial en la calidad acstica de una sala, los arquitectos reclamaron
el diseo de elementos difusores compatibles con las nuevas concepciones
estticas. Por ejemplo, las formas cilndricas de la figura 15 difunden aceptablemente las ondas acsticas.
En el ao 1979, Manfred Schroeder public un artculo en el que propona
el desarrollo de superficies difusoras de gran rendimiento. Basadas en secuencias
matemticas especficas (nmeros primos, residuos cuadrticos, etc.) permiten
un control detallado tanto de las caractersticas espaciales como del rango de
frecuencias tiles. En la figura 16 se puede ver la estructura de un difusor de
Schroeder.
La respuesta en frecuencia de esta clase de difusores se puede controlar en
la fase de diseo: la frecuencia de corte inferior, a partir de la que se muestran
efectivos, depende de la profundidad de las celdas. La frecuencia de corte superior, por su parte, es funcin del ancho de las celdas.
Respuestas espaciales desde la arquitectura
Como obtener, a partir del diseo arquitectnico, la cantidad de energa
lateral no correlacionada que proponen los trabajos de laboratorio? La arquitectura respondi a esta pregunta modulando tres factores que actan a escalas
diferentes: la geometra de las superficies que delimitan el espacio global, la

Figura 15. Comparacin entre una superficie plana y una cilndrica

81

Figura 16. Difusor de Schroeder basado en la teora de los residuos cuadrticos

disposicin de superficies reflectoras agregadas y la incorporacin de difusin


a determinadas superficies.
Modulacin de la forma de la sala
La cantidad de energa lateral que recibe cada espectador depende de
las caractersticas acsticas (absorcin y difusin) y geomtricas de cada
superficie lmite. Comparemos un auditorio de planta rectangular el
Musikverein de Viena con otro de planta en abanico el Aula Magna de
Caracas (figura 17).
La planta rectangular provee gran cantidad de energa lateral sobre la
platea, mientras que la planta en abanico dirige casi toda la energa hacia el
fondo de la sala. Pese a esta ventaja acstica de las salas de planta rectangular, la planta en abanico fue (y es) una de las ms empleadas. Los motivos
son de sencilla comprensin: permiten ubicar una cantidad mucho mayor de
espectadores.
Un buen ejemplo de forma no convencional con las paredes moduladas
para optimizar el factor de espacialidad se puede ver en la planta del auditorio
de Kirishima en Japn (figura 18), diseado por Yoichi Ando.
82

a)

b)

Figura 17. Musikverein de Viena (a) y Aula Magna de Caracas (b)

83

Figura 18. Planta del auditorio de Kirishima

Otro elemento geomtrico que se puede modificar con el fin de obtener


mayor cantidad de energa lateral es el cielorraso (figura 19). El auditorio de
Kirishima emplea planos de diferentes orientaciones a fin de obtener bajos
valores de iacc (Ando, 1998).
En otro caso, el del Tokyo Opera City Concert Hall, con diseo de Leo
Beranek, se apela al uso de un cielorraso a dos aguas de inclinacin extrema
(figura 20).
Incorporacin de superficies reflectoras
Una alternativa a lo anterior, til cuando la geometra lmite de la sala resulta inadecuada, es la instalacin de superficies reflectoras que redistribuyan
la energa temprana generando un aumento en el factor de espacialidad. Lo
habitual en estos casos es colocar reflectores individuales dirigidos estratgicamente. Las posibilidades de diseo son muchas. En las figuras 21 y 22 se
pueden apreciar dos ejemplos caractersticos. El primero es el Christchurch
Town Hall en Nueva Zelanda, que fue diseado en su origen por Harold
Marshall con los reflectores ya incorporados.

84

Figura 19. Cielorraso del auditorio de Kirishima

Figura 20. Tokyo Opera City Concert Hall

85

Figura 21. Reflectores que aportan energa lateral en el Christchurch Town Hall

Figura 22. Gran reflector sobre el escenario en el kkl de Lucerna

Un segundo ejemplo lo provee el kkl de Lucerna, que tambin fue concebido


desde el tablero de dibujo por Russell Johnson con el gran reflector que se ve
en la figura 22 sobre el escenario.
El tamao y la disposicin de los reflectores determinan el ancho de
banda de la energa reflejada. A causa del fenmeno de difraccin, solamente
86

las seales cuya longitud de onda resulte menor que el tamao del reflector
sern afectadas por este. En otros trminos, cada reflector acta como un filtro
pasaaltos cuya frecuencia de corte es funcin de su tamao. Es posible combinar varios reflectores pequeos en forma de red de difraccin para obtener
frecuencias de corte ms bajas que las que se consiguen con un nico reflector
de gran tamao.
Agregado de difusin
Se puede mejorar la cantidad de energa lateral y por lo tanto la sensacin de
especialidad perceptual agregando difusin a superficies que, de otro modo,
produciran reflexiones especulares puras y correlacionadas. Por ejemplo, es
posible mejorar notablemente una sala con planta en abanico colocando
elementos difusores en sus paredes laterales, tal como se puede apreciar en el
ejemplo de la figura 23.
Tambin es posible eliminar ciertas reflexiones especulares que agregan
excesiva energa en el plano medio del espectador colocando elementos difusores. En la figura 24 se pueden ver los difusores que eliminan las reflexiones del
cielorraso en la Beethovensaal de Bonn, diseada por Meyer y Kuttuff. Este tipo
de tratamiento, dirigido a aumentar la espacialidad del campo acstico, se inspira directamente en los trabajos alemanes sobre difusin de la dcada de 1970.
Como ejemplo extremo, en el Auditorium de Minneapolis se colocaron
grandes cubos de varios metros de lado en el cielorraso y en la pared del
fondo del escenario que actan como difusores de banda ancha.

Figura 23. Agregado de difusin a una sala en abanico

87

Figura 24. Agregado de difusin al cielorraso de la Beethovensaal de Bonn

En cuanto a la difusin de banda media, adems de los tpicos difusores calculados de acuerdo con la teora de residuos cuadrticos que se pueden ver en
la figura 25, se han implementado numerosos dispositivos de diseo ad hoc
como el difusor fractal que tapiza las paredes del kkl de Lucerna cuyo detalle
se muestra en la figura 26.15
Dos ejemplos clebres
Como conclusin de este captulo vamos a comparar dos auditorios para msica sinfnica muy diferentes que se destacan por su gran factor de espacialidad.
El primero es un exponente clsico de la arquitectura del siglo xix, el Grosser
Musikvereinsaal de Viena, diseado por Theophil Ritter von Hansen e inaugurado en 1870, que se puede ver en la figura 27.
Las paredes paralelas, la profusin de ornamentos de una amplia variedad
de tamaos, el cielorraso alto y de gran difusin, nos indican la presencia de un
gran factor de espacialidad. Lo anterior, unido a un tiempo de reverberacin
ptimo, ubica al Musikverein entre los tres mejores auditorios del mundo.
Sabine sigui este modelo, junto al del antiguo Gewandhaus de Leipzig, al
disear el Boston Symphony Hall.
El segundo ejemplo que vamos a presentar es la Philharmonie de Berln
(figura 28). Producto de la colaboracin entre Hans Scharoun y Lothar
Cremer, se inaugur en 1963 y es un claro ejemplo de la mejor arquitectura
de su tiempo.
15

Sobre fractales y difusores fractales, vase Basso (2005).

88

Figura 25. Difusores de Schroeder en el estudio de grabacin del Conservatorio Gilardo


Gilardi de La Plata

Figura 26. Difusores fractales en el kkl de Lucerna

89

Figura 27. Grosser Musikvereinsaal de Viena

Figura 28. Philharmonie de Berln

90

En este caso el gran factor de espacialidad se obtiene con elementos totalmente diferentes a los del Musikverein. La sala presenta una profusin de
pequeas paredes y frentes de bandejas, reflectores sobre el escenario y un
cielorraso de difusin de banda media que arman un campo acstico mucho
menos difuso y ms determinstico que el de su par en Viena, pero de similar
efectividad.
El desafo de la acstica actual consiste en obtener los campos acsticos
apreciados por los oyentes al margen de la forma y del estilo arquitectnico
propuesto en cada caso. Quiz en un futuro no muy lejano se disee primero el
campo acstico y, sobre l se monte la arquitectura que mejor se le adapte.

91

Apndice
Descripcin de los parmetros citados
Para facilitar la ulterior consulta a otras fuentes especializadas de informacin,
detallamos aqu la definicin de los parmetros acsticos mencionados en este
artculo.
Tiempo de reverberacin (tr)
Es el tiempo, en segundos, que tarda la energa acstica de una sala en caer a
-6
10 (-60 dB) del valor existente al interrumpirse la fuente de seal. El concepto fue desarrollado por W. Sabine a principios del siglo xx. Es comn describir
el tr en funcin de la frecuencia (en bandas de octava o de 1/3 de octava)
considerndose el correspondiente a 1.000 Hz como el de referencia cuando se
consigna un solo valor. La frmula de Sabine para calcular el tr es:
tr = 0,16 V/A

[s]

En esta expresin, V es el volumen cbico del recinto [m3] y A la absorcin


acstica total en sabinios mtricos [m2].
Reverberacin temprana (edt, Early Decay Time)
Es el tiempo, en segundos, que tarda la energa acstica de una sala en caer los
primeros -10 dB desde el valor existente al interrumpirse la fuente de seal,
multiplicado por 6 (Atal, Schroeder y Sessler, 1965; Jordan, 1970).
Retardo de la reflexin principal (itdg2)
Es el tiempo que transcurre entre la llegada del sonido directo y la reflexin
de mayor energa. Fue propuesto por Y. Ando en 1983 y se mide a travs de la
respuesta al impulso de la sala.
Respuesta al impulso
La respuesta al impulso obtenida en cada odo del oyente fi (t) y fd (t) es el
resultado de la convolucin entre la seal temporal emitida por la fuente
acstica pn (t) y las funciones de transferencia que tipifican el recorrido total
de ambas las seales con sus reflexiones gi (t) y gd (t):

92

fd (t) = pn (t) * gd (t)


fi (t) = pn (t) * gi (t)
Que al presentarse de manera discreta queda:

seal directa = A0 w 0 (t t 0 ) = (t)

gd, i (t) reflexiones = An w n (t t n )


respuesta al impulso de la cabeza = h (t)
d, i

f(d, i) (t) = pn (t) * An w n (t t n ) * hn (d, i) (t)


n= 0

Esta expresin es la base de casi todos los clculos que se emplean en el procesamiento digital de seales o dsp.
Funcin de autocorrelacin (())
Se define como la correlacin cruzada de la seal consigo misma. Resulta de
gran utilidad para encontrar patrones repetitivos dentro de una seal. Se la
define de acuerdo con la siguiente expresin:

()=Tlim

T
0

h(t) h(t + )dt

en la que h(t) es la funcin acstica temporal y h(t + ) una copia de h(t)


desplazada un tiempo .
Amplitud equivalente de las reflexiones (a)
Representa la razn entre la amplitud equivalente de la seal reflejada total y
la amplitud de la seal directa. Fue desarrollada por Y. Ando en 1983 y se la
define por medio de la siguiente expresin:

[
A=
[

0,05
0,05
0

]
h (t) dt]

h 2 (t) dt
2

1/ 2

1/ 2

en la que h(t) es la respuesta al impulso de la sala.


Se considera que la seal directa ocupa los primeros 50 ms de la seal
completa.
93

Fraccin lateral de energa (le)


Es un parmetro monofnico que compara la salida de un micrfono con diagrama en forma de 8 (h8 2(t)) con la de un micrfono omnidireccional (h 2(t)):

0,08 h 2 (t) dt

8
100%
LE = 0,005
0,08
2

0 h 0 (t) dt
Coeficiente de correlacin cruzada interaural (iacc)
Este parmetro es quiz el que mejor describe la difusin tridimensional de un
campo acstico. Se lo define por medio de la siguiente expresin:

d, i ( ) =

t0
0

t0
0

h d (t) h i (t + ) dt

h d (t) dt

t0
0

h i (t) dt

1/ 2

IACC = mximo d, i () para 1ms

en la que h(t)d es la respuesta al impulso en el odo derecho y h(t)i es la respuesta al impulso en el odo izquierdo.
Se considera un retardo mximo permitido de 1 ms porque ese es el
tiempo que le lleva a la seal acstica recorrer la distancia entre los dos
odos.
Funcin de crecimiento de la energa
Es simplemente la suma acumulativa de energa acstica a medida que transcurre el tiempo .

ERF ( )= 0 h 2 (t) dt

Definicin (Thiele, 1953)


Establece una relacin porcentual entre los primeros 50 ms de la seal y la
seal completa.
94

[
=
[

0,05

D50

h 2 (t) dt

h 2 (t) dt

] 100 %

Claridad a 80 ms y a 50 ms (Reichardt, 1974)


Es similar a la definicin D50, pero considerando la relacin entre los primeros
50 ms de la seal y el resto de la seal en decibeles. El tiempo de corte a 80 ms
se emplea para analizar seales musicales y el de 50 ms para palabras.

C 80

[
= 10log
[
[
= 10log
[

0,08
0

0,08

C50

0,05

0,05

]
h (t) dt ]
h (t) dt ]
h (t) dt ]
h 2 (t) dt

dB

dB

Relacin seal /ruido (Lochner y Burger, 1961)


Para evitar la gran sensibilidad en el entorno del tiempo de corte existente en
la claridad de Reichardt, la relacin S/R agrega una funcin de compensacin
lineal suave a (t).

[
S /R = 10log
[

0,095

a(t) h 2 (t) dt

0,095

1
a (t) =
(t 95)
60

h 2 (t) dt

[ dB ]

0 t 35ms
35ms t 95ms
t 95ms

Centro de tiempo (Dietsch y Kraak, 1986)


Es simplemente el baricentro temporal de la respuesta al impulso de la sala.

95

t c () =

t h 2 (t) dt

h 2 (t) dt

tc =lim
t c ()

Bibliografa
Ando, Y. (1983), Calculation of subjetive preference at each seat in a concert
hall, Journal of the Acoustical Society of America, vol. 74, pp. 873-887.
(1985), Concert Hall Acoustics, Berln, Springer-Verlag.
(1998), Architectural Acoustics. Blending Sound Sources, Sound Fields, and
Listeners, Nueva York, Springer-Verlag.
et al. (1997), Acoustic Design of a Concert Hall Applying the
Theory of Subjective Preference, and the Acoustic Measurement after
Construction, Acustica & Acta Acustica, 83, pp. 635-643.
Arau-Puchades, H. (1988), An Improved Reverberation Formula,
Acustica.
Atal, B., M. Schroeder y G. Sessler (1965), Paper G32, Proceedings of the Fifth
International Congress on Acoustics, Lige.
Barron, M. (1993), Auditurium Acoustics and Architectural Design, Londres,
e&fn.
Basso, G. (1994a), Escenarios para salas con bajo tiempo de reverberacin y escasa difusin: Mejora en el Coeficiente de Correlacin Cruzada Interaural, en
Actas del Primer Congreso Latinoamericano de Acstica, San Pablo.
(1994b), Difusin en escenarios de salas con bajo tiempo de reverberacin, en Actas de la Sptima Jornada Argentina de Acstica y Audio,
Buenos Aires.
(1996), Elementos de acstica de salas, Santa Fe, Universidad Nacional
del Litoral,
(1997), Relacin acstica entre instrumentos, tcnicas de ejecucin
y salas para msica en Actas de la XI Conferencia Anual de la Asociacin
Argentina de Musicologa, Crdoba,
(2002), Las salas como extensin acstica de los instrumentos musicales, en Actas del Encuentro Nacional 2002 de Investigacin en Artes y
Diseo, eniad 2002.
(2005), Orden generativo, fractales y msica, Revista del Instituto
Superior de Msica unl, N 10, Santa Fe.
(2006), Percepcin auditiva, Bernal, Editorial de la Universidad Nacional
de Quilmes.
Beranek, L. (1962), Music, Acoustics, and Architecture, Nueva York, Wiley.
96

(1996), Concert and Opera Halls: How they Sound, Nueva York,
Acoustical Society of America.
et al. (2000), Acoustical design of the opera house of the New National
Theatre, Tokyo, Japan, Journal of the Acoustical Society of America, 107
(1), pp. 355-367.
Blauert, J. (1997), Spatial Hearing. The psychophysics of human sound localization, Cambridge, mit Press.
Bregman, A. (1994), Auditory Scene Analysis, Cambridge, mit Press.
Chowning, J. (1999), Perceptual Fusion and Auditory Perspective, en
Cook, P. R. (ed.), Music, Cognition, and Computarized Sound, Cambridge,
mit Press.
Cox, J. T. y B. Shield (1999), Audience questionnaire survey of the acoustics
of the Royal Festival Hall, London, England, Acustica & Acta Acustica,
(85), pp. 547-559.
Eyring, C. F. (1930), Reverberation Time in Dead Rooms, Journal of the
Acoustical Society of America.
Fitzroy, D. (1959), Reverberation formulae which seems to be more accurate
with non-uniform distribution of absorption, Journal of the Acoustical
Society of America.
Haas, H. (1951), Uber den eingluss eines einfachechos auf die horsamkeit
von sprache, Acustica, vol. 1. [trad. al ingls, (1972), The influence of
a single echo on the audibility of speech, Journal of the Audio Engineering
Society, vol. 20].
Hidaka, T. et al. (1995), Interaural cross-correlation, lateral fraction, and
low and high frecuency sound levels as measures of acoustical quality
in concert halls, Journal of the Acoustical Society of America, 98 (2), pp.
988-1007.
Jordan, V. L. (1970), Acoustical criteria for auditoriums and their relation
to model techniques, Journal of the Acoustical Society of America, 47, pp.
408-412.
Kuhl, W. (1954), Uber Versuche zur ermitlung der Gunstigsten Nachhallaeit
Grossen Musikstudios, Acustica, 4, pp. 618-634.
Morimoto, M. et al, (1994), Relation between Auditory Source Width
in Various Sound Fields and Degree of Interaural Cross-Correlation:
Confirmation by Constant Method, Applied Acoustics, 42, pp. 233-238.
Sabine, Wallace (1922), Collected Papers on Acoustics, Cambridge, Harvard
University Press [reimpresin: Dover, 1964].
Schoroeder, M. (1979), Binaural dissimilarity and optimum ceilings for concert halls: More lateral sound diffusion, Journal of the Acoustical Society
of America, 65, pp. 958-963.
97

, D. Gottlob y F. Siebrasse (1974), Comparative study of European concert


halls: correlation of subjetive preference with geometric and acoustic parameters, Journal of the Acoustical Society of America, 56, pp. 1195-1201.
Wallach, H. et al. (1949), The Precedence Effect in Sound Localization,
American Journal of Psychology, vol. 57.

98

Captulo iii
Tcnicas de localizacin espacial de sonido con
altoparlantes usando indicios de intensidad y tiempo
Oscar Pablo Di Liscia

Introduccin
En los captulos i y ii de este libro se han tratado los indicios (i.e., los rasgos
distintivos de la seal acstica) que utiliza el sistema auditivo para evaluar sus
caractersticas espaciales.
En este captulo se tratarn diferentes tcnicas para la simulacin de los
indicios de intensidad y tiempo en seales acsticas para ser reproducidas con
sistemas de mltiples altoparlantes. Las tcnicas que se tratarn no son todas
las existentes, pero se ha intentado cubrir los aspectos ms bsicos y corrientemente utilizados.1
Las aplicaciones y/o dispositivos tecnolgicos que trabajan sobre la cualidad espacial del sonido intentan imitar lo mejor posible aquellos rasgos de
la realidad sonora que sirven mejor a sus propsitos. Pero dado que no necesariamente la imitacin perfecta de la realidad conduce al resultado perceptivo ms plausible, y que deben tenerse en cuenta cuestiones de eficiencia y
recursos involucrados, parece no existir una solucin tecnolgica perfecta. Sin
embargo, se puede afirmar que los numerosos desarrollos e investigaciones en
el tema han producido un considerable progreso en la efectividad perceptiva
de las tecnologas que actualmente se usan.
Las tcnicas de dsp (Digital Signal Processing o procesamiento de seal
digital) que se emplean en la espacializacin de sonido han sido y son
extensamente investigadas desde hace tiempo. El trabajo de John Chowning
(1971), quien es el primero en desarrollar un programa de computacin para
espacializacin de sonido, constituye una referencia inicial en esta rea.
Afortunadamente existe una gran cantidad de investigacin y desarrollo tec1

Algunas tcnicas, como Ambisonics, no se tratarn en este captulo, porque se desarrollan


in extenso en el captulo v de este libro. Otras, como las basadas en datos espectrales binaurales (hrtf), tampoco se tratarn por no ser apropiadas para la simulacin de localizacin
usando altoparlantes.

99

nolgico muy bien documentados sobre el tema (vanse Moore, 1983, 1989
y 1990; Chowning, 1971; Dodge, y Jerse, 1985; Kendall et al., 1989; Moorer,
1979; Karpen, 1998 y Cetta, 2007, entre otros) a la que el lector puede recurrir para ampliar lo que se expondr.

Tcnicas de espacializacin basadas en indicios de intensidad


Si se conocen la ubicacin espacial de una fuente sonora, sus caractersticas
direccionales y la ubicacin del/de los posible/s oyente/s, se puede calcular la
cantidad de energa acstica entregada por esta fuente sonora y simularla con
un sistema de sonido que tenga un nmero de canales y una ubicacin de sus
altoparlantes determinados.
Las tcnicas que se tratarn a continuacin intentan simular por medio
del escalamiento de la amplitud de la seal tres aspectos bsicos: 1) la ubicacin angular de la fuente; 2) la distancia entre oyente/s y fuente acstica; y 3)
las caractersticas direccionales (o directividad) de la fuente acstica.
Simulacin de la ubicacin angular en dos dimensiones
por medio del panormico de intensidad
Uno de los procedimientos ms difundidos para lograr la localizacin angular se denomina intensity panning (panormico de intensidad) y se basa en
la simulacin del indicio denominado iid2 a travs del escalamiento de la
amplitud de la seal que corresponde a cada canal de audio. Con esta estrategia
se pretende engaar al oyente intentando que crea que una fuente acstica
se encuentra en una ubicacin en la que en realidad no se encuentra, a causa
de la combinacin de la intensidad de las seales que emite cada altoparlante.
Por esta razn, se suele denominar fuente fantasma a la fuente sonora virtual
que crean los altoparlantes.
Para simular una fuente de sonido localizada en un ngulo determinado3
usando la tcnica de panormico de intensidad, la seal producida por la
fuente del sonido virtual debe ser distribuida entre pares de altoparlantes y
debe escalarse por dos valores de ganancia de manera proporcional a dicho
ngulo. La ley precisa que rige el clculo de dichos valores de ganancia todava
se sigue investigando, y hay autores (Pulkki, 2001) que piensan que no puede
2

Interaural Intensity Difference, o diferencia interaural de intensidad. Vase el captulo i de


este libro.
3 No estrictamente cualquier ngulo, dado que cada tcnica tiene sus limitaciones.

100

resolverse con una funcin simple. Algunas de las funciones ms utilizadas


para el panormico de intensidad son: la funcin lineal, la ley del seno y
la energa constante (tambin llamada ley de la tangente, o panormico de
coseno/seno).
Es sencillo conjeturar lo que la funcin lineal realiza. Calcula la ganancia de
cada uno de los dos canales de audio de acuerdo con un ngulo (expresado
en radianes) de la fuente virtual, usando las siguientes ecuaciones:

g1 = 1 - / M
g2 = / M

E. 1
E. 2

para M <= /2 y >=0.


La llamada ley del seno se basa en la siguiente ecuacin:

g1 - g 2 sin( s )
=
g1 + g 2 sin( 0 )

E. 3

en la que S es el ngulo de la fuente virtual y 0 es la mitad del ngulo


mximo de separacin de los altoparlantes. Por lo tanto:
g1 sin( 0 ) + sin(s )
=
g 2 sin( 0 ) sin(s)

E. 4

Los valores de ganancia para cada canal que surgen de la ecuacin anterior
deben ser normalizados para su uso prctico, ya que solo se establece la relacin entre ellos. Para ese propsito se usa la siguiente frmula:

g 1 + g 2 =1

E. 5

en la que es corriente que p tenga un valor de 1 (si se desea mantener la amplitud constante) o de 2 (si se desea mantener la energa constante).
Una de las maneras ms sencillas de realizar el llamado panormico de energa
constante se basa en la siguiente identidad trigonomtrica:

cos () + sin () = 1

E. 6

En este caso es fcil ver que, dado que la energa acstica equivale al cuadrado
101

de la amplitud, la suma de las ganancias de ambos canales elevada al cuadrado


ser siempre igual a la unidad, conservando as la energa total entregada constante para cualquier ngulo. Es decir:

g1 () + g2 () = 1

E. 7

Por lo tanto, si asumimos que tenemos dos altoparlantes en ngulos de 0 y


/2 radianes, la ganancia para cada canal deber ser calculada de la siguiente
manera:

g1 () = cos ()
E. 8

g2 () = sin ()
E. 9
en donde es el ngulo de posicin de la fuente virtual, en el rango de 0 y
/2 radianes.
Finalmente Chowning (1971) postula otra ley para el clculo de las ganancias
de cada canal:

g () =1
1

1 + tan( max /2)



2

g 2 () = 1 + tan( max /2)

E. 10
E. 11

en donde max es el ngulo mximo de separacin entre los parlantes.


En la figura 1 pueden observarse cuatro grficos de la evolucin de los valores
de ganancia para dos canales que corresponderan respectivamente a un altoparlante situado a 45 (derecha, canal 2) y a otro situado a 135 (izquierda,
canal 1) para un ngulo que vara entre 45 y 135. Se asume que el oyente
est situado en el origen, enfrentndolos. Los otros dos canales muestran, respectivamente, la energa total entregada (g12+g22) y la amplitud total (g1+g2)
desplegada por el par de altoparlantes. Los grficos corresponden a cada una
de las funciones explicadas:
Existen muchos trabajos sobre evaluacin de la efectividad perceptiva en
la localizacin espacial de estas y otras tcnicas. En general, se puede decir que
siguen tres estrategias: 1) anlisis de la realidad fsica, modelizacin matemtica
y posterior anlisis de su correspondencia con los procedimientos (West, 1998;
Bamford, 1995); 2) implementacin de un modelo virtual de oyente mediante
la simulacin de indicios auditivos espaciales muy robustos, al que luego se alimenta con las seales resultantes de cada tcnica. La posterior evaluacin de la
respuesta de este sistema tiene las ventajas de que las seales no estn contami102

g(ch1)
g(ch2)
g(ch1)2
+ g(ch2)2
g(ch1)
+ g(ch2)2

0
1
0
1
0
1
0

Lineal

Ley del seno (con p=1)

Energa constante

Chowning, 1971

Figura 1

nadas por las impresiones subjetivas de cada oyente y de que permite la experimentacin extensiva sin grandes costos e infraestructura (Pulkki, 1999); y 3) test
perceptivos realizados con oyentes (Guastavino et al., 2007; West, 1998).
Una de las debilidades de la tcnica de panormico de intensidad
mediante pares de altoparlantes es la falta de homogeneidad de la imagen
sonora que produce. En efecto, cuando la fuente virtual se ubica en el mismo
ngulo que un altoparlante, se obtiene una imagen sonora puntual y precisa,
dado que la energa sonora irradia solo de este altoparlante. Por otro lado,
cuando la fuente sonora virtual se ubica entre dos altoparlantes, la imagen
sonora es difusa, porque se produce por la suma de las seales que emiten. Las
tcnicas que usan siempre todos los altoparlantes de un sistema4 poseen una
mayor homogeneidad en este sentido. Desde ya, es obvio que este problema
disminuye en la medida en que se usan ms altoparlantes.
Otra de las debilidades del panormico de intensidad, que es comn a
todas las tcnicas, es la que se deriva del efecto de precedencia.5 A causa de este
efecto, en la medida en que el/los oyente/s estn alejados del punto ideal de
audicin tienden a atribuir la ubicacin de la fuente virtual al altoparlante
ms cercano. La decorrelacin de las seales de los diferentes altoparlantes
de un sistema mediante filtros todopaso (alpass) con distribucin aleatoria de
las fases en varias bandas de frecuencia ayuda a sobrellevar este incoveniente
(Kendall, 1995).
Simulacin de la distancia mediante indicios de intensidad
Las tcnicas de panormico de intensidad no tienen en cuenta la distancia
de la fuente al oyente.6 La distancia entre fuente virtual y oyente/s se puede
4

Por ejemplo, Ambisonics. Vase el captulo v de este libro dedicado a esta tcnica.
Vase el captulo i de este libro.
6 En efecto, son tcnicas de localizacin angular.
5

103

simular sencillamente escalando la amplitud de la seal de la fuente virtual de


manera proporcional a la distancia entre esta y el/los oyentes.7 Para tener en
cuenta la distancia, las ganancias de cada canal de audio en un sistema estreo
pueden calcularse de acuerdo con las siguientes ecuaciones:

Ch1 = g1 () / (distancia + offset)


Ch2 = g2 () / (distancia + offset)

E. 12
E. 13

El trmino offset es necesario para prevenir los casos en que la distancia es


menor a la unidad (especialmente cuando es cero).
Investigaciones psicoacsticas (Stevens, 1970) han mostrado que la
simulacin de los indicios de distancia es ms efectiva si se usa un escalamiento diferente. Siendo este el caso, un exponente de escalamiento puede ser usado
para elevar el factor de distancia a una potencia mayor que uno, produciendo
as una funcin de amplitud ms pronunciada (exagerada) en la medida en
que la fuente se acerca o aleja del oyente:

factor de distancia = (distanciaexponente) + offset

E. 14

Por lo tanto, la ganancia para cada altoparlante, teniendo en cuenta tanto el


ngulo que forma la fuente como su distancia al oyente, debera ser calculada
de la manera siguiente:

Ch1 = g1 () / factor de distancia


Ch2 = g2 () / factor de distancia

E. 15
E. 16

Es posible extender el uso de los procedimientos explicados a sistemas de


altoparlantes ubicados en ngulos diversos del plano horizontal. Si bien son
posibles varias configuraciones, es corriente elegir aquellas que ubican los
altoparlantes a ngulos iguales y en puntos equidistantes del origen. Una
configuracin tpica muy usada es la llamada cuadrafona, que consiste
en cuatro altoparlantes separados por ngulos de noventa grados (vase la
figura 2).
7

Por supuesto, existen otras tcnicas para simular la distancia entre fuente y oyente/s. Entre
ellas, la utilizacin de filtros para imitar la absorcin de la humedad y el efecto de proximidad. Adems, en recintos cerrados, la proporcin entre reverberacin densa y seal directa
es un indicio muy robusto para la estimacin de distancia. Tales recursos no sern tratados,
dado que exceden los objetivos de este captulo. Vase al respecto: Cetta (2007), Di Liscia
(2004, cap. 9), Moore (1990, cap. 4) y Moorer (1979).

104

Dist =
amp=
cos( -45) / Dist

x*x + y*y

amp=
sin( -45) / Dist

(amp= 0)

Figura 2

Por ejemplo, el procedimiento de escalamiento de intensidad en dos dimensiones de acuerdo con la distancia y el ngulo horizontal, trasladado a cuatro
altoparlantes, consistira en los siguientes pasos: a) determinar la distancia
entre la fuente y el oyente (generalmente se asume, por razones de simplicidad, que este est situado en el origen), y escalar la amplitud de la seal de
entrada de acuerdo con la distancia; b) determinar el ngulo entre la fuente
y el oyente (se asume, por razones de simplicidad, que este est situado en el
origen); c) determinar entre qu par de altoparlantes se encuentra ubicada la
fuente; d) escalar la amplitud del par de altoparlantes entre los que se encuentra la fuente virtual de acuerdo con la tcnica de intensity panning ya explicada,
usando alguna de las funciones que se han comentado anteriormente (lineal,
ley del seno, ley de la tangente, etc.) y poniendo especial cuidado en mantener el rango adecuado de los ngulos para cada caso; y e) poner en cero la
amplitud de los restantes altoparlantes.
La figura 2 clarifica lo antedicho tomando como base un espacio bidimensional y una disposicin de cuatro altoparlantes en un cuadrado con
ngulos de 45, 135, 225 y 315, y usando el panormico de coseno/seno
(energa constante):
La figura 2 tambin ilustra el clculo de amplitud para la simulacin de una
fuente sonora ubicada al frente, entre los altoparlantes i y ii (ms cerca de i, a la
derecha), simbolizada con un crculo sombreado. Puede verse cmo la ganancia
105

de la seal para los altoparlantes i y ii se calcula de acuerdo con el ngulo entre


la fuente y el oyente (), y la distancia entre la fuente y el oyente (D).8 Por otro
lado, los altoparlantes iii y iv tienen ganancia cero para el directo en este caso.
Simulacin de la ubicacin angular en tres dimensiones
por medio del panormico de intensidad
La extensin de la tcnica del panormico de intensidad a sistemas de altoparlantes ubicados en planos diferentes que el horizontal es perfectamente
posible. Por ejemplo, un sistema de ocho altoparlantes distribuidos uniformemente en tres dimensiones consistira en ubicar a cada uno de ellos en los
vrtices de un cubo imaginario. En este caso, habra que considerar cuartetos de altoparlantes (en los vrtices de cada una de las caras del cubo),
determinar entre qu cuatro parlantes se encuentra la fuente sonora virtual,
y aplicar las tcnicas vistas en la seccin anterior para escalar la ganancia de
estos. La simulacin de la distancia se realiza de la misma forma ya explicada
en la seccin anterior.
Otra posibilidad es la tcnica llamada panormico de amplitud basado en
vectores (Pulkki, 2001), que corrientemente se designa con la sigla vbap.9 Esta
tcnica se puede usar tambin en arreglos bidimensionales de altoparlantes,
y su ventaja principal es que puede aplicarse con facilidad a disposiciones
irregulares de estos. Si se usa para disposiciones de altoparlantes en un solo
plano (bidimensionales), equivale a la aplicacin de la tcnica de panormico
de energa constante ya explicada.
En tres dimensiones, vbap usa ternas de altoparlantes para distribuir la
seal a espacializar. Por supuesto, la fuente virtual solo puede ser ubicada en
el denominado tringulo activo, que no es otra cosa que el tringulo esfrico
imaginario en cuyos vrtices se ubican los altoparlantes del sistema. La figura
3 (basada en Pulkki, 2001) ilustra lo antedicho. En ella se pueden ver tres
altoparlantes (designados m, n y k) ubicados en los vrtices de un tringulo
esfrico, que es el que se denomina tringulo activo (marcado con lneas punteadas). La fuente virtual se ubicara en un punto de ese tringulo.
vbap trabaja con cuatro vectores-unidad cartesianos en tres dimensiones. Tres de ellos apuntan a la direccin de cada uno de los altoparlantes
en tres dimensiones (ln, lm y lk , en la figura 3). La direccin de la fuente
8

Para simplificar, los ngulos se indican en grados. Dada la ubicacin de los altoparlantes,
es necesario restarle al ngulo de ubicacin de la fuente 45 para que est en el rango de 0
a 90(0 a /2 radianes).
9 Del ingls Vector Based Amplitude Panning.

106

Altoparlante k

Fuente
virtual

Altoparlante n

Altoparlante m
Oyente

Figura 3

virtual se define con un cuarto vector-unidad cartesiano (designado como p


en la figura 3). La direccin del panormico de la fuente virtual surge de la
combinacin lineal de los tres vectores correspondientes a los altoparlantes.
Presentado en forma matricial:

p = gnln + gmlm + gklk

E. 17

pT = g Lnmk.

E. 18

en donde gn, gm y gk son los factores de ganancia para cada altoparlante, g = [gn
gm gk] y Lnmk = [ln lm lk] T.
El vector g se puede resolver de la siguiente manera:

g = pT L-1nmk

g = [ pn

pm

l nx

pk ] l mx
l kx

l ny
l my
l ky

1
l nz

l mz

l kz

E. 19
107

Los valores del vector g deben normalizarse antes poder ser usados, esto se
realiza multiplicando cada uno de ellos por un escalar e, tal que:
e

1
2
n

g + g k2 + g m2

E. 20

Por ejemplo, tmese una configuracin de tres altoparlantes y fuente virtual


que se ilustra en la figura 3 y supngase que su ubicacin en coordenadas
esfricas expresadas en grados es la siguiente:
Altoparlantes
y fuente virtual

ngulo horizontal

ngulo de elevacin

ln

45

lk

90

45

lm

135

p (fuente virtual)

90

20

La matriz Lnkm = [ln lk lm] T expresada en coordenadas cartesianas es:


Altoparlantes

Coordenada x

Coordenada y

Coordenada z

ln

0,707107

0,707107

lk

0,707107

0,707107

lm

-0,707107

0,707107

El vector pT(direccin de la fuente virtual), expresado en coordenadas cartesianas es:



Fuente virtual

Coordenada x

Coordenada y

Coordenada z

pT

0,939693

0,34202

La matriz inversa de [ln lk lm] T, o sea L-1nkm, es:


108

0,707107

-0,707107

0,707107

0,707107

-0,707107

1,414214

-0,707107

Y la multiplicacin del vector pT y la matriz inversa L-1nkm da como resultado


el vector g, que contiene las ganancias para cada uno de los altoparlantes:
gn

gk

gm

Valores crudos

0,422618

0,48369

0,422618

Valores normalizados

0,549658

0,629088

0,549658

Al normalizar los valores de ganancia de acuerdo con la ecuacin 20, se


cumple que:

0, 49658 2 + 0,629088 2 + 0, 549658 2 1

Cuando la tcnica vbap se usa en un arreglo de muchos altoparlantes, cada


uno de ellos es tomado como un punto o nodo de una red. Se somete luego
esta red a un algoritmo de triangulacin10 para determinar ternas de altoparlantes de una manera eficiente y, de acuerdo con la posicin de la fuente
virtual, se aplica el procedimiento ya explicado para escalar la ganancia de
los altoparlantes que forman el tringulo activo en el que se encuentra. Por
ejemplo, la imagen que sigue muestra una aproximacin a una esfera en tres
dimensiones a partir de una red (o malla) tridimensional de 144 nodos (puntos espaciales).11 La fuente virtual se ubicara en algn punto de esta esfera
terica formada por altoparlantes y dentro de la que estaran ubicados los
oyentes. Si se asume que en cada nodo hay un altoparlante, entonces se puede
considerar la aplicacin de vbap a las ternas de altoparlantes que surgen de la
triangulacin de la red. La figura 4 marca con tres puntos negros uno de los
tringulos activos (en blanco) posibles.12
10

Los mtodos de triangulacin son intensamente investigados en la geometra analtica


y las ciencias de la computacin. Segn el autor de la tcnica vbap (Pulkki, 2001), en su
implementacin se usa el mtodo de triangulacin denominado greedy triangulation.
11 Lgicamente, solo una parte de estos es visible en la imagen.
12 Rigurosamente hablando, el tringulo que se ve en la figura sera una aproximacin al
tringulo esfrico que se denomina tringulo activo.

109

Figura 4

Con el objeto de superar la no uniformidad de imagen que conllevan las


tcnicas de panormico de intensidad que usan grupos (pares o ternas) de
altoparlantes, el autor de vbap desarroll tambin un procedimiento que
permite distribuir una parte de la seal en los dems altoparlantes del sistema,
independientemente de si forman o no el tringulo activo. Esta porcin de
seal es controlada por un coeficiente de dispersin que el usuario puede graduar
(Pulkki, 2001).
Simulacin de la directividad de la fuente acstica mediante indicios
de intensidad
La directividad de una fuente acstica es la forma en la que emite o irradia
energa acstica en funcin de su orientacin. El patrn de emisin de energa
acstica de una fuente involucra tanto a la amplitud de la seal acstica que
emite como a su espectro.13 En este captulo solo trataremos las tcnicas para
simular la amplitud de la directividad de las fuentes acsticas.
Para tener en cuenta la amplitud de la directividad de la fuente acstica
en dos dimensiones, y para dos canales de audio, deben usarse las siguientes
ecuaciones:


13

Ch1= |r(,)| g1() / factor de distancia


Ch2= |r(,)| g2() / factor de distancia

E. 21
E. 22

Para mayores detalles sobre la percepcin de la directividad de las fuentes acsticas, vase
el captulo i de este libro.

110

en donde r(,) es la magnitud de un vector de radiacin en la direccin de


una fuente acstica con orientacin .
A pesar de que la emisin de energa acstica de las fuentes acsticas
reales posee patrones muy complicados, puede aproximarse a travs de diseos
esquemticos expresados mediante ecuaciones. Por ejemplo, un patrn muy
conocido y usado, tanto en audio como en acstica, es el denominado cardioide, junto con sus derivaciones en hipercardioide. F. R. Moore, en su programa
Space (Moore, 1983, 1989), propone modelar en dos dimensiones la radiacin
hipercardioide de una fuente acstica a partir de la siguiente ecuacin:

(back 1)| |
r (,) = 1+

E. 23

en la que r(,) es la magnitud de la radiacin hacia la direccin de una


fuente acstica que apunta hacia , y back es el monto de radiacin en el
sentido opuesto de . Si se asigna valor cero a back, se producir un patrn de
radiacin hipercardioide, mientras que si se le asigna el valor de uno, se producir un patrn de radiacin omnidireccional. La figura 5 ilustra el pasaje de un
patrn de radiacin omnidireccional hacia un patrn de radiacin hipercardioide
a travs de la ecuacin 23 usando cinco valores para back: 1; 0,75; 0,5; 0,25 y
0. La fuente de sonido est ubicada en el origen del plano cartesiano y apunta
hacia la derecha, pero esto ltimo se puede evidenciar slo en la medida en
que su patrn de radiacin se hace direccional.
La ecuacin 23 puede usarse para calcular el monto de energa irradiada
por una fuente direccional en la direccin de un oyente o receptor hipottico. En la figura 6 se puede ver un receptor situado a 90 (simbolizado con el
pequeo crculo blanco) y una fuente de sonido direccional (back = 0 en la

Back= 1

Back= 0.75

Back= 0.5

Back= 0.25

Back= 0

Figura 5

111

= 0, = 90

= 90, = 90

= 270, = 90

Figura 6

ecuacin 23) que cambia su orientacin en tres direcciones: 0 (apuntando


hacia la derecha), 90 (apuntando hacia delante) y 270 (apuntando
hacia atrs). La lnea de puntos marca la direccin de la radiacin a calcular.
La flecha seala el vector cuya magnitud se puede usar para escalar la ganancia
en la simulacin de la directividad de una fuente sonora mediante la ecuacin
23. En los dos ltimos casos, la magnitud del vector es 1 y 0 respectivamente,
correspondiendo respectivamente a la direccin de la fuente coincidente con
la del oyente y con la direccin contraria.
La aplicacin de la frmula anterior con un valor de back = 0 en la configuracin de la izquierda ( = 0, = 90, = 180)14 de la figura 6 produce:
(back 1)| |
r (,) = 1+

(back 1)| 90|


r(90) = 1+

(1) 90| 2
r(90) = 1+


r(90) = [1+ (90 /180)]
r(90) = [1 0,5]

14

r(90) = 0,25

Por razones de simplicidad, los ngulos se indican en grados.

112

Para calcular la radiacin en tres dimensiones es necesario tener en cuenta


tanto el ngulo horizontal (azimut) como el ngulo de elevacin de la direccin de la radiacin. En algunos casos, resulta til representar la direccionalidad de las fuentes acsticas con el modelo de cuerpos rgidos, a travs de
ecuaciones que expresen las coordenadas cartesianas de los puntos que constituyen su superficie. Por ejemplo, si se construye una variante arbitraria en
tres dimensiones15 de un patrn cardioide, sus coordenadas cartesianas surgen
de las siguientes ecuaciones:
x = cos()cos()
y = sin()cos()
z = sin( c)

E. 24

/2 /2
c 0,5

E. 25
E. 26

en las que y son respectivamente los ngulos de azimut y de elevacin que


permiten el clculo de las coordenadas cartesianas. Las ecuaciones dan como
resultado un patrn de radiacin cuyo centro se encuentra en el origen del
plano cartesiano y cuyo vrtice est orientado hacia la derecha (x positivo).
Se ilustra en la figura 7.

Figura 7
15

El patrn cardioide en dos dimensiones ya analizado se puede proyectar a tres dimensiones simplemente rotando la forma en dos dimensiones alrededor del eje x. Aqu se usa
deliberadamente una variacin arbitraria de este slo como ejemplo de otra posibilidad.

113

Para calcular la amplitud de la radiacin de una fuente acstica imaginaria con


las propiedades de directividad que surgen de esas ecuaciones, simplemente
basta con calcular la magnitud del vector que surge desde su centro (en este
caso, el origen) hasta un punto de su superficie indicado por los dos ngulos del
vector (azimut y elevacin). Esto se hace muy sencillamente, ya que:

r(,) =

x 2 + y2 + z 2

E. 27

y conocemos los valores de x (ecuacin 24), y (ecuacin 25) y z (ecuacin 26).


Si la fuente cambia de posicin (i.e., se traslada) o de orientacin (i.e.,
rota), su nueva posicin se obtiene sumndole un vector de traslacin a las
coordenadas cartesianas del centro de la fuente, y la nueva orientacin se
obtiene multiplicando las coordenadas cartesianas de la fuente por una matriz
de rotacin.
Otro ejemplo de implementacin anlogo al anterior lo constituye el
sistema DirectX,16 en el que se imita la directividad de las fuentes de sonido
usando el modelo geomtrico del cono (Bargen y Donnelly, 1998).
En los casos que tratamos, las propiedades de radiacin se calculan con ecuaciones, pero si se desea representar y calcular muy variados patrones de radiacin, aun arbitrarios (i.e., no correspondientes con el patrn de radiacin de
ninguna fuente sonora real) y absolutamente asimtricos, se podran definir
las propiedades de directividad de una fuente acstica a travs de una serie de
puntos en un espacio tridimensional (una red o malla). Esto sera como muestrear un cuerpo rgido. Los valores de las coordenadas cartesianas normalizados
representaran la magnitud de la radiacin en la direccin de cada uno de los
puntos que definen. Los valores intermedios se podran aproximar por medio
de algn tipo de interpolacin. Tal estrategia tendra la ventaja de adaptarse
al uso de archivos digitales de cuerpos rgidos en tres dimensiones de formato
estndar que, adems, se pueden representar y procesar visualmente con facilidad usando los programas adecuados.17
Otra posibilidad sera el modelado de la directividad de la fuente acstica
a travs de ecuaciones esfricas. Aqu se consideraran el ngulo horizontal
y el de elevacin, y el usuario podra prever una funcin de atenuacin para
cada uno de ellos. Si tales funciones retornaran la unidad, el resultado sera
16

DirectX es una api (Advanced Programming Interface) para multimedia del sistema operativo MS Windows.
17 Por ejemplo, los archivos obj de Alias Wavefront que, en su forma ms simple, definen
objetos grficos a travs de vrtices indicados en coordenadas cartesianas y superficies que
se forman a travs de la triangulacin de los vrtices.

114

una esfera (radiacin omnidireccional). Valores cambiantes de acuerdo con


los ngulos podran representar muy diversos patrones de directividad; este es
el enfoque que usa el entorno SoundScape (Wozniewski et al., 2007).
Finalmente se mencionar la posibilidad del cambio gradual de las caractersticas de directividad de una fuente acstica. Si se cambia gradualmente el
parmetro back en la ecuacin 23, por ejemplo, se puede lograr el paso gradual
de una fuente omnidireccional a una fuente hipercardiode.18

Tcnicas de espacializacin basadas en indicios de tiempo


El sonido se transmite a una velocidad constante que depende de la densidad
del medio. En trminos sencillos, el tiempo t que le toma al frente de onda de
una seal acstica alcanzar un determinado punto a distancia d de la fuente
que la emite se calcula de acuerdo con la siguiente expresin:

t = d / c
E. 28

en la que c es la velocidad de propagacin del sonido.
Dada una fuente de sonido, es posible calcular su distancia respecto de
un determinado punto y simular su tiempo de arribo por medio de lneas de
retardo. Hay varias estrategias de implementacin de estos datos que dan
lugar a diferentes indicios que pueden combinarse o no.
La distancia que existe entre dos puntos espaciales determinados por
medio de coordenadas cartesianas en tres dimensiones se calcula de acuerdo
con la siguiente ecuacin:
D (x a , y a , z a , x b , y b , z b ) =

(x a - x b )2 + (y a - y b )2 + (z a - z b )2 E. 29

en la que D es la distancia, xa, ya, y za son las coordenadas cartesianas que


definen la posicin del primer punto, y xb, yb, y zb son las coordenadas cartesianas que definen la posicin del segundo punto.

Se suelen usar los datos que surgen de las dos ecuaciones anteriores (28 y 29)
para simular: 1) el tiempo de arribo del frente de onda a un solo punto global
18

El efecto en el oyente, sin embargo, ser el de un cambio de intensidad, a menos que se


simulen los ecos de un recinto teniendo en cuenta la directividad de la fuente acstica y/o se
usen otros indicios espectrales. Vase la seccin Simulacin de las caractersticas de recintos
mediante indicios de intensidad y tiempo (p. 117 de este captulo).

115

en el que se asume que est el/los oyente/s (Chowning, 1971); 2) el tiempo


de arribo del frente de onda a cada uno de los odos de un oyente, denominado tambin simulacin de itd; y 3) el tiempo de arribo del frente de onda a
cada uno de los altoparlantes que se ubicarn en puntos determinados de un
recinto para simular una determinada situacin de audicin. Este ltimo caso
se corresponde con el modelo realizado por F. R. Moore (1989 y 1983) en su
unidad de espacializacin Space.
La ecuacin 29 puede ser usada para calcular la distancia entre la fuente
virtual y el oyente, y la ecuacin 28 para calcular el retardo que debe efectuarse en la seal a los efectos de simular el indicio temporal de distancia. En
general, muchas implementaciones asumen que el oyente est situado en el
origen (x = y = z = 0), por lo que la distancia entre este y la fuente de sonido
se calcula de forma mucho ms sencilla:

D =

x 2 + y2 + z 2

E. 30

Cuando la fuente de sonido cambia de ubicacin, la distancia y el retardo


deben ser recalculados. Dado que la trayectoria debe generar valores discretos,
en general se realiza este clculo muestra por muestra y se usa algn mtodo
de interpolacin (usualmente interpolacin lineal) para calcular los valores
intermedios de retardo. Asimismo, el hecho de que la fuente est en movimiento produce (salvo en el caso en que la fuente se mueve con velocidad
uniforme en un crculo en cuyo centro se encuentra el oyente) diferencias de
velocidad relativa entre el oyente y la fuente y, por consiguiente, da lugar a un
cambio de frecuencia en la seal conocido como efecto Doppler.
En audio digital, para simular todos los efectos de retraso de una seal, se
usan las llamadas lneas de retardo.19 La forma ms eficiente de implementarlas
usa la tcnica que se denomina de buffer circular.
La tcnica de buffer circular consiste en ir almacenando la seal de entrada
de a bloques en una regin de memoria (buffer) con un tamao determinado.
Cada muestra de la seal de entrada se almacena en una ubicacin sucesiva
del buffer y, por medio de una variable-contador, se chequea la cantidad de
muestras entrantes. Cuando el contador llega a ser igual al tamao mximo
del buffer, se lo pone en cero nuevamente y las muestras subsiguientes vuelven
a ser ubicadas sucesivamente desde el comienzo del buffer. Ya que la seal se
va escribiendo en el buffer circular, se puede leer en l la muestra necesaria retrasada por el tiempo que se necesite, pero hay que tomar la precaucin
de que el retardo no supere el tamao del buffer. Ms aun, se puede utilizar
19

Delay lines, en ingls.

116

el mismo buffer para leer la seal almacenada en l con diferentes retardos,


provistos del hecho ya mencionado de que estos no superen su longitud (vase
Moore, 1990, cap. iv).
La itd (diferencia interaural de tiempo) es un indicio que se produce por
el diferente tiempo de arribo de la seal acstica a los odos del oyente cuando
la fuente de sonido se encuentra en una ubicacin diferente del plano medio
(vase el captulo i de este libro).
Tomando como base la medida de la distancia de un odo a otro en una
cabeza promedio (aproximadamente 20 cm) es muy sencillo calcular el
tiempo de arribo a cada odo de la seal acstica de acuerdo con su ngulo de
posicin. Se trata solo de aplicar la ecuacin 29 a dos puntos situados respectivamente a -0,1 m y 0,1 m de la posicin del oyente.
A pesar de ser un indicio muy contundente de ubicacin espacial de sonido, la itd no es apta para su utilizacin en sistemas de altoparlantes porque la
posicin de los oyentes y su propensin a mover la cabeza reducen completamente su efectividad.20
Sin embargo, hay dos casos en los que la simulacin de retardos no solo es
necesaria, sino inevitable. Uno es la simulacin del efecto Doppler y el otro es
la simulacin de los ecos tempranos,21 o primeras reflexiones de un recinto.
El efecto Doppler surge, como ya se mencion (vase captulo ii de este
libro), de la modificacin dinmica de velocidad radial relativa a fuente acstica y oyente. Para implementarlo se usa la misma tcnica de buffer circular
ya explicada, pero respecto de un solo punto espacial en donde se supone
que est el oyente. Debe ser mencionado, por supuesto, que tal simulacin es
rigurosa solo para el punto en donde se calcula.

Simulacin de las caractersticas de recintos mediante indicios


de intensidad y tiempo
Introduccin
Para simular las caractersticas de un recinto, es necesario tener en cuenta
su reverberacin, que es el resultado de las numerosas reflexiones de la seal
acstica directa en sus elementos fsicos. Se la suele dividir por razones prcticas en dos fenmenos: primeros ecos y reverberacin densa (Di Liscia, 2004).
20

La simulacin de la itd es sumamente efectiva, sin embargo, cuando se usan auriculares


en vez de altoparlantes.
21 La simulacin de ecos tempranos se trata ms adelante en este captulo.

117

Los primeros ecos son una coleccin de reflexiones que ocurre aproximadamente en los primeros 80 milisegundos a partir del momento en que comienza
la seal directa. Proveen informacin sobre el recinto y, parcialmente, sobre
la localizacin relativa de fuente y oyente, siendo especialmente significativo
el lapso entre el comienzo de la seal directa y el primer eco. Pasados los 80
milisegundos, aproximadamente, la coleccin de ecos es cada vez ms densa,
y se percibe de manera estadstica. A este otro fenmeno se lo denomina
habitualmente reverberacin densa.22
En este captulo se tratar nicamente la simulacin de ecos tempranos, dado que las tcnicas que involucra tienen estrecha relacin con las ya
explicadas.

Simulacin de ecos tempranos
Cuando se conocen los datos referidos a las dimensiones, la geometra y la
constitucin de un recinto, es posible calcular tanto el retardo como la amplitud de las diversas reflexiones del frente de onda en sus paredes, techo y piso
respecto de un oyente ubicado en dicho recinto. Una de las estrategias para
imitar los primeros ecos se suele denominar acstica geomtrica (Begault, 2000)
y consiste en considerar las diferentes reflexiones como rayos en direcciones
determinadas, en analoga con rayos de luz.
Existen varios mtodos para el clculo de las primeras reflexiones de
acuerdo con esta concepcin. Uno de ellos es el llamado trazado de rayos.23
En el algoritmo bsico, la fuente emite rayos de sonido que se reflejan en las
superficies de la sala y el oyente sigue aquellos que le llegan como reflexiones
audibles. En general, se usa el modelo de una esfera y se toma una cantidad
predefinida de rayos en direcciones distribuidas uniformemente que se supone
que emite la fuente acstica (Savioja, 1999). Se debe recordar aqu que, para
una simulacin ms eficaz, deben tenerse en cuenta las caractersticas direccionales de la fuente sonora involucrada.24
Cuando se pretende simular una cantidad considerable de reflexiones
en tres dimensiones, el mtodo de trazado de rayos es sumamente exigente
en tiempo de proceso y slo puede realizarse con sistemas muy poderosos, o en
tiempo diferido.
22

Para ms detalles sobre la acstica de recintos y su percepcin, vase el captulo ii de


este libro.
23 Ray tracing, en ingls.
24 Vase el punto referido a la simulacin de la directividad de las fuentes acsticas en este
captulo.

118

Para efectos musicales ms prcticos25 y considerando una geometra


simple del recinto, la mayora de las aplicaciones de audio para simulacin
de localizacin y movimiento de una o varias fuentes acsticas en un recinto
implementan el llamado mtodo de la imagen.26 Este mtodo consiste en el clculo de las primeras reflexiones que llegan al oyente clasificadas por orden (es
decir, las de primer orden son las que rebotaron una sola vez, las de segundo
orden dos veces, y as sucesivamente). A pesar de que se sabe que este mtodo
no es completamente apto para la simulacin precisa de la respuesta a impulso
de una sala, la aproximacin que realiza es suficiente para obtener los ecos
que los oyentes utilizan para conjeturar la localizacin de la fuente acstica.
La figura 8 muestra las reflexiones de primer orden que surgen de una fuente
omnidireccional de acuerdo con el mtodo de la imagen, con respecto a un
oyente situado en el origen de un plano en dos dimensiones. En este caso, se
obtiene un rayo por cada una de las paredes del recinto.
20

20
(8,12)
(8,8)

(12,8)

(-28,8)
(0,0)

(8,-28)

Figura 8

25

A diferencia del propsito de diseo acstico de salas, que requiere de una mayor precisin en la imitacin de fenmeno fsico. Vase el captulo ii de este libro.
26 Image method, en ingls. Vase Allen y Berkeley (1979).

119

El mtodo de la imagen tiene tambin la ventaja de ser simple y, por consiguiente, ms fcil de implementar. Consiste en rebatir la imagen de la sala
hacia la izquierda, la derecha, el frente, atrs, arriba y abajo (si se calcula en
tres dimensiones). La nueva posicin de la fuente en tales imgenes tiene
una distancia y un ngulo en relacin con el oyente que son equivalentes a
la reflexin del orden que corresponda. Si se desea calcular las reflexiones
de segundo orden, estas surgen de un nuevo rebatimiento de las imgenes de
las reflexiones de primer orden obtenidas, y as sucesivamente. En la figura
9 se muestran esquemticamente en dos dimensiones las fuentes fantasmas
que se calculan para las reflexiones de primer y segundo orden del recinto,
oyente y fuente que se encuentran en el rectngulo central. El orden de las
reflexiones se marca con la intensidad del sombreado.
Las ecuaciones que permiten calcular la posicin de las coordenadas
cartesianas de la nsima fuente virtual en tres dimensiones con el mtodo de la
imagen (McGovern, 2004) son:

x i = (1)i x s +[i +

1(1)i
]x r
2

y j = (1) j y s +[ j +

1(1) j
]y r
2

1(1)k
]zr
2

E. 31

E. 32


E. 33

donde i , j y k son enteros que indican el nmero de fuente fantasma. Si alguno de ellos es 0, entonces las ecuaciones 31, 32 y 33 retornan la coordenada
cartesiana correspondiente de la fuente, mientras que si son negativos las
ecuaciones retornarn la coordenada cartesiana correspondiente a la fuente
fantasma en la pared opuesta. En estas ecuaciones, xs, ys, zs son las coordenadas cartesianas de la fuente en el recinto, xr es la dimensin del recinto en la
dimensin x (ancho), yr es la dimensin del recinto en la dimensin y (largo)
y zr es la dimensin del recinto en la dimensin z (alto).
La distancia de dichas fuentes fantasmas (equivalentes a las reflexiones)
al oyente se puede calcular con la ecuacin 28 o, si se asume que el oyente
est en el centro, con la ecuacin 29.
Por supuesto, a medida que el orden de las reflexiones se incrementa, la cantidad de fuentes virtuales a simular crece de manera geomtrica. La cantidad k
de reflexiones a calcular en tres dimensiones con el mtodo de la imagen, en
funcin del orden n de estas surge de acuerdo a la siguiente ecuacin (Varga,
2000):
zk = (1)k zs +[k +

120

((4n + 6)n + 8)n


3


E. 34

En la tabla siguiente se muestra una lista de la cantidad de reflexiones a
calcular desde n = 1 hasta n = 10 de acuerdo a la ecuacin anterior. Puede
apreciarse claramente con el aumento de reflexiones el proceso de pasaje
progresivo desde ecos tempranos a reverberacin densa por la progresiva
acumulacin de estos. Es evidente tambin que el incremento geomtrico de
la cantidad de reflexiones en funcin del orden torna casi imposible su simulacin en tiempo real ms all de un orden determinado. Por lo antedicho, la
mayora de las aplicaciones suele dar al usuario la posibilidad de establecer el
valor mximo de n (orden de los ecos a calcular), o bien un valor de amplitud
que el programa puede usar como umbral mnimo para determinar cuntas
reflexiones debe calcular y simular.27
k=

Figura 9

27

Alternativamente, se podra establecer un lmite de tiempo mximo para los retardos de


las reflexiones, ya que, dependiendo de las dimensiones del recinto que se quiere simular,
al pasar un determinado orden de las reflexiones, sus retardos podran fcilmente superar
el umbral de eco.

121

Orden (n)

Reflexiones (k)

24

62

128

230

376

574

832

1.158

10

1.560

A travs de las ecuaciones 31, 32 y 33 se pueden obtener las coordenadas


cartesianas de cada una de las fuentes fantasma que equivalen a cada una de
las reflexiones en las paredes, techo y piso de un recinto. Con los datos as
calculados, cada rayo se puede considerar una nueva fuente fantasma, y esta
se puede simular a travs de las tcnicas explicadas antes en este captulo:
localizacin angular, distancia y directividad, como as tambin tcnicas de
simulacin de la distancia a travs del retraso temporal.
Es interesante advertir que, si se simula la directividad de la fuente acstica direccional, la amplitud de los ecos en funcin de su direccin se ver
significativamente afectada. Por ejemplo, en la figura siguiente se observa
una fuente hipercardioide apuntando hacia un oyente ubicado en el origen.
La radiacin del sonido directo deber calcularse en base al ngulo (el ngulo entre el centro de la fuente y el oyente), pero la radiacin de la primera
reflexin sobre la pared lateral derecha se deber calcular a partir del ngulo
. Se puede comprobar que equivale a 2 - , siendo el ngulo entre el
oyente y la fuente fantasma que simula la reflexin.
Un posterior refinamiento incluira el clculo de un factor de atenuacin
extra para simular la prdida de energa inherente al material que recubre las
superficies reflejantes del recinto.28 Con este objetivo, puede establecerse un
28

Nuevamente debe advertirse que un clculo y una simulacin precisos de tal efecto deberan incluir los cambios en el espectro de la seal en relacin a la respuesta en frecuencia
y fase del material que recubre las superficies reflejantes y el ngulo de incidencia de la

122

Fuente
Reflexin
Oyente

Figura 10

escalar que representa un coeficiente de absorcin. Si este escalar es igual a


la unidad, no habr atenuacin. Pero si es menor que la unidad, la seal que
corresponde a cada reflexin deber ser atenuada por un factor que, de acuerdo
con McGovern (2004), podemos calcular tomando el coeficiente de reflexin
de las superficies, rw, y elevndolo al exponente n donde n =|i|+|j|+|k|.
Si los coeficientes de absorcin de las paredes, techo y piso del recinto son
diferentes, entonces el clculo del factor de atenuacin es ms complicado,
pero perfectamente posible.29
Finalmente se debe considerar que cuando la fuente virtual est en movimiento, el diseo de los ecos tempranos se modifica de acuerdo a su posicin.
Esta modificacin debe, por supuesto, ser calculada con la periodicidad necesaria.30 Como consecuencia de esto, tanto los valores de atenuacin en amplitud debidos a la distancia y direccin como aquellos debidos a la directividad
de la fuente cambiarn dinmicamente y debern ser calculados y tenidos en
cuenta. Los valores de retraso de la llegada al oyente del rayo correspondiente
a cada eco cambiarn dinmicamente tambin, y darn lugar a corrimientos
de la frecuencia de las seales que representan a cada eco, de una manera anloga al efecto Doppler que producen las diferentes velocidades radiales entre
fuente y oyente.31 Nuevamente, aqu habr que usar los procedimientos de
buffer circular con interpolacin que ya se explicaron para imitar los retardos
dinmicos que surgen de tal situacin.
reflexin. Vase el captulo ii del presente libro.
29 Para conocer las ecuaciones correspondientes, vase McGovern, (2004).
30 Se pueden calcular las posiciones de la fuente virtual y las correspondientes reflexiones a
cada muestra de audio, o bien a frecuencias menores y utilizar algn tipo de interpolacin
entre los valores obtenidos.
31 Si bien, rigurosamente hablando, no se trata de efecto Doppler, la manera de concebirlo
e imitarlo es exactamente igual a la que se usa para la emulacin del efecto Doppler en la
seal directa.

123

Conclusiones
Las tcnicas tratadas hasta aqu son relativamente sencillas de implementar y
constituyen la base sobre la cual se desarrollan muchos dispositivos de espacializacin. Existe fuerte evidencia cientfica y prctica de que, si tales tcnicas
se combinan adecuadamente con algunas otras que usan indicios espectrales
(tales como el filtrado dependiente de la distancia y el filtrado de las seales
reflejadas de acuerdo con los coeficientes de absorcin de los materiales reflejantes), es posible producir una simulacin de las caractersticas espaciales
bastante robusta. Adems de ello, los dispositivos electrnico-digitales son
cada da ms veloces y de mayor capacidad, permitiendo as el proceso de
mayor cantidad de seales y simulacin de indicios.
Particularmente, sin embargo, todava resta realizar mucha investigacin y desarrollo para superar ciertas limitaciones de las tcnicas tratadas.
Entre las principales de estas limitaciones se pueden mencionar: la falta de
uniformidad de la seal acstica difundida en los altoparlantes, la dificultad
de simular correctamente una fuente acstica en una ubicacin muy prxima
al/a los oyentes, y la estrechez del punto de audicin ideal32 para audiencias
numerosas.

Bibliografa
Allen, J. y D. Berkley (1979), Image Method for Efficiently Simulating
Small Room Acoustics, Journal of the Acoustical Society of America, pp.
912-915.
Bamford, J. S. (1995), An Analysis of Ambisonic Sound Systems of First and
Second Order, tesis de maestra, Ontario, Waterloo University.
Bargen, B. y P. Donnelly (1998), DirectX a fondo, Madrid, McGraw-Hill.
Begault, D. (2000), 3D sound for Virtual Reality and Multimedia (<http://humanfactors.arc.nasa.gov/publibrary/Begault_2000_3d_Sound_Multimedia.
pdf>).
Cetta, P. (2007), Un modelo para la simulacin del espacio en msica, Buenos
Aires, Educa.
Chowning, J. (1971), The simulation of Moving Sound Sources, Journal of
the Audio Engineering Society, N 19.
Di Liscia, O. P. (2004), Sntesis y procesamiento de sonido y msica a travs del programa Csound, Bernal, Editorial de la Universidad Nacional de Quilmes.
32

Denominado comnmente sweet spot por los ingenieros de audio.

124

Dodge, Ch. y T. Jerse (1985), Computer Music Synthesis, composition and performance, Nueva York, Schirmer Books.
Guastavino, C. et al. (2007), Spatial audio quality evaluation: comparing
transaural, Ambisonics and stereo, Proceedings of the 13th International
Conference on Auditory Display, Montreal.
Karpen, R. (1998), Space and Locsig Ugs, en The Csound Manual (<http://
www.csounds.com/manual/html/locsig.html>, <http://www.csounds.
com/manual/html/space.html>).
Kendall, G. et al. (1989), Spatial reverberation, discussion and demonstration, en Mattews, M. y J. Pierce, Current Directions in Computer Music
Research, Cambridge, mit Press.
Kendall, G. (1995), The decorrelation of Audio Signals and its impact on
Spatial Imaginery, Computer Music Journal, vol. 19, Cambridge, mit
Press.
McGovern, S. (2004), A model for room acoustics (<http://www.2pi.us/rir.
html>, consultado el 20 de febrero de 2008).
Moore, F. R. (1990), Elements of Computer Music, Nueva Jersey, Prentice
Hall.
(1989), Spatialisation of sounds over loudspeakers, en Mattews, M. y
J. Pierce, Current Directions in Computer Music Research, Cambridge, mit
Press.
(1983), A General Model for Spatial Processing of Sounds, Computer
Music Journal, vol. 7, N 3.
Moorer, A. (1979), About this reverberation business, Computer Music
Journal, vol. 3, N 2.
Pulkki, V. (2001), Spatial sound generation and perception by amplitude panning
techniques, Reporte N 62, Universidad Tecnolgica de Helsinki.
et al. (1999), Analyzing virtual sound source attributes using a binaural
auditory model, Journal of the Audio Engineering Society, 47 (4), pp.203217.
Savioja, L. (1999), Modeling Techniques for Virtual Acoustics, tesis doctoral,
Helsinki University of Technology, Finlandia (<http://www.tml.tkk.
fi/~las/publications/thesis/>, consultado el 20 de febrero de 2008).
Stevens, S. S. (1970), Neural events and Phychophisical Law, Science, 170.
Varga, I. (2000). Spat3d Unit Generator, The Csound Manual (<http://
www.csounds.com/manual/html/spat3d.html>).
West, J. (1998), Five-channel panning laws: an analytical and experimental comparison, tesis de maestra, Universidad de Miami.
Wozniewski, M. et al. (2007), AudioScape: A Pure Data library for management of virtual environment and spatial audio, Pure Data Convention,
125

Montreal (<http://www.audioscape.org/twiki/pub/Audioscape/Audioscape
Publications/audioscape_pdconv07_final.pdf>).

126

Captulo iv
Transformadas clsicas de la imagen estreo.
Un anlisis
Joseph Anderson

Introduccin
El presente estudio es el resultado de dos bsquedas del autor en el arte del
sonido grabado, ambas relacionadas entre s: en primer lugar como compositor
de msica acusmtica (Dhomont, 1996; Windsor, 2000), y adicionalmente
como ingeniero de grabacin purista (Lipshitz, 1986). La recoleccin de
sonidos grabados, para su uso a modo de bloques constructivos de un nuevo
mundo sonoro, es una actividad muy importante dentro de la tradicin britnica de la msica acusmtica. Normalmente, el primer paso de una composicin en esta modalidad es la improvisacin alrededor de un par de micrfonos,
produciendo sonidos en el estudio. En la prctica, la eleccin de las tcnicas
de microfoneo utilizadas (tipos de patrn y disposicin) pueden de hecho
variar, pero el resultado ser una grabacin estereofnica. Si bien comenzar
con grabaciones estereofnicas de solo una pista puede, en trminos de produccin, resultar ms simple, el compositor acusmtico diestro comienza con
tomas estreo para que la base de la pieza a ser creada ya tenga plasmados los
atributos espaciales1 (Rumsey, 2002) presentes en las grabaciones de la improvisacin inicial con los materiales de origen. De manera similar, al ingeniero
de grabacin purista le interesa realizar grabaciones estreo que capturen
exitosamente los atributos espaciales de un evento acstico, usualmente una
ejecucin musical.
Cuando se trata de manejar las grabaciones resultantes, tanto el acusmtico como el purista tienen un problema similar. El compositor necesita un
conjunto de herramientas para manipular los atributos espaciales de los sonidos recolectados, si este es uno de los parmetros a operar para crear sentido
y para que, como es de esperarse, sea reconocida la habilidad del artista. Para
1

Estos incluyen ancho, profundidad, distancia, cualidad envolvente, espaciosidad, impresin espacial, etctera.

127

el ingeniero de grabacin purista el asunto puede ser algo ms correctivo.


Particularmente para grabaciones hechas en conciertos, en las que cuestiones
de puesta en escena y lnea de visin pueden no siempre dar como resultado
grabaciones bien balanceadas, centradas, o de alguna manera bien representadas, la accin reparadora puede ser necesaria. El ingeniero de grabacin purista puede necesitar re-apuntar, re-balancear o re-guiar el resultado, en esencia
remezclando espacialmente, para producir una grabacin ms apropiada y
utilizable. Al hacer mencin del acusmtico y el purista, la intencin no es
acotar la audiencia para el anlisis que sigue. Se podra suponer, idealmente,
que todos los profesionales del audio deberan estar familiarizados con las
tcnicas que se discutirn, y particularmente, el ingeniero de masterizacin
y mezcla.
El propsito de esta discusin es revisar una variedad de transformadas clsicas de la imagen estreo, y aunque estas no sean capaces de cubrir
necesariamente todas las caractersticas de una grabacin estreo calificables
como atributos espaciales, un rango de cualidades puede manejarse ergonmicamente.
Aunque varias de las transformadas que sern comentadas son conocidas
y muy utilizadas por los profesionales del audio, algunas de ellas no lo son, y
han sido catalogadas habitualmente como oscuras y misteriosas.
Las transformadas en s se presentan en forma de variaciones de la ley
de panormico seno-coseno, tambin mencionada en la literatura como ley de
panormico tangente o ley estreofnica de senos (Malham, 1998; Griesinger,
2002).
Inspirados por los diagramas polares estreo de Julstrom (1991) que l
mismo utiliza para ilustrar la sensibilidad de un arreglo de micrfonos estreo
coincidentes y la distribucin del escenario estreo resultante, los cambios
aplicados por las transformadas al campo estreo son ilustrados mediante el
uso de figuras similares a las que muestra la pantalla de un gonimetro.2 La
intencin, idealmente, es conducir con mil palabras al lector hacia una
comprensin intuitiva de la accin de las transformadas de imagen. Gran
parte de este trabajo es el resultado de la lectura y reflexin sobre el trabajo de
Michael Gerzon, y el objetivo es hacer un intento de ilustracin y unificacin
de algunas de sus discusiones sobre el tpico.
Por ltimo, al cierre y sugirindose una lectura ms profunda de Gerzon,
se tratar ligeramente la nocin de transformadas de imagen dependientes de
la frecuencia.

Referido usualmente como medidor de fase estreo.

128

Ley de panormico seno-coseno y el dominio ms


Ley de panormico
Muchos, si no la mayora, de los novatos del audio comienzan su experiencia
con la imagen estreo a travs del uso de la ley de panormico, ubicando un
sonido monofnico dentro un escenario estreo. Al hablar de estreo, esta
discusin hace referencia a un sistema estreo de dos canales con dos altoparlantes ubicados frente al oyente en un arco, usualmente dispuestos a 60.
Adems, algunas de las impresiones de imagen que se describen en este texto
son claras solo a travs de la reproduccin con altoparlantes y en muchos
casos, si la seal estreo se escucha con auriculares,3 no se perciben.
Toda mesa de mezcla y estacin de trabajo de audio digital incorpora algn tipo
de ley de panormico o panning para posicionar seales monofnicas en un escenario estreo; esto se logra mediante la distribucin de la seal de entrada entre
los dos canales de salida de los altoparlantes. La ley de panormico utilizada con
mayor frecuencia por las mesas estreo es, tal vez, la ley de panormico senocoseno, que aplica ganancias a la seal de entrada de la siguiente manera:
L pan = cos (45 p )M

R pan = sin (45 p )M

E. 1

donde M es una seal de entrada monofnica y p es el ngulo de panormico


deseado. p vara entre +45 para un panormico total hacia el altoparlante
izquierdo y -45 para un panormico hacia el altoparlante derecho. Asignar
0 a p posiciona la seal de entrada M en el centro de la imagen resultante.
En sus acotaciones acerca de la conveniencia de la utilizacin de la ley senocoseno, Griesinger (2002) ha enunciado: La ley seno-coseno tiene la ventaja
de mantener una energa constante mientras vara la posicin aparente, y su
uso tiene una larga historia. Esta energa constante con variacin de posicin
permite la percepcin de un nivel de sonoridad constante con diferentes tipos
de seal de entrada.
Al ponerse en el lugar del ingeniero de grabacin purista, es vlido mencionar que la ley de panormico seno-coseno puede tambin ser implementada
a travs del uso de una tcnica de microfoneo estreo conocida como Blumlein
(Blumlein, 1931; Gerzon, 1976a; Lipshitz, 1986) o arreglo estereosnico (Clark,
3

El problema de la escucha de cualidades espaciales con auriculares tiene aspectos particulares divergentes de la audicin con altoparlantes y se considera mejor en el contexto de
las tcnicas binaurales.

129

Dutton y Vanderlyn, 1958). Se utilizan dos micrfonos bidireccionales cruzados; el micrfono que captura la parte izquierda de la escena apunta 45 hacia
la izquierda, y el encargado de capturar la parte derecha de la escena apunta
45 hacia la derecha, ambos respecto del centro. Esta tcnica es muy reconocida por su capacidad de producir grabaciones vvidas, estables, enrgicas y
objetivas, ubicando al oyente en el espacio de la grabacin.
El dominio

ms

Mucha gente en la comunidad del audio asocia el dominio ms (middle-and-side o


mono-and-stereo) con la tcnica de microfoneo estreo ms (Dooley, y Streicher,
1982). Como ocurre con otras tcnicas coincidentes, la tcnica de microfoneo
ms es recomendable por muchas razones fcil despliegue, imagen estreo
vvida y precisa. Presentado en la patente de Blumlein de 1931, el dominio
ms no debera pensarse ligado a los micrfonos y la adquisicin de sonido;4 el
dominio ms es simplemente una manera alternativa de representar o ver una
seal estreo. Una seal estreo estndar, compuesta por las seales izquierda
y derecha, es una seal estreo en el dominio lr (left-right). Los dominios lr y
ms pueden considerarse dos caras de una misma moneda; un cambio en la seal
estreo producido en uno de los dominios se ve reflejado en el otro.
La transformacin del dominio lr al dominio ms se logra de la siguiente
manera:

(L + R)
2
2 (L R)

M=

S =

E. 2

De manera similar, la transformacin de ms a lr es:


L=

R=

(M + S )
2
2 (M S )

E. 3

Estas dos transformadas son ortogonales; no se pierde informacin al moverse de un dominio al otro. Transformar una seal estreo lr al dominio ms
mediante la ecuacin 2 y luego al dominio lr nuevamente a travs de la ecuacin 3 dar como resultado la seal estreo original, sin modificaciones.
El panormico de una seal de entrada mono por va de la ley de panormico
seno-coseno es realizado de la siguiente manera en el dominio ms:

Las transmisiones estreo de fm son realizadas en el dominio ms.

130

M pan = cos (p )M

Span = sin (p )M

E. 4

M, p y el panormico resultante son como en la ecuacin 1 que aparece ms


atrs, cuando la seal estreo ms se transforma al dominio lr mediante la
ecuacin 3. Ntese que el panormico de una seal mono en el dominio ms
parece ser algo ms simple que en el dominio lr, pero a expensas de transformar el resultado al dominio lr. Veremos que esto ocurre con varias de las
transformadas a analizar; algunas son ms convenientes de implementar en el
dominio lr, otras en el dominio ms.
La visualizacin de la relacin entre los dominios lr y ms constituye un
punto importante para comenzar nuestro estudio. Aquellos que estn familiarizados con la lectura de gonimetros probablemente reconocern el trazado
que muestra la figura 1. El eje lr es trazado en oposicin al eje ms, con marcas
en los ngulos cada 15 e incrementos de 6 dB en las ganancias. El trazado
muestra tres seales mono, cada cual con una ganancia de 0dB, ubicadas a
+30, 0 y -45 en una imagen estreo resultante. Este trazado no es exactamente lo que un gonimetro mostrara para las seales descritas. En primer
lugar, un gonimetro no es capaz de representar tres seales que ocurren de
manera simultnea y dar ngulos de azimut precisos para cada una, como se
muestran aqu. Por el contrario, para seales mltiples se mostraran varias
figuras de Lissajous cuya variacin depende de cada una de las seales y de sus
posiciones en el panormico. En segundo lugar, incluso para una imagen estreo consistente de una nica seal mono posicionada, un gonimetro posee
limitaciones adicionales. No es capaz de representar polaridad; una seal
posicionada a +30 aparecer de la misma manera que una ubicada a -150.
Sin embargo, como puede verse en la ecuacin 1, estas dos seales tendrn
polaridades opuestas; la representacin de una imagen estreo, idealmente,
tomar esto en cuenta.
Las ilustraciones utilizadas a lo largo de esta discusin adoptan un mtodo de visualizacin del ngulo de panormico y de la ganancia codificados a
travs de los 360 completos: el ngulo de azimut como el desplazamiento
alrededor del crculo, y la ganancia como el radio desde el centro. La imagen
estreo que muestra la figura 1 se construye fcilmente mediante el uso de
mezcladoras estreo por hardware o software, ya que las tres seales mono son
posicionadas entre +45 y -45 (+L/R), a la izquierda y la derecha. La figura
2 ilustra una imagen estreo con seales mono a 0 dB posicionadas de 0 a
-15, con incrementos de 15.
La construccin de esta clase de imgenes requiere un acceso directo a
131

la ley de panormico seno-coseno dado que los elementos estn posicionados


ms all de los +45 y -45 comnmente establecidos como lmites en las
mezcladoras pensadas para usuarios estndar (este punto se discute ms adelante). La seal exhibida en la figura 2 se usar como una seal identidad y las
transformadas a examinar en el resto de este trabajo sern ilustradas actuando
sobre esta seal estreo.

Las transformadas estreo


Rotacin-panormico estreo
Mientras que la rotacin no es habitualmente una de las primeras transformadas estreo con las que la mayora de los practicantes del audio ha tenido
experiencia, comenzaremos aqu con ella. La rotacin se construye fcilmente
a partir de la ley de panormico seno-coseno, y veremos que el resto de las
transformadas a estudiar aqu pueden considerarse simples variaciones de
esta. La rotacin puede ser vista como un verdadero algoritmo de panormico
estreo, dado que acepta una entrada estreo y da como resultado una salida
estreo. Acta reposicionando los elementos en la imagen estreo sin ajustar
sus ganancias relativas, al igual que el resto de las transformadas a examinar.
Mientras que la ley de panormico seno-coseno se utiliza para posicionar una
seal mono, la rotacin se usa para posicionar (o reposicionar) una seal
estreo y debera considerarse como la operacin equivalente al panormico
para seales estreo. Sorprende entonces, que mientras las mesas de mezcla
por hardware y software emplean el panormico, muy pocas implementan la
rotacin, el verdadero panormico estreo.
La forma ms fcil de ver la relacin entre panormico y rotacin es
comenzando por el dominio ms; la transformacin de rotacin estreo se
implementa mediante el agregado de escalares al componente de entrada S
en la ley de panormico ms de la ecuacin 4:
Mrotate = cos (r )M sin(r )S

Srotate = sin (r )M + cos (r )S

E. 5

donde r es el ngulo de rotacin. Como sera de esperarse, una rotacin


de +45 colocar lo que estaba en el centro de la imagen en el altoparlante
izquierdo, mientras una de -45 rotar lo que estaba en el centro hacia el altoparlante derecho. En el dominio lr, la rotacin se implementa as:
132

+M

+L

+6
0

+R

-6
-12
-18
-24
+S

-S

-R

-L

-M

Figura 1. Dominios lr y ms, con seales ubicadas en +30, 0 y -45


+M

+L

+6
0

+R

-6
-12
-18
-24
+S

-S

-R

-L

-M

Figura 2. Imagen estreo con seales posicionadas de 0 a -15, con incrementos de +15

133

Lrotate = cos (r )L + sin(r )R

Rrotate = sin (r )L + cos (r )R

E. 6

Por supuesto que la rotacin puede ser utilizada tanto creativa como correctivamente. Es claro que, as como uno podra querer ubicar una seal monofnica en una mezcla estreo, colocndola en un ngulo de azimut deseado, podra
querer hacer lo mismo con una seal estreo, posicionndola dentro de una
mezcla estreo. El uso de la rotacin preserva la totalidad de las pistas vvidas
y la informacin espacial de una seal estreo mientras se altera el azimut. Un
uso correctivo de la rotacin podra ser la re-imagen de una grabacin estreo
para que un elemento previsto en el centro de la imagen, tal vez un cantante,
sea trado a esa ubicacin.

Panormicos ms all de +/-45. Movindose ms all


de los altoparlantes
Cuando se present la ley de panormico seno-coseno, el ngulo de panormico p figuraba como restringido entre +/-45. Si bien este rango es suficiente
para ubicar un sonido entre los altoparlantes, no hay nada en la ley de panormico que limite la eleccin de p a estos valores. Uno puede tranquilamente
elegir un p entre +/-60 o +/-90 o incluso +/-180. Puede haber razones para
no hacerlo, particularmente si hay incumbencias respecto de la compatibilidad de reproduccin mono conveniente para transmisiones. De cualquier
manera, si uno apunta al estreo y est interesado en la imagen estreo, es til
considerar lo que ocurre cuando se mueve ms all de +/-45.
Aquellos que tienen experiencia con la tcnica de microfoneo estreo
Blumlein reconocern las regiones desde +45 a +135 (+L a -R) y -45
a -135 (+R a -L) como las regiones fsicas* del arreglo de micrfonos.
Esta cualidad de fase ha sido descrita como productora de una localizacin
vaga y ambigua, y para el ingeniero de grabacin preocupado por la ilusin
estreo precisa y convincente, es usualmente evitada. Estas regiones son
llamadas fsicas dado que la ley seno-coseno (y/o el arreglo de micrfonos
Blumlein) comienza a introducir seales a contrafase, o polaridad opuesta,
en el altoparlante opuesto. Apenas pasando los +45 (+L) el altoparlante
izquierdo la cantidad de seal a contrafase en el parlante derecho es mnima
*

Phasey en el original en ingls. [N. de los T.]

134

y dependiendo del material sonoro, puede parecer estar pasando el lmite del
altoparlante izquierdo. Al incrementar aun ms el p el sonido puede parecer
moverse ms all del altoparlante, tornndose por lo general borroso, difuso
y ubicuo. Cuando p es igual a +90 (+S) los parlantes izquierdo y derecho
son alimentados con seales que poseen la misma ganancia, pero polaridades
opuestas. Kendall (1995) ha descrito la impresin de tal seal como cercana
en apariencia al oyente. Para el autor, el sonido se siente ligeramente posicionado detrs de la cabeza.
Volviendo a la rotacin y aplicando un r de 0 a la seal identidad de
la figura 2 obtendremos la seal de la figura 2. Este es el caso para todas las
transformadas a estudiar; aplicar 0 da como resultado una transformacin
transparente. Aplicar una rotacin de +7,5, +15 y +30 dar como resultado
las seales ilustradas en las figuras 3, 4 y 5. Como puede verse en todas estas,
los elementos de la imagen identidad que estaban previamente entre +/-45
(izquierda/derecha) estn ahora rotados hacia regiones fsicas. Anlogamente,
los elementos previamente en regiones fsicas estn ahora entre +/-45.
Veremos que todas las transformadas son similares en este aspecto, llevando
algunos elementos de regiones no fsicas a fsicas y viceversa.
+M

+L

+6
0

+R

-6
-12
-18
-24
+S

-S

-R

-L

-M

Figura 3. Rotacin +7,5

135

+M

+L

+6
0

+R

-6
-12
-18
-24
+S

-S

-R

Figura 4. Rotacin +15

-L

-M

+M

+L

+6
0

+R

-6
-12
-18
-24
+S

-S

-R

-L

-M

Figura 5. Rotacin +30

136

Ancho
Junto con el balance la transformacin de ancho5 es una de las transformadas
de imagen estreo ms familiares. En el dominio lr, la transformacin de
ancho puede crearse modificando la ecuacin para rotacin (ecuacin 6).
Para los escalares en el canal derecho, R, r es reemplazado por -r , dando
como resultado:
Lwidth = cos (w )L sin(w )R

Rwidth = sin (w )L + cos (w )R

E. 7

Esto cambia la direccin de rotacin aplicada al canal derecho. Ms que rotar


al mismo tiempo L y R a travs del escenario estreo, R gira en la direccin
opuesta a L. Valores negativos de 0 a -45 estrecharn el ancho de la imagen; este rango de valores rota L y R hacia el centro, resultando a -45 el
colapso de la imagen a mono, en el centro del escenario estreo. La figura 6
ilustra la transformacin del ancho de la seal identidad por -30. Comprese
esta ilustracin con la rotacin de +30 de la figura 5. Ntese que la marca
que indica la localizacin de la transformacin de la entrada +R para ambas
aparece en el mismo azimut, -15. Esto no debera sorprendernos, sobre todo
si consideramos la discusin anterior. La entrada +L ha sido rotada -30 (en
sentido horario) mientras +R ha sido rotada +30 (en sentido anti-horario)
en la direccin opuesta.
Cotejando la seal identidad de entrada, pueden observarse otras caractersticas de la transformacin de ancho. Junto con la compresin de elementos
hacia el centro, ntese los cambios de ganancia aplicados a los elementos de
la entrada. Para los elementos en +/-45 frontal, los cambios de ganancia son
mnimos, siendo el ms significante cercano a un incremento de 2dB, aplicado
al elemento central de la imagen. Sin embargo, es ms significativa la reduccin de ganancia aplicada a los elementos en las regiones fsicas (entre +L/-R
y -L/+R) de la entrada. Los elementos ubicados en el eje S han tenido una
reduccin de ganancia de casi 9 dB. Adems, se han aplicado desplazamientos
de azimut a todos los elementos de la seal de entrada, excepto aquellos en
los ejes M y S.
En principio, el ancho de una imagen se ver incrementado con valores
positivos, aunque el resultado puede no ser tan simple como parece inicialmente. La figura 7 ilustra una transformacin de +15, que da como resultado
5

El autor ha visto referencias a la transformacin de ancho como base estreo, basamento


estreo y control diferencial estreo.

137

+M

+L

+6
0

+R

-6
-12
-18
-24
+S

-S

-R

Figura 6. Ancho -30

-L

-M

+M

+L

+6
0

+R

-6
-12
-18
-24
+S

-S

-R

-L

-M

Figura 7. Ancho +15

138

el ensanchamiento del frente +/-45 del escenario estreo. Puede verse que los
elementos de los ejes L y R han sido desplazados hacia la regin fsica. Como
se dijo antes, segn el material sonoro, estos elementos pueden parecer ahora
un poco ms all de los altoparlantes izquierdo y derecho. Adicionalmente,
lo que se encontraba en +/-30 ahora aparece en los ejes L y R.
La transformacin del ancho en +30 da como resultado la seal ilustrada en la figura 8, produciendo una distorsin significativa de la imagen.
Quiz lo ms notable es la ganancia aplicada a los elementos dispuestos en
el frente +/-45 del escenario; ahora los elementos en el eje M estn casi 9
dB ms bajos. Debido a los desplazamientos de azimut, los elementos estn
comprimidos ahora hacia el eje S ms que hacia el eje M, como era el caso
para un ancho de -30. De la misma manera que para la transformacin de
ancho de -30, comprese la ilustracin de un ancho de +30 con la de una
rotacin de +30 (figuras 8 y 5). Ntese que los elementos que estaban a
+45 y +15 en la seal identidad ahora aparecen a +75 y +45 en ambos
resultados de las transformadas. Mientras estos dos elementos se encuentran
en el mismo azimut, la ganancia del elemento que ahora est a +45, difiere
en 6 dB.

+M

+L

+6
0

+R

-6
-12
-18
-24
+S

-S

-R

-L

-M

Figura 8. Ancho +30

139

Probablemente, el ancho en el dominio ms sea la forma en que la mayora de


los lectores han encontrado esta transformada:
Mwidth = 2 sin (45 w )M

Swidth = 2 cos (45 w )S

E. 8

En este caso, parece que el ancho cambia el balance de M a S. Como hemos


comprobado, esto equivale a las rotaciones de L y R en direcciones opuestas.
Sin embargo, en la accin de cambio de ancho vista ms atrs, el cambio de
las ganancias en los ejes M y S se vuelve muy explcito. Como la ecuacin
8 presenta la transformada en los trminos de la ley de panormico senocoseno, la ganancia en M vara mientras el ancho cambia. Para anchos ms
cerrados, con un w igual a valores negativos hacia -45, la ganancia en M
crece hacia los +3 dB. Para anchos ms abiertos, con un w hacia +45, la
ganancia en M decrece hacia - dB. La ganancia sobre M en la ecuacin
8 puede ser normalizada a 0 dB para todos los valores de w, y esta es la
manera en que aparece tradicionalmente la transformada de ancho. No obstante, presentarla como ha sido vista en la ecuacin 8 hace ms evidentes
las rotaciones y las relaciones con las transformadas inspeccionadas en este
trabajo.
Balance
Tal vez la transformada de imagen estreo ms familiar es el balance, dado el
hecho de que por lo general se encuentra implementada en los dispositivos
de audio estndar. Puede pensarse como un simple intercambio del dominio
en que se aplica la transformada de ancho; luego veremos que este cambio de
dominio es tambin un modo prctico de crear otras transformadas. En el dominio lr, el ancho opera rotando los ejes L y R hacia o desde el eje M. La misma
tctica puede ser aplicada a la rotacin en el dominio ms. Para los escalares en
el canal lateral S, el r en la ecuacin 5 se sustituye por r , resultando:
M balance = cos (b )M + sin (b )S

Sbalance = sin (b )M + cos (b )S

E. 9

La transformada de balance, entonces, es una rotacin de lo que ha sido codificado en los ejes M y S hacia o desde el eje L. En el dominio lr el balance
aparece como:
140

L balance = 2 cos (45 b )L

R balance = 2 sin (45 b )R

E. 10

El balance se presenta generalmente de esta manera, o en forma de ganancia


normalizada. Aqu, en la ecuacin 10, los escalares que aparecen en L y R
parecen muy similares a aquellos que aparecen en M y S en la ecuacin 8, y es
visible la relacin cercana entre ancho y balance.
La figura 9 y la figura 10 ilustran la resultante de aplicar un balance de
+15 y +30 a la seal identidad. Como sucede con el ancho, no solo se modifican los azimut de los elementos, sino que la ganancia tambin se ve alterada.
En el caso de un balance de +30, los elementos entre +M y -S sufren una
disminucin de ganancia, donde el elemento en el eje R es disminuido en
casi 9 dB. La ganancia sobre el eje L sube cerca de 2 dB. Comparando las ilustraciones de un balance de +30 y una rotacin de +30 (figura 5) es posible
comprender mejor las distorsiones de azimut producidas por la transformada
de balance. Ntese que lo que estaba a 0 en la seal identidad aparece a
+30 en los resultados tanto de la transformada de balance como de rotacin.
+M

+L

+6
0

+R

-6
-12
-18
-24
+S

-S

-R

-L

-M

Figura 9. Balance +15

141

+M

+L

+6
0

+R

-6
-12
-18
-24
+S

-S

-R

-L

-M

Figura 10. Balance +30

De manera anloga, el elemento previamente a -30 en la entrada aparece


ahora a 0 tanto en la ilustracin de balance como en la de rotacin. An
as, mientras la rotacin mantiene invariante la ganancia de este elemento,
el balance la reduce en 6 dB. Por otra parte, es claro que mientras la rotacin
desplaza los elementos a travs del escenario estreo, el balance mantiene los
elementos de los ejes L y R anclados en sus posiciones originales. Yendo en
la otra direccin, la figura 11 ilustra un balance de -30, comprimiendo la
imagen hacia el eje derecho.
Panormico medio
Junto con la asimetra, el panormico medio6 o m-pan es una de las transformadas
de imagen menos conocidas, aunque ha aparecido en diversas mezcladoras por
hardware y software y en productos de masterizacin. Las transformadas tratadas
hasta ahora, rotacin, ancho y balance, aplican una rotacin a ambos ejes del
6

El autor tambin ha visto referencias al panormico medio como panormico central, mezcla de direccin y control de direccin.

142

+M

+L

+6
0

+R

-6
-12
-18
-24
+S

-S

-R

-L

-M

Figura 11. Balance -30

dominio lr o ms. En contraste, m-pan, junto al resto de las transformadas que


veremos, aplica la rotacin a un eje solo. En el caso de m-pan, la rotacin se
aplica al eje medio. Volviendo a la rotacin en el dominio ms (ecuacin 5),
para los escalares del canal lateral, S, r es reemplazado por 0, resultando:
Mm pan = cos (m )M

Sm pan = sin (m )M + S

E. 11

M-pan es entonces una rotacin de M, pero quedando S en su lugar.


Representar la transformada en el dominio lr es bastante menos elegante,
debido a lo cual, por razones estticas, omitiremos la forma lr.
Las figuras 12 y 13 ilustran la consecuencia de transformar la seal identidad con un m-pan de +15 y +30. Consideremos los resultados de m-pan a
la luz de la rotacin y el balance, mediante la comparacin de la ilustracin
del m-pan de +30 con las de rotacin y balance de +30 (figura 5 y figura
10). Obsrvese que el elemento codificado originalmente a 0 est ahora desplazado hacia +30 por todas estas transformadas, sin embargo hay diferencias
importantes en las distorsiones de ganancia y desplazamientos de azimut. Para
143

+M

+L

+6
0

+R

-6
-12
-18
-24
+S

-S

-R

Figura 12. M-pan +15

-L

-M

+M

+L

+6
0

+R

-6
-12
-18
-24
+S

-S

-R

-L

-M

Figura 13. M-pan +30

144

el mismo corrimiento de lo que estaba a 0, m-pan realiza cambios de ganancia mucho ms bajos que los producidos por el balance, aproximadamente 3
dB menos en L en lugar de 9 dB. En comparacin con la rotacin, los cambios
de azimut de toda la seal se reducen, en tanto que el cambio se enfoca mayormente en la modificacin de lo que estaba en el centro de la imagen. Es por
estas razones que para ajustar un campo estreo se prefiere, en algunos casos,
el algoritmo m-pan por sobre el balance y la rotacin.
Asimetra
La asimetra7 es una transformada estreo que fue siempre considerada oscura,
misteriosa y relativamente poco aludida. El autor encontr por primera vez la
asimetra en una herramienta de imagen estreo por software disponible comercialmente, y han sido las investigaciones orientadas hacia la comprensin de
esta transformada las que derivaron en el presente estudio de tcnicas de imagen provenientes de la ley de panormico seno-coseno. La asimetra est ntimamente relacionada con el m-pan, pero mientras m-pan rota el eje medio, la
transformada de asimetra rota el eje lateral, manteniendo al eje medio en su
lugar. Revisando la rotacin en el dominio ms (ecuacin 5), para los escalares
en el canal del medio, M, r es reemplazado por 0, resultando:
Masymmetry = M sin (a ) S

Sasymmetry = cos (a ) S

E. 12

El lector debera advertir una fuerte similitud entre las ecuaciones 12 y 11.
Como ocurre con m-pan, la representacin de la asimetra en el dominio lr es
significativamente menos elegante, y por eso es aqu omitida.
La figura 14 y la figura 15 ilustran el resultado de la aplicacin de la transformada de asimetra a la seal identidad, con argumentos de +30 y +60.
Comparando las figuras de asimetra y m-pan de +30 (figura 13) vase que
la asimetra mantiene, como era de esperarse, lo que estaba a +/-M anclado al
eje M. Tambin obsrvense los nuevos emplazamientos de los elementos que
estaban en los ejes L y R. Para el mismo argumento, la asimetra y el m-pan
desplazan estos a un mismo azimut, pero con ganancias diferentes. La asimetra
y el m-pan de +30 mueven lo que estaba en el eje R a -30, un desplazamiento
de +15. Sin embargo, mientras la asimetra ha incrementado la ganancia de
este elemento en casi 2 dB, el m-pan ha dado como resultado una reduccin
7

El autor tambin ha visto referencias a la asimetra como control de la estabilidad estreo.

145

+M

+L

+6
0

+R

-6
-12
-18
-24
+S

-S

-R

Figura 14. Asimetra +30

-L

-M

+M

+L

+6
0

+R

-6
-12
-18
-24
+S

-S

-R

-L

-M

Figura 15. Asimetra +60

146

de casi 3 dB. Luego de ver este desplazamiento de 15 de los elementos previamente ubicados en los ejes L y R, puede ser provechoso para el lector revisar
estas dos ilustraciones en relacin con la rotacin de 15 de la figura 4.
Mas all de las aplicaciones ms obvias de la re-imagen, que implican
el re-acomodamiento de una imagen estreo existente mientras el elemento
central se mantiene en el centro de la imagen, Gerzon (1990) ha sugerido una
cantidad de usos correctivos muy creativos para la asimetra. La discusin de
Gerzon es de inters para el ingeniero de masterizacin, a quien se le requiere la
produccin de un resultado estreo utilizable a partir de una grabacin inicial
con problemas tcnicos intermitentes en uno o ambos canales. Es de particular
inters la incorporacin de dependencias de frecuencia y/o amplitud en el
algoritmo. Como se mencion en la introduccin, una breve enumeracin
de las dependencias de frecuencia ser explorada en la seccin final de este
estudio. El lector interesado puede remitirse a las brillantes consideraciones
de Gerzon.

Panormico izquierdo y derecho


Una discusin acerca de las transformadas de imagen estreo no estara completa sin una mirada sobre lo que correctamente podra ser descrito como las
dos transformadas con que los usuarios de mesas de mezcla estreo estn ms
familiarizados. Dado que ya se encuentran implementados por usuarios de
estos dispositivos, estos dos procedimientos pueden no considerarse siquiera
merecedores del trmino transformada. Aun as es posible obtener una
mayor flexibilidad, utilizando un rango ms amplio de valores a aplicar que los
usualmente permitidos por las mesas de mezcla. Confinados a las posibilidades
de las mesas por hardware, el panormico izquierdo y el panormico derecho, o
l-pan y r-pan, pueden ser implementados simplemente ajustando el panormico de un canal de entrada izquierdo o derecho. En la prctica, l-pan y r-pan
se utilizan habitualmente juntos para ajustar tanto el posicionamiento de los
elementos como el ancho de un campo estreo.8
R-pan
La transformada de r-pan puede ser desarrollada desde la ecuacin para la
8

Debe recordarse, de la discusin acerca del ancho, que la transformacin de ancho puede
ser vista como el enlace de l-pan y r-pan juntos, asignando un valor negativo al ngulo de
rotacin dado en R.

147

rotacin en el dominio lr (ecuacin 6). Para los escalares en el canal izquierdo, L, r es reemplazado por 0, resultando:
Lr pan = L + sin (rp ) R

Rr pan = cos (rp ) R

E. 13

La figura 16 y la figura 17 ilustran una transformada r-pan de la seal identidad de +15 y +30. Si agregamos la ilustracin de r-pan de +15 a la comparacin del m-pan y la asimetra de +30 con rotacin de +15 (figuras 13, 14
y 4) realizadas ms atrs, comprenderemos algo ms. Todas estas ubican lo que
estaba en el eje R a -30. Como es de esperar, mientras el m-pan, la asimetra
y la rotacin llevan lo que estaba en el eje L a la regin fsica, r-pan fija el eje
izquierdo en su lugar. Consecuentemente, tambin difieren la imagen resultante, las ganancias y la ubicacin de los elementos.
Revsense las ilustraciones de r-pan de +30 y m-pan, balance y rotacin
de +15 (figuras 17, 12, 9 y 4) prestando atencin al elemento que estaba en el
eje M. Obsrvese que mientras la posicin del elemento previamente ubicado
en el eje M est ahora a +15 en todas ellas, la distribucin resultante y los
cambios de ganancia de los otros elementos han sido variados. El r-pan y el
balance mantienen lo que estaba entre +/-45 en la regin no fsica, mientras
que el m-pan y la rotacin, con ngulos variables, no lo hacen. Desde un
punto de vista de produccin, estas transformadas dan diferentes opciones y
resultados creativos para la tarea de mover lo que se encontraba en el centro
hacia otro azimut.
L-pan
La transformada l-pan completa el conjunto. Como sera de esperarse, la ecuacin para l-pan puede ser derivada de la rotacin en el dominio lr (ecuacin
6). r es reemplazado por 0 para los escalares del canal derecho, R, dando:
Ll pan = cos ( lp ) L

Rl pan = sin ( lp ) L + R

E. 14

Viendo las ecuaciones 13 y 14 no debera sorprendernos su semejanza respecto


de las ecuaciones 11 y 12, de m-pan y asimetra. Ambos conjuntos actan de
la misma manera, rotando uno de los ejes de la seal de entrada tanto en el
dominio lr como en el ms.
148

+M

+L

+6
0

+R

-6
-12
-18
-24
+S

-S

-R

Figura 16. R-pan +15

-L

-M

+M

+L

+6
0

+R

-6
-12
-18
-24
+S

-S

-R

-L

-M

Figura 17. R-pan +30

149

En la ecuacin 14 no hay nada que restrinja los valores asignados a


lp para mantener lo que estaba previamente entre +/-45 en la regin no
fsica. La figura 18 y la figura 19 ilustran el resultado de transformar la seal
identidad con un l-pan de +15 y +30. En general, las mesas de mezcla por
hardware son incapaces de aplicar la transformada ilustrada aqu, porque sus
implementaciones de la ley de panormico restringen al l-pan y al r-pan a la
regin no fsica. Para un practicante creativo del audio esta restriccin puede
ser limitadora e indeseable. Revisando las ilustraciones de l-pan y rotacin
de +15, y m-pan y asimetra de +30 (figuras 18, 4, 13 y 14) se ve que todas
estas transformadas ubican lo que estaba en el eje L a +60. En este caso,
a diferencia de la rotacin, l-pan cambia mnimamente la ganancia de los
elementos.

Direccin-abilidad*
Aunque el autor ha visto herramientas de imagen por hardware y software
implementadas como una cascada de varias de las transformadas vistas, debera ser evidente que tales disposiciones son de hecho redundantes, posiblemente poco intuitivas, y potencialmente perjudiciales. Una til excepcin a
esta advertencia es ver que es imposible modificar las transformadas bsicas
para que se vuelvan direccin-ables. La relacin entre ancho y balance
es de direccin-abilidad: el ancho es a travs de un dominio mientras el
balance es a travs del otro. Cada una de las transformadas puede modificarse
para ser direccin-able rotando primero el azimut de inters hacia el centro
de la imagen, luego efectuando la transformada deseada, y finalmente rotando el azimut de inters nuevamente a su posicin original. La red (dominio
lr) que se muestra en la figura 20 ilustra la disposicin descrita, con r como
el azimut de inters y i como el argumento de la transformada de imagen.
Los detalles de implementacin (y simplificacin) sern librados al lector,
pero la opinin del autor es que desplegar las imgenes de esta manera presenta al usuario los mtodos ms ergonmicos para ajustar y dar forma a la
imaginera espacial de la seal estreo. De hecho, todas las transformadas
presentadas hasta aqu son realizables a travs de una nica transformada de
imagen direccin-able (ej., ancho) seguida de una rotacin. Esto se debe,
por supuesto, a que todas las transformadas son meras rotaciones de uno o
ms ejes en uno de los dominios.
*

Direct-ability en el original en ingls. [N. de los T.]

150

+M

+L

+6
0

+R

-6
-12
-18
-24
+S

-S

-R

Figura 18. L-pan -15

-L

-M

+M

+L

+6
0

+R

-6
-12
-18
-24
+S

-S

-R

-L

-M

Figura 19. L-pan -30

151

L
R

Rotar (-r)

Imagen (i)

Rotar (r)

Ldir-i
Rdir-i

Figura 20. Agregado de direccin-abilidad a una transformada de imagen

Transformadas dependientes de la frecuencia


En la forma presentada, las transformadas resumidas antes son bastante
poderosas, y permiten a uno reformar y reubicar imgenes estreo con fines
tanto creativos como correctivos. Pueden tomarse decisiones creativas respecto del posicionamiento y la impresin, o efectuarse acciones correctivas
para resolver problemas con la imagen estreo. Al agregar la selectividad en
frecuencia a estas herramientas, no debera olvidarse la contribucin de las
implementaciones no dependientes de frecuencia. Evidentemente, agregar
discriminacin de frecuencia a las transformadas vistas extiende el rango de
posibles intervenciones en la imagen, con resultados ms predecibles en unas
que en otras.
La selectividad en frecuencia puede ser agregada, principalmente, a travs
de la utilizacin de algn tipo de red de crossovers.* La red exacta puede variar.
En el caso ms sencillo, puede imaginarse la separacin de una seal de entrada en dos bandas de frecuencia, y la posterior transformada de una, mientras la
otra permanece intacta. La figura 21 ilustra la red descrita. Para un caso simple
como este, la red de crossovers debera (probablemente) ser ecualizada en fase,
de modo que la fase de la frecuencia del crossover sea equiparada en ambas
bandas. La muy conocida red de Linkwitz-Riley posee esta caracterstica
(Bohn, 2005) y es por eso una eleccin razonable en este caso. Dependiendo
de la aplicacin, tambin se pueden utilizar redes ecualizadas en fase ms
complicadas. En algunos casos estos crossovers pueden ser implementados
como redes unitarias de retroalimentacin (Gerzon, 1976b), aunque pueden
tambin emplearse redes fir. Esto no quiere decir, sin embargo, que las redes
no compensadas en fase no hayan sido utilizadas, en la prctica, para algunas
aplicaciones. En general, las redes de crossovers no compensadas en fase no son
recomendables, porque pueden introducir una distorsin de fase desagradable
en la seal estreo resultante, lo que es usualmente indeseado.
*

Se conserva su denominacin en ingls, dado que es de uso corriente en la ingeniera de


audio de habla hispana. [N. de los T.]

152

La
Ra
L
R

Red de
crossover

Imagen (i)

Lb
Rb

Lxover-i
Rxover-i

Figura 21. Agregado de dependencia de frecuencia a una transformada de imagen

Ecualizacin espacial
Desde las investigaciones iniciales de lord Rayleigh acerca de la audicin
(1907), ha habido conciencia de que diferentes mecanismos entran en juego
para la audicin de frecuencias bajas y altas. Sin entrar en los detalles de
estos dos (o ms) mecanismos, nuestro inters por la reproduccin estreo es
el resultado de que las frecuencias bajas en la imagen estreo parecen extenderse a travs de un ngulo ms estrecho que las frecuencias altas; o, en otras
palabras, el escenario de baja frecuencia parece ms estrecho que el de alta.
La patente de Blumlein de 1931 sent las bases para un tipo de procesamiento
usualmente denominado entremezcla estreo* (Clark, Dutton y Vanderlyn,
1958; Harwood, 1968; Gerzon, 1986). De entre estas tcnicas, resulta de particular inters el proceso que Griesinger (1986) ha denominado ecualizacin
espacial, implementado por primera vez a mediados de la dcada de 1950
como parte del sistema estereosnico para balancear el ancho estreo de los
escenarios de baja y alta frecuencia. A partir de nuestra breve discusin acerca
de la selectividad en frecuencias, pueden imaginarse sus posibles implementaciones. Las frecuencias bajas y altas deben estar separadas, ser procesadas
en ancho de manera acorde y luego sumarse, dando lugar a una imagen que
parecer tener el mismo ancho estreo a travs de los escenarios de alta y baja
frecuencia. El autor encuentra en el uso de una red Linkwitz-Riley de segundo
orden el crossover ms conveniente, siendo ajustado el ancho del escenario
bajo, en lugar del alto. Griesinger (1986), Gerzon (1986, 1994) y Lipshitz
(1986), Lipshitz, Griesinger y Gerzon (1987) han discutido en detalle la ecualizacin espacial y sus aplicaciones. El estudio de Gerzon es bastante largo e
*

Stereo shuffling, en el original en ingls. La expresin alude a una mezcla desordenada


(shuffling) en analoga a cmo se mezcla un mazo de naipes antes de jugar. [N. de los T.]

153

informativo, a los lectores interesados se les sugiere consultar su clarificante


discusin de este tpico.
El autor considera a la ecualizacin espacial una parte indispensable del
juego de herramientas del ingeniero de grabacin purista. En tanto admiradas
por su claridad y definicin de imagen, las tcnicas de microfoneo de punto
coincidente nico son a menudo criticadas por su falta de espaciosidad
al compararlas con tcnicas de micrfonos espaciados.9 Mediante el ensanchamiento del escenario de baja frecuencia, la imagen de una grabacin
coincidente puede ser apropiadamente expandida, reteniendo aun la claridad
en definicin de la imagen admirada en esta tcnica y habitualmente perdida en grabaciones no coincidentes. De manera similar, las imgenes estreo
construidas en el estudio con seales mono posicionadas con potencimetros
de panormico pueden mejorarse a travs de la aplicacin de la ecualizacin
espacial, ensanchando la imagen y expandiendo un sentido de inmersin espacial y estabilidad al emparejar los escenarios de alta y baja frecuencia. Es por
estas razones, y las de ms atrs, que el autor se sorprende de la no inclusin
regular de la ecualizacin espacial como parte del conjunto de herramientas
estndar de las estaciones de trabajo de audio digital estreo, particularmente
si se considera que esta tcnica ha sido presentada en la literatura especializada hace ya algn tiempo.
Dispersin estreo
A pesar de la variedad de arquitecturas que han aparecido en la literatura
especializada, en sus orgenes, la dispersin estreo puede ser considerada
como la aplicacin de una rotacin selectiva a una imagen estreo. El objetivo
es ensanchar una imagen mediante la rotacin o dispersin de frecuencias
de una entrada a travs del escenario estreo. En el caso ms simple (y menos
efectivo), una entrada puede ser dividida en dos bandas, donde graves y agudos son rotados entonces hacia ngulos opuestos. El resultado ser una salida
en la que la imagen rota a travs del escenario estreo a medida que la frecuencia aumenta. Para este ejemplo, nuestra percepcin probablemente ser
la de una imagen dividida y no fundida, ms que la de una que ha sido ensanchada. Sin embargo, con las etapas de rotacin dependiente de la frecuencia
suficientes (en el orden de las bandas crticas), la imagen parecer fundida, y
sus elementos tomarn un ancho adicional. En particular, para sonidos mono
posicionados con potencimetros de panormico, ests imgenes pueden lle9

Lipshitz ha notado que la espaciosidad en tcnicas no coincidentes es usualmente el


resultado de pistas de localizacin conflictivas, faltantes o confusas.

154

varse de simples imgenes puntuales a imgenes ensanchadas con una amplia


sensacin de cuerpo.
La implementacin inicial de Orban (1970) aplica un mtodo que da
como resultado filtros cuyas fases no son coincidentes entre los canales L y
R.10 Es posible argumentar que tal configuracin puede ser deseable, dado que
el objetivo es extender el ancho de una imagen de entrada y la incongruencia de fase puede agregarse para una sensacin de ensanchamiento. Se ha
argumentado contra este enfoque en especial debido al incremento fsico*
resultante en la imagen. Aun as, el autor ha encontrado al mtodo de Orban
prctico y apto con el debido cuidado para una variedad de materiales
sonoros, especialmente si tenemos en cuenta su fcil implementacin. Gerzon
(1992; 1997) ha demostrado un nmero de arquitecturas de red alternativas,
todas dispuestas a mitigar el aspecto fsico del enfoque de Orban. Tal vez la
ms ingeniosa de ellas implica el uso de una red de retroalimentacin unitaria
para crear una red de rotacin dependiente de la frecuencia y compensada en
fase. El lector interesado puede referirse a la discusin detallada de Gerzon al
respecto.

Otras transformadas
Ciertamente, la imaginacin es el lmite para las aplicaciones creativas
dependientes de la frecuencia. Lo mismo podra decirse para tareas ms
correctivas o de reparacin. Esta clase de esfuerzos puede ser habitualmente
hallada en una etapa de masterizacin o posterior a una grabacin en sitio,
donde se ha obtenido una mezcla estreo pero los elementos originales no
estn ya disponibles para armar una nueva mezcla estreo. Como ejemplo
de esto, imagine una grabacin estreo con un cantante en el centro del
escenario estreo y un platillo hi-hat que ha sido colocado en un azimut
del panormico estreo que es considerado ahora incorrecto o inapropiado.
Una primera idea podra sugerir el uso de una rotacin dependiente de la
frecuencia, dividiendo la imagen en agudos y graves, o mejor an, una red
de crossovers seleccionando solo el rango de frecuencias ocupado por el
platillo. El rango elegido podra entonces ser rotado al azimut deseado, corrigiendo la posicin del platillo en la imagen estreo resultante. Una mayor
10

La implementacin inicial de Orban est limitada a entradas mono. Sin embargo, con
el agregado de la rotacin, Gerzon (1992) ha adaptado el mtodo de Orban para entradas
estreo.
* Phasiness en el original en ingls. [N. de los T.]

155

reflexin sobre este mtodo sugerir que el algoritmo de ms atrs puede


no ser el ideal. Muy probablemente, la banda de frecuencias seleccionada
incluir tambin sibilancia de la voz. Cuando el platillo no est tocando,
enmascarando la voz, probablemente aparezcan separados los fricativos de
la voz, y en nuestro caso, corridos fuera de eje en relacin al resto de la voz.
Por lo tanto, si bien esta intervencin corregira el platillo, introducira otro
problema para la voz.
Pensando un poco ms el resultado deseado, puede hacerse un mtodo
ms adecuado. En detalle, el problema es reposicionar el platillo seleccionado por su rango de frecuencias, mientras se retiene la posicin de la sibilancia del cantante en el centro. Revisando las transformadas discutidas, la
tarea descrita coincide con la realizada por la asimetra. Ms que para rotar la
banda seleccionada, la asimetra puede usarse para mover el platillo al tiempo que se mantiene la sibilancia vocal centrada y en su lugar. Se describen
aqu algunas opciones, pero la implementacin de una red de seleccin de
frecuencias se dejar al lector. La ms simple de ellas es el empleo de un par
de filtros pasabanda y rechazabanda, de amplitudes complementarias pero
no coincidentes en fase. Dependiendo de la cantidad de asimetra aplicada, la distorsin de fase adicional puede ser mnima y bastante aceptable.
Como segunda estrategia se podra elegir una aproximacin de LinkwitzRiley, con pares de filtros pasabanda y rechazabanda dispuestos a la manera
Linkwitz-Riley. Tal tipo de red no induce distorsin de fase, por lo que
puede ser preferible en algunas circunstancias y considerarse una solucin
ms general. Ms especulativamente, y aunque el autor no ha intentado
hacerlo, sera posible implementar el algoritmo deseado como una red de
retroalimentacin unitaria. Si bien no es la ms sencilla de las opciones,
dado que las redes de retroalimentacin unitarias no son particularmente
intuitivas, esta aproximacin podra ser una solucin elegante, llevando a
un resultado no fsico, con cambios suaves y balanceados de la imagen a
travs de la frecuencia.
Como uno esperara, el conjunto de algoritmos de imagen discutidos ms
arriba puede ser adaptado y modificado mediante una variedad de dependencias de frecuencia, dando como resultado una amplia gama de oportunidades
creativas y reparadoras de imagen para el practicante del audio. Si bien solo
algunas pocas han sido discutidas en esta seccin, muchas ms son posibles y,
de hecho, deseables. Un cuidadoso examen y la consideracin de los ajustes de
imagen disponibles en cada una de las transformadas seno-coseno por s solas
puede, con el agregado de la seleccin de frecuencias, conducir al lector hacia
nuevas herramientas y mtodos.

156

conclusiones
Ms all de la rotacin en s, hemos visto que las transformadas de imagen
estreo clsicas aqu exploradas son meras modificaciones de la transformada
de rotacin (panormico seno-coseno para estreo) en un dominio (lr o ms) u
otro. El ancho y el balance son equivalentes entre los dominios: el ancho rota
los ejes lr juntos, mientras que el balance hace lo mismo para los ejes ms. El
m-pan y la asimetra tienen correspondencia con l-pan y r-pan; el m-pan y la
asimetra rotan solo el eje M y el eje S, respectivamente, mientras que l-pan
y r-pan actan sobre los ejes L y R como sus nombres lo indican. Adems,
las transformadas de eje nico (m-pan, asimetra, l-pan y r-pan) estn, como
sera de esperarse, vinculadas cercanamente a las transformadas de dos ejes
(ancho, balance). El m-pan y la asimetra pueden pensarse como dos versiones
del balance, llevando a sus extremos los ejes ms juntos. La diferencia, en la
imagen final, tiene que ver con las posiciones de azimut finales de los ejes en
la imagen resultante. Por ejemplo, el balance con un b igual a +45 reflejar
una imagen similar, salvo por el azimut resultante, a una asimetra con un a
igual a -90. Ambos devolvern la entrada L con una ganancia de +3 dB; sin
embargo, el balance mantiene a L en su lugar, mientras la asimetra ha dejado
a M fijo, dando como resultado a L en el medio de la imagen. Un m-pan con
el m igual a +90 da como resultado a L en el eje S. Las mismas relaciones
guardan validez para el ancho, y l-pan y r-pan; y hemos mencionado que, en la
prctica (nicamente para estrechar), el ancho es implementado por usuarios
de mezcladoras estreo por hardware o software habitualmente a travs del
panormico de los canales izquierdo y derecho en forma independiente.
Dado que las ecuaciones de cada una de las transformadas han sido presentadas, se ofrece al lector la oportunidad de implementar, escuchar e incorporar estas poderosas herramientas dentro de su prctica creativa con el audio,
ganando control sobre algunos de los atributos espaciales importantes codificados en una seal estreo. Y si bien no ha sido investigada en detalle aqu,
se ha presentado la utilsima nocin de direccin-abilidad de las imgenes
bsicas, inspirando idealmente ms experimentacin y exploracin. De modo
similar, han sido abordadas algunas instancias de aplicaciones que dependen
de la frecuencia, sugiriendo posibilidades para algunas intervenciones ms
imaginativas y reparadoras de un escenario estreo. Asimismo, y siendo demasiado numerosas para mencionarlas en detalle, las modificaciones adicionales
(ej., dependencia de amplitud, modulacin regular o irregular, modulacin
dependiente de amplitud y/o frecuencia, etc.) pueden sumarse para crear una
amplia variedad de efectos espaciales interesantes y atractivos al odo. Todo
esto a partir de la humilde ley de panormico seno-coseno!
157

Bibliografa
Blumlein, A. D. (1931), Improvements in and relating to Sound-transmission,
Sound-recording and Sound-reproducing Systems, Patente britnica
394,325 [reimpreso en Eargle, J. (ed.) (1986), Stereophonic Techniques,
Nueva York, Audio Engineering Society, pp. 32-40].
Bohn, D. (2005), Linkwitz-Riley Crossovers: A Primer, RaneNote 160, Rane
Corporation (<http://www.rane.com/pdf/ranenotes/Linkwitz%20Riley%20
Crossovers%20Primer.pdf>, consultado el 6 de noviembre de 2007).
Clark, H. A. M., G. F. Dutton y P. B. Vanderlyn (1958), The Stereosonic
Recording and Reproducing System, Journal of the Audio Engineering
Society, 6 (2), pp. 102-117.
Dhomont, F. (1996), Notes for Ls derives du signe, Acousmatic, What is it?,
Montreal, Empreintes Digitales, imed 9608, cd, pp. 24-26.
Dooley, W. L. y R. D. Streicher (1982), M-S Stereo: A Powerful Technique
for Working in Stereo, Journal of the Audio Engineering Society, 30 (10),
pp. 707-718.
Gerzon, M. A. (1976a), Blumlein Stereo Microphone Technique, Journal of
the Audio Engineering Society, 24 (1), pp. 36, 38.
(1976b), Unitary (energy-preserving) multichannel networks with
feedback, Electronic Letters, 12 (11), pp. 278-279.
(1986), Stereo Shuffling. New Approach Old Technique, Studio
Sound, 28 (7), pp. 122-130.
(1990), Fixing It Outside The Mix, Studio Sound, 32 (9), pp. 78, 81,
82, 85, 86, 88, 90, 93.
(1992), Signal Processing for Simulating Realistic Stereo Images,
Preprint No. 3423, 93rd Convention of the Audio Engineering Society, San
Francisco.
(1994), Applications of Blumlein Shuffling to Stereo Microphone
Techniques, Journal of the Audio Engineering Society, 42 (6), pp. 435-453.
(1997), Stereophonic Signal Processor, Unites States Patent 5,671,287.
Griesinger, D. (1986), Spaciousness and Localization in Listening Rooms
and Their Effects on the Recording Technique, Journal of the Audio
Engineering Society, 34 (4), pp. 255-268.
(2002), Stereo and Surround Panning in Practice, Preprint No. 5564,
112th Convention of the Audio Engineering Society, Munich.
Harwood, H. D. (1968), Stereophonic Image Sharpness, Wireless World 74,
pp. 207-211.
Julstrom, S. (1991), An Intuitive View of Coincident Stereo Microphones,
Journal of the Audio Engineering Society, 39 (9), pp. 632-649.
158

Kendall, G. S. (1995), The Decorrelation of Audio Signals and Its Impact on


Spatial Imagery, Computer Music Journal, 19 (4), pp. 71-87.
Lipshitz, S. P. (1986), Stereo Microphone Techniques: Are the Purists
Wrong?, Journal of the Audio Engineering Society, 34 (9), pp. 719-744.
, D. Griesinger y M. A. Gerzon (1987) Comments on Spaciousness
and Localization in Listening Rooms and Their Effects on the Recording
Technique and Stereo Shuffling. New Approach Old Technique and
Authors Replies, Journal of the Audio Engineering Society, 35 (12), pp.
1013-1014.
Malham, D. G. (1998), Approaches to spatialisation, Organised Sound, 3
(2), pp. 167-177.
Orban, R. (1970), A Rational Technique for Synthesizing Pseudo-Stereo
from Monophonic Sources, Journal of the Audio Engineering Society, 18
(2), pp. 157-164.
Lord Rayleigh (J. W. Strutt, tercer Barn de Rayleigh) (1907), On our perception of sound direction, Philosophical Magazine, 13, pp. 214232.
Rumsey, F. (2002), Spatial Quality Evaluation for Reproduced Sound:
Terminology, Meaning, and a Scene-Based Paradigm, Journal of the
Audio Engineering Society, 50 (9), pp. 651-666.
Windsor, L. (2000) Through and around the acousmatic: the interpretation of electroacoustic sounds, en Emmerson, S. (ed.), Music, Electronic
Media and Culture, Aldershot, Ashgate Publishing, pp. 7-35.
(Traduccin al espaol de Juan Pampin y Hernn Kerlleevich)

159

Captulo v
El espacio acstico tridimensional y su simulacin
por medio de Ambisonics
Dave Malham

Consideraciones fisiolgicas
Para entender las formas en las que los compositores electroacsticos han
usado el espacio en la msica, es apropiado considerar a la msica en el espacio o, ms precisamente, a las tecnologas que se pueden usar para realizar los
deseos musicales del compositor. Para comprender cmo funcionan, resulta
til revisar brevemente los mecanismos conocidos que los humanos usamos
para adquirir informacin acerca de las caractersticas espaciales de los campos
sonoros que nos rodean constantemente. Se debe sealar que la siguiente lista
no debe ser considerada como exhaustiva, dado que no es para nada claro que
nuestro actual nivel de conocimiento (hasta el 2007) se pueda considerar
completo.
Mecanismos de percepcin de la direccin
Diferencias temporales de llegada entre los dos odos. Una fuente sonora ubicada
en cualquier punto de una lnea trazada desde el frente hacia arriba y hacia
atrs (el plano medio) producir un frente de onda que llegar a los dos odos
simultneamente. Al mover la fuente afuera de esta lnea, un odo comenzar
a recibir el frente de onda antes que el otro. Esto se conoce como diferencia
interaural de tiempo o itd (Interaural Time Difference).* La diferencia mnima
entre los tiempos de llegada que puede ser percibida depende de la naturaleza
del sonido y vara entre 5 y 1,5 microsegundos (Begault, 1994, p. 44).
Diferencias de nivel entre los dos odos. El sonido de una fuente a la izquierda
de la cabeza, por ejemplo, llegar directamente al odo izquierdo, pero ser
*

Por razones de prctica habitual en el rea, en este artculo se usarn trminos y siglas que
provienen de la denominacin en ingls. [N. del T.]

161

difractado alrededor de la cabeza para alcanzar al odo derecho. Su amplitud


ser menor en el odo derecho que en el izquierdo, como resultado tanto del
efecto de obstruccin de la cabeza como, en una menor medida, del efecto de
distancia extra recorrida. Esto se conoce como diferencia interaural de nivel o
ild (Interaural Level Difference).
Diferencias en la respuesta a frecuencia. La forma de la cabeza y las partes externas de los odos producen una respuesta dependiente de frecuencia que vara
de acuerdo con la posicin del sonido y que es, en general, diferente para cada
odo. Esto se conoce como funciones de transferencia relativas a la cabeza o hrtf
(Head Related Transfer Functions) pero, estrictamente hablando, las hrtf tambin incluyen las ild y las itd. Por esta razn se las designa a menudo respuesta
de frecuencia relativa a la cabeza o hrfr (Head Related Frequency Response) para
indicar que los componentes no dependientes de la frecuencia han sido ignorados. Para posiciones donde las ild o itd dan diferencias ambiguas o inexistentes entre las seales de los odos (tal como las seales en el plano medio) o
donde el oyente posee poca o nula audicin en un odo, este es el mecanismo
sensor de posicin principal si no se involucran movimientos de la cabeza. Es
tambin uno de los dos mecanismos principales para distinguir las fuentes de
sonido frontales de las fuentes traseras.
Movimientos de la cabeza. Nuestra habilidad para cambiar la posicin de nuestra cabeza de tal manera que minimizamos el itd, ild y la diferencia entre las
hrfr en los dos odos. Esta diferencia mnima est, o debera estar, en el punto
en el que estamos enfrentando directamente hacia (o en contra de) la fuente
sonora. Esto es tambin la base del otro (posiblemente principal) mecanismo
para la discriminacin frente-atrs que constituye la percepcin de la direccin
de cambio de las itd y las ild con movimientos de cabeza.
De estos mecanismos, el itd es ms importante que el ild para sonidos de
baja frecuencia (<700Hz), el ild es ms relevante para las frecuencias altas en
las que hay un contenido restringido de frecuencias bajas, y el itd tambin es
el indicio ms fuerte para la ubicacin de ruido de banda ancha (Macpherson
y Middlebrooks, 2002).
Mecanismos de percepcin de la distancia
Los mecanismos precedentes tratan mayormente las posiciones angulares de
las fuentes de sonido. Nuestra habilidad en la determinacin de la distancia
de una fuente sonora se basa en los siguientes indicios:
162

Reverberacin. Es la proporcin entre sonido directo y reverberado. En un


entorno razonablemente reverberado, la energa en el campo reverberado
permanece ms o menos constante para todas las combinaciones de ubicacin
oyente/fuente, lo que significa que para un nivel de fuente dado, la intensidad
de la reverberacin permanece igual mientras que la intensidad de la fuente
disminuye con el incremento de la distancia. Es este factor en particular el
que dificulta la ubicacin de un objeto sonoro ms cerca que el altoparlante
ms cercano en un sistema de difusin.
Reflexiones tempranas. El diseo de direcciones y retardos de las reflexiones
tempranas desde las superficies del entorno cambian en una forma que es
dependiente tanto de las posiciones del oyente como de las de la fuente de
sonido.
Intensidad. La intensidad se reduce con la distancia debido a la dispersin del
frente de onda.
Proporcin de variacin de la intensidad. Fuentes cercanas muestran mayores
variaciones en intensidad ante movimientos y/o giros de la cabeza, dado que el
cambio en la distancia constituye una fraccin mayor del total de la distancia
a la fuente que en fuentes ms lejanas.
Prdida de altas frecuencias. Las frecuencias altas son progresivamente atenuadas con la distancia, mayormente debido a la absorcin de las molculas de
agua en la atmsfera. Esto vara con los niveles de frecuencia y humedad, con
un pico mximo en xx% humedad.
Para fuentes sonoras con una silueta fsica (i.e., no la fuente puntual de sonido
hipottica, que no existe en la naturaleza, a pesar de que existen sus aproximaciones cercanas), se producen cambios espectrales en la medida en que la
forma angular del objeto cambia (Malham, 2001).
Distorsin relacionada con el aire. Para altos niveles de presin sonora, el incremento de la distorsin con la distancia de la fuente, que resulta de las diferentes
velocidades de propagacin de los picos positivos y negativos de la onda de
presin (Czerwinski et al., 2000), es un indicio extra posible para la distancia
de la fuente.
Si hay diferencias interaurales de nivel, estas se incrementan en la medida
en que la fuente sonora se aproxima a la cabeza como resultado del hecho de
163

que la diferencia en distancia deviene una fraccin mensurable de la distancia


total. Por ejemplo, la ild puede aumentar de 4 a 20 dB para una fuente a 90
en la medida en que la distancia desde la cabeza disminuye de un metro a
pocos centmetros.
Estas diferencias interaurales de nivel son mucho ms sensibles a los movimientos de la cabeza cuando la fuente sonora est cerca de la cabeza, nuevamente como resultado de que la diferencia en distancia deviene una fraccin
mensurable de la distancia total.
Hay un filtrado pasabajos efectivo de las fuentes cercanas a la cabeza. Esto
resulta de una combinacin de la sombra acstica de la cabeza para el odo
ms lejano a la fuente sonora y la difraccin en el odo ms cercano.
Un efecto conocido como paralaje acstico produce que algunas de las
caractersticas de altas frecuencias de la hrtf en el odo ms cercano resulten corridas en el azimut a causa del cambio en la relacin geomtrica entre
la fuente de sonido, el odo y el centro de la cabeza en la medida en que el
objeto se mueve desde el campo lejano al cercano. Este corrimiento puede ser
de 40 o ms.
Un cambio de timbre del sonido directo en comparacin con el sonido
reverberado, como resultado del cambio de la respuesta a impulso que ocurre
cuando objetos con una superficie radiante mayor que la longitud de onda del
sonido que emiten se encuentran cerca del oyente.
La interpretacin de muchos de estos indicios es, por supuesto, depende en
gran medida del conocimiento adquirido tanto acerca del espectro como de la
intensidad de la fuente sonora, circunstancia que debiera ser considerada cuando se usan objetos sonoros muy manipulados o totalmente artificiales. Es sabido
que la intensidad como indicio de distancia constituye, en particular, un valor
muy dudoso, ya que experimentos en cmaras anecoicas (Nielsen, 1993) han
mostrado que los sujetos cometen errores de ms del doble cuando son interrogados para estimar la distancia de una fuente sonora basndose puramente en
la amplitud. Hay algunos efectos posteriores en el campo cercano, cuya discusin se puede encontrar en Brungart (Brungart, Durlach y Rabinowitz, 1999)
y en Kopo (Kopo, Santarell y Shinn-Cunningham, 2000). Se debe advertir
tambin aqu que estas no son las nicas maneras en las que el cuerpo adquiere
informacin sobre los sonidos y que algunos de los otros mecanismos perceptivos pueden tambin proveer indicios de direccin. Desafortunadamente,
164

a causa de las dificultades en el trabajo experimental en cuestiones como la


percepcin a travs de la cavidad del pecho o en mecanismos de conduccin
de los huesos, hay pocos trabajos publicados en estos medios de recoleccin de
informacin acstica y sus posibles capacidades de discriminacin direccional.
En vez de esto, a causa de la relativa facilidad con la que se pueden hacer
mediciones basadas en auriculares, casi todos los ms importantes estudios
de audicin direccional se han concentrado en informacin presentada en
auriculares. Experimentacin informal realizada por el autor, sin embargo, ha
mostrado que dichos mecanismos de percepcin de sonido no aurales necesitan
ser investigados ms profundamente. En particular, hay una razn para creer
que la cavidad del pecho puede jugar un rol en la discriminacin direccional de
bajas frecuencias y que la creencia sostenida comnmente de que no podemos
determinar la direccin de fuentes usando frecuencias muy bajas, en donde la
diferencia de fase entre los dos odos resulta muy pequea, puede ser cierta solo
para presentaciones en auriculares. Si se probara, esto tendra serias implicaciones para sistemas de difusin en donde las frecuencias bajas se presentan a
travs de un nmero limitado de altoparlantes de baja frecuencia (subwoofers),
o donde la reproduccin se realiza nicamente con auriculares.

Cuestiones perceptivas
Los humanos poseen una holstica e integrada capacidad de percepcin direccional de la cual los mecanismos de audicin direccional descriptos antes
son solo una parte. Sin embargo, estos representan los mecanismos a los que
se debe amoldar cualquier sistema de audio que busca presentar sonido con
caractersticas espaciales. En la medida en que nos movemos hacia sistemas
que pueden presentar sonido en una forma realista (vase, no obstante, la
seccin sobre realidad), necesitamos informacin acerca de qu es significativo perceptivamente para guiar los desarrollos.
Los estudios perceptivos del pasado se han concentrado largamente en el
sistema visual, habindose considerado ampliamente como el trabajo seminal
en este tema a lo publicado por Gibson un cuarto de siglo atrs (Gibson,
1979). Se realizaron originariamente intentos de extender este trabajo al sistema auditivo directamente, pero result claro que esto no poda tener xito
a causa tanto de las diferencias cualitativas (Lennox, Myatt y Vaughan, 2001)
como cuantitativas entre ambos. Estas diferencias incluyen:
Escuchar es ms verdaderamente tridimensional, en el sentido en que podemos or cosas en todas las direcciones simultneamente con solo variaciones
165

menores en sensibilidad, mientras que la vista se restringe a cerca de un cuarto


del espacio que nos rodea.
No podemos cerrar voluntariamente nuestra audicin, pero la vista puede
interrumpirse cerrando los ojos.
La mayora de las cosas que escuchamos concientemente son en s mismas
la fuente de sonido que escuchamos (aun a pesar de ecos muy intensos), pero
la mayora de las cosas que vemos son, ms o menos, reflectores pasivos, y
entonces estamos ms concientes de las fuentes sonoras como participantes
activas de nuestro mundo.
Adems del hecho de que la audicin comprende un espectro mucho ms
ancho que el de la vista (aproximadamente diez octavas contra tres cuartos de
una octava), la audicin la aventaja en el dominio temporal (con una capacidad efectiva de resolucin de 5S en algunos procesos), en el que la vista
es bastante pobre, si bien es menos capaz que la audicin en el dominio de la
frecuencia. La audicin, sin embargo, es a menudo considerada como menos
capaz en el dominio de la frecuencia que la vista, que puede resolver cientos
de colores por octava. Seguramente, la audicin no es tan capaz como la vista
en el dominio espacial.
La audicin es significativamente menos capaz que la vista, cerca de un 90%
de precisin (Ashmead, Le Roy y Odom, 1990), en proveer una estimacin
exacta de distancia (Abrahams y Landgraf, 1990).
La investigacin en percepcin de audio, particularmente respecto de campos
de sonido tridimensionales, brinda datos tiles acerca de los factores en un
campo sonoro a los que los humanos asignan mayor significacin. Para el
ingeniero que disea un sistema de (re)produccin estos datos son una fuente
importante acerca de en qu reas debe concentrarse cuando trata de llegar
a un punto de equivalencia con la realidad. Para el compositor que desea usar
sonido espacial, pueden proveer una gua sobre cules gestos musicales pueden
ser realmente perceptibles (y bajo qu circunstancias) y, por consiguiente,
merecedores de ser considerados para propsitos compositivos. Esto es til,
ya que es fcil forjarnos convicciones que no nacen de la prctica acerca de
qu podemos escuchar, basndonos en lo que podemos ver. Por ejemplo, en
el libro de Wishart de 1985, On Sonic Art, encontramos dibujos de un gran
nmero de posibles gestos espaciales diferentes (Wishart, 1985) cuando
muchos de ellos seran, en la prctica, indistinguibles unos de otros.
166

Resulta ampliamente, pero quiz errneamente, aceptado que cuando


hablamos acerca de nuestra percepcin de lo que llamamos realidad, el sentido visual es el preeminente.1 Ciertamente, el sentido visual normalmente
tiende a ser considerado como ms importante que el sentido de la audicin.
Este autor sostendr que este punto de vista representa una seria distorsin de
la realidad. Considere su sitio favorito al aire libre. Este puede ser, quiz, un
lugar junto al mar con luz solar centelleando desde las olas en frente de usted,
riscos escarpados detrs, los sonidos de las olas en la playa y las gaviotas arriba.
O tal vez sea una escena en un campo en donde le prestamos ms atencin a
la silueta de las sierras y el prpura de los matorrales, con los puntos blancos
de las ovejas esparcidos en ellos. El sonido del viento movindose a travs de
los matorrales, el balido de las ovejas y el canto plaidero del zarapito tienden
a estar en un plano secundario, tal como lo estaban las gaviotas en la playa.
Ms aun, imagine esas escenas sin los sonidos. Sin estos, ellas ya no son ms
una escena verosmil que vive y respira. Sin el paisaje sonoro correcto, pierden
mucho de su profundidad, transformndose solo en otra fotografa.
Esta prdida de realidad que ocurre cuando el sonido est ausente o se
presenta inadecuadamente al oyente, es aun ms pronunciada cuando la escena es una realizacin artificial de la realidad. Slo es necesario considerar lo
que ocurre cuando la banda de sonido se pierde en un film o en un programa
de la televisin para advertir que este es, de hecho, el caso. El corolario de
esto es que, al menos cuando estamos tratando de capturar/reproducir realidad
(sin importar lo que realmente sea), necesitamos esforzarnos para asegurar
que el grado de equivalencia con la realidad que consigamos sea tan alto como
sea posible. Si deseamos que un sistema produzca realidad sonora completa, es
obviamente necesario que todos los puntos de partida de la equivalencia con
la realidad en el sistema estn por encima de los umbrales relevantes de la percepcin. Por supuesto, como se mencion antes, el/la compositor/a de msica
electroacstica puede tener requerimientos especficos que involucran no solo
el uso de este criterio para los sonidos en su composicin. Las necesidades
compositivas pueden de hecho ser para sonidos no reales, parcialmente reales
o aun hiper-reales (Field, 1998).
Cuando se trata con eventos musicales la importancia del elemento
visual puede ser disminuida o hasta ausente. Sin duda, como se discuti
antes, la ausencia de elementos visuales es menos problemtica que la ausencia de sonido cuando se intenta proveer un sentido de realidad. Despus de
todo, estamos bastante acostumbrados a sonidos que no tienen una fuente
1

Excepto, posiblemente, para personas con una discapacidad significativa en su sentido de


la visin.

167

inmediatamente evidente a nuestros otros sentidos, as que esto no es percibido necesariamente como inusual o engaoso. Las experiencias visuales
sin una fuente fsica que los acompae, por el otro lado, son menos usuales
y percibidas como engaosas, posiblemente a causa de su asociacin con
perturbaciones visuales durante la enfermedad. No obstante estos casos,
cuanto ms capaces sean nuestros sistemas de difusin de sonido de imitar la
realidad, ms opciones tendrn los compositores para explorar los elementos
espaciales en su msica.
Dos puntos deben fijarse en la mente cuando se examina lo que la
investigacin en percepcin nos dice: primeramente que la investigacin
en esta rea est todava largamente en sus primeros das, y que el desarrollo
de una suerte de aproximacin holstica que sea probablemente mejor en la
prediccin del rendimiento de un sistema en condiciones que no sean las de
laboratorio es todava objeto de considerable investigacin. En particular,
los datos cuantitativos sobre los mecanismos perceptivos no son, ni de cerca,
tan amplios como los que provienen de la investigacin de los mecanismos
subyacentes de adquisicin de datos pero, no obstante ello, el trabajo es al
menos de utilidad cualitativa para diseadores y compositores involucrados
en sonido tridimensional.
En segundo lugar, si el procesamiento off-line en tiempo no real es aceptable, las tcnicas de simulacin acstica estndar, ampliamente disponibles, ya
producen imgenes acsticas que son tanto suficientemente detalladas como
suficientemente precisas en sus errores para estar cerca de los lmites perceptuales. Sin duda, el mayor indicio de la irrealidad de las imgenes producidas
por estos sistemas es el hecho de que actualmente deben ser reproducidas como
una grabacin, produciendo as una falta de interaccin con el usuario. El rea
donde hay mayor necesidad de la informacin que produzca la investigacin
perceptiva la constituyen los sistemas en tiempo real, donde se necesita un
cierto grado de esquematizacin* por as decirlo (Lennox, Myatt y Vaughan,
1999) o simplificacin de la imagen. Sin embargo, dada la creciente disponibilidad de potencia de proceso digital, cabe preguntarse por cunto tiempo ms
esto seguir siendo as. Lo que se puede decir es:
Es fundamental que se provea al oyente de indicios consistentes o, al menos,
que la consistencia de los indicios sea similar a la que se obtendra en un
campo sonoro natural.
*

Se usa en el texto original el neologismo cartoonification, que viene de la palabra inglesa


cartoon (en espaol, dibujo animado) cuya traduccin textual es prcticamente imposible.
[N. del T.]

168

Dado que nuestra experiencia en el mundo real es de sonidos en un entorno, al menos la primera parte perceptivamente importante de la interaccin
del sonido con ese entorno, i.e., las primeras pocas reflexiones, deben ser
modeladas.
Los objetos sonoros raramente, si alguna vez, tienen patrones de radiacin
omnidireccionales o se comportan como si fueran fuentes puntuales.
Debe haber un paisaje sonoro detallado y creble en segundo plano, dado
que el entorno acstico en el que normalmente existimos es complejo y
nuestros mecanismos perceptivos han evolucionado para tratar los aspectos
espaciales de un objeto sonoro en relacin con dicho segundo plano.
Mientras que el cumplimiento de estos criterios es necesario para crear un
paisaje sonoro verosmil con los atributos de realidad aparente, algunos, o sin
duda todos, se pueden ignorar cuando se trata con lo que un compositor (o un
diseador de sonido) puede desear hacer. Sin duda, la irrealidad sonora puede
ser ms apropiada y muy bien estar en la verdadera naturaleza de lo que est
tratando de lograr musicalmente.

Ambisonics, sistemas de primer orden


El sistema envolvente Ambisonics es esencialmente una solucin tecnolgica
en dos partes al problema de codificar direcciones (y amplitudes) de sonidos
y reproducirlas en un sistema prctico de altoparlantes de una manera tal que
para oyentes centrales el sonido reproducido parezca correctamente ubicado.
Esto puede tener lugar en un escenario sonoro horizontal de 360 grados (sistemas pantofnicos) o en la esfera completa (sistemas perifnicos). El sistema
usa un conjunto de seales que se denominan formato B. En esta seccin se
propone tratar solamente el sistema de primer orden, basado en las ideas que
propusieron originalmente Felgett (1972), Gerzon (1973), Cooper (Cooper y
Shiga, 1972), Gibson et al. (Gibson, Christensen y Limberg, 1972) y otros. En
tal sistema de primer orden, se necesitan tres canales para transportar el audio
en sistemas pantofnicos con un canal ms agregado para sistemas perifnicos,
i.e., sistemas que consideran la altitud. Esta informacin codificada direccionalmente usa una formulacin de armnicos esfricos, que es un formato
eficiente que permite una fcil manipulacin de campos sonoros complejos.
La reproduccin requiere cuatro o ms altoparlantes, segn sea pantofnica o perifnica, el tamao del rea, etc. El mnimo prctico es cuatro si se
169

trabaja slo en el plano horizontal, y ocho si se requiere tambin altura. La


cuestin importante para sealar es que es innecesario considerar los detalles
reales del sistema de reproduccin durante la grabacin original o la sntesis,
con la nica excepcin de que se requiere un sistema de reproduccin capaz
de representar la altura si la dimensin vertical es esencial. Si se siguen las
especificaciones del formato B, y asumiendo que se usen combinaciones de
altoparlantes y decodificador apropiadas, entonces la operacin en diferentes
salas ser tan similar como la acstica local lo posibilite. En todos los otros
aspectos las dos partes del sistema, codificacin y decodificacin, son completamente independientes.
Ecuaciones de codificacin
En la versin ms simple de Ambisonics, el concepto de esfera unidad es
importante. Cuando se realizan panormicos con sonidos en el formato B, las
ecuaciones de codificacin asumen implcitamente que los sonidos sern ubicados en, o dentro de, una superficie esfrica que rodea al oyente. Se le asigna
a esta superficie un radio terico de 1. Ntese que si el sonido se mueve afuera
de esta esfera, i.e. si el radio excede 1, la informacin direccional no se decodificar correctamente y los sonidos tendern a tirar hacia el altoparlante
ms cercano. Esto significa que las coordenadas de la fuente de sonido deben
obedecer la siguiente regla:

x 2 + y 2 + z2 1

E. 1

en la que x es la distancia a lo largo del eje X (frente-atrs), y es la distancia


a lo largo del eje Y (izquierda-derecha) y z es la distancia a lo largo del eje Z
(arriba-abajo).2 Por supuesto, esta versin simple de Ambisonics no provee
explcitamente codificacin de la distancia. Indudablemente se asume, como
se mencion arriba, que todas las transformaciones ubicarn a los sonidos en
la superficie de la esfera unidad. Si se mueven adentro de la esfera (i.e. si la
parte izquierda de la ecuacin 1 es menor que 1), la fuente sonora se volver,
en general, cada vez ms difusa.
Cuando una seal monofnica se ubica en la superficie de la esfera,
2

Ntese que la denominacin convencional de los ejes en Ambisonics es la que se usa en


los estndares britnicos y europeos para los efectos de vibracin en el cuerpo humano, con
Z hacia arriba, X frente-atrs e Y izquierda-derecha, que es distinta de la notacin matemtica de Z arriba, X izquierda-derecha e Y frente-atrs, como as tambin de las variadas
convenciones relacionadas con grficos de computadoras.

170

entonces sus coordenadas se consideran en referencia con el centro frente,


segn las siguientes expresiones:
x = cos cos
y = sin cos
z = sin

E. 2

donde es el ngulo antihorario de rotacin desde el centro y es el ngulo


de elevacin arriba o abajo del plano horizontal.
Z

Fuente

X
Frente

Figura 1. Convenciones Ambisonics para los ejes y los ngulos

Estas coordenadas se pueden usar directamente para producir las seales de


salida del formato B (X, Y, Z y W), entonces:
W = (seal) 0,707
X = (seal) cos cos
Y = (seal) sin cos

Z = (seal) sin

E. 3

El escalar 0,707 en W, a pesar de no ser matemticamente riguroso, se deriva de consideraciones de ingeniera, o sea de la necesidad de asegurar una
distribucin relativa de los niveles de la seal en los cuatro canales. Esto
es particularmente relevante cuando se toma sonido en vivo con un micrfono Soundfield o con campos de sonido sintetizados que contienen varias
fuentes. Estas seales, que comprenden el as llamado conjunto de formato
171

B Ambisonics, describen esencialmente las salidas que se obtendran de un


conjunto de cuatro micrfonos coincidentes, uno omnidireccional (sensible a
la presin) y tres de figura en ocho (sensibles a la velocidad) que son mutuamente perpendiculares. Ya que esto es fsicamente imposible, el micrfono
Soundfield (Gerzon, 1975a; Farrah, 1979) logra un resultado aproximado
muestreando el sonido en la superficie de una esfera, que es acsticamente
pequea en relacin, usando cuatro cpsulas sub-cardiodes y luego aplicando
un proceso para crear la salida de formato B.
La alternativa es posicionar sonidos individuales en un campo sonoro de
formato B usando mecanismos de panormico basados en la ecuacin 3, pero
ntese que no hay informacin implcita de distancia incluida en estas frmulas.
En el pasado, los sonidos posicionados en formato B Ambisonics se ubicaban, o
bien en la superficie de una esfera unidad, o bien en el interior de esta.
En aquel momento, la mayora de los experimentos en Ambisonics se
hicieron en el dominio analgico, que haca difcil, por no decir imposible,
tratar efectivamente con los indicios de distancias ms importantes tales
como el patrn de primeras reflexiones y la proporcin entre sonido directo y
reverberado. Los indicios de distancia, si se usan, deben ser provistos por separado con el mnimo tamao de la esfera-unidad realmente determinado por
el tamao del arreglo de altoparlantes final. Los campos de sonido naturales,
tales como los grabados por el micrfono Soundfield, no tienen, por supuesto,
el problema de sintetizar indicios de distancia pero existe todava el problema
de reproducir correctamente sonidos cercanos. Se advirti desde una poca
temprana que si se hubieran implementado los controles Ambisonics digitalmente, la situacin hubiera cambiado (vase, por ejemplo, Malham, 1987).
Aun en el dominio analgico, una ley de ganancia relativa a la distancia
no se podra implementar fcilmente. Con la aparicin de proceso digital
ms accesible en la dcada de 1980, se le dio un nuevo mpetu al desarrollo
de controles digitales Ambisonics. La naturaleza de la ley de ganancia que
se requiere fue investigada experimentalmente en 1990 por Clarke (1990, p.
43) y Hood (1990, p. 10) y fue implementada empricamente por el autor en
1992 cuando se revis el programa Ambicont de Clarke (Clarke y Malham,
1992)3. Anteriormente a la revisin, Ambicont sufri el efecto (muy audible)
del cambio de signo sbito en los canales de primer orden en la medida en que
el sonido era paneado* a travs del centro del campo sonoro. Previamente a
la revisin, el procedimiento operativo estndar para tratar con esto era correr
3

Ambicont fue escrito por Clarke (1990) para el actual controlador de Soundfield programable digitalmente desarrollado por el autor (Malham, 1984).
* En ingls, panned, trmino muy comn en la ingenieria de audio, que indica el traslado

172

Figura 2. Arreglo de la cpsula del micrfono MkIII Soundfield

el plano en el que el movimiento se estaba realizando levemente del centro.


Esto fue formalizado por Dylan Menzies (Menzies, 1999, p. 91) al desarrollar
un algoritmo4 mejorado de distancia basado en sus estudios tericos. El algoritmo fue incorporado en su software Lamb (Menzies, 1999, p. 86).
Manipulaciones del campo sonoro
Es posible manipular con un relativo grado de facilidad campos sonoros completos que contengan muchas fuentes diferentes en posiciones diferentes, aun
los grabados naturalmente.
Las siguientes definiciones estndar5 acerca de la manera en que los
sonidos se mueven hacia posiciones nuevas se han adoptado para mantener
las ecuaciones coherentes y para minimizar la confusin que podra, tambin
gradual de una seal de audio entre varios canales mediante su multiplicacin por una
funcin determinada y que proviene de la palabra inglesa panoramic (en espaol, panormico). [N. del T.]
4 l acu posteriormente el trmino W-panning para esta concepcin (Menzies, 2002).
5 En algunos libros se usa una notacin diferente, relativa al uso en la industria aero-espacial.
En ella la rotacin se refiere como yaw, el ladeo como roll y la inclinacin como pitch.

173

fcilmente, ocurrir (los ngulos positivos de rotacin son antihorarios o, por


convencin, se usa la rotacin hacia la izquierda).*
Una rotacin se define como un movimiento circular en un eje predefinido, normalmente el eje Z, siendo esto lo mismo que un movimiento antihorario en el plano horizontal. Un ladeo se define como una rotacin en el
eje X. Esto es lo mismo que un movimiento antihorario en el plano vertical
(izquierda-derecha). Una inclinacin se define como una rotacin en el eje Y.
Esto es lo mismo que un movimiento antihorario en el plano vertical (frenteatrs), i.e. cuando miramos a la izquierda.
Rotacin
Z
Rotacin

Ladeo
Inclinacin

X
Frente

Figura 3. Manipulaciones del campo sonoro Ambisonics

Manteniendo estas definiciones en mente podemos, por ejemplo, rotar todo el


campo sonoro en el eje Z. Por simplicidad, considrese el caso de un campo sonoro consistente en una sola fuente de sonido con amplitud a ubicada en el plano
horizontal a un ngulo de la posicin central frontal. Si es el ngulo por el
cual el campo sonoro es rotado desde su posicin invariante, entonces las seales
de formato B derivadas usando la ecuacin 3 son transformadas como sigue:
X = (seal ) cos( + )cos
Y = (seal ) sin( + )cos

E. 4


donde X e Y son las seales de salida de formato B.
*

Respectivamente rotation, tilt y tumble, en el original en ingls de este artculo. [N. del T.]

174

Simplificando:

X = (seal ) cos (cos cos sin sin)


Y = (seal ) cos (cos sin + sin cos )

E. 5

Y sustituyendo en X y en Y:

X = X cos Y sin
Y = X sin + Y cos

E. 6

Los componentes W y Z resultan, por supuesto, invariantes por esta transformacin, ya que la rotacin es en el eje Z. Aplicando un procedimiento similar,
podemos derivar las siguientes ecuaciones para ladeo e inclinacin:
Ladeo
W= W
X = X
Y = Y cos Z sin

Z = Y sin + Z cos

E. 7

W= W
X = X cos Z sin
Y = Y
Z = X sin + Z cos

E. 8

Inclinacin

Estas ecuaciones se pueden combinar para ejecutar transformaciones tales


como una rotacin-ladeo que producen una rotacin angular del campo
sonoro de entrada completo en formato B hacia la izquierda por un ngulo
desde el centro-frente junto con un ladeo del mismo campo por un ngulo
del plano horizontal.
Rotacin-ladeo

W = W
X = X cos Y sin
Y = X sin cos + Y cos cos Z sin
Z = X sin sin + Y cos sin + Z cos

E. 9
175

Cualquier combinacin de estas operaciones es, por supuesto, posible, pero


el lector deber estar advertido de que, a diferencia de muchas operaciones
matemticas, las rotaciones no son conmutativas. En otras palabras, el orden
en el que las operaciones se realizan afecta la orientacin final del campo
sonoro, ya que todas las operaciones se consideran con respecto a la posicin
central de audicin y no respecto del campo sonoro. Para comprender esto,
considrese qu ocurre cuando primero rotamos un dado y luego lo inclinamos
(figura 4).
Pero si inclinamos el dado primero y luego lo rotamos, obtenemos un
resultado final diferente (figura 5).
Adems de estos movimientos de rotacin, son posibles varias operaciones, por ejemplo el reflejo (mirroring) y la dominancia.

Figura 4

Figura 5

Reflejo
El control original analgico para reflejo como se usa, por ejemplo, en la unidad Audio+Design Pan-Rotate,6 consiste en un control rotatorio que permite
al usuario mover el campo sonoro de formato B desde la reproduccin normal
a travs de un campo sonoro cada vez ms difuso, eventualmente alcanzando
un punto en donde no hay esencialmente informacin direccional. Emergera
desde esta regin siendo cada vez menos difuso, pero con las fuentes de sonido en posiciones diametralmente opuestas a sus posiciones originales. Esto
6

La unidad Audio+Design Pan-Rotate tena ocho entradas mono, cada una con su control
individual de panormico (nicamente horizontal), siendo las salidas de formato B de las
ocho mezcladas para formar la salida.

176

fue raramente usado, ya que la cualidad difusa de las ubicaciones del sonido
entre los extremos no les gust a la mayora de los usuarios. Esto se debi a
las limitaciones de la tecnologa de control analgica usada en esa poca. Las
transformaciones en espejo se realizaron por medio de una inversin controlable de los canales direccionales (X, Y, Z) de manera tal que sus ganancias
variaban desde +1 pasando por 0 hasta -1. Parcialmente a causa de que los
elementos de control en los panormicos-rotaciones eran potencimetros
normales y parcialmente a causa de que esto era ms flexible, no se ejecut
en el campo sonoro completo,7 sino por el contrario en cada control individualmente. La operacin se puede realizar mucho ms fcilmente en el campo
sonoro completo en el dominio digital y, de hecho, se puede realizar en una
manera tal que mucho de la caracterstica difusa se puede evitar. Ejecutando
la inversin a lo largo de un solo eje (digamos, el eje x) las fuentes en el plano
y-z perpendicular al eje x permanecen correctamente posicionadas aun en el
punto central. Esto sirve como un ensanchador de la percepcin del oyente
del campo sonoro y los sonidos ya no se mueven a posiciones diametralmente
opuestas sino, en cambio, a posiciones directamente opuestas a sus posiciones
originales. Esto es, un sonido a la izquierda en el frente se mueve hacia la
izquierda atrs, uno a la derecha atrs se mueve a la derecha al frente y as,
sucesivamente.
Dominancia
La dominancia a veces es llamada control de zoom a pesar de que, de hecho,
no funciona exactamente de la misma manera que los familiares lentes de
zoom en una cmara fotogrfica. La dominancia toma la forma de una transformada Lorentz del campo sonoro, una operacin corriente de la matemtica
de la relatividad (Weinberg, 1972). Gerzon public tres diferentes variantes
sobre esto. La ms reciente (Barton y Gerzon, 1992), provee dominancia hacia
adelante por medio de un nfasis Lorentz* usando las siguientes ecuaciones:
1
( + 1 )W + 8( 1 )X
2
1
X = ( + 1 )X + 2( 1 )W
2
Y = Y

Z = X

W =


7
*

E. 10

Ya que esto hubiera requerido usar un costoso potencimetro.


Lorentz boost, en el original en ingls. [N. del T.]

177

Sin embargo, en el diseo original para controles de campo sonoro, en donde


se llam control de ancho, se proveyeron las siguientes ecuaciones:
W = W + 2X
X = X + 2W
Y = Y 1 2

Z = X 1 2

E. 11

Vale la pena notar, sin embargo, que la versin que se usa en el micrfono
Soundfield original no altera los canales Y y Z (Farrah, 1979). En cada caso,
el efecto es el incremento de la ganancia de los sonidos en el frente para > 1
y simultneamente reducir la ganancia de los sonidos traseros, de esta manera
logrando que los que estn al frente parezcan ms cercanos y los que estn
atrs ms lejanos. A diferencia de los lentes de zoom pticos, sin embargo,
la separacin angular entre las fuentes frontales decrece y las fuentes traseras
se separan y, por supuesto, es slo el indicio de distancia, que no es el ms
importante, el que se manipula.
Ni la dominancia ni el reflejo estn limitados a actuar solo en uno de los
ejes predefinidos del campo sonoro. En el caso ms simple, es posible rotar
el campo sonoro (en tres dimensiones) de manera tal que el eje sobre el que
se desea operar quede alineado en frente-atrs antes de ejecutar la transformacin que se requiera en ese eje. Aplicando luego una rotacin inversa el
campo sonoro original ser restituido a su orientacin original y la accin del
proceso ocurrir a lo largo del eje deseado en el campo sonoro. Una concepcin ms directa sera, por supuesto, modificar las ecuaciones de dominancia
o reflejo directamente.
Ambisonics y la compatibilidad estreo
Las seales de formato B Ambisonics no son compatibles estreo, a pesar de
que con el procesamiento adecuado es posible generar el equivalente exacto
de la respuesta de un par cruzado de micrfonos. Esta concepcin se usa, por
ejemplo, en el micrfono Soundfield ST250 para producir un par estreo
tanto con patrones de polaridad como con ngulos intermicrfonos controlables. Sin embargo, hay un sistema de dos canales domstico (conocido como
uhj) que permite que mucha de la informacin horizontal de las seales W,
X e Y del formato B sea codificada en una matriz de manera tal que formen
una seal estndar de dos canales estreo. La compatibilidad mono y estreo
178

de las grabaciones uhj es muy buena, as que las grabaciones uhj bien hechas
realmente proveen una presentacin bastante fina cuando se reproducen en
un sistema estreo normal. Con un decodificador apropiado y cuatro o ms
altoparlantes ubicados horizontalmente, virtualmente se puede lograr toda la
ejecucin de un sistema completo de formato B horizontal (Gerzon, 1977a;
1977b).
Este mtodo de codificacin, conocido como codificacin uhj, se ha usado
para producir grabaciones Ambisonics compatibles con estreo, cintas magnetofnicas y transmisiones de radio. Las seales X, Y y Z se transcodifican en
dos canales usando la siguiente transformada:
Derecho = (0,0928 0,255 j)X + (0, 4699+ 0,171 j)W (0,3225 + 0,00855 j)Y
Izquierdo = (0,0928+ 0,255 j)X + (0, 4699 0,171 j)W + (0,3225 0,00855 j)Y
E. 12

en la que la presencia de la j multiplicando una seal se usa para indicar que


la fase de esta seal debe ser corrida por 90 en toda la banda de audio con
respecto a su versin normal.
A causa de la dificultad de proveer un corrimiento de noventa grados en
s mismo dentro del dominio analgico, cada una de las tres seales debe pasar
por su propio par de redes de corrimiento de fase de banda ancha. Dentro de
cada par, un miembro est diseado para producir un corrimiento de fase que
difiere en noventa grados de la salida del otro miembro del par en todas las
frecuencias de audio. Esto produce el efecto requerido de corrimiento de fase
de 90 entre las dos salidas, a pesar de que cada corrimiento de fase de salida
d varias vueltas en la banda de audio. Dentro del dominio digital hay varios
algoritmos, como la transformada Hilbert, que se pueden usar para producir un
corrimiento directo de fase de noventa grados sobre un considerable ancho de
banda en un solo proceso. Desafortunadamente, parece que actualmente ninguna de las herramientas ampliamente disponibles pueden producir diseos
para dichas combinaciones, a pesar de que un diseo que se basa en ecuaciones, publicadas en Electronics World (Gibson, 1996) como parte de una serie
que cubre el diseo de ssb (Single Side Band) outphasers, s ofrece una simple
ecuacin para el diseo de un filtro fir (respuesta a impulso finita) con las caractersticas que se requieren. El diseo que se presenta en el artculo se orienta
a la banda relativamente angosta de los canales de voz ssb, pero se lo puede
extender fcilmente a la banda ms ancha y respuesta optimizada que se necesita en audio profesional. Esto, sin embargo, viene al costo de una extensin
considerable de la longitud del filtro, de 32 coeficientes en el original a varios
179

miles a causa de la ms alta frecuencia de muestreo y la respuesta en bajos


sumamente extendida. En el pasado, esto lo haca impropio para la operacin
en tiempo real, como en la implementacin producida en la dcada de 1990
por el Dr. Ambrose Field usando una computadora sgi Origin, que era varias
veces ms lenta que el tiempo real. Sin embargo, las modernas computadoras
son ms que suficientemente rpidas para hacer esto en tiempo real, a pesar de
que la necesidad de uhj ha desaparecido en gran medida con el advenimiento
de medios de distribucin multicanal como el dvd.
La codificacin uhj, al menos en su versin de dos canales, no puede
preservar toda la informacin del campo sonoro horizontal, como puede verse
fcilmente de las consideraciones de la teora de la informacin. Un diseo
cuidadoso tanto del codificador como del decodificador puede concentrar la
prdida de informacin en la parte trasera de la imagen en donde hay menos
de lo que es espacialmente crtico (con la msica ms convencional, de todas
maneras). Esto deja lugar para mejorar la cualidad de la imagen en el rea
frontal, que es ms crtica.
El miembro bsico (de dos canales) de la familia uhj puede ser suplementado con un tercer canal para remover las anomalas que resten para la reproduccin horizontal. Este puede ser de banda reducida sin degradar mucho las
cosas si es necesario por razones operativas, por ejemplo si se transmite la seal
usando modulacin de sub-portadora en un transmisor de fm. Se puede aadir
un cuarto canal para proporcionar informacin de altitud. Las ecuaciones
para decodificar son tales que un decodificador para cualquiera de los niveles
siempre extraer slo la informacin que realmente usa de entradas de mayor
orden, permitiendo al sistema ser compatible hacia arriba.
Decodificando Ambisonics de primer orden
La decodificacin de seales codificadas con Ambisonics generalmente involucra tanto matemticas como psicoacstica. Sin embargo, aunque es cierto
que tales conocimientos son necesarios para optimizar el rendimiento de los
decodificadores de primer orden destinados a pequeos sistemas domsticos
con un rea de audicin y cantidad de altoparlantes limitados, las tcnicas
psicoacsticas de optimizacin tienden a ser productivas cuando se aplican a
sistemas que cubren reas ms grandes (Malham, 1992). Las consideraciones
psicoacsticas que son ms apropiadas para el diseo de decodificadores de
primer orden para pequeas reas en situaciones domsticas no sern tratados en detalle, pero es importante estar al tanto de que, para tales decodificadores, las matrices decodificadoras son construidas segn frecuencia de
manera tal que a bajas frecuencias (i.e., aquellas en la regin en donde el
180

itd domina los procesos de audicin espacial) hay alguna emisin anti-fase
de los altoparlantes opuestos a la ubicacin de la fuente de sonido. Gerzon
dice en sus escritos sobre decodificacin8 que esto provee un refuerzo extra de
los indicios posicionales para los oyentes centrales. Sin embargo, para reas
ms grandes como las salas de conciertos, la experiencia ha mostrado que es
mejor aplicar la concepcin que ha sido alternativamente denominada como
en-fase (Malham, 1992) u opuestos controlados (Furse, [1]). En primer lugar,
se debe hacer notar que el diseo de un decodificador es considerablemente
facilitado si la distribucin de altoparlantes es tan regular como sea posible.
Sin duda, hasta la aparicin del as llamado diseo de decodificadores Vienna
(Barton y Gerzon, 1992) la mayora de los diseos de decodificadores predicaba el uso de arreglos de altoparlantes consistentes de una distribucin
regular de pares, con los altoparlantes de cada par montados en los finales
opuestos de una lnea que cruza el centro del arreglo, en donde estara la
posicin de audicin principal. Esto fue conocido como el teorema del par
diamtrico (Gerzon, 1977b). En general, esto significa que los altoparlantes
deben ser dispuestos en uno de los slidos geomtricos regulares, o bien en el
medio de sus caras, o en los vrtices. Las configuraciones reconocidas incluyen cuadrados y hexgonos regulares para el trabajo solo horizontal, con un
cubo siendo el mnimo prctico para el trabajo con altitud. Para arreglos
regulares de esta clase, el mnimo absoluto de altoparlantes es 2M + 1 en
sistemas solo horizontales y (M + 1)2 para sistemas con altitud, donde M es
el orden del sistema (Daniel, 2000, p. 179).
Sin embargo, existen considerables ventajas en usar ms altoparlantes
que esto, para minimizar la influencia tanto de la posicin de audicin como
de las disparidades entre los altoparlantes y la acstica del recinto.
Para la decodificacin en-fase, la entrada para cada altoparlante es simplemente una combinacin de las seales de formato B que corresponde a
la posicin del altoparlante respecto del centro del arreglo. Esto se puede
expresar con la siguiente ecuacin, en la que el altoparlante tiene un ngulo
antihorario desde el frente y un ngulo de elevacin arriba o abajo del
plano horizontal:

Paltoparlante = W + k(X cos cos + Y sin cos + Z sin)

E. 13

donde k es una constante que determina la respuesta direccional de la fuente y


que, tomando en cuenta el factor de 0,707 proveniente de la ingeniera para el
canal W, toma el valor de 0,707 para una respuesta direccional de la fuente car8

Vase, por ejemplo, Gerzon (1977b) o Barton y Gerzon (1992)

181

dioide que se necesita para la decodificacin en-fase. Esto es ptimo tanto para
audiencias que puedan estar cerca de la posicin de los altoparlantes como para
audiencias ubicadas fuera del arreglo de altoparlantes, dado que elimina cualquier posibilidad del fenmeno conocido como bounce-back* (Malham, 1992).
Bounce-back
Aun en un arreglo de altoparlantes apropiadamente dispuesto, el bounce-back
ocurre para oyentes muy lejos del centro, i.e., los que estn cerca de una
posicin de un altoparlante. Para decodificadores diseados para proveer
rendimiento ptimo en el centro cuando una fuente de sonido se encuentra
en direccin de un altoparlante, este altoparlante deber emitir un sonido de
intensidad I y el altoparlante opuesto deber emitir un nivel algo ms bajo
Iopp de sonido de polaridad inversa, al menos en frecuencias bajas.9 Cuando
un oyente se ubica a una distancia significativa del altoparlante opuesto a la
direccin de la fuente de sonido, de manera tal que la proporcin I/Iopp , al ser
multiplicada por la proporcin de prdida ocasionada como resultado de la distancia a cada altoparlante L/Lopp se vuelve menor que 1, el sonido dejar de ser
percibido como proviniendo de la direccin correcta y parecer provenir del
altoparlante ms cercano. En arreglos que intentan servir para una gran rea de
audiencia, entonces, la respuesta direccional de la fuente, en general, debe ser
ajustada para ser no ms direccional que cardioide para todas las frecuencias.
Entonces, por ejemplo, para un arreglo cuadrado, solo horizontal de
altoparlantes, dispuestos como izquierda-frente (lf), derecha-frente (rf),
izquierda-atrs (lb) y derecha-atrs (rb), las seales son:
1
(X + Y )
2
1
(X Y )
PRF = W +
2
1
PLB = W +
(X + Y)
2
1
(X Y)
PRB = W +
2

PLF = W +

E. 14

Literalmente rebote-de-vuelta, efecto que consiste en que la seal parece provenir del altoparlante opuesto diametralmente del que debera provenir. Se adopt aqu directamente su denominacin en ingls, dado que no existe traduccin de uso corriente en espaol. [N. del T.]
9 Vanse las discusiones detalladas que siguen, sobre el diseo de decodificadores.

182

Y para un arreglo cbico, las seales son:10


PLFU = W +
PRFU = W +
PLBU = W +
PRBU = W +
PLFD = W +
PRFD = W +
PLBD = W +

PRBD = W +

2
1

2
1

2
1

2
1

2
1

2
1

2
1

1
(X + Y) + Z

1
(X Y ) + Z

1
(X + Y ) + Z

1
(X Y ) + Z

1
(X + Y) Z

1
(X Y ) Z

1
(X + Y ) Z

1
(X Y ) Z

E. 14

En la prctica, se puede tolerar en los arreglos una cierta asimetra sin que cause
excesivos problemas. La experiencia ha mostrado, por ejemplo, que el arreglo
cuadrado puede variar desde un rectngulo con una proporcin de ancho/profundidad de dos a uno, hasta un rectngulo con una proporcin de uno a dos
sin que la imagen tenga serios problemas, provistos del hecho de que se hagan
los cambios apropiados a las ecuaciones de decodificacin.
Una manera de compensar esta suerte de irregularidad es modificar la
seal de formato B antes de que alimente al decodificador de la disposicin
regular correspondiente. Por ejemplo, si se alimenta un decodificador para una
disposicin cuadrada con X e Y modificados como sigue:
X = X 2 sin

Y = Y 2 cos

E. 16

10

Los decodificadores que se basan en estas ecuaciones se pueden construir fcilmente, ya sea
con electrnica analgica simple o por software. Es aun posible usar una consola de mezcla con
ocho entradas y ocho salidas para implementar el diseo cbico. Esto se realiza ingresando

183

es posible compensar razonablemente bien el uso de arreglos rectangulares en


donde el ngulo de los altoparlantes frontales est no ms de 15 fuera del
cuadrado (patente britnica N 1.494.751).
De manera similar, para un arreglo cbico se puede aplicar la siguiente
compensacin:
X = X 3 sin

Y = Y

3
cos 2 sin
2

Z = Z

3
cos 2 cos

2

E. 17

donde es el ngulo vertical.


Las ecuaciones precedentes (16 y 17) corrigen irregularidades causadas
por desviaciones angulares de arreglos cuadrados o cbicos, pero no errores en
la distancia entre los altoparlantes y el centro de los arreglos. Estos se pueden
acomodar de manera relativamente fcil si los altoparlantes estn distribuidos
en pares diametralmente opuestos. En este caso, los altoparlantes ms cercanos pueden tener retardos y atenuaciones insertados en sus seales en una
manera tal que los sonidos de todos lleguen al centro al mismo tiempo y con
el mismo nivel para un sonido con la misma direccin que el altoparlante.
El sistema tender as a funcionar como si fuera completamente regular, al
menos para un oyente central y otros con razonablemente pequeas desviaciones (Gerzon, 1977b).
Un refinamiento posterior en el diseo del decodificador es necesario si
los altoparlantes estn cerca del punto central. Los frentes de onda reconstruidos devendrn cada vez ms esfricos en la medida en que la frecuencia
baje, esencialmente por la misma razn que causa el aumento en las bajas
frecuencias cuando un micrfono direccional est cerca de una fuente sonora.
Este efecto se puede remover si los componentes direccionales estn sujetos a
un filtro pasaaltos. Daniel establece la regla como (Daniel, Nicol y Moreau,
2003, p. 8):
1

Fmc ()

E. 18

cada seal de formato B en dos canales de la consola, uno normal y el otro con la polaridad
invertida, disponiendo la ganancia del mezclador y la asignacin de las seales de acuerdo
con las ecuaciones presentadas arriba y enviando a los altoparlantes las ocho salidas.

184

donde r es el radio del arreglo en metros, c es la velocidad del sonido y Fm


es la funcin de transferencia que afecta a los componentes Ambisonics de
orden m como lo define en su artculo y lo reproduce en la ecuacin 32. Para
un sistema Ambisonics de primer orden, esto equivale a un filtro pasaaltos de
6 dB por octava que tiene una cada de -3dB en 53/r Hz (patente britnica
N 2.073.556) as que, en el caso de arreglos de altoparlantes para el tamao
de salas de conciertos, la frecuencia resultante tiende a ser tan baja que hace
innecesario tal filtro.
Criterios para una decodificacin ptima
Gerzon define dos criterios principales para una decodificacin ptima de
seales Ambisonics. Estos se basan en la nocin de vectores de velocidad en
o debajo de frecuencias en las que el tamao de la cabeza del oyente es
aproximadamente equivalente a la mitad de la longitud de onda del sonido, a
menudo consideradas como de 700 Hz, y vectores de energa arriba de esta frecuencia, pero por debajo de 4.000 Hz.* Una explicacin altamente abstracta
y matemtica de las razones de la determinacin de estas frecuencias se puede
hallar en Gerzon (1992).
Vectores de velocidad
De acuerdo con Gerzon, esta medida de la calidad de un decodificador corresponde a la teora de localizacin para la regin de baja frecuencia de Makita11
y proporciona informacin acerca de cun bien es estimulado el mecanismo
de las itd. Considrese el caso de un arreglo consistente en un anillo horizontal de n altoparlantes en donde las distancias altoparlantes-oyente son todas
iguales y ms grandes comparadas con la longitud de onda del sonido, con el
altoparlante i en un ngulo de azimut i reproduciendo un nivel de sonido Li
de una sola fuente de sonido. La presin acstica en el centro del arreglo es
entonces simplemente:
n

P = Li
i=1

E. 19

Respectivamente directional velocity vectors y directional energy vectors en el texto original.


[N. del T.]
11 Y. Makita (1962) postul que mover la cabeza para minimizar las diferencias interaurales
en las frecuencias bajas constituye un mecanismo de audicin direccional significativo, que
desde entonces lleva su nombre. Vase tambin Leakey (1959).

185

Si la contribucin vectorial de cada altoparlante es:



cos i
svi = Li

sin i

E. 20

entonces podemos hallar el vector de velocidad rv tomando la suma de los vectores que corresponden a los altoparlantes y dividindola por la presin P;
n

rv =
i=1

s vi )
s vi
P

E. 21

Para una fuente sonora natural (o un solo altoparlante), la longitud de rv ser


la unidad, y su ngulo ser el mismo que el de la fuente sonora. Esto ser generalmente equivalente, en bajas frecuencias, a la direccin a la que giramos la
cabeza para enfrentar la fuente. En un decodificador Ambisonics optimizado
para un rea pequea con un adecuado nmero de altoparlantes, la longitud
de rv se puede igualar a la unidad para los oyentes centrales, a pesar de que
esto requiere componentes anti-fase.
Vectores de energa
Cuando las frecuencias que nos interesan involucran longitudes de onda que
son pequeas comparadas con la cabeza, la suma de vectores de velocidad ya
no es aplicable, ya que los odos responden preferentemente a las ild en esta
rea. En este caso, de acuerdo con Gerzon, la suma de las contribuciones
de energa de cada altoparlante provee una buena indicacin de la calidad de
reproduccin.
La ganancia de la energa completa del sistema es:
n

E = (Li )

i=1

E. 22

Y, por un motivo similar, el vector de energa re se calcula:


n


186

re =
i=1

( sei )
E

)
sei

E. 23

La localizacin aparente del sonido dada por re es, de acuerdo con Gerzon,
vlida para un oyente central en frecuencias arriba de 700Hz y por debajo de
4.000Hz y tambin para la situacin en donde la suma vectorial de velocidades
es invlida en bajas frecuencias, por ejemplo cuando el oyente est desviado
del centro por un monto que es significativo para la frecuencia en cuestin.
Es fcil demostrar matemticamente que la magnitud de re no se puede
igualar al valor ptimo de 1, a menos que un solo altoparlante emita sonido y
as, los sonidos de alta frecuencia en un arreglo Ambisonics de primer orden
nunca producirn tan buenos indicios de localizacin como los de baja frecuencia. Sin embargo, si la decodificacin es ptima, al menos no variar junto
con la posicin de la fuente como lo hace en sistemas como el surround itu 5.1.
Esto explica ampliamente la tendencia observada en los sistemas Ambisonics
de volver los altoparlantes invisibles. Como regla de pulgar, la cantidad 1-|
re| es aproximadamente proporcional al grado de movimiento de la imagen en
la medida en que el oyente mueve su cabeza (Gerzon, 1992).
Maximizar |re | y lograr la condicin |rv | = 1 se excluyen mutuamente.
Para un arreglo destinado a grandes reas es deseable que |re | se maximice
a expensas de rv, ya que esto minimiza el bounce-back mientras que retiene
una buena imagen. Para arreglos grandes, con oyentes cercanos a los bordes,
la mejor y ms fcil manera de lograr esto es la estrategia de la decodificacin
en-fase ya discutida. No obstante, all donde el rea de audicin resulta ms
limitada, se puede obtener alguna ventaja al maximizar re, como lo discute
Jerome Daniel en Daniel, Rault y Polack (1998) y Daniel (2000). Munro
(2000) presenta un tratamiento algo ms simple y claro de esta cuestin.
El efecto de la acstica del espacio de ejecucin
La naturaleza acstica del espacio de ejecucin puede tener un efecto significativo en la operacin de un arreglo Ambisonics de difusin (o, sin duda,
de cualquier otro). Existen dos reas principales de inters, una relacionada
con efectos locales en un altoparlante especfico, la otra relacionada con la
acstica integral.12
Efectos locales
En el diseo de decodificadores Ambisonics se asume que todos los altoparlantes funcionan de manera idntica. Esto se necesita para asegurar que la
12

La experiencia ha mostrado que ambos efectos tienden a causar ms problemas en fuentes


de sonido estacionario que en las que se mueven dentro del campo sonoro.

187

reconstruccin del frente de onda se lleva a cabo correctamente en todas


las frecuencias. Cuando un altoparlante de un arreglo tiene una ganancia
acstica diferente a la de los otros, la reconstruccin del frente de onda
estar desviada. Si el error en ganancia acstica depende de frecuencia
(como podra ser cuando se usan diferentes tipos de altoparlantes) entonces
la desviacin del frente de onda ser dependiente de la frecuencia, causando
que las imgenes de banda ancha sean borrosas.13 El mismo efecto ocurre
cuando las superficies reflectivas cercanas a un altoparlante causan que los
sonidos de este alcancen la posicin del oyente con retardos adicionales
produciendo filtrado significativo de tipo peine en la banda del sonido
que reproduce. Ambos efectos se pueden disminuir por medio del uso de
ms altoparlantes, ya que la contribucin de cada uno de ellos al frente de
onda final es menor.
All donde el espacio de ejecucin sea problemtico en trminos de
superficies reflectivas, las dificultades pueden encararse de varias maneras,
por ejemplo, ubicando los altoparlantes a alguna distancia de tales superficies. Al ubicarlos suficientemente lejos se hace que el retardo tenga bastante
duracin como para forzar los dientes del filtro-peine a estar ms cerca el
uno del otro, lo que ayudar a reducir la audibilidad del efecto, y la prdida
adicional de amplitud a causa del mayor recorrido reducir la profundidad (y
altura) de los dientes, lo que tambin reducir la audibilidad.
Fragmentar las superficies reflectivas en otras que sean aleatoriamente
difusas es otra posibilidad, a pesar de que esto sea difcil para una instalacin
no permanente. Angelo Farina sugiri una alternativa en un correo electrnico del 18 de abril de 2002 al grupo Sursound (2), que es la de convolver
la seal de cada altoparlante con un fragmento breve, diferente para cada
seal (10 ms) de ruido con una envolvente exponencial. Esta estrategia,
que parece ser de inters potencial, para citar a Farina, ...vuelve aleatorias
las fases del sonido reproducido, y evita alteraciones dinmicas de fase* y
otros artefactos....... Otras posibilidades incluyen el desarrollo de la tcnica
del espejo acstico de tiempo invertido** que se usa, entre otras cosas, para
extender el rango de los sistemas de sonar (Kuperman et al., 1998). En los
sistemas de sonar de este tipo, se usa un arreglo aleatorio de transmisores
de sonar (a menudo implementado con un arreglo aleatorio de difusores,
tales como pequeas esferas, enfrente del transmisor). Para disponer el sis13

Ntese que cuando todos los altoparlantes tienen las mismas caractersticas espectrales,
esto causa solamente un cambio de timbre y no una desviacin del frente de onda.
* Phasiness, en el original en ingls. [N. del T.]
** Acoustic time reversal mirror, en el original en ingls. [N. del T.]

188

tema, un transmisor se ubica en el lugar en donde el rayo del sonar necesita


concentrarse, se usa para emitir un rayo de sonar de vuelta hacia el arreglo
transmisor principal y se mide la respuesta a impulso de cada uno de los
transmisores ubicados aleatoriamente en el arreglo. Esta respuesta a impulso incluye tanto los efectos de la aleatoriedad deliberada del arreglo como
aquellos de las reflexiones producidas por las obstrucciones a lo largo del
camino por la que el rayo viaj. Al disponer en reverso y reflejar la respuesta
a impulso para cada lugar focal del camino del transmisor y luego aplicarla
a la seal de ese transmisor, cuando el arreglo principal emite su rayo los
efectos aleatorios, incluidos los del entorno, son cancelados cuando todos
los rayos llegan al lugar focal. Esto tiene claras posibilidades para arreglos
de sonido surround, ya sea produciendo fuentes de sonido individuales (que
podran, por ejemplo, ser posicionadas cerca de los asientos en el espacio de
audiencia) o para producir un arreglo de altoparlantes virtuales que est ms
lejos de las paredes del lugar de ejecucin (y, de esta manera, ms inmune
a sus efectos) de lo que los altoparlantes pueden situarse fsicamente. Una
concepcin similar, que involucra el uso de los as llamados spots acsticos que usan la naturaleza no lineal del aire a altas presiones sonoras para
rectificar (y por consiguiente detectar, como en un receptor de radio) rayos
de ultrasonido modulados en audio, ha sido sugerida por otro estudiante del
York Music Technology Group, Alex Cohen, en su proyecto final (Cohen,
1999).
Efectos globales
El efecto global principal se origina por la conocida dificultad que posee cualquier sistema de reproduccin basado en altoparlantes de no ser capaz de producir correctamente sonidos que aparenten estar ms cercanos al oyente que
el radio de reverberacin. El radio de reverberacin se produce por la proporcin
del sonido directo de un altoparlante y la reverberacin que produce ese sonido en el espacio de ejecucin en s mismo. Esto se evita mejor teniendo una
acstica seca y ubicando los altoparlantes lo ms cerca posible a pesar de que
estas medidas crean sus propios problemas. Espejos de reverso temporal y otras
estrategias relacionadas pueden tener un papel para representar en esto, como
tambin lo tiene la posibilidad de usar sistemas hbridos de auriculares y altoparlantes juntos, como se discuti en la seccin sobre el realismo. Finalmente,
vale la pena destacar que nuevas ideas publicadas muy recientemente (Daniel,
Nicol y Moreau, 2003) parecen ofrecer una respuesta ms directa al problema
de la produccin de fuentes sonoras cercanas. Esto se discute brevemente en
la seccin que sigue, sobre Ambisonics de orden ms alto.
189

Sistemas Ambisonics de orden ms alto


La versin simple del sistema Ambisonics hasta donde se describi puede
solo (re)crear un campo sonoro exacto en una ubicacin central. Hay un
incremento gradual en el nivel de errores en la medida en que el oyente se
mueve del centro y en la medida en que la frecuencia aumenta (Bamford
y Vanderkooy, 1995). Sin embargo, si se implementa cuidadosamente, ha
demostrado funcionar en una manera razonablemente efectiva aun sobre
reas bastante grandes (Malham y Orton, 1991; Malham, 1992; Vennonen,
1994). Para mejorar el rea sobre la que se produce un error bajo en la
reconstruccin del campo sonoro se ha sugerido combinar Ambisonics con el
sistema Holofnico (Nicol y Emerit, 1999) o con la sntesis de campo sonoro
(Horbach y Boone, 1999). Desafortunadamente, estos acercamientos hbridos,
mientras que son interesantes por su propio derecho y quiz apropiados para
ciertas circunstancias especficas, carecen de la facilidad de implementacin
y control que Ambisonics puede ofrecer. Es bien sabido que al incrementar la
complejidad de la descripcin por medio del aumento del orden de los armnicos esfricos que se usan en esta descripcin se reduce el error para oyentes
que se encuentran fuera del centro (Bamford y Vanderkooy, 1995, Malham,
1999b) mientras que se retiene mucho de la facilidad de implementacin y
control que tiene el primer orden de Ambisonics.
Armnicos esfricos
El artculo original de Gerzon de 1973 presentaba los armnicos esfricos
hasta el tercer orden en trminos de coordenadas cartesianas (x, y, z) donde
x es el eje frente-atrs, y es el eje izquierda-derecha y z es el eje arriba-abajo.
Es su trabajo publicado posteriormente las definiciones se dan en coordenadas
polares, r, , , (lo que se ha transformado en norma para la definicin de los
sistemas Ambisonics) y la notacin es algo diferente. Esto nos ha dejado tanto
sin una terminologa definida como sin una formulacin de los armnicos
esfricos de los sistemas de orden ms alto que sea consistente con la prctica
corriente de los de primer orden. La capacidad de los armnicos esfricos para
definir eficientemente una funcin en la superficie de una esfera (Kaplan,
1981) ha producido como resultado su uso extensivo en fsica y qumica.
Desafortunadamente, cada uno de los grupos involucrados fsicos, qumicos, matemticos que usan los armnicos esfricos tiene su estilo propio de
notacin, de entre los cuales ninguno parece coincidir con el que se usa en
la prctica Ambisonics. La mejor y ms consistente presentacin parece ser
la de Daniel (2000) y, consecuentemente, ha sido la que se ha elegido para
190

constituir la base para la notacin que se usa en este trabajo, excepto cuando
se indique algo diferente.
En esta notacin, los armnicos esfricos se describen por la siguiente
ecuacin:

cos(n) if

Ymn
(,) = Pmn (sin)
sin(n) if

=1
= 1

E. 24

donde Pmn es la funcin asociada semi-normalizada de Legendre de grado14 m


y orden n. Daniel llama a esto codificacin sn3d Ambisonics (o sn2d en el
caso de variantes nicamente horizontales). Esto corresponde al primer orden
Ambisonics estndar, con la excepcin del escalamiento de 0,707 aplicado a
W por razones de ingeniera que ya discutimos. Aunque existen argumentos
matemticos significativos a favor del uso de esta formulacin generalmente,
la disponibilidad de funciones recursivas para generar Pmn (Press et al., 1997) y
as sucesivamente este autor cree que hay razones de ingeniera del mundo real
que imponen que la versin llamada Max-Normalisation (MaxN) por Daniel
debera ser usada como la base para la expansin del sistema Ambisonics hacia
rdenes ms altos. Esto es lo que se sigui en la versin Furse-Malham (FuMa),
con la inclusin del escalamiento estndar de 0,707 para el canal W. Se debe
advertir que las formulaciones de los armnicos esfricos preferidas matemticamente suelen incluir factores de escalamiento que aseguran que el resultado
de la integracin de cada armnico sobre la esfera sea 1. En la medida en que el
orden M de los armnicos se incrementa, el valor mximo para cada armnico
puede sufrir incrementos. En promedio esto no representa un problema para
campos difusos, pero cuando se trata con fuentes sonoras puntuales o cercanas
a lo puntual, como aquellas que se producen por panormicos, esto puede
producir que las seales de los canales de ms alto orden excedan la capacidad
de representacin del canal fsico por el que son transmitidas (o almacenadas).
Aun esto puede no representar un problema serio si todos los canales usan
representaciones de la seal en punto flotante, pero muchos sistemas usan
todava enteros de 16, 20 o 24 bits. Las representaciones MaxN tienen factores
de escalamiento que se aplican a cada componente superior al componente
cerosimo (W) de manera tal que el valor mximo que cada uno toma est limitado a |1|. El factor para esto se puede obtener por inspeccin hasta el tercer
orden, pero luego deviene ms difcil y requiere determinar la mxima para
14

Aunque no es estrictamente correcta matemticamente, ya que m es el grado y n el orden


de las funciones de Legendre, y a despecho de la confusin que esto pueda causar, es una
prctica aceptada referirse al orden M de los armonicos esfricos como m.

191

cada polinomio (ya sea matemticamente o numricamente) de manera explcita y luego invertida. A diferencia de las funciones de Legendre, hasta donde
este autor conoce no se ha descubierto hasta ahora una frmula recurrente
simple para generar los factores de escalamiento requeridos automticamente.
Los factores para convertir la representacin formal, matemtica, sn3d en la
versin FuMa, que se usa en los sistemas prcticos de ingeniera, se muestran
hasta el tercer orden en la tabla 1 junto con las designaciones convencionales
de los canales a los que corresponden.
Tabla 1. Canales de Ambisonics formato B hasta el tercer orden
Z
Orden m,n,

Canal Definicin

sn3d

Factor
FuMa

Y
X
Frente

1/

0,0,1

1,1,1

coscos

1,1,-1

sincos

1,0,1

sin

192

2,0,1

(3sin2 -1)/2

2,1,1

( 3/2) cossin(2)

2/

2,1,-1

( 3/2) sinsin(2)

2/

2,2,1

( 3/2) cos(2)cos2

2/

2,2,-1

( 3/2) sin(2)cos2

2/

3,0,1

sin(5sin2-3)/2

193

3,1,1

(3/8) sincos(5sin2-1)

45/32

3,1,-1

(3/8) sincos(5sin2-1)

45/32

3,2,1

(15/2) cos(2)sincos2

3/

3,2,-1

(15/2) sin(2)sincos2

3/

3,3,1

(5/8) cos(3)cos3

8/5

3,3,-1

(5/8) sin(3)cos3

8/5

194

En general, el uso de la nomenclatura basada en letras para los nombres de


canal no se usa ms all del tercer orden, a pesar de que el alfabeto ingls
podra realmente albergar los nueve canales del cuarto orden. En su lugar, se
usa para designar a los canales el sistema m, n, . Este sistema, que se adopt
por conveniencia tipogrfica, es ligeramente diferente de la notacin matemtica convencional porque no es un superndice arriba de las otras dos.*
La rotacin en el eje Z tal como se describe en la seccin sobre Ambisonics
bsico puede ser extendida fcilmente a estos rdenes ms altos. Tanto Daniel
(Daniel, 2000, p. 165) como Furse (2) han publicado las matrices para primer
y segundo orden con ligeras diferencias en las convenciones. Ya que la tabla
1 cubre el tercer orden, las matrices de rotacin hasta este orden se presentan
aqu. Ya que la matriz W es la matriz identidad bajo todas esas transformaciones, es trivial y no se incluye.
Matrices de rotacin
Para una rotacin a lo largo del eje Z por un ngulo , las matrices son como
sigue:
Componentes de primer orden
Orden de fila (entrada) X, Y, Z
Orden de columna (salida) X, Y, Z

cos sin 0

sin cos 0
0
0
1

E. 25

Componentes de segundo orden


Orden de fila (entrada) R,S,T,U,V
Orden de columna (salida) R,S,T,U,V

1
0
0
0
0

0
0
0 cos sin
0 sin cos
0
0

0
0
cos 2 sin2
0
0
0
0
sin2 cos 2

E. 26

* El trmino en ingls es de uso corriente en la literatura y la prctica en habla hispana. Alude

195

Componentes de tercer orden


Orden de fila (entrada) K,L,M,N,O,P,Q
Orden de columna (salida) K,L,M,N,O,P,Q

1
0
0
0
0
0
0

0
0
0
0
0 cos sin
0 sin cos
0
0
0
0

0
0
cos 2 sin2
0
0
0
0
0
0
sin2 cos 2
0
0

0
0
0
0
0
cos 3 sin 3

0
0
0
0
0
sin 3 cos 3

E. 27

Ladeo e inclinacin
Ya que, a partir del segundo orden, las formas de los armnicos involucrados
tanto en el ladeo como en la inclinacin ya no son simples, generar las matrices
necesarias no es trivial. Derivar las matrices de segundo orden no es tan difcil,
a pesar de que requiere un monto significativo de manipulacin de ecuaciones trigonomtricas para llegar a los resultados obtenidos por Furse o Daniel.
Sin embargo, el tercer orden y los ms altos constituyen una tarea bastante
intrincada, por citar una pgina web (Simulgen Proyect a) relacionada con
el proyecto de investigacin de la Unin Europea Simulgen Esprit. Uno de los
acercamientos investigados en este proyecto fue el uso de los armnicos esfricos para definir la iluminacin direccional en sistemas de simulacin visual
que tienen la misma necesidad de rotaciones arbitrarias. All se advierte que
no se haba encontrado en 1995 la solucin al problema de una generacin
simple de las matrices de rotacin que se requieren, pero que esto se haba
resuelto en 2000, la fecha de la pgina web. Desafortunadamente, no se dan
ms detalles ni en la pgina web ni en los documentos del proyecto disponibles al pblico. Sin embargo, una bsqueda en la literatura de otro campo en
el que se usan los armnicos esfricos intensivamente, la fsicoqumica, arroj
como resultado un artculo de Choi, Ivanic, Gordon y Ruedenberg, (1999)
que presenta una frmula recursiva estable para la rotacin de los armnicos
esfricos que parece ser adaptable a las convenciones usadas en Ambisonics.
a la produccin de componentes falsos (i.e., alias) como resultado de la imposibilidad
para representar componentes de la seal real que se encuentren ms all de la mitad de la
frecuencia de muestreo de un sistema. [N. del T.]

196

Dominancia
Daniel afirma (Daniel, 2000, p. 166), sin dar una prueba explcita, que no
es posible implementar el efecto de dominancia ms all del primer orden
usando la transformada Lorentz sin perturbar el proceso de reconstruccin
de la forma de onda. Cotterell (2002, p. 123) proporciona una demostracin
numrica de esta afirmacin en su tesis doctoral. Se requiere ms trabajo para
hallar una transformada apropiada que provea esta til funcin en los sistemas
de orden ms alto. En su seccin sobre este tema, Daniel sugiere buscar una
matriz de transformacin lineal que se base en las relaciones entre las funciones de Legendre asociadas. Richard Furse, en una comunicacin privada,
sugiere usar una aproximacin numrica. l ha desarrollado un mtodo basado
en una plantilla de clculo para investigar esta cuestin, pero al tiempo de este
artculo todava no se han conducido tests de audicin. Una posibilidad ms
que vale la pena investigar sera muestrear espacialmente el campo sonoro
usando un nmero de puntos de muestreo lo suficientemente amplio para
evitar aliasing* espacial y luego producir un nuevo campo sonoro por remuestreo de los puntos usando una funcin de torsin apropiada.

Sistemas de orden ms alto. desarrollos recientes


En un desarrollo reciente, Daniel, Nicol y Moreau (2003) ha propuesto
reformular el formato Ambisonics B (para eliminar la limitacin implcita en
el hecho de que est restringido a la reconstruccin de ondas planas). Esta
restriccin a ondas planas resulta en un sistema que no puede vrselas apropiadamente con fuentes cercanas, especialmente cuando estn dentro del arreglo
de altoparlantes. El enfoque de Daniel, Nicol y Moreau llega a esta propuesta
examinando la expresin de Fourier-Bessel para el campo de presin en una
superficie esfrica que rodea un punto.

r
p(r ) = j m j m (kr)

0 n m, = 1

m= 0

BmnYmn (,)

j m h m (kr) AmnYmn (,)

m= 0

0 n m, = 1

E. 28

Con el nmero de onda, k=2f/c, jm(kr) son las funciones esfricas de Bessel
(primeras series) y hm(kr) son las funciones esfricas divergentes de Hankel.
197

La parte derecha de la primera lnea de la ecuacin es equivalente a la


actual formulacin Ambisonics expresada en el dominio de la frecuencia
para fuentes externas al arreglo de altoparlantes. Si se asume una onda
plana, los coeficientes B se convierten en las ganancias de los componentes
armnicos esfricos. La segunda lnea describe frentes de onda dentro del
arreglo. Estas son ambas intrnsecamente curvas y tambin dependientes de
la frecuencia.
Daniel y sus colaboradores avanzan en la derivacin de dos frmulas que
tomadas en conjunto describen fuentes de campo cercano a una distancia R
del centro:

Bmn = S.FmR c ()Ymn


(,)

n
(m + n)! jc

n
R
n= 0 (m n)!n!2

E. 29

FmR c () =

E. 30

donde S es el campo de presin en el centro, Ymn son los armnicos esfricos


como se definen en la ecuacin 24 y el filtrado F indicado por la ecuacin 30
es una integracin y, por lo tanto, tiene ganancia infinita en frecuencias bajas.
La imposibilidad de esto ha significado que esta formulacin fuera ignorada
en el pasado. Sin embargo, ellos han avanzado al demostrar que el filtrado
de compensacin para el frente de onda esfrico que se discuti previamente
en el contexto de la compensacin del efecto de los altoparlantes demasiado
cercanos a la posicin de audicin central (como se describe en la ecuacin
18) puede combinarse con F cuando se codifica el campo sonoro. Esto produce el deseable efecto de que el filtrado ya no tiene una ganancia infinita
en bajas frecuencias. Con esta formulacin, se podran producir tanto fuentes
afuera como adentro del arreglo ya que se podran (re)producir frentes de onda
cncavos, planos y convexos. El precio a pagar sera que el tamao del arreglo de parlantes debera ser conocido tericamente al momento de codificar.
Afortunadamente, en la medida en que el tamao del arreglo que se tuvo en
cuenta en la codificacin sea conocido, es posible aplicar un filtro de compensacin antes de la decodificacin para corregir la diferencia entre el tamao
asumido y el usado actualmente. Este desarrollo es demasiado nuevo para que
el autor haya podido experimentar con l, pero tiene el potencial de enfatizar
la funcionalidad del sistema Ambisonics y de proveer nuevas oportunidades a
los compositores electroacsticos.
198

Bibliografa
Abrahams, R. A. y J. Z. Landgraf (1990), Differential use of distance and
location information for spatial location, Perception & Psychophysics, 47
(4), pp. 349-359.
Ashmead, D.H., D. Le Roy y R. D. Odom (1990), Perception of relative
distances of nearby sound sources, Perception & Psychophysics, 47 (4),
pp. 326-331.
Bamford, J. S. y J. Vanderkooy (1995), Ambisonics sound for us, Preprint
N 4138 presentado en la 99 convencin Audio Engineering Society,
Nueva York.
Barton, G. J. y M. A. Gerzon (1992), Ambisonics Decoders for hdtv,
Preprint 3345 de la 92 convencin de Audio Engineering Society,
Viena.
Begault, D. R. (1994), 3-D Sound for Virtual Reality and Multimedia,
Academic Press.
Brungart, D. S., N. I. Durlach y W. M. Rabinowitz (1999), Auditory localization of nearbysources II: Localization of a broadband source in the near
field, Journal of the Acoustical Society of America, vol. 106, N 4, pp.
1956-1968.
Choi, C. H., J. Ivanic, M. S. Gordon y K. Ruedenberg (1999), Rapid
and Stable Determination of Rotation Matrices between Spherical
Harmonics by Direct Recursion, Journal of Chemical Physics, 111, pp.
8825-8831.
Clarke, J. (1989), A Real-time Ambisonics Soundfield Controller, proyecto
final para el MA/Msc en Music Technology, Universidad de York.
y D. G. Malham (1992), Control software for a programmable
Soundfield controller, Proceedings de la Conferencia sobre Reproduced
Sound del Institute of Acustics, Windermere.
Cohen, A. (1999), An investigation into Hyper-Dense Transducer Arrays,
proyecto final para el MA/Msc en Music Technology, Universidad de
York.
Cooper, D.H. y T. Shiga (1972), Discrete Matrix Multi-channel Stereo,
Journal of the Audio Engineering Society, vol. 20, N 5, pp. 346-360.
Cotterell, P. (2002), On The Theory of the Second Order Soundfield
Microphone, tesis de doctorado, University of Reading.
Czerwinski, E., A. Voishvillp, S. Alexandrov y A. Terekhov (2000),
Propagation Distortion in Sound Systems - Can We Avoid It?, Journal
of the Audio Engineering Society, vol. 48, N 1/2, pp. 30-48.
Daniel, J. (2000), Reprsentation de champs acoustiques, application la
199

transmission et la reproduction de scnes sonores complexes dans un


contexte multimdia, tesis de doctorado, 1996-2000, Universit Paris 6.
, J. B. Rault y J. D. Polack (1998), Ambisonics Encoding of Other
Audio Formats for Multiple Listening Conditions, preprint 4795 de la
convencin 105 de la Audio Engineering Society, San Francisco.
, R. Nicol y S. Moreau (2003), Further Investigations of High Order
Ambisonics and Wavefield Synthesis for Holophonic Sound Imaging,
presentado en la Convencin 114 de la Audio Engineering Society,
Amsterdam.
Farrah, K. (1979), The SoundField Microphone, Wireless World, pp.
99-103.
Fellgett, P. B. (1972), Directional Information in Reproduced Sound,
Wireless World, vol. 78, pp. 413-417.
Field, A. (1998), entrevista en Austin, L. (2001), Sound Diffusion in
Composition and Performance Practice II: An Interview with Ambrose
Field, Computer Music Journal, vol. 25, N 4, pp. 21-30.
Gerzon, M. A. (1973), Periphony: With-height Sound Reproduction,
Journal of the Audio Engineering Society, vol. 21, N 1, pp. 2-10.
(1975a), The Design of Precisely Coincident Microphone Arrays for
Stereo and Surround Sound, presentado en la Convencin 50 de la
Audio Engineering Society, Londres.
(1975b), Panpot and Soundfield Controls, nrdc Ambisonics Technology
Report, N 3.
(1977a), Surround Sound Decoders, Wireless World, (en 7 partes)
enero a agosto de 1977.
(1977b) Design of Ambisonics Decoders for Multi Speaker Surround
Sound, presentado en la Convencin 58 de la Audio Engineering
Society, Nueva York.
(1992), General Metatheory of Auditory Localisation, Preprint 3306
de la convencin 92 de la Audio Engineering Society, Viena.
Gibson, D. (1996), Designing an ssb outphaser, part 2, Electronics World,
vol. 102, N 1722, pp 392-394.
Gibson, J. J. (1979), The Ecological Approach to Visual Perception, Boston,
Houghton Mifflin.
, R. M. Christensen y A. L. R. Limberg (1972),Compatible FM
Broadcasting of Panoramic Sound, Journal of the Audio Engineering
Society, vol. 20, pp. 816-822.
Hood, T. (1989), Investigation into the Ambisonics Surround Sound system, proyecto final para el MA/Msc en Music Technology, Universidad
de York.
200

Kaplan, W. (1981), Advanced mathematics for engineers, Reading, AddisonWesley, pp. 710-714.
Kopo, N., S. Santarell y B. Shinn-Cunningham (2000), Tori of confusion:
Binaural localization cues for sources within reach of a listener, Journal
of the Acoustic Society of. America, vol. 107, N 3, pp. 1627-1635.
Kuperman, W. A, W. S. Hodgkiss, H. C. Song, T. Akai, C. Ferla y D. R. Jackson
(1998), Phase conjugation in the ocean: Experimental demonstration of an
acoustic time-reversal mirror, Journal of the Acoustical Society of America,
vol. 103, N1, pp. 25-40.
Leakey, D. M. (1959), Some measurements on the effects of interchannel
intensity and time difference in two channel sound systems, Journal of
the Acoustic Society of America, vol. 31, pp. 977-987.
Lennox, P. P., A. Myatt y J. M. Vaughan (1999), From Surround to True
3-d, presentado en la conferencia 116 de la Audio Engineering Society
sobre reproduccin espacial de sonido, Rovaniemi, Finlandia.
Lennox, P.P., J. M. Vaughan y A. Myatt (2001), 3D Audio as an Information
Environment, presentado en la conferencia 19 de la Audio Engineering
Society, Schloss Emlau, Alemania.
Macpherson, E. A. y J. C. Middlebrooks (2002), Listener weighting of cues
for lateral angle: The duplex theory of sound localization revisited,
Journal of the Acoustical Society of America, vol. 111, N 5, pp. 22192236.
Makita, Y. (1962), On the directional localization of sound in the stereophonic sound field, EBU Technical Review, parte A N 73, pp. 102-108.
Malham, D. G. (2001), Spherical Harmonic Coding of Sound Objects - the
Ambisonics O Format, Proceedings de la Conferencia 19 de la Audio
Engineering Society, Schloss Elmau, Alemania, pp. 54-57.
(1987), Computer Control of Ambisonics Soundfields, preprint N
2463, presentado en la convencin 82 de la Audio Engineering Society,
Londres.
y R. Orton (1991), Progress in the Application of Ambisonics. Three
Dimensional Sound Diffusion Technology to Computer Music, ICMC
Montreal 1991 Proceedings, pp. 467-470.
Menzies, D. (1999), New Electronic Performance Instruments for
Electroacoustic Music, tesis de doctorado, Universidad de York, pp.
99-101.
Menzies, D. (2002), W-panning and O-format, Tools for Object
Spatialization, Proceedings de la 8 conferencia internacional sobre
Auditory Display, Kioto, Japn (<http://www.icad.org/websiteV2.0/
Conferences/ICAD2002/proceedings/29_DylanMenzies.pdf>).
201

Munro, G. (2000), In-phase corrections for Ambisonicss, Proceedings of


ICMC 2000, Berln, pp. 292-295.
Nicol, R. y M. Emerit (1999), 3D-Sound Reproduction over an Extensive
Listening Area: a Hybrid Method Derived from Holophony and
Ambisonics, conferencia 16 de la Audio Engineering Society sobre
reproduccin espacial de sonido, Helsinki 1999, preprint N 66819.
Nielsen, S. H. (1993), Auditory Distance Perception in Different Rooms,
Journal of the Audio Engineering Society, vol. 41, N 10, pp. 755-770.
Press, W. H., S. A. Teukolsky, W. T. Vetterling y B. P. Flannery (1997),
Numerical Recipes in C, Cambridge, Cambridge University Press, pp.
252-254.
Vennonen, K. (1994), A Practical System for Three-Dimensional Sound
Projection, en los anuarios del simposio de Computer Animation y
Computer Music, Synaesthetica 94, Australian Centre for the Arts and
Technology, Canberra, Australia.
Weinberg, S. (1972), Gravitation and Cosmology. Principles and Applications of
the General Theory of Relativity, Nueva York, John Wiley and Sons.
Wishart, T. (1985), On Sonic Art, York, Imagineering Press.
Furse, R. (1), "First and Second Order Ambisonic Decoding Equations"
(<http://www.muse.demon.co.uk/ref/speakers.html>, consultado el 14 de
noviembre de 2007).
www[2], <http://mail.music.vt.edu/mailman/listinfo/sursound>, consultado el
14 de noviembre de 2007.
Furse, R. (2), "Ambisonic Rotation Matrices" (<http://www.muse.demon.
co.uk/fmhrotat.html>, consultado el 14 de noviembre de 2007).
Simulgen Proyect (a), "wp1: First Pass Gloss y Global Illumination" (<http://
iiia.udg.es/Simulgen/Available/rs/Wp1/WP1.html>, consultado el 14 de
noviembre de 2007).
Simulgen Proyect (b), "Simulation of Light in GENeral Environments"
(<http://iiia.udg.es/Simulgen/>, consultado el 14 de noviembre de 2007).
(Traduccin al espaol de Oscar Pablo Di Liscia)

202

Captulo vi
Sistemas de sonido multicanal para la industria
audiovisual
Mariano Martn Cura

Introduccin
Este captulo tratar los sistemas de sonido multicanal ms significativos de
la industria de imagen y sonido, comnmente llamados sistemas de sonido
surround o envolvente.
Es importante marcar la diferencia entre las especificaciones y estandarizaciones sobre la cantidad de canales y/o configuracin de altoparlantes, y
los sistemas propietarios como Dolby Digital, dts, etc., cuya funcin principal
no solo es la distribucin de canales, sino tambin la codificacin, decodificacin, tipo de soporte de almacenamiento y reproduccin seales de audio
multicanal.
La mayora de los sistemas que mencionaremos han sido desarrollados
para la industria audiovisual, en la que la relacin del programa sonoro con la
accin proyectada en la pantalla es prioritaria, por lo que los canales surround
han sido pensados principalmente para efectos sonoros y ambientes acsticos
que acompaen al campo sonoro principal frontal.

Estandarizaciones de sonido surround


Generalmente, las estandarizaciones de sonido surround especifican la cantidad de canales de reproduccin y el tipo de parlantes o difusores a ser utilizados con su distribucin correspondiente en la sala (por ej. 5.1 surround).
De esta manera, se deja al usuario la eleccin del sistema de creacin o
representacin del campo sonoro espacial: con una misma configuracin de
canales se pueden implementar diferentes tcnicas de espacializacin como
las ya tratadas en este libro (panormico de intensidad, hrtf, binaural,
Ambisonics, etctera).

203

Especificaciones de canales
Las especificaciones de canales como 5.1, 7.1, etc., describen la cantidad de
canales discretos de reproduccin, donde muchas veces estos canales alimentan a ms de un altoparlante. En este tipo de denominacin el nmero que se
encuentra a la izquierda del punto especifica la cantidad de canales de rango
completo de audio y el que se encuentra a la derecha, la cantidad de canales
de rango limitado a bajas frecuencias de audio.
Sistemas propietarios
Las diferentes implementaciones de sistemas surround, por compaas como
Dolby, Sony o dts especifican la cantidad de canales, su distribucin en la
sala, la forma de almacenamiento y transmisin de datos, especificaciones de
calibracin de sala y otros. Con una misma configuracin de canales, como
5.1, podemos encontrar diferentes sistemas propietarios.
En este captulo solo se tratarn las diferentes configuraciones de sonido
surround y los sistemas propietarios ms significativos para estas configuraciones. Entre ellos, los tres sistemas propietarios ms utilizados en la actualidad
por la industria del cine: Dolby Digital, dts y Sony sdds; los dos primeros con
una configuracin 5.1 y el ltimo, con una configuracin 7.1.
Canal de efectos de baja frecuencia
El canal de efectos de baja frecuencia o lfe (Low Frequency Effects) fue
originalmente implementado para la reproduccin especfica de sonidos de
baja frecuencia en salas de cine. Este canal individual, limitado hasta los
120 Hz, est destinado a la reproduccin de efectos especiales (tales como
explosiones y otros con bajas frecuencias extremas) que necesitan mayor
presin sonora y rango dinmico que el que pueden reproducir los canales
principales.
Sistema de administracin de bajas frecuencias
En sistemas de audio hogareo, el difusor subwoofer no reproduce necesariamente el canal de efectos de baja frecuencia o lfe. Generalmente se utiliza
un sistema de administracin de bajas frecuencias que, con una red de filtrado
cruzado (filtros crossover) con una frecuencia de corte entre los 80 Hz y 160
Hz, se encarga de sumar los componentes de baja frecuencia de cada canal
principal con el canal de efectos de baja frecuencia, para ser reproducidos por
204

el subwoofer. Esta tcnica no est estandarizada y depende especficamente de


la implementacin de cada sistema en particular.
Sistemas multicanal matriciales
Es preferible almacenar y transmitir cuantos canales de audio sean necesarios
para una mezcla surround. Sin embargo, con el objeto de mantener la compatibilidad con reproductores ya existentes o con los medios de almacenamiento
disponibles, se han desarrollado sistemas que representan la totalidad de la
mezcla en menos canales utilizando una codificacin de matrices de seales.
Codificacin perceptual
En los sistemas multicanal digitales es deseable el almacenamiento y transmisin de todos los canales discretos en resolucin completa, formato pcm
(Pulse Code Modulation) (vase Pohlmann, 2002, caps. iii y iv) digital, pero
esto ocupa gran cantidad de espacio de almacenamiento o ancho de banda de
transmisin, entre 0,72 y 2 Mbps (mega bits por segundo), segn la resolucin.
Este ancho de banda es excesivo para la implementacin en sistemas de cine,
televisin, sistemas hogareos y otros, por lo que se han desarrollado diferentes tcnicas de codificacin de la seal digital para la reduccin de la cantidad
de bits a almacenar y/o transmitir.
Estas tcnicas de compresin de datos, utilizadas en los conocidos MP3,
Dolby AC3 (vase Pohlmann, 2002, cap. x) y otros, necesitaran un libro para
ser tratadas en profundidad. Podemos decir que se basan en analizar el espectro
de la seal a comprimir y, comparndolo con las caractersticas del enmascaramiento que se produce en el sistema auditivo, codifican solo la informacin
perceptible al odo, logrando tasas de reduccin de datos de hasta diez veces,
con un mnimo de prdida de la calidad de audio. En los sistemas multicanal de
la actualidad, se utilizan diferentes implementaciones de estas tcnicas.

Estreo de tres canales (3-0 stereo)


La configuracin estreo de tres canales casi no se utiliza hoy, pero es la base
de varios sistemas multicanales. Utiliza tres canales: izquierdo, centro y derecha ubicados equidistantemente del punto de escucha, como se puede ver en
la figura 1.
Tiene varias ventajas respecto del estreo de dos canales. Primero, permite una imagen frontal ms ancha ya que el canal central posibilita una mayor
205

separacin (+/-45) entre los canales izquierdo y derecho. En los sistemas


surround de cinco canales los canales izquierdo y derecho se ubican a +/-30
para tener compatibilidad con sistemas estreo de dos canales. Segundo, el
canal central permite un punto de escucha ms amplio ya que la imagen
sonora no colapsa tan fcilmente con el altoparlante ms cercano. Tercero,
en su utilizacin en salas de cine donde el ancho de la pantalla hace inviable
la localizacin de una fuente virtual en el centro (estreo de dos canales) el
canal central permite una buena localizacin de los dilogos en el centro de la
pantalla. Cuarto, la imagen central no sufre modificaciones espectrales como
en el estreo de dos canales, ya que emana de una fuente sonora real.
Sonido cuadrafnico
En la dcada de 1970, la industria del audio hizo el primer intento de introducir en el mercado hogareo un formato surround con el sonido cuadrafnico.
Este sistema daba igual importancia a los campos sonoros frontal, lateral y
trasero, lo que era ms que deseable para la produccin musical, que en este caso
no estaba subordinada a su relacin con una pantalla ubicada al frente. Ubicaba
cuatro canales, dos frontales y dos traseros, a distancia de 90 entre s (ver figura
2). Esta distancia (superior a los 60 del estreo) generaba problemas a la hora
de localizar fuentes virtuales entre dos altoparlantes contiguos. Corrientemente
se denominaba a esta deficiencia como agujero en el medio.
Este sistema extraa los cuatro canales tanto de una fuente estreo matricial o de una fuente discreta de canales. La falta de compatibilidad con el
equipamiento ya existente y entre los mismos sistemas cuadrafnicos hizo que
no prosperara y quedara en el olvido. Sin embargo, esta disposicin de canales
se continu utilizando fuera de la industria del audio comercial (por ejemplo,
en la reproduccin de msica electroacstica).
Surround de cuatro canales (3-1 stereo)
El sistema 3-1 stereo o lcrs surround utiliza la distribucin estreo de tres
canales ya mencionada y le agrega un canal monofnico que ser el canal
de efectos o surround, que se asignar a los altoparlantes que se ubican a los
costados y atrs de los espectadores.
La figura 3 muestra la configuracin tpica en salas de cine. Con el objeto de lograr una mejor cobertura de las butacas, generalmente hay una gran
cantidad de parlantes surround alimentados por el nico canal de efectos. En
algunos sistemas las seales que emiten cada uno de estos altoparlantes son
decorrelacionadas entre s para lograr una imagen ms difusa y espaciosa.
206

Figura 1

Figura 2

207

En los sistemas hogareos el canal surround monofnico generalmente


alimenta a dos difusores ubicados en posiciones similares a la configuracin
5.1 que se describir ms adelante.
La mayor limitacin de este sistema es la imposibilidad de lograr un buen
campo sonoro envolvente, ya que para esto se necesitara al menos distintas
seales a los costados de los espectadores.

Dolby stereo optical. Dolby surround pro logic


A mediados de la dcada de 1970 los laboratorios Dolby introducen el formato Dolby Stereo Optical (vase Dolby Laboratories Technical Library,
s/f), utilizando la configuracin lcrs surround para la reproduccin de sonido
envolvente en salas de cine. Este sistema tiene la particularidad de almacenar
los cuatro canales de la mezcla en dos canales pticos en la pelcula, a travs
de una matriz 4-2-4. En las primeras versiones se utilizaba un sistema de reduc-

Figura 3

208

cin de ruido Dolby A (vase Dolby Laboratories Technical Library, s/f), que
en las ms recientes fue reemplazado por Dolby sr (vase Dolby Laboratories
Technical Library, s/f). El sistema Dolby Surround Pro Logic (vase Rumsey
2001, cap. iv) es una posterior adaptacin al mercado hogareo, utilizando la
misma configuracin lcrs y almacenando los cuatro canales con una matriz
4-2-4 en los dos canales analgicos de las cintas de video.
La matriz 4-2-4 de Dolby Stereo que se ve en la figura 4 codifica el canal
surround mono sumndolo fuera de fase (+-90) en los canales izquierda y derecha. El canal central es codificado sumndolo a los canales izquierdo y derecho
en fase. Al resultado de esta suma se lo llama Lt/Rt (izquierda total y derecha
total). De esta manera, en el proceso de decodificacin, se puede separar el
canal surround de los canales frontales realizando una suma de las seales Lt/
Rt fuera de fase, extrayendo la seal de la diferencia estreo. Al canal central
se lo decodifica sumando Lt/Rt en fase.

Figura 4

Figura 5

209

Al realizar la decodificacin, con el objeto de corregir efectos secundarios


del proceso de codificacin/decodificacin (seales localizadas en el campo
frontal que parecen provenir del campo trasero) se realizan otros procesos,
como se puede ver en el diagrama de decodificacin bsica de la figura 5.
Adems de realizar las sumas y restas de canales, al canal surround se lo limita
en banda de 100 Hz a 7 kHz y se lo retrasa entre 20 y 30 milisegundos (dependiendo de la distancia entre parlantes) aprovechando el efecto de precedencia
(vanse los captulos i y ii de este libro) para que los receptores localicen la
seal de acuerdo al primer frente de onda recibido, por lo que las seales que
se encuentran en todos los canales tendern a una localizacin frontal. De
esta forma se facilita la separacin adelante/atrs entre canales. En los decodificadores activos ms avanzados se utiliza una matriz adaptativa que realiza
una serie de procesos con el objeto de determinar la localizacin de la fuente
dominante para poder selectivamente atenuar los canales menos importantes.
Por ejemplo, si la seal predominante es el dilogo en el canal central, se
atenuar la salida de los otros canales.

Surround de 5.1 canales (3-2 stereo)


El formato estreo 3-2 o surround 5.1 es la configuracin de canales ms utilizada y estandarizada en estos momentos en aplicaciones de cine, televisin y
productos hogareos, y probablemente lo ser durante bastante tiempo.
La configuracin de canales 5.1 se encuentra estandarizada bajo la norma
itu-r bs.775 (International Telecomunications Union, 1993). Como se
puede ver en la figura 6, mantiene los tres canales LCR para la representacin
del campo frontal con dos canales para la representacin del ambiente o efectos en estreo, ms un canal dedicado a efectos de baja frecuencia.
Esta configuracin fue diseada originalmente para las salas de cine, por
lo que la representacin sonora frontal es la ms importante, ya que se relaciona constantemente con la accin en la pantalla y los canales surround traseros
estn destinados a representar al ambiente y efectos sonoros complementarios.
Es por esto que este sistema no permite una localizacin espacial de la fuente
sonora en 360, principalmente debido a que la distancia angular entre los
altoparlantes no es igual y es particularmente muy grande entre los canales
traseros, produciendo un gran vaco en la imagen trasera del espectador. Sin
embargo, con sistemas de espacializacin y procesamiento sofisticado, como
leyes de panormicas avanzadas, Ambisonics u otras tcnicas descriptas en
este libro (vanse los captulos iii, iv y v), se puede lograr una buena aproximacin a la representacin de un campo sonoro envolvente.
210

Figura 6

El canal de efectos de baja frecuencia y el uso de subwoofers


Como sealamos al principio de este captulo, el lfe (Low Frecuency Effects
Channel) (vase Rumsey 2001, cap. iv), o canal de efectos de baja frecuencia,
ha sido diseado para reproducir seales de hasta 120 Hz que necesitan mayor
rango dinmico y presin sonora de la que pueden reproducir los altoparlantes
de los canales principales.
En los sistemas destinados al cine, este canal reproducir efectos sonoros
como explosiones, rumbles o cualquier otro programa sonoro en funcin de las
decisiones realizadas en el proceso de mezcla. Cabe aclarar que no es obligatorio el uso de este canal y que en muchos casos, sobre todo para la mezcla de
msica, es comn trabajar en rango completo en los canales principales.
En los sistemas hogareos se utiliza una adaptacin en la que se aprovecha el uso del subwoofer para reproducir bajas frecuencias y as poder disminuir
el tamao de los difusores de los canales principales. Utilizando un sistema
de administracin de bajas frecuencias con una red de filtrado cruzado, como
se puede ver en la figura 7, se suma al lfe el rango inferior a los 80-160Hz
(dependiendo del fabricante) de los canales principales.
211

Figura 7

Como el uso del canal de bajas frecuencias es similar en el formato 5.1 al que
se utiliza en los formatos que describiremos a continuacin, en adelante se
har referencia a la cantidad de canales de baja frecuencia de cada sistema.
Descripciones y asignacin de pistas
La estandarizacin tambin propone el tipo de asignacin de pistas a utilizar
en grabaciones 5.1 en los formatos de grabacin y almacenamiento de ocho
canales (vase tabla 1). A pesar de que existen otras posibles configuraciones
es habitual mantener la asignacin estandarizada.
Dolby Digital, Dolby Pro Logic

ii

Dolby Digital (vase Dolby Laboratorios Technical Library, s/f) es el sistema


de Dolby para el fomato 5.1. La versin para el formato de cine en 35 mm
se llama Dolby Digital Optical (vase Dolby Laboratories Technical Library,
s/f), ya que la informacin digital de audio se almacena de forma ptica entre
los orificios de arrastre de la pelcula de 35 mm, permitiendo mantener la pista
estreo ptica (con audio analgico), como se puede ver en la figura 8. Esto se
hace para mantener la compatibilidad con salas que no estn preparadas para
la reproduccin en 5.1 y para que la pista estreo sirva de copia de seguridad
en los casos en que no se pueda acceder a la informacin surround y as conmutar en la reproduccin de forma automtica entre una mezcla y la otra.
Este sistema incluye la codificacin Dolby AC-3 (vase Pohlmann, 2002,
cap. x) que utiliza tcnicas de reduccin de datos en base a filtros perceptuales
para lograr resoluciones de entre 32 kbit/seg y hasta 640 kbit/seg para cada
canal mono. El resultado final es un nico flujo de datos digitales con los seis
canales de audio discretos para su posterior decodificacin.
212

Tabla 1. Asignaciones de pistas para surround 5.1


Pista

Seal

Comentarios

Color

Izquierda

Amarillo

Derecha

Rojo

Centro

Naranja

lfe

Canal de efectos
de baja frecuencia

Efectos de baja frecuencia


adicionales, seal de
subwoofer opcional

Gris

ls

Surround izquierdo

-3 dB en caso de surround
mono

Azul

rs

Surround derecho

-3 dB en caso de surround
mono

Verde

Libre para uso de intercambio


de audio

Preferentemente seal
izquierda de una mezcla
estreo

Violeta

Libre para uso de intercambio


de audio

Preferentemente seal
izquierda de una mezcla
estreo

Marrn

Figura 8

213

La versin para el mercado consumidor de Dolby Digital utiliza la misma


codificacin AC-3 pero con un decodificador Dolby Pro Logic II (vase Dolby
Laboratorios Technical Library, s/f), que incorpora parmetros de control
especficamente diseados para salas hogareas y mantiene compatibilidad
con la codificacin por matrices de Dolby Pro Logic.
dts

El sistema dts (Digital Theater Systems) (vase Rumsey 2001, cap. iv) es otra
implementacin del formato 5.1 para salas de cine. En l se utilizan tcnicas
de compresin de audio destructivas para lograr un rango de frecuencias de
transferencia de entre los 32 kbit/seg hasta los 4.096 Mbit/seg (un poco
mayor que en Dolby Digital) y con frecuencias de muestreo de hasta 192
kHz, permitiendo tambin tcnicas de compresin no destructivas. Es por
esto que en teora permite configuraciones de mayor calidad de audio que
Dolby Digital, pero en la prctica las configuraciones ms utilizadas son
equivalentes.
En la pelcula de 35 mm el sistema dts graba una pista de sincrona al
lado de la pista estreo ptica (Dolby Stereo) y utiliza un reproductor de
audio especfico, externo al proyector, con las pistas de audio. De esta manera
se puede editar una misma pelcula en multiformato, con los tres sistemas
surround para cine: Dolby Digital, dts, sdds (que se detallar ms adelante)
y la pista estreo analgica Dolby Stereo. Ya que estos sistemas se almacenan
en diferentes sectores de la pelcula de 35 mm, permiten una compatibilidad
casi universal con las salas de cine actuales.
Para el mercado consumidor este sistema puede ser utilizado en las ediciones de dvd (vase Pohlmann, 2002, cap. xi) y realizar la reproduccin en
5.1 con el correspondiente decodificador. Cabe aclarar que la mayora de los
reproductores hogareos pueden decodificar tanto dts como Dolby Digital.

Surround de 6 canales. Dolby stereo 70 mm


A fines de la dcada del setenta Dolby realiz una adaptacin del sistema
Dolby Stereo Optical (con formato 3-1 stereo) a salas de gran tamao con
pantallas anchas para mejorar la representacin del campo sonoro frontal,
agregando dos canales en el frente con posiciones intermedias entre el canal
central y los laterales y un canal mono surround.
En la figura 9 se puede observar la distribucin de los canales izquierda,
centroizquierda, centro, centroderecha, derecha y surround.
214

CI

CD
surround

Figura 9

El almacenamiento de estos canales se realizaba de forma magntica junto con


la pelcula en el formato de 70 mm.

Surround de 6.1 canales


El formato 6.1 surround agrega a la configuracin 5.1 un canal surround trasero como se puede ver en la figura 10, quedando la siguiente asignacin de
canales: l, c, r, ls, bs, ls, lfe. De esta manera se mejora la representacin
del campo sonoro envolvente, permitiendo la localizacin puntual de fuentes
en el campo trasero. Al tratarse de un solo canal trasero, no se puede lograr
separacin izquierda-derecha de forma adecuada.
Dolby Digital Surround EX
El sistema Dolby Digital Surround EX (vase Dolby Laboratories Technical
Library, s/f) utiliza la configuracin 6.1 que se puede ver en la figura 10, con
215

Figura 10

la misma tecnologa de codificacin AC-3 en seis canales y, para el sptimo


(el canal surround trasero), utiliza una codificacin por matrices en el que ste
se codifica junto con los canales surround izquierdo y derecho. De esta manera
el sistema utiliza seis canales discretos de almacenamiento.
Dolby Pro Logic IIx
El sistema Dolby Pro Logic IIx (vase Dolby Laboratories Technical Library,
s/f) es la ltima versin hasta la fecha de la familia de decodificadores hogareos Pro Logic; utiliza la misma configuracin de canales 6.1 que se puede ver
en la figura 10 y est destinado a decodificar mezclas estreo y 5.1, y transformarlas en la configuracin 6.1.
dts-es

El sistema dts-es utiliza la configuracin de canales 6.1 que se puede ver en


la figura 10, la misma tecnologa de compresin de audio destructiva y alma216

cenamiento que dts y almacena de forma discreta los siete canales de audio.
Este sistema generalmente se lo encuentra en dvd y no se ha utilizado para
salas de cine.

Surround de 7.1 canales


El primer formato 7.1 de la industria fue un derivado del 5.1 que se adapt
para salas de grandes tamaos con pantalla anchas (widescreen) en las que la
localizacin de la fuente sonora frontal se perjudicaba por la distancia entre los
altoparlantes de los canales frontales. Para solucionar este problema se agregan
dos canales ubicados en centroizquierda y centroderecha como se puede ver en
la figura 11, y los canales surround y de efectos de baja frecuencia mantienen la
misma distribucin que en el formato 5.1.
En la actualidad, existe un segundo formato 7.1 que hasta el momento
tiene ms aceptacin en productos del mercado hogareo. Es una derivacin
del formato 5.1 pero con dos canales extras para surround trasero y derecho, de
CI

CD

Figura 11

217

manera que la configuracin es: izquierda, centro, derecha, surround izquierdo,


surround derecho, surround trasero izquierdo, surround trasero derecho, efectos
de baja frecuencia (l, c, r, ls, rs, bsl, bsr, lfe), como muestra la figura 12.
De esta manera se mejora uno de los principales problemas del formato
5.1, que era la gran separacin entre los canales surround, lo que permite una
mejor representacin del campo sonoro envolvente.
En las diferentes implementaciones en sistemas propietarios de este formato, puede haber diferentes modos de reproduccin especficos para msica
o cine, en los que es necesario reorganizar la ubicacin de los altoparlantes en
la sala.
Sony

sdds

El sistema sdds (Sony Dynamic Digital Sound) (vase Rumsey, 2001, cap. iv) es
el tercero de los sistemas ms utilizados en las salas de cine. Est especialmente
diseado para salas grandes en las que el ancho de la pantalla es demasiado

Figura 12

218

extenso para el sistema 5.1. La distribucin de los 7.1 canales que se puede ver
en figura 11 es l, lc, c, rc, r, ls, rs, lfe (izquierda, centroizquierda, centro,
centroderecha, derecha, surround izquierdo, surround derecho, canal de bajas
frecuencias), que permite una mayor precisin en la localizacin espacial de
las fuentes sonoras en el campo sonoro frontal.
Se utiliza el sistema de reduccin de datos Sony atrac (vase Pohlmann,
2002, cap. xii), que codifica los ocho canales con una compresin de aproximadamente cinco veces. El almacenamiento del sdds se realiza de forma
ptica entre los orificios de arrastre de la pelcula de 35 mm opuestos a los
utilizados en Dolby Digital.
Dolby Digital Plus
Dolby Digital Plus (vase Dolby Laboratories Technical Library, s/f) utiliza la
configuracin bsica 7.1 que se puede ver en la figura 12 (l, lc, c, rc, r, ls,
rs, lfe). Es una evolucin del Dolby Digital con AC-3 en la que se utilizan
tcnicas de compresin de audio destructivas para conseguir tasas de transferencia de hasta 6 Mbps (mega bits por segundo) en un solo flujo de datos
digitales con ocho canales discretos de audio, permitiendo as mayor calidad
de codificacin que su predecesor.
En el formato hd dvd (dvd de alta definicin) se utiliza con una tasa de
3 Mbps y en el Blue-ray Disc de 1,7 Mbps. Es soportado por la nueva interfaz
hdmi (High-Definition Media Interface) para interconectar audio y video de
alta calidad en un solo cable.
Este formato, que ha sido adoptado para transmisiones de televisin de
alta definicin, video por cable y satelital, es uno de los posibles formatos a ser
estandarizados y adoptados masivamente para este tipo de aplicaciones.
Dolby Digital True

hd

Dolby Digital True hd (vase Dolby Laboratories Technical Library, s/f) utiliza la configuracin bsica 7.1 que se puede ver en la figura 12 (l, lc, c, rc,
r, ls, rs, lfe).
Utiliza una nueva tcnica de compresin de audio no destructiva, que al
realizar la decodificacin permite obtener la seal original sin ninguna prdida de calidad. Soporta una tasa de transferencia de hasta 18 Mbps y resolucin
de audio de rango completo a 24 bits 96 kHz de frecuencia de muestreo. Si
bien permite ms canales para el formato hd dvd y Blu-ray Disc, utiliza ocho
canales de audio y es tambin soportado por la interfaz hdmi (High-Definition
Media Interface).
219

dts-hd

El formato dts-hd utiliza la configuracin bsica 7.1 que se puede ver en la


figura 12 (l, lc, c, rc, r, ls, rs, lfe). Sin embargo, tiene varios tipos ms de
configuracin de altoparlantes en los que se enfatizan en cada modo la localizacin frontal, trasera, efectos en altura y otros. Los tipos de configuracin se
pueden elegir de acuerdo a la aplicacin, sala o efecto deseado.
dts-hd utiliza un sistema de codificacin no destructiva de alta calidad
con una tasa de transferencia de hasta 24,5 Mbps para el formato del Blu-ray
Disc y 18,0 Mbps para el hd dvd. Permite as el almacenamiento y transferencia de ocho canales de audio de rango completo a 24 bits 96 kHz de frecuencia
de muestreo sin prdida de informacin.

Surround de 10.2 canales


El formato 10.2 fue desarrollado por Tomlinson Holman, el creador de thx. Si
bien es promocionado como el futuro de la reproduccin espacial de sonido,
todava no ha sido adoptado como estndar.
Este sistema toma la configuracin 5.1 (International Telecomunications
Union, 1993) y agrega mejoras con canales adicionales. La distribucin de los
doce canales discretos que se puede ver en la figura 13 es la siguiente:
Cinco canales frontales: izquierda abierta, izquierda, centro, derecha, derecha abierta.
Tres canales surround: surround izquierdo directo, surround trasero, surround
derecho directo.
Dos canales de baja frecuencia: lfe izquierdo, lfe derecho.
Dos canales de altura: izquierda alto, derecha alta.
Esta configuracin permite la localizacin espacial de la fuente sonora en 360
en el plano horizontal. Si bien los canales en altura no permiten localizar una
fuente en tres dimensiones en 360 (seran necesarios tantos canales en altura
como los ubicados horizontalmente), permiten una aproximacin a la localizacin vertical en el campo sonoro frontal. Este sistema aprovecha muy bien
los canales surround y los de altura para lograr, por medio de retrasos temporales, una mejor representacin de los reflejos tempranos de una sala acstica.
Los canales de baja frecuencia se utilizan como canales dedicados a efectos o
con administracin de bajos, en donde todos los canales izquierdos utilizan el
subwoofer izquierdo y todos los canales derechos el subwoofer derecho, o una
220

Figura 13

combinacin de los dos modos. Si bien las frecuencias graves son omnidireccionales, la decorrelacin de estas frecuencias otorga una mejor separacin
izquierda-derecha y una mayor sensacin de espacialidad.

Surround de 22.2 canales


El formato surround de 22.2 canales (24 canales discretos) es utilizado en
el sistema de sper alta definicin de video japons Super High Definition
Video, desarrollado por nkh Science & Technical Research Laboratorios.
La configuracin de parlantes est organizada en tres capas, con la siguiente
asignacin de canales (vase figura 14):
Capa alta (9 canales): izquierda, centro, derecha, surround izquierdo, centro
techo, surround derecho.
Capa media (10 canales): izquierda, centroizquierda, centro, centroderecha,
derecha, surround izquierdo, surround derecho, surround trasero izquierdo,
surround trasero centro, surround trasero derecho.
Capa baja (3 canales): izquierda, centro, derecha.
lfe (2 canales): lfe izquierda, lfe derecha.
221

Figura 14

thx
thx (vase Rumsey, 2001, cap. iv) no es un formato surround sino un sistema
de control de alta fidelidad de reproduccin de sonido para salas de cine, parlantes multimedia, consolas de video juego y sistemas de sonido de autos.
El sistema fue desarrollado por Tomlinson Holman para Lucasfilm; la
sigla thx viene de Tomlinson Holman Experiment.
El objetivo principal del sistema para su uso en cine es el de asegurar una
calidad de reproduccin de sonido lo ms parecida posible a las que se utilizaron en el proceso de mezcla de la pelcula. Para lograr este propsito thx otorga
certificaciones de salas en las que se cumplen las especificaciones requeridas,
que debern ser evaluadas peridicamente por personal certificado por thx.
Estos requerimientos son de dos tipos: 1) equipamiento utilizado para la
reproduccin sonora: diseo de parlantes, crossovers, amplificadores, etctera.
thx proporciona una lista de fabricantes y productos certificados; 2) la acstica de la sala, con especificaciones de diseo como piso flotante, paredes no
paralelas (para reducir ondas estacionarias), paredes con tratamiento acstico
(para controlar reflejos), tipo de reverberacin y ruido ambiente, estrictas
condiciones de insonorizacin, etc. Cabe destacar que thx no publica las
especificaciones referidas a la acstica de salas, sino que certifica a profesionales, que a su vez se encargarn de la certificacin de las salas.

mpeg
Las estandarizaciones mpeg (Moving Pictures Expert Group) (vase Pohlmann,
2002, cap. x) son muy utilizadas para la representacin en baja tasa de bits de
seales de audio y video en aplicaciones multimedia y otras.
222

El formato mpeg-1 es de dos canales de audio, mientras que el mpeg-2


permite informacin multicanal. Existen dos versiones de mpeg-2: el bc
(backwards compatible), que permite la compatibilidad con mpeg-1, y el aac
(Advanced Audio Coding, o codificacin avanzada de audio) que no permite
tal compatibilidad.
Los formatos y algoritmos surround mpeg no han sido implementados con
mucho xito en aplicaciones del mercado consumidor, cine y televisin, ya
que formatos como el Dolby AC-3 han resultado ms populares en la industria. Sin embargo la estandarizacin para dos canales como el mpeg-1 Layer
3 (el formato MP3) ha sido ampliamente adoptada en la gran mayora de los
productos hogareos.

mlp
mlp (Meridian Lossless Packing) (vase Pohlmann, 2002, cap. xi) es un sistema de compresin no destructiva de audio multicanal, que Meridian Audio
licencia a travs de Dolby Labs.
Fue especificado para el dvd-Audio con el objeto de poder almacenar
mezclas multicanal de hasta seis canales en alta resolucin, de hasta 192 kHz
en 24 bits sin perder calidad. Con esta tecnologa el audio, una vez decodificado, es exactamente igual a la seal original, no como en los procesos de
compresin destructiva como Dolby Digital, mpeg, etctera.

dvd-audio
El dvd-a (vase Pohlmann, 2002, cap. xi) es un formato de almacenamiento
digital para la distribucin de audio de alta calidad en el soporte de dvd,
propuesto por el dvd Forum y apoyado por la mayora de las compaas discogrficas y distribuidoras del sector. Posee una amplia variedad de canales,
frecuencias de muestreo, resolucin en bits y otras caractersticas adicionales.
Los primeros productos comerciales y ediciones musicales en este formato aparecieron en el ao 2000. Hasta la fecha no ha ganado gran parte del mercado
debido a la competencia existente con el Super Audio cd (sacd). Por esto,
ninguno de los dos formatos ha podido masificar la distribucin de ediciones
musicales de alta calidad.
El dvd-a ofrece muchas posibles configuraciones, de uno a seis canales
audio de rango completo y resoluciones desde 44.1 kHz a 192 kHz de frecuencia de muestreo y 16 a 24 bits, como las que se pueden observar en la tabla 2.
223

Tabla 2
16-, 20- o 24-bit

44,1
kHz

48
kHz

88,2
kHz

96
kHz

176,4
kHz

192
kHz

Mono (1.0)

Estreo (2.0)

Estreo (2.1)

No

No

Estreo + mono surround


(3.0 o 3.1)

No

No

Cuadrafnico (4.0 o 4.1)

No

No

3-Estreo (3.0 o 3.1)

No

No

3-Estreo + mono surround


(4.0 o 4.1)

No

No

Surround (5.0 o 5.1)

No

No

El audio almacenado es codificado en formato lpcm (Linear Pulse Code


Modulation) (vase Pohlmann, 2002, caps. iv y v) sin comprimir o comprimido de forma no destructiva con Meridian Lossless Packing (mlp). La transferencia de datos mxima es de 9,6 Megabits por segundo. La combinacin de
canales y resolucin no puede exceder esta tasa de transferencia, por lo que es
posible almacenar sin comprimir mezclas 5,1 en 96 kHz /16 bits o 48 kHz/24
bits y estreo en 192 kHz/24 bits. Para almacenar mezclas de seis canales en
96 kHz/24 bits es necesario realizar una codificacin mlp.
En un mismo dvd-a se puede tener ms de una mezcla en diferentes resoluciones, por ejemplo una estreo a 192 kHz/24 bits y una 5,1 a 96 kHz/24 bits.
Asimismo, pueden elegir diferentes resoluciones entre canales, por ejemplo en
una mezcla surround, los canales frontales a 192 kHz/24 bits y los surround a
48 kHz/16 bits u otras combinaciones posibles.
Para mantener compatibilidad con reproductores de cd es posible editar
un dvd-a hbrido en el que uno de los layers (capas) del disco almacene una
versin estreo a 44,1 kHz a 16 bits y otro (generalmente del otro lado del
disco DualDisc) con la edicin de alta fidelidad.
224

Super audio cd
El sacd es un formato de almacenamiento de audio digital de alta resolucin,
propuesto en 1999 por Sony y Philips. Permite la edicin de audio en estreo,
multicanal o ambos. El soporte fsico del sacd (a pesar de su nombre) es en
realidad un dvd de 4,7 o 8,5 Gb.
El sacd codifica el audio en el formato dsd (Direct Stream Digital) (vase
Pohlmann, 2002, cap. ix) a una frecuencia de muestreo de 2,8224 Mhz a 1 bit de
resolucin, obteniendo una calidad de audio similar a pcm de 192 kHz/24 bits.
Existen tres tipos de sacd:
Hbrido: el ms popular de los tres. En un dvd de 4,7 GB, en su primera capa
o layer almacena una edicin de cd Red Book (compatible con casi todos
los reproductores existentes de cd) y en el segundo layer la edicin de alta
definicin, en estreo o multicanal, y la resolucin de audio depender de la
cantidad de tiempo a almacenar. Generalmente un disco hbrido puede almacenar una hora de audio en su capa de cd a 44,1 kHz/16 bits y una hora en 5,1
en dsd con una resolucin similar a pcm de 48 kHz/24 bits.
Single-layer (capa nica): en un dvd de 4,7 GB un sacd con la configuracin
deseada de mezcla estreo, multicanal o ambas con diferentes resoluciones
posibles para cada una y sin capa de cd.
Dual-layer (capa doble): en un dvd de 8,5 GB, sin capa de cd, con caractersticas idnticas al single-layer, pero con casi el doble de capacidad de
almacenamiento. Permite ms cantidad de minutos de audio, ms canales,
mayor resolucin o la combinacin deseada. Este tipo de sacd es muy poco
utilizado.

Otros formatos multicanal


En este captulo se han descripto la mayora de los formatos y sistemas de
sonido envolvente para la industria audiovisual. Pero es necesario aclarar que
ha habido muchos otros desarrollos, como el sistema Fantasound que Disney
utiliz en la pelcula Fantasa en 1938-1940, que fue la primer pelcula con
sonido surround, o sistemas desarrollados por Lexicon, Circle Surround, las
implementaciones especficas en las sala imax y otros.
Para otro tipo de programas sonoros, como la reproduccin o interpretacin en vivo de msica, teatro, instalaciones multimediales, etc., es comn
225

que en el proceso del diseo de puesta sonora del proyecto se implementen


configuraciones especficas de altoparlantes y se utilicen diferentes tcnicas
de espacializacin, como las detalladas en este libro, en funcin de las necesidades de cada caso.

Bibliografa
Dolby Laboratories Inc., Technical Library (<http://www.dolby.com/technicallibrary.aspx?id=306>).
International Telecomunications Union, ITU-R BS.775 (1993) (<http://www.
itu.int>).
Pohlmann, Ken C. (2002), Principios de Audio Digital, Madrid, McGraw-Hill.
Rumsey, Francis (2001), Spatial Audio, Oxford, Focal Press.

226

Captulo vii
El sonido multicanal en la composicin acusmtica
Robert J. Dow

Presentacin
El compositor acusmtico, cuya msica queda fija en un soporte de grabacin
y es compuesta con la conciencia de que ser finalmente recibida a travs
de altoparlantes, est naturalmente preocupado tanto por la percepcin del
espacio musicalmente significativo, como por la forma en que se transmite y
se percibe su msica dentro de un espacio de audicin especfico. Es tentador
creer en la fidelidad potencial de la reproduccin sonora: la posibilidad de una
recreacin sonora literal. Para muchos, la reproduccin ideal de un trabajo
acusmtico supone crear una relacin transparente entre el sonido intencional y la experiencia sonora. En realidad, por supuesto, en una situacin de
audicin grupal, esto nunca puede ser completamente logrado.
El deseo de mayor control espacial, sin embargo, ha llevado a muchos
compositores acusmticos lejos de la prctica normativa de usar reproduccin
estreo, y a renovar el inters por toda la gama de formatos de reproduccin
de sonido multicanal. Estos incluyen el despliegue de mltiples altoparlantes
conformando matrices mono y/o estreo mltiples, formatos estndar como el
Dolby 5.1, y muchos formatos experimentales, como Ambisonics y la sntesis
de campo de onda.*1El uso de formatos multicanal puede llegar a dar, prima
facie, ms oportunidades al compositor que necesita diferenciacin y detalles
espaciales. Pero, como lo ilustra el decepcionante desarrollo del diseo de
sonido para cine, su uso ingenuo puede producir el efecto opuesto: la falta
de claridad espacial.

Prembulo
Quizs no sea sorprendente que algunos compositores acostumbrados a la
creacin utilizando sonidos grabados deseen fijar tambin la ejecucin de su
*

Wave Field Sntesis (wfs), en el original en ingls. [N. del T.]

227

trabajo. El proceso de composicin de msica acusmtica en un ambiente de


estudio es naturalmente reflexivo, dando lugar tanto a la impresin de estar
trabajando directamente con el sonido, como a la sensacin de que lo que se
oye es lo que se obtiene. Adems, el producto final del trabajo en el estudio
es algo que es fijado en un medio particular. En el caso de un medio digital,
el sonido es representado por una cadena de nmeros que pueden ser copiados
exactamente una y otra vez: la intencin del compositor ha tomado forma
absoluta, transformndose en un original cuidadosamente producido y capaz
de ser clonado, al menos en apariencia.
La reproduccin de sonido tiene, a primera vista, potencial para la
fidelidad: la recreacin literal del sonido dentro de un espacio especfico de
reproduccin. La reproduccin ideal de un trabajo acusmtico consiste, para
muchos, en establecer una relacin transparente entre el sonido intencional
(presumiblemente, lo experimentado por el compositor en el estudio) y el
sonido real experimentado por la audiencia. El actual y renovado inters en
la reproduccin multicanal es impulsado parcialmente por el deseo de crear
esta transparencia.
No obstante, como James Lastra ha sealado, cada sonido es:
[...] espacio-temporal especfico o, en un amplio sentido del termino, histrico.
Dado que un sonido es inseparable del tiempo y el espacio de su produccin, cada sonido llega a ser un evento irrepetible un evento distinguible
de todos los otros (Lastra, 1992).

De hecho, la conocida existencia de un sweet spot*2dentro de un espacio


de ejecucin particular implica usualmente la coexistencia de muchas ms
posiciones de escucha menos ideales. Esto, a su vez, indica que durante la
ejecucin de una pieza especfica de msica acusmtica, puede haber un rango
ilimitado de diferentes versiones simultneamente emitidas a la audiencia,
que se escuchan de acuerdo con las posiciones en el auditorio.
Por otra parte, la representacin fija de la composicin como, por ejemplo, en cinta o disco, se ejecuta por medio de una instancia particular de su
tecnologa de reproduccin y su espacio de reproduccin. Diversas caractersticas de la tecnologa usada para la reproduccin pueden ser percibidas en
el sonido y, de hecho, el equipamiento puede seleccionarse a causa de estas
caractersticas particulares, para ajustarse a un determinado gusto o a un conjunto de normativas prcticas. Por supuesto, esto es ms notorio cuando el
*

El trmino es de uso habitual en la ingeniera de audio. Alude al punto o zona de audicin


ideal de un espacio acstico. [N. del T.]

228

equipo no es de la calidad suficiente como para reproducir eventos estructurales importantes dentro de la composicin, pero aun efectos ms sutiles pueden
cambiar la percepcin de la msica por parte del pblico.
La acstica de un auditorio puede, naturalmente, tener un efecto inmenso
en la recepcin de un sonido reproducido, particularmente en lo que respecta
a detalles espaciales grabados. Es importante saber que esto produce, frecuentemente, una tensin entre la yuxtaposicin de un espacio virtual (planeado)
y un espacio real (ejecutado), y el movimiento de objetos sonoros dentro de
estos espacios. Esto se observa ms frecuentemente cuando una fuente con
un alto grado de reverberacin en la grabacin (sea real o artificial) es reproducida en un espacio altamente reverberante, lo cual es una buena razn en
contra de la prctica sorprendentemente comn de tratar la totalidad de una
composicin acusmtica ya terminada con un cierto nivel de reverberacin
artificial, para crear la impresin de un espacio virtual cohesivo. No obstante, hacia el otro extremo, una grabacin de un evento sonoro de una fuente
cercana en un espacio seco, sonar distante y reverberante si es reproducida
y escuchada respectivamente en los extremos opuestos de una gran catedral,
por ejemplo. De esta manera, es imposible componer con la esperanza de crear
algn sentido de espacio absoluto.

Ejecucin
La ejecucin (difusin) de una composicin acusmtica es el acto de su realizacin. No hay original: en lugar de reproducir una copia, la difusin aspira a
recrear el trabajo acusmtico para una instancia espacio-temporal especfica,
y por lo tanto, como apunt Smalley, este se convierte en el acto final, el
ms crucial de todos (Smalley, 1986). Mirada de manera puramente tcnica,
la difusin ofrece la posibilidad de cambiar en tiempo real continuamente la
dinmica, el volumen (muchos versus pocos altoparlantes), la coloracin del
sonido y el rango espectral (por el uso de diferentes tipos de altoparlantes), el
emplazamiento y la articulacin espacial dentro del espacio de ejecucin. De
qu forma pueden ser modificados estos parmetros depende, por supuesto, del
sistema de difusin que se est usando.
En este punto vale la pena enfatizar que la difusin no es simplemente
formar la mejor presentacin de algo absoluto y fijado. Difusin es ejecucin
y, como tal, no es simplemente promulgar las intenciones del compositor, ni
dar relieve a las estructuras aparentes de la msica. La ejecucin, incluyendo
la de msica acusmtica, tiene que ser analtica en el sentido de adivinar y
reaccionar a estas intenciones y estructuras pero, lo que es ms importante,
229

debe ser intuitiva y, en cierta medida, espontnea: una fuerza creativa en


su propio derecho. Como lo ha expresado Nicholas Cook, la aplicacin de
estos enfoques analtico e instintivo a la msica es casi como crear una
chispa a travs de la yuxtaposicin de dos polos elctricos opuestos (Cook,
1999).
La difusin artstica puede tomar riesgos jugando con las expectativas de
la audiencia y, de hecho, puede optar por hacer caso omiso a las tcticas de
difusin sugeridas por los compositores. Por ejemplo, gestos cortos, energticos y rpidos como aparecen en el comienzo de la obra Shortstuff, de Pete
Stollery (1993), sugeriran automticamente a la mayora de los ejecutantes
acusmticos una articulacin rpida y enrgica de estos gestos dentro un espacio de ejecucin tridimensional, enfatizando su forma natural y trayectoria,
que crean un sentimiento de excitacin y energa. Siendo un artista experimentado de la difusin, Stollery casi seguramente compuso esta obra con
la expectativa de que esto ocurrira, y cabe sealar que Shortstuff es, incuestionablemente, un trabajo que puede parecer muy plano en el estudio y muy
vivo si se ejecuta correctamente en una sala de concierto: es un trabajo que
requiere ejecucin. Sin embargo, otros enfoques de la ejecucin de Shortstuff
pueden simplemente ignorar estas expectativas. Un ejecutante puede decidir,
en otra ocasin, luchar en contra de la evidente estructura de la obra. Estas
interpretaciones pueden revelar otras facetas de la msica, tal vez menos
evidentes, presentando una comprensin ms profunda de esta a travs de la
intervencin del ejecutante.

Formatos
Al contemplar los diferentes formatos de reproduccin, se debe recordar que
las necesidades del ingeniero de grabacin no son necesariamente las del
compositor o ejecutante de msica acusmtica. No es comn para la msica
acusmtica limitarse a la mera reproduccin de una experiencia sonora conocida, aunque de hecho esto pueda formar parte de su intencin artstica. Esto
no significa minimizar el problema de producir buenas grabaciones: a menudo
se requiere mayor habilidad para crear un sentido de realidad o autenticidad
que de irrealidad.
Hoy en da existen numerosos formatos de reproduccin, todos con
sus propias ventajas y desventajas, y no es la intencin de este documento
explorarlos en su totalidad. Los formatos tratados en lo que sigue son los
ms comnmente utilizados por los compositores acusmticos en la actualidad.
230

Estereofona con dos altoparlantes


Incluso con la aparicin y reaparicin de un gran nmero de formatos de
reproduccin multicanal, el 2-0 estereofnico (o simplemente estreo) es el
formato elegido por muchos para la composicin de msica acusmtica. No
hay duda de que esto se debe parcialmente a que los recursos de reproduccin
estreo de alta calidad son relativamente fciles de disponer y de menor costo
comparados con sus equivalentes multicanales. Sin embargo, es importante
sealar que si bien se han realizado un gran nmero de experimentos con
respecto a las posibilidades de ejecucin de trabajos acusmticos multicanal,
actualmente la prctica de la ejecucin acusmtica est firmemente basada en
la reproduccin estreo.
Los buenos sistemas de difusin estreo en manos de buenos ejecutantes
pueden evitar algunos de los conocidos problemas del estreo sin difusin: por
ejemplo, ofrecen la posibilidad de abarcar ms audiencia (sweet spots ms
grandes) con menos agujeros espaciales, dan ms posibilidades de cambios
reales en las perspectivas espaciales (el sonido no se limita a una simulacin
en un solo plano) y el sonido puede tanto "envolver" a la audiencia como
moverse alrededor de ella.
Sin embargo, vale la pena reiterar que la intencin de la difusin estreo no
es mejorar o perfeccionar la reproduccin estreo sino esencialmente recomponer el trabajo acusmtico para una situacin espacio-temporal particular
(Dow, 2003). La difusin estreo es ms efectiva cuando un trabajo es pensado
teniendo en cuenta su difusin en estreo, y cuando el uso del espacio se aborda
de manera orgnica antes que arquitectnica, por usar la distincin de Jonty
Harrison (1999). El emplazamiento absoluto de objetos sonoros dentro de sus
espacios compuestos asociados no es importante aqu. Por el contrario, lo que es
importante son las relaciones e interacciones dinmicas tanto entre los objetos
sonoros individuales, como entre los objetos sonoros y su contexto espacial
percibido. Este ltimo comprende la superposicin del espacio compuesto y del
espacio de escucha (el espacio virtual y el real, respectivamente).
Por lo tanto, para el compositor acusmtico, la limitacin del estreo,
incluso del estreo con difusin, no debe considerarse en trminos de una
inadecuada fidelidad espacial, como tan a menudo lo es. Lo que no puede
ofrecer el estreo es la articulacin de clases particulares de relaciones, tanto
entre objetos sonoros discretos y espacios sonoros discretos como entre objeto
sonoro y espacio sonoro. Por ejemplo, controlar la separacin espacial de
un contrapunto de materiales de naturaleza similar puede ser dificultoso o
imposible de realizar. Uno de los muchos trucos de los compositores acusmticos con respecto a la difusin es la creacin de una separacin espectral
231

y/o dinmica entre los sonidos, que facilita su separacin espacial durante la
difusin. Sin embargo, esto limita las posibilidades de interaccin espacial que
el compositor puede explorar.
En la msica acusmtica rica en espacializacin, el uso de solo dos canales
(particularmente en un espacio de ejecucin tpico) a menudo no es suficiente
para transmitir la suntuosidad espacial de la imagen sonora; sin embargo la
distribucin de esta imagen en mltiples altoparlantes no necesariamente
lleva a la formacin de una imagen sonora coherente y simplemente mayor.
Por el contrario, las mltiples imgenes tienen tendencia a distorsionar y
borronear la imagen general, creando una percepcin ms difusa.
Estreo 3-2 (5.1 canales envolventes)
El creciente inters y la disponibilidad de sistemas 5.1 hogareos han producido, naturalmente, un cierto inters en este formato por parte de los compositores acusmticos. Se asume que la esperanza es que tal sistema de sonido
envolvente puede dar una mayor flexibilidad en la articulacin espacial en
situaciones en las que antes solo se poda contar con un sistema estreo.
Tambin es importante la existencia de versiones estndar en estreo 3-2
las cuales, en teora, pueden dar al compositor expectativas especficas de un
arreglo de altoparlantes correctamente dispuesto.
El 5.1, diseado y pensado para usarse en el cine comercial y hogareo
y, en consecuencia, principalmente con la idea de un escenario de sonido
frontal, usa un estreo 2-0 convencional con la adicin de parlante central
(izquierda, derecha y centro) y dos canales secundarios traseros, que fueron
pensados originalmente para dar soporte al sonido ambiente, la sensacin
de sala y los efectos especiales.13El canal central permite que el dilogo se
focalice correctamente detrs de la pantalla sin la distorsin tmbrica que
una imagen estreo 2-0 puede producir. En teora, tambin podra permitir la
creacin de un escenario sonoro frontal ms amplio, cubriendo el agujero en
el medio. Sin embargo, el estndar 5.1 envolvente tiene los altoparlantes de
izquierda y derecha localizados a +/-30 para ser compatible con estreo de dos
canales y, por lo tanto, no usa esta posibilidad.
El ngulo de los altoparlantes envolventes (110) causa que su
proyeccin sea ms lateral que trasera. El ngulo de los altoparlantes, por
lo tanto, se establece para lograr un compromiso con un sonido envolvente
que sea tanto lo suficientemente lateral para envolver al oyente de manera
efectiva, como lo suficientemente trasero para permitir que los efectos sean
1

Para ms detalles de la 3.2 estreo, vase, por ejemplo, Rumsey (2003, pp. 86-94).

232

paneados*4detrs de l. Vale la pena advertir que, aun cuando se usan


altoparlantes adicionales paralelos a los envolventes, tal como esta permitido
en el estndar itu (para proporcionar suficiente cobertura envolvente en
espacios ms grandes y distribuidos uniformemente entre los 60 y 150),
en el estndar envolvente 5.1 no hay altoparlantes dispuestos directamente
detrs de la audiencia.
Para el compositor acusmtico, el sistema 5.1 de canales envolventes
tiene numerosos defectos graves, en particular cuando utiliza un material
espacialmente rico. El estndar 5.1 no fue concebido teniendo en mente
una produccin precisa de imgenes en 360, y la desigual distribucin de
los altoparlantes (y, de nuevo, la disposicin de altoparlantes envolventes
suplementarios y paralelos en el estndar) hacen difcil conseguirla. Hay, por
supuesto, varias tcnicas de microfoneo que se han propuesto para hacer grabaciones en un formato ms o menos adecuado para reproducirse en sonido
envolvente 5.1 aunque, a menos que se use un mtodo Ambisonics utilizando
un micrfono Soundfield, hay que recordar que ninguna de estas tcnicas es
particularmente portable, haciendo que la grabacin ambiental y otros tipos
de grabacin in situ sean prcticamente imposibles.25En general, sin embargo,
las imgenes de arreglos 5.1 son inevitablemente mejores entre los altoparlantes del frente, bastante pobres en los traseros, y decididamente variables en los
costados (Rumsey, 2003).
Estas tcnicas pueden ser adecuadas para la reproduccin de imgenes
sonoras relativamente estables (grabaciones de msica, sonido de pelculas,
etc.), particularmente donde la mayor parte de la informacin sonora relevante es frontal, pero para el compositor acusmtico, que desea tanto poder
procesar estas grabaciones como manipular sus cualidades espaciales, las grabaciones multicanales destinadas a la reproduccin 5.1 son excepcionalmente
difciles de utilizar. En cambio, muchos de los compositores que trabajan en
5.1 confan en materiales originales basados en grabaciones fiables de dos
canales estreo o aun mono, que son luego manipuladas espacialmente con
distintos grados de xito en el escenario 5.1, usando leyes de panormico y
reverberacin artificial.
Si se utilizan seales estreo, el altoaltoparlante del centro es frecuentemente visto como un problema. En este caso, en trminos de imagen, no hay
ninguna seal grabada asignada a este altoparlante por lo que, o se vuelve
redundante, o su seal se deriva de alguna manera de los canales de la derecha
*

Castellanizacin de la expresin inglesa panning, trmino de uso corriente por parte de los
ingenieros de audio de habla espaola. [N. del T.]
2 Vase, por ejemplo, Theile (2001).

233

y de la izquierda (si bien esto puede generar buenos resultados si se ejecuta


apropiadamente, produciendo, por ejemplo, una imagen sonora central ms
estable).36Ms aun, este altoparlante central requiere de un uso muy cuidadoso: puede volverse fcilmente demasiado prominente, y tanto puede realzar
la imagen estreo frontal como tambin destruirla, particularmente si se le
asigna una seal decorrelacionada.
Si el altoparlante central es esencialmente ignorado, el compositor se
queda con un sistema cuadrafnico no uniforme, que es como, desafortunadamente, el sistema 5.1 es usado por algunos compositores. La forma irregular
del arreglo de altoparlantes y sus anchos ngulos laterales hacen que sea bsicamente imposible el panormico estreo uniforme, y esto puede tentar a los
compositores a tratar a los objetos sonoros de manera monoaural, conduciendo
a que su movimiento percibido se ubique en la periferia del sistema 5.1, y que
suenen muy a menudo localizados como si estuvieran en el altoparlante.
En trminos de rendimiento, el sistema 5.1 presenta problemas similares a
los otros sistemas multicanal (por ejemplo, octofona). Dado que usualmente no
hay en 5.1 una imagen real ni coherente, esta no puede ser manipulada con sensatez como una imagen estreo en un arreglo estreo mltiple. Los compositores
que se interesan tanto por el 5.1 como por la proyeccin sonora, tienen tendencia a difundir la imagen frontal derecha/izquierda normalmente, dejando los
altoparlantes del centro, los traseros y los de los lados fijos para aquellos efectos
especiales que no pueden ser logrados fcilmente a travs de la difusin (por
ejemplo, movimiento circular o aleatorio y separacin adelante/atrs genuina).
Pueden usarlos tambin para dar nfasis al ambiente envolvente, o para crear
una fuente central separada del resto del sistema de difusin all donde tenga
sentido (por ejemplo, texto y otros materiales vocales grabados).
Finalmente, cabe sealar que el canal lfe (efectos de baja frecuencia), limitado a una banda de hasta 120 Hz, realmente no tiene cabida en la composicin
de msica acusmtica ni, ciertamente, tampoco en su interpretacin. Como los
otros cinco canales son de banda completa, la utilizacin de este canal parece
tener poco sentido, particularmente cuando un apropiado sistema de manejo de
bajos es utilizado, como es de rigueur en sistemas de difusin profesionales.
Octofona
Recientemente ha habido un renovado inters en los sistemas de reproduccin
de 8 canales, que se debe indudablemente, al menos en parte, a la disponibilidad de placas de sonido de 8 (o ms) canales a bajo precio, y a la inmediatez
3

Vase, por ejemplo, Gerzon, (1992).

234

provista por programas como max/msp, pd y Supercollider para la creacin de


seales multicanal y para el procesamiento espacial. La configuracin de altoparlantes ms comn es la de un crculo uniforme alrededor de la audiencia,
con los altoparlantes espaciados uniformemente a intervalos de 45, ya sea
tanto con altoparlantes centrales al frente y atrs (es decir, puestos a 0, 45,
90, 135 y 180: conocida a veces como configuracin en doble diamante) o la misma configuracin rotada a 22,5 para lograr un frente plano (es
decir puestos a 22,5, 67,5, 112,5 y 157,5: conocida a veces como
configuracin en cuatro pares).
Sin embargo, el actual repertorio acusmtico no se limita a estos formatos
uniformes; indudablemente la variedad de formatos de 8 canales existentes
requiere que el compositor sea bastante especfico en las instrucciones de
difusin de la obra, tanto acerca de la disposicin de los altoparlantes, como
en sus expectativas de reproduccin. Streams (1999) de Jonty Harrison, por
ejemplo, usa cuatro pares de altoparlantes estreo ubicados en diferentes planos espaciales (principal, ancho, atrs y distante). Esto facilita la posibilidad de hacer fluir la imagen sonora entre diferentes perspectivas estreo
y permite una fcil integracin con las actuales configuraciones de difusin
estreo, creando as algn potencial de ejecucin. Los principales objetivos
de los arreglos de 8 canales regulares son, por el contrario, permitir tanto un
panormico uniformemente balanceado de los objetos sonoros alrededor de la
audiencia, como una distribucin sonora uniforme que posibilite envolverla
por completo.
Los sistemas de reproduccin octofnicos ofrecen un cierto grado de flexibilidad y su uso puede ser abordado de diversas maneras. La configuracin en
doble diamante puede ser considerada como un sistema de mltiples planos 3-0
estreo, donde el altoparlante central compensa el ngulo relativamente grande formado entre los altoparlantes derecho e izquierdo. En la situacin ms
simple, esto podra consistir en un sistema estreo 3-0 frontal y uno trasero, con
compensacin lateral. Sin embargo, este arreglo permitira tambin la proyeccin de mltiples y simultneas imgenes estreo, como tambin panormicos
estreo graduales en tres canales.
La distribucin de cuatro pares parece ser, en cierta medida, ms un
sistema de difusin estndar de dos canales con pares delanteros y traseros, y
dos pares laterales. El panormico de dos canales estreo puede lograrse fcilmente, aunque el ancho de la imagen es en realidad demasiado estrecho como
para producir una buena imagen estreo. Sin embargo, un material original
estreo 2-0 puede ser tratado como lo sera en un sistema de difusin de dos
canales, particularmente si el arreglo regular es deformado parcialmente, ajustando el ngulo de los pares delanteros y traseros para lograr una mejor imagen
235

(tendiendo hacia 30 y 150), y ajustando los pares laterales delanteros y


traseros para que acten ms como altoparlantes de ancho y laterales. Una
imagen frontal ms amplia puede, por consiguiente, ser lograda combinando
los altoparlantes principales y de ancho, y el movimiento de una imagen
desde el frente hacia atrs puede ser realizado va los altoparlantes laterales.
Para el intrprete de msica acusmtica, la difusin de piezas de 8 canales
tiene dificultades similares a las ya descritas para el sistema envolvente 5.1,
a menos que estn diseadas teniendo en mente algn tipo de difusin no
estndar (por ejemplo, nuevamente, Streams), aunque al menos no existen las
dificultades asociadas con la forma irregular de la disposicin 5.1. Los experimentos que utilizan mltiples arreglos octofnicos (supuestamente como una
extrapolacin del uso de mltiples pares de altoparlantes en muchos sistemas
de difusin) han tendido a concentrarse en el movimiento dentro del espacio
de audicin, utilizando trayectorias sonoras encuadradas, circulares y, hasta
cierto punto, ms variadas: no existe aqu una percepcin real de una imagen
sonora, con su espacio asociado y compuesto, articulndose en el espacio de
audicin. Sin duda, este tipo de sistemas hace muy difcil la creacin de una
ilusin con la solidez aural requerida para una difusin exitosa, particularmente si la msica investiga un material espacialmente rico.
Ambisonics
El enfoque del sistema de grabacin y reproduccin Ambisonics consiste en
muestrear y reconstruir frentes de onda en un punto. La importancia de esto es
que la reproduccin es a la vez homognea (no hay ninguna direccin tratada
preferencialmente) y, hasta cierto punto, coherente (la imagen permanece
estable si el oyente cambia de posicin dentro del sistema). Con adecuados
medios de grabacin y reproduccin, puede producir una verdadera imagen
sonora tridimensional. Existen numerosas tcnicas de microfoneo disponibles
al menos para las grabaciones Ambisonics de primer orden. La ms simple de
estas tcnicas es utilizar un micrfono especializado SoundField, que produce
una seal tridimensional, la cual se conoce como formato B (B-format) y consta
de cuatro componentes (llamados W, X, Y y Z). La ventaja de los micrfonos
Soundfield es que se dispone de una versin porttil, que hace completamente
factibles grabaciones in situ de entornos y de otros sonidos con riqueza espacial, generalmente imposibles de obtener en un estudio, aunque, por supuesto,
tambin es necesario un grabador porttil de 4 canales para grabar la seal de
formato B (asumiendo que las tres dimensiones sean requeridas).
Para reproducir el frente de onda, la seal de formato B es decodificada
usando una matriz especfica para el arreglo de altoparlantes en uso. Esto con236

siste normalmente en un arreglo simtrico de 4 o ms altoparlantes en pares


aunque, en teora, es posible tambin decodificar la seal para arreglos no
simtricos, como el sistema envolvente de 5.1 canales. Si el componente de
altura debe ser decodificado, se necesitarn tambin altoparlantes por arriba
y abajo de la audiencia. Lo que es especialmente til, es que el compositor
puede producir un trabajo en formato B que luego puede ser decodificado en
cualquier sistema Ambisonics, incluyendo el arreglo de 8 canales, actualmente muy usado, ya sea en la configuracin de doble diamante como en la de
cuatro pares. Esto es especialmente interesante para los compositores que
utilizan material espacialmente rico, ya que Ambisonics no solo puede recrear
la experiencia completa de estar en un lugar determinado, sino que tambin
lo puede hacer de una manera que no es completamente dependiente de una
determinada configuracin de reproduccin.
Desafortunadamente Ambisonics tiene algunas serias limitaciones, particularmente en trminos de la interpretacin de msica acusmtica. Puesto
que esta tcnica recrea el campo de onda en un punto particular del espacio, el
sweet spot es particularmente pequeo, aunque se pueden usar varios mtodos
para que esto sea menos problemtico, de hecho la experiencia de escucha
fuera de eje, aunque no sea exactamente la ideal, es ciertamente tolerable.
La imagen es fija, esto quiere decir que al menos con los sistemas existentes,
no tenemos la posibilidad de mover imgenes alrededor del oyente en tiempo
real y, de esta manera, difundir un trabajo en Ambisonics.
En trminos del primer problema, con sistemas Ambisonics de ms alto
orden, que tienen componentes adicionales de direccin, se puede crear una
codificacin direccional mejorada, cubriendo una mayor rea de escucha en la
reproduccin. Sin embargo, no hay un micrfono diseado actualmente que
pueda grabar en formato Ambisonics de segundo orden, lo que es una dificultad
para los interesados en usar grabaciones espacialmente ricas. Algunos compositores que usan Ambisonics de segundo orden (como Natasha Barret) sintetizan
estas seales artificialmente, ya sea de grabaciones en formato B o estreo. Por
ejemplo, de la misma manera que en la sntesis de campo de onda (vase ms
adelante), se pueden crear fuentes de sonido estreo virtuales dentro de las
fuentes Ambisonics (imagine usar un micrfono Soundfield para grabar un
sonido estreo emitido por dos altoparlantes en un espacio particular).
Sntesis de campo de onda (wfs)
La sntesis de campo de onda (wfs por su denominacin en ingls, Wave Field
Synthesis) es un contrincante relativamente nuevo en el mundo de los formatos de sonido multicanal, y est causando una gran excitacin en este momen237

to, particularmente en el mbito del sonido para cine. Como Ambisonics,


wfs tambin intenta recrear un campo de onda particular, pero lo hace a lo
largo de un rea en vez de en un punto. Su sistema de reproduccin utiliza un
arreglo (que puede ser lineal o circular) de pequeos altoparlantes que actan
como fuentes puntuales que en combinacin recrean el campo de onda.
wfs no sufre el mismo problema de cobertura limitada que Ambisonics. Sin
embargo, es esencialmente imposible grabar el campo de onda de un espacio
dado con la misma facilidad con que se realiza en Ambisonics utilizando el
micrfono Soundfield, dado el tamao de muestra que se requiere.
En lugar de ello, las tcnicas actuales de wfs: a) graban el sonido directo
de cada fuente de audio (i.e., los tratan como una fuente puntual usando un
micrfono direccional); b) graban las reflexiones tempranas de cada fuente
y c) graban la reverberacin del espacio sonoro. Estas grabaciones son luego
combinadas en la reproduccin para dar la impresin del sonido en un
espacio particular. Los sonidos pueden ser localizados extremadamente bien
dentro del espacio de reproduccin, aunque puede haber problemas si la
fuente sonora se encuentra ubicada exactamente donde un miembro de la
audiencia est sentado: en este caso el sonido se siente como si en realidad
estuviera en el centro de la cabeza de uno, lo que puede ser muy perturbador.
Se estn desarrollando sistemas que permiten a los sonidos-fuente moverse en
el espacio en tiempo real, o sobre trayectorias programadas.
El principal problema para el compositor acusmtico, muy preocupado
por supuesto por el carcter intrnsecamente espacial de su material-fuente, es
que dicho carcter espacial no puede ser realmente grabado, sino que puede
ser nicamente sintetizado. Tambin se debe tener en cuenta que se necesitan
tantos canales grabados como sonidos puntuales sean manipulados en el espacio, aunque es posible crear estreo virtual (o, sin duda, 5.1 u otros formatos
multicanales) dentro del campo de onda, como ocurra con las grabaciones
Ambisonics. De este modo, se podran tener grabaciones estreo emitidas, por
as decirlo, por pares de altoparlantes virtuales.

Conclusiones
La compleja naturaleza del sonido dentro de los espacios y las limitaciones de
la tecnologa actual no permiten la grabacin y reproduccin ideal del sonido. La reproduccin sonora es un compromiso y, debido a esto, el compositor
acusmtico no puede esperar el pleno control espacial una vez que su trabajo
no es escuchado desde la que presuntamente es la posicin ideal de escucha:
su puesto en el estudio de produccin original. La difusin, incluso en estos
238

apasionados tiempos de refinados sistemas de altoparlantes multicanales,


an tiene un rol importante como mediador entre la creacin artstica y su
recepcin.
De los formatos investigados en este artculo, el estreo parece todava
ofrecer el mejor compromiso entre ser capaz de representar informacin
espacial sobre un rea relativamente grande y ofrecer oportunidades reales de
ejecucin. Ambisonics y wfs no son completamente capaces de ofrecer esto
todava, pero en el futuro podran ofrecer mucho ms.

Agradecimientos
El autor desea agradecer a la Junta Investigadora de Arte y Humanidades en la
financiacin de esta investigacin. Tambin est en deuda con el Dr. Joseph
Anderson de la Universidad de Hull, por su ayuda y asesoramiento.

Bibliografa
Cook, N. (1999), Analysing Performance and Performance Analysis, en
Cook, N. y M. Everist (eds.), Rethinking Music, Oxford, Oxford University
Press, pp. 239-261.
Dow, R. J. (2003), Sound Diffusion and the Sonic Image, Diffusion, septiembre, pp. 2-6.
Gerzon, M. (1992), Optimum Reproduction Matrices for Multispeaker
Stereo, Journal of the Audio Engineering Society, 40: 7/8, julio/agosto, pp.
571-589.
Harrison, J. (1999), Imaginary Space Spaces in the Imagination, en
Proceedings of the Australasian Computer Music Conference, Victoria
University of Wellington, pp. 7-15
Lastra, J. (1992) Reading, Writing and Representing Sound, en Altman, R.
(ed.), Sound Theory, Sound Practice, Nueva York, Routledge, pp. 65-86.
Rumsey, F. (2003), Spatial Audio, Oxford, Focal Press, pp. 86-94.
Smalley, D. (1986), Spectro-Morphology, en Emmerson, S. (ed.), The
Language of Electroacoustic Music, Londres, Macmillan, pp. 61-93.
Theile, G. (2001), Multichannel Natural Music Recording Based on
Psychoacoustic Principles, en Proceedings of the Audio Engineering Society
19th International Conference, junio de 2001, pp. 201-229.
(Traduccin al espaol de Oscar Pablo Di Liscia y Esteban Calcagno)
239

Captulo viii
La interpretacin de la espacializacin electroacstica:
atributos espaciales y esquemas auditivos*
Gary S. Kendall

La interpretacin artstica y el anlisis de la espacializacin electroacstica


han sido raramente tratados de una manera que permita su aplicacin a mltiples composiciones. Abundan en la bibliografa histrica descripciones de
las bases tcnicas de la espacializacin y de las formas en que los compositores
las han empleado en composiciones especficas. Ms recientemente, en el
dominio de la msica acusmtica, Denis Smalley ha ayudado a adoptar un
enfoque ms general e inclusivo. Este enfoque emergi primero en el contexto
expositivo de la espectromorfologa presentado por Smalley (1986; 1997) y
fue luego extendido a travs de su tratamiento independiente del concepto
de espacio-forma (2007). De manera similar al trabajo de Smalley, este trabajo
es parte de un esfuerzo por crear un marco conceptual para la interpretacin
y el anlisis de la espacialidad en la msica electroacstica. Esta propuesta
complementa al trabajo de Smalley en varios aspectos. Es importante destacar
que la perspectiva de este artculo est fuertemente moldeada por la psicologa
perceptiva y cognitiva. Muchas de las ideas aqu expresadas estn basadas en
investigacin emprica y otras han sido inspiradas por la teora perceptiva y
cognitiva. Adems, este trabajo mantiene una relacin inmediata con las tcnicas y las prcticas de espacializacin en s mismas. De hecho, las tcnicas de
espacializacin son consideradas cruciales a la hora de dar forma al contenido
espacial artstico en el dominio electroacstico.
La situacin de la espacializacin en la msica electroacstica es semejante
a la de la sntesis del sonido, en el sentido en que la experiencia del mundo
natural provee una inspiracin importante, tanto para la creacin como para
la investigacin. La capacidad de la msica electroacstica para manipular
*

Partes de este captulo fueron tomadas del artculo The Artistic Play of Spatial Organization:
Spatial Attributes, Scene Analysis and Auditory Spatial Schemata, publicado en las actas de la
2007 International Computer Music Conference, Copenhage, Dinamarca.

241

seales de audio crea un contexto en el cual pueden ocurrir interacciones


singularmente complejas entre la audicin espacial y otros dominios de la
percepcin y la cognicin. Esto es particularmente cierto cuando los compositores electroacsticos juegan con los fundamentos de la organizacin espacial
en la msica, manipulando los agrupamientos perceptivos y los esquemas
espaciales. El audio espacial, y en particular el audio espacial de la msica
electroacstica, es un campo artstico que a menudo pone de relieve las convenciones espaciales del mundo natural, ya sea distorsionndolas o violndolas. Con el fin de apreciar el entrecruzamiento de lmites y convenciones de
esta interaccin artstica, nuestros conceptos y nuestro vocabulario deberan
estar bien alineados con los procesos perceptivos y cognitivos del oyente.

Atributos espaciales
El contexto de la msica electroacstica
A primera vista, la clase de fenmenos espaciales experimentados por un
oyente pueden parecer obvios. Cuando la msica es ejecutada con instrumentos acsticos en un ambiente acstico, una descripcin a nivel fsico por
s misma debera proveernos de una gua razonable sobre la experiencia del
oyente, porque tenemos una gran abundancia de experiencias compartidas
sobre el mundo fsico. La sensacin del oyente de estar en un mundo fsico
espacial es una construccin mental informada profundamente por la experiencia del mundo fsico. En la msica electroacstica, la experiencia acstica
de la vida cotidiana ha sido a menudo un punto de referencia, pero la tecnologa de reproduccin electrnica ampla el alcance y la complejidad de la
espacialidad de una manera radical. Generalmente, una descripcin a nivel
fsico (ubicacin de los altoparlantes, etc.) provee solo una gua rudimentaria
para las apreciaciones espaciales del oyente, que son en esencia inmateriales y
efmeras. La msica electroacstica generalmente ha carecido de un vocabulario que abarque esta gama expandida de las percepciones del oyente.
Investigaciones recientes sobre la percepcin pueden ayudarnos a comenzar a construir nuestro vocabulario. La mayora de las investigaciones concernientes a la espacialidad en la msica electroacstica pueden encontrarse
en la bibliografa de dos disciplinas: 1) la investigacin sobre la percepcin
y la cognicin en la audicin espacial y 2) la investigacin aplicada sobre la
reproduccin sonora. Una lnea de investigacin particularmente relevante
comienza en la literatura de la audicin espacial con el estudio de la impresin
espacial asociada con la (percepcin) acstica subjetiva de las salas de concier242

to (Barron y Marshall, 19891). Este evoluciona en el estudio interrelacionado


del ancho aparente de la fuente y el envolvimiento del oyente* (Ando, 1998;
Griesinger, 1997).
Estos atributos de la percepcin espacial fueron estudiados inicialmente
en el contexto de la acstica de salas de concierto y, ms recientemente, en el
de la reproduccin sonora en sistemas surround.
En la acstica subjetiva de la reproduccin electrnica, Zacharov y
Koivuniemi (2001) y Rumsey (2002) aportan profundos argumentos y la clasificacin de numerosos atributos perceptivos del espacio.
Berg y Rumsey (2003) toman en cuenta ms de 30 trminos que pueden
ser clasificados en 17 categoras. Estos trabajos han considerado en profundidad cuestiones relacionadas a los atributos espaciales y su terminologa
asociada.
Si bien es cierto que hay mucho que se puede extraer de estas investigaciones, la diferencia entre los contextos considerados en ellas y los de la
msica electroacstica es profunda. Por una parte, la acstica de la sala de
concierto y el sonido reproducido por altoparlantes son a menudo segmentados conceptualmente en sonido directo, reflexiones indirectas y reverberacin. Esto se refleja en una terminologa que puede separarse en trminos
relacionados con la fuente y aquellos vinculados al ambiente acstico. Pero
es de destacar que la msica electroacstica no se limita al modelo fuente-enambiente. Adems, hay diferencias profundas en lo que respecta a la materia
sonora. Esto es particularmente importante por dos razones: las percepciones
espaciales son definidas en parte por el contenido de las fuentes sonoras
(Mason, 2002; Mason, Brookes y Rumsey, 2005a) y los compositores electroacsticos no estn limitados a fuentes acsticas preexistentes. Los compositores electroacsticos no tienen solamente la libertad de disear sonidos que
dan soporte especfico a efectos de espacializacin, sino que pueden tambin
explorar mbitos acsticos que pueden derribar la validez ecolgica!
Atributos espaciales y anlisis de la escena auditiva
En una argumentacin particularmente fructfera, Rumsey (2002) considera
las caractersticas espaciales del sonido en el marco del anlisis de la escena
auditiva (Bregman, 1990). Sostiene que los atributos espaciales deberan ser
*

La expresin original en ingls es listener envelopment, que se ha traducido tambin como


envuelto por el campo acstico o sensacin de estar rodeado por el sonido. Se adopta
aqu la traduccin de envolvimiento del oyente, dado que existe en el espaol y responde
de manera ms precisa al concepto que el autor desea transmitir. [N del T.]

243

claros y preferiblemente unidimensionales (en otras palabras, deberan representar una sola idea perceptiva). Las cualidades espaciales tienen que ver con
la tangibilidad de los aspectos tridimensionales del sonido, incluyendo propiedades como ancho y distancia. Es de destacar que Rumsey1 distingue las cualidades espaciales de las cualidades de los espacios, esto es, de las propiedades
de las salas (u otros espacios). Los atributos de los espacios han incluido tradicionalmente propiedades como la reverberacin y vivacidad.* La confluencia
de estas categoras no ha sido examinada en la evaluacin subjetiva de salas de
concierto y sistemas de reproduccin de audio, donde se asume que las fuentes
sonoras estn contenidas en sus ambientes (y, de hecho, la argumentacin de
Rumsey est dirigida hacia tales ajustes tpicos de la reproduccin).
Esta confluencia de categoras es esencialmente un desfasaje entre la
acstica fsica y la perceptual.
As, por ejemplo, si trasladamos totalmente nuestra orientacin a la
organizacin auditiva del oyente, y observamos que el sonido indirecto de las
reflexiones tempranas influye en la percepcin auditiva de la fuente, entonces, ese sonido indirecto es esencialmente parte de la audicin de la seal de
la fuente, tanto como el sonido directo. Y, a partir de este punto, debemos ser
particularmente claros sobre la separacin entre la seal acstica (con todos
sus componentes acsticos) y la imagen percibida de la fuente (con todas sus
caractersticas perceptivas del espacio).
La separacin de estas categoras es particularmente til en msica electroacstica, donde el modelo fuente-sonora-en-ambiente, es solo una de muchas
posibilidades en el tratamiento espacial.
Habiendo realizado una clara distincin entre las caractersticas espaciales
respecto de otras propiedades del sonido en el espacio, Rumsey se dedica a
examinar las cualidades espaciales en el contexto del anlisis de la escena auditiva. Creando un marco organizativo para evaluar la clase de reproduccin de
sonido que le interesa, Rumsey propone cuatro niveles de organizacin que son
comunes en la experiencia de la escucha de msica grabada: fuente, ensamble,
sala y escena. Estas etiquetas estn pensadas para ser categoras generales de
organizaciones jerarquizadas, ms que simplemente tipos de fuentes acsticas.
En la figura 1 se ilustra cmo interactan estos cuatro niveles de organizacin
con el atributo espacial de ancho. En el nivel ms bajo de organizacin, una
fuente individual tiene ancho. En el nivel superior siguiente de organizacin
y agrupamiento, un ensamble de fuentes tiene ancho de ensamble. Tal agrupamiento depende de las particularidades de la escena y, por ejemplo, podra
1
*

Todas las notas subsecuentes referidas a Rumsey se corresponden con Rumsey (2002).
Liveness en el original en ingls. [N. del T.]

244

Ancho de la fuente

Ancho del ensamble


Ancho del recinto
Escena

Figura 1. El atributo espacial de ancho con niveles jerarquizados de organizacin dentro de


una escena auditiva (segn Rumsey, 2002)

estar integrada por la seccin de violines, la familia de las cuerdas o la orquesta


entera. En el siguiente nivel superior de organizacin para la msica grabada,
podemos hablar de ancho de la sala y ms all de eso, del ancho de la escena
auditiva completa. Este enfoque basado en la escena asla el qu del dnde,
y elimina la confusin conceptual inherente a la consideracin de los atributos
espaciales sin tener en cuenta los agrupamientos auditivos.
Podemos proponer ahora una terminologa espacial para ser aplicada a los
niveles jerrquicos relevantes de la organizacin auditiva. Rumsey propone que
todos los atributos espaciales sean limitados a 5, tres atributos dimensionales
y dos inmersivos. Las tres caractersticas dimensionales ancho, distancia y
profundidad pueden ser producidas por una fuente individual, un ensamble,
una sala o escena (aunque es improbable que una fuente sonora individual
pueda producir profundidad). Rumsey menciona que est omitiendo la altura;*
asumimos que se debe a que se enfoca en sistemas de reproduccin sin elevacin, pero tambin omite algunos otros aspectos de la direccin aunque los ha
comentado en otra investigacin (Mason, R., T. Brookes y F. Rumsey, 2005a;
Rumsey, 1999). Nosotros aadiremos la direccin en nuestra lista de caractersticas espaciales.2 La categora de atributos espaciales inmersivos de Rumsey
*

Se trata de una referencia a la dimensin espacial y no a la musical, de altura tonal o


pitch. [N. del T.]
2

Vamos a tratar la direccin como un nico atributo de la percepcin a pesar de que su representacin geomtrica requiere de dos dimensiones. El papel dominante del eje izquierda-derecha es
considerado luego, al examinar el rol de la percepcin de la agrupacin.

245

abarca el dominio de la percepcin espacial auditiva descrito por trminos


interrelacionados tales como impresin espacial, espaciosidad (spaciousness)
y envolvimiento. Dentro de este marco de anlisis de la escena, Rumsey recomienda la adopcin de solo dos trminos: envolvimiento y presencia. Propone
que el trmino envolvimiento designe a la experiencia de encontrarse rodeado por el sonido de mltiples fuentes sonoras, o de un campo difuso, como
el de la reverberacin. Estos tipos de envolvimiento son llamados relativo
a las fuentes y ambiental, respectivamente. Rumsey ha propuesto recientemente que el trmino presencia designe a la sensacin de estar dentro de
un espacio (cerrado). Adoptaremos la terminologa completa de Rumsey (con
nuestro pequeo agregado) en aras de la coherencia y postergaremos el anlisis
del uso del trmino presencia para prximos trabajos. Nuestra terminologa
resultante puede resumirse entonces del siguiente modo:
Atributos dimensionales: ancho (individual/ensamble/sala/escena), distancia
(individual/ensamble/sala/escena), profundidad (individual en casos especiales/ensamble/sala/escena), direccin (individual/ensamble/sala/escena).
Atributos inmersivos: envolvimiento (ambiental/relativo a las fuentes), presencia.
La figura 2 muestra las relaciones espaciales de estos trminos. Cada nivel de
organizacin en la escena puede ser caracterizado por los atributos dimensionales, pero solo ciertas situaciones dan lugar a los de envolvimiento o
presencia.
Estos atributos espaciales son propiedades de los eventos perceptivos
en la escena auditiva. Los procesos de formacin de eventos perceptivos y
agrupamientos auditivos proveen un nivel de aprehensin que es rico en
percepciones, pero carente de significacin cognitiva y de sentido. En este
nivel, los eventos pueden tener caractersticas espaciales y aun as no estar
vinculados al concepto de ambiente del oyente. Es importante destacar que
este es tambin el nivel en el cual la organizacin espacial comienza a tener
un papel significativo para el arte. Tales sonidos pueden producir una especie
de sentido intrnseco que precede a la comprensin, algo semejante al sentido
mtico.3 Por ejemplo, fuentes sonoras de origen misterioso, fuentes que no
podemos identificar, tienen un particular poder para afectarnos profundamente debido a que invocan categoras relativamente abstractas de fuente y origen
3

Un tipo diferente de sentido mtico se produce cuando escuchamos sonidos cuyas fuentes
tienen connotaciones mticas, tales como el ocano o el bosque.

246

Ancho

Profundidad

Distancia

Direccin
Envolvimiento
Oyente

Figura 2. Atributos espaciales para los niveles de la escena auditiva (segn Rumsey, 2002)

que solo presagian sentido. Esta es la verdadera esencia del placer producido
por lo acusmtico. En un sentido anlogo para el espacio, hay sonidos de
localizacin espacial misteriosa (por ejemplo, campos espaciales difusos) que
pueden afectarnos porque invocan niveles preracionales y mticos de nuestra
experiencia espacial.

Esquemas auditivos espaciales


Esquemas auditivos espaciales
Los esquemas auditivos espaciales son los patrones recurrentes a travs de los
cuales comprendemos el comportamiento del sonido en el espacio. Estos esquemas son aprehendidos y reforzados principalmente por la experiencia cotidiana
del ambiente espacial. En la vida cotidiana, todas nuestras capacidades sensoriales contribuyen a conformar nuestros esquemas espaciales bsicos (Johnson,
1987) y, por lo tanto, los esquemas auditivos espaciales pueden entenderse
mayormente como proyecciones de esquemas espaciales multimodales dentro
del dominio auditivo. El esquema general de objeto da lugar al esquema auditivo de fuente. El esquema general de coleccin da lugar al de ensamble.
Ambos poseen atributos y comportamientos espaciales tpicos. Tambin es
importante destacar que los esquemas auditivos espaciales nos ayudan a dar
247

sentido y significacin a la experiencia espacial. Con los esquemas musicales,


tratamos de comprender las organizaciones musicales que estamos percibiendo.
Con los esquemas espaciales, tratamos de comprender el espacio de los acontecimientos espaciales que estamos percibiendo. La construccin de sentido se
realiza en forma simultnea con la reduccin de la complejidad perceptiva.
Generalmente se reconoce que la localizacin del sonido tiene una
influencia dbil en la escena auditiva. Por esta razn, los esquemas espaciales
tienen un papel particularmente importante en la escucha espacial, porque los
esquemas le dan coherencia a informacin espacial que de otro modo podra
resultar vaga o incompleta. Los esquemas espaciales son particularmente
importantes para la reproduccin de audio cuando no hay otra informacin
sensorial que pueda colaborar con el contenido auditivo espacial. Nuestro
esquema espacial de trayectoria da coherencia a efectos de movimiento
que de otro modo podran ser muy frgiles. Adems, el sonido incorpreo de
la reproduccin de audio es interpretado frecuentemente en un marco que es
especfico a este contexto. Por ejemplo, la disposicin espacial de fuentes en
una tpica cancin pop en estreo no tiene ningn sentido fsico. Aceptamos
esta disposicin espacial como un modismo de la reproduccin de audio, un
modismo musical-espacial. La naturaleza inmaterial de la reproduccin de
audio permite al arte auditivo espacial explotar los esquemas espaciales de la
vida cotidiana.
Anlisis de la escena en funcin de los esquemas auditivos espaciales
segn Rumsey
El marco jerrquico de Rumsey, que agrupa las nociones de fuente/ensamble/
sala/escena, pretende ser utilizado en la evaluacin subjetiva de la reproduccin de audio de grabaciones de msica acstica. Y, mientras que el contenido de la msica electroacstica puede ser muy dismil, la nocin de niveles
jerrquicos de organizacin, desde lo micro a lo macro, parecera ser bastante
vlida para casi todo tipo de msica. Sin embargo, la focalizacin que hace
Rumsey en el contenido de audio tpico complica su propio marco, debido a
que en forma inadvertida socava la nocin de una simple organizacin microa-macro. El paso de ensamble a sala no es solamente un salto al siguiente
nivel superior de agrupamiento; es un paso esquemtico que es normativo solo
en el campo de la msica acstica, donde los instrumentos estn efectivamente en espacios cerrados.
Hay dos cuestiones que se ponen de manifiesto cuando se considera el
marco propuesto por Rumsey en el contexto de la msica electroacstica. La
primera es la naturaleza situacional de estas categoras tpicas. Por ejemplo,
248

puede haber situaciones en las que no haya una clara delimitacin entre
fuente y conjunto, esto es, entre la percepcin de una o varias fuentes. Luego,
tambin, la simulacin de la sala puede lograrse a partir del tratamiento
de una seal acstica con un algoritmo de reverberacin. En el caso en que
la seal de la fuente original es omitida, la salida del reverberador deviene
esencialmente una fuente en s misma. El sentido original de la distincin
entre fuente, ensamble y sala se diluye. En segundo lugar, la impresin de
sala que tiene el oyente es algo distinto del tratamiento de una seal acstica: es una comprensin que el oyente adopta en respuesta a la experiencia
auditiva. Sala es parte de nuestra comprensin cognitiva tomada de los
esquemas espaciales auditivos de sala. Dependiendo de las circunstancias, el
oyente puede o no invocar el esquema de sala durante el proceso de comprensin de la escena auditiva. En algunas circunstancias podemos imaginar
que la comprensin de sala es automtica y afn a la segregacin de estratos
basada en esquemas (Berg y Rumsey, 2003). En otras circunstancias, sala
puede bien ser una inferencia basada en informacin acstica incompleta
o fragmentaria. No es la percepcin de las relaciones jerarquizadas la que
determina las categoras.
Entonces, qu queda de la idea original de una organizacin jerarquizada
de relaciones espaciales? Claramente, la percepcin del oyente de relaciones
espaciales jerrquicas depende de circunstancias tangibles, las particularidades
de la escena auditiva. Para la msica electroacstica, los elementos en una
estructura jerrquica no estn limitados a priori a un conjunto de categoras
relacionales. Una descripcin completa del contenido espacial y sus implicaciones en un contexto artstico puede llegar a ser muy compleja. Los esquemas
espaciales auditivos pueden ser deformados o aun violados. Nuestra habilidad
para describir y categorizar estas interacciones complejas depende de tener
conceptos y terminologa claros de tal manera que podamos reconocer el
entrecruzamiento de lmites y la disrupcin de normas espaciales en el interjuego artstico.

El juego artstico con la organizacin espacial


Juego con el agrupamiento perceptivo
En la msica electroacstica hay a menudo un juego con el agrupamiento
perceptivo que afecta tanto a la identificacin de fuentes como a sus atributos
espaciales. Este juego est guiado, tpicamente, por la perturbacin en el nivel
de la formacin de eventos perceptivos, perturbacin que puede afectar tanto
249

a los mecanismos de agrupamiento como a los de localizacin. Hay numerosas


tcnicas que crean tales perturbaciones, tcnicas que pueden ser manipuladas
para ajustar el grado de disrupcin y, de este modo, permitir la exploracin
de lmites perceptivos. Si bien pueden ser conceptualmente diferentes, estas
tcnicas a menudo producen resultados similares. Con el fin de describir
adecuadamente los cambios en las caractersticas espaciales que se asocian a
estas tcnicas, necesitamos distinguir cuatro marcos de referencia asociados
a la palabra fuente. Primero est la seal-fuente, que es la seal acstica
o una representacin de la seal acstica. Segundo, est la imagen-fuente
tangible, la fuente que tiene atributos espaciales en la escena auditiva. Est
la fuente conceptual, el objeto que el oyente identifica con la fuente, independientemente de sus atributos espaciales (fuente conceptual es entendida
aqu del mismo modo que el concepto de Smalley [1986] de consolidacin de
la fuente).* Finalmente, se encuentra el esquema espacial del oyente, fuente. La imagen-fuente, ms all de si es aprehendida como una o muchas
fuentes conceptuales, es habitualmente un estrato auditivo; de qu manera el
juego artstico reordena la organizacin perceptiva del oyente es algo que se
discute a continuacin.
Tcnicas tipo 1. Vamos a considerar primero la clase de tcnicas que perturba
la identidad de la seal-fuente dividindola en partes. Estas partes pueden ser
separadas sobre la base del tiempo o del espectro (o de ambos). Un ejemplo
bsico de una tcnica temporal es el proceso de granulacin, que perturba
el orden temporal de la seal-fuente acstica. Un ejemplo bsico de tcnica
espectral sera el phase vocoding,** que altera la organizacin espectral de la
seal-fuente acstica. Ambas tcnicas involucran separar la fuente en mltiples partes, manipularlas y luego reensamblarlas para producir un resultado
(por supuesto, hay muchos ms modos de usar estas herramientas). El resultado puede abarcar desde la reconstruccin exacta de la seal-fuente acstica
hasta la construccin de algo esencialmente nuevo. La fuente conceptual del
oyente puede abarcar tanto desde la fuente conceptual original a una nueva
fuente como a mltiples fuentes nuevas. Tambin es importante destacar que
en ambos casos existe la posibilidad de ensamblar el resultado en una o varias
ubicaciones espaciales.
Consideremos el campo bidimensional de posibilidades de combinacin
del ancho de la imagen-fuente y el nmero de fuentes conceptuales creadas
Source bonding en el original. [N. del T.]
Se ha conservado la denominacin original en ingls, dado que es de uso habitual. [N.
del T.]

250

Grande

ENSAMBLE

Imagen-fuente

Chica

FUENTE

Una

Fuente conceptual

Mltiple

Figura 3. Campo bidimensional de posibilidades para las combinaciones de imagen-fuente


y de fuente conceptual, creadas a travs de la accin del agrupamiento perceptivo

por el juego con el agrupamiento perceptivo (vase la figura 3). En el caso


en el que la fuente acstica es perfectamente reconstruida y posicionada en
una sola ubicacin, hay una fuente conceptual y una fuente perceptiva que
le corresponde. Esto coincide con las caractersticas de fuente. En el caso en
el que la manipulacin de la seal-fuente da lugar a mltiples fuentes conceptuales posicionadas en una sola ubicacin espacial, el resultado es el de
mltiples fuentes conceptuales, asociadas como una nica imagen-fuente. (Si
se produce un borroneo entre una o varias fuentes conceptuales, podra surgir
una ambigedad respecto de si hay una o ms imgenes-fuente con los mismos
atributos espaciales.) En otro caso, si hay mltiples fuentes conceptuales y sus
partes componentes estn espacialmente dispersas, entonces la distribucin
espacial tiende a sostener una multiplicidad de imgenes-fuente organizadas
como un ensamble. Un ejemplo de esto es una nube granular espacialmente
dispersa (Truax, 1999; Kim-Boyle, 2007).
Lo ms interesante, en el caso en que la identidad de la seal-fuente es
mantenida como una fuente conceptual pero sus componentes estn espacialmente dispersos, es que hay una clara competencia entre organizaciones
perceptivas. El grado en que los componentes espacializados se separan del
todo (y se aproximan a mltiples imgenes-fuente) determina un amplio
abanico de combinaciones de percepcin espacio/fuente. En un extremo del
continuum est la posibilidad de una imagen fuente con un ancho espacial
incrementado. En el otro, est la posibilidad de mltiples imgenes-fuente
251

asociadas con una fuente conceptual nica (algo que la organizacin cognitiva puede combatir). En el medio, estn las borrosas fronteras entre fuente/
ensamble y una/muchas imgenes fuente. Un ejemplo particular es el caso en
el que bandas de frecuencia de la seal son sistemticamente distribuidas
en el espacio, dando lugar a la percepcin de una singular/mltiple, fuente/
ensamble, distribuida/s en el espacio (Torchia y Lippe, 2004; Kim-Boyle,
2007). La sntesis granular y el phase vocoding pueden ser manipulados para
crear estas posibilidades en toda la gama de opciones entre imagen-fuente y
fuente conceptual.
Tcnicas tipo 2. Existe otro tipo de tcnicas que a menudo dan lugar a este
juego con los lmites. Este segundo tipo de tcnica involucra la ruptura de
la formacin de eventos perceptivos a travs de la manipulacin de la informacin binaural y es, por lo tanto, una tcnica que bsicamente afecta los
atributos espaciales a lo largo del eje lateral izquierda-derecha. Una conocida
tcnica de grabacin nos brinda un ejemplo sencillo. Imaginemos que se graban dos interpretaciones vocales idnticas. Una difiere de la otra solamente
por micro variaciones. Si una de las grabaciones es paneada al parlante de
la izquierda y la otra al de la derecha, el resultado es que se perciben dos
instancias de la misma grabacin, una en cada lado. Las diferencias de las
micro variaciones impide la creacin de una imagen espacial nica. Esta es
una situacin extrema en la cual hay una fuente conceptual y dos imgenesfuente. Tpicamente, las diferencias entre las seales recibidas en cada odo
provocan que la imagen-fuente se ensanche (la medida del ancho puede vincularse directamente a la medida de la similitud entre las seales que llegan
a los odos, a menudo expresada como el coeficiente de correlacin cruzada
interaural).
Hay numerosas maneras de crear microvariaciones que den lugar a
diferencias binaurales y cada una de ellas se puede lograr mediante el procesamiento de una seal-fuente para crear mltiples versiones, o sintetizando
mltiples seales-fuente en forma directa. El modo en que las mltiples
seales-fuente son creadas es inmaterial. Creando pequeas diferencias de
frecuencia estticas o diferencias de fase estticas entre las seales-fuente
se obtiene una nica fuente conceptual con una imagen-fuente ensanchada
(Kendall, 1995; Potard y Burnett, 2004; Vaggione, 2001). Las diferencias
de frecuencia dinmicas (tales como el jitter o el vibrato) proporcionan un
modo particularmente efectivo de manipular las relaciones entre fuentes
conceptuales e imgenes-fuente. En el caso en que mltiples seales-fuente,
con diferencias de frecuencia dinmicas, sean asignadas a una sola ubicacin
(y no creen diferencias binaurales constantes) la magnitud de las diferencias
252

de frecuencia determinar la posicin de la fuente conceptual a lo largo de un


continuum que va de una a varias, mientras mantiene una sola imagen-fuente.
Un ejemplo convencional de esto es el chorusing en un solo canal. En el caso
en el que mltiples fuentes estn dispersas espacialmente (de modo tal que
creen una diferencia dinmica binaural en los odos del oyente), entonces
habr una imagen-fuente ensanchada, con una o ms imgenes conceptuales.
En el caso en el que las diferencias dinmicas de frecuencia sean de una magnitud suficiente, la imagen-fuente ensanchada se fragmentar en mltiples
imgenes. El particular poder que tiene el vibrato para afectar el agrupamiento
auditivo es bien conocido a partir de una demostracin de Steve McAdams y
Roger Reynolds (McAdams, 1984; McAdams y Bigand, 1993). Aqu, el vibrato sincronizado para los armnicos pares en un canal y los impares en el otro
lleva al oyente a percibir una nica imagen sonora. Cuando el vibrato en cada
canal es progresivamente desincronizado, el oyente gradualmente empieza a
percibir dos imgenes auditivas. Al igual que en el campo bidimensional de
posibilidades de la figura 3, la figura 4 representa la asociacin del cambio
de tamao de la imagen-fuente y el nmero de fuentes conceptuales. Una
representacin ms completa se muestra en la figura 4b, en la que se agrega un
tercer eje para captar el nmero variable de estratos auditivos.
Atributos inmersivos
Hasta aqu, discutimos el impacto de estas dos categoras de tcnicas de procesamiento en el atributo espacial de ancho, aunque otros atributos espaciales,
como el de distancia y profundidad tambin son afectados. Cuando Rumsey
formula la pregunta sobre cundo el ancho de una fuente se vuelve de una
magnitud tal como para crear envolvimiento, est apuntando a una relacin
entre los atributos espaciales dimensionales e inmersivos. Cuando se crean
imgenes sonoras que rodean al oyente, las tcnicas del primer tipo tienden a
crear un envolvimiento relativo a las fuentes, mientras que las tcnicas del
segundo tipo tienden a crear envolvimiento ambiental. Estas ltimas estn
ntimamente relacionadas a la reverberacin artificial y a las condiciones bajo
las cuales el oyente percibe inmersin en un campo reverberante (Mason,
2002). De hecho, podemos ver la reverberacin multicanal como otra tcnica
de procesamiento del segundo tipo, que produce una imagen que puede ir de
angosta a ancha, con una nica fuente conceptual. La figura 5 ilustra cmo
los resultados de la reverberacin y el chorusing pueden ser representados en el
campo bidimensional de posibilidades.

Source-related envelopment, en el original. [N. del T.]

253

Grande

Imagen-fuente

Vibrato
McAdams/Reynolds

Chica

Una

Fuente conceptual

Mltiple

(a)

Grande
Vibrato
McAdams/Reynolds
Imagen-fuente

Chica

Una

Mltiple
Fuente conceptual

Uno
Estratos
Mltiples

Dos imgenes
(b)

Figura 4. El rango de posibilidades asociadas con la demostracin de vibrato de MacAdams/


Reynolds: a) representacin en dos dimensiones y b) representacin en tres dimensiones

En el contexto de una escucha cotidiana los campos sonoros inmersivos son


principalmente experimentados como parte del fondo acstico. Estamos
permanentemente rodeados por un aluvin de sonido que aprendemos a
ignorar, mientras dirigimos nuestra atencin a los eventos del primer plano
acstico. Una forma importante en la que la manipulacin de los atributos
254

Grande

Imagen-fuente

Chica

Una

multi-channel

multi-channel

reverb

chorusing

mono

mono

Fuente conceptual

Muchas

Figura 5. Los resultados de la reverberacin y chorusing considerados en el campo bidimensional de posibilidades

inmersivos puede originar contenido artstico es a travs de la perturbacin


de las asociaciones espaciales normales entre fondo y primer plano. Esto puede
ocurrir cuando el primer plano acstico es en s mismo de tipo inmersivo. As
tambin, el proceso cotidiano de agrupamiento perceptivo y de formacin
de eventos es relativamente constante de un momento a otro. Y aunque los
cambios dinmicos en las tcnicas de los tipos 1 y 2 no han sido directamente
estudiados aqu, debera ser evidente que la perturbacin del agrupamiento
perceptivo puede modificarse a travs del tiempo. El campo bidimensional
de posibilidades puede ser recorrido transversalmente en forma dinmica. El
contenido artstico es creado por la manipulacin dinmica de atributos espaciales que son tpicamente estticos por ejemplo, haciendo que un sonido
angosto devenga ancho e inmersivo. Tanto la puesta en primer plano de campos sonoros inmersivos como la lenta manipulacin dinmica de agrupamientos perceptivos son aspectos importantes de numerosas obras electroacsticas,
especialmente de aquellas dedicadas a la composicin de paisajes sonoros.
Juego con los esquemas auditivos espaciales
Un buen ejemplo de un esquema espacial general con una representacin
auditiva es la contencin. Construimos nuestra comprensin de la contencin a travs de una interaccin con el mundo que involucra a todos nuestros
sentidos. Este proceso incluye la experiencia de objetos movindose hacia
dentro o saliendo hacia fuera de otros objetos que tienen su respectivo espacio
255

interno, un espacio que puede contener a otro objeto. Lo que hemos aprendido
sobre la contencin como esquema auditivo es que un objeto con un espacio
interno que contiene un objeto sonoro transforma a ese objeto dependiendo
de las caractersticas del contenedor. Ms aun, una sala es una especie de contenedor, un tipo particular de contenedor que puede contener tanto al oyente
como a los objetos sonoros. Una sala transforma el sonido de modo diferente
que otros contenedores, en parte debido a que tambin produce un sentido de
inmersin para el oyente cuando este se encuentra dentro de la sala. Estos
conceptos se representan grficamente en la figura 6.
El juego artstico con los esquemas auditivos espaciales en la msica
electroacstica puede realizarse de muchas formas. Una manera anloga a los
ejemplos anteriores es la manipulacin de las expectativas normales. La violacin de esquemas espaciales auditivos tiene el efecto de dirigir la atencin del
oyente hacia un contenido resaltado por relaciones inusuales o inesperadas.
De esta manera, el dominio de la perturbacin deviene tema para la expresin
artstica. Por ejemplo, consideremos la posibilidad del oyente de estar dentro
de un contenedor que no sea una sala (el juego entre espacio abierto y espacio
contenido es un elemento central en la obra de Denis Smalley, Empty Vessels
(2000), en la cual el punto de vista del oyente est alternativamente en un
espacio abierto o dentro de un enorme maceta de jardn). Consideremos
tambin la posibilidad de que un oyente perciba el sonido de una fuente proviniendo de una direccin determinada y el sonido de la sala que contiene a la
fuente llegando desde otra direccin. Estas posibilidades estn representadas
grficamente en la figura 7.

a)

b)

Figura 6. Esquemas auditivos espaciales: a) representacin de la contencin y b) representacin de sala

256

a)

b)

Figura 7. Violaciones de los esquemas auditivos espaciales: a) violacin de contencin y b)


violacin de sala

Conclusin
Uno de los aspectos ms importantes que diferencian a la msica electroacstica respecto de la acstica es el rango expandido de su paleta espacial. En
el nivel ms inmediato de apreciacin, esta paleta espacial es un producto
directo de la tecnologa de reproduccin sonora. En un nivel de apreciacin
ms sofisticado, es el producto de la interaccin entre la tecnologa y la
respuesta del oyente al contenido espacial auditivo. Hemos tratado formas
importantes en las cuales la espacialidad de la msica electroacstica manifiesta un sentido artstico al re-formar y reformular los patrones normativos de
la experiencia espacial. Y hemos examinado especficamente las posibilidades
de sentido espacial creadas por la perturbacin del agrupamiento perceptivo y
la violacin de los esquemas espaciales. De esta forma, hemos provisto medios
adicionales para interpretar y analizar el amplio arte de la espacialidad en la
msica electroacstica. Tambin esperamos haber abierto la puerta a nuevas
posibilidades en el arte espacial auditivo.

Agradecimientos
El autor quiere agradecer especialmente a Mauricio Ardila por las muchas discusiones profundas sobre inmersin y audio espacial que ayudaron a inspirar
el presente artculo.

257

Bibliografia
Ando, Y. (1998), Architectural Acoustics: Blending Sound Sources, Sound Fields,
and Listeners, Nueva York, Springer-Verlag.
Barron, M. y A. H. Marshall (1981), Spatial impression due to the early
reflections in concert halls: The derivation of a physical measure,
Journal of Sound Vibration, 77(2).
Berg, J. y F. Rumsey (2003), Systematic Evaluation of Perceived Spatial
Quality, Actas de la 24 Conferencia internacional de la Audio Engineering
Society.
Bregman, A. S. (1990), Auditory Scene Analysis: The Perceptual Organization
of sound, Cambridge, mit Press.
Griesinger, D. (1997), The psychoacoustics of apparent source width, spaciousness and envelopment in performance spaces, Acustica, 83.
Johnson, M. (1987), The Body in the Mind: The Bodily Basis of Meaning,
Imagination, and Reason, Chigago, University of Chicago.
Kendall, G. (1995), The Decorrelation of Audio Signals and Its Impact on
Spatial Imagery, Computer Music Journal, 19 (4).
Kim-Boyle, D. (2007), Spectral and Granular Spatialization with Boids,
presentado en seamus 2007 National Conference, Ames, Iowa.
Mason, R. (2002), Elicitation and measurement of auditory spatial attributes in
reproduced sound, tesis de doctorado, University of Surrey.
Mason, R., T. Brookes y F. Rumsey (2005a), Frequency dependency of the
relationship between perceived auditory source width and the interaural
cross-correlation coefficient for time-invariant stimuli, Journal of the
Acoustical Society of America, 117 (3).
Mason, R., T. Brookes y F. Rumsey (2005b), The effect of various source
signal properties on measurements of the interaural crosscorrelation
coefficient, Acoustical Science and Technology, 26 (2).
McAdams, S. (1984), Spectral Fusion, Spectral Parsing, and the Formation
of Auditory Images, disertacin doctoral, Stanford University.
y E. Bigand (1993), Thinking in Sound: The Cognitive Psychology of
Human Audition, Oxford, Oxford University Press.
Potard, G. e I. Burnett (2004), Decorrelation Techniques for the Rendering
of Apparent Sound Source Width in 3D Audio Displays, Proceedings of
the 7th International Conference on Digital Effects.
Reynolds, R. (1982) Archipilago para conjunto instrumental y sonidos
generados por computadora, (disponible en el cd Roger Reynolds/ The
Paris Pieces, Neuma 450-491).
Rumsey, F. (2002), Spatial Quality Evaluation for reproduced Sound:
258

Terminology, Meaning, and a Scene-based Paradigm, Journal of the


Audio Engineering Society, 50 (9).
(1999), Subjective Evaluation of the Spatial Attributes of Reproduced
Sound, Proceedings of the Audio Engineering Society 15th International
Conference.
Smalley, D. (2000), Program notes to Empty Vessels included in the compact
disk About Sources/scenes, IMED 0054, empreintes DIGITALes, 2000.
(2007), Space-form and the acousmatic image, Organised Sound, 12
(1).
(1986),Spectromorphology and structuring processes, en Emmerson,
S. (ed.), The Language of Electroacoustic Music, Basingstoke, Macmillan
Press.
(1997), Spectromorphology: explaining sound-shapes, Organised
Sound, 2 (2), Cambridge, Cambridge University Press, pp. 107-126.
Torchia, R. y C. Lippe (2004), Techniques for Multi-Channel Real-Time
Spatial Distribution Using Frequency-Domain Processing, Proceedings of
the 2004 Conference on New Interfaces for Musical Expression.
Truax, B. (1999), Composition and diffusion: space in sound in space,
Organised Sound, 3 (2).
Vaggione, H. (2001), Composing Musical Spaces By Means of Decorrelation
of Audio Signals, Addendum of the Conference on Digital Audio Effects.
Zacharov, N. y K. Koivuniemi (2001), Unravelling the Perception of Spatial
Sound Reproduction, Proceedings of the Audio Engineering Society 19th
International Conference.
(Traduccin al espaol de Martn Liut)

259

Captulo ix
Descentramiento y concrecin del espacio
en la msica del siglo xx
Pablo Fessel

Introduccin
La localizacin de la msica el hecho de que esta, considerada como acontecimiento, ocurra siempre en un espacio determinado permaneci, durante
buena parte de su historia, como un atributo exterior al fenmeno, propio de
la representacin, pero ajeno a la inmanencia esttica. El espacio se volvi
una variable compositiva en el siglo xx, y es a partir de all que obras como las
compuestas por Giovanni Gabrieli para la catedral de San Marcos, o el Finale
de la Sinfona N 6 de Gustav Mahler, se constituyen en antecedentes, expresin de una historia intermitente. Pero esos antecedentes, precisamente por su
condicin ocasional, no alcanzan a explicar la emergencia del espacio como
materia compositiva en la msica del siglo xx. Esa irrupcin podra pensarse
como exteriorizacin de un espacio inmanente de la msica. Esta posibilidad
da lugar a una pregunta por las condiciones que rigen el pasaje del espacio
inmanente al espacio fsico. El concepto de textura podra operar como un
concepto de pasaje: su desarrollo en la msica de concierto del siglo xx permite establecer un vnculo conceptual entre estos dos rdenes del espacio.

El espacio inmanente
Durante siglos el espacio de la msica fue representado a partir de una analoga con el lenguaje.1 Su conformacin descansaba en el principio de la
1

La primera formulacin de la analoga entre la msica y el lenguaje en la tradicin occidental


parece encontrarse en un tratado annimo del siglo ix denominado Musica Enchiriadis. All se
establecen dos paralelos importantes. Uno es el de los sonidos de la msica con las letras-slabas
de la voz hablada; el otro es el de la clusula musical con la estructura oracional. Vase Powers
(1980, p. 49).

261

sucesividad. La msica dispona sus materiales en forma sucesiva, al igual que


el discurso lo hace con las oraciones de que se compone. La linealidad se constituy as en la organizacin bsica de ese espacio musical. La polifona no
hizo ms que complicar esa representacin, sin alterarla en sus fundamentos.
La msica polifnica estaba concebida como resultado de una superposicin
de lneas.2
La progresiva racionalizacin de las simultaneidades sonoras que resultaban de tales superposiciones expuso la insuficiencia de esa representacin
y deriv en una revalorizacin del antiguo paradigma pitagrico.3 Pero el
espacio de la msica slo se dej regir bajo los principios de la matemtica
al precio de su reduccin a los atributos abstractos de la altura musical. As,
durante el perodo tonal, la racionalidad del espacio descans en una regulacin de las relaciones entre los sonidos simultneos basada en sus relaciones
de altura. El concepto de acorde resuma, en su carcter abstracto, la logicidad del espacio musical.
Mientras la tonalidad conserv su naturalidad aparente o su actualidad
histrica, el espacio de la msica mantuvo una condicin unitaria. La tonalidad no slo aseguraba un cierto grado de cohesin de los diversos momentos
formales en el tiempo de la obra, sino que tambin cohesionaba, integraba
su simultaneidad. La identificacin de la tonalidad como una segunda naturaleza, esto es, el reconocimiento de su carcter histrico y convencional, a
comienzos del siglo xx, posibilit un descentramiento del espacio musical.
Este perdi la referencia a un elemento organizador unitario.
Paralelamente a su descentramiento, un proceso contemporneo modific el espacio de la msica en otro aspecto y de modo no menos profundo.
Mientras la msica se orden sobre la base de alguna forma de tematismo, el
espacio tuvo el carcter de una dimensin secundaria de la estructura musical, derivada de una disposicin de materiales concebidos con anterioridad a
aquel. Su conformacin concreta estuvo considerada en la teora de la msica
occidental hasta avanzado el siglo xx como un problema de escritura. El abandono del tematismo hara posible concebir el espacio como una dimensin
inmediata, como un atributo del mismo material. El concepto de textura se
constituy en el pensamiento del siglo xx como uno de los conceptos centrales de ese espacio musical descentrado y concreto.

Vase la definicin de la polifona como pluralidad de melodas diferentes en el tratado


Summa Musicae (c. 1200), de Johannes. Cf. Gerbert (1784).
3 Para una exposicin resumida de la contraposicin entre un paradigma lingstico y un
paradigma matemtico en la historia de la teora de la msica, vase Neubauer (1992).

262

La crisis en el sistema de categoras estilsticas


La formulacin del concepto de textura en la teora de la msica se corresponde con un proceso que se manifest tanto en el plano de la composicin como
en el de la reflexin musical.
Hasta el siglo xx, la representacin terica de la simultaneidad musical
estaba definida por una orientacin predominantemente tipolgica. Un conjunto relativamente reducido de categoras estilsticas de acuerdo con la denominacin de Guido Adler (1973), entendidas como designacin de diferentes
modalidades de escritura musical, daba cuenta de una diversidad de conformaciones de la simultaneidad.4 Esa nocin de escritura representa un vestigio de
la antigua concepcin retrica de la composicin, que entiende la ideacin del
material en una primera instancia, como inventio, y la escritura en una segunda instancia, como parte de la dispositio.5 El espacio, entendido ahora como
resultado de la disposicin del material incluidas las decisiones relativas a sus
determinaciones tmbrica, registral, etctera, en este pensamiento tipolgico,
se configuraba en este segundo momento, el momento de la escritura.
A comienzos del siglo xx se desarrollaron formas nuevas de componer la
simultaneidad musical que no se dejaban representar con las categoras estilsticas tradicionales. Este desarrollo ira a repercutir sobre la representacin
terica del espacio musical en el sentido de una expansin del conjunto de
categoras estilsticas, tanto con la incorporacin de categoras nuevas como
con una prdida de especificidad de las categoras tradicionales, dada por las
continuas y fugaces redefiniciones de que fueron objeto.6 La pretensin de
representar conformaciones del espacio musical ajenas a la cultura occidental, introducidas contemporneamente a la conciencia europea, supuso un
impacto adicional sobre el sistema de categoras.7 De este modo ese sistema,
que lleg a sustentar el esquema de una filosofa de la historia de la msica,8 se
4

La definicin de categoras tales como polifona, homofona, heterofona, o puntillismo,


en trminos de categoras de escritura musical no hace ms que poner en evidencia la
falta de conceptos correspondientes a la esfera del fenmeno. La descripcin, carente de
herramientas en el plano del objeto, se vuelve sobre el procedimiento, respecto del cual el
resultado sonoro debiera ser un mero reflejo.
5 Cf. Bonds (1991).
6 Basta revisar la meticulosa reconstruccin de las conceptualizaciones de la polifona en
el HMT y el New Grove (ambas de Wolf Frobenius) para comprobar el alcance de estas
redefiniciones. Vase Frobenius (1980; 2001).
7 Vase Fessel (2007c).
8 Segn el cual la msica occidental habra evolucionado de la monofona a la polifona,
y de esta ltima a la homofona armnica. Para una versin de este esquema, cf. von
Helmholtz (1863).

263

debilit y terminara por fragmentarse. La aproximacin categorial dio lugar a


una aproximacin conceptual, fundada en el concepto de textura.

La textura
El trmino textura designa cierta forma de discontinuidad en la continuidad. La etimologa del trmino, as como su sentido corriente, ofrecen
parfrasis de su concepto. La etimologa lo deriva de una nocin de tejido o
entramado.9 Esta derivacin subraya uno de los aspectos relevantes del concepto de textura, que alude a su carcter compositivo: la textura resulta de alguna
forma de multiplicidad.
El sentido corriente del trmino le asigna dos atributos fundamentales.
El primero corresponde al orden de lo visual. La textura puede ser entendida
como una cualidad vinculada con la apariencia concreta de una superficie,
con independencia de sus atributos formales o de color.10 El acento recae en
la cualidad material de la superficie. Esta cualidad se resiste, en este sentido,
a una transposicin al plano del lenguaje verbal como no sea sobre la base
de categoras vinculadas al orden de lo tctil. De aqu se deriva un segundo
aspecto del concepto de textura en su sentido corriente: la textura puede ser
entendida como una propiedad de los objetos mismos, aprehensible mediante
el tacto.11
El trmino textura se incorpor al vocabulario tcnico de la msica
en lo que aparentan ser dos sentidos dismiles, pero que se corresponden en
realidad con una focalizacin unilateral sobre uno de los dos elementos que
designan el concepto, la discontinuidad o la continuidad. Un primer sentido
se aplica a la constitucin de la simultaneidad musical, a la representacin de
su disimilitud. La textura se identifica con conceptos como el de estratificacin y se presenta como forma de la simultaneidad. El concepto entra en este
sentido en una serie histrica junto con o, ms precisamente, en sustitucin
de categoras como las de polifona, homofona, heterofona, entre otras. El
segundo sentido se aplica a la designacin de una clase histricamente precisa de materiales musicales. Esa designacin coloca a la textura junto con
9

Del latn txtum, tejido, y texre, tejer. Cf. Corominas (1991).


Esta cualidad se encuentra destacada asimismo en mbitos como los de la percepcin
visual o la fotografa. Cf. Gibson (1950); Reed y Jones (1982, p. 94); Gardner (1972, pp.
40-59); y Moor y Moor (1996). Esa condicin concreta de la textura es constitutiva tambin del empleo del trmino en el mbito de la crtica literaria, donde la textura designa el
material verbal mismo, anterior a su estructuracin narrativa. Vase Baler (1994).
11 Para una concepcin eminentemente tctil de la textura musical, cf. Clifton (1983).
10

264

una serie de conceptos como los de motivo, tema y material. Los materiales
caracterizados como texturas tienen como uno de sus atributos esenciales el
de no existir con anterioridad al espacio musical en el que se encuentran. A
diferencia del motivo y el tema, susceptibles de una disposicin en la simultaneidad musical en la voz superior, en el comes, o repartidos en la textura
como en la durchbrochene Arbeit, por mencionar slo algunas posibilidades,
el espacio que despliega la textura representa uno de sus mismos atributos.12
En esta concepcin, la textura alude al contenido concreto de la simultaneidad y se identifica con conceptos como los de material y sonoridad. El concepto de textura se revela as como un concepto antinmico, una antinomia
dada por la contraposicin entre una concepcin formal y una concepcin
material de la textura.

Emancipacin de la textura
La diferenciacin que instaura el concepto de textura entre una acepcin
ligada a la constitucin de la simultaneidad y otra ligada al material es indisociable de desarrollos precisos de la textura en la msica de concierto en el
siglo xx. Se trata, por una parte, del desarrollo de un alto grado de disociacin
en la simultaneidad musical, as como, por otra parte, de la realizacin de una
significativa integracin y concrecin.
El primer proceso encuentra una manifestacin temprana y radical a
la vez en la msica de Charles Ives. Obras como The Unanswered Question,
Central Park in the Dark, Decoration Day, Over the Pavements, compuestas en
la primera dcada del siglo xx desarrollan una acentuada individuacin en la
textura. Los elementos que la conforman se desarrollan en forma autnoma
hasta tal punto que se independizan de la totalidad, la cual integran, pero que
ya no los rige. Resulta as una textura estratificada y heterognea. La estratificacin se constituye como un elemento alegrico, como una condicin
inorgnica de la textura.
Dos elementos permiten situar esta msica como un puente para pensar
una continuidad esttica entre el espacio inmanente y el espacio fsico. Por una
parte se presenta, en obras como Central Park in the Dark o Decoration Day, un
12

Se consuma as una inversin en la relacin entre tema y espacio, inversin que la


textura, entendida como designacin de un material musical, da por sentada. La ubicacin
del concepto de textura en una serie junto con los de sujeto, motivo y tema no lo vuelve un
concepto temtico, en el sentido de que la textura, entendida como material, no est ligada
necesariamente con la elaboracin temtica. La serie sujeto-tema-motivo-textura designa
elementos vinculados al orden de lo particular en la obra musical.

265

fenmeno de enmascaramiento textural, que se podra entender incluso con


categoras pictricas, como un estrato que cubre a otro en una idea etimolgicamente ms literal del enmascaramiento. Se revela aqu una concepcin
del espacio vinculada a una ilusin de proximidad, en la cual un material se
ubicara delante de otro, al que oculta. Se trata sin duda de trminos figurados,
pero esta representacin del espacio se aproxima ya conceptualmente a la
figuracin del espacio fsico. La textura estratificada, por otra parte, asociada a
una individuacin de los elementos que componen la totalidad, representa una
precondicin para la incorporacin del espacio a la msica, en la medida en
que el espacio fsico de la msica tradicional cuenta como totalidad, y por eso
mismo se cancela en cuanto tal. Ese espacio es todava homogneo, y en ese
sentido indistinto. La operacin compositiva del espacio presupone en cambio
una disociacin al interior de ese campo espacial. Es all donde se puede ubicar
ese punto de unin entre la textura estratificada, basada en la individuacin
de los elementos que la componen, y la disociacin del espacio, que permite
operar con l como una dimensin compositiva.
El segundo proceso de desarrollo de la msica de concierto en el siglo xx
se manifiesta de forma inequvoca en la msica de Gyrgy Ligeti, compuesta luego de su contacto con los compositores seriales ligados al crculo de
Darmstadt. La generalizacin de la serie en la msica de estos compositores
haba terminado por producir una indiferenciacin intervlica, contradictoria con el principio serial. A la dispersin de la textura caracterstica del
serialismo de la dcada de 1950, Ligeti contrapone una textura compleja pero
en ltima instancia integrada, prxima a una idea de masa.13 Una individuacin anloga a la de la estratificacin resulta en este caso del abandono de
los principios abstractos para la conformacin de la simultaneidad musical.
La textura entendida como sonoridad se encuentra ligada a un pensamiento
concreto de los materiales. El tratamiento matrico de la sonoridad, como
sustancia de la simultaneidad, se ubica aqu en primer lugar.14
Los dos procesos tienen, en ltima instancia, un origen comn. Ambos
representan consecuencias dismiles de la crisis y disolucin de la tonalidad. En efecto, la incorporacin de niveles crecientes de disonancia en la
estructura acrdica en la msica del siglo xix terminara por desdibujar las
oposiciones tonales.15 Una de las consecuencias de esta indiferenciacin
acrdica estar dada por el detrimento del papel del acorde como regulador
13

Para un anlisis textural de Apparitions, obra que marca una articulacin en la produccin
compositva de Ligeti, vase Fessel (2007b).
14 Sobre este punto vase Fessel (2007a).
15 Esta interpretacin histrica se encuentra desarrollada en Hualpa (1985).

266

de una simultaneidad integrada. La indiferenciacin acrdica determina,


indirectamente, una individuacin de los estratos que conforman la textura.
Esa individuacin puede interpretarse as, en la msica de Ives, como una
crtica inmanente de la condicin vinculante de la simultaneidad dada por
la tonalidad.
Una indiferenciacin anloga operada sobre la categora del intervalo
terminara por neutralizar el carcter distintivo de la serie en la msica centroeuropea de la dcada de 1950. La indiferenciacin estructural que Ligeti
interpreta como fatalidad del serialismo conducir a las texturas integradas
caractersticas de su propia msica desde la dcada de 1960. En esa indiferenciacin, que terminara por alcanzar a la misma abstraccin del pensamiento
musical, se concentra la crtica de Ligeti al desarrollo del serialismo durante
la dcada de 1950. Como en Ives, la indiferenciacin se vuelve, dialcticamente, individuacin. En el caso de Ligeti, la individuacin de las sonoridades es tal que su carcter intervlicamente equivalente se vuelve irrelevante.
No se trata slo de que la distincin entre consonancia y disonancia haya
sido neutralizada. El intervalo como categora su naturaleza abstracta
pierde toda sustancia en una msica que destaca el carcter concreto de sus
sonoridades.
Se establece as un notable paralelismo en los desarrollos de la textura
en uno y otro caso. Su conformacin representa una expresin, dismil e
histricamente distante, de procesos similares de indiferenciacin e individuacin creciente. La crtica de la idea de totalidad por la individuacin y
de los principios abstractos por la concrecin textural son las expresiones
ms claras de nominalismo en el proceso histrico que Jonathan Dunsby
caracteriz, no sin algo de nfasis, como emancipacin de la textura (vase
Dunsby, 1989).

Hacia una esttica de la heterogeneidad y de la concrecin


Distintas posibilidades de la textura las texturas estratificadas de Ives, as
como las texturas complejas e integradas de Ligeti parecen coincidir en un
punto elusivo: la crtica de nociones afirmativas como las de determinacin,
unidad y abstraccin de las construcciones musicales. Ese punto seala una
posible direccin para una esttica de la textura: se tratara de dilucidar la
racionalidad tanto de la simultaneidad desintegrada como de la concrecin,
ms all de su valor negativo como crtica de la integracin arbitraria o de
una abstraccin unilateral.
Una esttica de la concrecin tendra que cuestionar la primaca de la
267

estructura, esto es, de la inclusin de los elementos individuales en un entramado funcional, por sobre los atributos concretos del material musical, como
fundamento de su valor esttico.16 Se tratara, en otras palabras, de fundamentar la racionalidad de una autosuficiencia del material. Por su parte, esa
primaca de las relaciones funcionales sobre la materialidad de las sonoridades
representa una negacin del momento de genuina multiplicidad contenido
en el concepto de textura; hace de tal multiplicidad una forma mediata de la
unicidad. Una esttica de la heterogeneidad textural podra apoyarse asimismo en una legitimacin de la autosuficiencia, dirigida ahora a los estratos que
componen la textura desintegrada.17
No se tratara tanto de negar la pretendida imposibilidad de una verdadera relacin entre cosas de distinta naturaleza como de desplazar el foco
de la mirada hacia un plano de especulacin que pudiera sustraerse de la
centralidad del concepto de relacin, sin relegar por ello los elementos a la
condicin de los objetos inertes. La disposicin, un atributo capital de la textura heterognea, y la materialidad de la textura producen una significativa confluencia desde un punto de vista esttico. Ambos suponen un desplazamiento
del concepto de relacin, fundado en propiedades abstractas, a la condicin
situada, ubicada en un tiempo y un espacio musicales precisos, de la textura
en su particularidad.
Son justamente esos dos atributos, la estratificacin y la concrecin de la
textura, los que permiten establecer una asociacin entre el concepto de textura y el espacio fsico, entendido como objeto compositivo. La estratificacin
implica pensar la textura en trminos de una disposicin de los materiales, y
es precisamente en la idea de disposicin que se establece un vnculo con el
espacio. La disposicin de las fuentes sonoras en el espacio real de audicin
conlleva su descentramiento, la idea de que ese espacio ya no cuenta como
totalidad, sino que se puede concebir como un espacio segmentado y mltiple.
La concrecin, por su parte, permite asimismo una transposicin al plano del
espacio: a diferencia de la msica de concierto tradicional, que presupone
un espacio abstracto, indistinto, la incorporacin del espacio fsico al diseo
compositivo implica un cierto grado de particularizacin del espacio en el que
la msica acontece.

16

Una discusin a propsito de la msica informal se encuentra en Borio (1993) y en Fessel


(2007a).
17 Una esttica de la inorganicidad textural alcanzara tambin a algunos estilos de jazz,
los que reclaman de la esttica algo ms que la identificacin de un individualismo a
ultranza.

268

Bibliografa
Adler, G. (1973), Der Stil in der Musik, Walluf, Sndig.
Baler, M. (1994), Die Entdeckung der Textur. Unverstndlichkeit in der Kurzprosa
der emphatischen Moderne 1910-1916, Tbingen, Max Niemeyer.
Bonds, M. E. (1991), Wordless Rhetoric. Musical Form and the Metaphor of the
Oration, Cambridge, Harvard University Press.
Borio, G. (1993), berlegungen zu Struktur und Textur, Musikalische
Avantgarde um 1960. Entwurf einer Theorie der informellen Musik, Laaber,
pp. 92-101.
Clifton, T. (1983), Music as Heard. A Study of Applied Phenomenology, New
Haven, Yale University Press.
Corominas, J. (1991), Diccionario crtico etimolgico Castellano e Hispnico,
Madrid, Gredos, vol. v, pp. 450-451.
Dunsby, J. (1989), Considerations of Texture, Music & Letters, 70/1, pp.
4657.
Fessel, P. (2007a), Textura y postserialismo: la discusin sobre el material
musical en Gyrgy Ligeti y Helmut Lachenmann, Pauta. Cuadernos de
teora y crtica musical, 101, pp. 53-66.
(2007b), Forma y concrecin textural en Apparitions (1958-59) de
Gyrgy Ligeti, Revista del Instituto Superior de Msica, 11, pp. 49-86.
(2007c), From stylistic categories to the concept of texture. Changes in
the representation of simultaneity in the music thinking of the early 20th
century, presentado en el 18vo. Congreso de la Sociedad Internacional
de Musicologa, Zrich.
Frobenius, W. (1980), Polyphon, polyodisch, en Riethmller, A. (ed.),
Handwrterbuch der Musikalischen Terminologie, Stuttgart, Steiner.
Frobenius, W. (2001), Polyphony, en Stanley Sadie (ed.), The New Grove
Dictionary of Music and Musicians, Londres, Macmillan, vol. 20, pp.
74-83.
Gardner, H., (1972), On Figure and Texture in Aesthetic Perception,
British Journal of Aesthetics, 12, pp. 40-59.
Gerbert, M. (1784), Scriptores ecclesiastici de musica sacra potissimum, iii, 239a;
y Huglo, Michel (1993), Organum dcrit, organum prescrit, organum
proscrit, organum crit, en Polyphonies de tradition orale. Histoire et traditions
vivantes: Actes du colloque de Royaumont, 1990, Paris, Creaphis, pp. 14 y ss.
Gibson, J. (1950), The Perception of the Visual World, Boston, Houghton
Mifflin.
Hualpa, S. (1985), Armona, La Plata, Universidad Nacional de La Plata,
mimeo.
269

Moor, A. y J. Moor (1996), Photography, en Turner, J. (ed), The Dictionary


of Art, London, Macmillan, vol. 24, p. 651.
Neubauer, John (1992), La emancipacin de la msica. El alejamiento de la
mmesis en la esttica del siglo xviii, Madrid, Visor.
Powers, Harold (1980), Language Models and Musical Analysis, Ethno
musicology, 24/1 p. 49.
Reed, E. y R. Jones (eds.) (1982), Reasons for Realism, Hillsdale, L. Erlbaum.
Von Helmholtz, H. (1863), Die Lehre von den Tonempfindungen als physiologische Grundlage fr die Theorie der Musik, reeditado en 1968 en Hildesheim,
por Georg Olms, p. 396.

270

Captulo x
Integracin de la msica al espacio virtual
Pablo Cetta

Algunas construcciones musicales pueden ser entendidas como el resultado de


una sucesin o superposicin de gestos, movimientos plenos de significacin,
cuya organizacin proviene de las caractersticas, direccionalidad y comportamiento de los elementos que las constituyen. Como tales, estos desplazamientos tienen lugar en un espacio multidimensional que les es propio, y que
vamos a denominar el espacio interno de la msica.
La msica en general es inseparable de su espacio interno. Su aprovechamiento es recurrente a lo largo de la historia, y se manifiesta principalmente
asociado al concepto de textura, si bien en pocas ms recientes aparece vinculado ms fuertemente al concepto de timbre.
Aun en los casos ms elementales esto se pone claramente de manifiesto.
El contorno meldico de una pieza mondica da cuenta del espacio interno. La
partitura representa tres aspectos, la trayectoria, la velocidad y la aceleracin.
La altura se desplaza y la densidad cronomtrica se asocia indefectiblemente
a la velocidad del movimiento. Si la dinmica vara, se pone en juego una
nueva dimensin. Si los eventos se repiten aceleradamente pero la altura no
cambia aparece una nueva medida del movimiento, y as en orden creciente al
considerar el grado de tonicidad, las articulaciones, la riqueza del espectro, las
evoluciones dinmicas de los eventos sonoros, el timbre, en definitiva.
Una escucha analtica nos gua a la percepcin de diversos parmetros
que se articulan trazando distintas trayectorias; una escucha ms integradora,
al reconocimiento de uno o ms objetos que cambian de forma en un espacio
n-dimensional.
Estas afirmaciones, que pueden parecer simplistas, no pretenden de
ningn modo explicar lo que la msica es, sino ms bien tratan de establecer
un punto de partida para explorar posibles nexos entre el espacio sonoro y
el espacio de representacin de los sonidos. Apuntan a la fusin del espacio
interno y el espacio externo con el propsito de dar sentido a la composicin
musical centrada sobre la localizacin espacial del sonido.
271

Gran parte de las obras compuestas desde fines de la dcada de 1940 hasta
principios de la dcada de 1960 se caracterizaron por la bsqueda de una integracin de los parmetros musicales partiendo de la organizacin de la altura
en series dodecafnicas. Tal es el caso de Three Compositions for Piano (1947)
de Milton Babbitt, donde el compositor deriva de una serie pancombinatoria
la dinmica, los ritmos, los intervalos de ataque de las notas, el orden de las
acentuaciones y la densidad polifnica, anticipndose al racionalismo extremo
de Modo de valores e intensidades (1949) de Olivier Messiaen. Es aqu donde
comienza un nuevo camino de intentos de formalizacin absoluta de la msica,
basado como es bien sabido en las creaciones de la Segunda Escuela vienesa.
Ms hacia fines del perodo en cuestin, basta con observar la primera
y la ltima pgina de la Klavierstcke IX (1961) de K. Stockhausen, para
determinar la resultante de la composicin de fuerzas que all operan. El autor
propone una trayectoria que parte de un nivel mximo de periodicidad (un
acorde repetido 140 veces) para finalizar con un alto grado de aperiodicidad
(acciacaturas rpidas ubicadas aleatoriamente dentro del comps), con los
desvos intermedios necesarios que le permiten construir el discurso musical. El concepto de periodicidad se proyecta a la vez sobre otros parmetros,
estableciendo comportamientos cclicos del registro, de la dinmica, de las
articulaciones y de la densidad polifnica. Las notas del acorde repetido
conforman las componentes complejas de un espectro en evolucin, que va
del ff al pppp, mientras que las frecuencias de movimiento de los parmetros
citados se establecen, en cambio, fuera del registro audible, permaneciendo en
el dominio temporal. Todo esto es discernible a partir de la descomposicin
de los movimientos de los parmetros en ejes del espacio multidimensional, o
como una totalidad que transforma de manera muy sutil y compleja el timbre
y el espacio interno de la obra, a partir de movimientos peridicos de distinta
frecuencia. Resulta clara, adems, la influencia que en este perodo ejerce
la msica electrnica sobre la composicin instrumental. Diversos procesos
propios de la sntesis y la transformacin del sonido (uso de filtros, de envolventes, modulacin en frecuencia o amplitud, etc.) se trasladan al mbito de
la creacin para instrumentos tradicionales.
Nuevos intentos de integracin de los parmetros musicales surgen a
mediados de la dcada de 1970, a partir de la identificacin de las componentes de la msica con las componentes del sonido. Este movimiento,
denominado espectralista, encuentra sus antecedentes inmediatos en la
msica de Boulez y Stockhausen, pero tambin en los procesos graduales propios del minimalismo, y en las paradojas psicoacsticas planteadas por Ligeti.
As es como Grard Grisey propone la resntesis instrumental del sonido del
trombn en Partiels (1975), logrando una fusin ntima de la altura, de la
272

intensidad y del tiempo, tal como aparecen en la naturaleza misma del sonido.
El efecto de zoom temporal, necesario para la reconstruccin mecnica de las
delicadas variaciones de estos parmetros, podra convertirse en clave de una
posible exteriorizacin del espacio interno de la msica.
En este ltimo perodo tambin vemos que la incorporacin de tcnicas
electroacsticas incrementa la riqueza espacial del timbre. En Gondwana
(1980), Tristan Murail resintetiza espectros generados por frecuencia modulada, creando as sonoridades inusuales para la orquesta. Los gestos de la
introduccin son claros, doce ataques que modulan gradualmente en espectro,
y cuyas envolventes dinmicas parten de la imitacin de una campana hasta
llegar a una trompeta.
Vemos, entonces, que los eventos sonoros, al igual que las estructuras
musicales, se desenvuelven en un espacio propio e interno, delimitado por
los parmetros que los caracterizan. Algunas propiedades de ese espacio son
observables a travs de los movimientos de un intrprete o un director de
orquesta, que transforma y exterioriza los recorridos inscriptos en la partitura
en gestos visibles.
En relacin al espacio externo, sabemos que si bien la disposicin de
fuentes sonoras en el mbito de representacin acompaa a la msica desde
sus orgenes partiendo del canto antifonal o responsorial, pasando por la
policoralidad practicada en San Marcos en el siglo xvi, es en la dcada de
1950 donde comienzan a utilizarse fuentes sonoras aparentes como resultado
de la utilizacin de dispositivos tecnolgicos en la msica. Gesang der Jnglinge
(1955-1956) de Stockhausen, concebida originalmente para cinco grupos de
parlantes distribuidos en las esquinas y en el techo del auditorio, es la primera
obra electroacstica que explora las posibilidades de la localizacin espacial
del sonido.
A partir de all, ocurre una proliferacin de obras instrumentales, electroacsticas y mixtas que exploran las propiedades del espacio, as como tambin,
el desarrollo de sistemas de simulacin de fuentes aparentes en entornos virtuales mediante el uso de parlantes.
El tratamiento de la localizacin espacial del sonido en la composicin,
siguiendo esta idea de divisin del espacio en la msica, puede concebirse
como una exteriorizacin del espacio interno, y a la vez, como una interiorizacin del espacio externo. Esto significa que las trayectorias espaciales se
desarrollan en relacin a los recorridos interiores del sonido, o bien, que los
parmetros del sonido y la msica pueden ser alterados por la trayectoria de
las fuentes virtuales. Distinguimos, entonces, dos casos posibles.
Para el primero, exteriorizacin del espacio interno, partimos del anlisis
del sonido a espacializar. Este proceso, que puede ser realizado en tiempo real,
273

comprende la deteccin de algunos parmetros, cuyas magnitudes se trasladan


en proporcin sobre los ejes de coordenadas del espacio virtual. De este modo,
la altura puede asociarse al eje vertical (eje z), el nivel de tonicidad de los
sonidos al eje x, y la intensidad al eje y. Otras variables fcilmente asimilables
son la duracin de los eventos, la densidad cronomtrica, la densidad polifnica o la riqueza del espectro. Cualquier variacin de estas magnitudes se refleja
en un desplazamiento de la fuente en el espacio.
Un mismo fragmento sonoro puede realizar trayectorias bien distintas,
pues depende de la terna de parmetros y el sistema de coordenadas elegido
(cartesianas o esfricas). En cualquier caso, existe un marcado correlato entre
las transformaciones de los eventos sonoros y su distribucin espacial. Y al
existir dos o ms fuentes, la espacializacin nos ayuda a apreciar y comparar
la materia sonora de cada una de ellas, a visualizar sus diferencias a partir de
las distintas trayectorias que se establecen.
Veamos un ejemplo. Existe un modo de representacin de la altura, utilizado en psicoacstica, en el cual los grados cromticos se distribuyen bajo la
forma de una espiral ascendente, y donde las notas de igual nombre coinciden
verticalmente. La espacializacin de este modelo conduce a una registracin
espacial de la altura, pues cada grado ocupa un lugar fijo en el espacio virtual.
Si ejecutamos una escala cromtica de cuatro octavas, el sonido del instrumento define una trayectoria que gira cuatro veces, a la vez que asciende. Resulta
interesante observar lo que sucede con la velocidad de desplazamiento de la
fuente en relacin a la intervlica de un fragmento musical, pues si en lugar de
ejecutar una escala cromtica interpretamos una escala por tonos, la velocidad
del movimiento se duplica. En una situacin ms compleja, los intervalos que
se suceden linealmente se manifiestan en el espacio como transformadores
de la velocidad, mientras que la direccionalidad meldica determina el sentido de giro. Siguiendo el mismo criterio, podemos incorporar la dinmica al
modelo, de modo que influya en el dimetro de la espiral. Nuevamente aqu,
la superposicin de dos o ms fuentes conduce a la percepcin de una imagen
sonora del contrapunto que resulta muy efectiva.
Cuando se trata de detectar los parmetros del sonido que ingresan a la
computadora, la programacin del entorno de procesamiento en tiempo real
requiere ciertas consideraciones. En este ltimo ejemplo, que el sistema realice las interpolaciones necesarias frente a cambios bruscos de altura, o tome
decisiones cuando el grado de tonicidad de los sonidos es muy bajo.
En general, es necesario desarrollar previamente un modelo eficaz para
el posicionamiento de las fuentes, basado en transformaciones geomtricas,
cualquiera sea el sistema de espacializacin utilizado. Encuentro apropiado,
en particular para otras aplicaciones que veremos ms adelante, un modelo
274

basado en dos vectores solidarios, ambos de longitud variable. El primero parte


del origen de coordenadas, ubicado en el centro del espacio virtual, y llega
hasta un punto definido por su magnitud, un ngulo de azimut y un ngulo
de elevacin. El segundo, unido al extremo del primero, define su posicin a
partir de las mismas tres variables, como si se tratara del satlite de un planeta
en movimiento. Esto permite lograr desplazamientos complejos y fcilmente
controlables, donde una o ms fuentes satlites rotan sobre sus ejes a la vez
que se desplazan en conjunto.
Aun ms, teniendo en cuenta que la exteriorizacin del espacio interno
de determinados fragmentos musicales puede ser aprehendida rpidamente
por el oyente, la rotacin y la traslacin sobre los tres ejes de la imagen acstica completa brinda una riqueza todava mayor. En relacin al ejemplo de
registracin espacial de la altura, la espiral gira o se desplaza, siguiendo una
trayectoria prefijada, o bien de acuerdo al comportamiento de otras caractersticas presentes en la msica.
En relacin a la interiorizacin del espacio externo, la composicin del
espacio transforma al sonido. Partimos ahora de una trayectoria establecida
de algn modo, que puede o no depender del comportamiento de la msica.
El movimiento se descompone sobre los tres ejes de coordenadas y estos valores, convenientemente escalados, modifican tres aspectos sonoros elegidos.
Veamos un ejemplo, los valores x, y y z de un recorrido afectan a la frecuencia
de corte, al ancho de banda y a la ganancia de un filtro aplicado a uno o varios
objetos sonoros. La trayectoria puede ser externa a la msica o bien, a fin de
establecer un correlato, ser extrada del registro, del mbito y de la dinmica,
respectivamente, del fragmento musical compuesto a partir de esos objetos.
Los usos compositivos que surgen de estas ideas son muy variados. Si bien
buscamos un vnculo fcilmente perceptible entre msica y espacio, es posible
establecer diferencias que enriquezcan el discurso a partir de procedimientos
simples como la imitacin, aumentacin o disminucin, y retrogradacin de
las relaciones entre los recorridos internos de la msica y las trayectorias de las
fuentes virtuales, o incluso, de las dimensiones o caractersticas acsticas del
espacio virtual.
Es posible lograr una interiorizacin eficaz del espacio externo a partir de
comparar el tiempo subjetivo de un fragmento musical con las dimensiones
del espacio virtual. Desde el punto de vista perceptual, al aumentar el espacio,
la sensacin de transcurso del tiempo parece disminuir. Esta idea, considerada
a travs del tema que nos ocupa, puede justificarse a travs de diversas causas,
una es la accin de la reverberacin, que disminuye la resolucin temporal.
Otra surge en relacin a los primeros ecos, los intervalos entre los tiempos de
arribo de las primeras reflexiones aumenta a medida que el espacio crece.
275

Al citar ese breve recorrido histrico, caracterizado por una bsqueda


de integracin de los parmetros musicales, hice mencin del efecto de zoom
temporal aplicado al anlisis de un sonido para su posterior resntesis instrumental, utilizado por los espectralistas. Podramos partir del mismo principio
con el propsito de establecer un nexo entre las cualidades del espacio virtual
y las relaciones temporales de una pieza musical. Si efectuamos un aumento
considerable de las dimensiones del espacio, aumentan en proporcin las
diferencias en los tiempos de llegada de las reflexiones. El cambio de escala
trae aparejado un cambio en la percepcin, pasamos de mnimas diferencias
temporales, que favorecen la localizacin, a tiempos de ataque expresables en
trminos de ritmo musical.
Estas transformaciones en el modo de percibir el sonido ocurren de muy
variadas formas. Es bien sabido que si utilizamos una lnea de retardo con
realimentacin con un tiempo muy breve el sonido se transforma a nivel
espectral, si aplicamos en cambio un tiempo mayor percibimos un fenmeno
similar al eco. Algo parecido ocurre al aumentar gradualmente la frecuencia
de un generador de pulsos, al principio omos sonidos breves separados por
un determinado intervalo de tiempo, luego un nico sonido cuya altura
vara con la frecuencia. La diferencia en la percepcin de eventos repetidos
a bajas frecuencias y a frecuencias audibles sirvi como punto de partida a
Stockhausen en su intencin de establecer una relacin coherente entre la
altura de los sonidos y sus duraciones, aplicable a la composicin musical.
La tcnica de produccin de ritmos a partir del anlisis de las reflexiones
permite generar secuencias modulatorias interesantes y variadas, de acuerdo
a la trayectoria establecida. La ampliacin gradual del espacio virtual lleva,
a partir de cierto punto, a la percepcin de una clula rtmica susceptible de
ser resintetizada mediante instrumentos convencionales. Y en tal sentido, las
dimensiones del ambiente se manifiestan como un indicador de tempo.
Para alcanzar este propsito de forma rpida y efectiva dise un programa de computacin cuyas variables de entrada son las dimensiones de un
ambiente tridimensional y la trayectoria de una fuente virtual que reproduce
un sonido impulsivo. Este programa devuelve en tiempo real una secuencia
de clulas rtmicas, que resultan de capturar peridicamente el estado de las
reflexiones a intervalos especificados por el usuario, fcilmente trasladables
a notacin musical ya que las diferencias entre los tiempos de ataque son
cuantizadas a un mnimo valor elegible. Los datos obtenidos conforman un
material til en la composicin de procesos graduales. En estos, la trayectoria
de la fuente se relaciona de un modo firme con las estructuras temporales que
establecen el orden de los eventos sonoros de un fragmento musical.
Otros modos de exteriorizar el espacio interno de la msica se relacionan
276

con el tratamiento de la textura. Los mayores indicios que revelan al sistema


perceptual la posicin de una fuente ocurren durante el ataque del sonido. Es
por eso que nos resulta difcil detectar las sucesivas posiciones de un sonido
largo, y no iterativo, que se encuentra en movimiento. Y una forma creativa
de capitalizar esta dificultad es a travs de la fragmentacin de eventos continuantes, proceso que se basa en la distribucin espacial de grnulos extrados
de varias copias del sonido original. La suma de todos los grnulos y su concentracin en un punto, aplicando las envolventes adecuadas, reconstruye el
sonido. La distribucin de los grnulos en el espacio crea, por otra parte, una
textura de inters musical. Para lograr esto, es importante contar con varias
fuentes virtuales que puedan moverse de forma combinada, concentrarse en
un punto o distribuirse gradual y aleatoriamente sobre una parte o la totalidad de la superficie de una esfera que rodee al oyente. La integracin de la
msica al espacio se manifiesta de forma perceptible si la exteriorizacin de
los comportamientos musicales determina los recorridos o formas descritas
por las fuentes. La duracin de cada grnulo, el tipo de envolvente dinmica
establecido, y la densidad de la nube de eventos permiten, a la vez, mutar de
una distribucin espacial a una transformacin tmbrica que modifica sustancialmente la naturaleza del sonido original.
Una variante posible, partiendo del modelo antes descrito para el posicionamiento de fuentes virtuales basado en dos vectores solidarios controlados
por transformaciones geomtricas es la generacin de volmenes sonoros.
Para ello, partimos de una figura geomtrica tridimensional un cubo por
ejemplo y ubicamos en cada uno de sus vrtices una fuente. La ubicacin del
primer vector es la misma para todas las fuentes, parte del origen de coordenadas y su extremo alcanza el centro del cuerpo elegido. El segundo vector parte
del centro y se dirige al vrtice que corresponde, para cada una de las fuentes.
Esto permite una traslacin y rotacin en conjunto de todos los vrtices, como
si se tratara de una forma que se desplaza y gira sobre s misma. Cada fuente
posee un sonido caracterstico, que proviene de distintos instrumentos, o versiones transformadas tmbricamente del mismo instrumento. De este modo,
la rotacin del cuerpo se percibe acsticamente, el objeto virtual nos muestra
sus facetas y sus cualidades materiales, que asociamos con las caractersticas
texturales propias de cada sonido o estructura sonora.
Haciendo uso de nuestra imaginacin, a fin de llevar esto ms lejos an,
podramos pensar que quien se desplaza y rodea al objeto es el oyente, como
si se tratara de una verdadera escultura sonora. Tendramos as la posibilidad
de modificar el tiempo de lectura de ese objeto, y detenernos en aquello
que transmite de acuerdo a nuestro propio tiempo interno. El inters crece,
obviamente, frente a la presencia de diversos objetos interrelacionados y dis277

tribuidos en el espacio virtual, y a la de otros eventos cuyo tiempo y espacio


no dependen de nuestra voluntad perceptiva.
Diversos programas de espacializacin y composicin asistida, as como
parte de las ideas aqu expuestas, han sido la base de la composicin de mi
obra Interiores (2004), escrita para flauta, oboe, saxo alto, clarinete bajo y
piano, con procesamiento electrnico del sonido en tiempo real. Tanto la
parte de procesamiento como las aplicaciones de composicin asistida fueron
creadas en el entorno Max-msp.1
Las tareas de programacin comienzan con el diseo y desarrollo de
varias unidades de localizacin espacial del sonido basadas en la tcnica
Ambisonics,2 con decodificacin en ocho canales y parlantes dispuestos en
los vrtices de un cubo. El modelo incorpora el diseo del ambiente virtual, el
clculo y la reproduccin en tiempo real de las primeras reflexiones, y la absorcin del aire en funcin de las distancias recorridas. Contina luego con la
programacin de objetos destinados a la generacin de trayectorias definidas
en coordenadas cartesianas y esfricas, y a la aplicacin de transformaciones
geomtricas a diversas fuentes que se mueven en conjunto, utilizando coordenadas homogneas.
La deteccin de los parmetros musicales se realiza con diversos programas orientados a la exteriorizacin del espacio interno. La altura, la duracin
de los sonidos, el grado de tonicidad, la densidad de los eventos, se constituyen en variables de la espacializacin. Otras unidades de procesamiento, en
cambio, realizan transformaciones tmbricas de los sonidos instrumentales, y
sirven a la interiorizacin del espacio externo.
Objetos destinados a la registracin espacial de la altura y la generacin
de volmenes virtuales, procesos antes mencionados, junto a la armonizacin
de determinados sonidos utilizando conjuntos de grados cromticos, se integran al programa principal de procesamiento en tiempo real.
Los programas de composicin asistida, por otra parte, se utilizan para el
control de la altura en la obra, y para la construccin de secuencias rtmicas
derivadas de los intervalos de ataque del sonido directo y de las primeras
reflexiones.
La obra se divide en 17 secciones, con una duracin total aproximada de
25 minutos.
Desde el punto de vista de la notacin musical, la escritura de esta pieza
exhibe por momentos cierto grado de flexibilidad en el aspecto temporal, lo
1

<http://www.cycling74.com/products/maxmsp>.
<http://www.york.ac.uk/inst/mustech/3d_audio/welcome.html>. Vase, adems, el captulo v de este libro.
2

278

cual apunta a una mayor libertad y naturalidad en la interpretacin, aprovechando la posibilidad de tratamiento en tiempo real. Segn se observa en la
figura 1, la articulacin entre los constituyentes del gesto musical depende
en gran medida de la accin del director, y a simple vista podemos imaginar
trayectorias asociadas a los desplazamientos que ocurren en el espacio interno
de ambos fragmentos.
En esta seccin, las articulaciones de los acordes, enmarcadas por el
piano, son cada vez ms complejas y variadas. Aumenta gradualmente la
rugosidad de los acordes tenidos, partiendo de sonidos lisos hasta llegar a los
trinos y trmolos. La estructura de alturas es tambin modulante. El tipo de
distribucin espacial de los eventos se realiza por registracin espacial de la
altura, y luego por simulacin de los primeros ecos, en un ambiente virtual
que crece en dimensiones.
La organizacin de la altura de toda la pieza se establece a partir de la
utilizacin de conjuntos de grados cromticos (pcs, por pitch class sets). Del
anlisis de las caractersticas de los conjuntos surgen clasificaciones orientadas
a la generacin de similitudes, oposiciones o transformaciones entre campos
de altura. En el caso de los conjuntos formados por cuatro sonidos, por ejemplo, una clasificacin posible surge en relacin al grado de asociacin respecto
al sistema tonal acordes de sptima, tradas con notas agregadas, acorde
bimodal, conjuntos cuyos subconjuntos son acordes por terceras, acordes por
cuartas, fragmentos de escalas reconocibles o disociacin respecto a este
sistema, ordenados por sus caractersticas propias.
Las relaciones entre los campos de altura se regulan en funcin al nivel
de consonancia de cada conjunto. La determinacin del grado de consonancia

Figura 1

279

puede establecerse por varios mtodos, pero bsicamente tiene en cuenta la


cantidad y calidad de las clases intervlicas presentes en cada grupo, y la disposicin vertical u horizontal de sus sonidos en el registro. En el ordenamiento se comparan todos los conjuntos, pero tambin se establecen subcategoras
de acuerdo a la ausencia de uno o ms intervalos en particular, la cantidad de
clases intervlicas presentes, la cantidad de transposiciones o inversiones no
redundantes, etctera.
Considerando este mtodo de organizacin, la registracin espacial de la
altura, y en consecuencia las trayectorias asociadas a los distintos giros meldicos, no solo depende de la direccionalidad y la duracin de cada nota, sino
tambin de la intervlica lineal que cada fragmento presenta. A intervalos
ms amplios, mayor es la velocidad de desplazamiento de la fuente, por lo cual
es posible especular con la disposicin de los pcs en el registro y con sus permutaciones, a fin de controlar la velocidad y la aceleracin de los recorridos
sonoros. La figura 2 ilustra de algn modo este fenmeno, que trae aparejado
la percepcin del contrapunto en trminos espaciales.
El piano, en esta misma seccin, ejecuta una secuencia de acordes modulante en consonancia, cuyo ritmo proviene de las relaciones temporales entre
los ecos de un espacio particular, en relacin con la posicin de la fuente virtual
en ese mbito (en este caso la reproduccin del sonido del instrumento, que
va rotando alrededor de la sala). Luego de este fragmento y eliminado el plano
contrapuntstico, el piano permanece solo continuando la secuencia de acordes.
Se perciben claramente aqu las caractersticas modulatorias de la sucesin de
ritmos provenientes de la imitacin de los primeros ecos (vase la figura 3).
Por otra parte, el sector M de la obra, rtmicamente muy preciso, presenta
otra instancia de exploracin de las primeras reflexiones. En el 6/4 de la figura

Figura 2

280

4 se observa una resntesis del comportamiento de los primeros ecos, propios


del ambiente simulado. Significa que el comportamiento natural de la sala
virtual es luego imitado por los ataques de los instrumentos.

Figura 3

Figura 4

281

Aqu tambin se trata de un proceso gradual, pues a partir de M, el espacio virtual crece en dimensiones lo cual se aprecia al escuchar el comportamiento de las reflexiones para cada ataque de los vientos hasta alcanzar un
punto en el cual se produce la resntesis mencionada.
Pero volviendo al tratamiento de la altura, cuando varios instrumentos
mondicos ejecutan simultneamente las notas de un conjunto, cada sonido se diferencia por su timbre, por el modo de ejecucin empleado y por la
ubicacin de cada instrumentista en el escenario. Cualquiera de estas caractersticas puede ser transformada aplicando el procesamiento adecuado. Pero
es posible, adems, simular la produccin de varias alturas organizadas con
un nico instrumento mondico, transportando aquella que ejecuta a otras
distancias, y aplicando a cada nota un tratamiento tmbrico diferenciado y
una ubicacin particular en el espacio.
Para la implementacin de este proceso program un objeto de control que
genera los ndices de transposicin a utilizar. Estos ndices son calculados para
conjuntos de grados cromticos de tres y cuatro elementos, cuya denominacin
se especifica en una de sus entradas. Si elegimos el pcs 4-15, por ejemplo, e
informamos al programa que la nota ejecutada corresponde a la posicin de la
contralto, al tocar un do, es posible obtener do#, mi y fa#, que completan el
conjunto antes mencionado en las tres voces restantes. El objeto calcula una
transposicin posible y decide si lo invierte o no, por lo cual, en cada interpretacin de la misma nota escuchamos un acorde con la misma estructura
intervlica pero transpuesta, invertida, o permutada de formas distintas.
Las transposiciones del sonido de un mismo instrumento presentan un
nivel de coherencia mucho mayor que en el caso de varios instrumentos ejecutando las notas de un acorde. Obviamente la relacin de las componentes
espectrales es la misma para todas, pero desplazada en frecuencia. Esta caracterstica genera una integracin de los sonidos que gua a la percepcin de un
nico espectro, por lo cual este tratamiento de la altura produce resultados
ms bien tmbricos. El efecto se potencia en la combinacin de estos acordesespectros con el tratamiento intervlico de las fundamentales.
Con el propsito de generar acciones musicales variadas, recurrimos a un
objeto que detecta si la nota supera en duracin un cierto umbral. Solo en ese
caso la operacin de armonizacin es llevada a cabo. Esto permite la ejecucin de
giros rpidos adornos, por ejemplo sin armonizacin y detenciones, donde la
armona aparece a travs de un crescendo programado. La distribucin espacial de
estas acciones complementa el efecto buscado. La figura 5 muestra un fragmento
solista donde se aprecian los puntos de detencin que dan lugar a la armonizacin.
Los acordes que se producen poseen la misma intervlica que los giros meldicos,
establecindose as cierta coherencia entre el aspecto horizontal y vertical.
282

Figura 5

Algo similar ocurre al comienzo de la obra. Aparece aqu una transformacin


en el grado de tonicidad de los sonidos, que es enfatizada a travs del filtrado
de las bandas de ruido que producen los instrumentos de viento. El sonido
instrumental se procesa a partir de un banco de filtros pasabanda, cuyas
frecuencias de corte se corresponden con las frecuencias de las notas que
conforman una sucesin de pcs, que modulan de disonancia a consonancia.
La figura 6 muestra este pasaje inicial. Al igual que en la transposicin por
pcs, cada banda que resulta del filtrado puede ubicarse en distintas posiciones
del espacio virtual.
La modulacin en grado de tonicidad se traslada posteriormente a la parte
de piano, pero como una modulacin en trminos de consonancia-disonancia
(conjuntos de grados cromticos 4-1, 4-4, 4-12, 4-13, 4-16, 4-18 y 4-27, manteniendo el do como sonido comn en el bajo). El principio de este proceso se
observa en la misma figura 6. Hacia el final se aplica la fragmentacin de los
acordes tenidos que resultan.
En relacin con el tratamiento espacial de la textura, vimos la posibilidad
de generar volmenes que se desplazan y giran sobre s mismos. En el sector D de
Interiores los vientos, con y sin procesamiento, se ubican en los vrtices de una
forma geomtrica que rota sobre sus ejes y a la vez se traslada. A fin de generar
un tipo de textura localizable en trminos de espacializacin, los instrumentos
producen giros de cuatro sonidos, repetidos a gran velocidad (por momentos
tambin se aplica fragmentacin). Las relaciones intervlicas de los giros repetidos modulan, partiendo del conjunto de grados cromticos 4-1, hasta llegar
por orden sucesivo al 4-22. La rapidez de cada grupo se indica de acuerdo a tres
niveles: v-1, v0 y v1, para evitar las coincidencias rtmicas. El piano, por otra
parte, se desenvuelve en un plano independiente, pero al mismo tiempo articula
los ataques de los vientos. La escritura de esta seccin (vase figura 7) manifiesta
cierta libertad desde el punto de vista temporal. La unin efectiva de las partes
depende en gran medida de la interpretacin del piano y del director.
283

Figura 6

La obra finaliza con una reexposicin variada de las tcnicas expuestas. En


la figura 8 se observa un fragmento cercano al final que combina registracin
espacial de la altura y generacin de volmenes.
Al realizar un ordenamiento intuitivo de diversos objetos, es en cada
uno de ellos donde encontramos el modo, de acuerdo con las caractersticas materiales, formales y funcionales de cada elemento en relacin con el
contexto. As como es posible atribuir una duracin particular a un acorde
dentro de una sucesin, debido al grado de tensin y relevancia que presenta
en relacin con el resto, tambin es posible atribuir una trayectoria a un
sonido o conjunto de sonidos, considerando sus cualidades y los recorridos
interiores que los caracterizan. Pero, como siempre ocurre, la dificultad aparece al intentar la formalizacin de estas acciones, incluso cuando a veces
284

Figura 7

Figura 8

puedan parecer elementales. Si a esto sumamos que en la mayora de los casos


donde los procesos se realizan en tiempo real resulta imposible predecir el
futuro, notamos inmediatamente la complejidad del problema. Lo que aqu
he manifestado no pretende resolver la integracin del espacio en la msica.
Es simplemente el punto de partida que permiti la composicin de una pieza
musical en particular. La vinculacin de los aspectos temporales y espaciales
de la msica, la exploracin de su espacio interno en relacin al espacio
externo, la creacin de programas que hagan posible una msica interactiva
basada en las decisiones de un oyente, proponen desafos nuevos, y deben ser
profundizados en el futuro.
285

Bibliografa
Cetta, P. (2004), Principios de estructuracin de la altura empleando conjuntos de grados cromticos, en Altura-timbre-espacio, Cuaderno N 5
del Instituto de Investigacin Musicolgica Carlos Vega, Buenos Aires,
educa, pp. 9-35.
(2004), Modelos de localizacin espacial del sonido y su implementacin en tiempo real, en Altura-timbre-espacio, Cuaderno N 5 del
Instituto de Investigacin Musicolgica Carlos Vega, Buenos Aires,
educa, pp. 269-291.
(2007), Un modelo para la simulacin del espacio en Msica, Serie Tesis
de doctorado, Instituto de Investigacin Musicolgica Carlos Vega,
educa.

286

Captulo xi
Msica para sitios especficos: nuevas correlaciones
entre espacio acstico, pblico y fuentes sonoras
Martn Liut

Las obras musicales y de arte sonoro creadas para sitios especficos han puesto
de relieve la multiplicidad de relaciones posibles que pueden establecerse,
no solo entre el pblico y las fuentes sonoras, sino entre ambos y el espacio
acstico en el que transcurren las performances.
En Occidente la situacin de concierto se homogeneiz a partir del predominio del modelo de teatro a la italiana, con el pblico enfrentado a los msicos.
A su vez, la composicin musical se llev a cabo sobre la idea de una escritura
para lo que podramos denominar espacios acsticos genricos. Salvo excepciones, los compositores de la era moderna han escrito sobre el supuesto de que sus
obras seran interpretadas y escuchadas en salas, teatros o iglesias de diferentes
ciudades, cuyos espacios acsticos pueden tener cualidades diferentes pero caractersticas esenciales similares. Un ejemplo de ello es el tiempo de reverberacin.
Si se compone una obra sacra, se contempla el hecho probable de que la obra
tenga que lidiar con un tiempo de reverberacin mayor que el de una sala de
concierto, ya que probablemente ser interpretada en una capilla o iglesia.
La creacin para sitios especficos, por el contrario, toma nota desde su
gnesis de las particularidades topolgicas del espacio a ser utilizado. Ya se
trate de espacios dados o construidos ad hoc, una caracterstica saliente de
este tipo de obras es que promueven diferentes vnculos entre la msica y el
espectador. Estos pueden ser, adems, variables. De hecho, muchas de estas
obras contemplan y fomentan la opcin de una escucha mvil, no esttica,
durante su transcurso.
El presente artculo se propone analizar los diferentes tipos de vnculo
entre espacio acstico, fuentes sonoras y pblico que promueven las creaciones para sitios especficos. Se tomarn como base para la discusin las primeras
consideraciones taxonmicas propuestas por los compositores Iannis Xenakis
y Lloren Barber, y las propias. Se ofrecern luego algunos ejemplos de obras
realizadas en la ciudad de Buenos Aires que permitirn reunir los diferentes
aspectos estudiados.
287

Se trata de una temtica nueva para el campo de la composicin, que


admite diferentes tipos de soluciones, en funcin de las premisas estticas del
autor de la obra. Los casos de Xenakis y Barber son, en este sentido, paradigmticos: compartiendo el inters por la composicin para sitios especficos,
sin embargo, sus obras difieren notablemente en su resultado sonoro debido a
su adscripcin a paradigmas estticos diferentes. El primero se bas en modelos estadsticos y estocsticos para construir texturas de alta complejidad. El
segundo toma como modelo el minimalismo y las ideas de Cage y Satie, como
la no-narratividad y la repeticin de mnimos materiales. En el caso de instalaciones e intervenciones sonoras tambin la esttica determina estrategias y
herramientas diversas, aun en puestas sonoras similares en su diseo.

Sonidos especficos y arquitectura aural


Entendemos por arte para sitios especficos a aquellas creaciones que toman
en cuenta en forma integral el espacio elegido para su presentacin. Integral
implica no solo atender a los aspectos topolgicos del espacio sino, tambin,
a su carga simblica, su relacin con el uso cotidiano que tiene por parte de
la comunidad que lo transita, circula o habita, su historia y el imaginario
asociado a l. Como seala Omar Corrado: Tocar el espacio de la ciudad es
entrar en contacto con una zona rica y conflictiva del hacer humano. All se
anudan las vicisitudes de lo privado y lo pblico, de la historia y el presente,
de la cultura y la poltica de una ciudad que es, tambin, los poderes que la
representan (Corrado, 2001).
Planteado en estos trminos, queda claro por qu no se consideran aqu
los espectculos masivos realizados al aire libre de msicas originalmente
pensadas para su recepcin en recintos cerrados. Se trate de msica clsica
o popular, lo habitual en esos casos es, amplificacin mediante, intentar que
la seal acstica que se genere llegue con la mejor claridad perceptiva a los
oyentes. Para lograrlo, los ingenieros de sonido tratan de disimular la evidente
diferencia entre la acstica tpica de, por ejemplo, un estadio de ftbol respecto de una sala de conciertos. En estas situaciones, el espacio acstico, ms que
un tema, es un problema, algo que se padece y se intenta neutralizar.
En el captulo ii de este libro, Gustavo Basso analiza la acstica de recintos dedicados a la msica, los que han producido con los siglos una especie de
normalizacin en el modo de la generacin y recepcin del hecho musical:
la acstica de estos espacios es una extensin de los instrumentos, pero no
suele ser estructurante de las obras interpretadas. Por el contrario, la realizacin de experiencias artsticas sonoras en espacios no convencionales puede
288

ayudar a tomar conciencia sobre las caractersticas acsticas particulares en s


de un determinado punto de la ciudad.
Los investigadores Barry Blesser y Linda-Ruth Salter (2006) denominan
arquitectura aural a las particularidades acsticas que posee un espacio
determinado:
El compuesto de numerosas superficies, los objetos y las geometras en
un entorno complejo, crea una arquitectura sonora. [] Para ilustrar que
somos conscientes de la arquitectura sonora, consideremos la posibilidad
de desplazar a los sonidos familiares a entornos desconocidos. [] En cada
espacio, incluso si las fuentes sonoras se mantuvieran sin cambios, se modificarn debido a la arquitectura aural. Cada espacio tiene una arquitectura
sonora.1

La arquitectura aural no es, como ya sealamos, el nico aspecto a tener en


cuenta cuando se utiliza un espacio pblico urbano para la creacin artstica.
El espacio pblico como espacio en principio no-artstico, arranca a la produccin musical de sus histricos recintos, que le garantizaban su autonoma
artstica, y la enfrenta a un dilogo complejo con una red simblica que
excede el campo del arte para llegar a lo sociopoltico. De todos modos estos
aspectos no sern analizados aqu ms que tangencialmente, para no salirnos
del marco general que plantea el presente libro.2
La ubicuidad del sonido promueve una problemtica particular y novedosa para la produccin musical y el arte sonoro para sitios especficos. Por
lo pronto, se trabaja en locaciones que no cuentan con estudios acsticos
previos, sino, a lo sumo, controles de polucin sonora.3 Tampoco existen
estudios sistemticos sobre el diseo de puestas sonoras que puedan explotar
al mximo el potencial acstico de un espacio determinado.4
1

Blesser y Salter ofrecen varios ejemplos de traslado de fuentes a contextos no habituales: escuchar en medio del desierto el sonido del trfico de una gran ciudad, escuchar una
orquesta sinfnica en medio de la selva, o ms simple, el cambio que se produce entre cantar
bajo la ducha, en el bao, y cantar en el living.
2 Sobre las diferentes corrientes del arte para sitios especficos, en particular norteamericanos, vase Kwon (2004). Sobre la relacin entre espacio pblico y sonido vase aa. vv.
(2005).
3 Mayoritariamente son de tipo cuantitativo. Un caso de anlisis cualitativo destacable es
se puede apreciar en Lpez Barrio y Carles (1997).
4 El programa Teatro acstico, de la Universidad Nacional de Quilmes, incluye un proyecto
denominado, precisamente, Innovacin en puesta sonora, que pretende sistematizar este
aspecto esencial de la produccin de nuevas performances complejas.

289

Por otra parte, los estudios realizados hasta el presente en torno de la


percepcin de la ubicacin espacial de fuentes sonoras estn lejos de poder
predecir lo que ocurrir en estos campos acsticos complejos (vase Basso,
???), en los que se suelen utilizar mltiples fuentes de emisin y zonas de
recepcin notablemente diferenciadas en sus cualidades.
Los primeros ensayos tericos para el campo de la creacin sonora para
sitios especficos se produjeron alrededor de las obras cercanas a las artes
visuales expandidas como las instalaciones sonoras. Desde el terreno musical,
a travs de escritos de compositores como Iannis Xenakis y Lloren Barber.

Pblico y fuentes sonoras


El compositor de origen griego y nacionalizado francs Iannis Xenakis (19222001) fue uno de los pioneros en la realizacin de obras multimedia por fuera
de la sala de concierto. Gracias a su doble condicin de msico y arquitecto,
se ocup de crear mbitos especficos para sus obras y otras realizadas en
colaboracin. Fue parte del proyecto del Pabelln Philips, una construccin
realizada para la Exposicin Universal de Bruselas de 1958. Xenakis tuvo a su
cargo la construccin del edificio, a partir de unos bocetos de su maestro Le
Corbusier, quien a su vez se hizo cargo de la realizacin visual, consistente en
una proyeccin de diapositivas y juegos lumnicos. En forma simultnea, ms
de un centenar de parlantes emitieron el Poema electrnico, obra electroacstica realizada por Edgard Varese.
Luego de esta experiencia inaugural Xenakis control l mismo todas las
variables de las performances, en una serie que denomin Polytopes, presentada en espacios de mediana escala hasta monumentales.5 En casos como el
Dyatope (1978), encargado para celebrar la inauguracin del Centro Georges
Pompidou de Pars, dise un espacio semipermanente en el parvis del museo
vanguardista, dentro del cual se presentaba una obra que combinaba el uso de
cientos de parlantes y rayos lser.
A partir de esta experiencia, Xenakis realiz un breve anlisis de las nuevas correlaciones que se establecen entre pblico, fuentes sonoras y espacios
acsticos (Xenakis, 2001).
5

Xenakis present estas obras en otras exposiciones internacionales, como las de Montreal
(1967) y Osaka (1970). En espacios al aire libre estren Perspolis en el Irn gobernado por
el Sha Reza Palevi (1971) y en Micenas en la Grecia que emerga de la dictadura (1978).
Tambin realiz un polytope en las termas romanas de Cluny, en Pars, en 1974. Sobre estas
obras, sus implicancias estticas y polticas, vase Harley (1998), pp. 55-65.

290

Xenakis distingue cinco grupos de cuestiones: la dimensin de la performance, las relaciones espacio-temporales, la naturaleza de las fuentes, el tipo
de receptculo (de espacio) y la tecnologa. Nos centraremos en el segundo
punto.
Xenakis plantea que se pueden dar al menos cinco tipo de relaciones
espacio-temporales entre el pblico y las fuentes, entendidas estas ltimas en
un sentido amplio.6
1. Las fuentes se encuentran delante del pblico de modo frontal. Se trata
de la tradicional situacin en teatros a la italiana.
2. Las fuentes se encuentran en el centro y el pblico las rodea. Esta
situacin, segn recuerda el propio Xenakis, se da en una arena, un ring, un
hipdromo, estadios. La sala de la Filarmnica de Berln, construida durante
la era Karajan, permite que el pblico rodee a la orquesta, incluso por detrs:
no es el mejor lugar para escuchar msica sinfnica, pero s para ver de frente
al director ubicado en el podio.
3. Las fuentes estn alrededor del pblico que se encuentra en el centro.
El dispositivo surround del cine y el home theater son la versin comercial de
un tipo de dispositivo utilizado en muchas instalaciones sonoras y en conciertos de msica electroacstica multicanal, que permiten la ubicacin y el
desplazamiento virtual de fuentes sonoras en el espacio. Las obras Persepphassa
para seis percusionistas del propio Xenakis, o Gruppen, para tres orquestas, de
Stockhausen, ofrecen este planteo con fuentes sonoras acsticas.
4. Las fuentes y el pblico se encuentran entremezcladas. Xenakis ofrece
como ejemplo un paseo por la ciudad, tradicin iniciada por el movimiento
canadiense de los Soundscapes7 (Murray Schaffer y Barry Truax, entre otros),
experiencia que tambin se llev a cabo en las calles de Montevideo, gracias
a la iniciativa de Daniel Maggiolo. Xenakis menciona sus obras Terretektorh y
Nomos Gamma, en las que msicos y pblicos comparten el mismo espacio.
5. Relacin lineal. Xenakis denomina de este modo a la situacin propia
de un desfile militar, procesin religiosa o el paso de una carrera de bicicletas.
En ellas, el pblico se encuentra inmvil a ambos lados de la acera, mientras
las fuentes sonoras atraviesan la calle. Eine Brise, del argentino Mauricio
Kagel, explora esta posibilidad. Se trata de una pieza para 111 ciclistas,
munidos de cornetas y timbres, que pasan raudamente delante del pblico,
emitiendo sonidos, silbidos y susurros.
Una sexta opcin es alguna posible combinacin entre las 5 mencionadas
anteriormente.
6
7

Que puede implicar tanto un instrumentista como un parlante, o un dispositivo lumnico.


En castellano, paisajes sonoros.

291

Como bien seala Xenakis, estas combinaciones no se ven alteradas


sustancialmente si las fuentes, el pblico, o ambos estn estticos o en movimiento. Sin embargo, es particularmente relevante para comprender no solo
el aspecto topolgico de la relacin entre fuente y pblico, sino el modo en
que el pblico en particular percibir la msica u obra de arte sonoro.
El estatismo o movimiento del espectador determinan modos de escucha
radicalmente diferentes y que deben considerarse al momento mismo de la
creacin. Para ampliar este aspecto, apelaremos al compositor cataln Lloren
Barber.

En movimiento
Por definicin, una obra sonora presentada en un espacio pblico plantea dos
problemas en torno a la situacin del pblico. El primero supone aceptar la
enorme divergencia perceptiva que habr de la obra, segn los mltiples puntos de escucha del espacio seleccionado para su presentacin. Mientras que las
salas de concierto tienden idealmente a buscar una escucha similar, sin importar la ubicacin del pblico, el espacio pblico, no pensado para la difusin
sonora artstica, se impone en su diversidad como campo complejo.
La composicin de msica para ciudades, como las que viene desarrollando Lloren Barber (Espaa, 1948), impone una renuncia al control sobre
las infinidad de variables que ponen en juego espacios acsticos complejos y
pblicos dispersos en l. Estas obras proponen un dilema, un juego de bsqueda detectivesca, en palabras del propio compositor cataln. Dnde debe
ubicarse el pblico? Debe quedarse quieto o deambular? La segunda cuestin
es radicalmente innovadora respecto de la situacin de concierto tradicional,
en el que la escucha est asociada a la contemplacin esttica.
Barber ocupa un lugar destacado en el campo de la produccin musical
en espacios pblicos. Con sus conciertos de ciudades se propone generar
hechos artsticos valindose de las fuentes sonoras naturales (i.e., sin mediacin de la amplificacin) con que se encuentre en cada ciudad o pueblo donde
es convocado. Particularmente fructfera le ha resultado la frecuente presencia
de campanarios en los centros urbanos a los que ha acudido. Tambin ha
incluido bandas de pueblo, fuegos de artificio, y bocinas antiareas y de buques
cuando as lo ha podido.
Barber define a este tipo de obras como msica plurifocal: Multiplicidad
de focos sonoros que participan en cada concierto: tantos campanarios o
grupos instrumentales como existan en cada ciudad (Lopez Cano, 1997). La
consecuencia para la composicin es que se tiene una disposicin casual de
292

los focos sonoros. Esto requiere un estudio urbano acstico del campus snico:
disposicin y morfologa de plazas, calles, avenidas, altura general de los edificios que puedan interferir el desplazamiento del sonido.
La dimensin de estos conciertos vara de escala notablemente. Pueden
transcurrir en una plaza de toros como en su Alberomundo en Alicante; en
torno a un grupo de manzanas del casco histrico de ciudades tan dismiles en
su traza como Madrid, Buenos Aires, Pollenza o Alcal, hasta un valle, como
el de Innsbruck, que rene un conjunto de pueblos vecinos entre s, pero distantes a kilmetros unos de otros.
La escala de las performances puede proponer al espectador, segn Barber,
tres tipos de audicin: esttica: el pblico sube a techos o balcones o se aposta
en los cruces de calles; panormica: el pblico sale del casco urbano donde se
realiza el concierto para subir a montaas, colinas o miradores panormicos
de las carreteras; y peripattica: el pblico deambula por las calles de la ciudad,
atiende los ecos y rebotes, se sumerge en los tubos sonoros en que se convierten algunas calles estrechas.
La ubicacin de cada escucha, as como el tipo de audicin que este elija,
reorganiza por completo, una y otra vez, la estructura espacial de la obra.8

Zonas de audicin
La categorizacin de Barber aporta el reconocimiento de un elemento que es
nuevo para la recepcin de la msica, como lo es el de una escucha mvil,
por parte de los espectadores. Esto implica una situacin dinmica durante
el transcurso de una obra musical o sonora, que escapa al control de su o sus
creadores. Siguiendo los trminos de Barber, un espectador puede, en forma
sucesiva, adoptar escuchas estticas, focalizadas o panormicas. De este modo,
la versin final de una obra depender del recorrido que trace el espectador.
El compositor slo podr, en todo caso, estudiar como hiptesis esos posibles
caminos durante el proceso de composicin.
Naturalmente, este tipo de configuraciones se imponen como un nuevo
tema a la hora de la creacin misma de las obras: en las instalaciones en
espacios pblicos y en particular aquellos realizados al aire libre, se debe pensar en un tipo de espectador en una actitud activa, que determina y define
mltiples puntos de escucha posibles en el tiempo. Y, por lo tanto, mltiples
versiones finales de la obra. El compositor deber asumir la imposibilidad
de controlar cmo ser la audicin de la obra en cada uno de los mltiples
8

Lpez Cano (1997, p. 137).

293

puntos de escucha. Por el contrario, en la sala de concierto, se piensa en una


zona restringida de audicin ideal para lograr trayectorias sonoras de mayor
refinamiento y precisin.
Por otra parte, una sala de conciertos separa la obra de la realidad de
una manera tajante, pero esa frontera no existe al aire libre. En espacios abiertos se produce una zona de transicin (que puede abarcar unos pocos metros
hasta varias cuadras) en la que el espectador va sumergindose paulatinamente en la intervencin sonora, que se mezcla con el paisaje sonoro propio del
lugar. Aqu el tipo de materia sonora utilizada en las obras ser determinante
para producir una separacin tajante con el entorno acstico cotidiano. O,
por el contrario, producir una mimesis con l. Tambin es determinante, y de
un modo no menor, el grado de preaviso del espectador o potencial espectador, respecto de la ocurrencia de performance.
La ausencia de lmites en este tipo de obras genera, creemos, un nuevo
tpico a tener en cuenta en el proceso de composicin: se trata de la clasificacin y posterior estudio de diferentes zonas de audicin. El compositor deber
hacer una cartografa de las mismas y establecer qu tipo de correlaciones se
podrn estableces entre las fuentes sonoras y el pblico.
Los lmites de cada zona de audicin sern claros o difusos, dependiendo
del tipo de arquitectura aural involucrada en cada caso.
En principio, mencionaremos cuatro tipos de zonas de audicin: 1) ideal;
2) de transicin o intercambio; 3) residuales, o no previstas; y 4) neutras/no
artsticas.
Se entiende por zona ideal a aquella en la cual el compositor o artista
sonoro tiene un control lo ms eficiente posible sobre las variables en juego
en materia de emisin y recepcin de la informacin sonora. Esta zona se
corresponde, en principio, con la zona de audicin dentro de una sala de
conciertos tradicional.
La zona de transicin o intercambio es aquella en la que la energa sonora
de la obra, instalacin o performance compite o dialoga con el caudal propio
del espacio a ser intervenido. Se trata de una zona que puede ser particularmente mvil y dinmica, ya que depende de las relaciones de energa entre
ambos. En espacios abiertos, la transicin puede abarcar desde unos pocos
metros hasta varias cuadras, en las que el espectador va sumergindose paulatinamente en la obra sonora.
Las caractersticas de este trnsito (un crossfade a escala natural) se modificarn segn el tipo de materia sonora involucrado, tanto de la intervencin
como del paisaje circundante, como as tambin del grado de preaviso del
espectador o potencial espectador.
Si la intervencin se nutre de sonidos similares a los del paisaje sonoro
294

circundante, se puede producir una total mimetizacin, lo que llevara a una


especie de suma cero, una paradoja cageana. Tambin puede crear espejismos sonoros, como los de escuchar una Plaza de Mayo repleta de gente,
cuando se trata en verdad de una reproduccin amplificada.
Las zonas residuales pueden ocurrir en algunos espacios pblicos abiertos a los que llega la informacin sonora de un modo particularmente transformado o disociado de la accin visual que lo provoc. Citamos como ejemplo
el caso de la performance que con el grupo Buenos Aires Sonora realizamos
en la zona de Puerto Madero, en la ciudad de Buenos Aires. La performance
consisti en la transformacin del Puente de la Mujer, un puente peatonal
diseado por el arquitecto valenciano Santiago Calatrava, en un instrumento
musical. Por las dimensiones del lugar, y para reforzar la asociacin entre la
zona en la que se generaban las seales acsticas y el sistema de amplificacin,
se decidi girar el puente de modo tal de ubicarlo en forma paralela a uno de
los malecones, donde estara ubicado el pblico. En esa direccin se ubicaron
todas las columnas de sonido disponibles, que estaban sobre el mismo puente.
Hacia la otra orilla, lo que se escuch fue la seal que se reflejaba en unos
silos de la ribera opuesta y la pared de piedra del malecn. La seal sonora
haca un recorrido lo suficientemente extenso como para que se disociara de
la seal visual de la accin musical, adems de modificar notablemente la
calidad espectral del audio (haba, por caso, fragmentos en los que se emitan
voces cuya inteligibilidad se perda por completo).
Las zonas ciegas, neutras o no artsticas son aquellas en las que la
instalacin sonora o performance, por efecto de la distancia o algn tipo de
elemento corpreo, no se escucha, aunque pueda llegar a ser visible. En el caso
de espacios abiertos esto puede ocurrir, por ejemplo, en el caso de que haya
viento con una velocidad suficiente como para desviar la propagacin lineal
de la seal acstica.
En la mayora de las obras en espacios no tradicionales conviven estas zonas
de un modo dinmico y dependiente del tipo de arquitectura aural presente.
Veamos algunos ejemplos. En la instalacin Mayo, los sonidos de la plaza9
se dispuso un crculo octofnico de parlantes en el centro de la Plaza de Mayo
de Buenos Aires, cuyo dimetro era de alrededor de 70 metros. Esta configuracin supona contar con una zona de escucha ideal, en la que no solo se
podan superponer mltiples fuentes sonoras gracias a la cantidad de salidas
9

Produccin del grupo Buenos Aires Sonora, fue comisionada por la Ciudad de Buenos
Aires para el ao del casco histrico, 2003. Tiene una duracin de 64 minutos. Se estren
en la Plaza de Mayo el 5 de julio de 2003, y se volvi a presentar el 9 y el 16 de septiembre
de 2006. Ms informacin sobre esta obra en : <www.buenosairessonora.blogspot.com>

295

independientes, sino tambin trabajar el espacio acstico en forma integrada


virtual, como en el sistema surround propio del cine.
No se trat de una eleccin meramente tcnica sino esttica. Para la obra
se pretenda lograr un efecto inmersivo en el espectador, el que, por ejemplo,
deba, a travs del sonido, sentirse dentro de una de las tantas manifestaciones
masivas ocurridas en la historia de la plaza principal de la vida poltica argentina, mientras escuchaba, proviniendo del balcn de la Casa de Gobierno, los
discursos de los diferentes dirigentes que all hablaron.
De todos modos, debido a la energa sonora involucrada y a la falta de
lmites arquitectnicos, los sonidos de la obra se podan percibir con claridad
en toda la plaza. Y, segn las variantes producidas en el trfico circundante
(no se cortaron las calles aledaas durante la performance) la obra poda percibirse hasta dos o tres cuadras a la redonda. En ese lmite, la conciencia sobre
el hecho artstico dependa totalmente de la informacin previa que tuviera el
transente: si se trataba de un paseante ocasional y desinformado, la informacin acstica que reciba poda, por ejemplo, llevarlo a la conclusin de que
en la Plaza de Mayo estaba ocurriendo una manifestacin poltica real, y no la
recreacin que propona la obra.
El viernes 18 de octubre de 2002, entre las 19.30 y las 21, el compositor
Nicols Varchausky realiz una intervencin sonora de la Torre Monumental
(ex Torre de los ingleses), en Retiro, Buenos Aires.
En el da y la hora de mayor movimiento de personas y vehculos que
tiene esa zona de la ciudad, el tradicional reloj se transformara, segn
Varchausky en un atalaya sonoro [...] que duplicar, restituir y sealar los
sonidos que ocurren en la realidad.10
Para lograrlo, el compositor ubic cuatro columnas de sonido en sendas
ventanas ubicadas en cada una de las cuatro caras del monumento, a aproximadamente 15 metros de altura. Para cada cara-parlante de la torre, Varchausky
asign diferentes materiales sonoros, tomados de la ciudad, en los que la voz
es la protagonista. As, la cara oeste, que apunta hacia la avenida Figueroa
Alcorta y la barranca de Retiro, recibi en forma directa la grabacin de un
pastor evangelista que suele predicar en la plaza Once. En la cara sur, que da
al hotel Sheraton, se escucharon las comunicaciones de la onda de radio de
las policas Bonaerense y Federal. Hacia el Este, zona de Aduana y portuaria,
reprodujo grabaciones de diversos msicos callejeros de la calle Florida.
Como los parlantes no eran visibles, se generaba una zona de confusin:
las voces que se escuchaban correspondan a un aqu y ahora (particularmente con la grabacin correspondiente al predicador evangelista), pero
10

Entrevista a Nicols Varchausky, La Nacin, suplemento Espectculos. 18/10/2002.

296

no se poda identificar con precisin el lugar de donde provenan. Esta


performance permiti comprobar una vez ms que las caractersticas de la
zona de transicin, esa que va de lo real a la obra, dependen no solo
del tipo de materia sonora involucrada (tanto de la intervencin como del
paisaje circundante), como as tambin del grado de preaviso del espectador
o potencial espectador.
En Ser Buenos Aires, el concierto citadino presentado por Barber en el
casco histrico de la ciudad de Buenos Aires, la difusin previa de carcter
masivo jug un rol decisivo para, a la vez, convocar y prevenir a los paseantes
sobre la situacin performtica. Una vez ms la zona de transicin tuvo una
ubicacin y tamao diferente en funcin del preaviso o no del espectador. Es
una cuestin problemtica y no menor: se trata de que el pblico se tope con
la obra o que sea convocado?
Hay que recordar que la ocupacin del espacio pblico, aunque sea acotada en el tiempo es una tentacin para el mundo poltico. Como seala Omar
Corrado, quien particip de la experiencia como uno de los campaneros de
la obra de Barber:
Todo parece al fin igualarse en el carrusel de fatigados megaeventos pretendidamente culturales que alimentan el marketing poltico. Nos esforzamos
por otorgarnos una comprensin del concierto que reponga su caudal de sentido. Nos decimos entonces que lo que aqu se ofrece es una interpelacin
sonora que desbanca la hegemona de lo visual, tiene la fragilidad y la sutileza de lo efmero; apropirselo es aceptar perderse, naufragar, reconquistar
un lugar degradado, negado, usurpado. As, en la experiencia que no pasa sin
dejar huellas, los pblicos resignifican los hechos a la medida de sus aspiraciones y necesidades [...] divergentes de la intencionalidad del poder.

Barber es consciente de esta dualidad y, al respecto, prefiere valerse de los


medios masivos y del poder poltico para que sus espectculos lleguen a la
mayor cantidad de personas y no interpelar a espectadores casuales.

Conclusiones
Espacio, fuentes sonoras y pblico reconfiguran su interrelacin en forma
dinmica cuando se trata de obras musicales o de arte sonoro pensadas para
sitios especficos, por fuera de las tradicionales salas de conciertos. Esa situacin dinmica modifica radicalmente el proceso de composicin, y la constitucin final de la obra pierde su clausura.
297

La composicin debe incluir desde su gnesis un estudio de la arquitectura


aural del espacio a ser intervenido, ya que desconocerlo puede llevar al fracaso
de la obra misma en lo que hace a su difusin y su recepcin. El compositor
tambin debe renunciar a la idea de obra cerrada y bajo control.
La obra pierde casi inevitablemente su antiguo estatuto de existencia
como un todo orgnico y cerrado, para dar paso a una constelacin de
posibles versiones finales que estn representadas por las trayectorias y ubicaciones de cada uno de los espectadores.
El pblico es interpelado por las obras en espacios no tradicionales. Puede
continuar con el viejo hbito de la escucha esttica, pero ya nadie asegura un
lugar ideal de escucha. En muchos casos, adems, las obras invitan a un tipo
de audicin peripattica, que fomenta recorridos individuales y activos en
la construccin de sentido alrededor de la obra percibida.
Por ltimo se debe recordar que todas estas nuevas situaciones nada dicen
sobre el resultado sonoro de las obras en s: mientras que Xenakis prefiere, por
ejemplo, configuraciones texturales de tipo estadsticos, como los trabajos con
clusters, nubes de sonido, etc., Barber apela a herramientas tcnicas provenientes del minimalismo para construir sus obras. La repeticin de elementos
simples no es tan solo una cuestin operativa, esto es, de practicidad para
hacer sonar su msica plurifocal. Tambin es para Barber un comentario al
aire libre sobre su idea de una msica no narrativa. Dice Corrado sobre Ser
Buenos Aires, la versin portea de su concierto de ciudad: El fluir sonoro se
organiza en la sucesin de un nmero reducido de morfologas de base, que
reaparecen, con distintas modificaciones, en distinto orden, para sealizar
el transcurrir.11 Estos materiales son recurrentes a lo largo de la obra, estas
morfologas se encuentran fuertemente estructuradas en su textura, duracin
y relacin de stas con el espacio. La consecuencia es una msica no discursiva, hecha de bloques estticos, en la que se perciben los ecos del pensamiento
temporal de Satie, Cage y el minimalismo.12 Esta opcin, sin embargo es
producto de una eleccin esttica, que no es la nica posible, aun dentro del
mismo dispositivo por l propuesto.
En el caso de la intervencin de Nicols Varchausky hay un espritu
duchampiano en su decisin de no manipular las grabaciones emitidas en cada
cara de la torre de los ingleses. Prefiere hacer foco en el objeto en s mismo,
ayudar a dirigir una mirada, que comentar desde el montaje dicho material.
Por el contrario, en la intervencin de la Plaza de Mayo hay una idea de dilogo con el relato histrico-poltico disparado desde los documentos sonoros
11
12

Corrado (2001).
Corrado (2001).

298

histricos. Una vez ms, se trata de decisiones basadas en premisas estticas


diferentes, que resuelven, sin embargo, problemas comunes: el del dilogo
entre fuentes sonoras, pblico y arquitectura aural.

Bibliografa
aa. vv. (2005), Espacios sonoros, tecnopoltica y vida cotidiana. Aproximaciones
a una antropologa sonora, Barcelona, publicacin del Festival Zeppelin
2005.
Blesser, B. y L. R. Salter (2006), Spaces Speak, Are You Listening?: Experiencing
Aural Architecture, Massachusets, mit Press.
Corrado, Omar (2001), Glosas desde mi espadaa, indito.
Harley, A. M. (1998), Music of Sound and Light: Xenakis Polytopes,
Leonardo, vol. 31, N 1, pp. 55-65.
Kwon, M. (2004), One place after another. Site-specific art and locational identity,
Massachussets, mit Press.
Lpez Barrio, I. y J. L. Carles (1997), La calidad sonora de Valencia: espacios
sonoros representativos, Valencia , Fundaci Bancaixa.
Lpez Cano, R. (1997), Msica plurifocal: conciertos de ciudades de Lloren
Barber, Mxico, jgh
Varchausky, N. (2002), entrevista publicada en La Nacin, 18 de octubre.
Xenakis, I. (2001), Espaces et sources daudition et de spectacles, en Solomos,
M. (ed.), Prsences de Iannis Xenakis, Paris, Centre de Documentation de
la Musique Contemporaine.

299

Captulo xii
Espacio y materia, de lo auditivo a lo corporal.
Apuntes sobre la composicin de uom y Entanglement
Juan Pampin

Introduccin
La relacin entre espacio y materia sonora ha sido una de las problemticas
centrales de mi trabajo compositivo. Fue desde el interior del sonido, desde sus
intersticios, explorando esas micro-relaciones o micro-espacios, que comenc
a vislumbrar los vestigios de una nueva potica espacial. La investigacin de
las cualidades espectrales del sonido, que empec a realizar ms sistemticamente a mediados de la dcada de 1990, fue el comienzo de este camino, y el
ciclo para percusin y sonidos electrnicos compuesto entre los aos 1996 y
2000, el laboratorio para su realizacin.1 Surgi de la composicin de este ciclo
de obras un marco esttico con cimientos tecnolgicos en el anlisis espectral
y las tcnicas espaciales Ambisonics2 que sirvi de sustrato para la realizacin
de otros proyectos, como uom (2001) para sonidos electrnicos 3D, que es
analizada desde una perspectiva esttica y tecnolgica en este captulo. Este
marco terico y esttico abri tambin las puertas a la exploracin de nuevos
territorios artsticos, donde el trabajo con el sonido y el espacio exceden el
campo de la msica y se proyectan hacia lo que podramos denominar arte
sonoro.3 Parte de mi trabajo en este campo ha estado ligado a la extensin
del sonido ms all de los lmites de la audicin, transformando la experiencia
sonora en algo fsico, yendo desde lo auditivo hacia lo corporal. La segunda
parte de este captulo est dedicada a Entanglement (2008), una instalacin
sonora telemtica que es el resultado ms reciente de esta exploracin.
1

El ciclo est compuesto por las obras Mtal Hurlant (1996), Toco madera (1997), Skin
Heads (1998) y On Space (2000). Una nueva versin de On Space fue realizada en 2005
para la grabacin del ciclo por el ensamble de percusin Les Percussions de Strasbourg, en
Estrasburgo, en enero de 2006.
2 Para una presentacin detallada de Ambisonics, vase el captulo v de este libro.
3 La definicin de arte sonoro es problemtica, en particular en su relacin con la msica.
Este tpico excede el marco de este libro; para una introduccin al tema se sugiere la lectura
de LaBelle (2006).

301

uom
Mientras el ciclo de percusin indagaba en la relacin material entre instrumentos y sonidos electrnicos, y su articulacin con el espacio,4 uom
(2001) para sonidos electrnicos 3D se enfoca en la problemtica espacial
desde la perspectiva de la materia sonora electroacstica en su estado puro
y su relacin con el espacio fsico que la articula. Compuesta especialmente
para una fbrica metalrgica,5 uom establece tambin desde su mismo ttulo una relacin poltica con el espacio de su ejecucin, con el cual resuena
semntica y materialmente. Su ttulo, uom, refiere tanto al acrnimo del
sindicato de obreros metalrgicos de Argentina (Unin Obrera Metalrgica)
como a la onomatopeya en la que esta sigla se ha constituido para mucha
gente, con una prdida casi total de su sentido histrico y poltico (de ah
la eliminacin en el ttulo de los puntos que designan sus iniciales). La obra
explora de manera alegrica el sonido del metal, usando muestras digitales
de este material desplegadas en el espacio en forma granular como representacin de lo metlico sin masa, apelando a su esencia sonora pura, no
contaminada.6 La distancia entre lo representado y su representacin, de
alguna manera similar a la existente entre los trabajadores metalrgicos y su
gremio, constituye el ncleo semntico de la obra, que se completa con el
uso del texto del captulo 10 de Quin mat a Rosendo? de Rodolfo Walsh,7
que narra el asesinato del dirigente de la uom, Rosendo Garca, a manos de
gngsters de su propio gremio, en medio de una pelea con militantes de base
del sindicato en 1966.8
4

Para un anlisis de este ciclo de obras, y en especial de On Space, vase Di Liscia (2005).
fue compuesta para la fbrica metalrgica impa de Buenos Aires, y fue parte de La
estrella federal, concierto elctroacstico presentado en ese espacio junto al compositor
Nicols Varchausky en septiembre de 2001.
6 Lo puro aqu se refiere ms a la condicin acusmtica del material sonoro que a un purismo
estilstico. Como se ver ms adelante, esta distincin es importante puesto que el material
de la obra alude, alegricamente, a la imposibilidad de hallar dicha condicin de pureza en
la poltica, la cual parece reclamar siempre un grado de contaminacin en su praxis.
7 Este captulo del libro fue elegido no solo por ser el nudo de la narracin de los hechos
que hace Walsh, donde describe las acciones posteriores al asesinato de Rosendo Garca,
sino tambin por sus mltiples alusiones al sonido. Por ejemplo, Walsh dice que tras caer al
piso derribado por un disparo, Rosendo oy el resto de los tiros que zumbaban sobre l, y
ms tarde, cuando ces el tiroteo, lo rode el tropel de pasos fugitivos. Tambin podramos imaginar a Rosendo oyendo claramente la direccin del balazo que lo derrumb y as
preguntarse quin a su espalda, qu cuenta arreglada. Si bien ninguna de estas referencias
sonoras fueron usadas de manera explcita en uom, s permitieron imaginar el paisaje sonoro
de la masacre, aludido en forma potica en el final de la obra.
8 Hecho jams esclarecido por la polica argentina e investigado a fondo por el propio
5 uom

302

Especificidad
Si bien uom puede ser considerada una obra autnoma, que puede ejecutarse
en cualquier entorno sin dejar de funcionar musicalmente, es indudable que
su construccin en funcin de un espacio especfico marc su materialidad
y arquitectura musical. Su versin original, estrenada en la fbrica metalrgica impa de Buenos Aires, fue creada para resonar de manera simblica
y sonora con ese espacio fabril. Con este propsito en mente, di forma a un
material que pudiera desplegarse al interior del espacio de la fbrica de manera
parasitaria, aprovechando al mximo sus cualidades simblicas y acsticas,
apelando a las mltiples conexiones semnticas que el oyente pudiera realizar
inmerso en ese sonido en ese lugar.9 El uso de un dispositivo electroacstico
Ambisonics dio soporte a esta estrategia, permitiendo crear un entorno sonoro
inmersivo dentro de la fbrica y la ilusin de que dichos sonidos pertenecan
a su paisaje sonoro.10 Otro aspecto de la obra relacionado con su especificidad
de sitio es la referencia a la uom y a su historial poltico a partir de la cita del
libro de Walsh, que en el contexto poltico y social en que la obra fue presentada (septiembre de 2001) apuntaba claramente a la crisis de representacin
poltica del gobierno de la Alianza, y a la vez a un problema central de la
democracia argentina posdictadura. De algn modo, uom como sonido, como
onomatopeya, funcion como pre-eco trgico del estallido por venir.11

Walsh, en el que tambin murieron Domingo Blajaquis y Juan Zalazar, militantes de base
de la uom de Avellaneda.
9 El siguiente pasaje de la crtica de uom que Federico Monjeau escribi para el diario Clarn
apunta a este efecto simblico que plantea la obra: La obra de Pampin trabaja con un material que hoy tambin resulta dramticamente referencial: un sonido de fundicin, que crece
y se hace progresivamente ms complejo [...] En trminos concretos (en el extenso sentido
de esta palabra) dicho sonido no es ms que una sntesis digital que nada tiene que ver con
el sonido de una fundicin, pero que al resonar en el espacio de la fbrica parece volverse
dramticamente referencial. La versin completa de la crtica de Monjeau puede hallarse
en el archivo digital del diario Clarn, <http://www.clarin.com/diario/2001/09/07/c-00601.
htm>.
10 Esta estrategia fue reforzada tambin por la localizacin del espacio del concierto dentro
de la fbrica, que forzaba a los oyentes a subir en un montacargas y atravesar las instalaciones, rodeados de maquinarias y pilas de metal, antes de escuchar la obra.
11 Fueron mltiples e inesperadas las reacciones que gener este aspecto de la obra, incluyendo la reedicin de debates polticos al interior de la uom (en particular respecto del rol
de Augusto Vandor en el asesinato de Rosendo Garca) que generaron una fuerte tensin
entre la conduccin poltica de impa y los artistas, que casi resulta en la cancelacin de los
conciertos. Por obvias razones de pertinencia y espacio me abstengo de allanarme aqu en
esta dimensin de la obra que probablemente demandara un artculo en s misma.

303

Dispositivo
La figura 1 muestra el dispositivo electroacstico usado para difundir uom;12
los parlantes aparecen nombrados por su ubicacin en referencia a puntos
cardinales, los tringulos en el centro del dispositivo representan la ubicacin
del pblico, dividido en cuatro grupos de nueve asientos cada uno apuntando
a un punto cardinal distinto (n, s, e, o). Desde una perspectiva ambisnica,
este dispositivo funciona como dos sistemas bidimensionales imbricados, uno
formado por los parlantes no, ne, se, y so, y otro por los parlantes n, s, e, o,
estos ltimos elevados a unos cuatro metros del piso.

0
30

330

60

300

90

270

120

240

150

210
180

Figura 1. Planta del dispositivo de difusin de uom

12

El dispositivo electroacstico usado para difundir uom fue consensuado con el compositor Nicols Varchausky, quien en principio propuso una disposicin en estrella de ocho
parlantes para su obra La Bonaerense/La Federal, que junto con uom conform el concierto
La estrella federal (ttulo que haca referencia a esta disposicin de parlantes). La propuesta original de Varchausky fue modificada levemente para adaptarse a la reproduccin
Ambisonics de uom, que requiere una distribucin homognea de las fuentes sonoras. Esta
modificacin tambin ayud a resolver algunos problemas de efecto de precedencia del
arreglo original.

304

Estos dos sistemas de parlantes funcionan de forma independiente, cada uno


de ellos con ecuaciones de decodificacin adaptadas a su morfologa.13 Esta
caracterstica del dispositivo, con dos sistemas bidimensionales en lugar de
uno tridimensional, plantea un problema para la localizacin de sonidos con
ngulos de elevacin intermedios (entre ambos sistemas), puesto que la seal
Z no pudo ser usada en la codificacin en formato B.14 Para resolver este problema, fue necesario desarrollar ecuaciones de codificacin modificadas que
tuvieran en cuenta el ngulo de elevacin de los sonidos; este es el sistema de
ecuaciones utilizado para la codificacin:
1
2
X l = s cos( 2) cos()
Yl = s cos( 2) sin()

Wl = s cos( 2)

1
2
X u = s sin( 2) cos()
Yu = s sin( 2) sin()

Wu = s sin( 2)

donde W1, X1, Y1 y Wu, Xu, Yu son las seales de formato B correspondientes a
los sistemas bidimensionales de parlantes, inferior y superior respectivamente;
s es la seal mono a codificar, el ngulo de azimut (0 a 360 grados), y el
coeficiente de elevacin (0 a 1). Ntese que para un valor de de 0 las seales
del sistema superior seran eliminadas, utilizando el sistema inferior ecuaciones estndar de codificacin en dos dimensiones. Un valor de de 1 derivara
en la situacin opuesta, con el sistema inferior eliminado y el superior utilizando ecuaciones estndar de codificacin bidimensional. Con valores de
entre estos lmites, la energa de la seal a codificar sera repartida entre
ambos sistemas, codificando la fuente con igual intensidad en ambos sistemas
con un valor de de 0.5. Durante la difusin de la obra, cada una de las seales de formato B es decodificada para su arreglo de parlantes correspondiente
usando matrices de decodificacin estndar:15
13

Esto se debe a que no forman un poliedro Ambisonics estndar, que hubiese requerido
una distribucin cbica de los parlantes.
14 Para una presentacin en detalle de la codificacin Ambisonics en formato B, vase el
captulo v de este libro.
15 Para una presentacin en detalle de la decodificacin Ambisonics de primer orden, vase
el captulo v de este libro.

305

L =

1
1
1
1

1
2
1

2
1

2
1
2

1
2
1
2
1

2
1

1 1 0

1 0 1
U =
1 1 0

1 0 1

La matriz L contiene los coeficientes de decodificacin del arreglo de parlantes inferior, las columnas corresponden a los escaladores de las seales W, X,
e Y del formato B bidimensional, y las filas a los parlantes no, so, se, y ne
respectivamente. La matriz U contiene los coeficientes de decodificacin para
el arreglo de parlantes superior (n, o, s, y e).
Otra caracterstica importante de este dispositivo es la distribucin de
los asientos evitando un frente o escenario, reforzando el efecto de inmersin buscado para la obra. Esta disposicin del pblico, con cuatro grupos de
asientos apuntando cada uno a un punto cardinal distinto, facilita tambin
la escucha estereofnica puesto que la mayor parte de los oyentes se encuentra enfrentado a un grupo de dos parlantes del sistema inferior. Si bien esta
afirmacin parece contradecir la premisa de evitar una escucha frontal, en
la prctica sucede lo contrario, puesto que esta disposicin mejora notablemente la estabilidad de la imagen sonora y por consiguiente la ilusin de
inmersin.16
Espacio y materia
El material sonoro de uom es mayormente sinttico, con la excepcin de
algunos sonidos que aparecen hacia el final de la obra y que provienen del
procesamiento de grabaciones realizadas con un micrfono Ambisonics.17 La
composicin fue realizada por estratos espectrales a partir de la resntesis y

16 Podramos agregar que por ms que trabajemos con un sistema Ambisonics, los parmetros

perceptivos de escucha de los oyentes seguirn siendo estereofnicos, y por consiguiente una
buena decodificacin depender en gran medida de la creacin de una imagen estereofnica
estable, sin la que sera muy difcil crear la ilusin de inmersin. Para una presentacin en
detalle de tcnicas estereofnicas, vase el captulo iv de este libro.
17 El micrfono utilizado para estas grabaciones fue un Soundfield ST250. Para ms informacin acerca de los micrfonos Soundfield, vase el captulo v de este libro.

306

granulacin de un sonido de cualidades sonoras metlicas.18 El rango audible


de frecuencia fue dividido en 25 bandas correspondientes a las bandas crticas
de audicin o la escala Bark,19 el sonido sinttico fue procesado en forma individual en cada banda usando un sistema de granulacin en el cual cada grano
es codificado en formato B en forma independiente.20 La dispersin angular de
cada banda espectral fue controlada con un sistema de distribuciones estadsticas, que permiti dar forma espacial a los flujos granulares concentrndolos en
ciertos puntos del espacio o esparcindolos de manera difusa. El diagrama de
bloques de la figura 2 muestra un canal del sistema de sntesis y espacializacin
usado en la obra.

Figura 2. Sistema de sntesis y espacializacin usado en uom

18

La fuente de la mayor parte de estos sonidos sintticos fue el anlisis espectral realizado
con el programa ats (Pampin, 2004) de un sonido de gong proveniente de mi obra para
percusin y sonidos electrnicos Mtal Hurlant (vase Di Liscia, 2005).
19 El sistema de anlisis ats, utilizado para la obra, est basado en este modelo psicoacstico.
Una presentacin detallada de este sistema de anlisis puede verse en Pampin (2004). La
escala Bark y su relacin a las bandas crticas fue introducida por E. Zwicker (1961). Una presentacin ms detallada y profunda de este tema puede hallarse en Zwicker y Fastl (1990).
20 Este procedimento es similar al utilizado en la seccin North de On Space, la cual fue
compuesta a partir de un material metlico muy similar al del comienzo de uom; la principal
diferencia es que mientras que en On Space el procedimiento de espacializacin est basado
en un pricipio de transfomacin de la seal Ambisonics de formato B (vase Dominancia en
el captulo v de este libro), en uom la espacializacin fue realizada durante la codificacin
misma de cada grano, generando texturas de mucha mayor densidad. Para una presentacin
del sistema de espacializacin usado para On Space vase Di Liscia (2005).

307

La primera mitad de la obra presenta una construccin por capas usando este
sistema, en la cual sucesivos estratos espectrales van cubriendo gradualmente el
espacio hasta esparcirse en todas direcciones a la manera de una niebla granular.
La figura 3 muestra diagramas polares de dispersin angular correspondientes a
cuatro momentos de la primera parte de la obra. La figura 3a, correspondiente
al comienzo, muestra un estrato que conforma una distribucin espacial de tipo
hipercardioide apuntando hacia el Norte (0 grados). Espectralmente, este estrato est constituido por bandas de frecuencia de 16 a 20 Bark (cubriendo algo
ms que una octava de 3.150 Hz a 7.700 Hz).21 La figura 3b, correspondiente
a dos minutos de la obra, muestra un incremento en la dispersin angular del
estrato anterior (A), que describe ahora una distribucin espacial de tipo cardioide rotada 60 grados hacia el Este (300 grados en el diagrama polar). El eje
central de la distribucin angular de este estrato (A) es usado como referencia
para la generacin de nuevos estratos. En este grfico pueden verse diagramas
polares correspondientes a otros dos nuevos estratos: B, con bandas espectrales
de 14 a 15 Bark (2.320 Hz a 3.150 Hz), y C, con bandas espectrales de 21 a 22
Bark (7.700 Hz a 12.000 Hz). Ambos estratos presentan distribuciones espaciales hiper-cardioides ubicadas a 45 grados respecto del eje de referencia (estrato
A). La figura 3c, correspondiente a cuatro minutos de la obra, muestra las distribuciones espaciales de cinco estratos, puede verse que los estratos presentes en
el diagrama anterior (A, B y C) continan aumentando su dispersin angular y
rotando en sentido contrario a las agujas del reloj (el eje de referencia, estrato
A, se encuentra ahora en 240 grados), se agregan a ellos dos nuevos estratos:
D, con bandas espectrales de 9 a 13 Bark (1.080 Hz a 2.320 Hz), y E, con una
banda espectral correspondiente a 23 Bark (12.000 Hz a 15.500 Hz); ambos
estratos conforman distribuciones espaciales hiper-cardioides a 135 grados
respecto del eje de referencia (estrato A). La figura 3d muestra el estado de las
distribuciones espaciales de los distintos estratos hacia el final de la primera
parte de la obra (seis minutos); puede verse que la dispersin angular ha llegado
a su mayor punto en el estrato A, cubriendo casi por completo la circunferencia
espacial, y describiendo un patrn cuasi omnidireccional. Aparecen en este
grfico dos nuevos estratos: F y G con bandas espectrales de 8 Bark (920 Hz a
1.080 Hz) y 24 Bark (15.500 Hz a 20 KHz) respectivamente, ambos describen
distribuciones espaciales hiper-cardioides a 135 grados respecto del eje de referencia (que se encuentra ahora en 180 grados). Estos siete estratos abarcan un
total de diecisis bandas crticas (cerca de cuatro octavas y media). A la par de
este proceso, en el cual los diversos estratos espectrales van revelndose gradual21

Ntese que los valores en Bark indican la frecuencia central de las bandas crticas en
cuestin, y los valores en Hertz su ancho de banda.

308

mente y ocupando el espacio, cada uno de ellos sigue una evolucin temporal
diferente, consistente en cambios lentos (no lineales) de amplitud y densidad
granular. Perceptivamente, esta evolucin temporal insina la cadencia de una
respiracin, donde los cambios que suceden en el interior del sonido se reflejan
en su superficie como paulatinos cambios de brillo e intensidad.
(a)
0
330

30

60

300

90

270

120

240

150

210
180
(b)
0

30

330

60

300

90

270

120

A
B
C

240

150

210
180

Figura 3. Diagramas polares ilustrando la dispersin angular de los diferentes estratos


espectrales (a, b, c, d, e, f y g) de la primera parte de uom. a) comienzo de la obra, b) 2
minutos, c) 4 minutos, d) 6 minutos

309

(c)
0
30

330

60

300

90

270

120

A
B
C
D
E

240

150

210
180
(d)
0

30

330

60

300

90

270

120

A
B
C
D
E
F
G

240

150

210
180

Figura 3. (Continuacin)

Transformacin
Este proceso de apropiacin del espacio a partir de estratos granulares es
extendido gradualmente en altura usando el sistema de parlantes superior,
llegando a cubrir el espacio en sus tres dimensiones hacia el final de la pri310

mera mitad de la obra, despus de nueve minutos. A partir de all las ocho
bandas crticas inferiores (de 0 a 7 Bark) son introducidas paulatinamente
y sern la base para la construccin del clmax y la articulacin formal ms
importante de la pieza, en la cual el sonido, hasta ahora morfolgicamente
indefinido (similar al rumor de una maquinaria metlica), ir creciendo en
volumen hasta tomar la forma de una mquina de escribir. Esta transformacin morfolgica cumple una doble funcin: por un lado presenta una
metfora sonora, mutando una mquina en otra (de la fundicin22 a la
mquina de escribir), transfigurando el paisaje sonoro de la fbrica en el
espacio ntimo de la narracin escrita del texto de Walsh. Por otro lado,
esta transformacin marca tambin un cambio drstico en la difusin del
material sonoro, pasando de una textura difusa y envolvente, a una con
capas de sonidos claramente articulados y de localizacin espacial precisa,
creando la ilusin de que la mquina de escribir emerge de la niebla metlica
que la precede, develando as la presencia del narrador. La figura 4 muestra
un sonograma que comprende esta transformacin y el crecimiento gradual
de energa que la antecede.

Figura 4. Sonograma del minuto 10 al 17 de uom


22

Siguiendo la descripcin de Monjeau. Es significativo tambin que en su crtica, Monjeau


describa este proceso de transformacin como un fundido.

311

Puede verse en el sonograma que la transformacin fue realizada por bandas,


mutando gradualmente las siete bandas de 14 a 21 Bark (que abarcan aproximadamente dos octavas de 2.320 Hz a 9.500 Hz). A la par de esta mutacin
espectral, un nuevo material aparece en el extremo superior del espectro cercano a los 18 KHz, descendiendo luego en forma continua hasta los 13 KHz
y ocupando por completo la banda correspondiente a 23 Bark (de 12.000 Hz
a 15.500 Hz). Este material, una textura que en principio podra asimilarse
al sonido de un cristal roto, no es ms que una decomposicin del sonido de
la mquina de escribir, tomando solo parte de sus ataques y filtrndolos en el
registro indicado luego de someterlos a una granulacin de altsima densidad.
Este proceso, que toma forma espacial en tres dimensiones, tiene una duracin apenas superior a un minuto y culmina con la articulacin normal de la
mquina de escribir cubriendo el total del espectro.
Despus de esta transformacin, en el final de la obra, los materiales irn
gradualmente dividindose en dos capas espaciales, una asignada al arreglo
de parlantes superior, con la mquina de escribir (ya articulada normalmente) y restos de la textura metlica de la seccin precedente que desaparecen
gradualmente, y otra asignada al arreglo de parlantes inferior con el texto de
Walsh narrado por una voz velada. Adems de estar separadas en altura, estas
dos capas presentan tambin un contraste en su difusin espacial: la voz tiene
un carcter omnidireccional, mientras que la mquina de escribir, grabada
con un micrfono Ambisonics y casi sin procesamiento hacia el final de la
obra, presenta una imagen espacial clara que deja translucir el recinto en el
que fue grabada. La intencin aqu fue la de superponer un espacio interno a
uno externo: la voz, que parece susurrar desde el interior de nuestras cabezas
(su carcter omnidireccional la vuelve tambin omnipresente), y la mquina
de escribir, que con su articulacin revela el espacio fsico en el que se escribe
el texto.
Reflexiones
El marco terico y esttico desarrollado para uom, como as tambin su
implementacin tecnolgica, dejaron las puertas abiertas para la exploracin
de nuevos territorios artsticos. En particular el concepto de flujo espectrogranular y la posibilidad de ajustar sus patrones de dispersin espacial a partir
de distribuciones estadsticas me permiti vislumbrar nuevas posibles formas
de trabajo espacial con el sonido. Durante los aos que siguieron a la composicin de uom mi inters en lo espacial se centr en la relacin entre el sonido
y el cuerpo. Mis trabajos en esta nueva direccin que exceden el campo de
la msica y se proyectan hacia lo que podramos llamar el arte sonoro (vase
312

LaBelle, 2006) buscan la extensin del sonido ms all de los lmites de la


audicin, como una manera de transformar la experiencia sonora en algo
fsico.
A nivel tecnolgico, el trabajo con Ambisonics continu siendo central
en esta bsqueda, tanto por sus posibilidades de control perifnico del sonido
como por sus capacidades de inmersin, pero no result suficiente para lograr
trascender la esfera creada por los parlantes. 23 Fue el trabajo con ultrasonido
lo que me permiti crear flujos espaciales altamente localizados que trascienden los lmites del espacio virtual creado por los parlantes e ingresan al propio
espacio fsico, yendo de una concepcin puramente auditiva del espacio a una
que involucra lo corporal. La instalacin sonora Entanglement (2008) fue el
primer trabajo artstico de dimensiones realizado con esta tecnologa. En la
seccin siguiente se presentan en detalle los componentes conceptuales y tcnicos de este trabajo, en particular los relacionados a las nociones de espacio
y cuerpo.

Entanglement
Mi trabajo ms reciente, Entanglement (2008),24 extiende la nocin de flujo
espacial introducida en uom al propio espacio fsico. El concepto de esta
instalacin est relacionado con la idea de inmersin y dispersin sonora
tanto en una dimensin auditiva como corporal. La obra tambin extiende el
concepto de espacio (sonoro y fsico) creando un entorno o medio ambiente
que es habitable en dos sitios distantes en simultneo.
Entanglement fue encargada conjuntamente por el 911 Media Arts Center
y la galera soil de Seattle para su muestra Simultaneity. Haciendo uso
de una concepcin telemtica, la obra traza una lnea sonora que atraviesa
la ciudad y disecta fsicamente los espacios de ambas galeras, ubicadas en
extremos opuestos del downtown de Seattle. Esta lnea creada localmente
con ultrasonido y proyectada remotamente a travs de internet es una frgil
23

Vase la definicin de sistema perifnico y el concepto de esfera unidad en el captulo v


de este libro.
24 Instalacin sonora telemtica realizada en colaboracin con Eunsu Kang y Joel Kollin,
ambos estudiantes de doctorado del Center for Digital Arts and Experimental Media de
la Universidad de Washington. El ttulo de la obra posee mltiples significados en ingls
(enredo, vnculo, red, etc.) que tornan difcil una traduccin literal al castellano. Podramos
decir que el ttulo hace referencia a la manera en que la percepcin auditiva de los participantes de la obra queda atrapada en una red interactiva que involucra tambin a su cuerpo,
vinculndolo con el de otros participantes a la distancia.

313

construccin acstica que es solo perturbada por los visitantes de la instalacin, quienes con sus cuerpos pueden bloquear en forma total o parcial su
flujo sonoro continuo. La interaccin fsica con este flujo sonoro tiene como
resultado la dispersin de sus partculas granulares en todo el espacio de la
galera, produciendo localmente un estado acstico inmersivo. Al mismo
tiempo, una sombra acstica, resultante del bloqueo parcial o total del flujo, es
proyectada telemticamente en el otro sitio, produciendo una discontinuidad
sonora. Podramos decir que Entanglement explora la idea de tele-ausencia
(en lugar de tele-presencia, vase Ascott, 1990; 2003) usando un canal
acstico virtual para proyectar remotamente una presencia inmaterial de sus
visitantes.
Lugar
Uno de los objetivos principales de Entanglement fue la creacin de un espacio continuo, un lugar que atravesara linealmente la ciudad.25 Para ello,
en lugar de acentuar las diferencias entre los espacios de ambas galeras,
la eleccin fue unificarlos en forma visual y sonora, volvindolos complementarios y as producir una sensacin de ambigedad sonoro-espacial
en los visitantes. Esta concepcin sonoro-espacial se apoya en un diseo
arquitectnico homogneo de ambos sitios, evitando una distincin binaria
o didctica entre ellos.
A grandes rasgos, el diseo plstico del espacio consiste en dos estructuras espejadas ubicadas en los extremos de cada sala (vase figura 5).26
Ambas estructuras fueron construidas con un material flexible que permiti
darles formas orgnicas para quebrar la planta cbica de las salas. Una de las
estructuras (figura 5a) contiene un canal circular de aproximadamente 50
cm de dimetro y 1 m de profundidad que alberga un transductor de ultrasonido (vase la seccin siguiente); la otra estructura, enfrentada a la primera,
presenta una topologa ms irregular (figura 5b) y contiene un micrfono
oculto que capta los sonidos emitidos desde la primera.27 La instalacin se
completa con un arreglo de 6 parlantes distribuidos alrededor del recinto,
ocultos a los ojos de los visitantes.
25

Este concepto de lugar debe ser entendido como unidad espacial. Esta idea es muy cercana
a la que Juan Jos Saer presenta en su literatura y est apoyada en su concepto de zona.
Sobre este tema se recomienda la lectura de Premat (2002).
26 El diseo de estas estructuras fue realizado en gran parte por Eunsu Kang.
27 El micrfono capta adems una seal de ultrasonido que es usada como parmetro de
control. Esto se explica en detalle en las secciones siguientes.

314

Figura 5. Imgenes de la instalacin: a) estructura con emisor ultrasnico, b) estructura


con receptor (micrfono)

Al entrar a uno de los sitios de la instalacin, inmersos en una casi total


oscuridad, los visitantes apenas pueden ver las estructuras que, iluminadas
tenuemente, presentan formas orgnicas difciles de discernir.28 Las formas
completas de las estructuras irn revelndose con el paso del tiempo, a medida que los visitantes adapten su visin a la oscuridad. Durante este lapso de
adaptacin visual, cuya duracin depende de cada persona, la experiencia de
la instalacin es casi completamente sonora y fsica, teniendo los visitantes
que valerse de sus odos y su cuerpo para explorar el espacio. A medida que el
entorno visual se revela dinmicamente, varios aspectos del entorno sonoro
tambin lo hacen, dependiendo de los movimientos de los participantes y de
su interaccin con el flujo sonoro.

Flujo
La metfora natural de un ro, o un arroyo, podra servir para describir el medio
ambiente de la instalacin. Un flujo sonoro continuo y altamente localizado
28

El diseo de iluminacin de ambos sitios fue realizado por Joel Kollin.

315

atraviesa longitudinalmente a ambos sitios. Este flujo es creado a partir de un


haz de ultrasonido proyectado desde uno de los extremos de la sala. Una de las
propiedades del ultrasonido es que, debido a su largo de onda (aproximadamente 1,7 cm o menor), tiene un patrn de radiacin altamente direccional, como
puede apreciarse en el diagrama de radiacin polar de la figura 6.
Creando patrones de interferencia (o batidos) en el rango del ultrasonido pueden generarse sonidos dentro del rango audible y aprovecharse las
caractersticas del ultrasonido para construir transductores de audio altamente
direccionales.29 Por ejemplo, dos sonidos sinusoidales de 40 y 41 KHz respectivamente, transmitidos desde una misma fuente acstica con alto nivel de
presin sonora (mayor a 100 dB SPL) pueden producir un sonido diferencial
audible y altamente localizado de 1 KHz (y otro inaudible de 81 KHz). Una
manera sencilla de producir este efecto con una seal de audio de banda ancha
(no sinusoidal) es usando una portadora ultrasonora (a 40 KHz, por ejemplo)
que sea modulada en amplitud por la seal de audio a reproducir. Por cada
componente en la seal de audio se producirn bandas laterales alrededor de
la portadora creando copias en espejo del espectro del sonido en el rango del
ultrasonido. Una vez transmitida esta seal compuesta a travs de un transductor ultrasonoro, el aire acta como demodulador haciendo audible la seal
de audio moduladora.30 Adems de su alta concentracin espacial de energa,
produciendo solo un rea estrecha dnde el sonido es perceptible, este tipo de
haz sonoro tiene tambin la particularidad de ser altamente reflectivo. Esta
otra caracterstica del ultrasonido es aprovechada en la obra para crear la ilusin de que las partculas granulares que constituyen el flujo sonoro refractan
del cuerpo de la persona que lo interrumpe, esparcindolas en el espacio de la
instalacin. La siguiente seccin se refiere a este aspecto de la obra.
Perturbacin
Como hemos visto, el estado natural de la instalacin es el de un flujo sonoro
continuo que atraviesa el espacio fsico de ambos sitios. Los sonidos emanados
por el transductor de ultrasonido producen un flujo de sonidos granulares de alta
29

Los efectos no lineales producidos en el aire por ultrasonido de alto nivel fueron estudiados en la dcada de 1960 por P. Westervelt (Westervelt, 1963), quin acu el trmino
arreglo acstico paramtrico para describir este tipo de transductor. Para una historia detallada
del arreglo acstico paramtrico se recomienda la lectura del artculo de divulgacin publicado por la empresa atc (Croft y Norris, 2001).
30 Debe notarse que este esquema de modulacin tiene algunos problemas de distorsin
espectral debido a la intermodulacin de las bandas laterales. Para una discusin en detalle
acerca de mtodos de modulacin ms eficientes ver Barbagallo, Kleiner, y Sarti (2008).

316

20
40

0
0

340
320

-6
-12

60

300

-18
-24

80

280

-30
100

260

f = 40KHz
d = 1m

120

240
140

220
160

180

200

Figura 6. Diagrama polar de radiacin de un transductor de ultrasonido para una frecuencia de 40 KHz a 1 m de distancia. El grfico muestra un patrn de radiacin hipercardioide
abarcando un ngulo cercano a 40 grados

densidad que solo es percibido cuando se lo atraviesa.31 Una vez dentro del rea
afectada por el flujo sonoro, el cuerpo del participante acta como un objeto
perturbador, difractando parte de las partculas granulares, bloqueando as su
trayectoria hacia el otro sitio en forma total o parcial. De esta manera, una perturbacin local del flujo sonoro produce una remota, cambiando las condiciones
acsticas del otro sitio. Podramos decir que desde la perspectiva del otro sitio, la
perturbacin local del flujo sonoro es percibida como una sombra acstica: una
presencia acusmtica fantasmagrica (vase la seccin siguiente).
Desde un punto de vista tcnico, la ilusin de perturbacin es creada mediante la interaccin de un haz ultrasnico y un sistema de sonido
Ambisonics. El haz ultrasnico emitido desde un lado del recinto es captado
por un micrfono en el extremo opuesto del mismo. La amplitud del haz es
analizada por un agente informtico que produce una seal de control, utilizada para medir el nivel de interrupcin del flujo sonoro. Esta mtrica es aplicada a mltiples parmetros del sistema, produciendo un intercambio sonoro
entre el haz ultrasnico y el arreglo Ambisonics. Por ejemplo, al atravesar los
lmites del rea cubierta por el flujo sonoro, el cuerpo del participante produce
31

Al entrar a uno de los sitios, los participantes pueden or solo un rumor de este sonido,
mayormente debido a su refraccin. La relacin de nivel entre este reflejo y el sonido directo (medido dentro del haz de ultrasonido) es de al menos 70 dB.

317

una discontinuidad en la seal de control; segn el nivel de esta discontinuidad un mayor o menor nmero de partculas granulares son emitidas por
el sistema Ambisonics, produciendo una ilusin de difraccin e inmersin.
Tambin el patrn de dispersin y la densidad de estas partculas granulares
es controlado con este parmetro, yendo de un patrn cardioide con alta densidad granular (complementario al flujo sonoro) a un patrn omnidireccional
con baja densidad, para niveles de perturbacin bajos y altos respectivamente.
Este sistema de control multidimensional usa un mapeo paramtrico no lineal
que controla a su vez un reverberador artificial para crear la ilusin de un cambio dinmico del tamao del recinto. La figura 7a muestra la seal de control
para diferentes niveles de bloqueo del flujo sonoro. La figura 7b muestra la
curvas de correspondencia de los diferentes parmetros del sistema en funcin
de la seal de control. La curva a controla la densidad granular del sonido, el
rango de este parmetro va de 10 granos/seg (a = 0) a 100 granos/seg (a = 1).
La curva b controla la dispersin angular de los granos, el patrn polar de la
dispersin est dado por la siguiente ecuacin:
y()= b + (1 b) cos()

que resulta en un patrn omnidireccional para un valor de b de 1, y un patrn


cardioide para un valor de b de 0. La curva c controla el nivel de reverberacin
(el rango de este parmetro fue calibrado de manera independiente en cada
sitio). Finalmente la curva d controla el nmero de partculas granulares que
son emitidas por el sistema Ambisonics. Puede verse a partir de esta curva
que este sistema permanece en silencio si el flujo es continuo (d = 0), y llega a
su mxima intensidad cuando el flujo es interrumpido por completo (d = 1).
Cuando el nivel de interrupcin del flujo sonoro traspasa un cierto
umbral (A en el grfico 7a), el sistema enva un mensaje al otro sitio a travs
de internet. Este mensaje es usado por el sistema remoto para comenzar un
proceso de transformacin que acompaa la interrupcin del flujo sonoro,
acentuando la ilusin de una sombra acstica (vase la seccin siguiente).
Un mensaje diferente es enviado cuando la seal de control vuelve a superar
un cierto umbral (b en el grfico 7a), indicando que el flujo ha sido reestablecido y terminando el proceso de transformacin remoto. La presencia de
participantes activos en ambos sitios puede producir un alto nivel de complejidad en los cambios acsticos del entorno. Dependiendo de los niveles
de perturbacin tanto locales como globales, el sistema reacciona de manera
diferenciada teniendo en cuenta el nivel de actividad y el tiempo dispensado
a la interaccin, premiando acciones prolongadas que invitan a la exploracin
corporal y auditiva.
318

(a)
1

nivel del flujo

0.8

0.6

flujo continuo
flujo semi-continuo
bloqueo parcial
bloqueo total

0.4

0.2

0
0

10
15
tiempo (s)

20

25

(b)
1

0.8

mapeo

0.6

a
b
c
d

0.4

0.2

0
0

0.2

0.4
0.6
nivel del flujo

0.8

Figura 7. a) Seales de control para diferentes niveles de bloqueo del flujo sonoro; b) curvas de correspondencia paramtrica en funcin de la seal de control: a. densidad granular,
b. dispersin angular, c. nivel de reverberacin, d. nivel del sistema Ambisonics

319

Teleausencia
Mediante la exploracin del espacio acstico de uno de los sitios, los participantes transforman el paisaje sonoro de la instalacin tanto local como remotamente. Su presencia en uno de los sitios es transferida al otro a travs del
sonido o, ms precisamente, del silencio, mediante la interrupcin del flujo
sonoro continuo, creando una sombra acstica. La obra explora el principio
de teleausencia mediante el uso de un canal acstico virtual que proyecta
esta presencia incorprea de los participantes de un sitio a otro a travs de
internet.
Tcnicamente, este sistema telemtico consiste de un agente de emisin
de audio por internet que transmite el sonido capturado por un micrfono
usando un canal dedicado. Este canal es sintonizado por un agente de recepcin en el sitio remoto; el sonido recibido a travs de la red es decodificado,
procesado y luego emitido por el transductor ultrasonoro local. Debe notarse
que solo si el haz es bloqueado completamente en ambos sitios creando una
sombra acstica en espejo se abrir en el sistema un canal de comunicacin
bidireccional, intercambiando el sonido de ambos sitios a travs del flujo
ultradireccional.32 Esta nueva capa del sistema, que solo es revelada en situaciones especiales, es extremamente delicada ya que al menor movimiento de
los cuerpos fuera del rea de incidencia del flujo sonoro el sistema tender a
retornar a su estado de equilibrio, cerrando el canal de comunicacin. Este
componente interactivo involucra el cuerpo de los participantes de manera
radical, ya que solo forzando la interrupcin del flujo sonoro, quebrando el
fluir con su cuerpo, y permaneciendo inmviles a ambos lados del canal,
podrn los participantes atravesar la distancia acstica que los separa y establecer comunicacin.

Conclusiones
Entanglement constituye lo que Jack Burnham defini como un sistema
abierto (Burnham, 1974), el cual se cierra solamente con la accin de los
participantes, quienes funcionan como agentes interactivos revelando las
mltiples capas del mismo. El sistema de la obra es autnomo, tiene un estado
de equilibrio o reposo y una red de mltiples patrones de reaccin. Si bien
32

Este canal es a su vez afectado por lneas de retardo que simulan la distancia acstica
entre ambos sitios, introduciendo un retardo temporal similar al que ocurrira si pudiramos
proyectar nuestra voz a dos kilmetros de distancia.

320

esta red tiene un nmero limitado de componentes, la interaccin local y


remota, aislada o simultnea, vuelven al sistema impredecible en trminos de
su comportamiento: estando la interaccin de los participantes con el medio
ambiente de la instalacin basada en la retroalimentacin del sonido entre
ambos sitios, pueden emerger del sistema estados acsticos imprevistos. Este
es un punto importante de destacar, el cual est relacionado directamente
con el ttulo de la obra, que hace referencia a la manera en que la percepcin
auditiva de los participantes se encuentra atrapada en una red interactiva que
involucra tambin su cuerpo: no hay manera de separar el acto de or del acto
de enmascarar y viceversa.
Es interesante comparar este sistema abierto con el sistema cerrado que
constituye uom, en el cual los oyentes no tienen una participacin activa:
su presencia fsica es necesaria pero no central en la construccin de la obra
como lo es en el caso de Entanglement. Podramos decir que uom es una obra
musical con una narrativa espacial de sitio especfico, es decir que su contenido material resuena poltica y acsticamente con su espacio de ejecucin
(la fbrica metalrgica). Esta narrativa espacial difiere de la de Entanglement,
donde la propia experiencia espacial de los participantes se ve continuamente
sometida a modificaciones a travs de un lazo de retroalimentacin interactivo, que involucra tanto lo auditivo como lo corporal. Es importante notar
tambin que hay algo paradjico en esta interaccin: en nuestro intento por
orlo, nuestro cuerpo perturba o destruye el flujo sonoro que es eje del sistema,
transformando en el mismo acto la acstica del espacio de audicin.
Por otra parte, ambas obras estn basadas en la transformacin dinmica
del espacio y la materia, utilizando materiales y procedimientos electroacsticos muy similares pero en escalas temporales totalmente diferentes.33
Mientras que uom presenta una arquitectura material y espacial que se articula gradualmente a lo largo de dieciocho minutos, las articulaciones morfolgicas de Entanglement suceden en una escala temporal ms cercana a la cadencia
de nuestros movimientos corporales, revelando transformaciones sonoras ms
lentas cuando la interaccin con el sistema es prolongada o si el participante
decide mantenerse esttico bloqueando el flujo central de la obra.34 De esta
33

Los materiales de base utilizados para Entanglement provienen de objetos de vidrio y cermica destruidos a martillazos. A diferencia de los sonidos metlicos de uom, estos sonidos
pierden completamente su identidad material al ser transformados digitalmente, siendo
imposible reconocer su origen, solo conservando algunas de sus caractersticas morfolgicas
y su contenido espectral global.
34 Este aspecto del sistema fue utilizado de manera extensa en una segunda versin de la obra
producida para el museo Ssamzie Space, en Corea. En esta versin, los participantes que
bloqueaban el flujo sonoro por un largo perodo de tiempo eran recompensados con una muta-

321

manera lo formal est tambin ligado a lo corporal y a lo fsico, y no solo a


lo auditivo.
Desde un punto de vista tcnico, el trabajo en simultneo con ultrasonido
y Ambisonics permitieron la construccin de un sistema que es mayor a la
suma de sus partes. La alta granularidad espacial que permite el uso de un haz
de ultrasonido fue combinada con la capacidad de inmersin de Ambisonics
y sus posibilidades de control de la direccionalidad del sonido para crear un
sistema dinmico que pudiera transformar rpidamente el espacio acstico
en funcin de la interaccin de los participantes de la instalacin. La integracin de ambas tecnologas permiti tambin homogeneizar la experiencia
acstica de la obra: la refraccin de partculas granulares en los cuerpos de
los participantes fue acentuada por reflejos tempranos presentes en el sistema
Ambisonics; tambin los cambios de dispersin angular fueron dramticamente acentuados por la transicin de un sistema de reproduccin al otro. Podra
pensarse en maneras de extender este campo de integracin entre ambas
tcnicas para la creacin de entornos interactivos de mayor granularidad espacial, utilizando mltiples haces de ultrasonido en simultneo con un sistema
Ambisonics de segundo o tercer orden.35 Adems de una mayor agudeza en la
reproduccin espacial, un sistema como este en combinacin con un sistema
de control similar al usado en Entanglement permitira una particin ms
fina del espacio fsico, utilizando los haces ultrasonoros para la deteccin del
movimiento y la localizacin de los participantes. Nuestros presentes trabajos
de investigacin estn dedicados a indagar en las posibilidades artsticas de
este tipo de sistemas.

Bibliografa
Ascott, R. (2003), Telematic Embrace: Visionary Theories of Art, Technology,
and Consciousness by Roy Ascott, Berkeley, University of California
Press.
(1990), Is There Love in the Telematic Embrace?, Art Journal, 49:3,
Nueva York, College Arts Association of America, pp. 241-247.

cin gradual del sonido que terminaba inundando el espacio por completo con una textura
de gran densidad e intensidad.
35 De esta manera podran alinearse aun ms los patrones polares de radiacin de ambos sistemas de reproduccin. Para una descripcin de los sistemas Ambisonics de segundo y tercer
orden, y sus ecuaciones de codificacin y decodificacin, vase el captulo v de este libro.

322

Bamford, J. S. (1995), An Analysis of Ambisonic Sound Systems of First


and Second Order, tesis de maestra, Waterloo University, Ontario,
Canad.
Barbagallo, M., M. Kleiner y A. Sarti (2008), Modulation and Demodulation
of Steerable Ultrasound Beams for Audio Transmission and Rendering,
Proceedings of the 11th International Conference on Digital Audio Effects
(DAFx-08), Espoo, Finlandia.
Blauert, J. (1997), Spatial Hearing, Cambridge, mit Press.
Blesser, B. y L. R. Salter (2007), Spaces speak, are you listening?: Experiencing
aural architecture, Cambridge, mit Press.
Burnham, J. (1974), Systems Esthetics, Great Western Saltworks, Nueva
York, George Braziller.
Croft, J. J. y J. O. Norris (2001), Theory, History, and the Advancement of Parametric
Loudspeaker, (libro blanco del) American Technology Corporation (atc)
en <http://atcsd.com/pdf/HSSWHTPAPERRevE.pdf>.
Di Liscia, O. P. (2005), Los modos de vnculo de la espacialidad del sonido
con la poiesis de la msica electroacstica, tesis doctoral, Facultad de
Humanidades y Artes, Universidad Nacional de Rosario.
Forsyth, M. (1985), The Architect, The Musician, and the Listener from the
Seventeenth Century to the Present Day, Cambridge, mit Press.
Kahn, D. (1999), Noise, Water, Meat: A History of Sound in the Arts,
Cambridge, mit Press.
Kendall, G. S. (1995), A 3-D Sound Primer: Directional Hearing and Stereo
Reproduction, Computer Music Journal, 19:4, Cambridge, mit Press.
(1995), The decorrelation of Audio Signals and its impact on Spatial
Imaginery, Computer Music Journal, 19:4, Cambridge, mit Press.
LaBelle, B. (2006), Background Noise: Perspectives On Sound Art, Nueva York,
Continuum International.
Malham, D. G. (1998), Approaches to Spatialisation, Organized Sound, 3:2,
Cambridge University Press.
y M. Anthony (1995), 3-D Sound Spatialization using Ambisonic
Techniques, Computer Music Journal, 19:4, Cambridge, mit Press.
Pampin, J. (2004), ATS: A System for Sound Analysis, Transformation,
and Synthesis Based on a Sinusoidal Plus Critical Band Noise Model,
Proceedings of the 2004 International Computer Music Conference, Miami,
International Computer Music Association.
, J. S. Kollin y E. Kang (2007), Applications of Ultrasonic Sound Beams
in Performance and Sound Art, Proceedings of the 2007 International
Computer Music Conference, Copenhagen, International Computer
Music Association.
323

, O. P. Di Liscia, W. Moss y A. Norman (2004), ATS User Interfaces,


Proceedings of the 2004 International Computer Music Conference, Miami,
International Computer Music Association.
Premat, J. (2002), Saer fin de siglo y el concepto de lugar, Foro hispnico,
vol. 24, Rodopi.
Rumsey, F. (2001), Spatial Audio, Oxford, Focal Press.
Schulz, B. (2002), Resonances: Aspects of Sound Art, Heidelberg, Kehrer
Verlag.
Tschumi, B. (1996), Architecture and Disjunction, Cambridge, mit Press.
Walsh, R. (1969), Quin mat a Rosendo?, Buenos Aires, Tiempo contemporneo.
Westervelt, P. J. (1963), Parametric Acoustic Array, Journal of the Acoustical
Society of America, vol. 35, N 4, abril de 1963.
Wishart, T. (1985), On Sonic Art, York, Imagineering Press.
Zwicker, E. (1961), Subdivision of the audible frequency range into critical
bands (Frequenzgruppen), Journal of the Acoustical Society of America,
vol. 33, N 2, febrero, p. 248.
y H. Fastl (1990), Psychoacoustics Facts and Models, Berln, Springer.

324

325

326

colofn

327

328