Beruflich Dokumente
Kultur Dokumente
Percepci6n auditiva
Daniel Gomez
Vicerrector
Jorge Flores
(f)
Universidad
Nacional
de Quilmes
Editorial
Basso, Gustavo
Percepci6n audit iva - la cd. - Bernal: Universidad Nacional
de Quilmes, 2006.
288 p. : it. ; 15x21.5 cm
(Musica y ciencia dirigida por Pablo Di Liscia)
ISBN 987-558-082-1
(BI876BXD) Bernal
Buenos Aires
http://www.unq.edu.ar
editorial@unq.ed.ar
ISBN: 987-558-082-1
ISBN-13: 978-987-558-082-4
Queda hecho el deposito que rnarca la ley 11.723
Esta edici6n de 1.000 ejemplares se termino de imprimir en agosto de 2006, en los talleres
graficos de Imprenta El Faro, Dorrego 1401, Mar del Plata, Provincia de Buenos Aires.
Iodice
15
Prologo
17
otoacusticas
6. Funciones de transferencia del sistema auditivo periferico
7. Respuestas neurales a altos niveles en el sistema auditivo
19
20
22
24
24
26
26
26
28
30
32
40
42
44
53
54
54
55
57
58
46
47
48
de enmascaramiento
Modelos de cobertura y supresion
Modelos temporales de enmascaramiento
"
5. Analisis espectro-ternporal combinado
Reduccion del enmascaramiento por cornodulacion
Enmascaramiento no simultaneo
Enmascaramiento binaural
6. Distorsion alineal y sonidos de combinacion
Sonidos de cornbinacion de segundo orden
60
62
65
66
66
68
70
70
70
71
73
77
77
81
81
84
85
86
89
89
91
91
94
98
99
99
100
100
101
103
104
104
104
105
106
109
110
111
, ';!~:
~,.
113
113
de sefiales complejas
Discriminacion de la duraci6n
6. ] uicios sobre el orden temporal.
Desplazamiento aciistico temporal.
117
118
121
121
122
123
124
124
126
127
127
127
127
128
128
145
149
150
152
154
155
157
160
163
164
133
135
136
137
139
140
142
143
166
167
171
178
179
182
183
184
186
187
187
189
189
190
190
191
192
192
192
197
197
197
198
201
202
204
206
206
211
212
214
215
215
216
217
219
219
Localizaci6n de la fuente
221
Redundancia de la informaci6n
227
Leyes de la Gestalt
230
Isornorfismo
238
239
239
240
241
244
247
248
250
255
255
255
256
256
257
257
258
260
265
Apendices
I. Teorema de Fourier
II. Principio acustico de indeterminaci6n
267
271
Referencias bibliograficas
275
Indice ternatico
285
--~--
-----:;::--~--
- -
--- ----=-- - - - - - - - -
--
Presentaci6n
15
que van mas alla de los eventos individuales. Se involucran asf, procesos de
eventos sonaros de muy variada naturaleza y complejidad, como la percepcion
de secuencias de habla (capitulo IX), evaluacion de recintos y localizacion de
fuentes sonaras en movimiento (capitulo v), segregacion y fusion de estratos
sonoras simultaneos y sucesivos (capitulo VIII), 0, finalmente, los estudios sa
bre el desplazamiento entre el tiempo ffsico y el fenomenico (capitulo IV).
Una de las dificultades que hubo de enfrentar el autar de este libra es la
secuenciacion de los contenidos, dada su interdependencia. Es asi que, par
ejernplo, en el capitulo referido a la "sonoridad" (capitulo II) se pregunta: "Pe
ro, zes legitime considerar a la sonoridad como un rasgo autonorno, que se
puede estudiar de manera independiente, separada del resto de las caracteris
ticas que definen un sonido real?"
Y que decir del capitulo dedicado al "timbre" (capitulo VI), una de las no
ciones mas interdependientes y cambiantes en toda la historia del sonido y la
rmisica. En su tratamiento, el autor pone en evidencia, adernas, el rol de los
aportes de las tecnicas y tecnologias de sonido prapias de la electroacustica:
"Los modelos de analisis par sintesis han demostrado ser eficaces para generar
conocimiento cientffico y tecnico, reducir la cantidad de informacion necesa
ria para expresar una sefial aciistica, praducir variantes y modificaciones nun
ca experimentadas y contralar la prasodia musical en tiempo real. [...] Una
descripcion detallada de las tecnicas empleadas contendria la histaria de la
electroaciistica durante los iiltimos 60 afios."
Por todo 10 antedicho, este libra constituye un trabajo valioso para explo
rar antes que para simplemente "leer", para que ellectar realice multiples reco
rridos en los que puede y debe encontrar variados puntos de entrada-salida y de
relacion, a despecho de la necesaria secuencia que impone el texto escrito.
16
Prologo
Este libra fue concebido inicialmente como una publicacion interna para un
seminario de posgrado que se dicto en el ana 2000 en la Universidad Nacional
de Quilmes. Ese arigen explica, en parte, el contenido y la secuencia de los ca
pitulos. Su objetivo principal es el de exponer los elementos, principios y pra
cesos que intervienen en la percepcion del sonido. Nuestra intencion no es
presentar los temas como si formasen parte de un conjunto de conocimientos
definitivos, sino integrar las dificultades prapias de una disciplina en la que los
mismos datos experimentales llevan muchas veces a la creacion de modelos ex
plicativos totalmente diferentes.
Quiza la confusion mas habitual en cualquier texto sabre acustica tiene
origen en la ambiguedad de la definicion de sonido. Segun el autor a el texto
que traternos, el termino son ida se puede referir a un fenomeno ffsico -como
una vibracion a una onda en el espacio- a a un [enomeno psicologico, Aquf
llamaremos son ida a la representacion mental asociada a la percepcion, y se
fial acustica al estfrnulo ffsico que 10 origina. La psicoaciistica tradicional es
tudia directamente la relacion entre las sefiales acusticas de entrada y los
sonidos, colocando los pracesos intermedios en una especie de caja negra cu
yo mecanismo no considera de su incumbencia. La fisiologfa de la percepcion
y la neurobiologia, par su parte, se interesan especialmente par los pracesos de
transduccion que operan entre la serial aciistica y la representacion mental
asociada. En nuestro caso predomina la primera aproxirnacion, pera no evita
remos mencionar los aspectos fisiologicos involucrados cuando 10 creamos ne
cesario. El primer capitulo, par ejemplo, esta dedicado par completo a la
fisiologfa de la audicion.
Este texto esta concebido como parte de un pragrama completo de acus
tica destinado a music as e investigadores en temas relacionados can el soni
do. Aunque los aportes de la psicologia y de las ciencias medicas resultan
esenciales, nuestra aproxirnacion al tema adopta decididamente la perspecti
va especffica de la ciencia aciistica. Si bien se supone que ellector esta farni
17
Capitulo I
Sistema auditivo periferico y fisiologia de la audici6n
Timpano
Ventana
redonda
~
~
Conducto auditivo
Dido externo
Dido medio
Dido interno
18
19
Helix
--------"1~
Antihelix
-----t-t--.
Concha (plato)
----4-+---r:-+
Crus helias
1. Ofoo
EXTERNO
El ofdo externo, junto a la cabeza y la parte superior del torso, forma parte del
sistema receptor de vibraciones que acopla el timpano con el campo aciistico
externo. Ademas de protegerlo ante posibles agresiones mecanicas, filtra y
modifies las sefiales que le llegan del exterior y contribuye decisivamente en
la tare a de localizacion espacial de las fuentes acusticas.
Una descripci6n anat6mica del ofdo externo, de adentro hacia afuera, in
cluye el canal auditivo externo, la concha y el pabellon auricular El canal au
ditivo extemo es una estructura tubular irregular de aproximadamente 26 mm
de largo par 7 mm de ancho y un volumen de 1 crn-, con un eje central sinuo
so, que conecta el pabellon con el tfrnpano. Su pared esta confonnada por una
parci6n cartilaginosa (rnovil) y una 6sea. La parte cartilaginosa, continuaci6n
de la estructura del pabellon auricular, es de mayor longitud que la 6sea y es
ta cubierta par piel con folfculos pilosos, glandulas ceruminosas y sebaceas. En
cambio, la piel que recubre la regi6n 6sea del canal auditivo externo, en la
parte mas profunda adherida al tfrnpano, es muy delgada.
La parte externa del canal auditivo externo se ensancha notablemente
farmando una cavidad en forma de taza llamada concha, con un volumen in
terno de aproximadamente 4 cm '. En la Figura 2 se pueden apreciar una vista
lateral y un carte del ofdo externo.
El pabell6n auricular (la oreja) es una estructura cartilaginosa que acnia
como un filtro direccional de las sefiales que llegan del exterior. Es muy dife
rente al de otros mamfferos, par ejemplo el de los felinos, que poseen pabello
nes conicos que pueden enfocar hacia un punto del espacio de manera
independiente por medio de musculos de control especfficos.
Los efectos del pabell6n auricular (6 em), de la cabeza (22 cm entre of
dos) y de los hombros (15 cm de ancho) se vuelven significativos cuando las
longitudes de onda son comparables con la dimensi6n de las estructuras. El sis
tema completo puede ser caracterizado comparando -0 midiendo- la presi6n
acustica en el campo libre, a la entrada del pabellon auricular, con la presi6n
acustica en la superficie del timpano. En la Figura 3 se aprecia la acci6n de fil
1
20
--------l.......,'r-~',,"\
Antilrago
------+-..>.,-~
L6bulo - - - - - - - - - T - - +
20
iii'
~ 15
0
c:
tll
10
a;
c:
CD
SIII
CD
0III
CD
"
0::
-5
0.2
0,5
0.7
1012
Frecuencia (kHz)
Figura 3. Funci6n de transferencia del ofdo externo ante un estfmulo difuso de ruido blanco
21
~------------
tro espectral que produce el ofdo extemo. La transferencia maxima, a una fre
cuencia de aproximadamente 2.800 Hz, se debe a la resonancia del canal au
ditivo externo.
La compleja forma de la curva se debe ala concurrencia de los fenome
nos de reflex ion, difraccion y resonancia en diferentes partes del ofdo exter
no. Como curiosidad, en la figura 4 se reproduce el experimento de Goode, en
el que se compara la transferencia de un ofdo normal con un modelo en el que
el tfrnpano queda a ras de una esfera, como ocurre en el caso de algunos sau
rios (Goode, R. L. et al., 1994): es evidente la compleja accion espectral del
oido extemo sobre las sefiales que le llegan del exterior. En el capitulo sobre
percepcion auditiva del espacio nos detendremos a estudiar con detalle este
efecto y sus consecuencias.
""
10 ,...
Oldo completo
~
0
"'
""
Limite teorico
""
I..2I4rc
""
.2
'0
0
c.
E
ltl
o
c
Cll
c
0()
.~
"'
""
""
......
-l +10
"
-10
0,1
-E"'
Cll
Qi
.0
'0
Area del
altavoz
Cll
Cl
- ----........
...
-20
0,01
Area del
timpano
.0
0001
~
0,2
Volumen constante
130
I
0,5
10
20
Frecuencia (kHz)
2 Head
22
(HRTF).
23
t'r
5,1
5,1 --
rarnent e.'
3,5
4 ,4
2. 0[00 MEOIO
El ofdo med io permi te aco plar las sefiales ac ustica s en tre el ca na l a udi tive y e l
ofdo interno. Ocupa un a cav ida d en el hueso te mporal denomi nada ca ja tim
panica y esra co ns t it uido pa r el t frnpano, la cad ena de hu esec illos -rnartil lo ,
yunqu e y estr ibo- co n sus ligamen to s y museulos de co ntrol, la tro mpa de Eus
taquio y las venta nas o va l y red onda, que 10 co m un ican co n e l a ida inter no ."
S u pr inc ipa l fun c i6 n es la de perm itir qu e las vibrac iones ac iist icas llegue n a
la c6 clea ca n sufic ien te energfa. S i las sefiales llegasen direct arnente al ofdo
inte rn o a traves de la ven ta na oval, cas i toda la ene rgla se reflejaria a ca usa de
la d iferen c ia entre las pro piedades mecanicas del rned io ae reo ex terior y de l
medi o ltquido de la coc lea . En los vert ebrados terrestr es el oido medi o ac t ua
co mo un siste ma de acople q ue adapra a mbos med ios, permiti en do una efec
tiva transferenc ia de ene rgla. T ecni carnente, es un ada pta do r de impe da nc ias
y co mo tal 10 ana lizaremos mas adela nte.
Figura 6 . Vibrac ion relat iva del rfrnpano ante una exc itacion de 52 5
Hz y 121 d B
Martillo Yunque
Timpano
Estribo
T frnpan o
El tfrnpan o es un a membran a se m itranspa rente co n for ma de co no co n un a su
pe rfic ie prom ed io de 0, 6 c m/ . A causa de su geornetr fa irregu lar y al ancla je
so lida rio de l manubri o de l rnart illo, e l tim pano vibra co mo una co mpleja
membran a e las tica no horn oge nea. En la figur a 6 se aprec ia su respu est a an te
un esnruulo sin uso ida l de 525 H z. Se destaca ni ti damente la forma del area de
co n tacto co n e l manubri o de l rnarrillo.
3 A lgun os de los fac tores que aurnen tan el riesgo de hip oacusia son el usa de auric ulares en
arnbien tes can gran ni vel de ruido de fond a, par ejemp lo la vfa publica, y el emp leo de arn
plificadore s de audio de baja ca lidad, can der iva estatica y alt a porcenraje de "ru mb le" (rui
4 Esra estruc rura es sim ilar a la de casi rodos los verrebrados te rrest res. Las especie s que no
posee n memb rana rirnpanica, com o las salaman dras y las serpien tes , son la exce pcio n .
24
25
Cadena de huesecillos
Musculo
del estribo
(stapedius)
Estribo
.
Ventana oval
Pared del
canal(6 se~
Membrana
basilar
Membrana de la
ventana redonda
Canal
audi tivo
.,.
Membran a
tirnpani ca
.--' -::::as
Trompa de
Eustaquio
(cartilagi nosa)
26
27
...............
10
co
"0
'6
OJ
"0
'0
-10
CD
"0
<1l
>
~
~
-c- 500 Hz
-20
<1l
:<2
if)
40
30
iO
~
20
Q
~
a:
10
~
0,1
0,5
10
Freeueneia (kHz)
28
Hz
Hz
-30
-20
1000 Hz
-A- 2000
-0- 3000
Cii
I
-10
I
0
10
20
Figura 11. Variacion de la transferencia de energia del oido medio en funcion de la presion
estatica
29
..
m~~
, "
:2- -2
c
'00
,),,,,, ,
~~:~ : 're, l
Superior
Posterior
Lateral
-0
'E
-4
(fJ
jg
-6
c
Q)
Ventana oval
-8
<3
_\~
Vestibula
:.0
E
Ventana redonda
-10
-12
~
40 0 500
800 1000
2000
Frecuencia (Hz)
3. Otto
lNT ERNO
El oido interne es parte de un a ca vidad irregular del hue so temporal que reci
be el n ombre de laberi n to oseo y comp rende el vest ibule , el caracol y los ca
nal es semicirculares. Sus paredes estan forrnadas por hue so recub ierto de
epi teli o y cont iene un lfquido acuoso parecido al liquido amn iot ico. G ran par
te del espac io in terior esta ocupado por un siste ma de finos cond ucto s y sacos
que const itu yen una segunda capa, de paredes tapizadas por tej ido conecti vo
blando, llarnado laberinto mernbranoso. La porc i6n del laberin to 6seo que si
gue a la ven ta n a oval se denom ina vestibule , que a su vez esta dividido en dos
partes, elutrfcu lo y el saculo. Mientras la base del est ribo cubr e casi comple
ta rnent e la ven tana oval, la venta na redonda se halla recubierta por una del
gada membr an a de te jido conectivo. Un estrecho can al cond uce del saculo al
conducto coc lear, situ ado en el interior del caraco l. El conducto coclear, tam
30
bien conocido como caraco l mernbran oso, forma un a espira l de dos vueltas y
media de tejid o conect ivo que sigue el desarrollo de la espi ral osea del caracol.
Ellaberinto esta inervado por el nervio audit ive -octavo par crane al- que
en su interior se divide en dos ramas: el ne rvio coclear, que es el nervio vinc u
lado a la audicion, y el nervio vestibular, que perte nece al sent ido del equilibrio.
En la porcion centra l del laberint o estan los canales semicirculares, q ue
poseen celulas recept oras y cr istales de calcic que responden a la gravedad y a
la aceleracion, informando al ce rebro sobre la posicion y el movirnien to de la
cabe za. Son tres conductos semicirculares orien tados en cuadratura segun las
tres dirnensiones espaciales. A l mover la cabeza se prod ucen mov imientos re
lativos ent re el lfqui do y los crista les de ca lcic en suspension que est imulan a
las ce lulas sen sibles q ue tapizan el tejido int erior de los cana les. As \, ade rnas
de las estru cturas pro pias del sentido de la aud icion , el labe rinto oseo con tie
ne tam bien los organos del sen tido del equ ilibr io.
El tarnafio de los elemen tos del ofdo int em o es ext raordinariamen te peque
no. La base de l caraco l mide men os de 9 mm y el diamet ro del cond ucto que for
ma la c6clea es de alrededor de 1 mm en su part e media, estrechand ose a medida
que se acerca al vert ice. En su interior, el con ducto coclear -t-O scala media- es
aun mas pequefio, ya que la coclea esta dividida en tres part es 0 scalas como se
puede ver en la figura 14. La membrana basilar (MB) sigue la forma en espiral de
la c6clea y forma el piso del conducto coclear, En su desarrollo describe dos vue 1
tas y media y, totalmen te extend ida, mide alrededor de 35 mm de largo.
En la mem bran a basilar se enc uen tra el organo de Cort i, qu e cont iene las
cel ulas ciliadas responsables de con vert ir las vibraciones mecani cas en impu l
sos ner viosos. Duran te much o tiempo se crey6 que la coclea era unicamen te
31
fl '"
Scala Vestibull
(perdinfa)
Hueso
'-t":
,I'
~S~~(~:~d O ~
:.
\'\1"
.'l '~\
,I r'""..: .
I ,.
I ' I . '
Capsula de una
celula ganglionar
. ... '," , I
,
r;r.n'
\ I \\.\'r,:
\ j)' - ,
~""
un 6rgano receptor que procesab a las sefiales acust icas pa ra tran sforrnarlas en
pot en ciales electricos e impulsos nerviosos. Hoy sabe mos, grac ias a numerosos
estu dios, como los de Kem p y Zwicker, que tarnbien posee prapiedades rnot o
ras que Ie ot organ la cap acid ad de act uar sobre las seriales que Ilegan desde el
ex te rio r.
Fisiologia de la coclea
El movimien to de la cadena de hu esecillos del o ldo me dio se ap lica a tra ves
del estribo a la ventana ov al. C omo el laberi nt o esta Ileno de llquido y sus
pared es son oseas, el conjunto resul ta pr act icarnente inc ompresible. El mo
vimi ento del estribo seria poc o menos que nulo de no existir la ventana re
don da, que permite que el volumen de llquid o en la coclea se mantenga
co ns ta n te y que, por 0 tanto, se compensen exacta me n te los movimientos
net os de la ventana oval y de la ventan a redonda. La energia acustica Ilega
en to nc es a la c6clea que, como se puede ver en el co rte de la Figura 15, esta
di vidida en tres compartimientos. La scala tympani co m ienza en la ventana
ova l y esta Ilena de perilinfa, un llquido rico en sod io. La scala vestibula na
ce en la ven ta na redonda y se comunica con scala tympani a trav es de una
ab ertura , el helic otrema, que permi te el paso de l liqu ido perilinfa t ico en el
extre me superior 0 apex del caracol. Entre ambos co nd uc tos se enc ue n tra la
scala media 0 co nd ucto coclear, qu e esta ais lado de los an te riores par la mem
bran a basilar y por la membran a de Reissner y qu e co n tiene endo linfa -un
llquido viscoso rico en potasio . Como la membran a de Reissner es mu y li
32
t .:" .
. . 1 ~ . .
~ ,rl,. I, . ~ ..
I
"'f
~
I'J "'
M b
to
:-";'
:::s-.;
Fibras nerviosas
em lana basilar
, - '~ " ."
" : ':
Ganglios
" , -, \
~' " ; .
espiralados
Tt' nel de Corti
lIgamento
: ' ,, '" .
Neuronas coclea res
esp iralado \ ';,
Sca la Tympanr
" ,:
(perilinfa)
~'"
v. : -.':
vian a y delga da n o acnia mecan icamente sobre el movi miento de los fluidos
cocleares. Su funci6n principal es la de sep arar la endo linfa de la perilinfa
para ma n ten er una diferencia de potencial e lectrico de un os 80 mV en tre
am bos medios.
La membrana basilar es un a membrana elastic a en la que se ubica el or
gano de Corti, Posee alrededor de 3.500 celulas ciliadas intemas dispuestas en
una fila y de tres a cinco filas con apro xim adamente 25 .000 celulas ciliadas ex
ternas en cada oido. Tal como ver em os, las celul as internas son aferentes -en
vlan informa ci6n al cerebra a trav es del nervio aud itivo- y las celulas externas
son efere n tes -reciben impulsos nerviosos desd e el ce rebra. La membrana tee
t6rea cubre las estereoc ilias de las ce lulas c iliadas ayudando a su excitacion
rnecanica. En la Figura 16 se puede ve r una image n del organo de C orti torna
da co n un microscopic elec tr6nico de barri do ,
6 rgano de Corti
El ogano de Cort i es una co mpleja estruc tura co rnpuesta, en tre o tros elem en
tos, por ce lulas nervi osas tran sductoras, ce lulas de sopo rte y fibras ner viosas.
33
pi
II
I~
Hendidura
de Hensen
Zo na limbica
Figu ra 16. Im agen del 6 rgan o de Co rti tornad a ca n un mi croscop ic elcc t ron ico de barrido.
I , Z y 3: ce lulas ciliadas exre rn as; eel: celulas c iliadas intern as; TC: run el de Cort i;
~ 1I1 : mem bran a basilar
Las celulas ciliadas son ne uro nas alta rnente especi a lizadas y se d isponen
en dos arcos separ ados po r el t un e] de C orti. En el arco exterio r se agrupa n
un as 25.000 ce lulas ci liadas externas , ca da un a con ce rca de 140 est ereocili as
in terconectad as En el otro arco h ay ce rca de 3.500 celulas c iliada s in te rrias,
cada un a con alrededo r de 40 estereo cilias in te rco nectadas. La membran a tee
tor ea c ubre las celulas de Cort i )' se sabe q ue en tra en co n rac to co n las este
reoc ilias de las ce lulas exte rn as, pero ac t ualmen te se d iscute si tambien lo
h ace co n las de las ce lulas in ter n as.
Las celulas de sopo rte proveen apo yo estructural y me tab oli co a las celu
las ciliadas, Se pueden d ividir en dos grupos : el de las ce lulas con filarne n tos
y rn icr o nibu los q ue co n t ro lan la rigide z de la me mbran a basilar y q ue son en
parte respon sables de la d istr ibuc ion espacial de la frecu enc ia de reson anc ia a
10 largo de la membrana; y el de las ce lu las q ue poseen o rgan ulos ca paces de
sin tetizar las prot ein as y de t rans po rtar los ion es n ecesa rios para el me tabolis
mo del organa de C o rt i.
El o rgan a de Cort i se vinc ula con el sist ema nervioso ce nt ral por med io
de dos t ipos de fibr as nerv iosas: las aferentes lle van informacion desde el o ldo
inte rn o h aci a el ce re bra y las eferentes 10 h acen en el sen t ido co n tra rio,
desd e el ce re bra h aci a el o ido inte rne. Exi st en dos tipos de fibr as afere n tes .
Las del t ipo I co ns t ituye n el 95% del to ta l y contac tan uni carnente a las ce lu
las ciliadas interri as, mientras qu e las del ti po II - el 5% rest ante- se co nec tan
34
Zona media
Zona marginal
Fi gur a 17 . Celulas senso riales y de sopo rte e n el 6 rgano de Cort i. A: pilares internes;
E: pil ares ext ern os
con las celulas ciliadas externa s. Cada celula intern a se co m unica co n alrede
dor de 20 n eu ronas afe ren tes de tip o I y cada ne urona aferen te de tip o II sc re
parte entre va rias ce lulas ciliadas cxte rnas, En ca rnb io, las fibras eferen tes qlll
par ten del ce reb ra se co ne ct an solo co n las celulas ci liadas ex ternas , aun qu e
algunos in vest igador es supo n en q ue plied en turnbien ac tua r, aunque inclirec
tarnen te, sobre las ce lulas internas.
El punto de co n tac to a tr aves del cual la informacio n pasa de un a n eur o
n a a o tra se denom in a sina psis, La sinapsis ent re un a ce lula ciliada y un a fibr a
afe ren te se ca rac te riza por un ade lgazarn ie n to de la mem brana celular Y la pre
sencia de pequefias vesicu las en la celula c iliada q ue co n tiene n las susta nc ias
q ufm icas ne cesari as para tran smitir la serial. Por el co n t ra rio , en la sinap sis en
tr e un a fib ra eferen te y un a ce lula ciliada las ves iculas se en cuen t ran en la fi
bra tr ansm isor a.
Celulas ciliadas
Existe n dos clases pri ncipales de ce lulas c iliadas , las in te mas y las externas,
q ue difieren notablernente e n tre sf. Las ce lulas c iliadas internas ticn en forma
globular ca n el nu cleo ubi cado en el centra y es tan sopo rt adas lateralmen te
por ce lulas de soste n , La parte in fe rio r de cada celula interna esta en co n tac
to directo ca n las fibras ne rv iosas q ue se proyect an hacia el sistema n er vioso
35
Endolin fa
Fibras eferentes
Perilinfa
Figura 19 . Trcs mas de ce lulas c iliadas ex ternas tornadas con un microscopio clectron ico
d<: barrido
36
La peri linfa, rica e n sod io, es similar a los fluid os q ue oc upan c l espac io exte
rior a las cel ulas del orga n isrno , rnientras q ue la endolinfa, con un a gra n co n
centrac i6n de potasio, se ase meja al medio llquido interior de las celulas, Dada
su ubicaci6 n en la membra na basila r, las ce lulas del 6 rgano de C urt i esnin ex
pues tas a la en dolin fa en su parte supe rior V a la peril infa e n la in fe rio r, co n
un a difer enc ia de po ten cial de alred edo r de 80 mVe nt re a mb os ext re mos. Du
rante la esrim ulac ion ac ust ica el mov irniento de la membrana basila r se t ran s
m ite a traves de diferente s clases de ce lulas de sopo rte, en uni o n solida ria co n
las celulas sen soriales. Las este reoc ilias de estas ultim as se mueve n cn t re la
membran a bas ilar V la masa gelat inosa de la membrana tec tore a, cxc itando
mecanicarnente las ce lulas ci liadas e inic ian do el proceso de rran sd ucc io n en
tre vibrac i6 n e impu lso nervioso.
Todas las este reoc ilias d e un a ce lula estrin uni das e n tre sf. Se supon c q ue .
co mo est as son n gid as V pivo ta n sobre SLl base, el rno vim ien to ell una d irec
ci6n abr e canales se lec tivos de ion es a traves de los qu e fluyen iones de pour
sio hacia el in teri or V la celula se despolariza. La corr iente ioni ca, qu e fluve
de sde la escoui media hacia e l in te rior de las cel ulas ciliadas in rernas, esr;i 111 0
du lad a por la deflexi6n de l haz de este reoc ilias en rel ac i6 n co n un cje de ma
xi ma sensib ilid ad.
37
Excitacion
lnhibicion
Figur a 20. Deflexion de la estc rcocilias en una ccl ula ciliada int ern a
Los rnov imie nt os en d irecci6n de la fila mas alta pro vocan un aume n to
en la conductancia del sistema y los qu e van en sen t ido co ntrario la dismi n u
yen, mientras q ue los movi mient os or togo na les al eje no la alte ran . La eo
rricnte ionica esta constituida pr inc ipa lmente por iones positiv os de pot asio
(K +) pues su concentracion en la endo linfa de la scala media es mu y alta. La
transd ucci on en las ce lulas c iliadas es no lineal. Los desp lazarnien tos sirnetri
cos del h az de este reocilias desde la posicion de rep oso , de la misma rnagn itud
pcro en sentidos opuestos , gen eran cambios de oonduc ta nc ia asirnetricos .
Inrned iat aruente despues de un disparo la celula c iliada inte rna en tra en
un estado refractario, en el eua l se rea justa quimicamente, de una durac ion
apr ox irnada de 1 rns. N o podra disparar nuevamente h asra h aberlo supera do .
En la figur a 21 se pued e ap reciar el co rnpo rtamiento temporal de un a celula
de Cort i durante un disp aro .
120
50
.z
--,----
-----,
120
B
850 Hz
178/5
f 20
60
60
60
C
1.000 Hz
182/5
11
. . .
</)
oI
II
iii
~
ro
c:
10
15
20
0
0
Q)
10
15
20
10
15
20
-~
Q)
ro
'13 -50
cQ)
e 120
Q)
120
'J
o
a.
1.500 Hz
234/5
-40 -30
E K+
-20
-10
Tlernpo (ms)
Figu ra 2 1. Diferenc ia relati va de pot en cial entre el int erior y el exterior de una neuron a
especializada ante un pot en cia l de accion variable
10
60 ~
60
100
38
40 6 Hz
72/5
E NA++
. ... .
>
-S
r'- --
15
20
120
2 .000 Hz
178 /5
F
2 .300 Hz
83 /5
60
o~
0
10
01. ...
0
I t . . . . . . ,,Ia
.
10
Figura 22. Int ervalos int erdisparo para una neurona aud itiva ant e estfrnulos de diferent es
frecuen cias
39
Sinapsis
dendrita-dend rita
40
Sodio (Na++L.......... .
.~
.'
+++ +"+"+ + + + - - - - + + + + + +
- - - - - - - - - + ++++ -- - -_ "':
~~l~~~~~
I I
Media externa
Fi gur a 23 . Neurona tfpica y rran smision de un poten cial de accion en e l axon de una
neu rona
Le to rna ce rca de un qui nt o de segund o a un men saje llegar desde La cabeza de un orga
nism hasta sus pies -en un pasaje rapido este debe corn pensar este retardo md icandole a sus
pies que ha cer ant es qu e suen e la nota .
41
cia mecanica de 10. membrana basilar. Recordemos que, para un sistema discre
to, 10. frecuencia de resonancia fR depende directamente de dichos parametres a
partir de 10. relacion i =1/jJr;;, en 10. que k representa 10. rigidez y m 10. mas a del
sistema. La variacion de 10. elasticidad en funcion de 10. posicion, en una razon
de 1: 100 entre ambos extremos, es 10. principal caracterfstica ffsica que expli
co. el mapeo frecuencia-espacio que tiene lugar en 10. coclea. La estructura del
organa de Corti, a su vez, cambia continuarnente a 10 largo de su desarrollo.
Cerca del apex, en 10. zona sensible a las bajas frecuencias, las celulas son mas
grandes y las estereocilias mas largas que en 10. region cercana a 10. base, sensi
ble a las altas frecuencias.
Si el estribo empuja muy lentarnente a 10. ventana oval, to. perilinfa paso.
a traves del helicotrema y el volumen total de lfquido permanece constante 0.1
desplazarse hacia fuera 10. ventana redonda. Pero si empuja rapidamente a 10.
ventana oval, la deflexion en 10. membrana basilar compensa el cambio de vo
lumen y no existe flujo a traves del helicotrema. En esencia, una onda de una
frecuencia definida no puede viajar mas alia de un determinado "punto de cor
te" en 10. coclea. A medida que se aproxima a ese punto, 10. onda progresi va se
hace mas lenta, 10. amplitud aumenta y su energfa es absorb ida por el movi
miento de 10. membrana basilar. En 10. Figura 24 se aprecia una onda progresi
va en 10. membrana basilar generada por un estfmulo sinusoidal de 200 Hz.
EI gradiente espacial que define el comportamiento tonotopico de 10. mem
brana basilar se manifiesta tarnbien en 10. pendiente de 10. onda progresiva.
Se puede pensar en 10. membrana basilar como un filtro en el cual la res
puesta maxima ante una serial sinusoidal se mu cve hacia el extrema apical a
Como los pulsos nerviosos que nacen en las celulas ciliadas internas no son 10
suficientemente rapidos como para seguir 10. forma de onda exacta de una se
fial acustica (las ventanas que definen poseen anchos de banda limitados), de
ben existir necesariamente otros mecanismos que permitan codificar dichas
sefiales. De todos los propuestos se destacan 10. teorfa del lugar y las teorfas
temporales. Desarrollaremos aquf la primera de elias y estudiaremos las teorias
temporales en el capftulo dedicado a la altura tonal.
El descubrimiento de la mecanica de la membrana basilar, fundamento de
10. teorfa dellugar -0 teorfa tonotopica-, se debe a Georg Von Bekesy (Bekesy,
G. Von, 1960). Su magntfico trabajo, que le valio el Premio Nobel de Fisiolo
gfa y Medicina en el afio 1961, es el fundamento de casi todas las investiga
ciones posteriores sobre la fisiologfa de la audicion. La teorfa dellugar postula
que cada punto de la membrana basilar vibra a una frecuencia particular, las
mas agudas en la zona cercana a 10. base de la coclea y las mas graves en 10. re
gion proxima al apex, en una especie de mapeo frecuencia-espacio."
Cuando vibra el estribo, la onda generada en 10. ventana oval se propago.
rapidamente por el fluido coclear y liego. al apex en apenas unos microsegun
dos, Pero tarnbien se propaga transversalmente a 10 largo de la membrana ba
silar con una velocidad mucho menor, recorriendo su extension en algunos
milisegundos. La velocidad de propagacion en 10. membrana basilar no es uni
forme y varfa en funcion de la distancia a la base de la coclea. Cerca de 10. ven
tana oval la velocidad es rapida y la longitud de onda comparativarnente
grande. En el apex, por el contrario, la velocidad y 10. longitud de onda son
mucho menores. La velocidad finita de la onda progresiva implica un retardo
acumulado en funcion de la distancia desde el estribo que produce un corri
miento de fase, tambien acumulativo, de gran importancia en algunos proce
sos de transduccion coclear.
Esta caracterfstica mecanica de la membrana basilar se debe a que funcio
no. como una estructura de soporte con parametres que se modifican gradual
mente a lo largo de su extension. Es mas angosta, gruesa y rfgida en su base y
deviene progresivamente mas ancha, delgada y elastica a medida que se acer
co. a su extrema apical. La rigidez aumenta progresivamente hacia la base de
10. coclea, mientras que su masa decrece en 10. misma direccion. Este gradien
te de rigidez y masa permite la variacion gradual de la frecuencia de resonan
....
................
LJ
:::J
~
Q.
"
'"
'
I
,
I"
/
20
22
24
26
28
.....
....
30
32
Figura 24. Dos instantes diferentes de una onda progresiva generada por una excitacion
sinusoidal de 200 Hz
42
43
liiio......
11 kHz
2 kHz
Base
200 Hz
500 Hz
10
20
30
Apex
Retardo
acustico
OJ
E
~
C1l
IS.
<f)
OJ
1\
A"
VVVV
0,4 0,5
Tiempo (ms)
Figura 26. Respuesta mecanica ante un impulse del punto de ta membrana basilar
correspondiente a una frecuencia de resonancia de lO.OCO Hz
256
C1l
>
192
Q)
~ 128
C1l
u
"OJ
2
c
64
44
45
.........
5. COMPORTAMIENTO A CTIVO DE LA
alinea lidad co clear se ve rifica al excitar un otdo co n dos sin uso ides de frecuen
c ias fl y fz. El eco coclear qu e apa rece co inc ide en frecuencia co n e l soni do de
combinac i6n princ ipal 2fl - fz. Este resultado pru eba la d istorsi6n arm6 n ica 0
alineal q ue ac nia durante e l proc eso de tran sducci6n (Basso, G., 2001 a) .
La alinealidad oc urre princ ipa lmente en los lugar es de la membrana basi
lar pr 6x imos a la frecu enci a de resonanc ia co rrespo nd iente. En un cadaver la
respuest a es siempre lin eal, ta l co mo consrato Von Bekesv en sus experirne n
tos, ya que desapa recen los proce sos ce lula res ac t ivos apo rtados fun dame ntal
me nte par la motricid ad de las ce lulas c iliadas ex rern as. La a lin eal ida d se
pierde co n el dana fisiologico y co n la rnuerte: los ecos cocleares solo se o b
ser van en suje tos en bue na co n dicio n fisiologica, Estan relac ionad os con pro
ce sos vu lnerab les y las h ipoacu sias te rnporarias 0 perrnan en tes, c iertas d rogas
y otros tr astornos fisio logicos los in hibe n .
En aprox imad am ente e130 0/0 de las personas apa rece n em isione s otoac us
ti cas espo n taneas , que suce den en ause nc ia de est irnulos ac ust icos ex te m os.
Los tinnitus 0 acasieros so n, e n ese nc ia, em isio nes o to ac iist icas espontaneas.
MEMBRANA BASILAR
Y EMISIONES OTOACUSTICAS
D e ac ue rdo co n la teor ia dellugar clasica, tal como la enunc i6 Von Bek esy, la
membra na bas ilar ac nia co mo un an a lizado r lineal de Fourier co n un poder de
resoluci6n in sufic ien te par a exp licar la reso luci6 n en frecu en cia del o ido hu
rnano. En o tras palab ras, e l anc ho de banda de la resonanc ia de la membrana
es muc ho mayor q ue el que se rnide en los expe rime ntos psicoacu st icos. Pa r
ejemplo, de ac ue rdo can la teorf a delluga r clasica , a l exci tar la mem brana ba
sila r a un a frecu enci a ce ntra l de 1.000 H z ap arece una banda de 100 H z de ex
ten sion, cie n veces mas gra nde q ue la reso luc ion re al, q ue es del o rden de 1
H z pa ra d icha frecuencia centra l. La causa de es ta enorme discrep anci a es, 10
sa be mos aha ra, la existenc ia de un me canismo ac tivo e n e l o rgana de Co rt i
q ue Von Bekesy, a l tr ab aja r exc lusivam en te can ca daveres , no pudo descubr ir,
En 197 8 Kemp enconrro que al estimular el timpano de un ind ivid uo vi
vo can un impul so de baja intensidad se dete ct a un eco ge ne rado en e l inte
rior del ofdo (Kemp, D . T., 197 8 ). C omo esras se riales poseen un re rardo
comprend ido entre 5 y 60 ms se sugiri6 que tenian un o rigen co clea r. Ac tual
me nte se las co noce co mo ecos co cl eares, ecos de Kem p a em isio nes oroaciis
t icas evocada s. El nivel re la tive de la reflex ion es mayor a menores n ivel es de
excitaci6n, 10 q ue revela una o peraci6n n o lineal. En ocas iones, la energia re
flejada supe ra a la en ergfa in c idente eviden ciando un proceso activo de am
plificac ion biologica. Las e m isio nes otoacu sti cas provienen de la ac t iv ida d
morora de las ce lulas c iliadas ex te m as.
El descu brimi ento de Ke mp mo d ifico profundarnente el co noc imie nto
qu e ten em os sobre la fisio logfa del o fdo. Los proce sos cocl eares ac tivos posibi
lit an la sin to n ia de banda angos ta que se ob ser van en las ex pe rienc ias psicoa
custicas y q ue las teorias an terio res basa das en el ofdo como un receptor pas ivo
-corno la teo ria c lasica de l lugar-, no pod ian explicar. El co mpo rta m ien to ac
tiv o de l oido interno permite su aso mbrosa resolu c ion e n frecu enci a, su gran
se nsibilida d ante es timulos debiles y explica el efec to de supres i6n de un to no
po r otro, temas que desa rro llaremos ma s ade la nte.
La ac rividad co clear pued e e n te nderse tarnbien co mo un a relacion alineal
entre las sefia les mccan icas de en tr ada y salid a. Numerosos trabajos en indi vi
du os vivos han demostrado que la resp uesta de la membrana basi lar es a lin ea l,
es decir que la salida no responde proparc ionalmente a la entrad a. A ni vc lcs
de serial de e n trada po r debajo de 60 dB, un mecanismo bio logico ac t ivo a m
plifica la respuesta coclea r. A med ida q ue el n ivel crece la arnplificacion d ismi
nuy e y, para altos n ive les en la sefial de ent rada, ce rca nos a 90 dB, e l
mecanismo ac tivo deja de o pe rar y e l sistema deviene linea l. U na pru eb a de la
~ (t) =
U na parte de las respu est as gd (t) Ygi ( r) esta dad a por las ca racterist icas del am
biente ac ust ico ext er ior y o t ra part e po r las fun ciones de transfere n c ia defini
das por los hombros, la forma y tam an o de la ca beza y e l pabellon auric ular.
Los efectos de esras piezas ana rornicas se v ue lve n sign ifica rivos c ua ndo las lon
gitudes de on da so n co mpa rab les con sus di mensiones a causa del fenomen o
de difraccio n , tal co mo ve remos e n c l ca p itulo VII. Pa ra sirnplificar la ex pos i
c ion, obv iare mos d esde aq ui las diferenc ias en tre los o fdos derecho e izquier - .
47
46
........
20
do y uti lizare rnos la tra nsfo rmada de Fourier H (w) para sirnbo lizar la respues
ta espec tra l de la entrada aud itiva h(t) .
En el trayecto del estimu lo interv ierie a con tinuacion la funci 6n de trans
ferencia de l canal audi tivo extemo E(w ), que al cornbin arse co n H(w) modi
fica la serial de entrada de la manera que se ve en la Figura 28 .
En seguid a aparece la acci6n del sistema de pal an cas y filtros del o fdo me
d io, cuya funci6n de tran sferen cia promedio, C(w ), se aprecia en la Figura 29.
Si se co rnbin an las tres funciones de transferen cia an teriores se obtien e la
func i6n de transferenc ia total entre la Fuente ac ust ica y la entrad a de la coclea
S(W) :9
S(w) = H(w ) (W ) C( W)
til
:s.
'S'
I A mplitud
10
O r.
W
"3
~ -10
-20
0,2
0,5
10
15
Frecuencia (kHz)
30
humane .
EI notable ajuste entre la func i6n S( w) co n la curva de sensibilidad de l
o fdo permite afirma r que el proceso q ue sigue luego de la llegada de la sefia l a
la membran a basilar es, al men os para in ten sidad es med ias, esencialment e li
neal. Risset afirma: "En un articulo te6ri co , Yang, Wa n g y S hamma ( 1992 ) de
mostr aron q ue un modelo fisiologico pla usible de la periferia a ud itiva pu ede
ser in vertido y usado para regener ar I.a entrada or igin al cornpl et amente . Este
resultado sugiere que el siste ma aud itivo n o pierde informacion acu st ica en las
eta pas ternpra n as de l proceso" (en Deutsch, D., 1999) .
20 f.._...._ ..j
'S'
g:
~ _ _ _j ..
10
__j- - - -
o
0,2
0.5
10
2
Frecuencia (kHz)
Figura 29. Fun cion de tran sferen c ia del oido medic C(c.o)
'0
'0
(jj
'0
is
<I>
E
o-..
;=::3 I~I
"' -'"
1[
I:..~:.:.:~ . .__.. . . . ._
Q.
...
,.10 dB
L'0,2
_.--/
.-
'0
ro
~
:0
'in
..
<I>
0,5
en
I
10
Frecuencia (kHz)
Figura 30. Fun ci6n de tran sferencia ent re el campo externo y la coclea S(c.o) (puntas)
co mparada con la sens ib ilida d prornedi o de l oido h urnano ([(nea)
9 La relacion expuesta es val ida solo para Fuentes acusticas loca lizadas frent e al oyen re. En
el ca pitulo VII sc analizara el caso general.
48
49
..........
Hemisferio
izquierdo
dB
o
0....
21
-40
<:
'.
'~.?
...~.....
'.,
,
-60
'0
"
-80
6
6
9
9
<1..
4......
'Q,
'q
. ~.\'
6
6
?
9
.dJ
~
,
'\
r-,
"'f
Hemisferio
derecho
I:,
-100
0,1
0,2
0,5
10
20
50
Frecuencia (kHz)
... :
. . ( .0
..
. . . : 0
0..-....
::
Figura 31. Umbrales de respuesta de diferentes fibras simples ante diferentes esttrnulos
sinusoidales. La segunda pendiente es del orden de 1.000 dB/oceava
-,
tiple entre ambos sistemas. En todos los casos, el mapeo ocurre entre un siste
ma unidimensional, la coclea, y otro bidimensional, la corteza cerebral. Aun
que nos representamos al cerebro como una estructura tridimensional, quiza
sea mas cercano a la realidad pens arlo como una estructura bidimensional -la
materia gris- plegada en numerosas convoluciones.
Lo que sf se puede afirrnar es que la informacion acustica llega al sistema
auditivo central con un grado de detalle extremadamente fino. Por ejemplo, dis
tinguimos diferencias de apenas 10 IlS entre las sefiales que nos llegan a los dos
oidos; tornando en cuenta que la duracion de los pulsos mismos es de 100 us,
diez veces mas largos, la precision del sistema resulta poco menos que increible.
Las propiedades de respuesta en frecuencia de las celulas ciliadas internas,
asistidas por la realimentacion positiva provista por las celulas ciliadas exter
nas, se muestran en la Figura 31 para cuatro frecuencias centrales distintas. La
segunda pendiente es del orden de 1.000 dB/octava, valor consistente con
nuestra capacidad de discriminacion diferencial de aproximadamente el 0,3%
de la frecuencia central correspondiente.
Se define asi el maximo nivel de detalle espectral posible a la entrada del
sistema de transduccion, De acuerdo con las experiencias psicoacusticas en la
boratorio, este nivel de detalle se conserva intacto a 10 largo de toda la cade
na sensoneural.
El recorrido esquematizado de la informacion auditiva, desde que abando
na el ofdo hasta que llega a la corteza cerebral, se puede ver en la Figura 32.
Aunque el recorrido y la naturaleza de la informacion acustica distan de ser
Oido izquierdo
Nucleos
cocleares
venlrales
Nucleos
cocleares
dorsales
Oido derecho
Figura 32. Recorrido esquernatico del flujo de informacion entre el oido extemo
y la corteza cerebral
50
51
-~ ro
VI
Q)
>
:;:;
5.. .~
Capitulo II
Sonorida
~ -
a:
VI
I
~ ~
>
W :.;::;
:5~
~I
o ~
oro
'C
OJ
U '"
:~
~
'u
';:: 0
OJ C.
ro
Q..
'C E
VI
U2
OJ
c
c '"
:g
~ro ~
~
'0 ~
OJ ~
c. OJ
VI U
w
Qj
"0
(;
't:
0"0
~
~
~
~-5 ~
<3 '~~ ~
<ll
'
ro
Co
>
VI
o 0
VIC
oQ
=,-~
.~ '~.~
ro
::
~ - E ~
.J
EfJ)~
b'
~
2~
<ll '"
u~
.:J U
Z
0
U
co
C
::J
EU
VI ro
.~ ~
U
OJ
"0
OJ U
'"
:J
<{
co ro
- _.
-"0
~ co
,w
:.=
~B
co . ~
U '(3
15~
"OC
C ' ro
0;=
<ll.o
g 'O"J
"i:i
f- U
-0
OJ
'"
c. C '"
r:!
.S: ~.~
_
.0
"'C
C
'" OJ
UX
OJ
~
-0
c:
r5
;::;
00
'tJ~
ro 0
VI
...c
u
-;::;
. ",
"'
"0
-0
-9
._0
c.~
.~
.c-
ro
ro
c
;2
v
v
-0
c ~
OJ '"
OJ
VI
:J .:J
U- U
'"
52
'"
'"ro
i.I:
Es razonab le relac ionar la sono ridad - un a mag nitud perceptu al- co n la inten
sida d de la serial ffsica que la origin a. El me cani smo parece claro: un a on da
acu stica produce cierta presion d ina rnica en el aire a la entrad a del ofdo ex
terno y gene ra mov im ientos de amplit ud proporcional en el timpan o, en los
huesos del ofdo rnedi o , en la ven ta na ova l y en la membrana basilar. El movi
miento de la membran a basilar, a su vez, implica la est imulac i6n de las ce lu
las cili adas y la apa rici6n de un a cant idad de impu lsos nerviosos v iaja ndo por
el n er vio auditivo . La relaci6n ca usal intensidad [fsica ~ sonoridad se insiruia
co n apa ren te clarid ad. Pero , ies legfti mo considerar a la sonoridad com o un
rasgo autonorno, que se puede estud iar de maner a indepe n diente, sepa rada del
resto de las ca racterfsticas que definen un son ido real? Es pract icarnen te un a
pe rogrullada dec ir que todos los sonidos q ue n os resultan relevan tes esta n ca
racterizados par diferencias en la int en sidad del espec tro a 10 largo del tiern
po, pues la percepc i6n de la intensidad del est fmulo ac iistico esta presente en
todos los aspectos de la func i6n audit iva. Pero la in te nsi dad en sf misma , aun
que resulte vita l pa ra la funci6 n supe rior de extraer informac i6n de los son i
dos de l amb iente, n o es un rasgo de in ter es primar io para la aud icion.
A clarado 10 anterio r, debema s recon ocer que el est udio auto n orno de la
pe rcep ci6n de la intensidad es uno de los ternas tradi cion ales de la inv est iga
ci6n acustica y h a ge nerado gran ca n t idad de informaci6n relevante . Durante
los ultimos di ez afios se h a increme n tado notabl ernenre nuestro co noc im ien
to sobre un a de sus princ ipales carac te rfsticas, q ue es la forma en q ue el siste
ma auditivo repr esenta a cod ifica la in tensidad de las seftales ac usti cas ,
En 10 qu e sigue describ iremos el esta do actua l de los est ud ios sa bre el te
ma, tr at ando de n o perder de vista nu estro objet ivo ce ntra l - a curnplirse un os
capftulos mas ade lan te : int egrar cada un o de los rasgos en un a imagen globa l
y cornpleta del so n ido tal como efectivame n telo perci bimos.
Par el memento, podem os adopt ar la siguien te defini cion de sono rida d ,
que nos va a serv ir para co menzar su estudio . "La so no rida d es el rasgo de la
53
sensac ion aud itiva e n terrninos del c ual los soni dos puede n se r o rde na dos en
un a escala q ue se ex tiende de l silenc io a 10 muy sonoro".'
En esta defi n ic io n , la sono rida d apa rec e como un a tributo gen era l del so
n ido y se refiere , a nte tod o , a la sonoridad global de un o bje to acustico. Mas
ade lan te la arn pliaremos pa ra an alizar la sono ridad de los difer entes eleme n
tos que co mpo ne n dich os obje tos,
rftrni ca, el decibel, mucho mas adec uada para descr ib ir la relac i6n entre la
energfa de l est imulo ffsico y la sono rida d resulta nte." De aq uf se obt iene un a
de las magni tudes mas usadas en ac ust ica , el nivel de presion sonora (N PS),5 cu
ya un idad es el decibel (d ls) :
culo de Plack y Ca rlyon en el que emplean los termi nos loudness y subjecriveintensity ( Moo
2 Son los l.0 l3 h Pa (hecro pasca les) que informa el servicio meteorologico como presion
arrnosferica normal.
3 Ernst Heinr ich Weber (1795 -1878) y G ustav Theodor Fechner (180 1-1887), fisiologos
54
P = !:iE /!:it
4
[W] = [loulej/[s]
U n poco mas ade lan re vamos a volver sobre este pun ro.
Ing les se 10 denomina sound pressure level (SPL).
S En
55
Presi6n dinarnica
lntensldad
20 Pa
1wlm '
-I-
120 dB
2 Pa
lO-'wl m'
-I-
100 dB
200 mPa
10'" wl m'
.L
80 dB
20 mPa
1 0~ wlm'
-I-
60 dB
2 mF:a
1 0~ wlm'
40 dB
200 ~Pa
20 uPa
1O-1'w!m'
-I-
[W/m 2]
1 = P I A
Situaciones tlpicas
Es posible de most rar qu e la in ten sidad ac ust ica de una onda progresiva pla na
es propo rcional al cuad rado de su presion d inarnica:
p2
I = - [W/m 2J
p~.c
0 dB
Es dec ir que la po tenc ia de scribe la variac ic n de ene rgfa .'lE que ocurre en e l
tiemp o .'It.6 En ot ros te rrninos, es e l traba jo Fis ico ejercido por la Fue n te duran
te e l t iempo .'lL La po te nc ia aciist ica max ima qu e en trega n algunos instru
mentos musicales se puede aprec iar en la siguien te tab la (los va lores son un
prom edi o ent re varias mediciones):
Z. PERCEPCION
Fuente acll.snCa
C an tan ie (teno r)
Flaura
Trornpera
Tromb 6n
O rquesra sinfo n ica (fff)
W
W
W
W
W
La ene rgia tot al que rad ia la fuente se pro paga en mu chas d ireccio nes. En par
ticu lar, a nosot ros nos va a in teresar la que atrav iesa determinada area (por
ejernplo, el tfrnpano de un a per son a) . O tra magn itu d , la intensidad acustica (I),
da cuen ta de la po te ncia que atrav iesa un area A:
La pot en cia insranta ne a se calcula a partir de la derivada de la ene rgia co n respecto a l
tiernpo: Pi = JE/Jt.
DE LA SONO RIDA D
La sonoridad es una magnitud percep tual y como tal no pued e medi rse d irec
ram en te a partir de sensores fisicos. Pu C ~LO que todas las te cni cas indi rect as de
rned ic ion apor ta n sus propi os presupue stos y lirnitac iones, nu estra discusi6n
in clui ra necesariamen te un a descrincion de la metod ologla aplicada en cada
uno de los casos ex puestos . Quiza la me nos cont roverrida de las tecni cas de
medici6n sea la de comparaci6n de sonoridades, en la que un oyen te debe variar
la intensidad de un estimu lo hasra con segu ir igua larlo en sonoridad can ot ro
esta ndar de intensidad fija. En este rnetod o el oldo se usa como un detector de
cero y es capaz de revelar como otros parametre s de la serial, tales como la fre
cuencia 0 el anc ho de banda , afec ta n la sonorida d. Tarnb ien sirve para detec
tar la manera en que alguna carac terfst ica parti cul ar del oye nte , como un a
perdida de sens ibilidad aud it iva , influye sobre su per cepcio n de la sonorid ad .
56
57
1IM~
1'
- - - - - - - - - - - - - - -.........._
90
Umbrales absolutos
80
EI umbral abso lute de in ten sidad -Ia in tensid ad a part ir de la cua l cornenz a
mos a perc ibir so n ido- fue de te rm in ad o por pr imera vez en la segunda mitad
del siglo XIX. S e 10 m idi6 a una fre cuencia centr al de 1.000 H z y se supuso que
e l o ido hu m ane manten ia un comport amiento parejo a 10 lar go de todo el ran
go audibl e. H oy sabemos q ue, para un a sefia l sin uso idal de 1.000 Hz , la mayo
ria de las personas con o ido sano co m ienza a o fr c ua ndo la intensidad alcanza
unos 10- 12 W/ m 2 . Est a in rensida d eq uiva le a un a presion so nora de 20 millo
nesirnas de pasca l (20 flPa ), 0 a una arnplit ud de mov im iento de 10-11 m ( 0
0 ,1 A iun dec imo del d iarnetro del ato rno de hidr6gen o!). EI o ido humano es
in crefble rnente sensible a la intensid ad ac iistica, pues si pud iese rnos perci bi r
in te nsidades aiin menores o irlarnos e l rui do provocado par la agitac io n terrni
ca de las mo lecu las del a ire . C uan do comparamo s n ues tros old os co n los de al
gun os animales nocturnes, co mo los ga to s 0 las lechuzas, no de be mos buscar
en una m ayo r se nsib ilida d abso luta la razon de sus exc elentes ca pac idades au
di tivas (n o a l me nos a 1.000 H z).
La vari aci 6n del umbral de aud ici6n en fun ci6n de la frecue ncia del est i
m ulo se obtien e habitual mente a pa rt ir de dos met odos: el de la presion mfni
ma audible (MAP), q ue se e valua con auriculares, y el de l mtrurno campo audible
(MAF), q ue se mid e con a lta voc es y q ue incluye los efec tos de filtro del ca n a l
aud itivo extern o y del pab e llon a uricu lar (de gran importancia para defin ir los
filtros HRTF). 8 La Figura 2 perrn ite apreciar, junto a est os umbrales, el corres
pond ien te al minima campo audible binaural (MAF bin aural), q ue es a lrededor
de 2 d B me n o r q ue el monoaur al.
Se co nsideran sujetos co n aud ic io n nor ma l aq uellos q ue presentan urn
brales de h asta 20 dB por enc ima de la curva anterio r. Pa ra frec uenc ias sup e
rior es a los 1.000 Hz las d ifere n c ias interindividuales so n apreciabl es.
Es n otabl e la sernejanz a de for ma que existe entre la sens ibili dad del ofdo
de riv ada de los filtros del siste ma aud itive pe rife rico (figura 30 del ca pitulo I) y
la in versa de la c urva umb ral que acabarnos de presentar. Ademas de proporcio
n ar la identificac ion puntu al de la causa de cada resonancia y de cada factor de
ponderac ion espectral, la sernejanza alud ida permi te supo n er un a cod ificac ion
espectral "pl an a" en los ni veles superiores de procesamiento neur al, a part ir del
flujo de informacion q ue asc iende por el ne rvio a ud it ive . A si, pode mos inferir
q ue tan to la sens ibilidad max ima del o ido alrededor de los 3.000 Hz, como la
ca rac teristica de Fittro pasa altos que pre sen ta h asta los 5.000 H z, se originan
prin c ipalmen te en la resonanc ia ac ustica del co nd uc to aud itivo exte rno .
8
Fun cion es de trans feren cia relativas a la cabeza (Head Related Transfer FLmcrions) .
58
70
ill
60
50
40
"5
U)
..0
co
30
\\
\'
- - - MAF (monoaural)
- - MAF (binaural)
\
\
1
..0
20
::J
10
~
-c
~ ..
. ....
" < , ; ~ .... . . .., ....
..
10 [ . , ", "I
" , , " "I
0.02 0 .05 0.1 0.2 0.5 1
,~~ II
I
20
Frecuencia (kHz)
F igura 2. Mfnimas inr ens idades ac usticas audi bles (umbrales MA P y MAF)
En cuan to a los lim ites de audi bilidad pa ra bajas frecuenc ias, pode mos
apuntar que W h it tle m idio en 1972 los umbrales entre 3 ,5 y 50 H z y conclu
y6 que forman un continuum co n las curvas a frecuenci as medias (a 3 ,5 Hz se
n ecesitan 120 dB pa ra lle gar al umbral) (W hi t tle , L. S. et at., 1972 ). En 1974
Jo nson sugiri6, n o ob sta nte , qu e pa ra so n idos de men os de 16 H z 10 que se oye
es el prod uc to de la d istorsion arm6 n ica de l o ido (Johnson y Gierke, 19 74) . EI
lim ite para siru acio n es norm ales parece ser de alrededor de 16 H z, frec uen c ia
cercana a la m as baja que prod uce una sens ac i6n clara de alt ura ton al.
En la practica c hn ica los urnb ra les se to rnan co n rel ac i6n a los co ns idera
dos "estad fs t icamente norrnales" y se mid en e n niveles de umbral (HL) : un urn
br al de 40 dB HL a 100 H z sign ifies q ue es ta 40 dB por enc irna del um bral
normal a dicha frecuen c ia. En el aud iograrn a de la Figur a 3 se pu eden ver los
ni veles de um br al HL para ambos o tdos.
La sensib ilida d del o ido humano a la intensidad es desraca ble ta nto en ter
minos absolutos como en term ln os del ran go de valor es al que responde (del
orden del billon de veces entre la maxima y la minima in ten sidad perceptible,
o del rnillon si 10 medimos en pres iones ac usticas)." EI mo tivo de se mejan te
range hay que buscarl o en el con jun to de son idos h abit uales en los ti empos en
los q ue estas ca pac idades se fijaron biologicamente La gran sensibilidad ante
esti mu los minuscul es, del orden del decibel , n os permitia o ir por ejernplo el an
dar d istan te de un de predador 0 de una peq uefia presa. En aquellos tiernpos
tarn bien existian est imulos de gran ene rgia, co mo el so n ido de un t rueno 0 de
9
En n ume ros, un a relaci6n de 10 11/1 en inten sidad, 0 de 10 6/1 en pr esi6n acu stica.
59
120
110
100
90
80
:s. 70
e0 60
c
0
50
en
40
Qj
>
Z 30
20
10
0
-10
0
CO
.s.
~
E
10
rJ
:J
OJ
0
Qj
>
30
co
20
a ido derecho
Oido izquierdo
.......
. . \;
\
Oido normal
..
1\
40
50
Deterioro causado
por exposici6n al ruido
~"'\4 ";"
\, \
",: ....
... ..
60
0.02
70
125
250
500
1000
2000
4000
8000
Frecuencia (Hz)
un grito a co rta distancia. La est rategia q ue nos perrnitio co nse rvar una sensibi
lidad auditiva ex tre ma sin qu e po r e llo aurnen te exce siva rne n te la fragilidad de l
siste ma es co mp \eja y au n no se co no ce corn plet arnente. Ent re los facto res de
impo rtancia qu e int ervienen esta, sin du da, el efec to de lupa pro pio de la co m
presion logarftmica q ue opera entre el est fmu lo y la respuesta: n uest ra sensib ili
dad es maxim a a pequefias int en sidades y se va red ucie nd o a rnedida q ue la
in tensid ad aumenta. As!, para estimulos ce rcanos al um bral de do lor, e l co njun
to de mecan isrnos perifericos y cen t rales qu e se descr ibieron en el cap itulo I at e
mi an co ns ide rableme n te la serial que nos llega de l exteri or.
60
0.5
10
Frecuencia (Hz)
61
11:111 :
mo ya sabe rnos, este maximo de scns ib ilidad se o rigin a e n la resonan cia del
co nd uc to aud itivo ex te rno .
S i se gene ra un a serial sinuso idal qu e recorra co mpleta me n te una de las
curvas de igual son oridad se a ye un glissand o perfecto , de sono ridad co ns ta n te.
Una co nsec ue nc ia de las curvas isofonas, muy cornun en el ca mpo de la
mu sica, es el co n tro l de sono rida d --0 loudness- qu e posee n algunos prearn pli
flcad or es de aud io. Las grabac iones de piezas de rruisica se realizan por 10 ge
nera l a ni veles altos , do nd e la sensibilidad del otdo es plana . S i se re produ cen
a ni vel es meno res ca mb ia el balance espe c tral al ca mb iar nu estra sensiblltdad
a ud itiva: ol mos debil itadas las regio nes mas grave s y agudas de l espectro . Para
corregir este efeeto algunos eq uipos de aud io v iene n eq uipados co n un co nt rol
de sono ridad q ue refuerza los ex tre mos del espec tro a bajos n ivcles de arnp li
ficacion. La salida del prea rnplifica do r can el control de sono rida d ac tiva do si
gue de modo mas a rne nos feli z la c urva um bral de aud ibilida d .
La ley psicoflsica
Este problema se encaro in icialmente en la segu nda mitad del siglo XIX. Los fi
siologos aleman es Weber y Fech n er propusieron un a ley psicoftsica q ue pre
tendla vinc ular los est imulos can las per cepciones a cra ves de una rela c i6 n
co rmi n a todos los sen tidos . Esta ley fue co ns iderada adec uada y se la reprodu
jo e n la mayorf a de los te xtos espec ializados h asta no hace muc ho t iern po .
Au nque dio lugar a un a variedad de tecn icas y unidad es de medici6n en tre las
qu e se enc ue n tra el decibel , en la mayoria de los ca sas no es n i aprox irnada
mente co rrec ta . La definicion mas d ifundida de la ley psicofisica estab lece q ue
la magn it ud psicol6gica pe rcibida es proporc io nal al logaritmo del estimu lo fi
sica . Es dec ir, qu e mul tiplicaciones sim ilares en la magnirud del estfrn ulo ge
neran adiciones prop orcion ales en la respuesta pe rceptual, t ransforrnan do un a
esca la geornetrica en un a esca la aritrnet ica. En el caso del sonido , 10 anterior
sign ifica simplemente que n uest ros ju icios sob re la sono ridad deben seguir
62
La sonoridad
A pesar de qu e las recn icas q ue e mplea n al aida co mo un det ec to r de ce ro -eo
mo la de co rnpa racion de sonorida dcs- ha n probado ser utiles en la de te rmi
nacion de los fac to res q ue afec tan la sono ridad , no proveen un a medid a
direct a de la sensac ion percib ida. U no de los proced im ien tos emplead os pa ra
resolver el pro ble ma fue aplica r la tecni ca de es timaci6n de magnitudes, en la
qu e el oyente debe simplernen te as igna rle un ruim e ro a cada sonido de d ife
ren te in te nsidad . Una a lterna tiva co ns iste en emp lea r la tecn ica de producci6n
de magnitudes e n la qu e, a la in versa, el oyen te deb e ajusta r la intensidad de un
estfrnulo de ac ue rdo a un num ero dado de an te rnano. Duran te la decada de
195 0 S te ve ns e rnpleo a mbos rnet od os para desa rro llar sus esca las de sonoridad,
qu e descri ben la relaci6 n e nt re sonoridad -percep tual- e intens idad -ffsica
(Stev ens, S . S ., 1959 ). Los pro blemas me tod o l6gicos q ue enco n tro fueron
mu y grandes pues resu lta d iffcil cuantificar la sono ridad q ue es, como ya sabe
mos, una mag n it ud enterarnente pe rceptual. S tevens tuvo q ue defini r un a
n uev a un idad, el son, para c uan t ifica r d irecta rnen te la so no ridad . EI son es, fi
na lmen te , un a un idad lin eal: un son ido de 2 sones posee el dobl e de sono ri
dad qu e un o de 1 son, y un o de 3 sones el tr iple. A l igual que la altura, la
sonoridad es un a magn itu d perceptual y deberta definirse a part ir de un a un i
dad de referen d a estable. Pero co mo la estabilidad en el ca mpo de las sens a
ciones es mu y poco confia ble, se to ma un a refe rencia ffsica ex terria: un a serial
1.000 H z y 40 dB (40 fones) pro duce par defin icion un son ida que posee un a
sono rida d de 1 son (pa ra la altura ra rnbien se to ma un a refe rencia ffsica ex ter
na: 440 H z definen e l La en mu sica j.l?
A pa rtir de los trabajos de S teve ns se enco n t r6 qu e la relaci6n esn rnulo
respu esta sigue aproximadamente una ley de potenc ia, diferen te a la ley loga
rltrn ica de los psicoffsicos. Prop uso la siguien te relacion en t re la sonori dad (S )
y la intensidad ( I):
63
Traducci6n de GB. Hermann Ludwig Ferdinand von Helmholtz (1821 -1894 ) fue un cien
electr odinamica.
II
64
20
10
5
2
Ul
~
0.5
02
'0
'
0,1
g
o
(f)
0,05
0.02
0,01
0,005
0,0 02
0001 11...L._
I
'
~_~_~_-:,..
20
40
60
80
Intensidad (dB)
com pen saci6n "A" sigue de rnanera aprox imada la curva de respuesta del ofdo
para un nivcl de sonoridad de 30 fones, en co rnpensacion "B" la de 70 fones, y
en cornp ensacion "C" es practi carnente lineal. Cas i toda la norrnativa relacio
nada co n acustica ambien ta l esta espec ificada en decibeles A. Por ejernplo, el
n ivel equivalente de ruido acep table en zonas residen c iales no deberfa superar
los 65 dBA en horarios de aetiv idad diu rn a ni los 50 d BA duran te la noche.
S i se tornan dos lec turas de un a misma serial, una en dB lineales y o tra en
d BA , por 10 gene ral la ultima dara un valor in ferior pues se filtran las band as
graves del espectro de ruido.
Los medidores de niv el sonoro, sin embargo, s610 son confiables cuando
se los emplea para med ir sefiales continu as de larga duraci6n. Las respuestas
percep tuales an te seriales imp ulsivas 0 muy co rtas no co rrespo nde n a la mag
n itud que indi can . Los med idores ta mp oco proveen lecturas satisfactorias de
la sono ridad de estfmulos compuestos muy separados en frecuencia. Y, por su
puesto, no estan ca librados en sones, la un idad que debe ernplearse para eva
luar la sonoridad prop iamente d icha.
Sumario de unidades relacionadas con la sonor idad
EI camino que nos !lev6 de la arnplitud de las ondas en el aire a los sones es co m
plejo y se podrta supo ner de una dificu ltad innecesaria. Sin embargo, la auten
tica co mplejidad esta dad a por la multiplicidad de mecan ismos que actuan en la
cod ificaci6n aud itiva de la in tensidad. Para ilustrar esta situaci6n volvamos a las
65
I,
Tab la 1. Magn itud es relacion ad as ca n la sono ridad (pa ra ondas ac ust icas plan as)
Magnitud
Naturaleza
Unidad
Rango audible
Amplitud
Presion
Nivel de presion sonora (NPS )
Inte nsidad
N ivel de in tensidad (N I)
N ive l de sono ridad
So noridad
Fisica
Fisica
Fisica
Fisica
Fisica
Metro
Pascal
dB
W/m 2
dB
Fan
Son
10 - II m - 10 5 m
20 ~ P a - 20 Pa
Od B - 120d B
10- 12 W/ m2 -I W/ m2
Od B - 12Od B
fa n - 120 fanes
so n - 250 so nes
Hjbrida
Psicol6gica
o
o
Sonon dad
(sones)
an
1) L1L =
2) L1L = 10 log (& /1)
3) L1L = 10 log {(l +
an / l}
NI
(dB)
I3
66
67
-En todas ellas I es la intensidad de la seria l de base (el pedest al) y 61 la inten
sidad del menor incremento de tectabl e par el ovente.
Para medir ellimen de in ten sidad se emplea co n frecuencia el metodo de
elecci6n for zada entre dos ouemaiioas (2 A FC ), en la que cada suje to de be op
tar obligatariamen te po r alguno de los son idos qu e oye, aiin cuando le parez
ca n ind istinguibles. El umbr al de discrirninacion se o bt iene cuando la
d iferenc ia 6 1 e n el est fmul o prod uce el 75% de respu estas co rrectas. Esta tee
n ica se ap lica a part ir de tre s rnetodos pr in cipales: m etod o de det eccio n de
rnodulacion, de deteccion de increm en tos y de discriminacion de estimulos
pul santes. En la detecci6n de modulaci6n los oyentes deben n ota r la presencia
de un a pequefia rnodulacion en a mp litud en una sefial dada. En ladetecci6n de
incrementos y en la oiscrunuiacion de estimuios pulsaiues deb en perc ib ir un cam
bio en la inte ns idad de un est fmu lo esta nda r (el pedestal ).
8 kHz
<,
1.5 t- .......
iii"
"0
;;:- 1.G1-c
200 Hz
1 kHz
40
60
80
b)
100 r
La L ey de W eb er
68
<,
0.5
, . - - - - - --
Para ruido de banda an cha se co rnprobo que el min imo ca m bio de in tensidad
de tect able es una fraccion co nsta n te de la inte nsidad del est frnu lo . En otras pa
lab ras, la razon 6 1/1 se rnan tien e co nsta n te. Este es un buen ejemp lo parti c ular
de la conoc ida Ley de Weber, que estab lece que nuestro sistem a perceptiv o dis
crimina carnbios porcentuales constan tes. La relacion 61/1 se llam a fracci6n de
Weber y es h abitualmente expresada en dB co mo & = 10 log (61/0 . En el ran
go de 20 a 100 d B el valor de & permanece entre 0,5 y 1 d B. C erca de l urn
bra1de aud ibilidad la fraccio n de Weber au men ta dr asti cam en te, en parti cular
a frecu enc ias par debajo de los 200 H z.
En co n traste con los resultados an teriores pa ra ruid o de banda ancha, la
fraccion de Webe r sufre un desvfo cuan do el esti mulo se constru ye co n sinusoi
des: la discriminac ion mejora al aume nta r el nivel del estimulo. A 80 dB 6 L
llega a ser de 0,3 dB, par deb ajo de la Ley de Weber. En la figura 9a se puede
ver qu e el grafico de la relacion 10 log (6 0 en funcion de 10 log (I ) presen ta
un a pe ndiente de 0,9 en vez de 1, tal co mo co rresponderia a la fraccion de W e
ber exac ta, De ac uerdo con McGill y G oldbe rg, la diferencia q uiza se deba al
ensanch arniento de la zona afect ad a de la membran a basilar a ca usa del in cre
men to en la intensida d del estfmu lo sin usoidal ( McG ill y G oldb erg, 1968 ).
El des vlo - aume n to en la di scriminacion- q ue sufre la Ley de Webe r pa
ra estimulos si nusoida les pur os parece relacionarse co n el patro n de e n rnasca
rarni ento: al aumen tar e l ni vel sono ro se act iva n otros ca na les espe c tral es que
con tribuyen a la sonoridad genera l. Este ensan ch arn ien to de la zon a de in
fluencia en la mem brana basilar se p uede aprec iar en la figur a 10.
<,
----,
- Ley de Weber
.... Desvio
'"
-4
.'
.'
~ 60
-6
0:::
~- 8
.' .'
OJ
.Q
040
20 f- /
OJ
0. 10
"
12
14
20
40
60
60
100
20
40
60
10 Iog(l)
80
100
10Iog(l)
Figura 9 , Ley de We ber y desvfo de la Ley de Webe r para esn mulos sin usoida les
100
90
iii" ao
:2 70
c
-0
u
.cg
'u
x
60
50
Q)
Q)
40
"0
a;
30
20
>
10
1000
2000
5000
69
([- [J
LlS = k LlI/I
en la que k es una consta nte . A unque esta relaci6n fue defendida durante mas
de un siglo, se ha co rnprobado que es in correct a, tal como adve rti rnos antes ,
en este mismo capitulo (Zwislocki y Jorda n, 1986) .
EN LA PERCEPCI 6 N DE LA SONORIDAD
In tegraci6n tempo ra l
Ga rner y Miller enc ontraron que el umbral de aud ici6n de la sono ridad co rres
ponde mas a una can tidad co nsran re de energ fa que a un a canridad co ns ta n
te de pot enci a -0 de in tensidad-, al rneno s sobre cierto tan go de duraciones
(Ga rne r y Miller, 1947). Tiernpo despues, Hen n ing descubrio que para estirnu
los de corta duraci6n la ene rgfa de l menor increment o detec table (i'lE) se
mantiene co ns tan te , contra la creencia generalizada de la co nsta nc ia de la in
rensidad.!"
En 1995 Moore comprobo que para d uracion es menor es a 200 ms la in
tensidad necesaria para la dereccion del esrirnulo se incrementa a medid a que
la duraci6n disminu ye (Moore, B., 1995). Pareci era que el ofdo integrar a la
energia de la serial:
[ X
= ete.
70
X t
71
~---~p
:I
it = 200 Hz
fz = 400 Hz
h=600 Hz
f4 = 80 0 Hz
fs = 1.000 Hz
f6 = 1.200 H z
h = 1400 Hz
fs = 1 600 Hz
NI
98 dB
92 dB
:)1 = 88,5 dB
NI = 86 dB
NI = 84 dB
NI = 82,5 dB
NI = 81 dB
NI = 80 dB
=
:~I =
Sonaridad = 70 sones
Sonaridad = 45 sones
Sonaridad = 40 sones
Sonoridad = 35 sones
Sonaridad = 30 sones
Sonoridad = 20 sones
Sonoridad = 18 sones
Sonoridad = 15 sones
La son oridad total se obt ien e al sum ar las sono ridades de los primero s cinco ar
m6n icos de acuerdo co n la figura 11 -la d istanc ia entre ellos supe ra el ancho de
ban da crftico-, agregan do luego la ocasionada por los de mayor orden q ue cae n
15 Las bandas criticas se van a analizar en deralle en el capitulo Ill. Por aho ra, nos alcanza
can saber que cor responden aproximadamente al 15% de la frec uencia central cons iderada.
30
25
20
<Jl
:;;
15
ro
:g
a
10
(fJ
oI
o
- - - Sonoridad eombina da
10 12 14
16 18 20
22 24 26
Figura 11 . Son oridad cornbi nada de dos sinusoid es de 13 sones cada una. La freeuencia de
la serial base es de 300 Hz
de ntro de bandas crft icas solapadas. En el eje mp lo se suma n las int ensidades de
los arm6nicos 6, 7 y 8 que con tribuyen can 21 so nes al co nj unt o. La suma co m
ple ta alc anza unos 200 son es. En comparacion , una sin usoide de 200 Hz ca n un
nivel de in ten sidad de 100 dB determ in a un a sonoridad de apenas 80 son es. Se
entiende clarame n te aq ui la causa del mayor ren dim iento sonoro asociado a un a
serial pe riod ica cornp leja. Este es un o de los mot ives que exp lica el escaso em
ple a de sefiales sin uso ida les en c ualq uier siste ma de co mun icac ion acustica,
Adaptaci6n auditiva
U na propiedad co rruin a tod os los sen tidos co nsiste en q ue la respuesta neural
ante estfmulos estab les de larga d uraci6n decae rapi da rnen te , luego de su apa
ricion, h asta alca n zar un cierto "estado de equilibria" . Esta adaptaci6n awiitiva
resulta de la in te raccion entre la en ergia de respues ta del oyente frente a un
estimulo estac ion ario y la en ergia necesaria para mantenerlo en act iv idad . La
co n trapar te psico logica es un a declinaci6n en la son o ridad aparente has ta q ue
esta alcanz a un valor co nsta n te ,
So rp rende, sin e mba rgo , q ue la so norida d an te estirnulos de med ia a alta
intens idad n o parezc a decrecer en el tiempo, Solo los esti m ulos de nrro de los
73
I[
I)~
II
I , ,
I ,
b: ~
Tiempo (s)
, I,
Tiempo (s)
, ~
74
.1
Tiempo (s)
i[ t:= ,
c7l
.1
Tiempo (s)
Fatiga awlitiva
La fatiga auditiva es la perdid a tem po ra l de sensibilidad que aparece cuando
nos exponemos a un son ido mu y intenso y se la mide luego de remover el es
tfmul o q ue la ca usa. Ge ne ralme nte es ra ca rac terizada por el desplazamienw
.1
16 Del
17 Ya no se e rnplea la "regia de
75
20
CD
~
ro
aume n tar el intervalo temporal en tre ambas sena les y desaparece luego de unos
pocos cientos de milisegund os. El efecto es mayor si los dos estfrnulos tienen la
misma frecuen cia y si son expuestos al mismo ofdo (0 a los mismos ofdos).
15
.0
E
::l
Q;
10
C
~
E
::l
o I
1
I
2
12
16
20
24
Figura 13. Desarro llo de las perdidas t ran sit o rias de aud icion
20
CD 15
~
.D
E
.:: 10
~
.8
c;
~
E
::l
0 \
2
12
24
Para anali zar sefiales sin usoidales a las que se le agrega una banda de ruido se
emplea una metodologfa simi lar a la que se usa para est udiar la discriminaci6n
en intens idad entre sinusoides.
Un efecto temporal relacion ado es el de des borde (overs hoot).18 El umbral
necesario para deteetar un a serial breve es mayor si se la presenta cerc a del ata
que 0 la extinci6n del ruido en rnascaran re. EI efecto aurnen ta entre 10 a 15
dB cuando el ruido en masca ran te cubre un gran anc ho de band a y la serial es
de alta frecuencia. Las compone ntes en frecuencia del ruido por encima de la
serial son importantes para producir el efecro.
El efecto de overshoot muestra que el umbr al para un breve estfmulo sinu
soidal iniciado luego de l ataque de un ruido puede ser 10 dB mayor que si se
10 coloca , par ejemplo, 200 ms despues del inicio del ruido enmascarante
(Zwicke r, E., 1965) . A lgunos expe rimentos poster iores sefialaron que , para
que ocurra un gran efecto de overshoot, el ruido enmasca rante debe contener
ene rgfa a frecuen cias alejadas de la frecuencia de la serial, y q ue esta energfa
debe aparecer un breve instan te antes del ataque de la serial (McFadden, D.,
1989). La figura 15 sintetiza los trabajos de McFadd en .
Los mecanismos que da n lugar a estos result ados no se cornpren den toda
via ca n clarid ad , aunque sin dud a esta n vincu lados con el principio de inde
terminaci6n acustico (vease el A pendice n) .
48
Patologias auditivas
Figura 14 . Rec upe rac i6n de l um bral una vez in terrumpid a la fue n te acustica
Incremento de Ia sonoridad
En contraste con la reducci6n de la sono ridad producid a por son idos presentes
sirnultanea rnente con el son ido de prueba (enrnascaramien ro), los son idos que
aparecen antes del de prueba pueden a veces producir un incremen to en su so
noridad. Si el primer est frnulo es, por ejemplo, 20 dB mas in tense que el segun
do , los expe rirnentos muestran que este ultim o puede incrementar su sonor idad
hasra la equiva lente a un aumento en intensidad de IS dB. El efecto decrece al
76
Los efect os del ruido sobre el siste ma aud itive human o se pueden dividir en
desplazamientos temp orarios del umbr al de aud ibilidad (pe rdidas te mporarias
o rever sibles, TIS) ye n desplazami entos perm an entes de dicho umbral (pe rdi
das perrnanentes 0 irreversibles, PTS) .19 Estos ultim os pued en ser causados por
la destrucci6n inm ediat a de las estruct uras ffsicas del ofdo, en cuyo caso esta
mos en presen cia de un trauma acustico, 0 por el efecto ac umulativo de suce
sivas exposicion es d urante un perfodo relativamen te pro longado .
18 La pa lab ra "desborde" no es un a rrad ucci6n lireral d e "overshoo t" (exceder, rebasa r, so
bre pasar ), pero c reemos que describe mejor el fen ornen o alud ido .
77
Candici6n
a)
L'
-
co
co
Alto
---'
_ 40
:s.
20
E
co
:2
"0
.Qj 10
Baja
o,
-- - --
e) _
durante 10 arias
Baja
b) l-
d)
40 haras semanales
c)!-
Umbral
Baja
- I
80
90
10 0
Alto
oI
co 10
78
-- -
:s.co
20
~
"0
40
__ 5 arios
U
.Qj
50
- - - 35 aiia s
n,
60
~ 30
70
,~..
125
250
500
1000
2000
.. --
I
....
,," '"
I
3000 4000
6000
8000
Frecuencia (HZ)
Figura 17. Perdida perrn an ente de aud icion en funci 6n de l perfodo de exposi cion
la energfa en frecuencias rel ati vam ente bajas: las personas ac uden al medico
s610 cuando tienen d ificu ltades en la co mun ica c i6n oral, etapa en la que el
praceso ya manifiesta un gran ava nce.
En las figuras 18 y 19 se pued en ver microfotograffas de la membrana basilar
en las que se aprecia el deterioro que sufren las ce lulas de Corti a causa del ru ido.
Recluwmiento auditivo
El veciutamieiao auditivo oc urre c uan do el umbraI de aud ibilidad de un a perso
na est a par enc im a de l n ormal, pero su audic i6n es normal a altos ni vel es de
sonor idad . En e l suje to co n reclutamiento , la sonoridad aum en ta mas rapida
mente con la intensid ad de 10 q ue oc urre en un oven te con o fdo pro med io -al
me n os en las frecu enci as afecta das. Se podrfa asim ilar a un a suerte de cornpre
si6 n del rango de sonoridad .
79
Moore re lac iona e l recl utam ie n to aud it ive co n un dafio en las celulas c i
liadas exte rnas de la membran a basilar, que imp ide la co rrec ta cod ificacion del
ran ge d in arn ico del es tirnulo ac ust ico (M oor e, B., 199 7).
5. C ODIF1CACI6 N
DE LA INTENSIDA D
Figura 19. Ce lulas de Cort i en lin otdo dan ado par ruido
80
C omo hemos vista, e l sistema aud itiv e human e es capaz de de tectar d iferen
cia s en la in te nsidad de los est frnulos so bre un gran ran ge d in arni co, tan gra n
de co mo 120 dB en o yen tes co n o ido sano . La mayo ria de las ce lulas ne rviosas
aud itivas, aque llas q ue presen tan un a rasa de d isparo re lati varnente alta, tie
n en bajos umbrales de exc itac io n y rangos di n am icos co mparat ivarnen te pe
quefios. C asi todas se sa turan a l llega r a un a inte nsidad de ap ro xima darnen te
60 d B cuan do son es ti muladas a sus frec ue n ci as carac terist icas. La pro po rc io n
de fibr as en el ner vio aud itive q ue prese n ta n un arnplio rang o dinarn ico (60
dB 0 mas) es muy baja, de a lrededo r de l 10% de l tota l. Por 10 ta nto , se supo
ne qu e inte rviene mas de un mecanism o dife rente e n la d iscrirninaci on de la
intensidad. Los ca mbios en int ensidad pod rian se r cod ifica dos po r cambios de
la tasa de de scarga de las n euronas q ue ocupa n el ce ntro del pa tron de exc ira
c io n , po r un a exten sio n de l patro n de exc itac i6n (mas ne uro n as en t ran en
operac ion), 0 por una corn bin acio n ent re ambos mecan ismos. La sensibi lid ad
a la fase tarnbien parece in terve n ir en e l proceso.
La impo rtan te Ley de Weber para ruido de band a a ncha, qu e co n tin ua ac
tu ando para a ltas intensidad es, deb e prov en ir de la ope rac i6n del siste ma a udi
t ivo, no de prop ied ades estadisticas de l esn mulo. Pero no se puede ex plicar a
pa rt ir de la in formacio n cod ificada por un a sola n eu rona por los motives antes
81
ZO
Una posible soluc i6n serfa que el sistema aud itivo pudiera ajustar el rango de
ope racion de las celulas de acuerdo al ni vel de entrad a, de mo do de mantener
82
83
_J
ci6n de W e ber a 10 largo de cas i todo el rango dinarnico . Esta dificu ltad se in
cre me nta al constatarse q ue h ay much as mas celulas co n altas q ue co n bajas
tasas de disparo .
En uno de estos modelos de doble poblaci6n se sirnularo n las codifi cacio
n es basandose en el nu mero de celul as necesa rias para c ubrir el rango din am i
co comp lete a un a frecu encia dada: con s610 die z celulas comb in ad as es
posib le irnitar al sistema aud it ive (Vie rneist er, N. E , 1988). S in em ba rgo, po
see rnos mas de 50 para la m isrna funci6n. Es deci r, ten emos a la salida del n er
via aud itive infor mac ion mas que suficie n te pa ra codi ficar los estimu los sobre
un gra n rango de inte nsida des . Q uiza la pregunta no deba ser, en to nces , por
q ue es tan buena la cod ificac ion a altas in te ns idades, sino po r qu e no es me
jor de 10 q ue es a bajas in ten sidades.
84
Memoria de la intensidad
Muchos exp erimentos de d iscrim ina c ion de la intensidad emplean secu enc ias
en las q ue dos intervalos de observac io n estan sepa rado s por un intervalo inter
estfmulo (nt) . La a usenc ia de un efec to susta nc ial de este intervalo en las ta
reas de di scr iminacion cita das suste n ta la h ipotesis de que los oyen tes emplean
la memor ia de largo te rrn in o par a hacer las co mpa rac io n es entre el pri mero y
el segundo de los esn rnulos. U n a lmacena m iento en la memo ria de co rto te r
m in o deber la decaer en el t iernpo, ge ne rando una gran dependencia con la d u
raci6n del inter vale inter estfrnulo. Como un ejernplo ex trerno, Poll ack
ernpleo un llE de 24 h o ras y prac tic arnente no encontro de te rioro en la tarea
de discriminaci 6n de la inten sidad (Po llack , 1.,1953).
La memori a de la rgo ter rnino pu ede ser an ulada va rian do al azar, entre
pruebas, la intensidad de los estimulos en los intervalos de obs ervaci6n. Cuan
do est o ocurre , el ex ito en las tareas de d iscriminaci on de la intensidad baja
notab lernente al a ume ntar el us. Por ejemplo , la fracci6n de W eber aumenta
de 2 a 5 dB w ando el UE crece de 250 ms a 8 s. Esre ca rnbio se debe, presurni
blernente, al det eri or o del a lmace na rn ien to e n la memori a de co rto ter m in o.
85
)~~
Estimul o
FiurO
fiiadodea
la funci6n
transferencia
del oido
externo/medio
Calcular el
area bajo
el patron
especifico
de sonoridad
Transformar
la excitaci6n
en sonoridad
especifica
Transformer
el espectro
en patrones
de excitaci6n
N - = C Ea
En la qu e N - es la sono rida d po r banda c rltica , E es la in tensidad de la e xci
tacion, y C y ex so n co ns ta n te s co n ex < 1.
Este mod e lo fue modi ficado por Moor e y Glasbe rg, qu ienes asume n qu e,
por deb ajo de 1 kH z, la fo rma del filtro aud it ive es igual al co nto rno isofo ni
co co rrespo nd ien te a 100 ton es, y qu e por encima de 1 kH z la fo rma del filt ro
esta de ter m in ad a por la inversion de la c urva um bral de audib ilida d (M oore y
G lasberg, 1986 ).21 La exc itac i6n es co n vert ida en son oridad espec ifica por
ba n da c rft ica a pa rt ir de la siguien te expres ion :
San a
I AO 0 1 lK
1~~-
-1i-.-.---.-.LI .-
I
-
- _ -
00
86
Figura 2 1. Ecograma e n so nes simulado para una butaca en la platea del Teatro Argentino
de La Plata. La Fuente acustica ernitio un impulse de Dirac v irtual"
" En este caso se utilizo el paq uet e C ATT- Acoust ic v7.Z.
Moore, B. (1995).
87
Capitulo III
El oido como analizador espectral
Una de las pregun tas elernen tales relacionada con el terna es la que inqui ere
sobre nue stra habilidad para discrimin ar ent re dos sefiales cuyas frecuencias son
ligerame n te diferent es. La respuesta, obten ida a parti r de un procedimi en to psi
coffsico clasico, int roduce el conc epto de diferencia apenas perceptible (OAP 0
JNO) t en frec uenci a, 0 limen de frec uenc ia. Para medirla se realiza un experi
men to en el cua l los sujetos oven alte rnativam ente dos sinusoides de igual so
n orid ad : rnienr ras un a de ellas mantiene con stante su frecuenci a la otra la
1
89
Detectable
modi fica leve rnente. El o bje to es de te rmi nar la m in irna dife renci a en frec ue n
cia necesaria para d isr ingui r e ntre a mbas seria les. En las figur as 1 y 2 se pue
den ve r los va lores de la DAP en frecuencia en fun ci6n de la frccu enc ia de base.
El resultado pued e sin tet izarse di c iendo que la DAP en frecuencia se man
tiene ce rcan a a 1 H z par a frecuencias por debajo de 1 kHz y que crec e paula
I
18
16
Sin cambio
~lL
I' j ~LL ~ lli
I - :
~
Frecuen cia
14
Frecuencia
Frecuencia
12
N 10
;S
'<j
64
125
250
500
1000
2000
4000
8000
Frecuencia (Hz)
2.
Figura 1. DAP absoluta en frecuen cia; a ) obten ida a partir de sefiales sin usoidales de int en
sidades medias, ent re 60 y 80 dB, b) ob renida a partir de sena tes sin usoida les de inrensida
des ce rcanas al umbral de audibilidad (Wi er, [esteadr y Gr een, 1977 a)
0,9
0,8
0,7
0,6
-~~
Ya a med iados del siglo XIX alguno s in vestiga do res supo ni a n q ue el sistema
aud it ive no funcio n a en bloque y q ue di v ide las sefiales para su tratam iento
d et allad o. Una h ipot esis ternpran a planteab a la pre sencia de alguna cl ase de
ana lisis de frecuencia a ni vel de l sistema audi t ivo periferlc o. Este pro ceso de
anal isis en frec ue nc ia se h a estudiad o ind irectarnente a pa rti r del fen 6 men o
de enmascaramien to , que ocurre cuan do un son ido enmascara 0 "tapa" a otro de
di feren te frecuenc ia. El fen 6meno de en mas ca rarnien to se ana lizara con dew
lle en el pu nto 4 de este capf rulo .
0.5
0,4
0,3
El experirnento fund aciona l en este camp o 10 real iz6 H arvey Flet cher en
1940 .2 Fletcher midio el aumen to del umbral de deteccion pa ra una sefial si
nu soid al en func i6n de un ruido enrnascar ante con de n sid ad de po te ncia cons
tan te y banda pasante va riable. El ruido esraba centrad o a la frecue nc ia de la
0,2
0,1
64
125
250
500
1000
Frecuencia (Hz)
90
2000
4000
8000
Harve y Fletch er (1884-1981), ftslco e inge niero estadoun idense. Fue uno de los mas des
tacados invest igadores en psicoac ustica durant e la primera rnitad del siglo xx.
91
92
76
75
ill
"0
74
C1l
>c
Q)
if)
73
~
.0
E 72
::J
71
70
50
100
200
400
800
1600
3200
Figura 4. Umbral para una sinusoide de 2.000 Hz en funcion del ancho de banda del ruido
enrnascaranre
X Nt' )
W=P / (b N o )
93
5000
ro estas imperfecciones no imp lican que la hip6t esis central del mode lo es
te eq uivoca da . De hecho , gran parte de los avances en el ca mpo se han ba
sado en ell a.
La forma rect an gular de l filtro auditivo propu esta por Fletcher merece un
cornenta rio aparte . Si el filtro fuese perfectarnente rect an gular el umbr al de
det ecci6n deber fa crecer a una rasa de 3 dB por cad a duplicacion de la banda
de ruido , En la figura 4 se puede ver que !a curv a de crecimiento tiene una
pendiente much o menor. Este desvfo del valor reorico se debe probable men
te a dos fact ores: el filtro no es rectangular, y las pequefias flucruacion es del
ruido afecran la detecci6n de una manera aprec iable.
~
U
'"c:
'"
2000
1000
"0
D
500
Q)
s:
o
c:
,,
200
100
94
,,
c).
~. - - - - - - 1 0 0 Hz
0,05
, ". "
'l-\
"0
,
,,
0,1
0,2
0,5
10
20
Frecuencia (kHz)
Figura 5. An cho.de banda crft ico en funci6n de la frec uenc ia cent ral. Las Iineas de pun tos
indic an aprox imac iones lineales para baja yalta frecuenc ia (Zwicke r, Flottorp y Steve ns,
1957)
95
. . ....
. ... . . . ....
"r-- - - - -- - - - - - - - -- - - - - - - - --"
~ l
-;;;
~
Banda de ruido
enmascarante
Banda de ruido
enmasca rante
.~
J!!
VI
~
ro
Filtro auditivo
31mm 28
24
20 17
13 mm
Distancia
al eslribo
1,0
!'!
'u
e
'0
a0. 0,5
a.
2000
Q)
I I I I'
I I I I i I
'
200
Q):;
Q)
o e
,
lk
,! ,
2k
...
51<
Frecuencia (Hz)
500
co 'S
'0
""
1000
'0 0
elli
100
I I I I II
'0>
ro ~
.oro
' ,],-,
20 30 50
. Figura 8 . Posic ion del maximo de resonanc ia en la membrana basilar al ser estirn ulada
por una serial sinus oidal de frecuenci a variable (Bekesy, G . Von , 1960 )
Q)
Q3ro
<l:
0,0 I
Figur a 6. Esq uema del ruido en rnasca ran re usado por Patterson pa ra estima r la forma
del filrro aud irivo
100
.r: J)l
u u
e Q)
<l: a:
50
i.L
20 I f il l
0,05 0,1
0,2
I I I 11' 1
0,5
I I I I III
10
Experimen tos co mo los anteriores, y otros sim ilares, han llevado a los inves ti
gado res a form ular qu e el filtro rectan gular equiva lente sigue aprox imada me n
te los valores de la figura 7.
G reen wood prop uso en 1961 qu e el an cho del filtro rectan gular equivalcn
te represen ta un a distan cia cons tante a 10 largo de la mem bran a basilar. La re
laci6n de G ree nwood, corregida por G lasberg y Moore (1990 ), es la siguien te:
ERB
96
Extremo basal
Extremo apical
24 ,7 (4,37
f+
1)
+ 1)
90
Sumatoria de sonoridad
90
80
80
70
(il
OJ
m 60
:s
ro
:9
co
-0
60
--0g
c
40
50
<Il
Qj
.2:
70
ro
50
<Il
OJ
-0
,g
OJ
-0
30
40
Q;
>
20
30
20
10
20 dB
10
50
0,6
0,8
1,0
1,2
1,4
100
200
500
1000
2000
1,6
Frecuencia (Hz)
F igura 9 . Form a del filrro aud it ive cen trado a 1.000 Hz en func i6n de la in rensidad
del esruu ulo, de 20 a 90 dB en pasos de 10 dB
Figura 10 . N ivel de so nor idad para un ruido de ban da ce n trado en 1.0001-t en funci6n
del an ch o de band a
En cl aparrad o 4 de l capitulo J] an alizamos la infl uen cia de los fact ores espec
qu e in te rvi en en en la percep cion de la son oridad. Pcdernos aha ra exa
m in ar el tem a dcsde otra perspectiva.
Cons ideremos un a sefial aciistica de intensidad fija y an cho de ban da va
riable W. Mi entras W se manten ga menor que la banda crftica BC la sonori
dad sera mas 0 men os indepe nd ien te d e W, e igua l a la de un tono puro de
igual intensidad situado en la frecuen cia cent ral de la banda. C uando W su
pcra la BC , la sonoridad comienza a incr ementarse. Por 10 tanto , para una
dcu .nn inada can tidad de ene rgfa la sonoridad es mayor si la enc rgfa se repar
l ~_ sobre un ruim er o de bandas crfticas, en vez de estar co n ten ida en un a so la
de ellas. En la figura l O se aprec ia el aurnento de sonoridad alud ido. 4
Esre efec to es mu y importante en musica ya q ue el a ument o de sonoridad
dcpcnde de la suma de las sonoridades especi ficas en las d ifercn rcs band as. Por
cjemplo , doblar un bajo a la octava es mu ch o mas efectivo, desde el pun to de
vista de la sonoridad , que dob larlo al unfsono a unq ue la energfa ffsica puesta
en juego sea la misma.
Cuando dos est irnulos sin usoidales poco separados en frecu encia se prcscn tan
juntos, puede olrse sonido aun cuan do cada esnrnu lo por sf mismo esre ubica
do por deb ajo del umbra]. G assler propus o que, dcntro de un a banda cr ft ica,
las energias de los co mpone n res de un est fmul o complejo se surnan algebra i
ca men te.? Spi egel , por el con trario, sugiere qu e el ofdo es capaz de in tcgrar la
en ergia sob re anc h os de ban da mayores que un a BC (S piegel, M . E, 1981).
Al gunos ex pe rimentos real izados co n sin uso ides mu y sep aradas confirman es
to ultimo.
I rules
98
(loudness summation).
Sensibilidad a la fase
En un ce lebre exp erirnento rcali zad o por Zwicker y rep et ido casi iuc dio si...lo
mas tarde por Sek se ern plearon dos sefia les csrac ionarias , una modulada en
amplitud can un Indice de modulaci6n m y o tra modu lada en frecuenc ia ca n
un fndi ce de modulaci6n b (Sek, A. , 1994) . S i se igualan los Indices de mo
du lacion (m = b) y b es pequefio , el espec tro de potenci a de las scn a les es
; G assier (1954 ), en Moore, B. (1995).
99
identico. Las co mponentes de las sefia les s610 d ifieren en sus fases relativas.
EI resultado de este experi mento muestra q ue somos sensibles a las fases rel a
t ivas de una sefial esta cionari a cuando las componentes caen dentro de una
misma banda crftica. Por el cont rario, cuando las co mpo nen tes se encuen
tran separadas en frecuencia por una dista ncia que supe re el valor de un a
banda crit ica, las fases relativas dejan de percibirse. So lo en este caso parece
va lida la ley acustica de Ohm, q ue pos tu la la insensibilidad a la fase del siste
ma aud itivo.?
Di scriminacion de parciales en sonidos co mplejos
La ley acust ica de O hm tambien estab lece que el ofdo es capaz de percibir los
componentes sin usoida les en un son ido complejo . Plornp enco n tro que esta
hab ilidad llega, segun la frecuen cia de la fundame ntal, has ta el q uin to u octa
vo parc ial (P lomp, R., 1976). Co n su rnetodo -diferen te al de Fle tche r- est i
mo un valor para la banda critica algo menor a la medida por el metodo de
enmascaram ien to . Plom p introdu jo la h ipotes is adicional de que un parcial
puede ser ofdo en el entomo de otros parc iales si se encuentra separado de es
tos ultimos por 10 menos en 1,25 veces el valor del ERB de l filtro aud itivo que
le corresponde.
Los experimentos de Soderquist parecen probar que los musicos poseen
bandas crft icas menores a las de los no rmisicos (Soderquis t, D. R., 1970). Sin
embargo, Fine y Moore mostraron que no hay tal diferenc ia (Fine y Moore,
1993). La interpretacion mas aceptada es la que presume la exis tenc ia de al
gun meca nismo, mas entrenado en los musicos, que actua a n iveles no perife
ricos en la de tecc ion de parci ales.
Selecti vidad en fr ecuencia en ofdos dafiados
Hay considerable evide ncia de que la select ividad en frecue nc ia d ismin uye
por dafio en la coc lea. Una co nsec uencia es la gran sens ibilidad al en rnasca
ram ien to q ue posee n las person as con lesiones coc leares, con la consiguie nte
dificu ltad para ofr en am bien tes ruidosos. Un impedimento ad icional apa rece
ante el analisis percep tual de son idos complejos como la palabra y la rmisica ,
por ejernp lo en la disrninucion de la habilidad para distinguir entre diferentes
t imbres. Co n los audffonos conven cion ales no mejor an estas dificu ltades pues,
aunque conv ierta n en audibles las seriales, no se recupera la selec t ividad en
frecue nc ia perd ida.
6
100
4.
ENMASCARAMIENTO
101
100
100
80
80
.,."
CD
:2
c:
<ll
CD 60
:2- 60
c;
40
so
'"o
40
Qj
~ 20
.2:
Z
E
c:
20
ill
-<..:::r /
oI
100
250
J '"
-"""'T=-
1000
2000
4000
'--
500
J,..
'-i
8000
Frecuencia (Hz)
""W
u
c:
'0
13
400
800
1600
3200
Figura 13. C urvas de enrnascaramie ruo : a ) umbr a ] de audibilidad, b) aumento del umbral
causado par una banda de ruido y c) aurnenro delumbral causado por una sinusoide
200
Frecuencia (Hz)
Figurn 11. Parrone s de enrnascararnienro para ru ido de band a angosta centrado en 500 Hz
CD
-10
-20
-30
OJ
u 40
c:
0
D.
-50
0,5
1,0
1,5
2,0
Frecuencia (kHz)
0
-10
CD
:2-
-20
c:
'u -30
.8
u
x
ill
-40
50
0 ,5
1,0
1,5
2,0
Frecuencia (kHz)
Figu rd 12. Der ivaci6n del patron de enmascaramiento segun Moore y G lasberg
102
H ay mu ch as semeja nzas entre las select ividades en frecuen cia med idas tan
to en la mem brana basil ar co mo a partir de expe rimen tos psicofisiolcgicos
(Moore, B., 1995 ): cada a ncho de ba nda rectan gular equ ivalente ( ER B) co
rrespon de a alrededo r de 0 ,9 mm en la membrana basilar, sin qu e irnpor te
el centro de frecuencia co ns iderado . S in embargo, a pesar de la buena co
rrespon dencia entre e l co mpo rtarnien to de la co clea y la medida de los
ERB, es posible qu e ex ista un mecani sme de "afinac ion " del anch o de banda
en etap as supe ri ores de procesamiento. Esto podrfa lograrse a traves de me
can ismos de supresi on 0 inhib icion la teral. Si la ba nda cr it ica de pe nde de
un proceso n eu ral inhib itori o, se pued e esperar q ue el mismo demore algu
nos mi lisegun dos en ac t uar: la band a c rft ica para sefiales co rtas deb e rfa ser
mayor qu e para sefiales largas. Los datos ex perimen ta les en este pu nta se
con trad icen .
103
ZIIIIIlUb-------------------
I
coben usa in vol ucra la sa turac ion de la ac tiv idad n eural ev ocada por la sefial.
S i el ruido en mascaran te prod uce una can tidad significa tiv a de ac t ividad en
la banda crit ica que norma lme nte responde a la seria l, en tonces la act iv ida d
agregada por la seria l resul tara cubiert a y no se la pod ra detectar, Consi dere
se, po r ejemp lo, el caso de un tono jun to a un ruido de ba nda ancha . EI urn
bral del tono esra a -4 dB por deb ajo del ni vel del ruido en su banda crft ica.
La exc itac ion co mbina da de l to ne y el ruid o es 1,5 d B mayor que el ruido so
lo: 1,5 dB represen ta el increm en to m inirn o necesario para la deteccio n del
to ne (por eje mplo, si el tono estuviera a -20 dB , el n ive l to ta l h abn a aume n
tado 0 ,05 d B y no serta aud ible).
EI segundo mecan ismo posib le, desarr oll ad o por el mod elo de supresi6n,
se basa en la hi p6tesis de que el ruid o enmascaran te suprime la acti vida d neu
ral que la serial producirfa de est ar sola.
Po r el moment o no hay ev ide nc ia fuerte qu e perrnita descartar alguno de
los dos mecan ismos, aunq ue q uiza se co mbine n ambos. S in embargo, el ex i
to de los mod elos lineales de co mbinac i6n de filt ros aud itivos en la ex plica
ci6n del patron de en masca ra miento inclina la balanza hacia los mecan ismos
d e cobert ura, pues la supresio n es un proceso alrarnen re alineal.
Modelos temporal es de en mascaramien ta
Existen dat os q ue apoya n la hi pot esis del uso de los patrones temporales de dis
paro ne uron al en el ana lisis de est irnulos complejos (una sin uso ide produce
d isparo s neur ales cuyo int er vale temporal es un multiple en tero de su perfo
do ). Si la regular idad temp oral es menor que ciert o valor - com o oc urre co n el
ruid o alea to ric- la sin uso ide sera en mascarada. El mecanisme te mporal pare
ce efectivo iin ica men te pa ra frecuenc ias por debajo de los 4 0 5 kH z y cabe su
poner la acc ion de un disposit ivo sensible a la fase.
O tro elemen to q ue posibleme n te se empl ee en la det ecc i6n de un a serial
sin usoida l en un fond o de ruido es el cambio en la en vo ivent e de la onda co m
bina da, que flucni a menos en presenc ia de la sefial sin usoida l.
104
(conmodu
/arion maskingrelease).
105
til 60
FI
:2.
I
R
R
I
~ ~Vt--.~
I
K'
~
'"
55
,t."
.!!1
E
~
::J
W
"0
45 1
M
I
50
/I
))
Figura 14 . Resultado del experimen to de H all. Los puntos marcados "M" corresponden a
los umbrales obte nidos con ruido enrnascarante modulado en arnplit ud ca n una serial irre
gular que varia lentarnenre
en tre las seriales que afecta a los sujetos con poca practica. De heche , oyen tes
entren ados - rnusicos y tecn icos de audio ent re otros- obt iene n mejores por
cen tajes de deteccion que los sujeto s prorned io. Por otro lado, el en rnascara
miento "hac ia de lan te", con el ru ido en mascarante p reced iendo a la serial, es
un o de los tres proc esos que alteran el umbral de un a serial que tien e lugar des
pues de otro soni do . Los otros dos son la fat iga y la adap tacion. Se disti ngue
de ellos por estar limi tado a sen ales que apa recen dentro de los 200 ms des
pues del mom en ta en que cesa el ru ido en masca rante .
El en masca ramien to hac ia delan te t ien e las siguientes part icul ar idades:
1) es mayor cuan to mas ce rca en el t iemp o se suceden ambas sefiales: 2 ) los
incrernen tos en el n ivel del ruido en rnasca ran te no co rrespo nden a incrernen
tos iguales en el um braI de la serial (a d iferencia del en masc aram iento sirnul
taneo , que responde a una relaci6n serial/ruido co nsta n te), y 3) depende de la
relacion.de frecuen cias entre ambas seriales (igual q ue en el en rnascararnien
to simult aneo), Los pro cesos que dan cue nta del en masca ram iento no sirnul
tan eo no se co no cen co n exactitud , aunque pro bab lemente sea n co nsec uenc ia
de la co mbinaci6n de varios a la vez. La superposici6n temporal de patrones
de vibrac ion en la mem brana basilar - una suerte de co la de resonan cia 0 "rin
ging"- parece ser imp ortant e , asf co mo la adaptac ion de corto term ino tant o
en el ner vio aud itivo co mo en los ce n tros ne urales superiores.
Enmascaramiento binaural
80
CD
50
~
Q;
>
Z 40
20
2000
5000
10k
15k
la supresi6n se manifiesta porque cua lquier reduccion en la ac tiv idad del rui
do en rnasca ran te en la regi6n de frecu encias de la sefial se acompa fia co n un a
redu ccion sim ilar en la ae tiv idad de la seria l enmascarad a. En otras pa labras,
la razon "sena l en mascarada /ru ido enmascarante" no es afectada por la supre
si6n. En el en mascaram ien to no sim ultan eo la supresi6n afec ta al ruid o en
mascarante perc n o a la sefial.
O tra diferencia importante es que la seleet ividad en frecuenci a del en
mascarami ento n o sim ultaneo es mayo r qu e en el simultan eo (rnedido por
ejem p lo a partir de la curva de afin ac ion psieofisiea 0 PTS) .
108
El umbraI de en mascara miento pu ede ser marc adam ente menor cuando la se
fia l se oye co n am bos of dos. La difer encia de ni vel entre la audici6n binaur al
y la monoaur al se co noce co mo nivel de enmascaramiento diferencial (MLD). El
MLD llega a ser de 15 dB para baj as frecuencias y se reduce a s610 2-3 dB para
sefiale s de 1.500 H z. N o es cas ua l qu e el lirnite de 1.50 0 H z sea el mismo que
el de nu estr a ca pac ida d para co mpa ra r las fases de las seriales entre los dos o f
dos dur ante la localizaci6n espac ial. En la figur a 16 se aprecia cu alitativarnen
te un expe rime n to clas ico en este ca mpo .
Para qu e el efecto ten ga lugar se debe agrega r el mismo ruido a los dos oi
dos (0 al menos deben estar co rrelac iona dos 0 provenir de la misma fuente).
Se ha obser vad o en masca rarnien to binaural en sefiales sin uso idales, en cli cs y
en el habl a. En situac iones reales apa rece cu ando la serial y el ruido provi enen
de diferentes posieiones en el espac io y se relaciona fuertemente con el efec
to "cocktail party". La banda del ruid o en rnasca ran te q ue ac tua en las condi
ciones de en masca ra miento d iferencial es la que co rresponde a la frecuencia
de la serial. H all sugiri6 qu e los filt ros aud itivos qu e intervienen en la detec
cion monoaural y binaural son los mismos, pero que la det eeei6n binaur al de
pende de la sal ida de mas de uno de ellos en paralel o,
La inteligibilidad del h abl a en co nd iciones de ruid o arnbiental mejora
con sefiales an t ifasicas, en espec ial a niveies ce rca nos al umbral. Las co ndi cio
nes antifasicas n o s610 mej oran la capacidad de det ecci6n de sefiales, sino qu e
tambien incrementan la h abilidad para discriminar sefiales.f Los pro cesos de
enmascaramiento y de localizacion espac ial, sin embargo , par ecen procesarse
de manera separada .
Los mode los mas recient es, co mo los de Colburn, S tem y Trahiotis, asu
men que las tasas de disparo de los difer entes filt ros audit ivos pro venientes de
los dos ofdos son co mpa radas por det ect ores de coi n cide n cia que proveen un a
especie de sal ida bid imen sional , co n un a d imen sion ca rac te rizada por las fre
cuencias centrales de los filtros aud it ivos y la otra por el ret ardo interau ral
(Colburn, H . S., 1995) . U n co mp lejo modelo, el de Yoich i Ando , da cue nta
con bastante detall e del proceso de eval uac i6n inter aur al y fue util izado en el
disefi o de salas para mu sica n o arnp lificada (Ando, Ye t al., 1997 a) .
BU n pararnetro uti lizado en el estud io de salas para rruisica y palabra, el coeficiente de C01Te
lacion CTUZada interaural (ixcc ), cuan tifica la co rrelac i6n existen re en tra las seriales que lle
gan a los dos o tdos.
109
"'Cb----------------a)~
b)~ .~
C)~
V\f\N\v
d)~
W~
110
resultantes, pero en la pra ctica son aud ib les solam ente los de menor frecuen
cia. Se los pu ede cla sificar de acuerdo co n la can tidad de vec es que aparece n
las frecu encias de los estirnulos i, y fz en la formula correspondiente. En la ta
bla de la figura 17 se ind ican los soni dos de co mbin ac i6n de menor orde n .
En la tercera columna estan los arm6ni cos de cada un o de los cornp onen
res primarios. Por 10 gene ral, los son idos de co mbin ac i6n de las dos prime ras
columnas no sigue n un a estructura arrnonica. '?
El espectro d e los son idos de co mbi nac i6n de segundo orde n 0 cuadrciticos se
puede apreciar en la figura 18.
Ademas d e los arm6 nic os de los co mpo ne ntes primarios (2fl Y 2fz), se ge
nera un sonido diferencial (fz - !l) y un o adicional (fl + fz) de gran amp litud . El
sonido adi cional es d ificil de ofr po rq ue cae en una regi6n esp ectral en la que
existen arrnonicos, si las sefiaies primari as son co mp lejas. Tarnbien es en rnas
carado con facilidad por los co mpo ne n tes primari os ft Yh
En carnbio, el sonido diferencial se perci be co n facilidad, sobre rodo
cuando su frecu encia es mucho menor qu e fl' Aunque la frecu encia resultan
te (h - f\) es la misma , no h ay que co nfund ir el son ido diferencial - producto
de la distorsion alineal del ofdo- co n el batido ffsico , qu e se origina en la in
terferencia entre sefiales sin usoidales -un proceso lineal.
Para un siste ma regul ar con d istorsion cuadrat ica , el nivel del son ido d i
ferenci al sigue la siguien te ec uac i6n :
NI (fz - it)
Nl (ft) + NI (fz) - C z
111
r,
Primarias
f, -
Secundarias
Tercer orden
r,
f, + f,
2f , - f,
.zr,
3f, -f,
.sr, .r, ,
Cuarto orden
f,
- f,
2f, + f,
.zr,
+ f,
3f, + f ,
. sr,
+ f, ,
2f, - 2f,
2f, + 2f,
...
...
2f,
.zr,
3f,
. sr,
4f, , 4f,
...
a.
E
<l:
III
I, - 1,
I,
21, I, + I, 21,
I,
Frecuenc ia
Figu ra 18. Distorsi6n cuadrat ica pura a partir de dos cornponentes primarios de frecuenc ia
f1 \' f2
El espect ro de los son idos de com bin aci 6n de tercer o rden 0 cubic os, gene
rados por un siste ma regular con distorsion cubica, se puede apreciar en la
Figura 19.
Los soni dos adicionales cubicos de alta frecuencia (2fl + iz) y (2iz + fJ)
son extremadament e diftciles de oir. Los sonidos diferenciales cubicos (2fl - fz)
y (2.fz f l) poseen el triple de amplit ud que los terceros arm6n icos (3fl) y (3fz)
de los co mpon entes primarios. En c iertas circunsta nc ias el mas bajo de ellos,
(2fJ - fz) , es tan audible co mo el d iferencial cuadrat ico (f2 - fl )'
Sin emb argo, en este caso la relaci6n entre ni veles de en trada y sonori
dad percibida no sigue un a ley tan simp le co mo en el caso de los son idos de
combinaci6n de segundo orden , El d iferencial cubico (2fl - iz) persiste a n ive
les de estfmu lo muy bajos y su audibilidad dcpe nde en gran medida de la fre
cuencia de los comp onen tes primarios. Po r ejemplo, dec rece rapidamente en
sonoridad cuand o la diferen cia en tre iz y i, supera un valor cercano al 30%.
Estos hechos revelan la existe nc ia de un a alinealidad esencial, en la que el sis
tema no se puede aproxi mar a un siste ma lineal para pequefias amp litudes de
sefial. Se sabe que el origen de esta alinealtdad esencial aparece mas alia del
ofdo medic . Se supone q ue surge de la actividad de las celulas mot oras en la
c6clea 0 en algun ce ntro de procesa miento ne ural superior.
En la figura 20 se aprec ia el co rnpor tamie n to de los sonidos diferen ciales
mas audi bles en fun ci6n de la diferen cia de frecuencia en tre los comp on entes
primarios y en la Figura 2 1 se grafican en not aci6n musical aproximada los di
ferenciales cuadratic os y cubicos presen tes en alguno s intervalos sencillos.
a.
E
<l:
I,
21,-1,
21,+1 , 1,+21,
I,
21,-1,
31,
sr,
Frecuencia
Figur a 19. Distorsion cubica pura a part ir de dos co mponentes primario s de frecuencia f[
\' f2
112
Frecuencia
21, ~ - - - - - - - - - - - - - - - - - - - _. - -
Estimulo I,
(Frecuencia variable)
3/2 I,
Eslimulo I,
(Frecuencia fija)
I,
IC1 = 12 - I ,
: Sonidos dilerenciales
y- I
,
'I
I,
Unisono
c2
3/2 I ,
Quinta
21,
Octava
=21, - I,
Frecuencia
del estimulo
variable
Figura 20. Diferen ciales cuadra ricos y cubicos en funci6n de la diferenc ia de frecuen cia
entre los compone nres primaries (tornado de Roederer, 1997)
1 ::
-0-
()
.Q.
-0
()
~?
( )
Figura 21. Nor acion musical aproximada de los sonido s diferen ciales mas destacados
11 La parte de audio de MPEG- l (no rma ISO/IEC IS 11172-3 ) fue esrablecida en 1991 y con
siste en tres modos de operaci6n de complejidad crecien te: Laver-I , Layer-Z y Layer-3. En
el estanda r MPEG-Z, sucesor del MPEG -l , se define el Adva nced A udio Co d ing (AAC) que es
ta reernplazando al MP3 en muchas ap licac iones.
114
Seiial de
audio digital
(peM)
Seiialdeaudio
codificada
~' 92 kll i ls/ s
.!!J
t'""""1
:i5 u
~5
.~~
32kbils/s
==
~:g
u
g
115
Capitulo IV
Procesamiento temporal de sefiales
Decir que los sonidos del ambiente, de la musica y del habla dependen, nece
sitan y, en ultima instancia, estan hechos de tiempo, es enunciar una verdad
de Perogrullo. La naturaleza del sonido es el devenir y el estudio de sus rasgos
esenciales ha planteado, y plantea, arduos problemas filosoficos. De las mu
chas experiencias que nombramos con el terrnino "tiernpo", algunas involu
cran nociones relacionadas con la sucesi6n, el presente, el pasado y el futuro.
Otras con las ideas de instantaneidad, simultaneidad y duracion, Tambien es
tan las que tienen que ver con la flecha temporal y la irreversibilidad del tran
sito del pasado al futuro. De la nocion de tiempo se derivan de forma mas 0
rnenos directa otras como movimiento, velocidad, pulso 0 ritmo. La dificultad
del llamado problema del tiempo radica en articular semejante variedad de fe
nornenos y conceptos dentro un sistema coherente.
Son abundantes y variadas las soluciones propuestas hasta ahora para re
solverlo. Pero es posible reconocer en la historia del pensamiento dos grandes
tendencias, La primera -que cuenta en sus filas a Arist6teles, Newton y Eins
tein- considera al tiempo como un hecho Fisico al que se adapta la mente hu
mana. La segunda supone que el tiempo es un fen6meno que pertenece a la
mente humana y que el de los ffsicos es un constructo proveniente de la idea
lizaci6n de los contenidos mentales. Se pueden situar en esta ultima linea a
pensadores como San Agustin, Brentano 0 Husser!. Para Paul Ricceur estas
opciones no se solapan por entero: a la perspectiva ftsica le falta la capacidad
de concebir un presente a partir del instante, y a la perspectiva psicol6gica le
falta sustento a la hora de explicar de forma satisfactoria el durar.
En la actualidad, la mayorfa de los investigadores conjeturan que el tiempo
no responde a un modelo de tipo univoco, sino que constituye una entidad que
se debe pensar desde varias perspectivas diferentes. Segim Fraser (1992), existen
al menos seis categorfas temporales: 1. Atemporalidad: en un universo en el que
solamente hay radiacion electromagnetica el tiempo no existe. La emisi6n y la
absorcion de un fot6n ocurren, en 10 que se refiere al fot6n, simultaneamente.
117
1. RESOLucrON
E INTEGRACION TEMPORAL
118
I Hay numerosos ejemplos en la rmisica del sudeste asiatico . En occ idente, la integracion
temporal const ituye UD proceso central en el minimalismo.
119
+rl- - - -
--------,
iii
Q)
~
Banda de ruido
enmascarante
co
co
'u
'"
cQ)
13
'u
c
co
Banda de ruido
enmascarante
Sefial
u,
0..
Tlernpo (ms)
r::;
Eo
co
'u
c:
Q)
:0
<.:!
~
u,
1i empo (ms)
ro
:s.
"0
:~
a.
E
<l:
1i empo (ms)
Figura 2. G rafico temporal y especrral de una dtsconrinuidad en una serial de ruido blanco
120
Se ha sugerido que la reso lucion te mpor al deberfa ser mejor a alta que a baja
frecue ncia. Una discontinuidad en un a sinus oide causa un a cola de resonan
cia ("ringing" en ingles) en cad a filtro aud itivo, que se rnant iene durante mas
t iempo a medid a que decrece el ancho de banda del filtro aud itivo correspon
dien te -por aplicacio n de l principio de indeterminaci6n aciist ico. En la figu
ra 4 se puede observar la rnodificacion temporal ejer cida por el filtro aud itiv o
centrado en 1.000 Hz sobre un a serial de entrada de 1.000 H z.
Como las band as mas angostas se en cuentran a baja frecuencia, es logico
suponer que en dicha region del espectro la resolucion temporal resulte infe
rior que en la zona de alta frecuencia, Datos experimentales sugieren que , por
encima de los 2.000 Hz, el tiempo de respue sta de los filtros auditivos es muy
pequefio y no afecta sign ificarivarnen te la resoluci6n temporal. Por debajo de
esa frecuencia la resoluci6n disminuye aprec iablemen te.
2. RESOLUCI6N TEMPORAL
En gene ral, los experime ntos en los que se intenta dete rrnina r el umbral de de
tecci 6n de disconti nu idades (gaps) se basan en sefiales de ruido de banda an
cha o El metodo mas uti lizado es el de elecci6n forzada entre dos altemat ivas
( 2 AFC), en el que el sujeto debe decidir cual de los dos pu lsos sucesivos de rui
do contiene el gap. El umbra l de discontinuidad medido en esta clase de expe
rime ntos, por ejemplo el realizado por Plomp, es de 2 a 3 ms (Plomp, R., 1976).
Otro grupo de experimentos ernplea seriales de banda ancha invertidas en
el tiempo . Sab emos que el espectro de potencia de largo tiempo de una serial
121
I'"
a)
.. ~~ ~ ~ ~~.~
-0
ro
-0
'iii
Q)
-0
ro
"0
'iii
Q)
10
15
20
25
30
~ i~W~i~1
iII
:s
~~ !~~~~ !I
1 1~ 1 1 \1 1~l l l li
~ ~~mi~
Ii
liempo (ms)
de corta dur acion no cambia si esta es invert ida temporalmente, Por 10 tan to,
si la segunda serial es muy breve y se la dist ingue aud itivame n te de la original
debe ser por la diferen cia en su patron temporal. EI umb ral de det eccion entre
dos senales de banda anc ha que cambian de arnplitud a la mitad de su desa rro
llo (de A a 2A) , pasadas al "de recho " e invertidas, es de 2 a 3 ms, valor qu e
co inc ide con el hallado por Plomp. Los sujetos no se dan cue n ta de l ca mb io de
arnplitud, pero perciben un cambio tfmbrico (oven "t ick " y "tock" ), En el gra
fico de la figura 5 se pueden ver las seriales ut ilizadas en el experime n to cit ado ,
A lgunos autores hall aron valores sign ifica tivarnente menores para el urn
bral de detecc ion, ent re 0 ,25 y 1,8 ms, pero no se conoce la causa de la d iscre
panda ent re ambos grupos de med iciones.
AN GOSTA
Para sefiales de banda angosta , la in troducci6n de una disc ontinu idad impli ca
"desparr amar" el espectro por efecto del principio de indeterminaci6n aciisti
co. De todos modos, la sit uacion es d iferente si se trat a de sefiales de ban da
angosta moderada 0 co n espectro de linea, como es el caso de las sin uso ides.
A contin uac i6n se an alizan ambas posibilidad es.
122
l 'IT" I '1
liempo (ms)
b)
iII
:s
-0
ro
-0
'iii
ill
EO
'II'" I rr r." r
: , .
liempo (ms)
Figura 5. Sena tes de banda ancha ernpleadas para deterrninar el urnbral de detecci6n de
disconrinuidades
123
11[:
I~
es de gran importan cia para explicar la parwioja acustica temporal que ana
lizarem os mas ad elante.
D eteccion de discontinuidades en sinusoides
Para evitar la confusion entre detecci6n temporal y espectral, las sinusoides se
presentan junt o a un ruido continuo con una muesca espectral sintonizada a
la frec uenc ia de la sinusoide (figura 3). De este modo se consigue enmascarar
la dispersi6n de l espectro ocasionada en la discontinuidad.
En lin celeb re expe rimento , Sha iler y Moore estudiaron la detecci6n de
discontinu idades en sin usoides en foca ndo la atenci6n en la fase de reinicio
de la serial (Shailer y Moore, 1987). Explicaron sus resultados, que contradecfan
a la literatura sobre el terna, sobre la base de la cola de resonancia ("ringing")
del filtro auditivo: cuando la sinusoide cesa, el filtro auditivo sintonizado a su
frecuencia cont inua respond iendo por un tiempo . Si el reinicio de la serial
coinc ide en fase con esta respuesta del filtro, la det ecci6n de la discontinui
dad es mas dificil. En las figuras 6 y 7 se muestran las seriales empleadas y las
respuestas del mode lo ante discontinuidades de diferente duraci6n.
En los casos en los que la serial "engancha" en fase con la respuesta del
filt ro aud itivo , Sha iler y Moo re midieron umbrales de 4,5 ms, consider able
mente mayores a los 2 0 3 ms esperados.
W-1f\v
VW\fv
rvv-M
10 rns
~~
WvvwvVV'v
~-
V\JVVvWVVV
~ - V\JVVvWVVV
~ -V\JVVvWVVV
~ - fIJVvvvvvVVV
~-~
Figura 7. Salida de un filrro auditivo simulado con Fe = 400 Hz en respuesta a una sinu
soide, con disconrinui dades de 1,2 a 3,7 ms en la cond ici6n de fase esran dar (exper imento
de Sh ailer y Moore)
125
<iiIiJjP
-o
.~
:;
Ci
:g ~
<t
Q;
-c
'"
:2
ro
(f)~
10
15
20
Tiempa (ms)
Estim ulo
25
30
10
15
20
25
Tiempa (ms)
Filtro auditiv o
30
10
15
20
25
30
Tiempa (ms)
Modul o integrador
Figur a 9. Op eraci6n del mod ulo de decision en el modelo de Shailer y Moore para estimu
los de diferente frecuenc ia
126
127
T EMPORAL
que esgrirne pa ra defender d icha hip6tesis es la del desp lazam iento te mpora l
de estfmu los acust icos ex trernos: to ma ndo la sec uencia [a] - b - azl en el riem
po fisico t, si el estfrnulo ce n tral b tiene un a frecu encia qu e difiere de forma no
tab le -por ejemplo cu at ro oc tavas- de los est frnulos later ales y escogemos
esti m ulos muy breves -del orde n de los 80 mi lisegun cios-, 10 qu e se oye en el
tiempo fenomenico T es un a suces i6 n distinta [A I - A z - B]. Los sonido s mas agu
dos se oye n seguidos y cl son ido intermedi o, mas grave, se ve re legad o al fin a l
de la suce si6n (Vicari o , G . B., 1997). En la Figura 10 se puede ver un esquema
del experirnento. La diferen cia entre las frecu encias de aj y az corre sponde a
un intervalo de seg un da mayor desce nde n te .
Vicar io comprob 6 q ue e n e l caso de q ue los es t trnu los al Y az sea n no ta
blernente mas exte nsos q ue b el fen6 meno se hac e mas ev ide n te , in clu so de
sap arece la noci on de "localizaci on temporal" de b, q ue parece flota r sobre los
dos son idos agud os. Llega a la co n clus i6n de qu e las secuen cias de estirnul os
no h o mogen eos son m as propi cias pa ra la producci 6n de de splaza m ien tos
temp or ales.
EI desp lazamiento temp oral no se pued e a tribuir a n ingun proceso fisiolo
gico y no parece senc illo ex pl icar de q ue modo re laciones especfficas no tern
por ales -como semejanza 0 d isimilaridad- pueda n in teraccion ar con relaciones
temporales tales como anres/des pues. La ex plicaci6n mas difundida supo ne q ue
la posici6n de los so n idos e n el t iempo feno rnenico se decidirfa luego de h a
ber ofdo todos los estfrnulos, La o pe rac i6n , prec onsciente, te ndrfa lugar en el
lapso de aprox ima da me n te 200 ms q ue va de sde la lIegada de las sena tes at
tfrnpano y la pe rcepci6n consciente de las m ismas (Fraisse, P. , 1967).
a, = 1.800 Hz
I
b
Las prueb as ex pe rime n ta les refe rida s a l de sp lazam iento entre el tiempo ffsico
y el fenomcnico fueron ini ci ad as por W h ilhem W undt y continuad as luego
por Edgard Rubien , q uien es lograro n tr ansforma r un fen 6men o de si multa nc i
dad fisica en un a suces i6n psicologica, Varias h ip6t esis fueron pro puestas po r
entonces pa ra dar cu en ta de l fen 6meno, y en tre elias pre valeci6 la qu e supo
nfa qu e la h et erogen eid ad de los estfmu los consti tu ye el factor responsab le de
los desp lazami entos ternporales.
En la dccada de 1970 el psicologo italiano Gio vanni Bruno Vicari o desa
rrollo un a serie de tr ab ajos sobre el fen ornen o de l de splazamiento tempor al en
la aud ici6 n , en los q ue plantea la imposibili dad de est ab lecer un a co rresp on
dencia biunfvoca en tre el tiempo ffsico y el psico logico . Una de las ev ide nc ias
128
a, = 1.600 Hz
=66 Hz
80
160
240
Tiempo (ms)
I
I
A,
A,
B
I
I
Tiempo
I.
I.
I
129
..,....-
a)
Una cond icio n necesaria para la oc urrencia del desp lazam iento tempor al es
qu e las di stintas sefial es no deben co nec ta rse esp ectr alme n te en las t ran sic io
ne s. De h eche, la rep roducc ion literal del experim en to de Vicario no da el re
sultado esperado. El motivo hay que buscarlo en el pe rfil di n arni co de las
sefia les: si las tr an siciones son bruscas (figura l l a ) apa rece un gran anc ho de
banda que destruy e la separacion espectral estipulad a en la h ipotesis o rigina l.
La apa ren te ano rna lia se debe simplemente a que n o puede ser qu eb rantado e l
lfrnite impu esto por el principio de inde terrninacion ac ust ico . El efecto se
aprec ia clara men te en el diagrama tridimensional de la figura 11b.
S i se suav izan las transiciones entre las sefiale s, po r eje rnp lo co n ven tarias
te rnporales gaussian as, se eliminan los puentes espectr ales q ue co n ec ta n Ia re
gion aguda co n la grave y el fenorneno de de splazam ien to tempor al se perc ibe
co n claridad, En la figura 12 se observa la sefial de prueba mod ificada y el efec
to espectral de rivad o. Se ve cla rarnente la ma yo r independen c ia (sepa rac ion
espe ct ral) ent re las seriale s aj y az con respecto a la seria l b, q ue correspo nde
a la co nd icion de n o h omogene idad de los est imu los post ulad a en los t rabajos
in ic iales (Basso, Gu illen y Liut, 2000).
u
ro
u
Tiempo
ol rJ.2J ms
".
544.54 ms
Figura 12 . a) Deralle de la sec uenc ia temp oral co n transi c io nes gaussian as largas. b) Ora
TEFd e la misma sec ue nc ia
f ICO
a)
Aplicaci6n musical
u
m
:g
c: 0
'"
t:
b)
iIi"
Tiempo
:so
_ O,Oms
.~
~ JJ-+'tJ2i!
-
344
689
1033
1378
'!J
1
1722
2067
2411
2756
Frecuencia (Hz)
130
Estas ex pe rie nc ias controlada s - co mo reco nocen casi tod os los inves t igadores
qu e par tic ipan de ell as-, por su simpl ic idad d istan bas ta n te de 10 qu e sucede
en la vida cotidiana, Es posible, sin embargo , encontr ar en rnuc has obras de
rruisica el uso -intencional 0 no - de algun a de estas pec uliaridad es de la pe r
cep c ion a udi t iva. Por tratarse de situaciones m usicales reales (es to es, dentro
del contexto de una "puesta en ob ra") n o ti en en la intensi.dad y la clari dad
que se puede lograr en el marco ascetico de un laboratorio.
De acuerdo con sus objetivos y co n los pre supu esto s esti lfsticos in vo lucra
dos, un co mpositor puede decidir el mod o de aplicac ion del desplazam ien to
aciistico temporal. Si su intencion es in depe nd izar y desvincu lar d iferentes ele
mentos de un conjunto, la estrategia pl an te ada permite de sdoblar la estru ctura
en dos tr aru as temporales separadas y autonorn as. U n ejemplo q ue ilustra esta
tecnica se encuentra en la pieza para orquesta red ucid a Homenaje a Garda Lor
ca (1936) de Silvestre Revueltas, en la qu e la m isma melcdfa se in te rp reta en
para lelo con una tuba y una flauta piccolo a d istan cias de cuatro y c inco oc ta
vas. Aunque el paralelismo absolute de alturas y dur acion es deber ia ayuda r a
fund ir perceptualmente los instrumentos, la en orme separacion de los regist ros
131
Tiempo
Capitulo V
Percepci6n de la altura tonal
iD
~
"D
'"
"D
"Vi
932 .97 ms
C
QJ
tIT"
516
1033
1550
206 7
258 3
3 100
1,391 S
36 17
Frecuencia (Hz)
Figura 13. Grafi co T EF del fragment o cita do de H omenaje a Garcia Lorca de Silvestre
Re vueltas
y la ausenc ia de puentes espec trales rompen la relacion temp oral ent re cllos. A l
La altura tonal se define tecn icam ente co mo "aq uel atri buto de la sensac i6n
audit iva en terminos de l cual los son idos pueden ser orde nad os en una esca la
musical" (American Sta ndards A ssociation, 1960) .1 En otras palabras, un a se
cue ncia de son idos que varfan de altura ton al tien e el car acter de una melo
dia, Un ejernp lo qui za ayude a delimitar este concepto.
Si se alte ra la ec ualizaci6n en un sistema de audi o ca mbia el brillo del so
nid o y, en cierto sen tido , algun aspecto relacionado con su altu ra. Pero h ay
otros elementos que no se rnodifican, pues el cambio en la ecualizaci6n no ha
ce que el Do de un a flaut a sesustituya por un Re, ni que el fragmento modul e
a ot ra ton alidad. Estas caracte risticas -que perrn an ecen in variantes frente a los
cam bios en la d istr ibuc i6n de energfa del espectro- definen la altu ra ton al pre
sen te en los son idos llamados t6nicos (Sc haeffer, P , 1966) . La ton icidad de un
son ido es el rasgo percep tual q ue permite que se 10 identifique con uno de los
grados de la escala musical. Lo q ue cam bia al modificarse la posici6n de los cur
sores de un ecualizador es la distribuci6n de ene rgia en el espectro de la sefia l.
Esta dist ribuc ion de ene rgia se asocia co n la percepci6n de la altura espectial del
son ido: dos guita rras que emite n la misma not a, una de soni do rnet alico y la
otra de sono ridad oscura, produ cen la misma altura tona l pero distintas alturas
espec tra les (es ha bitua l decir que la primera es "mas aguda" que la segunda) .
El grado de tonicidad varia de un son ido a ot ro: una flau ta genera sonidos
muy t6nicos, una ma rimba sonidos de tonicid ad interrnedia y un ta rnbor ge
ne ra sefiales de ton icid ad nula. En una primera aproximaci6n podemos esta
blecer que el grado de tonicidad guarda relaci 6n con el ancho de band a de la
serial ffsica: a mayor ancho de banda menor tonicidad, y viceve rsa. El princi
pio de inde te rrninacion aciistico gobierna la rela ci6n frec uencia/duraci6n en
los casos anteriores. La altura tonal se considera comp leta 0 "fuerte" cuando
permite la for maci6 n de aco rdes y funciones tonales, e incompleta 0 "debil"
1
132
133
134
0
-6
-12
-18
-24
-30
m -36
:s-
-0
:::J
~
E
-42
-48
-54
60
-64
-72
-78
-84
-90
-96
100
200
500 1k
2k
5k
10k
20k
Frecuencia (Hz)
Figura 1. Espectr o de un son ido de violonce llo
bilidad a la fase de l sistema aud it ive . Como esta sens ibilidad desaparece para
frecuencias por en c ima de los 5 kHz, la teorfa tem pora l no expli ca la percep
c ion de la altura to na l a alras frec uenc ias.
135
lizar un barrid o ascende nre en frec uenc ia del uni co armo n ico presenre (la si
nuso ide misma) se exc itan sucesivamen te zonas advacentes en la mem bran a
basilar. El resultado perceptu al es un glissando acornp afiado de un cambi a
continu o del co lor to na l. U n ejemp lo trad icional de esta confusion entre al
tura tona l y espectral 10 brinda la esca la de altura, expresada en me ls, que se
muestr a en la figura 2.
Los valores de altura en mels, elabora dos a part ir de estimu los sinusoidales,
d ifieren no tablemente de los obtenidos a partir de sefiales arrnon icas complejas.
Para alguno s auto res, la escala en mels describe simplemenre el brillo tfmbrico
de los sonidos simples y no es aplicable a la altura to na l ta l com o se la en tie n
de en la pract ica musical. A prin c ipios de la decada de 1970, Fred Attneave y
Richa rd O lson postu laron que para est udiar las escalas musicales se deben
ernp lear las seria les co mplejas que se usan en la practi ca musical concreta
(Attneave y O lson, 197 1). Los experimen tos que realizaron a part ir de este
postu lado diero n resultados mejor correlacionados con un vfnc ulo logarftmi co
en tre la frecuencia de l estfrnulo y altura tonal que la escala de me ls, al men os
dentro del rango de las frecuencias fun damentales que se emp lean en musica.
10 largo de l tiempo. Para la teoria del lugar ambas habil idades esran relac iona
das , pues depende n de l filrrado en frecuencia de la coclea . Para las te orfas
temporales la re lac ion no es tan marcada.
El limen - rnfnima variacion det ect able en frecuencia- permite evaluar la
discriminacion en frecuencia y crece mon otonarnente con el valor de la fre
cuencia del estfmu lo sinusoidal.' En las figuras 3 y 4 se pueden observar sus va
lores absoluto s y relatives, El valor relati vo de l limen, expresado en relacion con
frecuenci a central Fe, tiende a ser menor a frecuencias centrales y aume nta a
med ida que el estfmulo se desplaza hacia los ex tremos del espectro audible. Por
ejemplo, el limen absoluto es aprox imada ment e ~f = 2 Hz para una frecuen cia
ce nt ra l de 1.000 Hz y corre sponde a un limen relative de 0,2%.
Es habitua l rea lizar las experienc ias de medi cion del limen a partir de dos
metodos: la var iacion en frec uenc ia de sinusoides aisladas y la variacion en
frecuencia de la sefial moduladora en un dispositivo de frec uencia modulada
(FMDL).4 Los resu ltados de las experiencias de FMDL se utili zan, por ejernplo, en
el calculo de los Ind ices de inteligibilidad de la palab ra en sistemas de cornu
nicacion. En el capitulo IX desarrollarem os este top ico ,
C ontrariamente a 10 pred icho por la teorfa del lugar, el DLF no varta con
D iscriminacion en frecu en cia
la frecuencia de l mismo modo que la band a cr ft ica y disminuye al aumentar la
sono ridad de l estfrnu lo. A part ir de estos datos la mayorfa de los invest igado
Como ya serialamos, es necesario d isti nguir en tre selectividad en frecuencia,
res se inclinan por las teorlas tempo rales al proponer sus mod elos, aunq ue los
que es la habi lidad para distingu ir cornpo nentes en un son ido co mplejo , y dis resultados experimenta les sugieren q ue ex iste un mecanis mo temporal para las
criminaci6n en frec uencia, la capacidad para de teetar cambios de frecu en cia a
bajas frecuen cias y un mec anismo tonotopico para altas frecuencias.
Zwicker y Henning crearon un modelo mixto que produjo resultados con
sistentes
con los valores medidos de DLF y de FMDL (Zwicker y Fastl, 1999 ). Es
3000 I
I
t
I
j
I
I
t
I
JII
te modelo establece que el limen esta det erminado por la informacion tem poral
(sensibilidad a la fase) para frecuen cias de h asta 5.000 H z - la sensibilidad a la
2500 ~ . .f_f L.
L.
+ .. 1 1
fase dec rece ai llega r a 2 kH z y desa parece a 5 kH z. Por enc ima de 5.000 Hz
tanto el DLF y como el FMDL parece n responder a un a suerte de teo rfa del lugar.
2000 -I i-- i+- -: ;; + 1 ..~ . j
'
T'
..
Q;
- ; l S00
-I . _~ ......
.3
Stevens constat o en 1935 , a part ir de esti mulos sin usoidales, que la alt ura to
nal varfa con la sono ridad del esn mulo (Stevens, S. S., 1935). En la figura 5
se muestran los resultados del ex perime nto origina l.
1000
500
10
20
50
100
200
SOO
1000 2000
5000 10000
136
13 7
100,0
50,0
15
-I-:
-t .
8000 ~ Hz
10-1
--+
5J OO Hz
- +1
;;g
+"
C1l
>
~ o l~
C1l
5 -l
-'-_ _...._
- + ' . . ; ..
~ _. ~- ;: " .' 1
. --.+-
.;.-. , - i X ' 1
!
125 250 500 1000
2000
4000
6000
-15
0,02
&
co
-;
c
-o
80
90
100
LRF FM 10 Hz(FMDLF)
0,01
-.
0Q
2. PERCEPCION
'.
K
0,005
c
'"
o
>
.~
~
c
'"
E 0,002
:::;
250
500
1000
2000
II"
4000
8000
\
Figura 4. Limen relat ivo en frecuencia para esnrn ulos sinusoid ales. El FMDL se obtiene ca n
un a modulaci6n en frecuencia
138
ii
70
Aunque los dat os actuales son men os profundos que los medidos por Ste
vens, el fenorneno ocurre y, para senales alejadas del centro del espectro audi
ble , la variacion en altura ton al puede superar el 5%. Este fenorneno no tien e
aun explicacion teorica.
La variac ion de la altura ton al con la son orid ad desaparece cuand o el es
timulo est a cons titu ido par sefiales arrno n icas com plejas y no es, por 10 tanto,
apreciable en la mayorfa de los son idos que se usan en musica.
LRF (DLF)
:::>
60
Figura 3. Limen absol uro en frecuencia para esnrnu los sinuso idales. En la medici 6n de
Shower y Biddulph se ernplearon FMDL
'"
50
ec:
c'"
.~
Iii
40
12000
8000
-,
"
139
sost uvo que ambos merodos resultan incorr ecros a la hora de eva luar y dar res
puesta a la cuest i6n de la alt ura to na l, y que se debe ce ntrar el estud io en la
rasa de repetic ion de Four ier de la serial acustica.
Sin dud a, hay al menos dos d iferen tes clases de altura to na l: la que deri
va de estfrnulos d iacron icos 0 suces ivos y la que provien e de est frnulos sinc ro
nicos 0 simultaneos, Aunque la escala de mel s no es un a esca la aprop iada para
usos musicales, ca ptura sin embargo algun aspec to irnportan te relacion ado
co n la alt ura tonal de los son idos d iacron icos, Al gun os dat os estad fs ticos, co
mo la mayor can t ida d de inter valos cerrados en el ran go central de frecuen
cias , esta n relac ionados co n la esca la de mels. Tamb ien tien e algo que ve r co n
el brillo de los son idos, tal como co rne n ta ramos antes.
La teo rfa del lugar clasica tien e d ificultad es a la hor a de descr ibir la pe r
cepc ion de sefiales comp lejas ya q ue, por 10 gene ra l, la alt ura to na l no co
rrespo nde a la posic ion del max imo de exc itac ion en la membrana basilar.
U na dernostr ac ion co n cluyen te la provee el fenorneno de la fundamental re
co nst ruida 0 fantasma, descr ito por Schouten en 1940 co mo el "residue " de
bat ido de un grupo de arrnonicos co nsecut ivos.' La percepcion de este resi
duo n o requi ere ac t ividad en el punto de la MB que responde a un a sin uso i
de de alt ura sim ilar. Tiem po despues, Licklider ( 956) dernost ro que la
al tura del resid uo pe rsiste aiin cuan do los ca n ales en la MB co rrespo nd ientes
a la fundamental de la serie arrnon ica se enmascaran co n ruido de baja fre
cuenc ia: los soni dos de baja frecuen cia qu e se perc iben, asoc iados al residuo
de batido, apa rece n a part ir de los canales exc ita dos por los comp onentes de
me dia y alta frecuen c ia de la serial.
Varios mod e los fue ron prop uestos para exp licar la incid en ci a de la fun
dam enta l reconstruida en la percepcion de la a ltu ra ton al. U na primer a c la
se de modelos, los llamados modelos de reconocimiento de purrcnes, asume qu e
la a ltu ra de un soni do co mp lejo se de riva de las sefiales neura les co rrespo n
dientes a los estfmulos prima rios en la membrana basilar, por eje mplo las fre
cuenc ias de los pa rc iales indi vidu a les. La segund a clase de mod elos sost iene
q ue la percep c i6n de la a ltura to na l se as ienra en la eva luac ion de inter va
los te rnpora les. Veam os cada una con det all e.
Modelos de recon ocimi ento de patrones
Los modelos de reconocimienro de pa trones di viden el proce so de percepc ion
de la altu ra tonal en dos e tapas, La primera consra de un ana lisis en frecuen cia,
5 La funda menta l reconstruida cor responde al primer arrnon ico en el desarro llo de Fourier
de una serial per iodica. Vease el Apendic e l.
140
sim ilar al analisis clasico de Fourier, para det ermin ar las co mponen tes sinusoi
dales de la senal co mpleja. La segunda e tapa co nsiste en el recon ocimiento de
los esquem as 0 patron es que det erm inan la altura ton al co nforme a la salida
de la pr imera et apa.
En el afio 1962 Sc ho ute n realize un a expe rienc ia que provoco la apari
cion de gran cantidad de modelos teoricos que intentaron dar cuenta de los
result ados (Sch ouren , }. F. et aL, 1962). A part ir de sin usoides modul adas en
amp litud genera , en primer terrnino, sefiales co n tres co mponent es de 1.800,
2.000 y 2.200 H z. La altura to na l percibida cor respo ndfa, com o era de esperar,
a la de un a sin uso ide de 200 Hz, fundame nta l de Four ier del tr fo de arrnoni
cos an te riores. Luego gene ra otra sefial co n co mpo ne ntes de 1.840, 2.040 y
2.240 Hz (que son los arrnonicos 46, 51 y 56 de una funda men tal de 40 H z).
Los oyentes, sin embargo, percibfan un son ido compuesto cuya altura to na l
predom ina n te era similar a la de una sinusoide de 204 H z, jun to a dos alturas
secundarias que se pod fan asoc iar co n sin usoides de 185 y 227 H z. Ninguno
de los sujetos que part iciparon de la experienc ia perc ibio la altura correspon
dien te a la fund amen tal de Fourier de 40 Hz.
El modelo propuesto po r Wa lliser, en 1969, para ex pl icar estos resultados
con sta de dos pasos: 1) se calcula la altura de te rm ina da por la diferen cia de
frecuencia entre pa rc iales vec inos (la tasa de repetic ion de la en voIven te) y
2) se busca el subarrno n ico del co mpo ne n te de meno r frecuenc ia que mejor se
ajuste a la frecuen cia enc ontrada en el paso pr imero ," Este modelo aplicado al
experimento de Scho ute n da 200 H z en la pr imera operac ion 0 ) y 204, 4 H z
0 .840 H z / 9) en la segunda operac ion (2). Esra ulti ma es la frecuencia que
de te rm ina la altura tona l.
En 1972 Terdh ardt sugirio , inspirado en el modelo de Walliser, que la al
tura residual es un subarrnon ico de un compo ne nte dom ina n te y discrimina
ble, sea 0 no el de meno r frec uenc ia. C uando los parc iales estan muy proxim os
en frecue ncia no puede n d iscrim inarse y resulta imposible o fr la altura resi
dual. Estimo q ue los parcia les dom inantes cae n en la region espectral com
prend ida entre 500 y 1.500 Hz."
U nos afios despues, Terdh ard t sugirio qu e la capac idad necesaria para ha
cer uso del mecanisme prop uesto en su modelo apa rece en un a fase ternpran a
del ap rendi zaje, en la que estarnos expuestos sobre todo a los son idos del ha
7 Terhardt llama 5ubaml6nico5 al conjunto de las funda menta les de Fou rier cuyas series ar
m6ni cas inclu yen el co mpone nte del est fmulo en cuesrion. Sus frecuencias coincide n co n
los subm ultiples de la frecuencia de l compone n te. No se los debe confund ir con el produc
141
bla (Terdhardt, E., 1974) . Afirrn o que aprendemos a asociar la frecuen cia de
un corn pone n te del estim ulo co n los suba rrnoni cos del m ismo: la estirnulac ion
de un solo arrnon ico produce alturas prob ab les a las frecuenc ias de los subar
mon icos. C uando un co mplejo arm6 n ico se pres enta, la mayor cantidad de
co inc idencias a la frecu encia de la fundamenta l determina la altura to na l del
son ido, Para son idos no armo n icos (como el de la experiencia de Sc ho uten )
no hay co inc ide ncias exa ctas y la sensac ion de altu ra no resulta tan precisa.
Queda claro que este modele requ iere de l ana lisis de mas de un parc ial de la
serial de entrada .
a)
b)
l ' 2 ' 3:
Figura 6. Form as de onda de dos sefiales modu ladas en arnplitud. En el pr imer caso, la
portadora (2.000 H z) es un multi ple exac to de la moduladora (200 Hz) y el pertodo ent re
picos correspondienres (1-1 ' , 2-2' ) es de 5 ms, En el segundo la frecuen cia de la portadora
aumenra a 2.040 Hz y el in tervale en tre picos es algo menor a 5 ms
Mo de los temporales
Para da r cuen ta de su celebre ex perirnen to , Sc hou ten propuso un mod elo
basad o en el patron temp or al q ue desarr olla la onda del estimu lo en la mem
bran a basilar. Seg un su mod elo, la a ltura tonal es determinad a po r la pe rio
dicidad de los parciales in vo lucrados en la dete rminacion de l residu o. EI peso
relati ve de cada parcial depende de su capacidad para atraer la ate nc ion del
oye nte , ya sea po r sono ridad 0 po r co n traste con esn rnulos prev ios.
La gran diferen cia ent re los modelos temporales y los mod elos de recon o
cim iento de patron es es que este s ulr imos requ ieren que mas de un parcial sea
discriminabl e del co mplejo para q ue se perciba la altura de l residuo , mientras
que los primeros solo pid en que los parciales interactuen , no que sea n discri
minab les (n o es n ecesario que sean perc ibidos separados) ,
En la figura 6 se mu estran los resultados temporales del exper ime n to de
Sc ho uten .
1 2 3
"
-,
~
despues, Plomp hallo qu e la altur a residual puede percibirse para tasas de re
peti ci6n de hasta 1.400 Hz, dat o compatible - aun que no identico- con la pro
puesra de Rit sma (P lo mp, R., 1967).
A con trapelo de las h ip6tesis an teriores, Moore estableci6 q ue para an no
n icos de orde n elevado hay un rango determinad o en el cual se puede o ir una
altura residual aun cuand o ningun o de los arm6n icos pueda o frse por separa
do (Moore, B., 1995 ). Los modelos de reconocimien to de pat rones no pueden
dar cuenca de este heche . De tod os modos hay que apuntar q ue los son idos ge
ne rados un icarnen re a parti r de arm6ni cos elevad os no definen tan clara rnen
te la altura residual como aquellos que con tiene n arm 6nicos mas bajos.
A unq ue la altura residual se percibe rnejor en presencia de gran can tidad
de comp on entes arm6n icos, Houtgast reporto que si el con tex to lleva al suje
to a centra r la atenc ion sobre alturas de un rango particular, aun un solo arrno
n ico es capaz de evoca r la percepcion de una altura residual grave (Ho utgast,
T., 1976). C uando la infonnaci6n sensorial se vuelve ambigua, como ocurre en
presencia de ruido, esas alturas potencia les se perciben con mas facilid ad.
En un expe rimen to sec uencial de Hall y Peter s, en el que tres arm6nicos
sucesivos de 40 IDS de dur aci6n se presen taban separados por 10 ms de silencio,
los son idos se ofan d isociados en condiciones de laborarorio (H all y Pet ers,
198 1). Pero en presenc ia de ruido la altura residual asociada, correspond iente
a los arrnon icos en presen tac i6n sincron ica, se volvla perceptible. Parece ser
q ue el ruido habilita la aparicion de un mecan ismo sin tetico de percepc ion de
la altura.
El principia de dominaci6n
De acuerdo con la teo rfa de reconocimie n to de patron es, los arrnon icos dis
cr imin ab les de rnenor frec uenc ia son los mas import an tes para det erminar la
altura tonal. En ca rnbio, para las teorlas tem porales los mas impor tantes son
los de mayor frec ue nc ia. La altura residu a l se h a observado uni camente
cuando los arrnon icos esta n presen tes a frecue nci as por deb ajo de 5.000 H z,
region q ue coi nc ide co n la efec tividad del proce samienro de la inform acion
temporal.
Rit sma sugirio qu e los arrnon icos 3, 4 y 5 domi nan la sensac ion de altura
tonal en la region de 100 a 400 Hz (R irsrna, R., 1967). Plom p co incid io en
parte con este postulado, pero considero q ue la region no se define en cuan ro
al nurn ero de armo n ico, sino qu e es funcion de la frecuencia absoluta (Plomp,
R., 1967). Para alturas to na les agudas son imporran tes los prim eros arrnon i
cos, mientras que para alturas ton ales graves cobra n import an cia los arrnon i
cos por enc ima del quinto.
144
c ion corresponde a la que se enc uen tra en la en trada. A modo de eje rnplo, en
la figura 8 se aprec ia la salida de diferentes filtros audit ivos an te un tren de irn
pu lsos de 200 pulsos po r segundo.
La segu nda eta pa consis te en Ia transducc ion de la salida de los filt ros an
ter iores en impulsos nervi osos.
La tercera etapa defin e un dispositi ve capaz de analizar los in tervalos en
tre rnaximos a cada frec uenc ia central Fe (vease la figura 8).
En la cuar ta etapa se comparan los in tervalos rernporales presen tes en los
diferen tes cana les y se buscan los pa tron es com unes a varios de ellos, Esre cir
cuito tam bien deb e in tegrar Ia informac i6n a traves del t iernpo. En general, el
interva le temporal mas frec uen te corr espond e a la co mpo ne n te fund amental.
En la quinta etap a los valo res de los in te rva los ternporales mas prcrn ine n
tes llegan a un mecan ismo de decision qu e selecciona un o de ellos. Este cir-
Hz
5080 -141_~--~_.--
-----'l/j,..-
4032 -HIH
Entrada
acustica
banco de
filtros
pasabanda
3200 1-"W\J1i1ftArv----.AAflJJ.A/'tN'J""-~
2540 -J---.AAAAiW
-.AJW't:Prf\!'<P-
20 16 +--.A;f'rAJ_
1270
Transducci6n
nerviosa
'<Af'rAJ_
1600 +-"""p.,<""'-
""'-__
f. .-- -=--.=.,-.",- _
1008 +=,=..,_~~"""""'""".,,=....=......=....
800 +="=="""'==--"=="""'==--"==
Analisis de los
intervalos
entre picos
635 = = = =~ ~=====
504 4 - --
- - --
400
Combinaci6n de
mtervalos con
frecuenclas centrales
Selecci6n de los
intervalos mas
promlnentes
: : j-~-~----~-~
159 .
Tiernpo
A ltu ra
ton a l
146
Figura 8. Sim ulacion de las respuest as de la MB ante un tre n de impulses de 200 pps.
Los mim eros de la izquierd a ind ican cada un a de las frecucncia s cenr rales Fe,
que co rresponden a las formas de onda de salida de cada ftltro
147
cuito incorpora la memoria y la atencion, y puede ser influido tanto por los es
tfmulos in med iata rnen te precedentes como por el co n tex te y las co nd ic ion es
generales de pres entacion. La altura tonal final (sefial de sa lida del modelo)
corresponde al intervale seleccionado.
El modelo de Moore explica satisfactoriamente gran ca n t idad de ev iden
cia experimental. A co n t inuac ion mencionaremos algu na de las situac iones
que logr a resol ver.
C uan do la altura residu al se obtiene a partir de un os pocas armoni cos ele
vados (por ejemplo, el 12, 13 y 14) que no pueden resolverse por separado, resul
ta debil y am bigua. Este hecho ex plica por que los primeros arrnon icos tienden a
dominar en la percepcion de la altu ra. La altura asoc iada a los armo n icos supe
riores se hace mas clara si aurnen ta el mim ero de armonicos presen tes.
Un pequefio grupo de armo n icos mu y altos no gen era la sensacion de al
tur a tonal, h ech o que se puede explicar en terrninos dellimitado ran go de in
tervalos tempor ales que pueden ser analizados por el grupo de neuron as de cada
frecuencia ce n tral. Para arrnon icos por encima dellS, el intervalo temporal co
rrespondiente a la fund am ental cae fuera del rango que puede ana lizar el can al
que responde a esos armonicos (este dato es muy import ante en el modelo de
Moore).
Cuando los arrnon icos superan los S kHz la estructura fin a de la forma
de onda a la salida del filtr o de la primera et apa no se prese rva en el patron
tem pora l de los imp ulsos ner viosos.
La altura de estfmulos qu e no presentan picas espectrales, com o el rui
do blan co interrumpido periodicarnente, se percibe en el mod elo a traves de
los interv alos tempor ales presentes en los cana les de altas frecuen cias ce n tra
les FC, que poseen mayores anc ho s de banda y por 10 tanto mayor defini cion
tempor al (preservan la estructura temporal fina de la forma de onda) . La altu
ra tonal de esto s est irnulos es debil.
Si se incorpo ra un mec anismo comparador central de la informacion
proveniente de ambos o idos lue go de la tercera etapa, se pueden in te rpretar
los fenornenos dicoticos.
El modelo se parece al de Terhardt en el tratamiento de los primeros arm o
nicos, pero este ulti mo no puede explicar la altura producida por los arrnon icos
superiores no discriminables . En el modelo de Moore los sonidos de co mb ina
cion juegan un rol en la dete rminac ion de la altura. El mas impo rtante (2ft - f2)
se percibe aun a bajas sonoridades y puede actuar com o un arrno nico infe rior
mas facil de d iscrimina r que algunos co mponentes del espec tro de en trada .
El modelo de Moore se utiliza ac tua lrnen te en el disefio de tradu ctores de
altura tonal para sistem as cod ificado s a ruimero uni co , por ejernplo para dise
fiar conve rsores de altura tonal desde un a guitarr a al siste ma MIDI.
148
3. LA ALTURA
El ejemplo clasico consiste en tran sport ar un fragmento musical un cierto inrervalo, par
ejemplo una quinta justa ascende nte.
10 Podemos citar aquf la pieza para piano Modes de valeurs er d'intensitis, co rnpuesta en 1949
por O livier Messiaen (1908-1992), que emplea por primera vez la recni ca serial no sola
mente para las alturas sino tarnbien para las durac iones, los araques y las intensidades.
149
------------------------.....------------------ - - -
La 1
La 2
La 3
La 4
La 5
La 6
55
11
11
110
220
440
880
1.760
12
13
14
15
16
11x 2
12 x 2
13 x 2
14 x2
15 x 2
Mi l l
Escucha dos
nolas: Do y Mi
Do+Mi
Re
Escucha dos
notas: Do y Mi
II
Escucha una
nota: Re
150
Frecuencia (Hz)
nes para designar el inte rvale de octav a (Une rnoto , T., 1989 ).
151
La5
La4
--<;>-Mi5
Parcial
Do
00#
Re
Oesplazamiento
La
Ancho de banda
Sol#
Sol
Fa#
Fa
152
~ Croma ~
Figura 14. Toroide que permire representar las relaciones de octava y de quinta
IS3
Figura 15. Helice toroida l q ue permue represen tar la altur a tonal, la a ltura (height)
y las relaciones de oc tava y de quinta
154
155
Frecuencia (Hz)
I
3729
3322
296 0
2489
22 18
1865
1661
1480
~ )86
-
1244 ,5
1108 ,7
932,3
830,6
740
622 ,3
554 ,4
466 ,2
415 ,3
370
~
~
~
3 11,1
277 ,2
233 ,1
207 ,7
185
155,6
138 ,6
116,5
103,8
92 ,5
77,8
69,3
58,3
5 1,9
46 ,3
38,9
34,7
29 ,1
~
~
3951
3530
3 136
2794
2637
2349
2039
1976
1760
1568
1397
1318 ,5
1174,7
1046 ,5
937,8
88 0
784
698,5
659 ,3
587 ,3
523,3
493,9
44 0
392
349,2
329,6
293,7
26 1,6
246,9
220
196
174 ,6
164 ,8
146 ,8
130,8
123 ,5
110
98
87,5
82,4
73,4
65,4
61,7
Do 8
Si 7
La 7
Sol 7
Fa 7
Mi 7
Re7
Do 7
Si 6
La 6
Sol6
Fa 6
Mi 6
Re 6
Do 6
Si 5
La 5
Sol 5
Fa 5
Mi5
Re 5
Do 5
Si 4
La 4
Sol 4
Fa 4
Mi4
Re4
D0 4
Si 3
La 3
Sol 3
Fa 3
Mi 3
Re 3
Do 3
Si2
La 2
Sol2
Fa 2
Mi 2
Re2
55
D02
Si 1
La 1
49
43 ,7
41 ,2
36,7
32,7
30,9
27 ,5
Sol 1
Fa 1
Mi 1
Re 1
Do 1
Si 0
La 0
156
Los dos mecan ismos que acnia n en la percep ci6n primaria de la altura, el ton o
rop ico y el temp oral, se man ifiestan de mane ra d iferen re si se presen tan int er
valos sucesivos 0 diacronicos 0 int erv alos simultaneos 0 smcrorucos. C uando los
estfmulos son diacr6n icos, la sucesi6n de intervalos posee ca racter melod ico.
La eva luaci6n de la diferen cia de altura ent re esn mulos -el intervale diacroni
co- puede derivar uni carnente de la evaluac ion de la distancia que existe ent re
puntos de vib raci6n en la membran a basilar. S i los est frnulos son periodicos,
con espectro arrnon ico, se eva lua la d istan cia ent re los dos patrones de excit a
cion. En esros casas el mecan ismo tonotopico es el unico que pued e act ivarse
porq ue, al no actuar los dos esn rnulos al mismo tiempo, no es posible el anali
sis tem poral sirnulran eo ent re ambos. En la figura 17 se ap rec ia un grafico tem
pora l de las sefiales que indu cen un interv alo diacroni co de qu inta justa.
] uzgamos los interva los sucesivos casi de rna nera tactil, cornparando el
pun to de maxima excitac ion del segundo esrfrnulo co n el recuerdo de l punto
de ma xim a excitacion de prim ero . En este caso , el rol de la me moria de co rto
terrni no resulta dererrninanre. S i ade rnas actua la mem oria de largo terrnino,
hech o que oc urre en alrededor del 1% de la poblaci6n , se dice que el oyen te
posee ofdo abso luro. El oldo absolwo es la habilidad de recon ocer la altu ra ro
na l de un son ido sin co mpararla con una referencia cercana en el tiernpo,
En camb io, cuando los esn rnulos se presen ran de manera sincronica , la
man ifestacion simulta ne a de dos 0 mas son idos posee carac ter arm6nico. 16 La
eva lua ci6n de la d iferencia de altura entre estfrnulos - el in tervale sincronico
Mi
La
ill
:s
"0
I1l
"0
'iii
CD
E
Tiempo (ms)
16 El termino "armon ico" se emplea aquf en un sent ido arnp lio y sign ifica ocurreneia sirnul
tanea . De rnan era similar, en el parrafo ante rior se habla de caracter melodico para descri
bir la ocurrenc ia sucesiva. Se podrfa trazar un correlate eon las estruc turas ver tic ales y
ho rizon tales en una partitura 0 en un sonogra ma.
157
CD
:s
"0
C1l
"0
"Vi
c
2c;
V\fL"
Ii
~"
-j---j -
. -
T-I
I.-
i_J
"0
C1l
"0
"Vi
c
_.
CD
~-"-I
I.
i - -;
~---" -~:
:s
Q)
-~
_."- - -
I
l"'
Figur a 19. Espectro de Fou rier asociado a un intervalo sinc r6n ico de quinta justa
ro
:s
"0
C1l
"0
"Vi
C
Q)
Tiempo (ms)
Figu ra 18. Seriales asociadas a un int ervale sinc ron ico de quin ta justa
+----!~"
-'-
1S8
--'
--+-----+ ~ - - 1 -1
I -
1I
'-
-1.-.1 - - -
puede deri var en este caso tanto del mecan ismo tonot o pico a n te rio r co mo del
analisis temp ora l sirnultaneo de las dos sefiales. En este ultimo caso la apari
ci on de batidos y so n idos di ferenciales pre va lece como cr ite rio de co nso na n
c ia y co rrec ta afinac io n , al menos en la mu sica tonal occ idental.
Tomem os como ejemplo un intervale sincron ico de qui nta jus t a , C a
da vez qu e la seri al m as gra ve, un La4 d e [ = 440 H z cornplet a dos ciclos la
m as aguda, un M iS d e i': 660 Hz cornpleta 3 , tal como se apr eci a e n la fi
gur a 18.
La ex ac ta coinciden cia de fase cada dos ciclos del La4 -0 tres del MiS
imp ide la aparic ion de batidos y d iferenc iales . EI grafico espec tral del interva
10 an terior es el qu e se mu estr a en la Figura 19.
iQ ue oc urre si desafina mos un poco esta q uinta justa , po r eje rnplo, au
mentando la frec uencia del M iS ap e nas 2 H z pa ra llevarl o a 66 2 H z? A pare
cen n ece sari amente ba tid os de primer o rden que crece n en frecuencia a
med ida qu e aumenta el orden de los arrnon icos involucrados.
EI batido mas grav e se da entre el tercer armo n ico de La4 (un M i6 de [ J =
r
I--t-a
.I"
1j -
t i - .
"
-- .J- . .
j:
~ : f/ j
-1I '-1-- !-
--
"
Figu ra 20 . Espect ro de Fourier asociado a un Intervale sincr6n ico de quinta justa desafinado
159
~
r-.
--
r-.
':'
e-------=--o
I'7't
I'7't
o
e
U n ejernplo pract ice para dernostrar la diferen cia entre un a octava dia
cronica y o tra sinc ronica se puede realizar con un instrurnen to de arco, por
eje mplo un vio lin . Primero se toea la tercera cue rda al aire (Re4), se hace un
pequefio silencio y se toea en segunda cuerda la oc tava (Re5) del son ido an
terior, buscando la mejo r afinac ion posible. A cont inuacion se compara esta
ultima no ta con el segundo arm6n ico de la tercera cuerda (Re5 ): el Re5 en se
gunda cuerda es casi siempre mas agudo q ue el arm6n ico.
lQue ocurre? La octava diacr6nica fue afinada de acuerdo con la memo
ria audit iva y no pud o controlarse por baudo. Par 10 gene ral se la afina un po
co mas grande que la que corresponde a la relacion Z: 1. A su vez, la frecuencia
del segundo arrnon ico, si la cuerda es de buen a calidad, es casi exac ta rnen te el
doble de la frecuenc ia de la cuerda a aire.
En ca mbio, si la octava an terior se interpreta sincroni camen te (un bicorde)
es posible llevar el batido en tre ambos son idos a cera. En este caso la altura del
Re5 en segund a cuerda y el ann6 n ico en te rcera son de la rnisma altura to nal.
Co ns onancia y disonancia
Los conc eptos de conso na ncia y disonanc ia son, obviarnente, cultu rales y de
pend en del contexte h istorico, del gen ero, del estilo y hasta de las caracterfst i
cas part iculares del compositor de cada pieza de rnusica. En muchos textos se
leen frases del tip o: "cuando los son idos musicales relacionados por un a razon
simple suena n sirnultanearnente el son ido es agradab le" 0 "la d isonancia puede
ser explicada en parte por el bat ido entre cornpon en tes en la membrana basi
lar", que pret end en establecer causas perceptu ales primar ias e independ ientes
160
<.;
17 Q ue alguno de los siste mas experirnen rales que apa reciero n en el siglo xx ha ya n sido ac u
sados de "ax iom at icos", y hasta de "recnocra ricos" , no invalida la aftrmac ion ante rior.
161
Capitulo VI
TImbre
Aprendimos en nuestra etapa escolar que el sonido tiene por atributos la altu
ra, la intensidad, la duraci6n y el timbre. El timbre se referia a cierta cualidad
del sonido que nos permite reconocer los instrumentos de una orquesta 0 dis
tinguir entre sonidos diferentes. Pero, a diferencia de la altura, de la intensi
dad y de la duracion, el timbre no es un atriburo perceptual de descripci6n
sencilla.
Entendernos la percepci6n como un proceso en el que usamos la inforrna
ci6n provista por nuestros sentidos para armar representaciones mentales del
mundo que nos .rodea, Una parte irnportante en esta tarea es decidir que par
tes de la estimulaci6n sensorial corresponden al mismo objeto 0 evento ffsico,
y cuales no. La necesidad biologica del timbre tarnbien puede ser comprendi
da desde una perspectiva evolutiva, a partir de la adapracion del sentido del
oido para proporcionar informacion sobre la base de las vibraciones mecani
cas del aire.
Bregman opina que el timbre surgi6 de la necesidad de distinguir entre dos
objetos auditivos cuando estes no pueden identificarse a partir de parametres
simples (Bregman, A., 1994). Si un rasgo auditive se mantiene dentro de limi
tes unidimensionales, como ocurre con la altura tonal, podemos operar hasta
una cantidad maxima de cinco 0 seis elementos individuales a la vez. Para ma
nejar simultaneamente una mayor cantidad de unidades de informacion se re
quieren mas dimensiones y el timbre aportarfa esas dimensiones adicionales.
Segun Shepard, el sistema perceptual de los animales nace con la incor
poracion sensorial de las regularidades propias del arnbiente en el cual han
evolucionado.' Por ejemplo, somos muy sensibles a ciertos aspectos del soni
do que no se modifican durante el recorrido entre la Fuente y el oyente, como
-",,-,J a altura tonal. Por el contrario, somos practicamente insensibles a las carac
t~risticas que varian de manera aleatoria con el contexto, como la fase y la in
1
163
1. DEFINICION ES DE T IMBRE
EI primer problema qu e aparece al estud iar el concepto de timbre es la vague
dad y arnb iguedad del terrnino. Rep asem os las dos defini ciones mas utilizadas .
1. Una maner a clasica de definir timbre es asociando lo a las fuentes acus
ticas de origen. En musica , los nombres de los instrurnentos se usan co mo eti
qu et as para deno tar los t imb res, por eje rnplo "timbre de flau ta" 0 "timbre de
violin". S i uno de sea comunicar la impresi6n gene ral dada por un son ido , est e
met odo de nombrarlo puede ser adec uado. Las etiquetas norninales ac nia n de
modo ana logo a los n om bres de los co lores: el termino "rojo" es suficien te pa
ra ped ir un torn ate maduro en un a verdulerfa, pero result a dem asiado arnplio y
vago para describir los miles de "rojos" que se usan en la indu stri a grafica. Del
rnisrno modo, h abl ar d e "so n ido de flaut a" n o n os sirve para diferenciar en tr e
los son idos de dos flaut as d iferentes, ni para distinguir los son idos que obt ien en
dos flau tisras del mismo instrurnento . C om o eje rnplo, podem os men cionar la
mut aci6n que ocurri6 co n el co nce pto de ruido blanco: en princ ip io describe
un a ca racte rist ica ffsico-mat em arica de un a sefial ac ust ica de espec tro plano,
pero se co nv irt io en tre los rruisicos electroac usticos en un a nu eva unidad c ul
tura l, el "ruido blanco" co mo un timbre mas de su repertori o.
Como vere mos mas ade lante, el uso del timbre a man er a de et iq ueta irn
plic a el reconocimienro del son ido sobre la base de un esq ue ma previo en el
qu e la mem oria auditiva juega un papel cent ra l.
2. La defin icion acade mica de timbre se puede encon trar, por eje rnplo, en
el apartado sobre terminologta ac ustica del ASA . Es repetida hasra el ca nsanc io
en rnultitud de norrn as y tex tos, y dice menos de 10 que no d ice: "ti mbre es el
at ributo de la sensaci6 n auditiva en term inos del c ual un oye nte puede juzgar
qu e dos son idos simil ares, co n igua l sono ridad y altura tonal, son diferenr esv.s
Esta es, qui za, la defini cion menos co mpro me tida de tod a la historia de la
2 American Sta nda rds Associati on (1960) , trad ucci6 n de GB. Esta definicion es de fendida,
entre otros, por Crow der, aunq ue impone una restriccion remporal que sc suma a las con
d iciones originales (Crowder, R. G., 1989). O tros autores (Plomp, R., 1976) restringen la
definic i6n a la clase de los sonidos co mplejos estaciona rios en el tie mpo.
164
165
166
El mod elo clasico empleado pa ra exp licar el timbre -al menos en los instru
mentos de rnusica- establecia q ue, asf co mo la frec uencia funda men tal deter
mina la altura percibid a y la intensid ad ffsica la sono ridad, el timbre tiene
origen en la a mplitud y distribuci6n del espec tro promed io de la sefial acu sti
ca . El modelo est ab a basa da e n la ley ac ustica de O h m, enunc iada en 184 3 ,
segun la c ual el o fdo es ca paz de disc riminar los arm6 n icos que co mpo n en un a
sefial peri odica, pero n o pu ed e pe rc ibir las diferencias de fase entre los co m
ponentes, En la figura 1 se pueden ver los osc ilogra mas de cu atro seriales pe
ri6dicas can igual espec tro de potenci as y diferentes fases relativas en tre
arrnonicos. S i pudierarnos ofrlas n o e nco n trarfarnos diferenci as aprec iables.
De mod o mas pre ci so, la ley ac ustica de O hm esta blece qu e un oye nte
no puede d isti ng ui r en t re dos sefia les can la m isma distribucion de frec ue n
cias y a mplit udes en los a rmo n icos, pero can un a di stribuci6n de fases di fe
rente . En est e modelo el timbre depende unicarnente del espec tro de
potencias de la o n da , q ue es s610 un a parte del ana lisis co mp lete de Fourier
(Ba sso , G., 200 1a) .
Segun la tradi cion, el defensor mas dest acad o del modelo clasico fue H er
man von Helmholtz. S in emba rgo, H elmholtz tuvo la precauci6n de limitar su
alcance a las sefia les est acion ari as: "Ciertas ca rac te rfsticas particulares de los
sonidos de va rios instrumentos dep enden del mod o que co m ienzan y cesa n
[Oo .J", de man era q ue estudi6 sola mente "[...] las pec uliarida des de los son ido s
mus icale s que co n tiruia n un iforrn ernente"." Los seguido res del model a -easi
todos los ffsicos, ac usticos y rmisicos hasta bien e n trada la dec ad a de 1960-,
n o tuvieron la prud encia de Helmholtz y procl am aron resuelto el asun to.l A
10 sum o , reconoclan qu e la teorf a es ta ba limitad a a las ondas estacionarias pe
riodicas qu e, seg iin ellos, co mpo n fan la mayor parte de las sefiales de los in s
trumentos de mu sica.
" <, .............~
167
'}I)~ AJL'~,Y\r.
Tiern po
b)
ILL
OT' --,.-~---,--,
Flauta
UillJ
-20
co
~ -20
"0
.-E
-40
0.
<{
Frecuencia
Figura 1. a) Oscilogramas de cuatro sena tes periodicas con igual espectro de potencias y
d iferentes fases relat ivas: b) espect ro de potencias de las senal es anteriores
Frecuencia (kHZ)
Llevar esta teorfa a la realidad no fue tarea simple. Se sabla desde princi
pios del siglo XX que los espectros de los son idos varian en el tiernpo, asf que
la pregunta central fue: lc ual de tod os los espec tros sucesivos de bia to rnarse
para determinar el tim bre del son ido? La respuesta la dio H all en 1937 al es
tablecer que se deb fan pro med iar temporalm ente los espec tros, y que el resul
tad o de este promedi o era e l responsable del tirnbre .? Un eje rnplo
repr esentative de estud io experime n ta l basado en el modelo clasico se puede
aprec iar en la Figura 2.
Si el timbre es co nsec uenc ia de la distr ibuci6n de los armonicos 0, ex
puesto de otra manera, de la forma de onda estac ionaria, una serial cuya for
ma se mantiene no deber fa sufrir modifi caciones t fmbricas. Pero un o de los
experimen tos acusricos mas simples contradi ce esta afirrnac ion .? La fo rma de
onda de un a sin usoide no ca mbia a l cambia r su frecuenc ia, pero si se genera
un glissando que recorra buena parte del tan go audi ble poc as personas d iran
q ue el timbre perrnan ece inmutabl e. En realid ad, a bajas frecuen cias la sin u
soide suena bland a y oscura, mientras q ue a altas frec uencias parece dur a y br i
llante." [La sin usoide, el "ladrillo" con el que se pret end fa construir el edificio
del timbre poseia, a su vez, un timbre particul ar! 0 peor aun, mutaba de t im
168
Figura 2. Espect ros de son idos de diferentes instrurnen tos segun Wedln y Goude (Hande l,
S, 1995)
bre a medid a que ca mbiaba de frecue ncia. La conclusion del expe rimento es
ca teg6 rica: no ex iste una relaci6n uno a uno entre forma de o nda y timbre.
U no de los pilares del modelo clasico se desrnoro naba.
Otra cuest i6n que gener6 un intenso de bate fue la de la invariancia del
timbre ante un cambio de frecuencia. Para que el timb re no varie, ldeb en con
servarse las relacione s de amplitud entre arm6n icos para preservar la forma de
onda escalada, 0 de ben conservarse las posicion es absolutas de la envoi vente
temporal? El modelo clasico sosten ia clararnen te la prime ra opcion. En un ce
lebre trabajo, S lawson demostr6 que el model o tarnbi en fracasaba en ese pun
to (S lawson, W., 1968 ). En la Figura 3 se pueden ver las dos opciones. Los
oyen tes juzgaron que la alte rna t iva 1 co nserv a mejor el ti mbre que la alter na
tiva 2 -defend ida por el modelo clasico,
Durante el ana 1926, en plena auge de la teorla clasica, Me tfessel public6
un artlculo en el que ponia en duda la simplista propos ici6n "forma de on da es
tacionaria igual timbre" (Butler, D., 1992). La inve rsi6n temporal de una serial
de aud io -posible desde la aparicion del registro magne tico durante la segun da
.~rra mundial- , en la que se mantiene sin carnbi os el espectro de potenc ias
pro medio pero se alteran las fases relativas, de mostr6 que hab ra alga mas que
distribuci6n espec tral en el te rna del t imbre (cualquie ra puede co mproba r el
cam bio d rarnat ico que se oye al invertir temporalmente un registro de pian o,
por ejemplo mediante el uso de software de aud io en una corn putado ra) .
169
a)
.....1
I..,I.
-0
eo
-0
'iii
Espectro original
r-- ..'l
OJ
dos y para prede cir 0 crear otros n un ca experimentados. Dur ante el siglo pa
sado se pot encio la necesi dad de aplicar las nuevas recnologias a la construe
cion y a la sirnulacion de instrumentos m usicales. La llegada de la energia
electric a prime ro, del control electr6nico desp ues y, por ulti mo, de la sintesis
digital, perm iti6 gradualmen te la construcci6n de sonidos a partir de la des
crip c ion ffsica de las sefiales asoc iadas a tales sonidos. El mayor esfuerzo tee
no logico se apoy6 en los tratados de acust ica qu e repetlan, obv iamen te, el
modelo clasico . En la mayo rla de los casos el producto de la sin tesis instru
mental se parecfa muy poco al instru men to origina l. Los son idos resulraban
apagad os, carentes de identidad y de interes.? La conclusion fue entonces evi
dente : la descri pci 6n ffsica de la cau sa del t imbre era in adecuada, pues fallaba
en el dec isivo test de la sintes is aciistica. Este fracaso pued e describirse como
un a auten t ica "catastrofe del t imbre" de la ac ust ica del siglo xx. El modelo cla
sica debta ser reemplazado par otro.
10 Numero de arm6ni co
"' j . . .
Frecuencia (Hz)
b)
co
-0
'iii
I .
-0
Nurnero de arm6nico
I
Alterna tiva 1
OJ
Conservaci6n de las
tor-nantes espe ctrates
.'. I
.' 1...
Frecuencia (Hz)
c)
234567
1
. . . . ' .
~ ~
"
-. '
'\ '
~ ..
Altirnativa
d~."""?"
Conservac ion de la
.I-. --.1.... r
estructura
Frecuencia (Hz)
Figura 3. Experimento de Slawson sobre la invar ianc ia del t imbre ante un ca mbio de
frecuencia, a) espectro or iginal, b) alterna t iva 1: frecu encias fijas 0 conservaci6n de las
formames espectrales: c ) alt ern ativ a 2: frecuencias relativas 0 conservaci6n de la
estruct ura de arm6n icos
--
La falla principal del mod elo clasico fue, sin dud a, que en su form ulaci6n sos
layaba compl etamente la importancia d e los fac tores temporales. Hel mho ltz
ya habta sospecha do que el ataque y la extincion de c ierto s son idos co n renia n
informacion relevante para la det erm inacion de l t imbre. Y resultaba eviden re
que la co rrespondenc ia en tre los datos ffsicos y los rasgos pe rcibidos no era
simple y line al co mo, por ejernp lo, en la relac i6n frecu enc ia-altura.
Para no repetir el erro r comet ida dur an te el apogeo de la teo ria clasica,
en el q ue se inten to imponer un concepto ffsico para explicar la perc epci6n ,
dur ante la dec ada de 1960 se idearon y realizaro n gran can t idad de expe rien
cias psicoaciisticas. Las motivaban la necesid ad de encontrar los datos fisicos
empleados efectivamen te en la percepci6n del timbre, comprender la estruc
tur a de las rep rescntaciones pslquicas de l t imbr e de un son ida y hallar un a co
rr espondencia en tre datos fisicos y representaci one s mentales .
Aunq ue par ece habe r un a gran ca ntidad de maneras de describir la form a
en qu e un son ido se dis ting ue de otro , la psicoacust ica necesita encon trar las
mas sencillas para simplificar el problema . Es in teresan te aqui comparar el es
tudio de l t imbr e can el del co lor. Un co lor esta determinado ffsicamente par
un espectro de luz carac reristic o. Exisren infinid ad de espectros posibles y po
dem os percibir miles de co lores, Sin embargo, tod os los colores pueden desert
birse can s610 tres dimensiones: dos de ellas define n la cro ma t icidad y la otr a
Algunos de estos instrumen tos, sin embargo, lograron irnponerse como generadores de
timbr es a rigina les y novedosos. Tal es el caso del organa Hammond.
171
\'
c l brillo . iEs pos ible desc rib ir las difer enc ias de t im bre en tr e los son idos a par
tir de un ruirn e ro peque fio de dimensiones, c om o oc urre co n e l color? Para
responder a esta preg un ta se emplea el metoda del analisis multidim ensional, me
di ante el cu al se procesan esta d fst ica rnen te los .I uicios de los o yen tes sobre e l
grado de sim ilit ud entre dos sonidos elegidos de un conjunto restringid o . La
hipot esis de trab ajo del metodo afirrna q ue ex iste un numero lirnitado de di
mension es ca paces de desc ribir la total idad de los timbres pos ibles. S i dos so
n idos tiene n un va lor ce rca no en una d imens ion , so n sim ila res e n esa
dimens ion aunq ue no 10 sea n en las o t ras. Bregman 10 ex p lica de la siguien te
rnan era: "C uan do co menza mos a pensar en las similitudes en t re cosas, inrn e
dia ta rnen te nos dam os c uen ta que un a cos a puede parece rse a o tra de man e
ras di feren tes , Una pe lo ta se parece a algun os jugue tes e n su redondez, a o tros
e n su co lo r roj o, a o tros en su ta rnafio , [...] el hecho de q ue a lgo pued a pa re
ce rse a o tras cosas de diferen te s maner as lle va n at ura lmente a la idea de la
ex iste nc ia de dimensiones de sirnilit ud'U ''
A co n t in uac io n describiremos tre s destacados estud ios de ana lisis mu lti
dimen siona l sobre el timbre.
172
bre. La h ipotesis principal esta blecia q ue los oye ntes ernplean la corr elacion
entre diferenc ias espect rales para per ci bir el timbre de los so n idos . Aunque
Plornp permite la apa rici6 n de nu evas dirnensiones perceptuales en cases par
ticulares (po r eje rnplo, la "tasa de rui do" es dec isiva para evaluar e l so n ido de
un cascabel) , sugiere qu e siernpre se reducen en ultima ins ta nc ia a no mas de
tres. Simplern ente, cada son ido pol ari za e l ca mpo perceptua l de ac ue rdo a sus
carac teri sti cas particulares.
Aunque e l mod e le de Plornp introduce e l a na lisis mul tidimensional en el
esrudio de la percep c ion del timbre, sigue fie l a l mod elo espectra l cs rarico de
la reo ria c lasica . Quiza por eso su rnejor resulrad o se h a ob ren ido con so n idos
cuyo c ue rpo es mu y es ta ble e n e l tiernpo , co mo 10 so n los qu e ge ne ran los tu
bos de o rgano. En la Figura 4 se aprecia un d iagrama bid ime nsio na l e n el que
se comparan los jui cios so bre los so n idos de los t ubos reales co n sus sirnulac io
nes esp ectrales. La d im en sion vert ica l desc ribe la ca nt ida d de arrn on icos supe
riore s (d e men or a ma yo r ca n tida d), rnie n t ras qu e la horizon tal es produ ct o de
una com binacion co rnpleja de pr opi ed ad es espec t ra les .
Una de las criticas mas irnport antcs que se le h an h echo a este tip o de ana
lisis es q ue de pende fue rte me nte de l co nj unto de sonidos eleg idos. En cie rta me
d ida , para cada co nj unto de datos se obt ienen resultados d iferentes, A dern as, las
o
o---b.
Trompela
L;,
Organa
Sintetizadar
Regal
~ F" "
'
Diapas6n 4'
LengOe1as
J?
f:/alJla s
Q~JD iapaS6 n
8' .
Diapason ~
G ed aC~
Octava 2'
Waldftule
------
Rohrtlute
Figura 4. Repr esen tacion bidimen siona l de l timbre de sonidos de organa (cfrculos) versus
son idos de orga na sin retizados (triangu los) (R asch y Plomp, 1999 )
173
diteren cias en el timbre "esta tico" de Plomp no son sufic ien tes para definir un
objeto audi tivo, en part e porque la serial acust ica puede ser alterada espect ral
mente par las reflexiones en una sala. En la epoca de los trabajos citados se sa
bia que el reconocimien to de los instr umentos musicales, pa r ejernplo, depende
ca n fuerza del at aque y de la estructura temporal de la en voiven te d inarnica del
son ido.!' S in embargo, Plomp no incorp or6 factores ternporales en su modelo.
Especlro
angoslo
1
~
u
Q)
0.
if)
Q)
-0
'(3
Modelo de GTe )!_ Entre 197 5 y 1979 John Grey realiz6 una serie de experien
cias tendientes a construir un espacio ti mb rico vecto rial , sim ilar al que se em
plea para describir los co lo res. En la primera de elias ernpleo di ec iseis son idos
de la misma altura, intensidad y duraci6n , pro ven ientes de 12 instr umentos
t6nicos (es decir, de al tu ra to nal defini da ). Digitalize las seriales, las simplifi
c6 reempl azando las m icrovariaciones temporales pa r secciones rectilineas, y
se las presen t6 de a pares a ve in te oyen tes. Los suj etos deb ian cuantificar la si
militud en tre los son idos de cada pa r medi ante el usa de un a esca la grad uada
de uno a trein ta. Grey interpret o qu e las dista ncias psicol6gicas se pod ian co
rrelacionar negativamente ca n las sim ilitudes per ci bidas. En otras palabras, a
menor similitud, mayor dista nc ia timbr ica. Los result ados de est a experienc ia
fueron graficados en el espacio vec torial tridimension al de la figura 5. Cada
dimen sion , aunque obten ida par ana lisis multidimen sional , representa los
atribu tos ffsicos que Grey consider6 mejor apa reados con las respuest as per
ceptuales obten idas (Grey, J., 1975) .
La d imensi6n vertica l (Y) repr esen ta la distribuci6n de la en ergia en los
parciales arm6 n icos de la serial. Se trata princ ipalmente de una dimensi6n es
pectral. Se puede pensar en ella co mo repr esentando el grado de "brillo" del so
nid o, y en los analisis trad icio nales queda defin ida par la envolvente espectra l.
La dim ensi 6n horizontal (X) repres enta en parte el grado de fluctuacion de la
env olvent e espectral dur ante el desarrollo del son ida y en parte el grado de sin
cron ismo en el ataq ue de los diferentes arrnon icos, Es una dimensi6n espectro
temporal, den ominada "flujo espectral" por Krumhan sl (McAda ms y Bigand ,
1994 ). Permite distinguir entre sonidos de evolu ci6n esta t ica y sonidos de ev a
luci6n dina rnica. La tercera dimensi6n (Z) repres enta la presencia de vibracio
nes inarm 6nicas prev ias a la parte arm6n ica pr incipal del son ido. Se pued e
hablar de una "calidad de ataque" y es esenc ialmen te una dimensi6n temporal.
En una pub licaci6n de 1977 , Grey ilustr6 dos de las proyecc iones bidi
mensionales de su espac io tridimens ional con los d iagramas tiemp o-energia
frecu en cia (TEF) de las sefiales de los instrumen tos (figura 6).
clasico en esa epoca consistfa en invert ir cernporalmerue un regisrro de audio:
la en volvente espectr al promedio no cam bia, pero el tim bre sf 10 hace.
11 EI ejemplo
174
:J
'C
.~
Especlro
ancho
_ .
( -(
/ u 7L
fr.7/
~
Jncrcnlco
'. ~'
:z:tt
1r. ?1-
I.:::=J L:..':l
'-=-'
<l'.
\\
Q)
&
r>:
----X
Tran sitorios
de alta Irecuencia
.c
Asincr6nico
Sin transttorio s
de alta frecuencia
~ ~Q" ~
'"
0
0 '
\ '\
Q.l
~,~ tt l L
@
~@
t" '@~ ~,, ' ~.c~~
.
~
~
~~
"
-.
' 0
01
Sincro nicos
Parciales
Dimension 2 Asincroni ccs
~1
~
iii
~:J
'~
Figura 6. Ejempl o de una pro yeccion bidime nsion al del espacio de tim bres
(los instrurnenr os son los rnisrnos de la figura 5) (Gre y,[ ., 1977)
175
"\
Grey,
176
(1977). Trad. de
GG.
i~
O ,~taqu es
Frecuencia
~o
JIM '0' o
't:
rf
&
~
~
Perfil espectral
mas angosto
r:
L21
Frecuencia
Envolvente de amplitud
to]
Tiempo
+ Subito
~'E E:]
1'1
2
4:
.,
Tiempo
Tiempo de ataque
I~
Tiernpo
+ Lento
177
ta y baja frecuenc ia, y se parece al "bri llo" presente en casi todos los estudios
sobre t imbre. La segunda di mension en import anci a -"compacto- d isperso"
perrnire separar los son idos to nicos del ruid o. En esta experie ncia , como en to
das las de su clase, el resultado es muy sensibl e a la selecci on inicial de son idos.
Pa r ejemplo, la dimension "cornpacto-disperso" no hubiera apa recido si no se
inclu ian pulsos de ruido entre los esti mulos de partida.
O rra posibilidad de ace rca miento verba l al timbre la dan las "ex perie nc ias
de campo", en las que simplerne n te se recopil an y clasifican los terrninos que
las perso nas -rnusicos 0 no musicos, segun el caso-, usan para describir los so
nidos. Aquf la dificult ad est a dada por la mu lti plicidad de un iverses lin guist i
cos exis te ntes, aun de ntro de un a misma comun idad. Los mejores trabajos son
los que restringe n las muestras a un uni verso mu y aco tado . Dos buen os ejern
plos son los tra bajos de Kend all y Ca rtarette , en los que analizan los terrninos
que apa recen en el tra bajo de Von Bismark citado y en el trat ado de orqu es
tacion de Wal ter Piston (Kenda ll y Cartarette, 1993). EI fin prac tice mas sig
nificari vo de esra clase de estudios es obtene r un diccionario de terrninos que,
al alimentar uri siste ma basado en una red ne ural, perrn ita que los rru i sicos
controlen de man era verbal ciert os programas de sinresis pa r co rnputado ra.
Mod elos de analisis por sfntesis
Modelos verbales
Desde un a perspect iva d istinta, Von Bismark int ent o reducir el mime ro de va
riables necesarias para de term inar el timbre a parti r de la verb alizacion de las
percepciones (Bisma rk, G., 1974 ). Q ue es, de heche, 10 que hacemos habitu al
mente cuando tratamos de descri bir un son ido en un a co nve rsaci6 n. Se lecc io
no 35 son idos diferentes y le pidio a los oventes que los califiqu en, con un valor
de 1 a 7, con relaci on a 30 cualidades 0 dimensione s d iferentes, Cada dimen
sion se defin io a partir de una parej a de adjet ivos contrarios com o "duro-blan
do", "seco-vivo", "opaco-brillante" y asf hasta llegar a las 30 inclu idas en el
estud io. Los son idos prove n lan de genera do res de sefiales periodicas co mplejas,
co n un ruirnero variable de armo n icos, y de pulsos de ruid o rosa. Se hac ian pa
sar a traves de filtros que los modifi caban de acuerdo co n determinadas envoi
ventes espec trales, entre las que figuraban las correspondientes a las voca les en
idiom a aleman. Aplicando el met odo de selecc i6n de co mpone ntes princ ipa
les, el auto r reduj o las 30 dime nsiones verba les origina les a cuat ro d imensiones
perceptuales. Las dos d imensiones mas destacadas represen taban los pares
"punzante-apagado" y "compacto-disperso". La d imension mas importante
-definida por el par "punzante-apagado"- se relacion o co n el ce ntro de grave
dad del espectro de la sefial, que depen de de la relacion ent re la ene rgfa de ai
178
179
0'"
~t"
~:'I>
60
C0Q.
' 'o~
,/>",
~~
<V'"
CD
U
t1l
;Q
~ 30
100
50
150
Tiernpo (ms )
Figura 9. Resulrado del ana lisis sinc ron ico de altu ra del son ido de un a tro rnpera (Basso,
G .,200 1a)
iii'
~
na r los efectos aciist icos propi os de un a sala normal. El ana lisis sincron ico pre
supon e qu e la serial es cuasi-pe riodica y de scribe el desa rro llo de cada arrno n i
co individual en el t iernp o. El resultad o de un ana lisis de esta cl ase se mue st ra
en la figura 9.
A partir de este an alisis del sonido or igina l, los autores sirnularo n la serial
simplifica n dola de dos rnane ras: elirnina ron las fluctuacion es de alta frecuen
c ia y aprox imaro n las curvas po r trarnos lin eales. La sena l sin tet izada que do
co mo la que se ve en la Figura 10.
Las dos sefiales resu ltaron ind ist ingu ibles cu ando se las co rnparo a ud it iva
mente. Las simplificacion cs, por 10 ta nto , n o afect aron los datos relevan tes
presentes en el sonido origina l.
Au nq ue el mode lo er a simp le, para la epoca resul taba m uy costoso a n i
vel co mputaciona l (e n el estud io or igina l se simu laron las evo luc ion es tern
por a les de los primeros 13 arrnorucos) . A partir de suce sivas simplificac iones,
Risset y Mathews encon tra ron que: 1) la variac ion tem poral del esp ectro es
crft ica pa ra deterrnin ar el timb re; 2) las variacio nes de alta frec uencia y pe
q uefia arnpli tud n o se perciben; 3 ) la dinarnica del crec im ient o de cad a ar
mo n ico defin e gra n pa rte del tim bre de los bronces; 4 ) existe un a forrn ante
ubicada entre 1.000 y 1.500 H z de gra n imp ortan ci a pa ra la d iscrirninacion
180
U
t1l
U
.~ 30
Q)
.~
.... .
.3.. .
100
50
150
Tiemp o (ms)
tfmbr ica; 5) la prop orcion de ar rnonicos supe riores aumen ta signi ficat iva
mente con la inte nsi dad . Empleando estos nu evos co noc im ien tos lograron
cre~un model e co mp utac ion alrnen re mas econo rnico que supero ex itosa
men e la prueb a de discr irninacion aud itiv a
. l.ejernplo ante rio r, aunque limitad o a un os pocos sonidos de rrornp eta,
ilustra las caracte rist icas y ve ntajas de l an alisis por sin tesis. Par a em pezar, per
mi te eva luar cada pararnetr o del so nido de ma ne ra ind ividua l, uno por vez,
evitando la co mp lejfsima tarea de lid iar co n espaci os multidimensionales en
los que no se sabe bien qu e cosa produ ce cada efecro per ceptual. N o menos
181
irnportante, saca prov echo inmedi ato del avance tecnol ogico en los ca mpos
de la aciistica y de la informati ca, a la ve z q ue im pul sa nu evas in vestigacio
nes y desarro llos . Los mod elos de ana lisis po r sin tesis h an demost rado ser efi
caces para gene ra r co noc irnien ro cient ffico y te cnico , reducir la can tida d de
in formacion necesar ia para exp resa r una serial acu stica, pro du cir varian tes y
modi ficaci ones nunca ex pe rirnen tadas y co ntro lar la pro sodi a m usical en
tiempo real.
U na descr ipc ion deta llada de las tecnicas empleadas conr en dria la h isto
ria de la elec troac ust ica duran te los ult irnos 60 afios. S610 para enu rnerarlas,
podem os c ita r la sin tesis aditiva, la sln tesis sustrac t iva, la sin tesis alinea l 0 glo
ba l -a este grupo per tenece la sin tes is por FM de Chowni ng- , el mo de lado ff
sico y, ac tua lme n te en desar rollo , la sfn tes is basada en prin cipios percep tu ales.
Estudios sob re el timbre en la VOz h urna na
Parece que poseem os cap acidades audi t ivas especiales para co mp re nde r la voz
h urnan a, q ue no empleam os para oir el resto de los sonidos, Es algo similar a
10 q ue oc urre en la decodi ficacio n visual de los rostros. Se sabe que pa ra el re
conoc imien to del rostro de un a persona se usan rec ursos diferentes de los q ue
se usan para percibir el resto del camp o visual (ex isten personas que n o pue
den distinguir los objetos, pero que leen perfec tarnen te los rostros, y viceve r
sa ). Q uiza esta s capac idades tengan que ver con la irnpor tan cia socia l de la
in formacion y co n 10 parecidos que son los rostros - y las vo ces- entre sf; es
prob ab le que se n ecesite cierta ca pac idad pot enciada y espe cifica para distin
guir en tre un a voz y otra. Por otra parte, existe fuerte evide n cia de que la pa
labr a y la musica se procesan en lugares d iferentes de la corteza cerebral.
Anteriorme nt e se crefa que cada un o de los h emisferios cerebr ales estaba es
pec ializado en un o de estos do rnin ios, pero en la actualidad se sabe que tanto
la producc i6n como la perce pci on de miisica y pa labra involucran varios sub
procesos , cada un o de ellos lat era lizado de mod o diferen te. Por eje rnplo , se
descubri6 que las ta reas de discr imin aci6n y de identificacion (q ue implican
un acceso al lexico verbal ) son independ ientes y estan loc alizadas en dife ren
res lugares de la co rteza .
El pro blema de la iden t ificac ion t fmb rica de las voces es mucho mas di
freil que en el caso de los dernas son idos, N o s610 porqu e pode mos ident ificar
m iles de voces di fer entes (contra un gru po reducido de et iquet as ti rnbri cas
gene rales ), sino por el peq uefio ran go de variaci6n de los rasgos n o t lmbr icos
en la voz. Sa bemos que las frec uenc ias fundamenta les t fpicas en h ombres,
mujeres y ni fios estan comprend ida s en tre 80-240, 140-450 y 170-600 H z,
respectivam ente. Y que el ran go de variac ion en frecuencia para un habl ante
182
14 Esta
183
4. Para tra nsporter un co lor respecto a una dime nsion, se debe agregar un
va lor constante en esa dimension.
5. Para invertir un color respecto a una d imen sion, se debe inverti r el sig
no del valor en esa dime nsion. IS
Estas reglas definen claramente un espac io vec torial, simil ar al espac io
de los colores visuales propu esto por Schrodinger. A 10 controversial de la
con jetura, Sla wson le sumo ciertas afirrna ciones que se pueden calific ar, por
10 menos, de arriesgadas: "el color del soni do aparece com o un elemento mu
sical viable que puede ser sometido a un control estructu ral precise , en todo
an alogo al que se le aplica a la altura tonal". Aquf aparece por primera vez el
debate sobre la capacidad del timbre para sustentar tr ansform aci ones estruc
t urales 0 , dicho de otro modo, sobr e la capac idad morfof6rica del timbre (m as
adelante desarrollarernos este pun to) . A l margen de la audacia de las afirrna
ciones de Sla wson, en sus conjeturas se perciben claros resabi os de l modelo
clasico del timbre .
En sinton fa con Slawson, Yee On Lo acepta que la envo lvente especrra l
dete rmina en gran medida el timbre de los sonidos, pero se diferencia al asig
narle tam bien gran irnportancia a la evo lucion temporal del espectro. A firma
que percibimos los cambios espectrales a traves de "cuadros" defin idos com o
la minima porc ion repet itiva de la onda. Estos cuadros acnia n como las tr an
siciones entre fonemas en la voz hablada . Asf como los cuadros proporcionan
la microes tru ct ura temporal -del orde n de los milisegundos- , la rnacroe struc
rura -del orden de los segundos- esta tarnbien const ruida a partir de la co nca
tenacion de cuadros, Como ap unta Lo: "El tim bre es la evo lucion de los
cuadros"." Existe n c iertos cuadros crft icos q ue define n los cambi os importan
tes a 10 largo del tiempo. En el modelo de Lo, la percepc ion de l t imbre se fun
da en tres parametres: la d isposicion de los cuadros crit icos, la envolvente de
arnplit ud y la trayectoria de la altu ra tonal. En la Figura 11 se aprecian los dia
gramas de Lo para dos sonidos diferenres.
El model o de Yee On Lo se puede ver com o una version cuan rificada a d i
ferentes niveles de la concepcion que asoc ia el timbre con la evoluc ion tem
poral del espectro de la serial.
Even tos acus ticos dif erentes a la voz y a los son idos mu sicales
Aunque la mayo rfa de los estudios sobre el timbr e tratan sob re los son idos de
la voz hab lada 0 de la rnusica, algunos investigadores centraron su ate ncion
15 Slawson
16
184
~d
~c
c
b
Tiempo
sobre sonidos complejos prop ios de la vida cot idian a. Co me n taremos breve
mente cuatro de ellos.
1. D. ]. Freed estud io los soni dos producidos po r diferentes baquetas al
golpear cuatr o cacerolas de distinto tama fio (Freed, D. ] ., 1990) . A islo cuatro
para metros de "prevision de timbre": la energia global, la distribuci6n espectral,
la velocidad de evoluci6nespectral y la rapidez de alteraci6n del evento. Las eva lua
ciones de los sujetos sobre el tipo (dureza) de la baquera emp leada se mantu
viero n to ta lmente independ ient es del tip o de cacero la golpeada, a pesa r de
que los estfmulos contenian informacion tanto sobre el excitador como sobre
el resonador. Los pa rametres de pre vision de timbre de Freed se corre laciona
ron bien con las eva luacio nes de la du reza de la baqueta. Actualmente se co n
tinua investigando co n el fin de individualizar los Indice s invariantes que
pe rmiten a los oyentes ca racte rizar y reconocer a l excitador y al reson ador de
forma sepa rada .
2. B. H. Repp estudio los son idos que producen las mane s al aplaud ir, En
ce ntro que los oye n tes co inc idfan al juzgar el sexo de l "ap laudidor", aunq ue
los juicios no siemp re co rrespo nd fan al sexo rea l de la Fuente (Repp, B. H.,
1987). Seg un el a uto r este estud io refleja la influencia de los estereot ipos cul
tu rales auditivos.
3. Wa rren y Verbrugge ana lizaron las respuestas aud it ivas frente a ob jetos
de vidrio que rebotaban 0 se rornpia n (Wa rren y Verbru gge, 1984). A na lizo la
correspondencia entre patrones ritrnicos, la intensidad y las envolventes es
pectrales y los juicios aud it ivos asociad os.
4. N. ]. Vanderveer estudio la identificac ion libre y la clasificacion de
\ eventos acusticos complejos como el tintine o de llaves, el crep ita r del papel ,
~c . (Vanderveer, N . ]., 1979). Segu n S. Handel , serfa natural indicar los so
nidos a partir del evento mecan ico que los engendra, sin duda a partir de in
variantes transformacionales (Han del , S., 1989 ). Los grupos esta rian
parcialmente determinados a partir de las pro piedades acusticas de los mate
riales utilizados (es decir, las invariantes estr ucturales) .
185
A los estudios an te rio res les cabe, poten ciada, la crit ica que se le h ace a
casi todos los estudios sobre el timbre: dependen fuertemente del conjunto de
son idos escogidos.
Resumen y conclusiones
Los resultados de los estudios mencionados, y de otros similares, son muchas ve
ces contrad ict or ies. En general, todos acepta n que la percepci6n del timbr e de
pende de la forma de onda en su conjunto, pe ra discrepan sobre cual es de sus
caracteristicas debe n considerarse relev antes. A modo de resumen, podemos es
tablecer una serie de elementos, aceptados por la rnavorfa de los investigadore s,
que intervienen en la discriminaci6n de los timbres instrumen tales aislad os.
La informaci6n pre sente en el ataque de la sefial.
La informaci6n rel ati va a la evoluci6n de la envoivente espectral, pri n
c ipalme n te en el cuerpo d e la serial.
La presenci a de pequerias variac ione s alea to rias de frecuencia en los
componentes discret os de la serial.
Otras ca rac terfsticas se discriminan co n mayor d ificultad:
El grado de coherencia de la variaci6n en frec uen cia de los co mpo n en
tes discretos.
El grado de simplificacion en las variaci on es de amplitud y frecuencia
(valido sobr e tod o para los modelos de analisis po r sin tesis).
Esta en ume rac i6n es valid a sola mente co mo refer en cia ya que deben agregar
se numerosas sing ularidades y excepciones. En la lista qu e sigue men cionam os
algunas de ellas.
Las var iables sign ifica tivas par a la percepci6n del timbre musical exis
ten en, al menos, dos ni veles tempor ales d iferen tes: un nivel se asien ta en los
cambios que oc urren en algunos milis egundos y el otro registra las variaciones
mas lentas, del orde n del segundo.
C uando el estud io permite que part ic ipen las caracterfsticas de ataque
de los sonidos, estas dominan por sobre los otros factores presentes en la sefial
acu stica. So larnen te el bril lo, determinado por la distribucion espectral, pe r
manece presente co mo un factor tirnbrico de importan cia . Un erro r sist em a
tico co me t ido por mu chos in vesti gad ores qu e pretenden eliminar el ataq ue de
la serial aparece al seccionarlo abruptam ente : lejos de eliminar el ataque, se 10
reemplaza por otro de banda ancha.!? Algo similar ocurre en los experimen
tos de resta urac ion fon ernica, en los q ue ciertas silabas de una Frase son sup ri
17 Este
186
efecro es consecuencia del principi o de indeterm inacion aciistico (Basso, G., 2001a).
187
188
lTimb~es metarnericos?
El sen tido de la audicion es clar amente analitico con rel acion a las alturas to
n ales, relacion ad as co n la frecuenc ia fundamental de la serial acustica, Es de
cir, en prese n cia de un a mezc!a espectral distin guimos ca da un o de los
co mp one ntes de la mezcla. Por eje mp lo, cuando co mbi na mos un Do y un M i
ofmos tanto la ter cer a mayor (la co rnbinacion) co mo cada un a de las notas in
d iv idu ales. En co nt ras te, el sentido de la vista no es analftico co n relaci6n a
los co lores, rela cionados co n la longitud de las on das lumfnicas: al mezc lar
azu l y ama rillo vemos el co lor ver de (Ia cornbin ac ion), pero ya no percibimos
e l azul y el amarillo que 10 forman . Esta caracterfstica de la vision perm ite
crea r co lares metarnericos, causado s por espectr os diferentes pero indistingui
b les a la v ista. lEx isten los timbres metarnericos 0, 10 que es equivalente, dos
sefia les ffsicas difer en tes que se o igan exacta rnen te igual? De ac uerdo con los
estud ios realizados h asta aho ra, la respuest a es no (a l menos en un sen tido es
tr ict o, pues se pued en h allar dos seriales d iferen tes que curnp lan un a misma
func ion t fmbri ca -par eje mp lo en un a fusio n de objetos aud itiv os- aunq ue se
los pu ed a discriminar).
Por otro lado lex iste un "unisono tfmbrico", mas alla del caso tri vial de
dos son idos de igual in ten sidad y altura tonal? Es decir, dos sonidos de diferen
re alt ura tonal e identi co timbre (l n o serfa este el ideal de un constru cto r de
pianos?) . A lgunos auto res cree n qu e sf, a unq ue sus argume ntos n o son plena
mente co nv incentes (Va n N oord en, L., 197 5; Erickson, R., 197 5). O tra ca rac
te rfst ica de la audicion, rel acion ada co n 10 ante rio r, es la inexistencia de
algun a cosa parecida a una "octava t fmbrica": no es posi ble obte ne r un cic lo
de t imb res a partir de l cual co nst ruir una "esca la timbr ica", a semej anza de la
esca la de alturas tonales. Por supuesto , 10 anteri or n o es mas que otra form a de
dec ir que el timbre es un rasgo multidimensional.
\
189
Kubovy y Roger She pa rd, cons ideraron el t imb re como un medio no rnorfo
forico. Es eviden te que a partir del timbre no se pued e codificar la misma cla
se de inform acion est ructural q ue se obt iene operando con la altura tona l.
Sin embargo, descar tar tod a ca pacidad de o rgan izacion est ruc tural cimenta
da en la modul acion tfmbrica no parece razon able. La codificac ion fon et ica
de l habla se asien ta prin cipalmente en las va riac iones del ti mbre en func ion
del ticmp o, y la arrnonia musical puede ser cons iderada como un a pa rticular
cod ificac ion de l timbre de los son idos {cada funci on tonal posee un ','co lor"
particu lar ).'?
Capitulo VII
4. COMENTARIO FINAL
Lo visto en este capftulo vale solamente para ca racter izar el t imbre de un iin i
co objeto audit ive . Tod avfa no con side ramos las caract er fsticas que de be po
seer un a serial acust ica para que percibamo s un o 0 un a mult iplicidad de
obje tos ac ust icos, terna que sera desarro llado en el cap itul o VIII.
La conclusion logica de este capftu lo esta ria dada por el ana lisis de los
usos musicales de l timbre, quiza o rdenados de acuerdo con su progresion h is
torica. Pero tal empresa ocupa ria, por 10 men os, un libro similar a este. As f que
10 dejamos para mas adelan te.
Plano
frontal
-,
Plano
horizontal
19 En la rmisica conre rnporan ea la d istinci6n entre armon ia y tim bre resulta muchas veces
desd ibuiada, co mo puede co mprobarse en piezas co mo Avenrures de Ligeti l' Modulations de
G risey,
190
191
30 ,-,.......,---,.---.,..--,---,-...,-.,.-.,-,.......,---,.---.,..--,---,---,----,---,
5000
'"
'(;
c
3000
:J
2500
(1)
1800
192
ai
co
~
Qj
<:
LL
1000
C uando la fuent e aciistica se ubica fuera del plan o medio del oyente, la in ten
sidad de las seriales que llegan a cada uno de sus oidos es ligerarnente diferen
teoEn la mayorfa de los casos, esta diferen cia de int ensidad no es provoeada por
la desigualdad de reeorr ido entre la fuent e y cada ofdo, sino por la sombra acus
tica que causa la cabeza al interpon erse en tre la fuent e y el oido mas alejado.
En la figura 2 se puede ver la difere ncia interaural de intensidad (110) en
funcion del azimut 8. La frecuencia de la sefial sin usoidal generada por la
fuen te se ernplea com o pararnetro de la familia de curvas.
Una cabeza hu man a promedio se pued e aproximar a una esfera de alrede
dor de 20 ern de diarnetro, A causa del fen6me no de difraccion la cabeza no
va a provoca r una sombra aciistica n ftida por debajo de 1.700 Hz, y va a resul
tar acusticamente transparente por debajo de 500 Hz. Co mo pued e verse con
clar idad en la figura 2, la 110 es Infima a frecuencias por debajo de los 500 Hz,
pero puede llegar h asta 20 dB a frecuen cias elevadas, En otros terrni nos, la di
fracc ion de las ond as en la cabeza lirnita la eficacia del mecanismo de detec
cion de diferencias int eraur ales de intensidad a la parte superior del espectro
audible.
En cuanto al min imo camb io detectab le en la lID, se h a compro bado que
llega a 1 dB para seriales frontales siempre que la frecueneia de la serial supe
re los 1.000 Hz.
U n buen ejernplo relacion ado con la 110 10 provee la reproduccion este
reofon ica bicanal, en la que casi toda la informaci6n espac ial esta codificada
unica mente en terrninos de diferencias de int ensidad (esto no es asi, debemos
aclarar, en los registros de audio bien cuid ados en los que se conternpla tam
bien la informacion de fase) .
500
200
c c ;
" C"
o ~---+----;-____==::;::=;.....;~,..;.....;.;;;-.;-;...-..;---+----;-----,-----"
10
"0
'"
4000
(1)
~
-
i..
c;;.;'-'-"-.i.:.;.;.....;-~.;.....;~ c
"C"
20
10
0
10
.. - .. _
0
10 c c 0
10
..
"C"
C " ~"
._... .
~
~.
,:
~ ~-
..
0 ~c:::.._;___+___;__----:----___;____;_-:-_:___;----;____;____;__----:----___;_---:----::'!'_1
....
::
~
0 1""': -;--;----;-----;----;----;----;--+- -+- ---;----;----;----;-- ;--,---"'" 1
- ~ . -~ . . ~ .. ~ . . ~ .. ~ . ~. .;. -.;---.;.. .
: ;-,.....;
~ ,
'C
..
0"
30"
60'
90"
120"
150'
180'
el tiempo que le lleva a la onda alcanz ar cada uno de los otdos. La ITO varfa
entre a y 690 ms para sefiales euyos angulos de azimut eo rrespo nden a 0 0 y
90, respect ivament e. Como una onda ac ustica que se propaga en el aire tar
da 30 us en recorrer 1 em , para ir de un ofdo al otro necesita aproximada
mente 700 us.
Si las sefiales son estr ictamen te sinu soidales, una diferencia de tiempo
equiva le a una diferencia de fase. A bajas frecuenc ias la infor macion co nte
n ida en la diferencia de fase es sign ificativa, pero a altas frecuencias la longi
tud de onda es men or que la dista ncia entre otdos y la diferen cia de fase
provee datos ambiguos. A una longitud de onda de Z3 em, similar a la distan
c ia pro medio en tre ofdos, le corresponde una frecue ncia de 1.500 Hz. Si la
serial posee 10 kH z en tr an varios ciclos completos en esa distan cia y la fase
deja de aportar inform acion espacial un ivoca. En la figura 3 se puede n apre
ciar estas dos situ acion es.
\ Los movimientos de la cabeza reducen en parte la arnbiguedad de fase, pe
ro\esta resulta muy grande para frecuencias por enc ima de los 1.500 Hz y el
rnecanis
mo de ITO pierde toda efectividad.
-,
En la figura 4 se ap recia la diferen cia de recorr ido en funei6n de l angulo
de ent rada de las seriales que llegan a los oidos ,
Si denominamos r al radio de la cabe za, la diferenc ia de recorr ido des :
d = r e + r sen e
193
u;
.s
/".,
0,6
/V
E
0,5
<D
""~
0,4
(5
0,0
1/
'u
~ 0,1
/
~
a)
1\
1\
~
~1W1~1~1~1~
~<p=2100
Baja frecuencia
~ 0,3
Qj
02
'
:sro
"'\
14
rt
, i
u;
b)
~<p = 180
2?
10
'6
OJ
ro
.2
OJ
~<p
.\>'
OJ
c;
= 180 0
ro
<D
u
.9
Alta frecuencia
.n
E
o
E
'c
~
75'
_1:<"
f>
6
4
rl
0
60'
4
n
"
,,, ,,,
,,, ,,,
,, ,,
,,, ,,,
,, ,,
,, ,,
0" ,
...
~ 12
30'
//
...
0------0---0--0
....
0'
500
,
,0
...'
--- -----
1000
2000
5000
10000
Frecuencia (Hz)
"~ .....'
rse~"
Figura 4. Calculo de la diferencia de recorrido entre las sefiales que llegan a ambos oidos
194
\
Como la d iferencia interaural de tiempo depende de la diferencia de recorri
do de las ondas entre ambos oidos, la linea que va de un tfrnpano al otro de
fine un eje de simetria axial alrededor del cual se encuentran lugares
195
Batidos binaurales
Arriba
geo rnetricos co n el m ismo ITO. Ap arecen asf los de norninados cones de confu
sion a cada lado de la cabeza tal como se aprec ia en la figura 7.
Las arnbiguedades relacionadas con este co no de confusion, al igual q ue las
vinc uladas co n el plano med io, puede n ser resueltas moviendo la cabeza. S i la ro
tarnos 20 a la izquierda y la imagen aud itiva se desplaza 20 en su posicion late
ral aparen te, en tonc es uno tiende a supo ne r que la fue n te se sinia en el plan o
horizont al. S i, en carnbio, el movimi en to de la cabeza no es aco rnpariado por un
cambio en la imagen percept ual, la fuen te de son ido se localiza directamente arr i
ba 0 abajo del oyente . La vision y el sentido del equilibrio juegan un pape l im
port ante en este proceso, pues ayudan a definir la posicion de la cabeza en el
espacio. A n iveles elevados de procesa rnien to neural la represen tacion espac ial
involucra la integracion de la inform acion proveni ente de d iferent es sent idos,
Co mo resumen - y solarnen te pa ra sefiales sin uso idales-, es posible soste
ner que los dato s ffsicos apo rt ados po r la !DO son uti les a alms frecuencias,
mien tras que los proveni en tes de la ITO 10 son para bajas frecu encias. Este re
leva en los mecan ismos de pe rcepc ion espacia l rue denominado en 1907 teo
na doble por Lord Rayleigh , pero no se verifica de rnan era aca bada para sefiales
de espectro co mp lejo .
Los umbr ales de ca mbio en la percep cio n de las d iferenc ias de t iempo son
rnen ores cuand o la ITO es ce ra , co n la fuen te ubicad a en el plan o med ic . El
umbral de variacio n para la [DO ta mbien es menor cuando la !DO es cera . En
defin it iva, la resolucion espacial es mejor para sonidos qu e llegan de [rente 0
de sde algun lugar en el plano medi o, con 0 de azimu t.
En algunos casos la loca lizacio n rnono aural es tan buen a co mo la binau
ral, heche qu e sugiere el uso de algun mecanismo ad iciona l no co n te mplado
en la [DO n i en la [TO, ta l co mo ve remos mas ade lan te .
196
Una notab le caracterfst ica de nu estra aud icion, en la q ue se com prue ba la sub
sistencia de la informaci6n de fase mas alla de l sistema aud it ivo per iferico, se
revela con la aparicion de batid os binaura les. Estos se manifiestan al presen
tar dos sefiales sin usoidales de frecuencias apenas difere n tes (M < 20 Hz), un a
en cada ofdo , La ex istenc ia de los batidos binaurales dep ende de la in terac
cion de la informac ion de las sefiales qu e part en de ambos o fdos a n iveles su
peri ores de procesarni ento neu ral. Pro veen una dernostracion irrefutable de
que la descarga de las neuronas preserva la informac ion de fase del estirn ulo.
Los batidos binaurales son menos ni t idos que los bat idos monoa urales,
con las dos sin uso ides de l estirnulo presen tes en un solo ofdo. Se los per cibe
solo por deb ajo de los 1,000 Hz, a diferen cia de los mon oaurales que se oven
en tod o el rango de frec uenc ias audibles. Adernas, estos iilt imos se perciben
mej or cuando las in tensidades de las dos sin usoides son sim ilares. Los bar idos
binaurales, por el co n trario, se oyen aun co n grandes d iferenc ias de inten sidad
entre los estimulos (Ia sensi bilidad a la fase ex iste den tro de un gran ran go de
inten sidades), y un auto r bas ta sostuvo qu e un a de las sefiales puede qu edar
par d ebajo del umbral de audibi lida d. Estudi os recien tes no han corroborado
esra afirrnacio n .
197
198
Amplitud 10dB
0
1----.
18
36
72
126
144
162
l/\\
/!
/ V\\ 1/\\1/
I---- ..----'
f--..- ~
/\"--- VA
h\ 1
/
---
180
0.2
0.5
0
18
36
>
90
:r: 106
.:~\
j ~'\
00'
<D
./'
./
54
'8
>
\\ j
54
72
r: 90
'I' 106
r-; 126
144
1/
\l/
10 15
162
180
Frecuencia (kHz)
Figura 8. Funciones de tran sferen ci a desde el campo extemo h ast a la entrada del canal
aud itivo ex tem o (HRTF) con el angulo h orizontal e como paramerro
dad es de fase ti pic as de las sinu so ides. S i el espectro cu bre un gran range de
frecuencias, las arnb iguedades de fase pu eden ser superadas a traves de cornp a
raciones ent re los ca na les del filtro aud itivo involu cr ados. D. W. Grantham
consider6 que la diferencia in teraural de tiempo debe definirse a partir de se
fiales de espectro de banda y pro puso llamarla verdadera ITO (G ran th am, G.,
1995 ).
A continuaci6n men cion arnos algunos experimentos en los que se desta
ca la aplicacion de datos espe ctrales en la localizaci6n bin aural.
Klump y Ead y rnidi eron los um brales para la discriminaci6n de la ITO para tres
t ipos de estfrnulos co rtos. Fueron ne cesarios 9 us para detec ta r lin ca mb io en
el ITO an te un estfrnul o de ruido de banda an gosta de 1,4 s de duraci6n; 11 us
199
Correspondencia tiempo-intensidad
Si se presentan dics identicos por medio de auriculares, la imagen se percibe
"en el centro" de la cabeza, Si a continuaci6n se retarda el clic del ofdo dere
cho, por ejemplo 100 1-lS, la imagen se desplaza hacia la izquierda. Pero si la in
tensidad de la serial en el ofdo derecho aumenta, es posible colocar la imagen
nuevamente en el centro de la cabeza. La cantidad de tiempo necesario para
compensar 1 dB de diferencia interaural se denomina razOO de correspondencia.
Este fen6meno apoya la teorfa que establece que las diferencias en tiempo y en
intensidad son codificadas en el sistema nervioso de manera similar, y es de gran
importancia para la implementaci6n de sistemas virtuales de espacializaci6n.
Adaptaci6nbinaural
tren de pulsos. Los dics luego del primero aportan poca informaci6n para la
localizaci6n. E. R. Hatter present6 evidencia de que un disparo adecuado -un
pulso de ruido de baja intensidad 0 un hueco (gap) en el tren de clics- puede
desactivar la adaptacion binaural. En su experimento los clics que aparecen
luego de la perturbaci6n son mas efectivos que los anteriores -adaptados- pa
ra localizar espacialmente la fuente. Hafter y Buell dicen: "[...] El sistema au
ditivo se vuelve insensible a los datos interaurales luego del ataque, a la vez
que monitorea el entomo a la espera de nuevas condiciones. Cuando algo
inesperado ocurre, el entomo espacial es nuevamente examinado" (Hafter y
Buell, 1990).
Interferencia binaural
Los ruidos de baja frecuencia degradan fuertemente la lateralizaci6n de las se
fiales de alta frecuencia, mientras que la recfproca no es cierta. Una interpre
tacion de la interferencia binaural establece que esta resulta de la fusi6n de la
serial y del ruido en una imagen auditiva unica, no jerarquizada.
200
201
'"
'iii
'0
0.
II
:c
a
~o.
'
I ln fu r~a~i6~ s-;;n~oria l- I
no auditiva
Cognici6n
eJecta f1ass .
.Q.
eo
ro"O
ro 2
.D C
"C
Q)
~ .~
II
t--- ,
li
olio
ReaHmonlaci6n
roPI~
E Q)
ro'"
6 ro
0.
"0
,.
--
L--
",""
--I
--"- -
Procesador
monoaural
,~
ro ~
.D O
Procesador
binaural
r I
-" - ' - -
Filtro del
"_
-,
l __ .
_
.,:lo.
Procesador
monoaural
..
~.
Figura 9. Modelo esquerna tico de Blauert para la audicion espacial
4. EL EFECTO DE PRECEDENCIA
Sa bemos que el sent ido de la aud icion, a diferenc ia de la vista, se co nce ntra
en las fuentes ac ust icas antes que en las reflexiones provocadas por los obje
tos de l entorno. U n ejemplo cotidian o ocu rre al localizar la ub icacion de una
fu ente ac ust ica en un a sala reverberan te donde la mayor part e de la ene rgia
proviene de reflexi on es. Wallach (1949) y Ha s.') (1951) in vesti garon este fe
nom en o co n dos sefiales asincron icas y los result ados pueden sinteti zarse en
las siguientes reglas.
Dos son idos sucesivos se perciben como uno solo si el in tervalo te mpo
ral entre ellos es 10 suficienternen re corto. EI limite superior es de 5 ms para
clics y de 40 ms para sonid os de carac ter co mplejo, como palabr a y musica.
202
C uando ocur re 10 ante rior, la locac ion de la fuente esta det erm inada
por la de l primer soni do. Este fen ornen o se den om ina eiecto de precedencia, 0
203
20
10
Altavoz 2
Eco
rn
//1\"'
.
'x
Ol
0
E:r}Sqr}Ch
0=
q0ier}1.
~ -10
a
E:s qCiq,
".
P
'I(jq(j
-'"
Ol
U
(je
I.
q i0
qPer)
~ -20
Posici6n
deloyente
Altavoz 1
'/
Figura 11. Sistema de refuerzo electroacustico con dos altavoces distantes entre sf
Reflexi6n
inaudible
-30
A
-40 0
rn
10
20
30
40
50
60
70
80
'0
'u
o,
Altavoz 2
Ol
u
~
Altavoz 1
-'"
Ol
u
cc
u
'iii
c
204
Figura 12. Diagrama temporal en el punto de recepcion a partir del sistema de refuerzo
electroacustico con dos fuenres
-.
// I\""-
Altavoz 2
retrasado
0, + 20 ms
Altavoz 1
sin retardo
-0
deloyente
205
I ~ Allavoz 2
lD
:s
-0
-0
'"
.u;
Altavoz 1
con retardo
de senal
.i->:
oS
Tiem po (ms)
Figura 14. Diagrama tem po ral en el punro de recepc ion luego de insralar el d isposi rivo de
rerardo
5. PERCEPCION
DE LA DISTANC IA
H asta ahora ana lizamos los rneca nis mos empleados para de term in ar la d irec
cion de llegada de las ondas ac ust icas desde una fuente externa. N os qu ed a po r
ver de q ue rnane ra eva lua mos la distanc ia a la q ue se encuen tra d icha fue nte .
En e l sis te ma de coordenadas esfericas de la figura 1, al comienzo de este ca
pi t ulo, nos fa ltar ia deterrninar la di st anci a r a la que se encuen tr a la fuen te.
Pe rspectiva auditiva
La perspec ti va ac ust ica , al igual q ue su co n traparte visual, es un a imp or tan te
fue n te de in for m ac ion ambien ta l. Las imageries acu sticas de gran desarroll o en
azim ut se red ucen a un pun to a gra n des d istanc ias, Por ejemp lo , e l an cho actis
tico aparente de un a o rques ta sin fon ica , m uy gran de en las prim eras butacas de
la platea, d ism in uye a unos poco s grado s al o frla en un parq ue a 300 m de d is
ta nc ia.! El efec to es eq uivalen te al de las lin eas paralel as q ue co nvergen en e l
in fini te. S i contin uarn os d esarr o llando la an alogia con el sent ido de la vista,
se pod rfa dec ir q ue la son o ridad d ism in uye co n la d istanc ia ta l como oc urre
co n e l ta rnafio apa rente de los ob jeto s y que la defin ic ion t fmbrica se ateruia
de modo sim ila r al grad ien te de co lor en la v ision. 6 Aunqu e no siem pre estu
5 El pararn etro subjer ivo emp lead o en acust ica de salas se den om in a "anch o apar enre de la
fuente" (AWS), bien co rrelac ion ado con el fact or objetivo de espacialidad (I -IACC).
6 La ana logfa co n el sentido de la vista , aunque inexact a, resulra ut il pa ra eje mp lificar los
diferentes aspecro s irnp licados en la percepc i6n de la pe rspecti va auditiv e.
206
d iad a en de talle, la d istancia apa rente de la fuente ac ustica que defin e la pers
pectiva auditiva cornp one una impo rtante d ime nsion psicoac ustica . Los in ves
t igad ores que desarroll an d isposit ivos acust icos para el ci n e y siste m as
multimed ia ha n conc cntrado gra n pa rte de su in teres en el perfecc ion amien
to de mod elos vi rt ua les de perspectiva auditiva.
La sonor id ad, cuan do inte rv ien e co mo un pa rarnetro de en trada pa ra ev a
luar la d istanc ia de las fuen tes ac iist icas , deja de ser un correlato un idi mens io
n al de la in tensid ad fisica pa ra co n vc rtirse en un rasgo co mplejo que in vo lucra
m as de un a di mension. Los objetos en e l mundo son, en gen eral, de tarnafio
constance, pe ro la im agen de un o bje to en la retin a c rec e y decrece cu ando es
te se acerca 0 se aleja de n oso tros. Este heche es co nocido co mo constancia de
tamano. En la figura 15 se puede aprec iar un a ilust rac ion c lasica de la constan
c ia visua l de tarnafio.
En e l dorn in io de la audicion la constancia de fa sonoridad funciona de mo
do ana logo a la co ns ta ncia de tarnafio pa ra e l sen t ido de la vista . S i un a fuen
te acu stic a de in te n sidad cons ta n te se aleja de n oso t ros a campo libre, la
inten sidad ffsica que nos llega d ism inuye prop orc ion a lmen te con el cu adrado
de la d istanc ia. N o de be sorprendernos en to nces q ue un a fuente cuya intensi
dad decrece parezca aleja rse. Es dec ir, tarnbien podemos exp erimen tar la sen
sac ion de ofr una fue n te aciistica que d ismi nuy e de in tens idad sin alejarse - un
in str urnen to m usical en decrescendo-, cuyo eq uiva len te en el ca mpo v isua l po
d rfa ser un globo que se de sinfl a.
207
............
'I
if
"' 0
">! t::!
E '"
"'"
CUi::>
o ~
pp
Oltura
209
Canta
Figura 18. Pcrccpci6n de la d istancia: los son idos de ambas can tan tes poseen para el
oyen re la rn isma in tens idad, pero la composici6n especrralle perm ite al oyen re saber que
la mas alejada canta en ff
el mism o nivel qu e a 2 m
ro
'0
'iii
Selia !
directa
t:
<l>
,'(' J ] )
1
,:
,,,
,/
"
/ ......'
ZOOM /
6X
/ ,"
B
'0
,/
,,
...
5
~
6
Oistancia de la fuente
2 10
.......
f'=
c - VF
c-
Fuentes acusticas
\\
~"~~"
f' = ~
1
c - VR
EI efect o Dopp ler se emplea desde h ace tiempo en rnusic a elec troac ust ica a
part ir de modu le s espec fficos de proce sarnie nto. Casi no es necesario co rnen
tar la impor tan c ia que tiene un a buen a simulaci6n Doppler en el caso de los
efec ros espec iales para c ine y multimedia.
En cuan to a la percepcion del efecro, se reduce a la percep cion de una va
riaci6 n co n ti n ua de frecue nc ia, qu e ya examinamos en el capitulo Il l.
D
\/\/\ R
V C~V
I
I
~f\
v,
F'
f\
f\
V\J\J\J R
reales
(ITO) Y de inten sidad (lID) que apo rt an las seriales qu e Ie llegan a ambos of
dos . En un sistem a elec troac iist ico de reproducci6n, sin embargo, a la infor
mac ion anterior se suman las referencias espac iales cod ificadas en la serial
grabada.
Por ejemp lo, el registr o de un co nc ierto en un gran audito rio contiene in
formaci6n sobre la reverb eraci6n y las ca rac terfst icas espectro-ternporales de
la sala. A simismo , es funcion de los vfnc ulos espac iales entre cada insrrumen
to y cad a uno de los microfon os ut ilizados. C uando esta grabac ion se reprodu
ce en otro recin to a traves de un sistema estereofon ico bican al, el campo
acustico qu e pe rcibe el oye n te se desdob la en tre: a) un campo acUstico real, que
es en el que esta inmerso y qu e detect a a partir de los son idos que el mismo
pro duce -com o voz hab lada, ruidos de pisadas, etc .- y b) un campo (U;ustico vir
tual generado por la Fue nt e elec troac ust ica a part ir de las referencias cod ifica
das en el registro origina l. En la Figura 21 se puede ver un esquema que ilustr a
d icha situ acion.?
Por supuesto qu e el ter rnino "real" esta cmpleado aqu f co mo una euqueta pracuca, sin
connotaciones episte rnologicas. En cierto scnt ido, por supuesto, ambos campos aciisticos
son "reales" a su rnane ra.
7
Figura 20. Efecto Doppl er con una fuente Fen rnovimien to a velocid ad
ceptor R en reposo
212
VF
hacia un re
213
La situac ion ideal serta q ue el ca mpo acu st ico real no in te rfiriese negat i
varnen te co n el espac io ac ustico vi rt ual q ue defin e la grabacion . Pero esto
ocurre po r 10 gene ra l en salas de aud ic ion cuidad osam ente diseriadas, por
eje mp lo un a sala de co ntrol de un estu d io de grabaci6n . Lo h ab itu al es que el
camp o acust ico de la sala real degrad e la informacion espaci al que con t ienen
las senales elec t roaciisticas . Aunque en el ejemplo n os referimos a un siste ma
este reofon ico bicanal, 10 m ismo oc urre ca n los de mas sistemas de espacializa
ci6 n elect roacust icos que ex iste n en el mercado, tales com o las diferentes ve r
sione s co nocidas co mo surround 0 las que se derivan de la codifi cacion Blumlei n
Capitulo VI n
Percepci6n de objetos auditivos
original.'
8. RESUMEN
N uest ra habilidad pa ra local izar sonidos es muy buena en el plano hori zontal ,
algo men or en el p lano vert ica l (elevacion ) y regul ar para la d istan cia,
La locali zacion espacial es el res ultado del procesam iento comb ina do de
da to s. Para Fuentes acus t icas co rrien tes los dat os descrip tos en este capitulo
son accesibles simul ta nea rnente, al menos en circun stan cias no rrn ales. Es esta
riq ueza de informacion, muchas veces redu nd ant e y refo rzada par da tos visua
les, 10 q ue hace la local izacion mas prec isa y co nfi ab le.
Un capitulo apa rte po d na dedica rse al disefio de ca mpos ac iist icos vi rtua
les. Todos los irnplernenrados h asta ah ora , de sde los disposit ivos rnonofon icos
h ast a los ac tua les algoritmos de espa cializacion para cine y mu lti med ia, pasan
do pa r la estereofonla bica na l, h acen usa de las citadas capac idades aud itivas .
En algunos casas , la contrad icc ion entre datos de entrada (p ar eje rnp lo, un a
[[ 0 q ue corresponde a una Fue n te a la izquierda del oyen te con un a de ITO re
lacion ada can la rnisrna Fuen te ubicada a la izquie rda) puede degrad ar e inclu
so destruir la loca lizacion audi t iva .
Desde A rist6t eles, la pe rcepci6n se ent iende co mo el proceso a traves del cual
util izamos la informacion provista par nu estros sentidos para ar mar represen ta
ciones me ntales del mundo q ue nos rodea. En gen era l, desde una per spec tiva
realista (la de Aristoteles 10 era ) la tarea de la percepc i6n es tamar los da tos de
los sentidos y ded ucir de ellos un a representacion util del arnbien te exteri or. En
la vida di aria n o percib imos los rasgos del son ido - alt ura, sonorida d, ti mbre,
dura cion- de modo aislado , sin o q ue los in tegra mos en la representaci on de
Fuentes acu sticas u obje tos audi tivos . U na pa rte importante en el proceso es
decid ir q ue partes de la est irnulac ion sensorial co rrespo nden al mismo objeto
a even to ambien ta l. La for ma final de ca da represen taci on mental de un ob
jew - visual 0 aud it ivo- for mado a part ir de un cie rto agrupa m ien to de da tos
senso riales, es un a propieda d eme rgen te . Esta pro p iedad n o corresp onde a n in
guno de los dato s to rnados de manera individu al y surg e a partir de nu estr a
capacidad de organ izaci6n psiquica de los datos. La c ita de Helmholtz repro
ducida en el capitu lo [[ ("[...] esta mos muy bien entrena dos para evaluar los
objetos q ue n os ro dea n , pero fallamos com p let arnente cuan do interitarnos ob
servar las sensaciones per se [...]") alcanza aquf p lena signi ficacion .
214
->:
--sado por un grupo de elemen tos sonoros que se exp erimenta como un to do y
que parece em an ar de una unica Fuente ac ust ica ext erna.! Normalmente, las
propiedade s em ergentes que definen cada agregado estan co rrelac ion adas con
las propiedade s de los obje tos fisicos asoc iados.
En vision se pued e describir el probl em a del analisis opti co del am biente
en terrninos del co rrec to agrupa mien to de las regiones estimuladas en la ima
gen retinian a. En nu est ro caso [que elem entos se deben agrupa r para ensa m
blar un son ido 0 , me jor aun , un obje to ac ust ico? N o es pos ible co mpa rar las
estrategias de agrupam iento de ambos sen tidos pu es existe un a diferencia cru
cial en el modo en que usam os la energia ac ustica y la lumfn ica para obten er
informacion del mundo ex terior. En audicion, h acemos uso de la energfa erni
tida por los objetos (las Fuentes acusticas) y cas i n o to rnamos en cuenta la
energfa reflej ada en otros objetos fisicos. Se podrla afirma r que existen al me
nos tantas Fuentes ac ust icas co mo objetos sonoros en una situacion normal.
Las reflexiones - qu e carnbian en funcion del contexto espac ial- degradan la
informacion que n os llega de cada una de las Fuentes. En co nsec uenc ia, ne ce
sita rnos aten uar la informacion que llega por reflexi6n y co locar en primer pla
no la qu e nos llega dir ectamente (en una sala de co nc ierros situ arnos
a ud it ivame nte el piano en el escenario , aun cuan do gran parte de su energfa
n os llega por reflex ion desde las paredes y el c ielo rraso de la sala ). Por el con
trario, la informaci6n visu al esta causada princip almente por la reflexi6n de la
luz en los objetos de in teres. Encendemos un a larnpara n o porque nos intere
se mirada, sin o para ver por reflex ion los objetos de la sala. A diferencia de la
gran cantidad de Fuentes ac iist icas que nos aco rnpafian desde siempre, hubo
una sola Fuente de luz a la vez a 10 largo de gran par te de nues tro recorrido evo
lutivo, En resum en, los dat os auditivos y visuales son dife re n tes y se comple
mentan para brindarnos un pan or ama ve ros irnil del mundo ex terior.
Z17
216
->
~2
Voz humana
1
-6
~
III
~9
-12
~ ~n
-g
::=
-0,
Q.
-21
15
<l:
-12
~9
MMMvWNMAMMAM
~6
4
~3
~2
",
I
0,005 0001 0 0,015 0,020 0.025
co
o.o ~
O,CfI)
coes
la componente fund am ental de la ser ie. De acuerdo con este criterio, si dos es
tfmul os sirnultaneos de espectros perfe ctarnente arrnonicos tien en diferentes
frecuencias fund amenrales, se ove n separa dos.! U na desafin acion del 3% es
suficiente para que un arrnonico se perc iba segregado del co mplejo (siernpre
que su dur acion exce da los 400 ms), Para el sonido co mplejo restante, el efec
to de la desafin ac ion del arrnon ico es sim ilar al que oc urre cuando se reduce
el ni vel del arrnon ico en cuestion hasta vo lverlo ina ud ible. La fusion par ar
monicidad fue uti lizada desde el med ioevo para combinar los registros de or
gano y constituye un recurso clasico en orquestacion .
~2
Disparidades en el ataque
Impresora
1
-6
iD
E
<l:
~~i~ I'V~~,'V\~"14r/1'~V~
WW'\;l_l" \i\f/\t.h~ft"W/VWV
-12
~9
-6
-4
-a
~2
~
1
0.005 0.010 0,015 0,020 0 .025 0030
cess ooeo
O,07~
0,00(1 0,065
oosc
0.095
0.1
~2
Alarma
1
-6
~I~~I
It"
<l:
~9
-6
4
~3
~2
-1,
I
0,005 0,010 0,015 0,020 0.0250,0300,035 O.Gl
O .~5
o .~
0,085
o,COJ
0005
0,1
~2
Mezcla
i~ ~~NW~N~~','~~"
-4
~ 3
~2
~1~~~.
0.005 O()1()
O.O1 ~
c.~
O,uz. O.DX
1:~
QOW O,().l5 O.D50 0.056 a,ClEO OJ1i5 0,010 o,OTS O.OOCI o.e:a-- O]:J JJ 0);1..e
Tiernpo (segundos)
218
(),1
Las relaciones entre espectro arrnon ico , period icid ad y ton icid ad se exponen en el
Apendi ce 1.
J Alg unos cantantes 10 util izan para co nseguir pianissimos sorprende nres (y, estrictarnen te
219
Enmascarante
"0
:ec.
III \ I \
<{
Enmascaranle
"0
.~
C.
IlL
<{
"
III ~ ~
Enmascarante
"0
,?
c.
~
Frecuencia
: Senal
Tiempo
Figura 3 . Espectro de poren c ia de dos sen a tes sucesivas. EI tercer grafico representa
Localizaci on de la fu ente
220
el
M uchas veces las diferen cias espac iales jue gan un papel importante en el an a
lisis auditivo de l entomo al fac ilitar 0 dificu ltar la segregac ion basada en otros
factores." Sabem os, por ejemp lo, que un a serial se detecta co n mayor fac ilidad
cua ndo su ubic aci 6n espaci al difiere de la de l ruido enrnascarante.
Shackleton y sus co legas in vesti garon la h abi lidad para identificar cada
vocal en un conjunto de dos voca les concurrentes. Encontraron que una dife
rencia de frec uen c ia fund am ental entre las dos mejora la identificacion en un
22% , mientras que un retard o de 400 us-correspond ienees a un a d iferencia en
azim ut de 45-la mejo ra s610 7% (Shack leton, T. M. et al., 1992). En resum en,
el mecani smo de segregac i6n espectral parece scr mas poderoso que el espaci al.
La preg unea es, en to nc es, !po r que los humanos no le dan pr ioridad absoluta al
ind ice espac ial? Y la respuesta se enc uentra en la base de n uestra estr at egia au
d it iva , centrada en la percepci6n de fuentes y no de reflex ion es acu sticas. Las
sen ales provenientes de la fuente pueden h aber sido reflejados muchas veces en
Recordemos que la localizacion de la fuente se refiere al rnundo fisico mientras que la la
ter alizacion de l son ido pertenece at un iverse de las represenracion es men tales (ve ase el ca
pftulo vu).
221
Directo
Prim eras
reflexiones
CD
~
"0
co
"0
'in
Reverberaci6n
c
w
Tiempo (ms)
Figura 4. Patron de ref1e xiones en una sala median a y grafico te mporal de la ener gfa que
VII.
222
223
-.
-~
+
c
"Vi
'0
n,
:2~ r
rl:
"
I!
"
!,
rfl,
Ii
I'(l
.;
II
Figura 5. Comparaci6n ent re una serial periodica y una serial cuasi periodica
+
c
0()
"w
n,
+
c
'0
"Vi
n,
Figura 6. Percepcion visual de la periodicidad y de la simetria . Las ondas son las mismas
que en 1afigura 5, pew sin llneas de referend a
224
225
'I
1,111
1
226
IV.
intern ali zado y ope rarfa aun si el a ud ito r no esta familiari zado con la seria l fi
sica en un caso par ticul ar. Q ue e l siste ma aud it ive interpreta una transforrn a
c i6n subita de las pro p iedad es ac ust icas co mo e l ini c io de una nu eva seria l, 0
que haber o ido previa me nte un sc ni do potencia la pe rce pc i6n de su OCU1Ten
c ia fu tura, son h echos qu e n adie c uest iona, Aunque n oso tro s nos in cl in am os
po r el modelo acustico, la pr opu est a de Cadoz n o dej a de tene r c ierto atrac tiv o.
Las regularidades ffsicas h an sido corrobo radas experirne n ta lmen te y son una
buena gu fa pra ctica , a unq ue q uizas no de riven de una corn pren sion perceptu al
profunda de la n atura leza de los procesos ftsicos inv o luc rados.
De ac ue rdo co n el modelo ffsico , las regu larid ade s qu e pueden emplearse
pa ra agrupar e leme ntos en un unico o bje to a ud itivo so n :
Regula ridad 1: es ext rernada rne n te raro que dos so n idos, que co rnien
cen y rer rnine n e xac ta rne n te a l mism o tie mp o , no posean a lguna relacion en
tre sf.
Regularidad 2: progresion de un a tr an sforrn acion: a ) las pr opiedades de
un sonido a islado ti enden a rnodificarse de rnanera co n t in ua y lenta: b) las
prop iedades de un a sec uencia de sonidos to rnados de la m isma fuente tienden
a m od ificarse lentamen re .
Re gul aridad 3 : cuan do un c uerpo vibra pe riod ica men te, sus vibrac ion es
dan nac imi ento a un patron ac ust ico donde las frecu en cias de las co rnponen
tes son mu ltip les de un a misma frecu enc ia fund amen tal.
R egul aridad 4: la rnayor ia de las mod ific ac ion es qu e afec tan a un a fuen
te ac ust ica afec ta a todos los cornpone ntes del so n ido resultante, de rnane ra
ide ntica y sirnultanea.
El fen 6rn en o de red ucc ion de l e n rnasca rarnien to po r co mo d ula c ion co ns
tit uye un bu en eje rnplo de regu laridad del tip o 4 . 10 En e l experirnento c lasico
de Donald H all se emite una seria l sin uso ida l supe rp uesta a un ruid o de ban
das mu ltiples. S i e l ruido se manriene esta t ico el son ido de prueba es en rnas
carado, pe ro si e l ruido e nrnasc aran te flucni a sin cron ica rnen te en arnplit ud, la
percepcion de la seria l se rest abl ece. El oyente agrupa a las d iferentes bandas
de ru ido en un so lo obje to aud it ivo a part ir de su mo vim ien to co rmin . El so
n ido de prueba , estatic o , se segrega de l resro.
Redundancia de la in fo r macio n
C omo hemos v ista , exi st en rnuch as est ra teg ias de agrupa rnien to e interpreta
c ion de los da tos se nso riales. Est a mu lt ipli cid ad es necesaria porque cada un a
10 Vease
227
.......
de elias, par sepa rado, esta sujeta al erro r. Por ejemp]o, la estra teg ia que agru
pa los soni dos por su o rigen espacia l puede ser ineficaz en arnbien tes muy re
verb erantes. La q ue se basa en re lacion es arrnonicas puede fallar si se
enc uen tra co n son idos inarrnonicos 0 ruidos de banda. Las qu e buscan sim ili
tud es sec uenc iales pueden ser burl adas an te sonidos d iscontinuos 0 ca rnbian
res. La utilizac ion en para lelo de varias relaciones de agruparniento co nst ituye
habitualmente un a prot eccion co n tra e l fallo de una de e lias. C uando la in
form aci6n que rec ibe es co n trad icto ria, e l audit or sirnplernen te se puede de
c larar incapaz de penetra r los co mplejos sono ros. La extrema rareza de tales
casos testim onia la pot en cia de ana lisis de l sistema aud it ivo humano.
PERCEPTU A L
Y T EORfA DE LA GESTALT
Junto a sus descubrim ien tos fund acionales en ffsica y fisio logfa de la pe rcep
c ion , H elmh o ltz es co nocido tam bien co mo un precursor de la psicologfa cog
ni ti va. Forrnu lo el princ ipio de la inferencia inconsciente, que esta blece que
nu est ro siste ma visual "construye" obje tos trid imension ales a partir de los da
tos presen tes en el espac io bid imens iona l de la reti na. A part ir del principio
de H elmho ltz se desa rro llo la teorfa de la Gestalt. Esta se in icia en 1912 con un
artic ulo de Max W ertheim er sob re el rnovim iento aparen te , que exp lica la ilu
sion que posibil ita la ex istenc ia del cine. El auto r deduj o que la percepci6n de
un todo (el mov irnien ro) era radicalmenre difererite de la percepci6n de sus
co mpo ne ntes (las imageries esta t icas), La teoria tu vo un gran desarro llo du
ran te los siguien tes 50 afios. Sin embargo , aunque la descripci6n de los fen o
men os per ceptu ales pos tulada por los gestaltist as no ofrecfa rep ar os
importan tes, la argumen tacion te6ri ca se mos tr6 insufi cienre para funda rnen
tar sus leyes y la esc uela cay6 en c ierto de scredito en la decada de 1970. En la
ac tua lidad, se han ret ornado sus princ ipios generales de organ izac ion percep
tu al, que descr iben a grandes rasgos las caracterist icas de la percepcion, pero
se han dejado de lado los modelos exp lica tivos originales. Cas i todos los psi
co logos especializados en la percepci6n aceptan hoy la ope rativi dad de las le
yes de la Ges ta lt, aunque las justifican a part ir de procesos y mecan ismos
diferentes,
Los gesta ltistas, a d iferenc ia de los estructuralisras, entendfan q ue la per
ce pc ion no pod fa redu cirse a un a mer a suma 0 serie de sensaciones, sino que
respond fa a la configurac ion tot al de la que aq uellas form an part e. "El to do es
distinto que la suma de sus part es" sin tet iza uno de sus axio mas basicos, en el
qu e las pro pieda des ernergen tes ilustr an el concepto gesta lt ico de organ izacion
228
ne cesario para ex plica r por q ue los se res human os ve mos el mundo co rnpues
to de obje tos d isrinros, La ca pacidad de pe rcibi r obje tos - piedras, arboles, la
dr idos 0 vien rc-- deb la esta r o rigina da en o perac iones efectuadas po r el siste ma
ne rvioso centra l. A dve rt ir qu e la percepcion de objetos se parados no es s610
prod ucro de las sensa c iones periferi cas fue una de las mas importantes con tri
buciones d e la esc uela de la Ges ta lt.
Segun la teori a de la Ges ta lt los hechos psfquicos son forrn as, un idades or
gan icas q ue se indi vidu alizan en e l ca mpo espac ial y te mpo ral de pe rcepc i6n
o de represenracion. Las form as dependen , en e l caso de la percep c i6n, de un
conj unt o de fac tor es senso riales obje tivos. La pe rcepci6n de las dife rent es c la
ses de elem entos y de las d iferenres clases de relaciones co rresponde a dete r
minados modos de organizaci6 n de un to do , qu e depende a la vez de
condicion es objerivas y subje rivas. La co rresponde ncia qu e se puede estab le
cer entre las part es de un red o artic ulado y ciertos eleme n tos objetivos no se
mantiene, en gene ra l, cu and o esos mismos elementos perten ecen a otro con
junto obje tivo. En ot ras palabras, un a part e en un todo es algo d ist into a esa
part e a islada 0 en o tro to do, a causa de las propiedades q ue debe a su lugar y
funci on en cada uno de ellos. El ca mbio de una cond icion objet iva puede pro
duc ir un ca mbio local en la for ma perc ibida, 0 traduci rse en un cambio rad i
cal de la form a eme rgen ce.
El objet ivo in ic ial de la teorfa de la Ges ta lt cons iste en esta blecer, por
med io de la expe rienc ia, un conj un ro de cond iciones de ex istenc ia de las for
mas perceptuales y de leyes de tran sforrn acion de dich as formas. Para que es
tas se mue str en eficaces no es necesar io q ue exis ta una correspondencia
rigurosa entre los elemen tos del estfrnulo objet ivo y los eleme ntos de la forma
- de heche, la co rrespo nde nc ia direct a gene ralmen te n o existe y, en tod os los
casos, no se man t iene co nsta n te.
Los te6ricos de la escue la afirma ron que el proceso fisio logico que resulra
de un co n jun to de exci tac ione s tien de a organ izarse espo n ta neamen te si
guiendo cie rtas leyes de estructura, independ ien tes en prin cipio de las sign ifi
cac iones agregadas por la educaci6n. En la act ualidad ex isten teorias sobre la
percepc ion que co n tradice n tal afirrnac ion . Se ran comentadas mas adela n te .
Los tr ab ajos de los psicologos gesta ltis tas lIevaron a en un c iar ci nco le
yes y dos princi pios gene ra les q ue pe rrnite n agrupar los estfmu los que pro
v ienen de un a mi sm a fuen te , y seg rega r los q ue no 10 h ace n , En gene ral,
un a regia a islada no sie mpre perm ite la fusi6n 0 fision perceptua l y varias
de eli as d eb en act ua r juntas pa ra que e me rja la forma final (Kohle r, Koffk a
y S ander, 1962).
En 10 que sigue describirernos brevernente las leyes y los princ ipios gene
rales de organ izacio n q ue propon e la teo rfa de la Ges ta lt.
229
~-
III
Leyes de la Gestalt
1111
'c"
'(3
OJ
::J
OJ
u:
Tiempo
Ley de proximidad
La ley de proximidad expresa que los elemen tos ce rca nos tienden a percibirse
como un a unid ad . En la Figura 7 se aprec ian pares de c irculos agrupados por
proximidad cspac ial.
En audici6n la proximidad pued e darse en diferentes di mensiones . Los so
n idos se agrupan po r pro ximidad de altu ra, de tiem po, de timbre a de espacio.
Circulos no ag rupados
F igura 9. Agrupa mienr o de son idos par pro xim idad temp oral
Ley de semejanza
La ley de semejanza esta blece que elem entos iden ticos a semeja ntes (en color,
tarnafio 0 forma para el sentido de la vista) t ienden a percibirse agrupad os. En
aud ic i6n , la semej anza implica sim ilitud de timbre, altu ra, sono ridad 0 locali
zaci6n espac ial. EI rasgo que determina la agrupacion percep tual por semejan
za depende de l co ntex te 0 de la rarea impuesta al oyen te. Van No orden
demostr6 que la sirnilitud de timbre puede impone rse a la similitud de alt ura
tonal, al men os bajo ciertas circunstancias (Van N oorden, L., 1975) .
En la Figura 10 se observa la ley de semeja nza aplicada a la vista y en la fi
gura 11 se puede ver el espectrogram a de dos corrientes perc eptuales agrupa
das par semejanza tfmbrica.
'c"
'(3
OJ
OJ
::J
lL
'"
' (3
eeD DeeD D
::J
~
u,
Tiempo
Tiempo
'c"
'(3
OJ
::J
~
lL
..
_-=LJ ..
~
Ll
. Ll
Ll
Tlernpo
El o rde n y aun el ruirnero de leyes varfa segun el aura r q ue se consulre. El que ex pon e
mos aq ul es el mas frecuenre en la lit eratura so bre el terna.
II
230
231
1,;[
Ley de cierre
La ley de cierre esta blece que las figur as incornpletas tienden a cornpletarse y
a ser percibidas como una unidad cerra da. En la Figura 12 se ve un a serie de
rect angulos.
Bajo ciertas condiciones un son ido enmascarado puede oirse como si fue
ra continuo aun sin serl o (en to do caso, no existe evidenci a senso rial de su
co ntin uidad), Se 10 sigue "oyen do" aiin cuando ha cesado. En la Figura 13a
per cibim os que la serial de banda an gosta no pr esenta ninguna solucion de
continuidad . Puede ocurr ir, sin embargo, que result e disc ontinua en los tr am os
en mascarados (figur a 13b) .
suave y continua. Los cambios bruscos indican que una nueva Fuente se ha acti
vade . Par ejemplo, si la alternancia entre son idos agudos y graves se intercala con
los glisados en la dire ccion adecu ada , se redu ce la segregacion en dos corrien tes
perceptuales. En la Figura 15 se puede apreciar el correlato auditivo de esta ley.
En la voz hablada, gran des cam bios ine sperados en la frecuencia funda
mental dan la impresion de que un nuevo hab lante se ha incorp orad o. Este
efecto requiere un "conocimiento" de las reglas normales de en to n ac ion . La
segregac ion aud itiva produce silencios ilusori os en cad a corriente durante la
parte de la serial atribuida a la otra co rrierite.
Continuidad AD Y CoB
:><
[ ] [ ] [ ] [ ] [ ]
'"
"0
I'"
"
1/\
c;
<l)
::>
2'
LL
rv
"
)i
fo\
I~
-~
1\
'"
Tiempo
b) Sin enma scaramiento
Z3Z
@
eL
Tiempo
a) Con enmascaramiento
"g .
Tiempo
Figura 15. Ley de contin uidad en dos secuenc ias de soni dos
233
--------
-8 -8
-8-8
~~
'-.:::::/ '-.:::::/
'-.:::::/ '-.:::::/
Figur a 16. Ley de destine co rrni n (las ondas dobles representan rnovirnient os en paralelo)
C1l
'0
OJ
OJ
LL
...
. ...
..: ".
".
..
0.. .... . ....: .....
. ..
Tiernpo
o mas co rnpone ntes de un son ido complejo experimen tan el mismo tipo de
carnb ios al mismo tiempo, son agrupados y percibidos como proveni entes de la
misma Fuent e. En la Figura 17 las dos lineas melodicas que se rnueven en para
lelo tiende n a agrupa rse entre sf.
Con relaci6n a la ley de destin o co miin, hay dos fact ores q ue se destacan
a la hora de sin tet izar sonidos para crear nue vos obje tos audit ivos. El primero
t ien e que ver co n la forma y sinc ron ismo del ataq ue, y el segundo co n la sin
cro nfa de las mod ulaeiones (de amplitud 0 frecuencia) en el desarrollo tem
poral de los cornpon en tes que se preten den agrupa r.
234
G rac ias al pr incipio de Figura y fon do se esta blece una jera rqufa ent re los
obietos de interes y el medio neutro que, aunque pueda estar constituido por
exc itac iones co mplejas y heterogeneas, es desplazado a un grado infer ior de di
feren ciaci6n. La segregac i6n perceptu al entre Figura y fondo no ocurre de rna
nera rnecan ica. A l ofr una conversacion 0 una melod ia en un arnbiente co n
un gran ruido de fondo , seguimos al objeto aud itivo q ue co nte nga mayor sen
tido en funci6n del co ntex te 0 de nu estro interes parti cular. Cuando los Indi
ces de diferenciacion no son ev identes se producen figuras amb iguas 0
ilusion es figura-fondo, situac iones q ue se aprovechan en el mimet ismo y en el
camuflaje.
El principia de pertenencia (t arnbien conoc ido co mo principio de cortes
ponden cia ) expresa que si un compo ne n te simple es usado para la form aci6n
de una corrien te perceptual, no puede emplearse en la formaci6 n de una se
gunda co rrien te . En la Figura 18 no pueden verse a la vez la copa y los rostros.
Parece que ate ndernos a una corrien te perceptual a un tiernpo, y el resto for
ma part e del fondo. A lgunos autores han ace prado, no obs tan te, que el prin
cipio de per te nenc ia auditive puede debilitarse en ciertas ocas iones: un
elemento sono ro puede oirse co mo part e de mas de una corrien te perceptiva.
En el caso de las texturas polifon icas se ha propuesto la posibilidad de perc i
bir mas de una Figura a la vez.
El pape l de la atencion cs determ inant e en la selecc i6n de los elemen tos
que van a form ar parte del objeto ac ustico que ocupara la funci6n de Figura.
La atenc i6n ac nia sobre la en trada auditiva para seleccionar ciertos rasgos del
son ido para su ana lisis conscie nce. Emp leamos nu estra sensibilidad a los ca m
bios en la sefial aciistica para dirigir la at encion hacia n uevo s y pot encialmen
te import ant es eventos del entorno . C uan do un aspec to del sonido ca mbia,
235
L~
Principia de pregnancia
El princip io de pregnancia fue formulado por Koffka del siguien te modo: "la or
ganizacion psicologica sera siempre tan excelente como las condiciones domi
nant es 10 permitan" (G uillaume, P , 1975). Se entiende aquf por "excelencia" a
la interveneion de propiedades como regularidad, simetrfa, armon ia de conjun
to, homogeneidad, equilibrio, maxima senc illez,etc. En otras palabras, para agru
par el campo perceptu al recurrimos a la menor cantid ad posible de informacion.
Este principio opera empleando simultanea men te varias leyes de la Gestalt.
En la Figura 19 se ha dibujado el triangulo de Kani zsa. La interpretacion
mas eco nomica en terrninos de inform acion es supone r que ex iste un triangu
10 blanco que se superpone a tres circulos y al triangulo delinea do, y no la rnu
cho mas compleja e improba ble alineacion de tres angu los y tres pacman .
En el en mascaramiento por ruido ocurre algo similar. Es mas eco norni co
en terrn inos de informacio n supone r que el son ido en mascarado con tin ua en
presen cia de l ruido , que in terpretar una compleja operacion sincr6n ica de ac
t ivacion -desact ivac ion .
Se puede aprecia r un ejemp lo notable de agrupamien to , en el que int er
viene n varios princ ipios gesta lticos a la vez, al comienzo del movimie n to fin al
de la sexta sinfonfa de Tchaikovsky. En el sistema superior de la Figura 20 se
yen las partes de los violines I y II tal como figuran en la parti tura, mientras
que en el segundo sistema esta escrito 10 que casi todos los oyentes percibe n ,
cn-esre caso se oponen ent re sf algunas de las leyes de agrupa miento exa m i
nadas. Por semejanza tim brica y de alturas se fusion an los son idos provenie n
tes de ambos grupos instrumentales y luego se reagrupan de acuerdo con el
prin cipio de pregnanc ia. En esta segunda fase inte rviene n las leyes de con ti
nuidad y cierre junt o a un principio de cohes ion estructural llarnado ilusi6n de
escala por Dian a Deutsch (1975).
Es posible ace n tuar la arnbigueda d perceptua l del pasaje agregand o un
compone nte espacial si se dispone la orquesta en el escena rio de ta l modo que
los primeros y los segundos violines queden alejados entre sf, a ambos lados del
director, como ocurre en la forrnacion orques ta l "a la alernana" .
236
e /\
Figura 19. Triang ulo de Kanizsa
"
Como se escribio;
-. -Violin I
-----
Violin II
Como se percibe:
Violin I
Violin II
-----
~--
Figura 20. Reagrupam ienr o melod ico en el cuarto mo vimien to de la sexta sinfonfa ("Pa
te tica") de Tcha ikovskv
237
Isomorf ismo
Los creadores de la escuela de la Ges talt trataron de fundam entar su teona en
term inos fisioiogicos. Postularon una conexi6n muy directa entre la expe rienc ia
percep tiva, la fisiologfa y el mundo ffsico a traves del principio de isomorfismo,
que afirma que una experie ncia subje tiv a y el dispositivo neura l asociado tie
n en estruct uras formales similares.
Se trat a clarame nte de una postur a monista en la que los procesos fisicos,
fisio16gicos, psico logicos y culturales t ienen la misma base rea l: la forma ftsi
ca. La ffsica se convierte aqu f en la ciencia fun da mental a tamar como refe
renci a explicat iva ultima. Esta con cep ci6n se man ifiesta, por ejernplo, en las
numerosas comparacio nes ent re el mundo ftsico y el psicologico a las que re
curre Kohl er: "[...] del mismo modo que en el camp o ffsico (pe r ejernplo el
campo elect rico) , en el campo psico16gico hay tambien una estructuracion es
pont anea que obedece a principios dinarnicos" (Kohler, W., 1972).12
Para estos investigado res la teoria de las formas ffsicas y el isomorfismo
psicoffsico constituyero n el asien to te6rico de la doc trina . A l afirrnar que en
la natural eza inorgan ica se en cuentran mod os de ser del tip o "formal", libera
ron la barrera que separa los procesos no organi cos de los procesos fisiologicos
en el sistema n ervioso central. El marco te6rico fue to rnado de la teor fa del
campo electrornagnetic o vigente a principi os del siglo xx . Citernos n ueva
mente a Koh ler: "[...] los proc esos fisiologicos neu rales con que se asoc ian los
he chos percep tuales esta n en cada caso localizados en un medio cont inuo , y
los hechos que ocurren en una parte de ese rned io influyen sobre los que tie
nen lugar en otras region es, en la med ida direcra en que las prop iedades de
ambos se ha llan relacion adas mutuamente [...] a un percept o aislado en medio
de un arnbie n te ho rnogeneo, le atribuimos su campo". Introduce entonces el
princip io de isomo rfisrno: "las propi edade s estructurales de las exper ienc ias
--'-sen al mismo tiempo las pro piedades estruct urales de sus correla tos biologicos
y, en ult ima instan cia, del mund o ffsico" (Koh ler, w., 1972).13
En la actualidad ya no se cree en el princip io de isornorfismo , y hace tiern
po que han sido dejados de lado los fund amentos teo ricos originales de la psi
cologfa de la G esta lt. Sin embargo, las leyes de agrupamiento todavfa son
empleadas para describir el modo en que percib imos el mun do exterio r. De to
dos los in tentos realizados para int egrar estas leyes a un modelo reorico gene
ral, qu iza el mas interesante sea el que pro ponen los creadores de la teona de
la percepci6 n caotica.
12 Trad.
IJ
de Julio Gu illen .
238
Capitulo IX
Percepc i6n del habla
1. EL
Las menores unid ades del ha bla son los fonemas. EI idioma espanol posee a l
rededor de 24 fon emas diferentes que se definen a partir de los sonidos que es
capaz de producir el aparato vocal.' En esencia, proclucimos tres clases basicas
de son idos diferentes: las consonantes plosivas , que son sefiales tra nsitorias que
se produc en al bloque ar y luego abrir repentinarnente el tracto vocal; las con
sonantes fricativas, que depen den de la tur bulencia en el aire cuand o pasa a tra
ves de una pequefia abe rtur a, y las vow les, cuyas ondas son periodicas y que
poseen altura tonal definida.
Veamos primero, de manera muy sint et ica, como y con que produc imos
esta gran cantid ad de son idos diferentes.
I La can ridad de fonemas del espariol depende de cada region IingL
ifsrica y varia levernen
te, por ejemplo, en tre Madrid, Buenos Ai res y La Ha bana. Co mo referencia cornparat iva,
el Ingles posee alrededor de 40 fone mas.
239
II
a)
E[ apa rato vocal hu man o se puede di vidir en tres partes principa les que son:
un a reserva de a ire a mayor presi6n que [a atmosferica, un cana l de salida do n
de el a ire puede ser interrumpido 0 modulado, y una cav ida d reson ante q ue
filtra las sefia les que se erniten al exterior.
La rese rva de aire a presion, llamada presi6n subglot ica, se local iza en los
pulmones. Su capac idad prom ed io es de tres a cuatro litros y puede llegar has
ta seis durante una inspirac i6n profunda . Mov emos alrededo r de med io litr o
durante la respiraci6n pausada , pero un cantante entrena do es capaz de ut ili
zar hasta c inco lit ros en una sola exha laci6n.
En el borde supe rior de la traqu ea se ubica una espec ie de cav idad ca rt i
laginosa llamada lar inge, que la co mu nica co n el tracto voca l, terrn ino que in
c luye la gargan ta y la cav idad naso bucal. Dentro de la lar inge se hallan las
cuerdas (0 mem bran as) voca les, encargadas de estrech ar u ocl uir el paso de ai
re a pa rti r de la acci6n de va rios peq uefios rruisculos. La ape rtura co n form a de
V entre las cuerdas voca les se denomina glotis. La gloris mide aproximada
mente 2 cm de largo y 1 c m de anc ho cu ando esta tot alm ente ab ierta, En la
figura 1 se puede ve r e l co rte lat eral de la pa rte superior del apa rato voca l, y
en la figura 2 se yen dos co rtes esque rnat icos de la laringe.
Paladar
blando
I '~
'."
Cuerda s
vocales
falsas
Carti lago
1iroides
Carti lago
Cuerdas
vocales
verdaderas
Tlroldes
Cuerdas
voca les
verdaderas
b)
Cartilago
Aritenoides
En fonac i6n, la caja toraxica ap lica una presi6n subg lot ica un poco ma
yor que la presi6n armosfe rica - entre 1,005 y 1,04 atm6sferas- qu e fuer za al
a ire a pasar por la glotis y que hace vibrar las cuerdas voca les, cu ya apert ura
estatica es regulada por el ca rti lage arite no ides. Las cue rda s vocales, a su vez,
vibran a un a frecu en cia co n tro lada por la presi6n subglotica y por la ten si6n
aplicada a sus pequefios rmisculos. Para el habla norm al, las frecuencias se ex
tienden en un ran go que va de 140 a 400 Hz en las muj eres y de 70 a 200 Hz
en los hom bres. Estos ran gos puede n extende rse una oc tava 0 mas en el can to.
'II
Faringe
Epiglolis
Figura 1. C ort e lat eral de la parte superior del aparato voca l hurnano
240
Cuerdas
vocales
falsas
En la fona ci6 n par tic ipan varios mecani smos diferentes dura n te la producc i6n
de ondas. Las consonantes plosivas, que son seriales trans itor ias que se produ cen
al bloquear y luego abrir repenti nam ente el tracto voca l, tienen un desarrollo
temporal en el que pr imero aparece un ataque similar a un impulso de gran pre
sion, seguido por un breve int ervalo en el que la vibraci6 n se aten ua rapida
mente. En la figura 3 se ve el grafico tem poral de la co nso na n te plosiva /k/
Esta serial , transitori a y no pe riodica, pose e un espec tro de banda anc ha
y, por supuesto, carece de altura to nal. Las plosivas se div iden en sordas ({pi ,
241
---+
+
"0
.-e
a.
"0
.a.e
<l:
<l:
Tlernpo
Tiempo
/t/ y /k/) y sonoras (lb/, /d/ y /g/). En estas ultimas, las cuerd as vocales se po
nen en vibraci6n y una vocal suena inmed iatamente despues - unos 30 ms- de
la conson ante, Como el ca rac ter transitor io de las plosivas hace q ue co n ten
gan poca energfa, los can tan tes generalmente las exageran para equilibrarlas
en sonor idad con respect o a las vocales.
Las consonantes fricativas (ls/, [z], /sh/, /j/, /f/, /v/, etc.) producen un a tur
bulencia en el aire que fluye a traves de una pequena abertu ra a mayor velo
cidad que la veloc idad crftica. Aunque se pued e sostener est a clase de seriales
en el tiemp o, son estaciona rias solarnente en el sen t ido que 10 es el ruido blan
co. S us ondas son no peri 6dic as y el espect ro es de band a anc ha . En la figura
4 se aprec ia el grafico tem por al aislado de la consonante fricativ a /sh/.
Aunque el tract o voca l pueda enfat izar alguna s frecuencias de la banda
total gene rada por una con son ante fricati va (por ejernplo, 6 kH z para la /s/ 0
3 kH z para la /sh/ ) no se destaca ninguna frecu encia en part icular y el sonido
resultan te es no t6ni co. Existen otros son idos como las consonantes tiasoles
(lm/, /n/, /n!), las vibratues (lr/ , /rr/ ), erc., pero los modos de producci6 n no di
fieren en esen cia de los ya vistos.?
A diferencia de las conso nantes, las vocales se manrienen estables en el
tiemp o, sus formas de onda son practi carnenre peri6dicas y sus espec tros son
1 N o prerende rnos cub rir aquf el pan orama cornplero de los fonemas del espanol. Tampoco
ernpleamos los sfmbo los recornendados por la Inr ernatlonal Phonetic Associati on (IPA),
q ue exig irfan una desc ripci6n de rallada. Q uien desee ampliar en el tema debera recurrir a
text os especfficos de fon erica y fono logfa.
242
aproximadamente arm6ni cos. En otras palabras, las voca les sf poseen altura
tonal definid a. Se producen por la modulaci6n peri6dica de la apertura glot i
ca. Tanto la frecuencia de vibrac i6n de las cuerdas voca les co mo la forma de
onda resultante estan determina das casi co rnpleta rnen te por la laringe. La fre
cuencia fund amental, que define la per iodicidad y la altura tonal, dep end e de
la presi6n subgl6tica y de la ten si6n y apertura de las cuerdas voca les. El trac
to voca l, tapizado de tejido blando, casi no devuelve energ fa hacia la laring e.'
Las diferentes posiciones de la lengu a, por ejem plo, modifican la acci6n de fil
trado y determ inan cual vocal se va a emitir, pero no alt eran la periodicidad
base de la serial que emiten las cuerdas vocales.
En la figura 5 se pueden observar las formas de onda que parten de la la
ring e para tres ni veles de intensidad diferentes. A mayor intens idad aumen ta
sign ifica tivamen te la cantidad de arm6nicos en el espectro.
De la laringe surgen ondas aproxirnada rnen te periodicas que se parecen,
segiin el caso, a una onda trian gular 0 una onda dienre de sierra con gran can
t idad de arrnon icos. El sonid o que se registra en la laringe se sien te como un
zumbido con altura tona l defin ida, no como los son idos mucho mas agradables
que ofmos cuand o el locutor emite por la boca . Esta gran diferencia acustica
se debe a la acci6n de los filtros de resonancia de l tracto voca l.
Aquf Fa lla la difundi da ana logfa en tre el apa rato vocal humano y los insrrumenr os de
viento del grupo de los bronc es: la carn pana de estos ultirnos de vuelve hacia la boquill a un
gran po rcen taje de energfa en cada ciclo. Asf se esrablecen las ondas estacionarias necesa
rias para su funcion arnienr o.
3
243
........
a)
:t~ it.
---- - -
-..
<{U
Tiempo
..
Frecuencia
200 AA~~
"0
a.
<{
Ii!
Tiempo
c)
Figura 6. Con figuraciones del rracto vocal para las vocales Iii, l ui, /e/ y /a/
Qt
b)
(f)
Frecuen cia
"0
a.
<{
E
Tiempo
I.
Frecue ncia
o~
' 0
: ;~
o
1
2
3
Frecu en cia (kHz)
lal
~ ~~ ' ~ ~
>
D !:J
.~
IIII
0
luI
Fo rma ntes
El traeto voca l se puede aproximar a un tuba de 17 ern de largo, cerrado en un ex
tremo por las cuerdas voca les y abierto en el otro a craves de la cavidad naso bucal.
C ada voca l d efine una geom et rfa particu lar de l trac to voc al , como se pue
de ver en la figura 6.
Cada co nfigurac ion particu lar de l tracro voca l, a su vez, modifica las ca
racterfst icas espectra les del filrro ac ust ico co rrespond ien te. Lo que ofmos es,
en definitiva, un a serial peri odi ca gene rada en la laringe y filtrada par e l tr ac
to voca l. En la figura 7 se pu ede ver co mo la misma onda, ernitida por la fa
rin ge, ado pta envo lven tes espec trales d iferentes para cada voca l. En este
ejernplo se oye siempre la misma alt ura tonal, pero co n tre s alturas espectrales
d iferentes (las voc ales /ii, /a/ y /u/).
La cav ida d n aso bucal posee resona n c ia de banda medi a porque el tej ido
blando qu e la tap iza absorbe gra n cantidad de energfa ac ust ica , Cada un a de
estas zonas de resonanc ia, en las que se refuerza la arnplit ud de los cornponen
tes espectrales, se denomina [omviiue. Cada vocal co rrespo nde a un a corn bi
244
~
Frecue ncia (kHz )
Figu ra 7. Efecto de filtro del tracto vocal sobre una serial periodica proven ience de las
cuerdas vocales
245
a)
3000
2500 .
2000
----r----~----;' -'
'
: E
~- --~
~ -- -! _
I
E.
:e
L
_ I
1500
1000
",
U .
,,
-----,----
- -T-----'
,
' - --
--~,
:--
500
~: - ---
-----iG}D---, ., __ ~0:
LL
,-'' - - --
:__
''
0
0
200
400
600
800
Fl (Hz)
1000
1200
1400
b)
3000
250 0
2000
<,
E.
N
'
1500
LL
1000
--':
500
- - - "l " -
"
~-~ -- - - ,;-
-,
" A--
:- - -- T- ----,
~'
110
0
0
200
400
600
800
Fl (Hz)
100
1000
1200
1400
90
CD
80
70
Figura 8. Regiones de reconoc imiento vocal para las dos prirneras forrnan tes de l espafiol
riop larense, a ) voces masculinas, b) voces femen inas
c:
0
60
-0
50
a.
40
'"
c:
'in
~
dia. POl' 10 tanto hay un ran go de valores para cada par de form antes (una re
gion en el grafico de la figura 8) que co n tie ne informacion sobre la misma vo
cal (Aronso n , L. et aI., 2005).
Los ran gos se superponen en algunos casos y los mismos son idos puede n
percibirse en dos fonn as diferenres. POl' 10 general, solo una de las interpr et a
ciones tien e sentido en su co ntexto y la ado ptamos auto ma tica rnente de rna
nera preconsciente. Una de las razones de la gran ext en sion de las areas para
cada voca l es que las mujeres, los hombres y los nifios no poseen el mismo ta
rnafio de tracto vocal y no pueden producir exactarnente las mismas forma n
tes. Los oye ntes eval uan las ca racte rfs t icas acusticas gene rales del locutor
antes de decidir las forrnantes que le va n a corre sponder a ca da voca l. Co mo
246
Region de sa brecarga
<])
'0
30
20
(J
pa lab r~
<])
a.
'"
10
<])
Qi
10
>
-20
30
270380 490 630 770 9201070 1230 1400 1570 1740 1920 2 ' 30 2370 2660 3000 3400 39504650 5600
247
270'
a)
270'
5.000
180'
1 II
(?K 1 \ a O'
' 1\1
(*\
1' 0'
;s
co
'(3
c:
2.500
<1l
:J
90'
100 Hz
90'
~
u,
400 Hz
1.000
270'
0
180'
I l
I a O'
(')+()
I 1 'Ii
2
Tiempo (5)
2
Tiempo (5)
I 1 0'
b)
5,000
90'
90'
1.000 Hz
4.000 Hz
;s
270'
180'
I I
f\?K
j,
I /I
O'
~~
'~ 2.500
c:
<1l
:J
U
u,
1.000
90'
10.000 Hz
lor que proporciona una buena resoluci6n tem poral 0/300 s) , pero que no
permite observa r los arm6nicos individuales de una serial periodica. Los sono
gramas de ban da angosta poseen no rrnalmente bandas de 45 Hz, suficiente pa
ra dist inguir los armo nicos , pero no para diferencia r ind ividualrnente los
rapidos impulsos gl6ticos. En la figura l 1 se pueden ver dos sonogramas de di
ferente ancho de banda.
N uestro ofdo puede resolver con gran deta lle y (casi) simulta nearnente los
aspectos te mporales y espectrales de un a serial acustica, como ocurre cua ndo
ofmos una sucesi6n rapida de acordes . Sin emba rgo, no viola el principio acus
tico de indete rminacion porque posee la capaci dad de activar y desactivar ra
Como los espect ros de los sonidos del habla varfan en eI tiempo -no son estati _
cos-, para estudiarlos se usan tradiciona lmente graficos cartesianos tiemp o/fre
cuencia que se denorninan sonogramas. EI problema con estas formas de
represen tacion es que, como todo sistema pasivo de analisis de ondas, depe n
den del lfrnite impuesto por el principio acustico de indete rminaci6 n. Resulta
imposible obrener sirnulta nea mente gran resoluci6n en el tiempo y la frecuen
cia . Una soluci6n de comp'romiso consiste en alte rnar son ogramas de banda
anc ha y de banda angosta . En los primeros la band a tipica abarca 300 Hz, va
248
249
E-
m
2.500
'u
c:
OJ
::J
U
i':'
LL
1000
Tiernpo (s)
pida men te los. sens or es de la membran a basilar, corr igiendo asf eI an cho de
ban da efec t ivo de acuerdo a la tarea impuesta ."
Co mo ninguno de los sonog ram as tradicionales representa 10 que eI ofdo
detecta realmente, algunos autores crearon los espectrogm mas awlitivos, en los
que eI anc ho de banda de cada frecuencia de ana lisis iguala a la banda cri tica
que correspon de a su frecuen cia ce ntral (C arlson, Granstrom y Hunnicutt ,
1982) . En la figura 12 se muestra el espect rogram a aud it ivo del registro de V Ol
habl ada de la figura 11. En este caso se pu eden observa r a la vez los arrnon i
cos en baja s frecue nc ias y las transi ciones rapid as a altas frecue nc ias.
C uando se compara un registr o aciistico de voz hablada con su represen
tac ion grafica 10 primero que llama la ate nc ion es que los silencios gene ral
mente no co rresponden a los espac ios entre palab ras. Una de las mayores
dificu ltades a la hor a de ana lizar graficarnente esta c lase de sefia les es determi
nar el modo en q ue la secuencia de son idos se segme n ts en sflabas y pa labras .
Existe evidencia de espe cializaci on cerebral rel ac iona da con la per cep ciori
del hab la. Por ejernplo, se ha pro bado q ue intervienen diferen tes re giones
del cerebro en la percepcion de los son ido s del habla y en la de los son idos
ambientales en general. Si se apl ican sim ultan eamen te a los dos ofd os esti
mulos diferentes -por eje mp lo dos frases distintas- eI esurnulo h ablado pre
sente en eI ofdo derecho - que se procesa en eI h emisferio cer ebr al izquier do
es comprend ido con ma yor facilidad . Lo co ntrario ocurre en el caso de la
rnusica.
Experiencias con tom ografia cornputada y resona nc ia magnetica dem os
traron que, mientras que los sonid os ambientales y musicales son procesados
en am bos hemisferios cerebr ales, los sonid os del hab la est imulan casi exclusi
vamente el he misferio izqu ierdo. Esta caracterfstica esta na basada en la nece
sidad de rnan tener ce rcanos todos los centros involu crados en eI trat arniento
de las sefiales del habla, a fin de per mitir la detecc ion de sus pequefias transi
ciones -del orden del rnilisegundo. De otro modo, si la informacion tu viera
que viajar entre hemisferios, estas transi cione s se perde rian debido al excesi
vo t iempo invo lucrado en la cornun icacion.
A continuacion nos referimos a algunas de las caracteristicas particulares
de la percepcion del habla, que nos perrniten decodificar con eficacia los fo
nemas en una amplia variedad de situ ac iones y contextos.
3. C A RACTERISTICAS PARTICULARE S DE LA
La percepcion del mismo fonema puede estar de ter mi na da por d iferen tes da
ros acust icos. Por ejernplo, un a consorian te fricat iva "acomoda" sus bandas
de ruido de acuerdo con la voca l que la sucede: vocales diferentes dan lugar,
inevitablemente, a difer en tes tr an sicion es en tre formantes. Una sola tran si
c ion de la serial acu st ica puede con tener informac ion sobre varios fon emas
vec inos.
250
251
Modo lingiiJstico
N o h ay un continuum en la percep ci6n de los son idos del h abla , la percep
cio n es dic ot6m ica. En gene ral, los son idos son pe rc ibidos co mo lingu isti
cos 0 como no lin gufsticos, Se pu ed e activar el mod o lingu fsrico dandole
cie rtas instru cciones a l oyen te, pero un a vez ac t ivado es mu y d iffcil rever
t ir el pr oceso.
Una de las co ns ecue ncias de esta caract eristica de la percepci6n del
h abla es nu estra incapac idad par a oir los sonidos propios de l lenguaje en
terrninos de sus parametres acust icos . Los perc ibimos co mo un a corriente
unica d e pa la bras y las de scr ipciones "a ciist icas" son , cas i siempr e, confusas.
Pa ra lograr un a audic i6n limpia de los dato s ac ust icos es ne cesar io a islar ca
d a fonema y sacarl o de co ntex te . S6 10 a partir de ese momen to se desacti
va el mod o lingufsti co.
Results cas i in necesa rio menc ionar la impo rta ncia qu e tie ne esta ca
racteristi ca en la percepc i6n de canc iones y piezas lfricas, en las que coex is
ten elementos pr opios del mo do linguistico (e l te xt o ) y no linguistico (la
rnusica ). ___
Tran siciones
de las forrnante s
.~
"u
u:
Una
de
estas
Q)
de la voca l
:
:........,, '
,
~ :
: Form ante 3
{
,,
''
.
. Forrnante 2
, Formante
T1empo
Presentaci6n normal (di6tica)
"'--:
:~
{~
''
Percepci6n dual
En la decada de 1970 Rand realiz6 por primera vez un experimen to qu e de
mos tr6 la existencia de 10 qu e se con oce co mo percepci6n dual (Ra nd , T. c.,
1974). Mas adelante, Liberm an perfeccion 6 la ex per ienc ia de Rand de la si
guiente man era: se presenta a un o fdo la parte de la sefial prop ia de una sfla
ba a la cual se Ie ha q uitado la transicion del tercer forrnante, y al ot ro la parte
esta t ica del tercer forma n te mas los dos prim eros forman res co mpletos (Libe r
ma n , A. , 1995). Los oyentes dicen percibir la silaba co mp leta en el primer 01
do y s610 un corto zumbido en el otro, En la figura 13 se ap rec ia la de scripcion
esq uernat ica de d ich o ex perirne n to .
Segun Liberman , los resultados ob ten idos indican qu e existen m6dulos
separados qu e pro cesan , por un lado, los sonidos del habl a y, par otro, los de
mas sonido s. Est a co ncl usion co ncuerda co n los dat os ob te n idos a partir de la
obse rvac i6n directa de la actividad co rtical dur ante la aud icion.
Una de las con secuencias in teresa n tes asociadas a este fen 6m eno es qu e
se viola el principi o de separaci6n espaciol que sostiene qu e un elemento ac us
t ico dad o no pued e ser asign ado a mas de un a fuente a la vez. Pare ce que el
meca n ismo de per cepci6n lin guistico es tan poderoso que, bajo ciertas cir
cunsta ncias, permite agrupar ele me ntos ac iisticos aun cuando estos pro ven
gan , 0 aparenten pro ven ir, de fuentes diferen tes .
252
Base
(a un oido)
Transicion es aisladas
(al otro oldo)
Presentaci6n dic6tica
Integraci6n audiovisual
A l decod ificar un mensaje habl ado Ie presta rnos ate nci6 n a un a gra n ca n t i
dad de d ato s no aciis t icos . Los mov imientos de la cabeza, de las manos y, en
particular, de los labios del hablante puede n influir sign ifica tiva men te en la
percep ci6n del habla .
Es in te resan te mencionar aqu f un experi rnen to en el que se presen ta
un vid eo co n el a ud io modificado a un gru po de espec tadores (M cGurk y
MacD o nald, 1976 ). En la image n apa rece un locu tor di c ien do "t a ta" jun
to al audio del mismo locu tor pronunciando la pa labra " ma ma". Los ove n
res di cen ofr "n ana", sin expresar riin guna d ud a -oyen "nana" con
cla ridad-, y se so rpr e nde n a l o ir el aud io aislado, libr e de toda in formaci6n
visual.
253
Percepci6n cQteg6ricQ
U n a consecuencia de la percepc ion en mod o linguisti co es nu estr a capacidad
par a ubicar cada fonema en un a dererrnin ada cat egorfa ind ividu al. C ua ndo
varia de man era cont in ua algun par ametro acust ico de la sefial, por ejernp lo la
frecuenc ia de una formante, n o oimos un a serie de pequefios cambios grad ua
les, sino que pe rci bimos saltos "cuan t icos" en tre un fonem a y otro. Este fen o
meno se denom in a percepci6n cQteg6ricQ y no oc urre usualm en te con los
son idos arnbienta les. No se d ist in guen los ca mb ios aciisticos de la sefia l cuan
do estes caen en la misrna categorfa, pero se percib en com o mu y grandes si
provocan un salto de ca tegorfa. La percepc ion categ6rica se nos present a co
mo evide n te c uando trat arnos de co mprender un discur so en un a lengua qu e
no dorninarnos co mpleta rnen te: las con fusion es frec uentes se deben a un a in
suficien te co rnpete nc ia respecto de las ca teg orfas fon ernicas de esa lengua,
La percep c ion de vocales est aci onarias es m uy d iferente pues los peq ue
fios ca rnb ios ffsicos son perc ibidos con faci lida d . Segun Liber man, est o oc urre
porq ue las vocales ais ladas estan mu cho menos cod ificadas y se las oye co mo
son idos co rr ien tes, no ca tego rizados lingufsticam en te. N o obsta nte, las voca
les de n tro de un a sec uenc ia del ha bla se comportan de mane ra sim ilar a las
co nso na n tes, es decir , de rnan er a a ltarnen te cod ificad a.
U n ejern plo de percepci6n codificada y categorizada de son idos n o pe rt e
nec ien tes al h abla es la percepci on de las alt uras musicales en un siste ma es
ca list ico dete rrninado . En rnusica to nal, las funciones arrnon icas tarn bien
esta n a lta rnen te ca tegorizadas .
Ex isten tr es hi potesis principales elaboradas para ex plica r la percepci6n
ca teg6 rica . En la prirn era, P isoni co ns idera que la me moria aud itiva para los
patrones acust icos de las co nsona ntes decae rap idam ente y que cuando debe
rian ser p rocesados en la iden t ificac ion acust ica del fon ema ya se h an per d i
do : la discr iminacion fina de l est frnulo dentro de est a categorfa de fon em as es
imp osib le (Pison i, D. B., 1973). Par a fonemas mas largos e in tensos, como los
de las voca les prolong adas, los pa trones ac ust icos pueden ret enerse en la me
mor ia aud it iva por perfodos mayores, pud ien do reali zarse sobre ellos operac io
n es de discrim in acion similares a las ope radas en los son idos en gene ral.
En la segunda h ipot esis K. S te vens sugiere que las ca tego rfas y los lim ites
en el h abla han evo luc ionado co n el fin de ex plota r la sens ibilidad natural del
sistem a aud itivo (Steven s y Blumste in , 1981) . Esta hipotesis n o da cuen ta de
mu chas de las operac ion es carac terist icas necesarias para la apa rici6n de la
percepcion categ 6rica.
U na tercer a h ip6tesis, formulada por Kuhl, conside ra que la percep c i6n
ca teg6rica surge de la expe rienc ia co n el prop io len guaje (Kuh l, P. K., 1993 ).
254
C uand o aprendemos a en tende r las palab ras de un lenguaje part icular, presta
mos atencion a las diferencias ac usticas que afecta n su sign ificado e ign oramos
las que no 10 afecta n . U na vez que ap rendernos a distinguir en tre ambos gm
pos, n os c uesta o fr las diferen cias ac usticas que no atafien al sign ificado . Esta
explicacion da cuenta de la dificu ltad para ofr diferencias en tre fon emas en un
len guaje no fam iliar. Kuh l enco n tro que los n ifios n acen con h abi lidades rele
van tes respect o dellenguaje que parecen depender de me cani smos gen erales de
la percepcion aud it iva: no responden de man era espec ffica a una lengua en par
ticular. Pero a los seis meses la percepci6n de los bebes ya esta polar izada por la
exposicion a un a lengua espec ffica. Kuh l propu so la teorfa del magne tismo del
l.enguaje nativo, en la que la ex pos ic ion a un a lengua en particular resulta en la
form acion de representaciones almace na das de catego rias foneticas, que gene
ran "prototipos" de cada ca tego rfa. Los prot otipos acni an com o ima ne s percep
tua les: la percepc ion cat egorizada es un a co nsec uen cia n atural. La teorfa de
Kuhl es co mpa tible con la hi pot esis de que el cerebro funciona co mo un siste
ma qu e opera en la Frontera del caos .
4. M ODELOS DE PERCEPCI6N
DEL H A BLA
Finalrnente, aparece n eta pas de ana lisis de segmen tos y busqueda de lexico .
Este mod elo esta basa do en la suposicio n de que es posibl e encon trar un
mapeo relati vam ente in vari ante en tre los patrones ac usticos y los soni dos de l
h abl a. S us det ract ores sefialan el caracter in evitabl emente sec uenc ial de las
operac iones inv olu cradas.
Modelo de red n euronal
EI mod elo de McClell and y Elma n es co nexionis ta y esta basado en las teor fas
de las redes ne uro na les (McClella nd y Elman, 1986) . Asum e q ue existen tres
n iveles de represen tacion , cada un o de los cuale s co ntiene unidades de proce
samiento alta rnente interco nectadas llamadas nod os. En el nivel mas bajo, los
nodos represen tan rasgos foneticos, en el siguiente representan segmentos fo
n et icos, yen el ultimo nivel representan palabr as. Por eje rnplo, el nodo corres
pondiente a un fonem a especffico puede d isparar h acia dos 0 tres nodos
correspon dientes al nivel de los rasgos asocia do s normalrnente co n di chos
fone mas. La ac tivaci6n excitato ria 0 inhibitor ia puede f1uir en ambas direccio
nes, desde niveles mas bajos h ac ia otros mas elevado s, 0 viceversa.
Este modelo perrnite ex plica r varios aspectos de la percepc i6n de l h abla,
tales co mo la resta uraci6n percep tiva de fonemas "perd idos", la percepci6n ca
tegor izada y la armon izacion de dat os. Es un o de los mod elos compatibles co n
la teor ia de la percepcion caot ica ,
5. LA BUSQUEDA DE
Cole y Sco tt nota ron que la percepcion del habl a in volucra la identificaci6n
sim ultanea de , al menos, tres tip os de datos cua lita tiva rnen te diferen tes: indi
cadores aciisticos invarian tes, indicad ores de pendientes del contexte e indica
do res asentados en la envolve n re dinamica de la onda (Cole y SCOtt, 1974).
En o tras palabras, cada sflaba contiene da tos in variantes y datos depe nd ientes
del co n texte. Ex iste ev ide ncia de qu e la envoiven te dinarni ca de la on da pro
vee in formacion sob re la co rnposicion fonernica de la serial y de que, en cier
to grado, el siste ma auditive esta capaci tado para decodifi car los estirn ulos de l
h abl a basa ndose un icam ente en las varia cio nes de la amplitud en el tiernpo.
La naturaleza mul tidimensional de la informacion aciistica permi te un alto ni
vel de redundan cia en la seria l del habl a. C oex iste n diferentes datos q ue per
m iten la iden tificac ion de un fonem a determinado , aunque co n uno so lo de
ellos se 10 pueda reco noce r. La redundancia sirve para supera r las arnbigueda
des inherentes a l disc urso hablad o, para minimizar la inf1uenci a del ruid o y de
256
las interferencias, para compensa r las d isto rsiones de la sena l (por ejernplo en
un a linea tel efonica) y par a supera r la ma la articulaci6 n de un locu tor.
R esistencia del habla fr cnte al deterioro de la serial
Es remarcabl e la resistencia del habla fre nte a varias forrn as de distorsion se
vera. Los met odos de testeo de artic ulac ion las h an ca raloga do en : cantidad de
ruid o de fondo , ca mb ios en el espectro d e frec uencia y recorte de picos.
Cantidad de ruuio de fonda. La inteligibilidad de sflabas aisladas resulta sa
tisfactoria co n un a relac ion sena l/ruido (SiR) de +6 dB. Sin emba rgo, las pala
bras resultan inteli gibles aun para rel aciones SiR negativas si integran
sente nc ias bien fonnadas, en particul a r si el oye n te esta farniliarizado co n el
tem a, 0 si el h abl a y el ruido prov iene n de lugares diferentes.
Cambios en el espectro de frecUencia. Se ha dem ostrado qu e, co n tra la afir
maci6n tradi cion al, no h ay co m pone n tes en frec uencia esen ciale s para la co
municaci6n. Se puede cortar un a serial de habla co n un filtr o de banda
pasante de a 1.800 H z, de 1.800 a 20 .000 H z 0 de 1.000 :J. 2.000 Hz, y no per
der mucho en intel igibilidad .
Recotte de picos. S i se coloca un ci rcuito que reco rte la sefial de entrada al
2% de su arnp litud pro med io queda un a onda casi rect an gular de per iodo varia
be y se pierd e la infonnaci6n aportada por la forma de on da origina l. Sin em
bargo, se ob tiene n tasas de articu lacio n ent re el80 y el 90%: son necesar ios solo
dos bits para cod ificar la amplitud sin perde r casi nada de inteligibilidad, Por su
puesto que el son ido no result a "na tu ral" y es imposible reconocer al locuto r.
En resum en, el siste ma de co municaci6n human o ha evo lucio nado de tal
forma que pued e operar bajo un a gran variedad de con diciones adversas. Sin es
tas capacidades el telefon o n o ex istiria, 0 serla ext rao rdina riame n te complejo.
6. INTELIGIBILIDAD DE LA PALABRA
La inteligibilid ad del disc urso se refiere a la exactitud con que un oyen te pro
medio puede entende r un a palabra 0 un a frase h abl ada. En un a situac ion n or
mal parte de la informacion se ex trae de l co ntexto y de las sefiales visua les que
acompafian a la fon aci6n y, po r 10 tan to, es posible entender el sign ificado in
clus o si solamente un a fracci6n de las un idades ac usticas d iscretas se oye co
rrectamen te. En otros casos el oye nte queda limitado a valerse unicamente de
la informaci 6n ac ust ica, co mo oc urre en los siste mas de co rnunicacio n no pre
senc iales, por eje mp lo el telefono 0 las gra ndes salas en las que se emplea re
fuer zo electroacustico.
257
100
Silencioso
90
<f)
l"
.0
'"
'"
80
-o
70
'iii
Ruidoso .
..
-0
'(3
'"
:;
o
t
Ensayos de articulaci6n
''""
'"
~
'"
60
-0
La in vestigaci 6n en esta area com enzo con el desarroll o de los sistemas telefo
nicos a fines del siglo XIX y de la radiofon ia a princip ios del xx. Los primero s
intentos para definir numericarnente la inteligibilidad fueron los ensayosdear
ticuiacum, que cons isten en pruebas de ca mpo en las que un locutor lee un
conjunto de fonemas 0 palabras de una lista confeccionada al azar. Para evitar
la influencia de elem entos no fone ticos, las secuencias ca rece n de sentido lin
gufst ico y las sflabas estan ordenadas de manera estocastica. Es habitual el uso
de listas estandarizadas para permitir la comparaci6n entre en savos.t Los oven
res, distribuidos en la sala de una manera prede terminada, an otan los fonemas
o pal abras que creen ofr, El result ado del test es el porcentaje de pal abras co
rrect as -que coinciden con la lista original- para cada oyente. Ademas de los
factores acust icos especific os que analiz aremos mas adelante, los en sayos de
articulaci6n son muy sensibles a las caracteristicas par ticulares de cada locu
tor y de cad a oyen te. En las figuras 14 y 15 se pueden ver los resultados obte
nidos a partir de dos grupos de locutores y oyen tes (Beranek, L., 1954).
Una caractenstica a destacar de los ejemplos an teriores es la not able dis
paridad en la resistencia al ruido que presentan las voces de los diferentes 10
cutores. En las mismas condiciones de ruido intense, el prim er locutor de la
figura 14 se comprende correctamente, mientras que el ultimo de la lista re
sulta absoluta mente ininteligible.
La rasa de art iculaci6n se puede con siderar una med ida valida de la inte
ligibilid ad , que es aplicable iinicarnente a cada caso parti cular. El valor es re
presentative de la sala en la que se reali z6 el en sayo y de las caracteristicas del
locutor y de los oyentes que participaron en el,
En condicio nes acusticas 6ptimas la art iculac i6n cas i nunca supera el
95% de respue stas correctas. Afortunadamente, un discurso art iculad o puede
comprenderse aunque algunas silabas resulren ininteligibles porque el oyen te
extrae el sent ido del contexte. Por esta razon, una rasa de articulaci6n del
5 En idioma ingles se util iza la lisra de fin ida en
258
50
~
0
40
[
i
,
3
Lcicutores
Figura 14. Resulrado de un ensayo de articu lacio n de palabra a partir de cuatro locutores
diferentes
Figura 15. Resulr ado de un ensayo de art iculac i6n de palabr a obten ido co n siete oyenres
ubicados en la misma pos icion. El locutor fue siempre el mismo
259
prornedio.
Tabl a 1
Esfuerzo vocal
dBA
Re!aci6n seiial-ruido
S usurro
S uave
Relajado
Norm al (p rivadc )
Normal (p ublico)
Voz levan rada
Int cnso
Muy int ense
G rito
Max imo
260
32
37
42
47
52
57
62
67
7Z
77
Prob ablemente sea la mas simp le y senc illa de las relac iones que se usan para
med ir la inteligibilidad. Se la define co mo la resta entre el pro med io de largo
tie rnpo, 0 ni vel sonoro continuo equ iva lente , de la serial del h abla en el pun
to de recepc ion (LA eq. " iiul) Y el n ive l promedi o de largo tie mpo del ruid o de
fondo (LA eq. ruido)' Ambos n iveles se miden en dBA:
n,ido (dBA)
26 1
Las med ic iones de in teligibi lid ad del discu rso conforme a la re laci 6n sefia l-rui
do reali zadas po r Brad ley sugiere n un a meseta de ni velaci6n po r en cima del
va lor S R = + 15 dBA. En o rras palab ras, me jo rar el sistema m as alla de este va
lor n o aurne n ra la in teli gibil idad del sistema. El defe ct o de este fndice es q ue
n o contemp la la na tur aleza ac ustica de l canal de comun icaci6 n: relaciones de
S R 6pt imas pueden co rrespo nde r a un a in te ligibilidad deficienre si, po r eje rn
plo , la sala prese n ta un ec o desrac ad o.
Al
G(i}
30dB
.=1
=- - L
(LA eq . seiial - LA eq
ruido +
12) dB
G r,}
250
0.072
500
0.144
1000
0.222
2000
0.327
4000
0.234
Dur ante varias decad as, el AI y los e nsayos de articulac io n fueron los uni
co s met odos cap ace s de evalua r la inteligibil idad del ha bla. Se sabla q ue el ri
po y la complej ida d de la serial de pru eb a (pa labras art iculadas sin se n tido
contra palabras cone ct adas en un a sen te nc ia signi fica tiva ) tien en un irnpact o
importante en los result ad os. S in e mba rgo, la ac ust ica de esos ti empos n o po
dfa diferenciar c uan ritat ivarnenre ent re las dos secuencias. Tampoco inclu ia
elemen tos prop ios del canal de co mun icac i6n, co mo el patron de reflexion es
o la re verbe rac io n , ni co n te mplaba algunos efec tos psicoac iisticos rele vantes
co mo el en rnascararn iento . Era necesario h all a r o tro merod o de evalu ac i6n
q ue superase estas lirnitaciones.
[ndice de transmisi6n de la palabra
Introduc ido por Steen ek en y H ou tgast , e l fndice de transmisi6n de fa polabta
(STI )6 es basicarnenre un a ve rsi6 n mej o rada del In di ce de la art iculac i6n
que in cluye las d isto rs iones te mp o ra les e n el ca na l d e co m un ica ci6n (S tee
neken y H ourgast , 198 0 ). El STI se basa e n las ex pe rienc ias de det ecci 6n de
modulac i6 n desc rip tas e n e l pun to 3 del ca pit ulo II. Las seria les del h abla se
co ns ide ran como un flu jo de ene rgia co n va riac io nes espec tro-te rnpo rales y
el grad o de prese rvaci6n de estas va riac ion es a t raves del ca na l de co rnun i
ca c i6n se to rna co mo un a med ida de su fid elida d . Los autores argumen taro n
q ue la conse rvaci 6 n de la envo lve n te d in arn ica impl ica la prese rvaci on d e
sus compo n en tes de Fo ur ie r en el p unto de recepc i6 n. EI n ive l co n ti nu o
eq uiva len te de la sefia l del hab la es sust it uido po r un a seria l teo rica de prue
ba, c uya intens idad es modulada por un a func i6 n s in uso id al co n un Indice
de la modul ac i6n m = 1. C ua lq u ier degr adaci 6 n de la se ria l e n e l ca na l de
comuni caci 6n apa rece ra co mo un a red ucci 6 n en e l fn d ice de la mod u la
c i6n e n el p unta de recepci on . Steene ke n y H ou tgast aco ns eja n el e rnp leo
de seria les mo d uladoras de frec ue n c ias co mp rendi das en tre de 0 ,4 y 20 H z
pa ra repres e n ta r el grade de in tel igibi lid ad a tod as las tasas de oc urrenc ia
del h ab la .
S i f rep resenta la frecuenc ia de la serial modul adora y t es el tiem po en se
gundos, en tonces la inte nsidad de la sefial de pru eb a es modul ada por la fun
ci6n 1 +cos(2n ft ). El fnd ice de mod ulac i6 n en el pun to de recepci6n es
fun ci6n de la frec uenc ia y se ca lcula co n la siguien te ex presion , q ue se dedu
ce de la repuesta di screta al imp ulso entre los ex tre mos de l ca na l:
263
L.J
a ( -j nf ~)
n
rn2
m( f ) = - - -
an
L
n
r;
Usando mediciones empfricas de las sefia les reale s de prueba, es posible medir
el STI de cualquier sala 0 siste ma de co mun icac i6n. Si se reduce el numero de
bandas de octav a se pu ede construir un sistema mu cho mas sencillo y rapid o
denominado RASTI,7 qu e permite determinar la inteligibilidad del habla en
tiempo real.
L
n
Is an
r;
m'(f)=m(j) - - - -
IsL~+ l R
n
r,;
(S/R )ap
ocr. I
(S/R)ap = --14.
El Ind ice de tran srnision de la palabr a (STI) representa un a razon lin ealizada
de la forma:
ST1= (S/R)ap + 15
30
264
%A lcons = 9 TR ~
i -a
en la qu e TR es el ti empo de rev er ber aci on globa l en segundos, S es la su
perficie interi or total de la sa la y a es el coe fic ien te de absorcion medio d e
la sala.
Ayuda visual
Se sabe que la lectura de los labi os perm ite que las personas hipoacusicas par
ticipen en un a conversacion. Las personas con ofdo n ormal tambien se bene
fician con la info rmac i6n v isual y, si b ien no les perrn ite la comprensi6n
completa del discurso h ablado , la reconstruccion fonetica en presencia de rui
do se facilita al obs erva r el rost ro del locutor.
Se h a co mpro ba do qu e la informaci6n lin gufstic a se comprende mejor
cuando se la tr an sm ite por television qu e por radi o (Reisberg y McL ean ,
1987). Macleod y Sum me rfield encontraro n que el "beneficio de la lectura de
labios" corresponde a un aume nto promedi o de 11 dB en la relaci6n sefial-rui
do del sistema y O stberg probe qu e el tarnafio del monitor de video tambien
contribuye en el m ismo sen tido (M cLeod y S umme rfield, 1987). Estas ob ser
vacion es confirman la idea intuitiva de que la informacion visual contribuve
7
265
100
so
ro
Apendice I
Teorema de Fourier
80
<:;
i!'
"
0
"'
ro
60
(iJ
<J)
:J
o,
co
40
<J)
-0
<J)
'ro
20
C
<J)
~
0..
-l
-30
-20
-10
visual
266
267
los rnotivos de su emp leo en gra n ca n tidad de ap licaciones prac t icas. La voz
humana y algun os instrumen tos, como el v iolin 0 el oboe, generan sefia les q ue
se le aproxim an .
h = 2 mm
-l. . . .. . .
Tiempo (ms)
.s
ro
a.
<fJ
-1
-2
'
i:
Periodo
P= 10 ms
0,64
=0,64 mm
.su
f,
'6. 0,32
f, = n f ,
.3
<l:
0,213
=1/
= 100 Hz
+-"m.u
r,
r,
f2
f3
= 100 Hz
r.
f5
Frecuencia (Hz)
f6
f7
f.
f5 = 500 Hz
f9
f,o
f,o = 1000 Hz
268
269
Apendice II
Principia acustico de indeterminaci6n
271
iD
iD
!'!
o
!'!
o
c
51
51
,0
c
'in
-0
i"
i"
"in
0.
0.
QJ
QJ
-0
-0
~
Z
Freeuencia (Hz)
>
ti/ = oo
M= 0
ro~
iD
~
[1'
[1'
51
51
-0
-0
"in
"in
i"
i"
0.
0.
QJ
Tiempo (ms )
-0
W
>
QJ
-0
W
>
6 1= 0
iD
iD
[1'
!'!
51
51
-0
c;
-0
"in
"in
i"
i"
0.
0.
QJ
QJ
-0
-0
"z
M= oo
Freeuencia (Hz)
espec tro contendra un a sola lin ea (com o era de espe rar) . Si se anal iza un im
pu lso de duraci6n tl c -7 0, el ancho de banda tl f sera 1 divid ido (cas i) cero que
equ ivale a infiniro , Este result ado co nfi rrna qu e el espectro de un impulso es un
ruid o blanco can un anc ho de banda infinito. En el caso intermedio de un a se
fial limitad a en el t iempo -<Ie duracion fin ita- el pr inc ip ia se aplica sin incon
ven ientes. En la figura 1 se ilustr a 10 an te rior co n los di agramas temporales y
espectrales de un a sefia] sin uso ida l, de un impulso y de una serial de duraci6n
in tennedia.
El pr inc ipio ac ust ico de ind et erminaci6n irnpone un limite inferior, pe w
n o un o superi or : el produ ct o d e la duraci6n par el a nc ho de banda puede al
canzar va lores co nside rables. Par ejernplo , el ruid o en un a av eni da mu y tran
sita da posee a la vez un a d uraci6 n (tl c) y un anc ho de banda (tl j) muy gra ndes
y no vio la po r ella la relaci6n tl f X tlt ~ 1.
Es imp ortance dest acar qu e el princ ipia de ind et erminaci6n no se refier e
a un a limitaci6n en la tec no logfa de gene rac i6n de o n das 0 en el mec an ismo
de percepc i6n human e , sino qu e descri be el comportam iento fisico propio de
los fen6menos o nd ulato rios. N o ex isre la posibilidad de construir un a sefial
que a la vez este bien det erm inad a en la frec ue nc ia (pe quefio tlj) y en el ti ern
po (pequefio tlt) , cualquiera sea la tecn ologia utilizad a. En otras palabras, no
se puede co n struir un son ida tan co rto co mo el de un tambor y a la vez ta n to
ni co co mo el de un a flauta ,
61
272
273
Referencias bibllograficas
Ando, Yoichi (1998 ), Architectural A coustics. Blending Sound Sources, Sound Fields , and
-
Margen - UNL P.
(2001 b ), "Fracrales, ruid o l /f y rruisica", en Acw.s del Encuenrro Nacional 2001 de
(1999 ), "E l princi pio de inde term in aci6n en ac ust ica m usica l", en AcUlS de la XIII
w.
275
III!\"
C halmers, D. (1996 ), "EI prob lema de la co nc icnc ia", Inuesrigaci6n y Ciencia, N 233 .
C hion , M . (1998) , "Du son a la cho se: h ypo th eses sur l'objet sono re", L'analyse musi
Un iversit y Press
- (1960), H ams, Strings and HamlOny, N ue va York, Anchor Books.
Benoit , c., T. Mohamadi I' S . Kandel (1994 ) , "Effec ts of ph onetic contex t on a ud io
Research.
Beranek , L. ( 1996), Concert and Opera Halls: How they Sound, N uev a York, A cou st ical
-
Society of A me rica .
(1988 ), Acousrical Measurements, Wood bury, A co ust ical Society of A merica.
Acustica, vo l. 30 .
Blaue rt, J. (199 7 ), Sparial Hearing. T he psychoph)'sics of human sound localization,
Ca mbridge, MIT Press.
Bregman , A. (1 994), Auditory Scene Analysis, Ca mb ridge, MIT Press.
Brown ell, W. E. er al. (1985 ), "Evok ed Mechan ical Re spon se of lso lat ed C oc h lear
O ute r H air Ce lls", Science, vo l. 22 7.
Butler, R. A. ( 1969) , "Mo naura l a nd bin aur al local izati on of no ise bursts ve rt ically in
th e med ian saggital plane", Journalof Auditory Research, vo l. 3.
Butler, D . (1992 ), The Musician's Guide to Perceprion and Cognition , N ueva Yor k,
Sc h irme r Books.
C adoz, C. et al. (1993) , "C ORDIS-ANIMA: a Mod eling and S imu lat ion Syste m for So und
and Image Sy nthes is-T he Gen era l For mali sm", Computer' MU5ic] oumal, vo l. 17.
Ca rlson , R., B. G ra ns tro m I' S . Hu nnicutt ( 198 2) , "A multi -lan gu age tex t-to -speech
module", Proceedings of ICASSP, vo l. 82 .
Ca rlyo n, R. I' B. Mo ore (1984 ), " In te nsity d iscrim ination: a sev ere depar tu re fro m
We ber 's Law", Journal of the A cousnccl Society of America, vo l. 76.
276
of America, vo l. 57.
Di Liscia, O . P. (2000 ), "Spa t ial listening and its computer simulat ion in electron ic music",
en <htt p://depts.wash ington.e du/smcc web/courses/40 1-3/402examps/spat ial.htm l>.
Divenvi, P. (1 992 ), "Binau ral suppressio n of no nechoes" , Journal of Experimental
Eh resman, D. (1 978 ), "Percept ion of t imb ral an alog ies", Rapports IRCAM N 13/78.
Erick son , R. (19 75 ) , Sound Structure in Music, Berkeley, Uni versity of California Press.
Fec hner, G . (1 860 ) , "E lem e nt os de psicofisica", pub licado en int e rn et.
Fin e, P. A. I' B. Moor e (1993 ), "Freq ue nc y ana lysis a nd musical a bility", Music
Perceprion, vo l. 11.
Flet cher, H. , W. A. Munson (1933 ), "Lo ud ne ss, its de fin it ion, mea surement and cal
culati on", Journal of the Acousrical Society of America, vo l. 5.
277
Fletch er, H . (1995), "Speech and Hearing in Communi cation - A SA Edit ion ", reirn
preso, Woodbury, A me rican Ins ti tut e of Ph ysics.
Fraisse P. (1967), Psychologie du temps, Paris , PUF.
Fraser, J. T. (1992), II Tempo, una Presenza Sconosciuca, M ilan, Felt rin elli,
Freed, D. J. (1990) , "Audi tor y co rre la tes of pe rceived ma llet h ardness for a set of
record ed per cussive sound events", Journal of the Acoustical Society of America,
vo l. 87.
Freeman, W. (1991), "Fisiolc gfa de la percepc ion", Investigaci6n y Ciencia , NQ 175.
Gardne r, M. (1968), "His to rica l Background of the Hass and/or Preced en ce Effect ",
Journal of the Acoustical Societ)' of America, vol. 43.
Ga rne r, W. R. y G . A. Mi ller (1947), "T he masking th reshold of pure ton es as a func
tion of du ration ", J. Exp. Psycho/., vol. 37.
G lasberg, B. y B. Moore (1990), " Deriva tion of aud itory filter sha pes fro m not ch ed
n oise dat a", Hearing Research, vol. 47.
Goertzel, B. (1993) , The evolving mind, Nueva York, Gord on and Breach Sc i. Pub .
Go ldste in , J. L. (1973), "A n op tim um processor th eor y for the central form at ion of th e
pitch of co mp lex to nes ", Journal of the Acoustical Society of America, vo l. 54.
G oode, R. L. et al. (1994) , "N ew know ledge abo ut th e fun cti on of th e human ear :
deve lopmen t of an improved model", Am . J. Otol., vo l. IS .
G rant ham, D. (1995), "Spat ial hear ing and related ph en omen a", en Hearing, ed. B.
Moo re, Nu eva York, Acade mic.
G reen, D. M. (1973), "Temporal acuity as a func t ion of frequ en cy", Journal of the
Acoustical Society of America, vo l. 54.
G rey, J. (1975), An Exploration of MusicalTimbre , CCRMA , S tan ford Un iversity.
Guillaum e, P. (1975), Pisicologfa de la forma , Buen os A ires, Psiq ue.
H aas, H . (1951) , "Uber den e ing luss e in es einfach echos auf die h orsamk ei t von
sprache", Acustica, vo l. I [trad . a l Ingles, (1972), 'T he in fluen ce of a sing le echo
on the audi bility of spee ch" , Journal of the Audio Engineering Societ)', vol. 20].
Hafter, E. y" T. Bue ll (1990), "Resta rting th e adapted bin aura l system ", Journal of the
AcousticalSociety of America, vo l. 88.
Hall, J. W. y R. W. Pet ers (198 1), " Pitch fro m no nsirnultaneous successive harmoni cs
in quiet and noise", Journal of the Acoustical Society of America, vel . 69.
Ha ll, J. W. et al. (1984) , " Detection in noise by spec rro- rernporal pa tte rn ana lysis",
Journal of the Acoustical Society of America, vol. 76.
-
y M. Fern and ez (1984), "T he role of rnon oaural frequency se lectivity in bina ural
ana lysis", Journal of the Acoustical Society of Amencs, ve l. 76.
H all , D. (1991) , Musical Acoustics, Ca liforn ia, Brooks/Cole Publi shing Company.
Han del, S. (1995), "Timbre percep tion and audito ry object ide ntificat ion", Hearing,
ed. B. Moo re, Nu eva York, Acade mic Press.
- (1989) , Listening, Cambridge, MIT Press.
278
H elmho ltz, H . von (1885) , Die Lehre von den Tonempfidungen [trad. en ingles, (1954),
On the Sensation of Tone, trad . A. J. Ellis, Nu eva York, Dover Publicat ions].
Henning, G . B. (1970), "Compar ison of th e effects of sign al dur ation on frequency an d
amplitude discr imin at ion", en Frequency analysis and periodicity detection in hear
ing, ed . Plornp, Leiden , Sijthoff
H irsch , 1. J. ( 1959), "Aud itory percept ion of temporal order", Journal of the Acoustical
Society of America, vol. 3l.
Hourga sr, T. (1976) , "S ubharrnon ic pitc hes of a pure to ne a t a low SIN ra tio", Journal
of the Acoustical Societ)' of America, vol . 60.
- (1972), "Psych oph ysical evide nce for lateral inhibit ion in he aring", Journal of the
AcousticalSociet)' of America , vol. 51.
- Y Sreen eken , H .. (1984), "A mult i-language eva lua tion of th e RASTI-Me tho d for
estim ating speech inte lligib ility in aud ito ria", Acustica, vol. 54.
H~tsma , A. y J. Go ldste in (1972), "The central origin of the pitch of pure to nes : evi
\\ence fro m musical int erval recogn ition ", Journal of the Acoustical Society of
America, vol. 51.
- , T. Rossin g y W. Wage naa rs (1987), Auditory Demostraiions, ASA (cd y libro).
Iverson, P. y C. L. Kru mh an sl (1989), "P itch and t imbre interac t ion in isola ted ton es
and in sequences", Journal of the Acoustical Society of America , vol. 86.
Ive rson , P. y C. L. Krumhan sl (1993) , " Iso lat ing th e dynami c at tribures of musical tim
bre", Journalof the Acoustical Society of America, vol, 94.
Javel , E. (1980) , "C od ing of AM tones in the ch inc hi lla aud ito ry nerve: implication s for
th e p itch of complex to nes ", Journal of the Acoustical Society of America, vol. 68.
Joh nson , D. L. y H . Gierke ( 1974), "A ud ibility of infrasound" , Journal of the Acoustical
Society of Amelica, vo l. 56.
Kat z, D. (1967) , Pisicolog(a de laforma, Madrid , Espasa-C alpe.
Kemp , D. T. (1978), "S timulated Aco ustic Emissions from with in th e A ud ito ry
S ystem" , Journal of the Acoustical Society of America , vo l. 64.
Kendall R. A. y E. C. Cartere rre (1993), "Verbal att ribu tes of simul tan eou s wind
ins trum ent timbres: II. Adjec tives induced from Pisto n 's Orch estration ", Music
Perception, vol. 10.
Kendall , R. A. , E. C. Cartere tt e y J. M. Hajd a (1999), "Natura l vs. synt he tic instru
ment ton es", Music Perception, vo l. 16.
Klatt, D. H . (1989 ), "Review of selected mod els of speech pe rcep tio n", en Lexical
Representation and Process, Ca mb ridge, MIT Press.
Klumpp, R. y H . Eady (1956), "So me measurements of interaural time difference
th resho lds", Journal of the Acoustical Society of America , vo l. 28.
Koh ler, W. (1972), Psicologia de la forma . Su tarea y ultimas experiencias , Madr id,
Biblioteca Nu eva .
- , K. Koffka y F. San der (1962), Pisicologia de la forma , Buenos A ires, Paidos.
279
Konishi, Masak azu (1993), "Audici6n bin aura l", Investigad 6n y Ciencia, N Q 20I.
M iller, G . y W. Taylo r (1948), "The perception of rep eated bur st of noise ", Journal of
y R. Shepard (1979), "Quant ification of the Hi e rarch y of To nal Fun ct ions With in
a D iatonic Contex t" , Journal of Experimental Psychology : Human Perception and
Performance, vo l. 5.
Kubo vy, M . (1981), " Integral an d sepa rable d imensions and the theo ry of in d is
pensable att ributes", en Perceptual Organization, Erlbaurn, H illsd al e.
Kuhl, P. K. (1993), "In na te predi sposit ions and the effects of exp er ience in speech per .
ce pt io n: The na ti ve langu age magnet theory", en Developmental neurocognition:
Speech and face processing in the first year of life, Pafses Bajos, Kluwer'A<zdemi c
-Publishers.
-,
Liberman, A. er al. (1967), "Perception of th e speec h code", Psychological Review, vo l. 74.
Liberman , A. y Mattingly, I. (1985), "The motor theory of speech perception revisited",
Cognition, vol. 2I.
Liber man , A. M . (1995), Speech perception , Cambridge, MIT Press.
Lo , Y. O . (1987), "Tow a rd a T he ory of Ti mbre", Stanford, CCRMA , St anford Un ive rsit y.
McAdam s, S . y E. Bigand (1994), Penser les sons. Psychologie cognitive de l'audition,
Parts , PUF.
McAdams, S tephen (1995), Localisation Auditive, Parfs, IRCAM .
Mc Clell and , J. L. y
J. y J. P.
G o ldb erg (1968), "A St udy of the near-mi ss inv o lving Weber's
Law and pure-tone in tensity d iscri m inati on", Perception and Psychophysics, vo l. 4.
McG urk, H . y J. Mac Donald (1976), "Hearing lips and see ing voices: A new illusio n ",
43.
Malham D. G . (1998), "S patial he aring mechan isms and sound rep roduction", trad . al
espa fiol O . P. Di Liscia, aur o rizad a por el auto r, en < h ttp://www.unq .ed u.ar/cme/
personales/od iliscia>.
Matthew, Robert (1975), "A co ust ics in per spective", en Auditorium Acoustics, Londres,
A pplied Sc ience Pu blishers.
Mathews, M . y J. Pie rce (1980), "H armon y and no nharmon ic part ials", Journal of the
Acoustical Society of America, vo l. 68.
280
Press.
(ed .) (1995), Haruibook of Perception arui Cogn ition : Hearing, Londres, Academic
Pre ss.
- et al. (1993), "Cornodulation masking release in subj ects with unilateral an d bilat
eral cochlear hearing impa irme nt", Journal of the Acoustical Society of America,
vo l. 93.
- y B. Glasberg (1983), "S uggested formu lae for ca lculat ing aud ito ry-filter bandwidths
and excitati on pa tterns", Journal of the Acoustical Society of America, vo l. 74.
N e isser, U . (1967), Cognitive psychology, N ue va Yo rk, App let on-C enrury-Crofts.
O lson, H . (1952), Music, Physics and Engineer ing, Nu ev a Yo rk , Dov er Publications.
O stberg 0 ., B. Lindst ro m y P. O . Renhall (1988), "Contribution to speech int elligi
bility by different sizes of vide ophone displays", Proc. of the Workshop on
Vide ophone Terminal Design, Turfn .
Patterson, J. y D. Green (1970), "D isc riminati on of Transient Si gn als H aving Ident ical
Energy Spectra" , Journal of the AcousticalSocie ty of Am erica, vol. 48.
Patterson, R. D. (1976), "A ud ito ry filte r shapes der ived with noise stimuli", Journal of
the Acoustical Socie ty of America, vo l. 59.
P ick les, J. (1988), An Introduction to the Physiology of Hearing, S an D iego, Acad em ic
Press.
Pierce, ] . R. (1991), "Periodic ity a nd Pit ch Perception", Journal of the AcousticalSociety
of America, vo l. 90.
(1 985), Los sonidos de !a mUsica, Barce lona, Ed . Labo r.
Pisoni, D. B. (1973), "Auditory and ph onet ic memory co des in th e d iscrimination of
consonants and vowe ls", Percept. Psychophys., vo l. 13.
Plenge, G . (1974), "On the d iffe rence between locali za t io n and latera liza tio n", T he
Journal of the Acoustical Society of America, vo l. 56.
Plomp, R. (1976), Aspects of Tone Sensation, Londres, A cadem ic Press.
- (1967), "Pitch of complex tones ",journal of the Acoustical Society of America, vol. 4I.
- y Levelt,] . M . (1965), "Tona l Conso nance and Critical Bandwith", Journal of the
Acoustical Society of America, 38.
Po llack , I. (1968), "Auditor y pul sed Dopp ler d iscriminat ion", Journal of the Acoustical
Socie ty of America, 44, pp . 592-598
- (1953), "The Inform ati on of Elem entar y A ud itory D isplays", Journal of the
Acoustical Socie ty of America, 25, pp . 765-769.
Ran d, T. C. (1974), "D icho tic rel ease from masking for spe ec h ", Journal of the
AcousticalSocie ty of America , vo l. 55.
281
-Randell, M. (1993), "M ental mode ls and co mp lex syste ms: the ada ptive dynamics of
cog n itio n" , en internet .
Rasch, R. A . (1978), "The perception of sim ultane ous notes such as in polyphon ic
music" , Acustica, vo l. 40.
Rasch , R. y R. Plornp, (1999), "The percept ion of musical tones", en The psychology of
music, ed. D. Deutsch, San Diego , Acade m ic Press.
Rayleigh, L. (19 45) , The Theory of Sound, Lond res, Do ver.
Repp, B. H. (19 87), "The sound of two hands clappi ng", Journal of the Acoustical
Society of Am erica, vo l. 8l.
Rei sberg D . y J. McLean (1987) , "Easy to hea r but
hardt~nderstand :
Risser, J. e. (1 986) , "Pitch and Rhy thm Pa radoxes: C o mment on A uditory Par ad ox es
Based on Fract a l Wavefo rm" , Journal of the Acoustical Society of America, vo l. 80 .
-
Risser, J.e. , y D. L. We ssel (1999), "Exp loration of timbre by ana lysis and syn thesis",
en The Psychology of Music, ed . D. De utsch, San Diego, A cad emic Press.
Ritsrna, R. ( 1967), "Freq uencies do minan t in the percep tion of th e pi tch of co mplex
so und", Journal of the AcousticalSociety of America, vo l. 42.
- ( 1962), "Existen ce region of the tona l residu e", Journal of the Acoustical Society of
America, vo l. 34.
Rock, I. y S. Palmer (1991), "EI legado de la psico logia de la forma", Investigaci6n y
C iencia, N Q173 .
Roede rer, Juan (1997), FCsica y psico[fsica de Ia miisica, Buenos Ai res, Ric ord i.
Ru iz, R icard o (1995), Ideas para el estudio de la organizaci6n pSlquica, La Plata, UNLP.
Scho ut en, J. F. et al. (19 62), "P itch of the resid ue", Journal of the Acoustical Society of
Am erica, vo l. 34.
Sek, A. (1 994), "M od ulati on de tec tion th resho lds and crit ical modu lati on frequen cy
based in random amp litude and freq ue nc y chan ges" , Journal of the Acoustical
282
A lip-reading
adv antage with intact a ud ito ry st imuli", en Hearing by ey~ : The psychology of lip
reading, New Je rsey, Lawrence Erlbaum Associates.
S hac kleton, T. M ., et al. (199 2), "Across freq ue ncy integration in a mod el of lat era liza
America , vol. 31 .
(1935 ) , "The relati on of pit ch to in te nsity," Journal of the Acoustical Society of
Amencc , vo l. 6.
al. (1937), "A sc ale for th e mea sure ment of the psychologic al magni tude of
pi tch", Journal of the Acoustical Societ)' of Am erica, vo l. 8.
S undberg, J . ( 1991), The Science of MusicalSound, San Dieg o, Academ ic Press.
- (1 98 7), The Science of the Singing Voice, DeKalb, N orthern Illinois Un iver sity Press.
- y Lindqvisr, J . (1 973 ), "Musica l oc ta ves and p itch," Journal of the AcousticalSociety
of A merica , vo l. 54 .
- y Verr illo , V. (19 80) , "On the anato my of the retard : A St ud y of tim ing in music,"
Journal of the Acoustical Society of America , vol. 68 .
Terhardt, E. ( 1974), " Pitch , consonan ce and harmony," Journal of the Acoustical Society
of Amencc, vol. 55.
- er al. (1982a) , "P itch of co mplex signa ls accord ing to vi rt ua l-p itc h theory: Tes ts,
ex amples, and predic t ions ", J. Acousr. Soc. Am ., 7l.
- y W. Dixon Ward (1982b), "R ecognition of musica l key: Exploratory stud y", J.
Acousr. Soc. Am. , 72 .
-
er
283
----------------------zp-----------
Unernoto, T. (1989), "T h e psycho log ica l structure of m usic", Proccedings of the Firs t
of freq uency an d sen sa t ion level", Journal of the Acoustical Society of America, 61,
pp. 169-177.
N 12.
Whittle, L. S . et al. (1972), "T h e aud ibility of low frequency so un ds ", J. Sound Vib.,
vo l. 2 1.
Zwi cker, E. (1965) , "Tempora l effects in simultaneous masking by wh ite -n o ise burst",
Indice ternatico
de co mpresi6n , 113
Auriculares, 22
B
Ban das cnticas, 91, 103
Celulas ci liadas, 34
(PTS), 77
285
284
---------------~----------------_.
(TIS) ,75
de ruido, 77
190
Ecos, 203
Ecos cocleares, 47
Exciraci6n irnpulsiva, 44
Fechner , ley de , 70
Fen (unidad), 61
286
Fonaci6n, 241
Fonemas, 239
Formanres, 244
(DAP),89
(HRTF),198
frecuencia, 220
.
H
H ass, efecro, 202
habla, 256
lnrensidad, codificacion de la , 8 1
(DAP),66
Inrensidad, discriminaci6n de la, 66
In re nsidad , facto res espec tra les, 71
Isofonas, curvas, 61
Isornorfismo, 238
N
Nervio aud it ive , 40
o
L
Ley de c ie rre , 23 1
Localizaci6n audiriva, 19 1
M
Medidor de n ivel sonoro, 64
141
Otdo ex terno, 20
Otdo in tern e , 30
Oldo medio, 24
Pabellon auricular, 20
Pascal (unidad}, 54
Potenc ia ac iistic a, 56
Presi6n dinarnica, 54
287
Psicoffsica, ley, 62
rnetodo de, 95
Refractario, esrado, 38
Resonancia me cani ca
(membrana basilar), 43
Reverberaci6n , 208
nati ve , 255
Timbre, 163
el, 182
S
Schouten, expe rirncnto de, 142
Sensibilidad a la fase, 98
Sonidos diferenciales, l lO
So nogra rnas, 248
Sonoridad, 53
S ta pedi ano, 29
Supresi6n, 82
288
177
Tfmpano, 24
Tonoropta.T Z
U
Umbral de audiblidad, 58
251
Vocales, 243
182