Generación Sintética de Sonido Direccional

Universidad de Sevilla
Departamento de Teora de la Seal

y Comunicaciones

Escuela Superior de Ingenieros
Ingeniera de Telecomunicacin

PROYECTO FIN DE CARRERA

GENERACIN SINTTICA DE SONIDO
DIRECCIONAL.

Autor: Antonio Emilio Muoz Ylamo
Director: Prof. Dr. Jos Ramn Cerquides Bueno

a mis padres

Quiero agradecer especialmente a D. Jos
Ramn Cerquides Bueno por darme la posibilidad de
realizar este proyecto en el Departamento del rea
de la Seal.
A Mnica, porque eres lo mejor que me ha
pasado y no entiendo la vida sin ti.
Gracias a mis padres y hermanos por
ayudarme y comprenderme en la distancia, sin
vosotros no estara hoy aqu.
Quiero tambin mostrar mi gratitud a
Mammen, Mary y Marcos, me habis dado un apoyo
que slo una verdadera familia sabe dar.
Gracias a mis amigos de Crdoba, del
Colegio Mayor y de la Escuela, el estar con vosotros
hace que me sienta afortunado.

I
Generacin Sinttica de Sonido Direccional
NDICE DE CONTENIDOS

1.- INTRODUCCIN Y OBJETIVOS........................................................................................................... 1
1.1.- Introduccin............................................................................................................................. 1
1.1.- Objetivos ................................................................................................................................. 3
2.- ACSTICA. ............................................................................................................................................. 4
2.1.- Introduccin............................................................................................................................. 4
2.1.1. Resea Histrica .......................................................................................................... 5
2.1.2.- reas de Trabajo en Acstica ..................................................................................... 7
2.2.- Caractersticas de las Ondas Acsticas.................................................................................. 8
2.2.1.- Ecuacin de Onda.......................................................................................................9
2.2.2.- Ondas Planas............................................................................................................ 10
2.2.3.- Ondas Esfricas........................................................................................................12
2.3.- Caractersticas del Sonido .................................................................................................... 13
2.3.1.- Velocidad .................................................................................................................. 13
2.3.2.- Longitud de onda.......................................................................................................14
2.3.3.- Presin Acstica........................................................................................................ 16
2.3.4.- Nivel de Presin sonora (SPL) .................................................................................. 16
2.3.5.- Intensidad Sonora ..................................................................................................... 17
2.3.6.- Nivel de Intensidad Sonora (IL) ................................................................................. 18
2.3.7.- Nivel de Potencia Acstica (PWL)............................................................................. 18
2.4.Micrfonos............................................................................................................................... 20
2.4.1.- Transductores bsicos .............................................................................................. 21
2.4.2.- Direccionabilidad. Patrones bsicos de los micrfonos............................................. 28
2.4.3.- Micrfonos de Configuracin variable ....................................................................... 31
3.- CIENCIAS BSICAS DEL SONIDO 3D................................................................................................ 34
3.1.- Perspectiva Fsico Acstica .................................................................................................. 35
3.2.- Perspectiva Psicoacstica..................................................................................................... 39
3.3.- Perspectiva Neurofisiolgica................................................................................................. 43
3.3.1.- Sistema perifrico...................................................................................................... 43
3.3.2.- Fisiologa del Sistema Auditivo ................................................................................. 44
4.- MTODO DE ANLISIS 1. MODELO DE PROPAGACIN DE ONDAS ESFRICAS ...................... 65
4.1.- Introduccin........................................................................................................................... 65
4.2.- ngulo y distancia ................................................................................................................. 65
4.3.- Modelo de fuente cercana y fuente lejana............................................................................. 66
4.3.1.- Modelo Fuente Cercana............................................................................................ 66
4.3.2.- Modelo Fuente Lejana............................................................................................... 67
4.3.3.- Intensidad Sonora ..................................................................................................... 68
4.4.- Cuantificacin y retardos enteros.......................................................................................... 69
4.5.- Movimiento............................................................................................................................ 73

II
5.- MTODO DE ANLISIS 2. HEAD RELATED TRANSFER FUNCTION. (HRTF)............................... 75
5.1.- Tcnicas de medida de HRTF...............................................................................................75
5.1.1.- Modelo de cabeza esfrica ....................................................................................... 75
5.1.2.- Modelado de Eco-Oreja ............................................................................................ 77
5.1.3.- Modelado emprico.................................................................................................... 77
5.2.- Colaboracin con la Universidad de Wisconsin .................................................................... 79
5.3.- Montaje ................................................................................................................................. 80
5.3.1.- Tcnicas de Medida .................................................................................................. 81
5.3.2.- Procedimiento de Medida.......................................................................................... 83
5.3.3.- Medidas de Altavoz y auriculares.............................................................................. 84
5.3.4.- Los datos................................................................................................................... 85
5.4 Caractersticas de la HRTF ..................................................................................................... 86
5.4.- Diferencias individuales......................................................................................................... 92
5.5.- Reproduccin estreo del sonido 3D .................................................................................... 95
5.6.- La Reproduccin estreo de los Sonidos 3D........................................................................ 96
5.6.1.- Filtrado Direccional.................................................................................................... 97
5.7.- Procesado............................................................................................................................. 99
5.7.1.- Esttico ..................................................................................................................... 99
5.7.2.- Dinmico ................................................................................................................... 99
6.- INTERFAZ DE USUARIO.................................................................................................................... 103
6.1.- Requisitos bsicos .............................................................................................................. 103
6.2 Funcionamiento..................................................................................................................... 105
6.2.1.- Anlisis Esttico ...................................................................................................... 106
6.2.2.- Anlisis Dinmico.................................................................................................... 113
6.2.3.- Estadsticas............................................................................................................. 117
7.- CONCLUSIONES Y LNEAS DE DESARROLLO .............................................................................. 125
7.1 Conclusiones......................................................................................................................... 125
7.2.- Lneas de desarrollo............................................................................................................ 126
8.- BIBLIOGRAFA Y REFERENCIAS..................................................................................................... 128
ANEXO I : POSICIONES ANGULARES Y RESULTADOS DE LAS PRUEBAS..................................... 132
ANEXO II : TIEMPOS DE PROCESADO................................................................................................. 137

1

1.- Introduccin y Objetivos

1.1.- Introduccin

El sonido y su tratamiento digital han experimentado en los ltimos aos
un importante desarrollo debido en gran parte, a una mejora notable en los
sistemas de obtencin y reproduccin del sonido. El sector multimedia y los
sistemas de vdeo y DVD domsticos se han visto ampliamente mejorados.

En la actualidad los hogares se ven invadidos por electrodomsticos
potentes y de prestaciones elevadas, en la mayora de los casos acompaados
de un elevado nmero de altavoces, que hacen que surja la necesidad de
sacar rendimiento a esta inversin.

Los ordenadores cada vez son ms potentes, no son slo las
herramientas para llevar las cuentas o procesadores de texto para escribir
cartas, se convierten en elementos que aportan caractersticas multimedia
donde los nios, y los no tan nios, juegan y se divierten. Es muy comn que
los PCs traigan incorporados un DVD y un numeroso juego de altavoces, esta
evolucin trae consigo una necesidad de mercado dedicada a la investigacin
de imagen y sonido. Es precisamente el sonido el tema fundamental de este
proyecto y concretamente el papel que tiene la direccionalidad del mismo en la
poca en la que vivimos.

2
Los sistemas de sonido denominados Home Cinema cada vez son ms
habituales en los hogares. Estas inversiones tanto del consumidor al comprar
los equipos, como del fabricante en investigacin y desarrollo, exigen un
desarrollo paralelo en las tcnicas de reproduccin que saquen el mximo
rendimiento a estos sistemas multicanal, y el sonido direccional es uno de los
aspectos fundamentales en este desarrollo.

El proyecto pretende implementar un sistema alternativo de sonido
direccional y sensacin espacial para ser reproducido en auriculares. Esto
tiene la dificultad aadida de que slo disponemos de 2 fuentes de sonido, en
lugar de hasta 6 como los sistemas 5.1. Mediante los dos minialtavoces
situados dentro de los auriculares pretendemos emular un entorno
tridimensional.

La reproduccin estreo tradicional provoca alguna informacin espacial,
pero no recrea lo suficiente la dimensionalidad completa como si estuvisemos
en una habitacin (por ejemplo en un concierto de msica real), ms bien
provoca una sensacin como si estuvieses en un espacio tridimensional. La
reproduccin por medio de altavoces crea la impresin de que ests en frente
de un espacio de sonido, y la reproduccin mediante auriculares crea la
impresin de que la fuente de sonido est en la propia cabeza.

Es complicado que cuando escuchamos un sonido grabado de la forma
habitual podamos recibir la informacin sensorial sobre los eventos
almacenados en el archivo, no podemos interactuar con esos fenmenos
grabados para actualizar, testear y refrescar nuestro entorno cognoscitivo (no
podemos mover la cabeza para asegurarnos de donde viene un sonido, o para
ver la fuente del mismo). Estamos relegados al rol de un observador inmvil
con imposibilidad de mejorar nuestra informacin sensorial.

3
1.1.- Objetivos

Las seales de sonido monofnicas van a ser tratadas mediante dos
algoritmos para convertirlas en estereofnicas, de modo que se recibirn en
cada unos de los odos seales distintas, procesadas segn:

La teora de propagacin de ondas esfricas
Procesado mediante Funciones de Transferencia relativas a la
cabeza o HRTF (Head Related Transfer Functions)

Estas seales de salida estereofnicas sern testeadas por una serie de
voluntarios que medirn la bondad de la direccionalidad creada por los
algoritmos implementados.

La herramienta de anlisis y reproduccin de sonidos direccionales
presentada en este proyecto permite, de una manera fcil e intuitiva, la carga,
procesado, reproduccin y visualizacin de las seales de sonido de entrada y
salida. Tambin habilita la posibilidad de que cualquier persona que quiera
comprobar la direccionalidad del sonido pueda hacerlo, e incluso pueda
participar en la elaboracin de las estadsticas convirtindose en voluntario del
experimento.

El objetivo final del proyecto es comprobar cmo de buenos son estos
tratamientos a la seal de sonido, para proporcionar direccionalidad en el
espacio. Tambin se desarrollar un mtodo para crear sensacin de
movimiento sobre un sonido monofnico. Este algoritmo emular el
movimiento al que se somete una fuente de sonido al realizar una traslacin a
lo largo de una curva.

4

2.- Acstica.

2.1.- Introduccin

La Acstica es la ciencia que estudia la produccin, transmisin y
percepcin del sonido tanto en el intervalo de la audicin humana como en las
frecuencias ultrasnicas e infrasnicas.

Dada la variedad de situaciones donde el sonido es de gran importancia,
son muchas las reas de inters para su estudio: voz, msica, grabacin y
reproduccin de sonido, telefona, refuerzo acstico, audiologa, acstica
arquitectnica, control de ruido, acstica submarina, aplicaciones mdicas, etc..
Por su naturaleza constituye una ciencia multidisciplinaria ya que sus
aplicaciones abarcan un amplio espectro de posibilidades, tal como se observa
en la Figura 2.1.

5

Figura 2.1 Ciencias relacionadas con la Acstica.

2.1.1. Resea Histrica

En la antigedad, filsofos griegos como Chrysippus (c. 240 AC) y
Aristoteles (c. 384-322 AC) as como el arquitecto romano Vetruvius (c. 25 AC)
teorizaban sobre la naturaleza del sonido.

En 1657 Gaspare P. Schotto en su libro Magiae Universalis publicado en
Herbipoli, actual Wurzburg, describi ejemplos de anlisis de ondas sonoras
as como su generacin mediante instrumentos basados en agua.

Se considera que el comienzo del estudio cientfico de las ondas
acsticas corresponde a Marin Mersenne (1988-1648), un Francs considerado

6
el padre de las acstica, y a Galileo Galilei (1564-1642) con su "Discursos
Matemticos concernientes a dos nuevas ciencias" (1638).

Isaac Newton (1642-1727) desarroll la teora matemtica de la
propagacin del sonido en su "Principia" en 1686.

Habran de transcurrir muchos aos hasta que, en el siglo XIX, los
trabajos realizados por Stokes, Thomson, Lamb, Knig, Tyndall, Kundt y otros
precedieron el importante desarrollo de Helmholtzen su Teora fisiolgica de la
msica en 1868 para luego llegar al gran tratado de dos volmenes de Lord
Rayleigh " Teora del Sonido" en 1877 y 1878.

Habra que esperar hasta el perodo de 1900-1915 para que, como
seala Leo L Beranek, W.C. Sabine, en una serie de artculos, eleve la acstica
arquitectnica al grado de Ciencia. Es de destacar tambin, el enorme aporte
de los laboratorios BELL a la Acstica, Electroacstica y Psicoacstica durante
la primera mitad de este siglo.

W. Herschell observaba en el siglo pasado que, en general, el
fenmeno sonoro estaba acompaado de una serie de eventos:

La comunicacin de dicho movimiento al aire o a cualquier otro
intermediario interpuesto entre el cuerpo sonoro y el odo.
La propagacin de este movimiento, que pasa de una molcula a otra
del cuerpo intermediario en una sucesin adecuada.
La transmisin de dicho movimiento del medio ambiente al odo.
La transmisin que se produce desde el odo a los nervios auditivo
por determinado mecanismo.
La produccin de la sensacin.

7
Estos puntos determinan an hoy , los captulos bsicos de la acstica
moderna: Generacin, Irradiacin y Propagacin del sonido as como tambin
su interaccin con el ambiente mediante los fenmenos de Absorcin,
Reflexin o Difraccin del sonido, y por ltimo su Percepcin.
2.1.2.- reas de Trabajo en Acstica

Algunas de las reas de trabajo en acstica son:

Acstica Arquitectnica. Estudia la interaccin del sonido con las
construcciones. Participa en el diseo de: salas de conciertos,
auditorios, teatros, estudios de grabacin, iglesias, salas de reuniones,
salones de clases, etc.

Ingeniera Acstica. Estudia el diseo y utilizacin de transductores e
instrumentos de medicin de sonido. Incluye la instrumentacin para
diagnstico mdico, ssmico, grabacin y reproduccin de voz y msica.
Una rama de la Ingeniera Acstica es la Electroacstica la cual trata con
micrfonos y Altavoces.

Acstica Musical. Combina elementos de Arte y de Ciencia al incluir el
diseo de instrumentos, el uso de sistemas de grabaciones, la
modificacin electrnica de la msica con el estudio de su percepcin.
Su campo de trabajo est en la Industria de la grabacin de msica y
cine, y en la Industria de la construccin de instrumentos. A esta rea
pertenece el llamado Ingeniero de Sonido.

Control de Ruido y Vibraciones. Esta rea cobra cada vez mayor
importancia dado el aumento en el reconocimiento del ruido como un
factor de contaminacin que afecta seriamente la salud. Su campo de
trabajo est en las fbricas, en los organismos de control gubernamental
y en asesoras a los arquitectos. Tambin tiene un campo importante en

8
el mantenimiento preventivo de maquinarias mediante el anlisis de sus
vibraciones.

Bioacstica y Acstica mdica. Estudia la interaccin entre las ondas
sonoras y los cuerpos humanos y animales. Se ha desarrollado
enormemente el uso de ultrasonido como herramienta de diagnstico y
de tratamiento. Tambin es importante el campo de las ayudas auditivas
y de implantes para personas con defectos en la audicin.

Se ver a continuacin los fenmenos que ocurren en la Generacin,
Transmisin, Recepcin, Tratamiento acstico y Electrnico y Percepcin por el
sistema auditivo de las seales de audio con el fin de poder intervenir en su
incidencia en el entretenimiento, calidad de comunicacin, confort o en la salud
de las personas expuestas a sus excesos.

2.2.- Caractersticas de las Ondas Acsticas

El sonido se produce mediante un tipo de ondas longitudinales, esto es,
las molculas de un medio que vibran en la misma direccin de propagacin.

Figura 2.2 Propagacin del sonido en el aire.

9
2.2.1.- Ecuacin de Onda

Para caracterizar ondas acsticas basta con describir el desplazamiento
instantneo de las molculas o su velocidad. Para obtener la ecuacin que
define el comportamiento de las ondas acsticas tenemos que de acuerdo con
la conservacin del momento:

t
v
p grad
=
0
) (
(2.1)

donde:
p = Presin sonora.
v = Vector de velocidad de partcula.
t = Tiempo.
0
= Densidad esttica del gas.

y de acuerdo con la ley de conservacin de la masa:

t
v div
) (
0 (2.2)

donde r es la porcin dependiente del tiempo de la densidad del gas.

En estas ecuaciones se asume que los cambios en p y en r son
pequeos comparados con los valores estticos y que adems, la velocidad de
partcula v es mucho menor que la velocidad del sonido.
Si suponemos que el gas es ideal tendremos:

273 1
0 0
+
= =
p
p
(2.3)

10
donde:
= constante adiabtica ( 1.4 para el aire )
= Temperatura C.
= Variacin de temperatura.

Con las ecuaciones anteriores se puede eliminar el vector de velocidad
de partcula y la parte variable de la densidad r , lo cual resulta en la siguiente
ecuacin diferencial:

t
p
p c
2
2
2
=
(2.4)
donde:

0
0
2
p
c =
(2.5)
donde p
0
= Presin atmosfrica.

Esta es la "Ecuacin de Onda" que define la propagacin de las ondas
acsticas.

2.2.2.- Ondas Planas

En el caso en que se tengan frentes de ondas planos en una sola
direccin la ecuacin de onda se convierte en:

2
2
2
2
2
t
p
x
p
c
(2.6)

cuya solucin general es :

11

) ( ) ( ) , ( x ct G x ct F t x p + + =
(2.7)

donde c es la velocidad del sonido.

Si hacemos que F y G sean funciones exponenciales con argumentos
imaginarios tendremos:
) ( ) (
) , (
kx t i x ct ik
e p e p t x p

= =
(2.8)
donde:

c
k
=
(2.9)
w=2pf= frecuencia angular

Cuya parte real es:

) cos( ) , ( kx t p t x p =
(2.10)

Tomando en cuenta la ecuacin (2.1) tenemos que la velocidad de
partcula tiene, para las ondas planas, una sola componente paralela al eje x:

c
p
p
k
x
p
i
v v
x
0 0 0
1 1

= =
= =
(2.11)

donde:
c se define como la impedancia caracterstica del medio que, en el

caso del aire es igual a 414 Kgm
-2
s
-1
.

12

Figura 2.3 Ejemplo de ondas Planas

2.2.3.- Ondas Esfricas

En el caso de las ondas esfricas la ecuacin (2.4) se convierte en:

2
2
2
2
1 2
2 t
p
c r
p
r r
p
(2.12)

y, suponiendo seales armnicas, tenemos:

0
2
2
2
2
= +
p k
r
p
r r
p
(2.13)

Una solucin de esta ecuacin es:

r
e
C t r p
kr t i ) (
) , (
(2.14)

donde C es una constante.

13
Con la ecuacin (2.14) y la (2.1) tenemos que:

|
.
|
\
|
+ = =
ikr c
p
dr
dp
i c
v
r
1
1
1 1
0 0

(2.15)

donde se observa que si r es muy grande v
r
se iguala a v
x
, lo cual significa que,
para distancias grandes, los frentes de ondas esfricos se pueden aproximar
por frentes de ondas planos.

2.3.- Caractersticas del Sonido

2.3.1.- Velocidad

La Velocidad del sonido depende de la masa y la elasticidad del medio
de Propagacin.

En el aire se tiene que:
0
4 , 1 P
c =
(2.16)
donde :
c = velocidad del sonido
P
0
= Presin atmosfrica.
= Densidad del aire

A 22 C se tiene que

P
0
= 105 newtons/m2.
= 1,18 Kg/m3

14
por lo cual c = 344 m/s.

Asumiendo que el aire se comporta como un gas ideal tenemos que:

273
1 332
t
c + =
(2.17)
Donde t = temperatura en C.

Figura 2.4 Variacin de la velocidad del sonido con la temperatura

2.3.2.- Longitud de onda

Consiste en la distancia que separa a dos molculas que vibren en fase,
en un ciclo se cumple que:

f c/ =
(2.18)
donde:
c = Velocidad del sonido en m/s
f = frecuencia de la onda sonora en Hz
= longitud de onda en m

15

Figura 2.5 Variacin de la longitud de onda del sonido con la frecuencia.

En la Figura 2.5 se observa que, para el rango de audicin, las
longitudes de ondas del sonido van desde los 17.2 metros para 20 Hz hasta
1.72 cm para 20KHz, siendo este un parmetro fundamental a tomar en cuenta
en la Acstica Arquitectnica ya que el comportamiento de un dispositivo de
control acstico es dependiente de la longitud de onda del sonido.

Como la Velocidad del sonido es dependiente de la temperatura, es
importante que se tome en cuenta la incidencia de una variacin de esta en la
longitud de onda del sonido.

Figura 2.6 Variacin de la longitud de onda del sonido con la temperatura para una frecuencia de
100 Hz.

16
2.3.3.- Presin Acstica

Al aplicar una fuerza sinusoidal a las partculas de aire, stas se
comprimen y se expanden alternadamente, lo que se refleja en pequeas
variaciones de la presin atmosfrica lo cual se mide en unidades llamadas
Pascal ( 1 Pascal = 1 Newton/m
2
) .

Adems se tiene que 10
5
Pascal = 1 atmsfera. El mnimo sonido que se
puede percibir es de 2x10
-5
Pascal.

2.3.4.- Nivel de Presin sonora (SPL)

Es una medida que relaciona el valor RMS de la presin acstica con el
mnimo audible promedio.

0
log 20
P
P
SPL
rms
=
(2.19)
donde
Pascal P
5
0
10 * 2
=
(2.20)

17

Figura 2.7 Niveles de presin sonora.

2.3.5.- Intensidad Sonora

Es el valor medio de la energa que cruza una unidad de rea
perpendicular a la direccin de propagacin.

Figura 2.8 Definicin de la Intensidad Sonora.

18
Este valor depende del campo acstico donde se encuentre el sonido:

a) Para una onda acstica plana progresiva (plana o esfrica) se tiene que
la transferencia de energa ocurre en la direccin de propagacin luego:

c
p
I
2
=
(2.21)

b) En campo difuso cerca de las paredes se tiene que:
c
p
I
4
2
=
(2.22)

2.3.6.- Nivel de Intensidad Sonora (IL)

Es una medida relativa a una referencia:

0
log 10
I
I
IL =
(2.23)
donde la referencia es:
2
12
0
10
m
w
I
=
(2.24)
2.3.7.- Nivel de Potencia Acstica (PWL)

Consiste en una medida relativa a un valor de referencia de potencia y
se define como:

0
log 10
W
W
PWL =
(2.25)
donde

watios W
12
0
10
=
(2.26)

19
y W es la potencia irradiada por la fuente

Figura 2.9 Niveles tpicos de potencia acstica.

Recordando que W es la potencia total generada mientras que I es la
porcin que fluye por una unidad de rea se tiene que, para una fuente puntual
que irradia ondas esfricas:
2
4 r
W
I
=
(2.27)
donde r = distancia de medicin.

Adems se tiene que como:
c
p r
I r W
2 2
2
4
4 = =
(2.28)
Se cumple que:
(
=
c W
p r
PWL
0
2 2
4
log 10
(2.29)

20
por lo cual:

(
+
(
=
c W
P r
P
p
PWL
0
2
0
2
2
0
2
4
log 10 log 10
(2.30)

dB r SPL PWL 11 ) log( 20 + + =
(2.31)

dB r PWL SPL 11 ) log( 20 =
(2.32)

Donde se deduce que, en campo libre, cada vez que se dobla la
distancia el nivel de presin sonora disminuye 6 dB.

2.4.Micrfonos

Los micrfonos son los transductores encargados de transformar
energa acstica en energa elctrica, permitiendo por lo tanto el registro,
almacenamiento, transmisin y procesamiento electrnico de las seales de
audio. Son dispositivos ligados intrnsecamente a los altoparlantes (altavoces y
auriculares), constituyendo ambos transductores los elementos mas
significativos en cuanto a las caractersticas sonoras que aportan a las seales
de audio.

21

Figura 2.10 Familia de micrfonos

No existe el micrfono ideal, debido a la razn de que no se tiene un
solo ambiente acstico o un solo tipo de msica. Es por ello que, el ingeniero
de sonido tiene a su disposicin una amplia gama de micrfonos, cada uno de
los cuales sirve para ciertos casos particulares.

2.4.1.- Transductores bsicos

Los Micrfonos se pueden clasificar de acuerdo con la forma de
transduccin, en otras palabras, dependiendo de la forma como se transforma
la seal acstica en elctrica.

2.4.1.1.- Micrfonos de Carbn

Fueron los micrfonos utilizados durante mucho tiempo en los telfonos,
su principio de funcionamiento se basa en el cambio de resistencia en los
granos de carbn al ser comprimidos por el diafragma al recibir este las
variaciones de presin sonora.

22

Figura 2.11 Micrfono de carbn

Figura 2.12 Respuesta del Micrfono de carbn

De la curva del micrfono de carbn se deducen sus pobres
caractersticas frecuenciales que han hecho posible su casi desaparicin del
mercado (excepto en telfonos econmicos).

2.4.1.2.- Micrfonos Piezoelctricos

Estos micrfonos se basan en la capacidad que tienen los cristales
piezoelctricos de generar cargas elctricas al ser sometidos a presin (En
griego piezein = presin).

23

Figura 2.13. Micrfono piezoelctrico

Figura 2.14 Respuesta de frecuencia de un Micrfono piezoelctrico

Aunque su respuesta es mejor que el micrfono de carbn, no llega a
ser suficientemente bueno para grabaciones profesionales, por lo que se utiliza
slo en micrfonos pequeos para voz.

2.4.1.3.- Micrfonos Dinmicos (Bobina mvil)

Se basan en el principio de induccin electromagntica ( son la versin
dual de los Parlantes de bobina mvil), segn el cual si un hilo conductor se
mueve dentro de un campo magntico, en el conductor se inducir un voltaje
de acuerdo con:
Blv e =
(2.33)

24
donde:
e = potencial inducido, en voltios.
B = Densidad de flujo magntico, en teslas.
l = longitud del conductor, en metros.
v = velocidad del movimiento, en metros/s.

Son micrfonos muy utilizados por su resistencia, confiabilidad y buena
respuesta en frecuencia.

Figura 2.15 Esquema de un Micrfono dinmico

Figura 2.16 Micrfono Dinmico

2.4.1.4.- Micrfono de Cinta

Este tipo de micrfono tambin trabaja bajo el principio de induccin
magntica y responde a la diferencia de presin sonora entre los dos lados de

25
la cinta y por eso recibe tambin el nombre de micrfono de gradiente de
presin o de velocidad o bidireccional.

Figura 2.17 Micrfono de Cinta (Ribbon).

Debido a que responde a la diferencia de presin, este micrfono tiene
una respuesta polar con un mximo en el eje perpendicular a la lmina,
mientras que no responde a los sonidos laterales.

Figura 2.18 Respuesta frontal de un micrfono de Cinta

26

Figura 2.19 Respuesta lateral de un micrfono de Cinta

La respuesta polar es bidireccional y est indicada en la figura 2.22.

2.4.1.5.- Micrfono Capacitor (Condensador)

Recordemos que un Condensador almacena carga cuando se le
suministra un potencial elctrico. La ecuacin que describe el fenmeno es:

CV Q=
(2.34)

donde:
Q = carga, en coulombs.
C = capacitancia, en faradios.
V = potencial, en voltios.

En un micrfono capacitivo la placa posterior est fija, mientras que la
otra (el diafragma) se desplaza al recibir variaciones de presin, ya que el
interior del micrfono est a un presin constante igual a la presin
atmosfrica.

La variacin de la capacitancia, al cambiar la distancia entre las placas,
producir una variacin de voltaje:

27

C C
Q
V V
+
= +
(2.35)

Este tipo de micrfono produce la mejor respuesta de frecuencia por lo
cual son los mas utilizados en grabaciones profesionales. Debido a que
responde a variaciones de presin se clasifican en los micrfonos de presin, y
como consecuencia de ello tienen una respuesta onmidireccional.

Figura 2.20 Micrfono Capacitivo.

2.4.1.6.- Micrfono Elctret

Un material Electret tiene como caracterstica su capacidad de mantener
carga sin necesidad de una fuente de polarizacin, por lo cual tiene cada vez
mayor popularidad por razones econmicas.

Figura 2.21 Micrfono Electret

28
2.4.2.- Direccionabilidad. Patrones bsicos de los micrfonos

Una de las caractersticas mas importante de los micrfonos es su
direccionalidad ya que, de acuerdo con cada tipo ambiente acstico o del
programa a grabar, se requerir un patrn polar distinto.

Existen tres tipos bsicos de patrones: unidireccional, bidireccional y
omnidireccional, aunque se pueden conseguir otros patrones combinando los
tipos bsicos.

La ecuacin polar, en su forma general es:
cos B A+ =
(2.36)
donde A+B=1

Los valores particulares de A y B definirn el tipo de respuesta. Por lo
cual tenemos que:

Figura 2.22 Patrn Omnidireccional. =1

29

Figura 2.23 Patrn bidireccional =cos(q)

Figura 2.24 Patrn Cardioide =0.5+0.5cos(q)

Figura 2.25 Patrn Super Cardioide =0.375+0.625cos(q)

30

Figura 2.26 Patrn Hiper Cardioide =0.25+0.75cos(q).
Las caractersticas fundamentales de los diversos patrones se resumen
en la Figura 2.27.

Figura 2.27 Sumario de micrfonos de primer orden

En la Figura 2.27 se define REE (" Random Energy Efficiency") como la
cantidad de ruido ambiente que capta el micrfono en relacin a lo que captara
un micrfono omnidireccional a la misma distancia y con la misma sensibilidad
(se indica en dB). El Factor de Distancia DF se refiere a cuanto se debe alejar

31
un micrfono para que capte la misma relacin de sonido directo respecto a
ruido ambiente teniendo como referencia a un micrfono omnidireccional
colocado a un metro de la fuente.

2.4.3.- Micrfonos de Configuracin variable

Existen configuraciones de micrfonos que combinan elementos de
gradiente y de presin, de manera de poder elegir la respuesta polar
cambiando el grado de participacin de cada elemento. Un ejemplo de ello lo
constituye el sistema Brunmhl-Weber.

En la Figura 2.28 se tiene la operacin del micrfono como elemento de
captacin de presin sonora.

Figura 2.28 Sistema Brunmhl-Weber en modo presin

Se puede destacar en la Figura 2.28 que cualquier diferencia de presin
a cada lado del micrfono no producir voltaje de salida ya que se
compensara. (Una de las placas producira una corriente en un sentido sobre
la resistencia mientras que la otra lo hara en sentido contrario).

32
La configuracin de Gradiente de presin o velocidad, se consigue
cambiando la polaridad de una de las fuentes, tal como se puede observar en
la Figura 2.29.

Figura 2.29 Sistema Brunmhl-Weber en modo gradiente de presin
En la configuracin de gradiente de presin se tiene que, si las lminas
se acercan o se alejan al mismo tiempo, no se producir ninguna variacin de
corriente en la resistencia.

Por ltimo se tiene que si se configura la fuente como en la Figura 2.30
se tendr un dispositivo con patrn polar variable cambiando solamente el
interruptor para elegir cuanto de captacin de presin y cuanto de gradiente se
desea en la respuesta total (Figura 2.31).

33

Figura 2.30 Sistema Brunmhl-Weber.

Figura 2.31 Sistema Brunmhl-Weber. Patrones resultantes.

34

3.- Ciencias bsicas del Sonido 3D

Las ciencias bsicas en las que se basa el sonido 3-D estn
representadas en la literatura como tres disciplinas claramente separadas:
Fsica Acstica, Psicoacstica y Neurofisiologa. La Fsica Acstica se enfoca
en las ondas sonoras que reciben los odos del oyente y el fenmeno acstico
que determina sus propiedades especficas. La Psicoacstica estudia las
relaciones ente las ondas acsticas y los odos y la percepcin de una imagen
espacial representada por el oyente y la Neurofisiologa est relacionada con la
comprensin de las estructuras neurolgicas que nos permiten alcanzar la
experiencia del sonido.

La consideracin del sonido 3-D desde la perspectiva de cada una de las
3 disciplinas la resolveremos vindolas por separado. El conocimiento
conseguido por cada una de ellas por separado es insuficiente para
comprender muchos de los fenmenos que suceden en nuestra vida diaria, y la
tecnologa 3-D del sonido continuar desarrollndose hasta alcanzar este
conocimiento. El numero de profesionales que se necesitan aumenta a medida
que aparecen ms fuentes de informacin en esta ciencia multidisciplinar.

35
3.1.- Perspectiva Fsico Acstica

Cuando un evento acstico sucede en el un ambiente natural, las ondas
sonoras se propagan en todas direcciones. Las ondas encuentran obstculos
en el entorno con los cuales interactan y provocan reflexin o difraccin. La
interferencia constructiva o destructiva de todas ellas crea una textura sonora
enriquecida con las mltiples nuevas fuentes de sonido.

Figura 3.1 Descripcin de un evento sonoro en un entorno determinado. Hay un trazado de ondas
directas (lnea gruesa) entre fuente y destino , y multitud de trazados indirectos ( lneas finas)

Uno de los objetos potenciales que podemos encontrar en el entorno es
el propio oyente. Desde la posicin del oyente, las ondas sonoras estn
llegando desde diferentes direcciones. Como se muestra en la Figura 3.1, hay
tpicamente una lnea recta a lo largo de la cual las ondas iniciales del sonido
llegan antes al oyente. Este sonido inicial proporciona una informacin
comprometida sobre la direccin del evento sonoro. Despus las ondas
sonoras son reflejadas en los objetos del entorno con lo cual nos llegan ondas
sonoras desde muchas otras direcciones del espacio y con distintos retardos.
Estos sonidos indirectos proveen al oyente de informacin sobre la posicin
relativa de evento de sonido y del entorno y en especial de la distancia desde el
oyente a la fuente de sonido. Cuanta mayor sea la persistencia del sonido ms
percepcin de las cualidades del mismo tendr el oyente. Si las ondas sonoras

36
directas e indirectas son simultneas, ser prcticamente imposible
distinguirlas.

Cuando una onda sonora encuentra al oyente hay dos fenmenos acsticos
resultantes dependiendo de la frecuencia.

Alta frecuencia. La energa se refleja especularmente hacia fuera
Baja frecuencia. La energa se difracta y se curva alrededor del oyente.

En medio de ambos extremos hay una banda de transicin centrada
alrededor de 1500 Hz, en cuyas frecuencias la longitud de onda es
aproximadamente igual al dimetro de la cabeza. El fenmeno acstico podra
ser similar al de las olas en el ocano golpeando las rocas de un embarcadero:
las pequeas olas rebotan mientras que las grandes curvan alrededor y luego
pasan por encima.

Las ondas sonoras que llegan a ambos odos del oyente son afectadas por
la interaccin de la onda del sonido original y el torso, cabeza, orejas y
conducto auditivo del oyente. La mezcla de estas propiedades podra ser
medida de un modo ms o menos exacto por medio de una Funcin de
Transferencia Relacionada con la cabeza ( Head-Related Transfer Function),
en adelante HRTF que son sus siglas en ingls. La complejidad de la
interaccin de las ondas sonoras con la acstica del cuerpo del oyente
conforma la HRTF que en cada odo depende fuertemente de la direccin del
sonido.

Cuando un sonido es equidistante de los dos odos, el sonido llega
exactamente al mismo tiempo y desde la misma direccin, con lo que las
HRTFs son muy parecidas (pero no idnticas debido a las asimetras de la
cabeza). La regin en la cual las fuentes de sonido son equidistantes es
denominada plano medio (la similitud de la informacin acstica es, a veces,
obtenida de la razn por la cual la precisin de la localizacin es pobre en el

37
plano medio). Hay otros dos nombres por los cuales nos referimos a los planos
en el espacio 3-D. Uno es el plano horizontal que divide la cabeza del oyente
horizontalmente, y el otro es el plano frontal (o lateral) que divide la cabeza
verticalmente de atrs hacia adelante. Ambos planos estn ilustrados en la
Figura 3.2.

Figura 3.2 Relacin entre los planos mediano, horizontal y frontal(lateral) de la cabeza del oyente.

Cuando la fuente no es equidistante de ambos odos, las seales llegan
a cada oreja desde diferente direccin y las HRTFs estn lejos de ser idnticas.
La oreja ms cercana a la fuente de sonido es llamada oreja ipsilateral y la ms
lejana oreja colateral. La posicin de la fuente de sonido relativa al centro de la
cabeza del oyente es conveniente considerarla como un vector expresado en
trminos de dos ngulos, Azimuth y elevacin, y un escalar que es la distancia
como se puede apreciar en la Figura 3.3.

Figura 3.3 Especificacin de la posicin de un evento de sonido en trminos de azimuth, alevacin y
distancia

Azimuth es la medida del ngulo entre la proyeccin del vector en el
plano horizontal y el vector extendido directamente desde el oyente hacia el

38
frente. Un movimiento progresivo desde 0 hasta 360 llevara a la fuente a dar
una vuelta completa alrededor de la cabeza del oyente, aunque no suele haber
consenso respecto a si 90 de azimuth representan la derecha o izquierda del
oyente. A lo largo del proyecto se describen como ngulos positivos aquellos
que partiendo del frente del oyente se despliegan hacia la derecha y negativos
los que lo hacen hacia la izquierda. La elevacin es la medida del ngulo
formado entre el vector y el plano horizontal, estando el rango comprendido
entre los 90 (arriba) y los 90 (abajo).

39
3.2.- Perspectiva Psicoacstica

El sentido de la direccin de un sonido para un oyente est dominado
principalmente por el sonido que le llega por el camino ms corto, rpido y
directo (de otro modo el juicio de la direccionalidad del evento podra ser
ambiguo debido al sonido indirecto). Esta preferencia proporciona al sonido
inicial lo que se denomina efecto precedente (Wallach an 1949) o la ley del
primer frente de onda (Blauert 1971). A veces estas ondas de sonido iniciales
son transformadas radicalmente en comparacin con las del sonido original. El
sonido que llega a cada odo es modificado espectralmente por las HRTF,
cada oreja realiza una transformacin diferente, y las transformaciones
cambian cuando la cabeza y/o el sonido se mueven. El sistema auditivo
desempea las tareas para la integracin de la informacin que llega a los dos
odos en una nica imagen perceptual para fundir el evento acstico en el
espacio: el sistema auditivo extrae la informacin direccional y reconstruye una
estimacin del espectro de la fuente origen. Estas observaciones, sin embargo,
no bastan para proporcionar suficiente explicacin para la localizacin humana
del sonido.

El sonido que llega a la oreja ipsilateral es generalmente ms intenso
que el que llega a la oreja contralateral, esta diferencia entre la intensidad de
ambos odos es denominada Diferencia de Intensidad Interaural (Interaural
Intensity Difference) y la diferencia de tiempo entre ambos odos es la
Diferencia de Tiempo Interaural (Interaural Time Difference), en adelante IID
y ITD de sus siglas en ingls. IID y ITD slo afectan para la lateralizacin de la
fuente de sonido, que es la posicin percibida a lo largo del eje interaural, el eje
derecha/izquierda entre las orejas. Con solo ITD y IID, una persona no puede
juzgar la procedencia de un evento acstico respecto a su posicin de delante,
atrs, arriba o abajo. Esta ambigedad de localizacin en unos grados de

40
lateralizacin es llamada cono de confusin(Woodworh 1954) descrita en la
Figura 3.4.

Figura 3.4 El cono de confusin (basado en Woodworth 1954, adaptado por Kendall en 1990)

En la actualidad es comn aceptar que asemeja una localizacin
espacial incierta en forma de cono, la cual dejara de ser ambigua mediante la
complejidad aadida de las HRTFs. El experimento psicoacstico clsico
soporta la teora dplex de localizacin, sin utilizar la dependencia frecuencial
de la diferencia de magnitud y fase interaural tpica de las HRTFs. Por tanto la
teora dplex ignora la influencia de las pistas alternativas temporales por
encima de los 1500 Hz. Los eventos acsticos en entornos naturales tambin
presentan perturbaciones que ayudan a comprender fenmenos temporales.
Los estmulos psicoacsticos clsicos se encuentran reducidos, y los
resultados son slo parcialmente tiles para la comprensin de la localizacin
en situaciones de escucha diarias.

Experimentos psicoacsticos actuales han cambiado su atencin a la
escucha binaural y el papel de las HRTFs en la localizacin espacial del
sonido. Dentro de un contexto, binaural significa la informacin combinada de
ambos odos (en contraposicin con monoaural que significa que slo usa la
informacin de cada odo independientemente). El uso de la palabra binaural
tambin implica la dependencia con la frecuencia que existe en las pistas
interaurales tpicas de las HRTFs. Este cambio en el enfoque de la

41
investigacin est acompaado por un cambio hacia el uso de estmulos de
banda ancha en vez de ondas sinusoidales.

An cuando las HRTFs son muchas veces muy ricas en detalles
acsticos, las investigaciones perceptuales sugieren que el sistema auditivo
sea selectivo en la informacin acstica que recibe para realizar el juicio de la
direccin del sonido. Las pruebas revelan que la informacin de fase
monoaural es irrelevante para la percepcin espacial y que la informacin de
fase interaural es extremadamente importante. Wightman y Kistler (1992) han
demostrado que a baja frecuencia la ITD es la pista fundamental para la
localizacin del origen de sonidos que contengan energa por debajo de 2.5
kHz. Para sonidos que carecen de esta baja frecuencia, IID proporciona ms
informacin para la localizacin.

An no est claro cmo de significativa es la influencia de las altas
frecuencias en las diferencias temporales, desde que los experimentos han
mostrado que las envolventes temporales de sonidos de alta frecuencia son
detectados bastante bien (Henning 1974). A pesar de que la mayora de los
focos de investigacin se basan en las pistas binaurales, se est investigando
el espectro de las pistas monoaurales que aportan informacin significativa
para las fuentes de sonido laterales (Musicant as Butler 1985). Hay tambin
evidencias de que la elevacin en particular est influenciada por el contenido
espectral de la fuente de sonido en s misma (que es recibida por ambos
odos), con lo que sonidos que tienen altos pitch/bright son tpicamente
localizados mejor que aquellos sonidos que poseen bajos pitch/dark.

Hay diferencias importantes entre las dimensiones verticales y
horizontales en la resolucin con la cual las personas pueden resolver la
localizacin espacial de una fuente de sonido, ste es un efecto que Blauert
denomina Localization Blur (Blauer 1974). La mayor resolucin la
encontramos en el plano horizontal, especialmente en frente del oyente donde

42
existe un ngulo mnimo de audibilidad de 2 grados o menos dependiendo de
la naturaleza exacta del experimento. Este ngulo incrementa a cerca de los
10 grados en los lados y decrece a cerca de los 6 grados en la nuca. Por
comparacin, la resolucin en el plano vertical es un poco menor. El ngulo
mnimo vertical audible en frente del oyente est cerca de los 9 grados y
incrementa firmemente hasta encima de la cabeza donde alcanza los 22
grados. La precisin espacial no es tan importante aparentemente en la
percepcin auditiva como lo es en el sistema visual.

Figura 3.5 Movimiento dinmico de la cabeza hacia la derecha provoca la eliminacin de la
ambigedad en el oyente para la posicin delante/detrs

Mientras las discriminacin delante/detrs es posible mediante las bases
de una completa informacin acstica implementada en las HRTFs, est claro
tambin, que el movimiento de la cabeza tiene un papel fundamental para
resolver las confusiones delante/detrs (Wallach 1940). Esto tiene una
importancia particular para fuentes de sonido situadas cerca del plano medio
donde otras informaciones acsticas pueden provocar pequeas interferencias
interaurales. La Figura 3.5 nos muestra cmo se elimina la ambigedad
provocada por un sonido situado el la parte delantera del oyente. Esta
ambigedad se elimina mediante un giro de la cabeza hacia la derecha que
provoca en el primer caso que el odo izquierdo reciba la seal antes y con
mayor intensidad que el derecho. Para un sonido situado en la parte trasera
del oyente (segunda figura) pasa lo contrario. Los experimentos clsicos de

43
Wallach muestran que las pistan interaurales dinmicas podran sustituir a las
HRTFs.

3.3.- Perspectiva Neurofisiolgica

Aunque la neurofisiologa no es parte de la base educacional de la
mayora de los campos de la msica y profesionales del audio, es un rea de
dnde continan viniendo muchas de las ms importantes ideas y
descubrimientos sobre la audicin. Esto es especialmente cierto en el rea de
la escucha direccional. Estas terminologas y perspectivas son bastante
distintas desde el punto de vista de la Fsica Acstica y la Psicoacstica.

El propsito de esta seccin es familiarizar al lector con este importante
contexto de la comprensin de la escucha direccional y en particular, en el
punto de la adaptacin especial en el sistema auditivo de la localizacin del
sonido. Aunque la terminologa es introducida delicadamente, es
indudablemente til que el lector tenga alguna familiaridad bsica en el campo,
especialmente en el de la fisiologa del sistema auditivo.

3.3.1.- Sistema perifrico

Mientras que el pabelln auditivo est claramente adaptado para la
escucha direccional, el sistema neurolgico perifrico tiene poca o ninguna
especializacin para ello. El sistema neurolgico perifrico transforma las
seales acsticas provenientes de la oreja en una actividad neural que parece
claramente diseada para capturar la descomposicin espectrotemporal de las
ondas acsticas entrantes. La funcin principal de la descomposicin debe ser
la identificacin de la fuente de sonido. Esto condiciona firmemente la
estructura de los mecanismos neurales y pone por debajo la localizacin,

44
puesto que, desde el punto de vista del sistema neurolgico perifrico, la fuente
de informacin se mezcla con la informacin espacial.

3.3.2.- Fisiologa del Sistema Auditivo

Se va a examinar la estructura y funcionamiento del odo, con el fin de
lograr una mejor comprensin de los fenmenos y modelos Neurofisiolgicos y
Psicoacsticos. Se estudia la anatoma y la fisiologa del aparato auditivo,
haciendo nfasis en aquellas partes y estructuras del mismo ms importantes
para el desarrollo de modelos perceptuales.

3.3.2.1.- El sentido de la audicin y el sistema auditivo

La generacin de sensaciones auditivas en el ser humano es un proceso
extraordinariamente complejo, el cual se desarrolla en tres etapas bsicas:

1. Captacin y procesamiento mecnico de las ondas sonoras.
2. Conversin de la seal acstica (mecnica) en impulsos nerviosos, y
transmisin de dichos impulsos hasta los centros sensoriales del
cerebro.
3. Procesamiento neural de la informacin codificada en forma de impulsos
nerviosos.

La captacin, procesamiento y transduccin de los estmulos sonoros se
llevan a cabo en el odo propiamente dicho, mientras que la etapa de
procesamiento neural, en la cual se producen las diversas sensaciones
auditivas, se encuentra ubicada en el cerebro. As pues, se pueden distinguir
dos regiones o partes del sistema auditivo: la regin perifrica, en la cual los
estmulos sonoros conservan su carcter original de ondas mecnicas hasta el

45
momento de su conversin en seales electroqumicas y la regin central, en la
cual se transforman dichas seales en sensaciones.

En la regin central tambin intervienen procesos cognitivos, mediante
los cuales se asigna un contexto y un significado a los sonidos, es decir,
permiten reconocer una palabra o determinar que un sonido dado corresponde
a un violn o a un piano.

Se analizarn y estudiarn solamente los aspectos perceptuales del
sistema auditivo, esto es, aquellos que son independientes del contexto y del
significado y que, en buena parte, se localizan en la regin perifrica.

3.3.2.2.- Regin perifrica del sistema auditivo

El odo o regin perifrica se divide usualmente en tres zonas, llamadas
odo externo, odo medio y odo interno, de acuerdo a su ubicacin en el
crneo, como puede verse en la Figura 3.6.

Figura 3.6 Anatoma del odo humano.

46
Los estmulos sonoros se propagan a travs de estas zonas, sufriendo
diversas transformaciones hasta su conversin final en impulsos nerviosos.
Tanto el procesamiento mecnico de las ondas sonoras como la conversin de
stas en seales electroqumicas son procesos no lineales, lo cual dificulta la
caracterizacin y modelado de los fenmenos perceptuales.
En las siguientes secciones se estudia la anatoma y funcionamiento de
estas tres zonas del odo, as como la propagacin y procesamiento del sonido
a travs de las mismas.

3.3.2.3.- Odo externo

Anatoma y funcionamiento

El odo externo est formado por el pabelln auricular u oreja, el cual
dirige las ondas sonoras hacia el conducto auditivo externo a travs del
orificio auditivo. El otro extremo del conducto auditivo se encuentra
cubierto por la membrana timpnica o tmpano, la cual constituye la
entrada al odo medio. La funcin del odo externo es la de recolectar las
ondas sonoras y encauzarlas hacia el odo medio. Asimismo, el
conducto auditivo tiene dos propsitos adicionales: proteger las
delicadas estructuras del odo medio contra daos y minimizar la
distancia del odo interno al cerebro, reduciendo el tiempo de
propagacin de los impulsos nerviosos.

Respuesta en frecuencia y localizacin de las fuentes de sonido

El conducto auditivo es un "tubo" de unos 2 cm de longitud, el cual
influye en la respuesta en frecuencia del sistema auditivo. Dada la
velocidad de propagacin del sonido en el aire (aprox. 334 m/s), dicha
longitud corresponde a 1/4 de la longitud de onda de una seal sonora
de unos 4 kHz. Este es uno de los motivos por los cuales el aparato

47
auditivo presenta una mayor sensibilidad a las frecuencias cercanas a
los 4 kHz, como se ver ms adelante.

Adicionalmente el pabelln auricular, junto con la cabeza y los hombros,
contribuye a modificar el espectro de la seal sonora. Las seales
sonoras que entran al conducto auditivo externo sufren efectos de
difraccin debidos a la forma del pabelln auricular y la cabeza, y estos
efectos varan segn la direccin de incidencia y el contenido espectral
de la seal, de este modo se altera el espectro sonoro debido a la
difraccin. Estas alteraciones, en forma de "picos" y "valles" en el
espectro, son usadas por el sistema auditivo para determinar la
procedencia del sonido en el llamado "plano medio" (plano imaginario
perpendicular a la recta que une ambos tmpanos).

3.3.2.4.- Odo medio

Anatoma

El odo medio (Figura 3.7) est constituido por una cavidad llena de aire,
dentro de la cual se encuentran tres huesecillos, denominados martillo,
yunque y estribo, unidos entre s en forma articulada. Uno de los
extremos del martillo se encuentra adherido al tmpano, mientras que la
base del estribo est unida mediante un anillo flexible a las paredes de la
ventana oval, orificio que constituye la va de entrada del sonido al odo
interno.

Finalmente, la cavidad del odo medio se comunica con el exterior del
cuerpo a travs de la trompa de Eustaquio, la cual es un conducto que
llega hasta las vas respiratorias y que permite igualar la presin del aire
a ambos lados del tmpano.

48
Propagacin del sonido y acople de impedancias

Los sonidos, formados por oscilaciones de las molculas del aire, son
conducidos a travs del conducto auditivo hasta el tmpano. Los cambios
de presin en la pared externa de la membrana timpnica, asociados a
la seal sonora, hacen que dicha membrana vibre siguiendo las
oscilaciones de dicha seal.

Las vibraciones del tmpano se transmiten a lo largo de la cadena de
huesecillos, la cual opera como un sistema de palancas, de forma tal
que la base del estribo vibra en la ventana oval. Este huesecillo se
encuentra en contacto con uno de los fluidos contenidos en el odo
interno; por lo tanto, el tmpano y la cadena de huesecillos actan como
un mecanismo para transformar las vibraciones del aire en vibraciones
del fluido.

Figura 3.7 Propagacin del sonido a travs del odo medio e interno.

Ahora bien, para lograr que la transferencia de potencia del aire al fluido
sea mxima, debe efectuarse un acoplamiento entre la impedancia
mecnica caracterstica del aire y la del fluido, puesto que esta ltima es
mucho mayor que la primera.

49
Un equivalente mecnico de un transformador (el acoplador de
impedancias elctricas) es precisamente, una palanca; por ende, la
cadena de huesecillos acta como acoplador de impedancias. Adems,
la relacin entre las superficies del tmpano y de la base del estribo (en
la ventana oval) introduce un efecto de acoplamiento adicional,
logrndose una transformacin de impedancias del orden de 1:20, con lo
cual se minimizan las prdidas por reflexin.

El mximo acoplamiento se obtiene en el rango de frecuencias medias,
en torno a 1 kHz. En la Figura 3.8 se representa en forma esquemtica
la transmisin del sonido del odo externo al interno, a travs del odo
medio.

Figura 3.8 Esquema de la propagacin del sonido a travs del odo medio.

Reflejo timpnico o acstico

Cuando se aplican sonidos de gran intensidad (> 90 dB SPL) al tmpano,
los msculos tensores del tmpano y el estribo se contraen de forma
automtica, modificando la caracterstica de transferencia del odo medio
y disminuyendo la cantidad de energa entregada al odo interno.

Este "control de ganancia" se denomina reflejo timpnico o auditivo y
tiene como propsito proteger a las clulas receptoras del odo interno

50
frente a sobrecargas que puedan llegar a destruirlas. Este reflejo no es
instantneo, sino que tarda de 40 a 160 ms en producirse.

El reflejo timpnico debe ser tomado en cuenta en cualquier modelo
matemtico del procesamiento del sonido en el aparato auditivo, siempre
que se trabaje con sonidos de gran intensidad, puesto que es un
mecanismo no lineal que introduce un trmino cuadrtico en la relacin
entrada-salida del odo medio.

Respuesta en frecuencia combinada del odo externo y el odo medio
El conjunto formado por el odo externo y el odo medio forman un
sistema cuya respuesta en frecuencia es del tipo paso de baja, como se
muestra en la Figura 3.9. En el intervalo cercano a los 4 kHz se observa
un pequeo efecto de ganancia, debido a las caractersticas del
conducto auditivo.

Esta respuesta slo es vlida cuando el sistema se comporta de modo
lineal, es decir, cuando la intensidad del sonido no es muy elevada, para
evitar que acte el reflejo timpnico.

Figura 3.9 Respuesta en frecuencia combinada del odo externo y el odo medio

51
3.3.2.5.- Odo interno

El odo interno representa el final de la cadena de procesamiento mecnico
del sonido, y en l se llevan a cabo tres funciones primordiales: filtraje de la
seal sonora, transduccin y generacin probabilstica de impulsos nerviosos.

Anatoma
En el odo interno se encuentra la cclea o caracol, la cual es un
conducto rgido en forma de espiral de unos 35 mm de longitud, lleno
con dos fluidos de distinta composicin.

El interior del conducto est dividido en sentido longitudinal por la
membrana basilar y la membrana de Reissner, las cuales forman tres
compartimientos o escalas que pueden observarse en la Figura 3.10. La
escala vestibular y la escala timpnica contienen un mismo fluido
(perilinfa), puesto que se interconectan por una pequea abertura
situada en el vrtice del caracol, llamada helicotrema. Por el contrario, la
escala media se encuentra aislada de las otras dos escalas, y contiene
un lquido de distinta composicin a la perilinfa (endolinfa).

La base del estribo, a travs de la ventana oval, est en contacto con el
fluido de la escala vestibular, mientras que la escala timpnica
desemboca en la cavidad del odo medio a travs de otra abertura
(ventana redonda) sellada por una membrana flexible (membrana
timpnica secundaria).

En la Figura 3.11 podemos observar que sobre la membrana basilar y en
el interior de la escala media se encuentra el rgano de Corti, el cual se
extiende desde el vrtice hasta la base de la cclea y contiene las
clulas ciliares que actan como transductores de seales sonoras a
impulsos nerviosos. Sobre las clulas ciliares se ubica la membrana

52
tectorial, dentro de la cual se alojan las prolongaciones o cilios de las
clulas ciliares externas.

Dependiendo de su ubicacin en el rgano de Corti, se pueden distinguir
dos tipos de clulas ciliares: internas y externas. Existen alrededor de
3500 clulas ciliares internas y unas 20000 clulas externas. Ambos
tipos de clulas presentan conexiones o sinapsis con las fibras nerviosas
aferentes (que transportan impulsos hacia el cerebro) y eferentes (que
transportan impulsos provenientes del cerebro), las cuales conforman el
nervio auditivo.

Sin embargo, la distribucin de las fibras es muy desigual: ms del 90%
de las fibras aferentes inervan a las clulas ciliares internas, mientras
que la mayora de las 500 fibras eferentes inervan a las clulas ciliares
externas. El propsito de ambos tipos de clulas y de la distribucin de
las conexiones nerviosas se estudia ms adelante.

Figura 3.10 Corte transversal de la cclea o caracol.

53

Figura 3.11 rgano de Corti.

Propagacin del sonido en la cclea

Las oscilaciones del estribo provocan oscilaciones en el fluido de la
escala vestibular (perilinfa). La membrana de Reissner, la cual separa
los fluidos de la escala vestibular y la escala media, es sumamente
delgada y, en consecuencia, los lquidos en ambas escalas pueden
tratarse como uno solo desde el punto de vista de la dinmica de los
fluidos. As, las oscilaciones en la perilinfa de la escala vestibular se
transmiten a la endolinfa y de sta a la membrana basilar, la membrana
basilar, a su vez, provoca oscilaciones en el fluido de la escala
timpnica.

Puesto que tanto los fluidos como las paredes de la cclea son
incompresibles, es preciso compensar el desplazamiento de los fluidos;
esto se lleva a cabo en la membrana de la ventana redonda, la cual
permite "cerrar el circuito hidrulico".

54

Figura 3.12 Corte transversal de un conducto de la cclea.

La propagacin de las oscilaciones del fluido en la escala vestibular a la
timpnica no slo se lleva a cabo a travs de la membrana basilar; para
sonidos de muy baja frecuencia, las vibraciones se transmiten a travs
de la abertura situada en el vrtice de la cclea (helicotrema).

En conclusin, el sonido propagado a travs del odo externo y medio
llega hasta la cclea, donde las oscilaciones en los fluidos hacen vibrar a
la membrana basilar y a todas las estructuras que sta soporta.

3.3.2.6.- La cclea como analizador en frecuencia

La membrana basilar es una estructura cuyo espesor y rigidez no es
constante: cerca de la ventana oval, la membrana es gruesa y rgida, pero a
medida que se acerca hacia el vrtice de la cclea se vuelve ms delgada y
flexible.

La rigidez decae casi exponencialmente con la distancia a la ventana
oval, esta variacin de la rigidez en funcin de la posicin afecta la velocidad
de propagacin de las ondas sonoras a lo largo de ella, y es responsable en

55
gran medida de un fenmeno muy importante: la selectividad en frecuencia del
odo interno.

Ondas viajeras y transformacin de frecuencia a posicin

Las ondas de presin generadas en la perilinfa a travs de la ventana
oval tienden a desplazarse a lo largo de la escala vestibular. Debido a
que el fluido es incompresible la membrana basilar se deforma, y la
ubicacin y amplitud de dicha deformacin vara en el tiempo a medida
que la onda de presin avanza a lo largo de la cclea.

Para comprender el modo de propagacin de las ondas de presin,
supngase que se excita el sistema auditivo con una seal sinusoidal de
una frecuencia dada:

La membrana basilar vibrar sinusoidalmente, pero la amplitud de
la vibracin ir en aumento a medida que se aleja de la ventana
oval (debido a la variacin en la velocidad de propagacin), hasta
llegar a un punto en el cual la deformacin de la membrana
basilar sea mxima; en ese punto de "resonancia", la membrana
basilar es acsticamente "transparente" (es decir, se comporta
como si tuviera un orificio), de modo que la amplitud de la
vibracin y por tanto, la transmisin de la energa de la onda al
fluido de la escala timpnica es mxima en dicho punto.

A partir de esa regin, la onda no puede propagarse
eficientemente, de modo que la amplitud de la vibracin se atena
muy rpidamente a medida que se acerca al helicotrema. En la
Figura 3.13 se observa la onda en la membrana basilar en un
instante de tiempo.

56

Figura 3.13 Onda viajera en la membrana basilar.

En este modo de propagacin, las ondas de presin son ondas viajeras,
en las cuales (a diferencia de las ondas estacionarias) no existen nodos.
En la Figura 3.14 se puede apreciar la amplitud de oscilacin de la
membrana basilar en dos instantes de tiempo, junto con la envolvente de
la onda viajera, en funcin de la distancia al estribo.

La ubicacin del mximo de la envolvente de la onda viajera depende de
la frecuencia de la seal sonora, como puede observarse en la Figura
3.15: mientras menor es la frecuencia del tono, mayor es la distancia que
viaja la onda a lo largo de la membrana antes de ser atenuada y
viceversa. De esta forma, la membrana basilar dispersa las distintas
componentes de una seal de espectro complejo en posiciones bien
definidas respecto a la ventana oval.

57

Figura 3.14 Ondas viajeras para un tono de 200 Hz.

Figura 3.15 Transformacin de frecuencia a posicin en la membrana basilar.

Selectividad en frecuencia de la membrana basilar

Como se ha visto, las altas frecuencias contenidas en un estmulo
sonoro se atenan a medida que la onda se desplaza hacia el
helicotrema. As, se puede considerar a la membrana basilar como un
filtro paso de baja de parmetros distribuidos. Por otro lado, si se
midiese la respuesta en frecuencia en un punto dado de dicha
membrana, se obtendra una respuesta de tipo paso banda.

Este comportamiento de la membrana basilar puede modelarse, con un
grado de aproximacin razonable, como una lnea de transmisin no
uniforme, representada en la Figura 3.16.

58
Cada etapa en paralelo representa un segmento corto de la membrana
basilar. La corriente suministrada por la fuente corresponde a la
velocidad del estribo. Los inductores en serie y en paralelo representan
las masas del fluido y de segmentos de la membrana basilar,
respectivamente; los condensadores representan la rigidez de la
membrana, y se asume que su valor vara exponencialmente segn la
posicin. Las resistencias representan prdidas en la membrana.

Figura 3.16. Representacin de la membrana basilar como una lnea de transmisin.

Este modelo pasivo presenta varios inconvenientes: no considera
fenmenos activos y no lineales de la membrana, no es capaz de
generar una respuesta paso banda tan estrecha como las observadas
experimentalmente en tejidos vivos y adems, no toma en cuenta el
hecho de que la membrana basilar es una estructura en tres
dimensiones. A pesar de ello, permite representar fcilmente los
fenmenos de resonancia y de ondas viajeras.

En apartados posteriores se discute un modelo anlogo al anterior pero
que resulta ms til en la elaboracin de modelos perceptuales, en el
cual se representa el efecto de la membrana basilar como el de un
banco de filtros paso banda. Si bien los parmetros que definen dicho
banco de filtros se obtendrn a partir de consideraciones psicoacsticas,

59
y no fsicas o fisiolgicas, se debe tener en mente que tal modelo est
basado en las propiedades fsicas observables de la membrana basilar y
del odo interno en general.

3.3.2.7.- Mecanismo de transduccin

Interaccin entre las membranas basilar y tectorial

El proceso de transduccin o conversin de seal mecnica a
electroqumica se desarrolla en el rgano de Corti, situado sobre la
membrana basilar.

Las vibraciones de la membrana basilar hacen que sta se mueva en
sentido vertical. A su vez la membrana tectorial, ubicada sobre las
clulas ciliares (los transductores), vibra igualmente; sin embargo, dado
que los ejes de movimiento de ambas membranas son distintos, el
efecto final es el de un desplazamiento "lateral" de la membrana tectorial
con respecto a la membrana basilar.

Como resultado, los cilios de las clulas ciliares externas se "doblan"
hacia un lado u otro (hacia la derecha, en la Figura 3.17, cuando la
membrana basilar "sube").

En el caso de las clulas internas, aun cuando sus cilios no estn en
contacto directo con la membrana tectorial, los desplazamientos del
lquido y su alta viscosidad (relativa a las dimensiones de los cilios)
hacen que dichos cilios se doblen tambin en la misma direccin.

60

Figura 3.17 Desplazamiento relativo de las membranas basilar y tectorial.

Clulas ciliares y potenciales elctricos

La diferencia fundamental entre los dos fluidos de la cclea, la perilinfa y
la endolinfa, estriba en las distintas concentraciones de iones en los dos
fluidos. De esta manera, la endolinfa se encuentra a un potencial
elctrico ligeramente positivo (ver Figura 3.18) respecto a la perilinfa.

Figura 3.18 Potenciales elctricos en el rgano de Corti y los fluidos de la cclea.

Por otro lado, los movimientos de los cilios en una direccin determinada
hacen que la conductividad de la membrana de las clulas ciliares
aumente. Debido a las diferencias de potencial existentes, los cambios

61
en la membrana modulan una corriente elctrica que fluye a travs de
las clulas ciliares.

La consiguiente disminucin en el potencial interno de las clulas
internas provoca la activacin de los terminales nerviosos aferentes,
generndose un impulso nervioso que viaja hacia el cerebro. Por el
contrario, cuando los cilios se doblan en la direccin opuesta, la
conductividad de la membrana disminuye y se inhibe la generacin de
dichos impulsos.

Se pueden destacar dos aspectos de este proceso de transduccin:
primero, que la generacin de impulsos nerviosos es un fenmeno
probabilstico; segundo, que el proceso se comporta como un rectificador
de media onda, puesto que la probabilidad de activacin de las fibras
nerviosas "sigue" a las porciones "positivas" de la seal sonora
(equivalentes a desplazamientos hacia "arriba" de la membrana basilar),
mientras que se hace cero en las porciones "negativas" de la onda.

Interaccin entre clulas ciliares internas y externas

Las fibras aferentes estn conectadas mayormente con las clulas
ciliares internas, por lo que es posible concluir con certeza que stas son
los verdaderos "sensores" del odo. Por el contrario, el papel de las
clulas ciliares externas (ms numerosas que las internas) era objeto de
especulaciones hasta hace pocos aos.

Recientemente se ha comprobado que dichas clulas no operan como
receptores, sino como "msculos", es decir, como elementos mviles
que pueden modificar las oscilaciones en la membrana basilar.

62
La actuacin de las clulas ciliares externas parece ser la siguiente: para
niveles de seal elevados, el movimiento del fluido que rodea los cilios
de las clulas internas es suficiente para doblarlos, y las clulas externas
se saturan. Sin embargo, cuando los niveles de seal son bajos, los
desplazamientos de los cilios de las clulas internas son muy pequeos
para activarlas; en este caso, las clulas externas se "alargan",
aumentando la magnitud de la oscilacin hasta que se saturan.

Este es un proceso no lineal de realimentacin positiva de la energa
mecnica, de modo que las clulas ciliares externas actan como un
control automtico de ganancia, aumentando la sensibilidad del odo.
Este nuevo modelo del mecanismo de transduccin nos indica que el
conjunto formado por la membrana basilar y sus estructuras anexas
forman un sistema activo, no lineal y con realimentacin, y permite
explicar dos fenmenos asociados al odo interno: el "tono de
combinacin", generado a partir de dos tonos de distinta frecuencia por
un elemento no lineal que contiene un trmino cbico, y las "emisiones
otoacsticas", las cuales consisten en tonos generados en el odo
interno en forma espontnea o estimulada, y que pueden llegar a ser
audibles.

Selectividad en frecuencia de la cclea

Debido a la accin de filtraje de la membrana basilar, cada clula
transductora procesa una versin del estmulo sonoro filtrada de modo
diferente. Esta accin de filtraje de la membrana basilar por s sola
equivale a la de filtros cuya respuesta en frecuencia es relativamente
"ancha". Ahora bien, la realimentacin positiva provocada por las clulas
ciliares externas contribuye a aumentar la selectividad del sistema
auditivo.

63
Esto puede comprobarse midiendo la respuesta de una nica fibra
nerviosa ante variaciones en la frecuencia y la amplitud del estmulo
sonoro; las curvas de sintona as obtenidas indican una respuesta de
tipo paso banda mucho ms angosta que la debida al efecto de la
membrana basilar como elemento pasivo.

Adicionalmente, experimentos recientes han permitido determinar que la
selectividad del odo interno es virtualmente idntica a la selectividad del
sistema auditivo en su totalidad, estimada por mtodos psicoacsticos.

3.3.2.8.- Procesamiento a nivel neural

Los impulsos nerviosos generados en el odo interno contienen (en
forma codificada) informacin acerca de la amplitud y el contenido espectral de
la seal sonora; estos dos parmetros estn representados por la tasa de
impulsos y la distribucin de los mismos en las distintas fibras,
respectivamente.

Las fibras nerviosas aferentes llevan esta informacin hasta diversos
lugares del cerebro. En ste se encuentran estructuras de mayor o menor
complejidad, encargadas de procesar distintos aspectos de la informacin.

Por ejemplo, en los centros "inferiores" del cerebro se recibe, procesa e
intercambia informacin proveniente de ambos odos, con el fin de determinar
la localizacin de las fuentes del sonido en el plano horizontal en funcin de los
retardos interaurales, mientras que en los centros "superiores" de la corteza
existen estructuras ms especializadas que responden a estmulos ms
complejos. La informacin transmitida por el nervio auditivo se utiliza finalmente
para generar lo que se conoce como "sensaciones".

64
Hasta ahora se ha visto que las distintas partes del sistema auditivo son
susceptibles de ser modeladas matemticamente, en trminos de su
comportamiento como sistemas fsicos.

Se podra por tanto pensar que el modelo perceptual ideal es aquel que
simula, en trminos de los procesos fsicos y fisiolgicos, todas las etapas del
sistema auditivo, incluyendo la etapa de procesamiento neural en el cerebro.
Sin embargo, la comprensin que se tiene acerca de lo que ocurre en las
estructuras cerebrales es muy limitada, especialmente en lo relativo a los
centros "superiores" del cerebro. Por lo tanto, es necesario recurrir a la
descripcin psicoacstica de los fenmenos perceptuales y de las sensaciones.

65

4.- Mtodo de Anlisis 1. Modelo de Propagacin
de Ondas Esfricas

4.1.- Introduccin

Podemos aplicar una serie de transformaciones a nuestra seal de
entrada de modo que a la salida provoque una cierta sensacin de
direccionalidad. Si no queremos tratar con Funciones de Transferencia de
difcil obtencin, podemos aplicar a nuestra seal dos transformaciones bsicas
en funcin del ngulo y la distancia, basndonos en el principio de propagacin
de ondas esfricas. Dichas transformaciones son simplemente una diferencia
de amplitud entre la seal original y la recibida por el odo derecho e izquierdo y
una diferencia de temporalizacin o retardo entre ambos odos.

4.2.- ngulo y distancia

Desde el punto de vista actual slo podemos tener en cuenta dos
variables: la atenuacin y el retardo. Debido a esta limitacin, debemos
centrarnos en identificar un sonido que proviene slo del semiplano delantero
horizontal, ya que el trasero horizontal provocar el mismo retardo y atenuacin
que para el mismo ngulo y distancia en el semiplano horizontal delantero.

66

Figura 4.1 Retardo y atenuacin idnticas en semiplano horizontal delantero y trasero

4.3.- Modelo de fuente cercana y fuente lejana

En funcin de la distancia de la fuente al destino podemos aplicar el
modelo de fuente cercana o el de fuente lejana, siendo el ltimo bastante ms
simple.

4.3.1.- Modelo Fuente Cercana

Figura 4.2 Modelo de Fuente Cercana

67
Mediante trigonometra, teorema del coseno, y sabiendo la distancia y el
ngulo desde el foco al centro de la cabeza, podemos calcular la diferencia de
longitud de camino recorrido por la onda sonora desde el origen a cada uno de
los odos, para posteriormente calcular el tiempo de retardo de uno respecto a
otro sabiendo la velocidad del sonido.

(
+ = cos )
2
( 2 )
2
(
2 2 aural aural
d
d
d
d
d D
(4.1)

(
+ = ) cos( )
2
( 2 )
2
(
2 2

aural aural
d
d
d
d Di
(4.2)

d i
D D p =
(4.3)

sonido
V
p
tardo = Re
(4.4)

4.3.2.- Modelo Fuente Lejana

Para el modelo de fuente lejana suponemos que la fuente de sonido est
a una distancia suficientemente grande para que se pueda considerar que los
rayos directos desde al foco a cada uno de los odos describen unas
trayectorias prcticamente paralelas entre s y paralelas con el eje central de la
cabeza, como se muestra en la Figura 4.3. Este modelo es bastante ms
simple y empieza tener resultados bastante similares al modelo real a partir de
los 2 metros y medio.

68

Figura 4.3 Modelo Fuente Lejana

) cos( * daural p =
(4.5)

sonido
V
p
tardo = Re
(4.6)

4.3.3.- Intensidad Sonora

La Intensidad sonora podemos definirla en ambos casos como:

2
4 R
P
I
=
(4.7)

69
Por tanto el cociente entre ambos odos es el coeficiente de amplitud
que tendremos que aplicar.

2
2
2
4
4
|
|
.
|
\
|
= = =
i
d
d
i
R
R
R
P
R
P
Id
Ii
A
(4.8)

En funcin del modelo que hallamos aplicado tendremos que disponer
de unas distancias u otras.

4.4.- Cuantificacin y retardos enteros

Debido a que la seal de sonido es una seal muestreada y cuantizada,
y por tanto discreta, los retardos deben ser discretos tambin, de modo que
para una serie de retardos en un continuo obtenemos los mismos retardo
cuando se procede a la cuantificacin. Esto nos provoca que tengamos zonas
de reconocimiento angular definidas y estticas en funcin de la frecuencia de
muestreo de la seal de sonido original. Cuanto mayor frecuencia de muestreo
tengamos, ms definida quedar angularmente nuestra posicin.

El retardo mximo queda determinado por la distancia interaural y por la
frecuencia de muestreo de la seal sonora. Si suponemos una velocidad del
sonido de 340 m/s y una frecuencia de muestreo de 8000 muestras/s, el
retardo mximo en metros es la distancia interaural, y en muestras es:

8000 muestras / sg 340 metros /s
X muestras D. Interaural

70
Para una distancia interaural de 0.2 metros y una Frecuencia de 8000 Hz
tenemos un retardo mximo de 5 muestras.

En las grficas siguientes podemos observar la diferencia entre el ngulo
original y continuo y el ngulo discreto obtenido despus de la cuantizacin.
Observamos que a mayor frecuencia, mayor parecido con los ngulos
originales.

71

Figura 4.4 Angulo Original, Cuantizado y Error para Frecuencia de 8000 Hz



72
Los ngulos posibles en funcin de la frecuencia son los representados
el las siguientes figuras. Aqu tambin podemos apreciar que la distribucin
angular no es lineal, siendo para unos ngulos mayor que para otros.

Figura 4.7 Reparto Angular para frecuencias de 8000 Hz



73
4.5.- Movimiento

Podemos aplicar lo visto hasta ahora para desarrollar una
transformacin lineal de modo que podamos representar una fuente sonora
realizando un movimiento a lo largo de una trayectoria. Para ello lo nico que
debemos hacer es definir este trayecto y aplicar las transformaciones de
Atenuacin-Retardo a cada uno de los puntos que definen dicho recorrido. Al
tratar con frecuencias de muestreo lo suficientemente grandes y debido a la
limitacin misma del odo humano, podemos asegurar que no existen saltos
apreciables en los cambios de ngulo debidos al movimiento.

El proceso es el siguiente:

Se toma cada una de las muestras de la seal original.
A cada muestra se le asigna una posicin en el espacio. Dicha
posicin la podemos definir por la duracin de la seal de sonido y
por la trayectoria del recorrido. Se tomar una trayectoria con
velocidad constante, aunque se puede modificar en caso de desear
otro tipo de movimiento.
Se le aplica la atenuacin de potencias correspondiente a la
localizacin de cada muestra, con lo que se obtiene una seal
parecida a la original, pero con las muestras atenuadas segn
criterios individuales, cada punto es atenuado independientemente.
Se le aplica el retardo a cada muestra, de modo que cambiamos de
posicin respecto a la seal original.
Al aplicar este nuevo posicionamiento, se dejan espacios en blanco
que deben rellenarse. El relleno es la media aritmtica de las
posiciones adyacentes. Tambin es posible el solape de puntos,
para solucionar el problema se hace la media aritmtica de los
puntos que se solapan.

74

Figura 4.10 Creacin de movimiento mediante Propagacin de Ondas Esfricas para cada los dos
odos

Odo Izquierdo
Odo Derecho
Y
i
(n)
Y
d
(n)
Y(n) sn(n)
Procesado Potencia
Duracin seal
Procesado Retardo
Y(n) Sn(n)

75

5.- Mtodo de Anlisis 2. Head Related Transfer
Function. (HRTF)

5.1.- Tcnicas de medida de HRTF

5.1.1.- Modelo de cabeza esfrica

En teora sera posible calcular la HRTF mediante la resolucin de la
ecuacin de ondas sometida a las condiciones presentadas por el pecho,
cabeza y orejas. No es necesario decir que es difcil de alcanzar
analticamente y que el clculo computacional es enorme. Hace unos 100
aos, Lord Rayleigh obtuvo una notablemente buena aproximacin de baja
frecuencia obteniendo una solucin exacta al problema simple de la difraccin
de una onda plana acstica sobre una esfera rgida. Entre otras cosas, esta
solucin mostraba que:

1. Los efectos IID de sombra-cabeza comienzan a aparecer alrededor
de los 1 KHz.
2. La ITD vara sinusoidalmente con el azimuth y gradualmente aunque
con complejidad con la frecuencia.

76
A pesar de que el modelo de Rayleigh era simple, su solucin no lo era,
y varias aproximaciones han sido propuestas. Una de ellas es la que se
expone a continuacin, que se ajusta bastante bien a la solucin de Rayleigh.

El modelo es el siguiente:

R
T j
R
e
j
j
H
+
+
=
1
2 1
) , (
(5.1)

L
T j
L
e
j
j
H
+
+
=
1
) 1 ( 2 1
) , (
(5.2)
Donde

) 1 (
2
1
sin + =
(5.3)

) (
2
1
c
a
=
(5.4)

) 1 ( =
R
T
(5.5)

=
L
T
(5.6)

Este modelo se adapta bastante bien a la solucin de Rayleigh a
frecuencias inferiores a 2 kHz. Cuando se escucha un sonido binaural
sintetizado con este filtro, la localizacin aparente se mueve suavemente desde
el odo izquierdo al derecho cuando vara de 90 a 90. Sin embargo, este

77
modelo no proporciona ninguna dependencia con la elevacin, y la localizacin
aparente no es externa, parece que est dentro de la cabeza.

5.1.2.- Modelado de Eco-Oreja

Hace aproximadamente 25 aos, Batteau demostr que la forma de la
oreja jugaba un papel fundamental para determinar el ngulo de elevacin de la
fuente sonora. El razonamiento era debido a los dos pliegues principales que
presenta la oreja, dichos pliegues producen distintos ecos debido a las
mltiples reflexiones que se desarrollan en las distintas superficies que
conforman el pabelln auditivo. Esto conduce a una FdT de la oreja de forma:

) 1 (
) 1 (
2 1
2 1
2 1

+ +
+ +
=
j e j e
Hp
(5.7)

Donde ambos coeficientes de reflexin
i
y los retrasos de eco
i
pueden
variar con el azimuth y la elevacin. A pesar de que los modelos de oreja-eco
han sido criticados por la excesiva simplificacin del complicado proceso de
difraccin, sus curvas de respuesta frecuencial muestran vanos de filtro peine
parecidos a los obtenidos de modo experimental, y los test psicoacsticos
indican una fuerte correlacin entre las frecuencias de vanos y la percepcin de
la elevacin

5.1.3.- Modelado emprico.

La otra manera de obtener unas HTRF con cierta garanta de una forma
totalmente emprica, de modo que se realizan una serie de pruebas en
laboratorio sobre personas normales y maniques y los resultados obtenidos
son procesados para desarrollar las Funciones de Transferencia que
posteriormente sern utilizadas.

78

Las HRTFs son medidas generalmente mediante la grabacin de unas
seales de test de uno de estos 3 modos:

En la entrada de uno de los canales auditivos con un micrfono en
miniatura en forma de cpsula bloqueando el canal.
A travs del canal auditivo con un tubo sonda.
En la posicin de la oreja en la cabeza de un mueco de pruebas
(maniqu).

En los tres casos, la cabeza debe permanecer completamente quieta
durante la prueba de medida para eliminar el sonido medioambiental existente.

Las medidas realizadas en cada posicin tienen una relacin estable y firme
con las medidas realizadas en otras posiciones. Por ejemplo, las medidas
realizadas con un tubo sonda situado al menos a 15 mm en el interior del canal
auditivo estarn cerca relativamente de aquellas realizadas en la posicin del
canal auditivo.

Hay un ratio fijo entre la magnitud espectral de ambas hasta alrededor de
los 7000Hz . Por encima de los 7000Hz ( y a veces debajo) los notches en las
dos medidas son descompensados en cada uno y se crean diferencias
espectrales ( hay una relacin seal a ruido pobre en general en los notches la
cual puede causar equivocaciones cuando se transforma un tipo de medida en
la otra).

Las mediciones realizadas en los odos pueden ser procesadas con el
propsito de aislar la parte que representa las actuales HRTFs. Las seales
acsticas medidas en los odos pueden ser representadas como el producto de
la funcin de transferencia dela fuente, S(w), y el equipo de grabacin, T(w),
con el odo ipsilateral, Hi(w), o el odo contralateral, Hc(w):

79

S(w) T(w) Hi(w)
S(w) T(w) Hc(w) (5.8)

Una medida de referencia sin sujeto humano es el producto de la fuente
y equipo de grabacin solamente, S(w) y T(w). Por consiguiente, las HRTFs
pueden ser aisladas por la divisin de las referencias medidas desde los odos.
S(w) T(w) Hi(w) = Hi(w) y S(w) T(w) Hc(w) = Hc(w)
S(w) T(w) S(w) T(w) (5.9)

Este clculo est tpicamente desempeado mediante una
transformacin desde el dominio temporal al frecuencial por medio de la FFT
donde la distribucin del valor complejo puede ser desarrollada directamente.

Alternativamente, los datos frecuenciales complejos pueden ser
convertidos a magnitud y fase. La respuesta impulsiva para la HRTF es
calculada por la transformacin de la HRTF desde el dominio de la frecuencia
al dominio del tiempo mediante la FFT inversa.

5.2.- Colaboracin con la Universidad de Wisconsin

Las HRTFs utilizadas para la realizacin del estudio han sido facilitadas
por la Universidad de Wisconsin. Gracias a un acuerdo previamente
establecido entre dicha Univeridad y la Hispalense, hemos podido tener acceso
a gran parte de los estudios realizados en sus instalaciones. Mediante esta
colaboracin, desde Sevilla hemos podido definir nuestras necesidades para
que realizaran las pruebas que necesitbamos y mediante un servidor FTP
pudimos descargarlas usando Internet.

80
5.3.- Montaje

Se ha realizado medidas de Head-Related Transfer Function (HRTF)
sobre una serie de 5 voluntarios, cada uno de ellos posee una HRTF
caracterstica y diferente del resto dependiendo de su fisonoma. En la
siguiente tabla se muestra el sexo y la altura de cada uno de los sujetos que
participaron en este estudio.
Voluntario Sexo Altura(pies)
AFW Femenino 68.5"
SJX Femenino 68.0"
SOU Femenino 65.0"
SOS Masculino 74.0"
SOW Masculino 75.0"

Las medidas consisten en adquirir las respuestas impulsivas en los
odos derecho e izquierdo a sonidos emitidos desde un altavoz Realistic
Optimus Pro 7 montado a 1,4 metros de la cabeza de los voluntarios. Han sido
usadas secuencias binarias pseudoaleatorias de mxima longitud (ML) para
obtener las respuestas impulsivas a una tasa de muestreo de 44.1 kHz. Se
han elegido para el estudio 505 posiciones diferentes obtenidas mediante la
combinacin de azimuth entre 170 y 180 y de elevacin entre 50 y 90.

El sistema de referencias angular que vamos a tomar durante todo el
proyecto es:

Azimuth igual a cero para el frente.
ngulos de azimuth positivos hacia la derecha.
ngulos de azimuth negativos hacia la izquierda.
Elevacin cero para el plano horizontal.
Elevacin positiva para alturas mayores a cero.
Elevacin negativa para alturas menores a cero.

81
5.3.1.- Tcnicas de Medida

Figura 5.1 Esquema de montaje en Laboratorio (I)

Las medidas se han realizado mediante el uso de un ordenador
Macintosh Quadra equipado con una tarjeta DSP Audiomedia II, con
convertidores estero digitales A/D y D/A de 16 bits que operan a 44.1 kHz de
tasa de muestreo. Uno de los canales de salida de audio es enviado a un
amplificador que conduce directamente a un altavoz Realistic Optimus Pro 7.
Este es un pequeo altavoz de dos vas con woofer de 4 pulgadas y tweeter de
1 pulgada.

Los voluntarios disponen de micrfonos y preamplificadores Etymotic
ER-11. Las salidas de los preamplificadores se conectan directamente a las
entradas estreo de la tarjeta Audiomedia.

Desde el punto de vista de la tarjeta de sonido, una seal enviada a
travs de la salida de audio corresponde con una seal que aparece en la
entrada de audio. Las medidas de la respuesta impulsiva de este sistema
Micrfonos y
Preamplificadores
Etymotic ER-11
Altavoz
Realistic
Optimus Pro7
Macintosh
Quadra
Audiomedia
DSP
Amplificador

82
corresponden con la respuesta impulsiva combinada del sistema constituido
por los convertidores A/D y D/A y los filtros antialias de la tarjeta de sonido, el
amplificador, el altavoz, la habitacin donde se han realizado las medidas y lo
ms importante, la respuesta de los voluntarios combinada con los microfonos
y preamplificadores. Podemos eliminar las interferencias debidas a las
reflexiones de la habitacin asegurndonos que ninguna reflexin sucede antes
de que ocurra la respuesta temporal de la cabeza, que es cuestin de
milisegundos. Medimos la respuesta impulsiva del altavoz de forma
independiente, de este modo podemos compensar la respuesta no uniforme del
mismo mediante un filtro inverso de modo que al aplicarlo la las medidas de
HRTF ecualiza la respuesta del altavoz ponindola plana.

Las respuestas impulsivas han sido obtenidas usando secuencias ML.
La longitud de la secuencia es N = 16.383 muestras, correspondientes a un
registro generado de 14 bits. Dos copias de la secuencia son concatenadas
para formar un sonido de 2*N muestras que es reproducido desde la tarjeta de
sonido Audiomedia. Simultneamente 2*N muestras son grabadas en los
canales correspondientes a los odos derecho e izquierdo. Para cada canal de
entrada se ha procedido del siguiente modo para recuperar la respuesta
impulsiva.

Las primeras N muestras del resultado han sido descartadas.
Las restantes N muestras han sido duplicadas para volver a formar
una secuencia de 2*N.
Esta seal es croscorrelada con la seal de original ML de N
muestras usando convolucin FFT de bloques, formando una seal
de salida de 3*N-1 muestras.
Las N muestras de la respuesta impulsiva fueron extradas partiendo
de la muestra N-1 de la seal de salida.

83
5.3.2.- Procedimiento de Medida

Las medidas han sido realizadas en la cmara anecoica de la
Universidad de Wisconsin. Los voluntarios se sientan en una silla regulable en
altura que est fija sobre una plataforma giratoria controlada por ordenador, de
este modo podemos seleccionar con exactitud la medida del azimuth. El
altavoz est anclado en una plataforma mvil que recorre un riel en forma de
semicrculo de 1.4 metros de radio, partiendo desde la base de la silla hasta
una altura de 2.8 metros, lo cual permite posicionar con precisin el altavoz en
cualquier ngulo de elevacin.

Figura 5.2 Esquema de montaje en Laboratorio (II)

De este modo las medidas se realizan a un ngulo de altura fija, rotando
el ngulo de azimuth mediante control por ordenador para esta elevacin fijada.
Con la cara del voluntario mirando hacia delante, el altavoz es posicionado de
forma que un hipottico rayo normal proyectado desde el centro de la cara
frontal del altavoz dividira en dos el eje interaural del sujeto a una distancia de
1.4 m

1.4 m
1.4 m

84
1.4 metros. Conseguimos esto usando una cinta mtrica, un pndulo, una
calculadora, una vara de 1.4 metros y el riel instalado para el experimento.
Queremos que el altavoz est siempre en la posicin deseada con un error de
0.5 pulgadas, lo cual corresponde a un error angular de 0.5 grados.

El espacio esfrico alrededor del sujeto est muestreado en 36 espacios
regulares de 10 cada uno en el plano horizontal y en 15 espacios regulares de
10 cada uno desde el 50 al 90 de elevacin en el ngulo de elevacin. La
tabla siguiente muestra las posiciones desde donde se han obtenido las
HRTFs.

Elevacin Nmero de Medidas Incremento Azimuth
-40
-30
-20
-10
0
10
20
30
40
50
60
70
80
90
36
36
36
36
36
36
36
36
36
36
36
36
36
X
10
10
10
10
10
10
10
10
10
10
10
10
10
X

Si las personas fusemos totalmente simtricas slo necesitaramos el
hemisferio derecho o izquierdo, pero como no lo somos necesitamos obtener
las HRTFs de ambos odos para todos los ngulos de la esfera.

5.3.3.- Medidas de Altavoz y auriculares

La respuesta impulsiva del altavoz Optimus Pro 7 ha sido medida en la
cmara anecoica usando un micrfono Kmi 84 a una distancia de 1.4 metros.

85
La tcnica de medida ha sido exactamente la misma que para las medidas de
HRTF. La respuesta impulsiva ha podido ser usada para crear un filtro inverso
con la idea de ecualizar las medidas de HRTF.

5.3.4.- Los datos

Como se ha descrito anteriormente, cada HRTF medida consiste en una
respuesta impulsiva de 16.383 puntos muestreada a 44.1 kHz. La mayora de
estos datos son irrelevantes. Los 1.4 metros de viaje areo corresponden
aproximadamente a 180 muestras, y existe un retraso adicional de 50 muestras
inherentes al sistema de reproduccin/grabacin. Como consecuencia, en
cada respuesta impulsiva, hay un retardo de aproximadamente 230 muestras
antes de que la respuesta del cuerpo se produzca. Dicha respuesta persiste
durante muchos cientos de muestras, y es seguida por varias reflexiones de los
objetos de la cmara anecica (incluidos altavoces, cablesetc). Para reducir
el tamao del conjunto de datos, se ha procedido a eliminar las primeras 200
muestras, y conservar las 256 siguientes. Cada HRTF tiene por tanto 256
muestras de longitud.

Los datos han sido almacenados a priori en 10 archivos, cada uno con
505 funciones de Transferencia de 256 coeficientes procedentes de los dos
odos de cada voluntario. Para poder trabajar de forma ms rpida y cmoda,
se ha procedido a dividir estos archivos de la siguiente manera:

Habr 505 archivos WKX (Lotus 123) por cada voluntario.
Cada archivo es una hoja de clculo editable con Microsoft Excel que
posee dos columnas, una para cada odo.
Estarn etiquetados del siguiente modo:

XXX_TT_PP.wkx

86
Donde:

XXX: nombre abreviado del voluntario.
TT: ngulo Tetha.
PP: ngulo Phi.

De este modo quedan totalmente definidos los 2525 archivos resultantes
de esta descomposicin. Como se puede suponer, esto reduce
considerablemente el tiempo de carga de las HRTF a la hora de trabajar con
las mismas.

5.4 Caractersticas de la HRTF

Las HRTF presentan una serie de caractersticas importantes tanto en el
dominio del tiempo como en el de la frecuencia. Estas caractersticas
determinan un comportamiento determinado en las seales sonoras que son
afectadas por ellas.

Como se muestra en la Figura 5.3, las seales que llegan a los
pabellones auditivos pueden ser examinadas desde dos perspectivas distintas,
el dominio del tiempo y el de la frecuencia.

Si nosotros imaginamos que el evento sonoro es un simple impulso,
podemos fcilmente identificar el hecho de que depende solamente de la
acstica del oyente.

87

Figura 5.3 Representacin de HRTFs en el dominio de la frecuencia y del tiempo en oidos
ipsilateral y contralateral (adaptados por Kebdall en 1990)

Desde el punto de vista del dominio del tiempo, se puede considerar a
las seales que llegan a los odos como impulsos sonoros. La energa ha sido
dispersada alrededor de 1-3 milisegundos por la interaccin con el cuerpo del
oyente. Cuando una fuente de sonido est exactamente a 90 azimuth en el
plano horizontal, la ITD llega a su mximo, estando ste entre 7 y 8
milisegundos.

Una comparacin de medidas impulsionales de un mismo sujeto desde
diferentes localizaciones revelar patrones significativos.

88

Figura 5.4 Curvas de respuesta impulsiva medidas en el odo izquierdo de un voluntario para 36
ngulos distintos de azimuth en el plano horizontal. La curva de abajo representa 0 grados
azimuth (frente) y las siguientes curvas proceden de aumentar el ngulo alrededor de la cabeza
hasta llegar a 350 (de Kendall 1990)

Figura 5.5 Curvas de respuesta impulsiva medidas en el odo izquierdo de un voluntario para 14
ngulos distintos del plano vertical con 30 de azimuth. La primera curva de abajo representa 80
grados ( arriba ) y las siguientes curvas proceden de disminuir el ngulo alrededor de la cabeza
hasta llegar a 50

La Figura 5.4 muestra las curvas de respuesta impulsiva medidas en la
oreja de uno de los voluntarios para 36 ngulos distintos de azimuth en el plano
horizontal. Significativamente podemos observar la variacin del retraso del
sonido inicial que acompaa el cambio de azimuth. Cuando el oyente se sita
alrededor de 270 grados (de distancia del lado contralateral) la simetra del
sonido alrededor de la cabeza en ambas direcciones difiere en los patrones de

89
los picos (el sonido retrasado reduce la ganancia entre 150 y 270 grados,
probablemente reflejando una reduccin del sonido desde la oreja.)

La Figura 5.5 muestra las curvas correspondientes a un ngulo de 30
de azimuth y recorre la elevacin desde los 90 hasta los 50.

En el dominio de la frecuencia las Figura 5.6 y 5.7 revelan que la
magnitud del perfil de las HRTF vara tremendamente con la frecuencia.
Comparando los dos odos podemos observar que las magnitudes son ms
similares cuando menor es la frecuencia del sonido y mas dispares a medida
que la frecuencia es mayor. La diferencia es significativa y se incrementa
notablemente por encima de los 1500 Hz ( la longitud de onda que coincide con
el dimetro de la cabeza), porque la cabeza empieza a bloquear las ondas
sonoras a estas frecuencias mayores.

Figura 5.6 HRTFs medidas en la posicin del odo izquierdo en un sujeto voluntario para 36
ngulos distintos de azimuth en el plano horizontal.

90

Figura 5.7 HRTFs medidas en la posicin del odo derecho en un sujeto voluntario para 36 ngulos
distintos de azimuth en el plano horizontal.

Hay numerosos factores acsticos que aaden complejidad y riqueza a
las HRTFs, como por ejemplo el pico de gran amplitud que nos encontramos
en una zona de alrededor de los 3.000 Hz que est causado por la resonancia
del canal auditivo. Hay tambin vanos y otros finos detalles en la magnitud de
la respuesta causados por las interferencias constructivas y destructivas de la
onda directa con el sonido reflejado en el cuerpo. El sonido reflejado en torno a
2000Hz est causado principalmente por el torso, y el de 4000 HZ es debido a
la oreja, en medio hay una regin de influencia superpuesta de ambos
interferentes.

Una comparacin de HRTFs medidas en direcciones adyacentes
revelar muchos patrones significativos. La Figuras 5.6 y 5.7 muestran los
patrones que pueden ser observados en la magnitud de la respuesta de los
odo en el plano horizontal entre 0 y 360 grados de azimuth. Por ejemplo, el
ancho de banda del pico espectral cerca de los 3000 Hz se ensancha cuando
la fuente de sonido se mueve desde el frente hacia atrs. Un desvanecimiento

91
profundo en los 8000 Hz emigra hacia arriba en las frecuencias donde la fuente
se mueve hacia atrs y entonces desaparece virtualmente.

Figura5.8 HRTFs de los dos odo (izquierdo y derecho respectivamente) de un sujeto. El sonido
incrementa en elevacin ,-50 (lnea negra), 0 (lnea azul) y 70 (lnea roja)

92
En la figura 5.8 se puede observar las diferencias de las HRTF de un
individuo al aumentar el grado de elevacin, con un ngulo fijo de azimuth de
30. Estas grficas son an ms especficas de cada persona que las
mostradas anteriormente para el recorrido alrededor del ngulo Theta.

Cuando la distancia del evento origen del sonido est a ms de dos
metros de la cabeza, al moverse ste o el oyente, producen pequeos cambios
de la HRTF. Las ondas sonoras, a esta distancia, vienen del evento sonoro en
forma aproximadamente plana (esto significa que las HRTFs provocadas por
eventos de menos de dos metros de distancia de la cabeza puedan ser
utilizadas para simular fuentes de sonido lejanas (a condicin de que los
indicios del entorno a esa distancia tambin estn presentes). A menos de dos
metros de la cabeza, las ondas sonoras procedentes del evento acstico son
ms esfricas, el ngulo efectivo entre el evento sonoro y el odo del individuo
cambia, y las HRTFs divergen significativamente de aquellos sonidos ms
lejanos.

5.4.- Diferencias individuales

Actualmente hay un debate concerniente al impacto de las diferencias
individuales para extrapolar una HRTFs general con la que localizar el sonido
para todos los individuos, ya que cada uno posee una HRTF particular.

Las HRTFs varan muchsimo entre las personas y las diferencias
interaurales son afectadas de manera importante por las diferencias en el
tamao de la cabeza y la orientacin de las orejas. Esto implica que algunas
HRTF implementadas sobre algunos individuos puedan variar notablemente la
precisin de localizacin ( Butler & Belendiuk, 1977; Wightman & Kistler, 1989),
pero esas grandes diferencias en el tamao de la cabeza pueden socavar la
localizacin (Morimoto & Ando, 1983). Wenzel en 1993 comunic que el juicio

93
de la elevacin y la diferencia entre adelante/atrs son propensas as
degradarse con el uso no individualizado de las HRTFs.

Del mismo modo parece que la localizacin efectiva puede ocurrir en
muchos casos en los cuales los odos reciban funciones de transferencia
direccionales (DTFs) cuyos detalles difieran significativamente de las medidas
en las HRTFs. Kendall y Rodgers(1982) usaron filtros de orden bajo para crear
figuras de las FdT como aproximaciones de las HRTFs naturales mientras que
Martens (1987) y Kendall (1988) describen el uso de un anlisis de
componentes principales para crear las DTFs artificiales.

Figura 5.9 Representacion de las HTRF de dos individuos (azul y rojo) y el error entre ambas para
un ngulo de 50 azimuth y 0 de elevacin. Odos Izquierdo

94

Figura 5.10 Representacion de las HTRF de dos individuos (azul y rojo) y el error entre ambas
para un ngulo de 50 azimuth y 0 de elevacin. Odos Derecho

Comparando la respuesta en frecuencia de HRTFs de diferentes
individuos se puede observar que los rasgos espectrales no son exactamente
los mismos para todos. La magnitud de las HRTFs individuales variar en
trminos generales y tambin en pequeos detalles. Las Figuras 5.9 y 5.10
comparan las HRTF de los odo izquierdo y derecho de dos individuos para un
ngulo de 50 azimuth y 0 de elevacin.

Y aunque hay considerables diferencias en forma y detalle, pueden
verse como en general se parecen bastante. Por ejemplo, individualmente
ambas muestran la misma tnica en la transicin de subida de las frecuencias
notch (por ejemplo, ambos individuos muestran las mismas tendencias en la
migracin desde las frecuencias del vano hasta los picos ms elevados). Esto
sugiere que mientras los individuos poseen cabezas de diferentes tamaos y
orejas de distintos tipos, el proceso acstico que se realiza para conseguir las
HRTF es el mismo para todos. No obstante , la diferencia de fase interaural

95
ser afectada especialmente por una separacin entre odos. La magnitud de
los fenmenos de fase interaural ser un poco distinta en nios que en adultos.

La comparacin de los resultados sugiere lo siguiente:

1. Las personas generalmente localizan mejor los sonidos con sus propias
HRTFs que con las generales (o las de otros).
2. Algunos individuos tienen HRTFs que son superiores , y esas HRTFs
pueden algunas veces mejorar las localizaciones de otros individuos .
3. Para trabajar un individuo con la HRTF de otro, el tamao de la cabeza
debe ser aproximadamente el mismo.
4. La localizacin puede ser lograda con DTFs sintticas cuyos detalles
difieran de las HRTFs medidas.

5.5.- Reproduccin estreo del sonido 3D

Muchos sonidos 3D recrean una visin de un sistema de audio ideal que
podra incluir un motor computacional con suficiente potencia para sintetizar
completamente la acstica 3D de un entorno simulado. De hecho, ambientes
simulados simultneamente parecen ser requeridos para situar cada sonido en
el entorno ms apropiado. Cada fuente de sonido simulada y cada reflexin
simulada podra ser procesada por un par de filtros direccionales con los que
capturar las propiedades direccionales de la cabeza del oyente. Estos filtros
podran cambiar instantneamente en respuesta al movimiento de la cabeza
del oyente (o debido a cambios del entorno simulado). Si hubiese ms de un
oyente, los cambios podran ocurrir independientemente de cada persona. Los
filtros direccionales estaran basados en la HRTF de cada uno de los oyentes.
Algunas influencias del equipo de reproduccin o del entorno podran ser
eliminados.

96
Hay muchos factores que nos mantienen lejos de la realizacin de este
proyecto hoy en da. Uno de los factores es la enorme carga computacional
requerida para desarrollar este sistema, que parece no tener lmite.
Necesitarn ser incorporadas muchas herramientas de ingeniera antes de que
un sistema prctico pueda acercarse a la funcionalidad descrita anteriormente.

Realizar un sistema de que comunique eficientemente al oyente es
probablemente ms importante que representar la acstica de una realidad
fsica, ya conocemos entonces que el sistema auditivo es selectivo en cuanto a
la informacin que utiliza. Un factor an ms importante es que la
implementacin actual de los filtros direccionales est lejos de ser perfecta.

5.6.- La Reproduccin estreo de los Sonidos 3D

Cohen (1989) y Begault (1991) han planteado seales para advertir la
carencia de discusiones realistas para reas problemticas y sobre
predicciones demasiado optimistas y argumentaciones para el sonido 3D,
especialmente para desarrollos comerciales.

Algunos problemas cruciales son la discriminacin del sonido
delantero/trasero, decoloraciones de timbre, diferencias en la interpretacin del
oyente y diferencias debidas a la acstica de la fuente de sonido. La
reproduccin de sonido 3D puede ser un asunto complicado. Por ejemplo,
mientras unos auriculares y un altavoz tienen un sistema de reproduccin
tecnolgicamente similar y buscan los mismo objetivos, algunas veces
presentan algunos problemas muy diferentes y requieren soluciones prcticas
distintas.

97
5.6.1.- Filtrado Direccional

Tanto si la reproduccin sucede en altavoces como en auriculares , hay
una serie de aspectos esenciales de la simulacin computacional que sirven
para ambas opciones. Por ejemplo, como se muestra en la Figura 5.11, cada
fuente de sonido potencial y cada reflexin simulada empiezan como una seal
monofnica que eventualmente debe ser dividida en forma de un par estreo
derecha/izquierda. Cada canal del par estreo debe ser procesado mediante
filtros direccionales dependientes que cambian en respuesta a la proyeccin de
la localizacin de la fuente de sonido.

Todos los resultados de los pares estreo derecha/izquierda resultantes
son sumados juntos para formar una seal de salida estereofnica compuesta
que finalmente es reproducida en los altavoces o auriculares. Estos filtros
direccionales pueden ser implementados de cualquiera de las maneras
tradicionales.

Figura 5.11 Una fuente simple y monofnica es dividida para formar un par derecha/izquierda
estreo el cual es procesado mediante filtros digitales con dependencia direccional y sumados para
formar una seal de salida estereofnica compuesta.

Este es el modelo de implementacin de Escucha Direccional mediante
HRTF utilizado en este proyecto.
I I
I
I
D
D
D
D

Filtros con
Dependencia
Direccional
Seal de
Fuente
Monofnica
Otras Fuentes
Otras Fuentes
Seales Estereofnicas
de Salida
Azimuth y Elevacin

98

La Figura 5.12 muestra los detalles de una implementacin ms
compleja. Hay filtros FIR de derecha e izquierda cuyos coeficientes son las
respuestas impulsivas HRTFs sacadas de una librera de HRTFs. En las
HRTFs normalmente estaran incorporados los retrasos interaurales y las
diferencias de intensidad, pero esto puede ser implementado de forma
separada mediante controles de ganancia y retraso, (esta separacin puede
reducir el nmero de coeficientes necesarios para implementar los filtros FIR).

Figura 5.12 Detalles de la implementacin con filtros FIR y retrasos interaurales independientes
con control de ganancia
D
de Salida
Filtro FIR
Seal de Fuente
Monofnica
Filtro FIR
Retraso Interaural
Ganancia Interaural y
tabla de retrasos
Librera de HRTF
Azimuth y Elevacin
I
Ganancia I
Ganancia D

99
5.7.- Procesado

5.7.1.- Esttico

Para el procesado de una seal de audio mediante la tcnica de HRTF
usamos una seal monofnica. Dependiendo de los ngulos de azimuth y
elevacin escogeremos la Respuesta Impulsiva mas parecida entre las 505 que
disponemos. Una vez elegida convolucionamos nuestra seal de sonido con
las h(n) correspondientes a los filtro de las HRTF del odo izquierdo y derecho.
De este modo tenemos dos seales de salida que conjuntamente forman la
seal estereofnica de salida.

Figura 5.13 Esquema de generacin de seales direccionales mediante HRTF

5.7.2.- Dinmico

Mediante el procesado dinmico se pretende dar una sensacin de
direccionalidad de una fuente de sonido en movimiento. Al tratar con HRTF
obtenidas a una distancia fija, solamente podremos describir el movimiento de
una curva en la superficie de una esfera de radio 1,4 metros.
de Salida
I
D

Filtros con
Dependencia
Direccional
Seal de
Fuente
Monofnica
Azimuth y Elevacin

100

Figura 5.14 Representacin de movimiento esfrico a partir de uno lineal

Debemos dividir la trayectoria de la fuente de sonido en tantos intervalos
como cambios de sectores angulares encontremos, de este modo podemos
aplicar una transformacin simple a la seal por cada uno de los intervalos
correspondientes a ngulos testeados en las pruebas y por tanto
pertenecientes a una de las 505 Respuestas Impulsivas conocidas.

Figura 5.15 Generacin de sonido dinmico (I)

Destino Origen
h(1)
h(2) h(3)
h(4)

101

Figura 5.16 Generacin de sonido dinmico (II)

De cada intervalo i obtenemos una seal de salida esttica y
i
(n).
Mediante una combinacin estas y
i
(n) podemos recrear un movimiento a travs
de la curva del modo que muestra la Figura 5.15.

El proceso que se realiza, y que puede verse en la figura 5.17, es el
siguiente:

Se definen cada uno de los intervalos por los que pasa el
recorrido.
Se divide la longitud total de la seal por el nmero de
intervalos. Esto genera un desplazamiento con velocidad
constante, aunque se podra modificar en caso de querer otro
tipo de movimiento.
Se aplican los algoritmos de sonido direccional para cada uno
de estos intervalos.
Y
1(n)

Y
n(n)

Y
2(n)

y
1(n)

Y
2(n)

Y
n(n)

n

Seales
Estereofnicas
de Salida
I
D

Procesado
Recorrido
Seal de Fuente
Monofnica
Azimuth y Elevacin

Filtros
Direccionales
Odo
Izquierdo

Filtros
Direccionales
Odo Derecho

Algoritmo
de
Combinacin

Algoritmo
de
Combinacin

102
Se cogen por orden los subintervalos de las salidas,
correspondientes a cada intervalo y se ponen ordenadamente
en las salidas correspondientes a los odos izquierdo y
derecho.
En caso de no coincidir las longitudes se procede a un relleno
de ceros al final de la seal.

Figura 5.17 Creacin de movimiento mediante HRTF para cada uno de los odos

Salida
Y1(n)
Y2(n)
Y3(n)
Y4(n)
H1(n)*sn(n)
H2(n) *sn(n)
H3(n) *sn(n)
H4(n) *sn(n)
Duracin seal

103

6.- Interfaz de usuario

Para facilitar la obtencin y visualizacin de resultados se ha creado una
interfaz grfica con el programa MATLAB 5.3.

La interfaz de usuario est dividida en tres grandes grupos o
aplicaciones:

Anlisis de archivos de sonido y procesado direccional esttico.
Anlisis de archivos de sonido y procesado direccional dinmico.
Generacin y presentacin de estadsticas y grficas.

Durante el desarrollo del capitulo se ver con mayor detalle cada una de
ellas.

6.1.- Requisitos bsicos

Al tratarse de una aplicacin realizada con el programa MATLAB 5.3, el
PC donde se ejecute ha de tener dicho programa instalado. Tambin
funciona en versiones posteriores del mismo ( MATLAB 6.0 y MATLAB
6.1 ).

La interfaz lleva asociada una base de datos realizada con el programa
Microsoft Access para la cual se necesita crear el origen de datos ODBC.

104
Si el sistema operativo es el Windows la manera de proceder ser la
siguiente:
1. Ir a panel de control.
2. Seleccionar Fuentes de Datos ODBC.
3. Pestaa DSN de sistema y pulsar Agregar.

Figura 6.1 Eleccin del origen de datos

4. Seleccionar Microsoft Access Driver y pulsar Finalizar.
5. Introducir la ruta y el nombre del origen de datos (nombre de la base de
datos de los voluntarios), que en este caso es Escucha y pulsar Aceptar.

Figura 6.2 Eleccin del origen de datos II

105
6.2 Funcionamiento

Tras situarse en el programa MATLAB y seleccionar el directorio donde
se encuentra la herramienta matemtica diseada, tecleamos
escucha_direccional. Aparece entonces la pantalla de presentacin
siguiente:

Figura 6.3 Ventana de Presentacin

Pulsamos Continuar para acceder al programa. Se presenta ahora en pantalla
una eleccin que definir tres caminos diferentes en la aplicacin:

1. ANLISIS ESTTICO
Realiza un procesado de la seal de sonido para una direccionalidad
esttica.

106

2. ANLISIS DINMICO
Realiza un procesado de la seal de sonido para una direccionalidad
dinmica.
3. ESTADSTICAS
Generacin y presentacin de estadsticas y grficas comparativas entre
distintos factores que afectan a la direccionalidad.

Figura 6.4 Ventana de eleccin principal

Veremos cada una de ellas por separado. Alguna de las partes
contienen bastantes similitudes, as que se desarrollar primero el procesado
esttico y luego el dinmico explicando de ste ltimo slo las partes que sean
diferentes al primero.

6.2.1.- Anlisis Esttico

Tras pulsar ANLISIS ESTTICO aparece la pantalla principal del
procesado. Inicialmente se muestran deshabilitados algunos botones, los

107
cuales se irn activando conforme carguemos el archivo de sonido, el ngulo a
estudiar o procesemos la seal de entrada.

Figura 6.5 Ventana procesado esttico

Barra de men

La mayora de las pantallas que se describen a continuacin tienen una
barra de men similar con una serie de opciones comunes.

Ventana

Aparece un men desplegable con las opciones Inicio, Esttico,
Dinmico y Estadsticas que conducen directamente a la pantalla a
la cual hace referencia.

108

Figura 6.6 Men ventana
Carga

El desplegable contiene las opciones Carga Sujeto, Carga ngulo y
Carga Sonido que se explicarn a continuacin.

Figura 6.7 Men Cargar

Salir

Aparece la siguiente ventana de dilogo con dos posibles opciones:

Figura 6.8 Salir

Carga de Datos

Carga sonido

Aparece una ventana de dilogo de Windows para seleccionar el
archivo de sonido a procesar. Esta ventana se ejecutar tanto

109
pulsando en el botn Carga Sonido de la propia interfaz o en el
men de opciones.

Figura 6.9 Ventana procesado esttico. Carga Sonido

El archivo de sonido debe contener una seal monofnica, en el caso
de ser estereofnica, el programa se quedar slo con el primer
canal, y procesar los algoritmos sobre una nica seal. El sonido es
cargado y se prepara en el cuadro indicado de la pantalla. Adems
se habilita el botn Original que si lo pulsamos reproducir el sonido
que hemos elegido.

Carga ngulo

Pulsando en el botn de la pantalla Cargar ngulo o en la barra de
men se abre otra ventana diferente a la anterior donde se podr

110
elegir la localizacin virtual de la fuente de sonido a implementar. En
la parte derecha podemos definir los ngulos Theta y Phi que definen
la direccin del sonido, mientras que en la derecha encontramos el
botn Vista Previa el cual cargar en los cuadros inferiores unos
grficos que nos ayudarn a situar la fuente de sonido en el espacio
mediante dos vistas, una en el plano XY y otra en 3 dimensiones.

El botn Aceptar admite los ngulos y nos hace volver a la pantalla
principal donde se cargan automticamente los grficos vistos
anteriormente.

Figura 6.10 Venta carga ngulos

111
Cargar Sujeto

En la barra de men existe la opcin de Cargar. En el desplegable
se puede elegir Cargar Sujeto, con esta accin aparece una nueva
ventana en la que hay una cuadro de opciones donde elegir el sujeto
cuyas HRTF sern utilizadas en la implementacin del sonido
direccional. Una vez elegido el sujeto slo tenemos que pulsar
Aceptar para volver a la pantalla principal y observar que en cuadro
superior de la misma aparece el nombre de la persona voluntaria que
se ha elegido.

Figura 6.11 Eleccin sujeto

Procesado

Cuando se ha concluido el proceso de eleccin de voluntario, sonido y
direccin, se habilita la opcin de Procesado. Al pulsar sobre este botn y tras
esperar el tiempo necesario para la realizacin de este procesado de la seal
original, se habilitan el resto de los botones.

112

Figura 6.12 Procesado esttico completo

Ahora estn los botones Original, RA y HRTF que reproducen la
seal original, la procesada mediante la propagacin de ondas esfricas y la
procesada mediante las HRTF respectivamente.

Grficos

El botn Grficos conduce a una pantalla donde se pueden
comparar la seal de entrada con las salidas de ambos odos
procesadas por los dos algoritmos o incluso las mismas seales de
salida entre s.

113

Figura 6.13 Resultados grficos del anlisis esttico

6.2.2.- Anlisis Dinmico

Pulsando ANLISIS DINMICO en la ventana de eleccin principal
aparece la pantalla de procesado dinmico. Inicialmente se muestran
deshabilitados algunos botones, los cuales se irn activando conforme
carguemos el archivo de sonido, el ngulo a estudiar o procesemos la seal de
entrada para los dos algoritmos estudiados.

114

Figura 6.14 Ventana procesado dinmico

Se describe a continuacin las ventanas, pantallas y opciones que son
distintas a la opcin PROCESADO ESTTICO que se ha visto en el apartado
anterior.

Barra de men

La barra de men es idntica a la pantalla anterior, aunque las ventanas
a las que conducen tienen algunas diferencias notables que se describirn a
continuacin.

115
Carga de Datos
Carga ngulo

Al disponer slo de HRTF medidas a una distancia fija, el nico
movimiento que podemos describir con ste mtodo es el recorrido
de una curva a travs de una esfera de radio 1,4 metros.

En cuanto a la propagacin de ondas esfricas, no tiene sentido
definir un ngulo de elevacin, puesto que consideramos que la
direccionalidad que puede conseguir este algoritmo es slo en el
plano horizontal frontal. Con nimo de poder comparar la eficacia de
los dos algoritmos empleados, se define el movimiento como la curva
que recorre una circunferencia de radio 1,4 metros desde un punto
inicial definido por una Theta inicial hasta un punto final definido por
una Theta final.

116
Figura 6.15 Carga ngulos procesado dinmico
Si se pulsa el botn Vista Previa puede distinguirse el recorrido
en la grfica situada en la ventana. Como opcin complementaria se
puede definir el sentido del recorrido, horario o antihorario, desde el
punto inicial al final.

En la Figura 6.15 se muestra la ventana en la que se elige el ngulo
de partida y el de fin.

Procesado

Una vez concluida la eleccin de los parmetros, se habilitan las
opciones de Procesado HRTF y Procesado RA que realizarn la
ejecucin de las funciones cuyo resultado es la seal de salida
procesada. Se han separado ambas funciones de procesado por el
tiempo de computo que puede llegar a ser un poco elevado.

Figura 6.16 procesado dinmico completo

117

Al igual que en el caso anterior, tras el procesado se activan los
botones Original, RA y HRTF que nos permiten escuchar la seal
original y las procesadas.

6.2.3.- Estadsticas

Pulsando ESTADSTICAS en la pantalla de eleccin principal aparece
una ventana donde podremos elegir de nuevo 4 opciones:

Figura 6.17 Eleccin estadstica

1. GENERACIN ESTADSTICAS
2. ANLISIS ESTADSTICO
3. RECORRIDOS ANGULARES
4. COMPARACIN SUJETOS

118

Generacin de Estadsticas

Al cargar esta pantalla se muestra un cuadro de texto donde se
informa del sistema de referencias utilizado, para facilitar el relleno de
los cuadros de texto que posteriormente se utilizan para realizar las
estadsticas.

Figura 6.18 Cuadro de texto de sistema de referencias

La ventana principal presenta una serie de botones etiquetados
como Test X donde X es un nmero, si es pulsado uno de estos
botones, se reproducir un sonido previamente procesado por HRTF o
por Propagacin de Ondas Esfricas.

El usuario voluntario debe anotar en los cuadros de texto adjuntos
al botn los ngulos Theta y Phi que considere apropiados desde su
punto de vista. Como referencia se puede escuchar en todo momento la
seal original presionando sobre el botn correspondiente.

119

Figura 6.19 Generacin de estadsticas

Una vez rellenos todos los cuadros de texto, presionamos
Aceptar, esto conduce a una nueva pantalla donde se deben introducir
los datos del voluntario. Estos datos personales irn a almacenarse a la
Base de Datos Escucha, establecida en el origen de datos ODBC
mientras que los datos obtenidos en el test de sonido son almacenados
en una hoja de clculo LOTUS 123 WK1 que puede ser editada con
cualquier programa de Hojas de Clculo como por ejemplo Microsoft
Excel.

120

Figura 6.20 Introduccin de datos en la BdD

Anlisis Estadstico

En esta ventana se presentar el anlisis estadstico de los
resultados guardados en la hoja de clculo. En la parte derecha
tenemos una imagen donde se muestran las posiciones de los puntos
del test y los algoritmos utilizados en cada uno de los puntos.

Se puede ver las medias de las respuestas dadas por todos los
voluntarios y tambin los valores de un usuario en concreto, solo
necesitamos que introduzca su DNI en una pantalla que se muestra al
presionar el Botn Carga Sujeto.

121

Figura 6.21 Presentacin de resultados estadsticos

Recorridos Angulares

El objetivo de esta opcin es mostrar una comparativa entre
distintas respuestas impulsionales de un mismo sujeto desde distintas
posiciones. Se puede elegir el sujeto, el odo y el recorrido, siendo este
ltimo una de estas dos opciones:

Recorrido Theta. Con una elevacin de 0 (plano horizontal),
se establece un recorrido del ngulo Theta desde 0 hasta
360, siguiendo el sistema de referencias establecido para
todo el proyecto (0 frente y grados positivos hacia la derecha).
Recorrido Phi. Se fija un azimuth de 30 (configurable a otro
cualquiera si lo deseamos), y se recorre el ngulo de elevacin
desde 90 hasta 50.

122

Figura 6.22 Recorrido del ngulo Theta

Figura 6.23 Recorrido del ngulo Phi

123
Comparacin sujetos

En esta ltima opcin se comparan las respuestas impulsionales
de distintos sujetos para una misma direccin. Las posibles elecciones
son los dos ngulos que determinan la posicin de la fuente y los dos
voluntarios cuyas HRTF van a ser comparadas. Una vez elegidos los
parmetros y tras pulsar Aceptar se representarn en los cuadros
inferiores las grficas correspondientes a los odos izquierdo y derecho,
siendo el significado de los colores el siguiente:

Azul. Color de la FdT procedente del sujeto de la
izquierda.

Rojo Color de la FdT procedente del sujeto de la derecha.

Verde Color de la resta de ambas FdT. Mediante esta
grfica podemos apreciar lo parecidas que son las
dos HRTF.

124

Figura 6.24 Comparacin distintos sujetos

125

7.- Conclusiones y Lneas de Desarrollo

7.1 Conclusiones

El anlisis presentado en este proyecto permite obtener de una forma
cualitativa las seales estereofnicas de salida tras el procesado de una seal
monofnica de entrada. Podemos apreciar la diferencia entre las seales
procedentes del procesado a travs de HRTF y por medio del mtodo de la
propagacin de ondas esfricas.

La direccionalidad del sonido esta ligada intrnsecamente al entorno. En
la vida real tenemos la posibilidad de localizar un sonido mediante un
movimiento de la cabeza o simplemente por la situacin real en la que nos
encontramos. La creacin de sonido sinttico mediante ordenador nos impide
realizar este movimiento y, por tanto, localizar de manera eficaz la fuente de
sonido. No obstante los resultados obtenidos mediante el procesado de la
seal de sonido son bastante aceptables.

Mediante los dos algoritmos implementados podemos decir que en el
semiplano delantero horizontal est determinada la direccionalidad con un
rango bastante bueno. Si escuchamos un sonido procesado en distintas
posiciones podremos localizar sin dificultad cada una de estos lugares y
posicionar los focos de sonidos con un rango angular de 10-15 grados.

126
El mtodo de la propagacin de ondas esfricas mantiene limpia la seal
origen, ya que slo hace una traslacin de las muestras y las atena segn un
coeficiente constante. Mediante el procesado de HRTF podemos observar la
introduccin de una distorsin y una atenuacin no uniforme debido a que son
dos seales convolucionadas lo que obtenemos a la salida del filtro.

La direccionalidad adelante/atrs y arriba/abajo slo podemos obtenerla
mediante el mtodo de las HRTF. Con este proyecto hemos podido determinar
que ests direccionalidades estn ligadas intrnsecamente con la persona, y
que dependen muchsimo de sus caractersticas fsicas exteriores e interiores.
Es por ello que con una funcin de transferencia obtenida de un sujeto, slo
proporcionar direccionalidad arriba/abajo y adelante/atrs a este sujeto,
mientras que los dems sujetos que escuche un sonido que procede del
tratamiento de una seal con las HRTF de este sujeto, slo podr apreciar una
direccionalidad en el semiplano horizontal delantero.

7.2.- Lneas de desarrollo

7.2.1. Realizar HRTF individuales

Debido a la importancia de las HRTF individuales, la mejor opcin para
conseguir una direccionalidad mejor es implementar FdT especficas para cada
indivduo. Esto se consigue mediante loa obtencin de las HRTF especficas e
indivuduales de cada persona. Lo ideal sera conseguir estos sin necesidad de
introducir al sujeto dentro de una cmara anecica.

7.2.1 Convertir a un programa ejecutable

Tanto los algoritmos diseados como la interfaz grfica de usuario slo
funcionan bajo el entorno MATLAB. Sera interesante poder convertirlo a un

127
programa ejecutable (MATLAB contiene herramientas especficas para la
compilacin) y as se permitira la encriptacin de los cdigos y la utilizacin en
cualquier PC, sin necesidad de que tenga instalado el programa MATLAB.

128

8.- Bibliografa y Referencias

[1] Estorff O. V.: Boundary elements in acoustics : advances and
applications, Wit Press, 2000.

[2] Frank F.: Foundations of engineering acoustics, Academic Press. 2000.

[3] Haykin S.: Communication systems, John Wiley and Sons, 2000.

[4] Haykin S.: Adaptive filter theory, Prentice Hall, 1996.

[5] Kinsler L.E.: Fundamentals of acoustics, John Wiley & Sons, 2000.
Kinsler-Sanders, Coppens-Frey .

[6] Kinsler L.E.: Fundamentos de acstica, Limusa, 1990.

[7] Manilakis D.G., Proakis J.G.: Digital signal processing : principles,
algorithms, and applications, NJ Prentice-Hall PTR, 1996.

[8] Oppenheim Alan V., Schafer R.W.: Discrete-time signal processing.,
Prentice-Hall International, 1999.

[9] Oppenheim A. V., Willsky A. S.: Seales y sistemas Alan S.: Prentice-
Hall Hispanoamericana, 1998.

129
[10] Proakis J.G.: Digital communications, McGraw-Hill, 2001.

[11] Rosenhouse G.: Active noise control : fundamentals for acoustic design,
GWit Press, 2001

[12] Scott C. R.: Acousto-optic signal processing devices, Artech House,
1992.

[13] The Math Works Inc.: Matlab., Student Edition of MATLAB Version 5 for
Windows, Prentice Hall,1997.

[14] Williams E.G.: Fourier acoustics : sound radiation and nearfield
acoustical holography, Press, 1999.

[15] Duda R.: Modeling Head Related Transfer Functions, Twenty-Seventh
Asilomar Conference on Signals, Sistems & Computers, Asilomar, 1993.

[16] Pulkki V.: Uniform Spreading Amplitude Pannen Virtual Sources,
Workshop on Aplications of Signal Processing to Audio and Acoustics,
New York, 1999.

[17] Riederer K.: Investigation of multisensory spatial hearing: from the sense
of audition to multisensory interactions, Campfire: Acoustic Rendering for
Virtual Environments. Snowbird, Utah, 2001.

[18] Tollin D. J., Yin T. C. T.: Investigation of spatial location coding in the
lateral superior olive using virtual space simulation, Physiological and
Phychophysical Bases of Auditory Function, Maastricht, 2001.

130
Referencias en Internet

[19] Madariaga Imanol: Electroacstica. Apuntes de clase.

http://bips.bi.ehu.es/users/imanol/akustika/ElektroAkustikaApunteak.pdf

[20] Hartmann W. M.: How we Localize Sound, Physics Today On de Web.

www.aip.org/pt/nov99/locsound.html

[21] Researchers Uncover the Neural Details of How Barn Owls Locate
Sound Sources, Physics Today On Line.

http://www.physicstoday.com/pt/vol-54/iss-6/p20.html

[22] Mock J.E.: Experiments in Psychoacoustics.

http://wug.physics.uiuc.edu/courses/phys398emi/Student_Projects/Spring01/JM
ock/Jason_Mock_Paper

[23] Kendall G.: Directional Hearing and Stereo Reproduction.

http://www.northwestern.edu/musicschool/classes/3D/pages/sndPrmGK.html

131
[24] Stereo Recording Techniques, Deutsche Welle Radio Training
Centre.

http://www.dwelle.de/rtc/infotheque/stereo/stereo_recording.pdf

[25] Site Oube de Jrme Daniel.

http://gyronymo.free.fr/

[26] The Music, Mind and Machine Group, Instrument Identification and
Cochlear Implants.

http://sound.media.mit.edu/index.html

[27] La importancia de tener dos odos, Viviendo, oyendo y oliendo el Mundo.

http://www.hhmi.org/senses-esp/c220.html

[28] Gacetilla Matemtica. Notas matemticas

http://www.arrakis.es/~mcj/notas.htm

[29] Equivalencias de medida, Enciclopedia de la construccin.

http://www.construir.com/Econsult/C/Consulta/RENISON/document/medidas

132

ANEXO I : Posiciones angulares y resultados de
las pruebas

Se presentan a continuacin las posiciones angulares de las pruebas
realizadas as como los resultados obtenidos en las mismas. Como medida
estadstica tomaremos la media aritmtica 3 veces la desviacin tpica.

Las pruebas realizadas consisten en un grupo de 13 seales de sonido
modificadas mediante los algoritmos de propagacin de ondas esfricas y
mediante HRTF. Los resultados corresponden a 15 voluntarios que han
escuchados estos sonidos y han dispuesto las posiciones angulares de las que
les pareca provenir el sonido.

En la siguiente Figura 9.1 se muestran las posiciones reales de la fuente
de sonido. Se muestran en el plano horizontal, con lo que observamos slo el
grado azimuth. Para el plano elevacin se ha elegido elevacin igual a cero
para todas las pruebas, con el objeto de poder comparar los resultados de
ambos algoritmos, ya que como hemos comentado la propagacin de ondas
esfricas no tiene la posibilidad de implementar altura.

133

Figura 9.1 Disposicin angular de las pruebas realizadas.

A continuacin se muestran los resultados obtenidos por los 15
voluntarios. En el eje horizontal podemos observar los test efectuados, cada

134
uno caracterizado por un nmero al que se puede hacer referencia mirando la
Figura... y en vertical tenemos los resultados obtenidos por los voluntarios para
cada uno de estos archivos de sonido. Presentamos dos tablas, una para el
ngulo de azimuth y otra para el ngulo de elevacin.

T1 T2 T3 T4 T5 T6 T7 T8 T9 T10 T11 T12 T13
A -30 -80 30 -45 20 80 -20 20 -90 70 -60 15 90
B 20 -90 70 -60 20 100 -70 70 -70 45 -45 0 90
C 20 -70 60 -30 0 70 -45 25 -70 30 -30 0 70
D 0 -90 50 -50 0 90 -50 50 -90 50 -50 0 90
E 15 -80 40 -50 0 90 -70 50 -70 60 -50 10 90
F 10 -90 45 -45 10 90 -50 60 -80 70 -60 10 80
G -20 -70 45 -45 0 90 -60 40 -80 50 -40 0 75
H -30 -90 50 -50 0 80 -75 30 -90 40 -50 0 80
I 15 -90 60 -60 20 75 -30 60 -90 30 -45 0 90
J 30 -80 40 -70 -20 80 -20 70 -80 50 -50 15 80
K -20 -70 30 -70 -10 75 -40 30 -70 50 -60 30 90
L 10 -80 70 -50 -30 90 -50 50 -90- 60 -55 20 90
M 20 -90 50 -30 0 90 -65 40 -75 70 -45 -20 80
N 15 -80 40 -40 0 85 -75 60 -90 80 -60 -30 75
O -30 -90 30 -45 10 90 -40 50 -90 50 -30 010 80

Tabla 9.1 Resultados obtenidos para el ngulo de azimuth

135
T1 T2 T3 T4 T5 T6 T7 T8 T9 T10 T11 T12 T13
A -45 10 0 0 15 30 40 -15 -20 15 0 0 0
B -30 0 0 0 0 10 45 10 45 0 0 0 0
C 10 -15 0 0 0 0 0 0 0 0 -15 0 10
D 30 15 20 15 0 -30 -50 -30 -50 45 -45 30 60
E -45 10 0 0 10 45 10 45 -45 10 0 0 10
F -30 0 0 0 0 0 0 0 -30 0 0 0 0
G 10 -15 0 0 -30 -50 -30 -50 10 -15 0 0 -30
H 30 15 20 15 15 30 40 -15 -20 15 20 15 30
I -45 10 0 0 0 10 45 10 45 0 0 -30 -50
J -30 0 0 0 0 0 0 0 0 20 15 30 40
K 10 -15 0 0 0 -30 -50 -30 -50 0 10 45
L 30 15 30 40 -15 -20 -30 0 15 30 40 -15 -20
M 0 0 0 0 10 45 0 0 0 0 45 10 45
N 0 -30 -50 -30 0 0 0 -30 -50 -30 0 0 0
O 10 45 10 45 -30 -50 10 45 10 45 -50 -30 -50

Tabla 9.2 Resultados obtenidos para el ngulo de elevacin

Debido a la disparidad de los datos obtenidos en la pruebas en el caso
de la elevacin, se ha concluido que este valor es especfico de las HRTF y
que slo puede apreciarse si el voluntario escucha la seal de origen
procesada con su propia funcin de transferencia.

Como se puede observar, la mayora de los voluntarios han interpretado
que la fuente de sonido est situada en el plano horizontal delantero. Para no
falsear datos en la media, aquellos resultados que se siten en el plano
horizontal trasero, se les modificar el valor de modo que estn en el plano
horizontal delantero, de este modo los datos estadsticos sern ms fciles de
interpretar.

136
A continuacin de muestran los datos estadsticos de los resultados del
ngulo azimuth y elevacin.

Azimuth Elevacin

Media Media
T1 1.66 21.43 -6.33 28.37
T2 -82.66 7.98 3 17.8
T3 47.33 13.21 2 17.4
T4 -49.33 11.93 5.66 17.91
T5 1.33 14.07 -1.66 13.71
T6 85 8.01 -0.66 30.75
T7 -50.666 18.5 2 31.83
T8 47 15.78 -4 26.26
T9 -81.047 8.8 -9.33 32.06
T10 53 14.69 9 20.37
T11 -48 9.9 1.33 25.45
T12 4 14.9 3.66 20.65
T13 83.33 6.98 3.21 33.37

Tabla 9.3 Anlisis estadstico para los ngulos de azimuth y elevacin

En la tabla 9.3 se puede observar que la elevacin es muy dispar en la
mayora de las pruebas. Por el contrario encontramos unos resultados
bastante precisos en el ngulo de azimuth, teniendo en cuenta que siempre
nos referimos al semiplano horizontal delantero.

137

ANEXO II : Tiempos de procesado

El ordenador utilizado para la realizacin de este proyecto tiene las
siguientes caractersticas tcnicas.

Pentium III 500 MHz.
128 MB de memoria RAM.
Sistema Operativo Windows 98.
MATLAB 5.3.
Placa base Winex2
Tarjeta de sonido integrada en placa base.

Los tiempos de procesado en este equipo han sido para una seal de
sonido de 2,701 segundos de duracin a una frecuencia de muestreo de
22.050 Hz, lo que hace un total de 59.561muestras

Propagacin de ondas esfricas:
Posicionado esttico: 0.11 segundos
Posicionado dinmico 0 - 50: 980 segundos

HRTF:
Posicionado esttico: 1,59 segundos
Posicionado dinmico 0 - 50: 10,71 segundos

138
Recorrido azimuth: 5,55 segundos
Recorrido elevacin: 5,22 segundos

Y para una seal de sonido de 17,12 segundos de duracin a una
frecuencia de muestreo de 7.200, con un total de 123.298 muestras:

Propagacin de ondas esfricas:

HRTF:
Recorrido azimuth: 5,55 segundos
Recorrido elevacin: 5,22 segundos

Generación Sintética de Sonido Direccional

Hochgeladen von

Dokumentinformationen

Originaltitel

Copyright

Verfügbare Formate

Dieses Dokument teilen

Dokument teilen oder einbetten

Freigabeoptionen

Stufen Sie dieses Dokument als nützlich ein?

Sind diese Inhalte unangemessen?

Copyright:

Verfügbare Formate

Generación Sintética de Sonido Direccional

Hochgeladen von

Copyright:

Verfügbare Formate

Universidad de Sevilla

Departamento de Teora de la Seal

c se define como la impedancia caracterstica del medio que, en el

Das könnte Ihnen auch gefallen