Sie sind auf Seite 1von 80

leA

JUANA GI L FERNNDEZ

Los Sonidos
el Lenguaje
ISBN 84-7738-005-8

788 477 380 054

'

(11'
EDITORIAL

SINTESIS

LOS SONIDOS
DEL LENGUAJE

LOS SONIDOS
DEL LENGUAJE
JUANA GIL FERNNDEZ

EDITORIAL

SINTESIS

f;2. :l/
G 55
NS 006515:2 102

ndice
FL-II 00 'b:2Pginas

o.

Pres entacin .

1.

Nociones de acs ca ........... ... . .. ................ .

1.1. Las ondas sonoras.


1. 2. Propiedades de los sonidos
1.3. La resonancia.

Primera reimpresin: abril 1990


Segunda reimpresin: noviembre 1991
Tercera reimpresin: julio 2005

z.
Diseo de cubierta: Isidro beda

Reservados todos los derechos. Est prohibido, bajo las


sanciones penales y el resarcimiento civil previstos en
las leyes, reproducir, registrar o transmitir esta publicacin, ntegra o parciahnente, por cualquier sistema de
recuperacin y por cualquier medio, sea mecnico, elec-

3.

trnico, magntico. electroptico, por fotocopia o por


cualquier otro, sin la autorizacin previa por escrito de
Editorial Sntesis, S. A.
Juan Gil Femndez

4.

VaIlehermoso, 34. 280 15 Madrid


Telfono 91 593 20 98

ISBN: 8477380058
Depsito legal: M. 28.8902005
Impreso en Espaa - Printed in Spain

. .............. .

5.

II
II

20
26

La produccin del habla , , , .. . ...... , ...... , ... , ... . .. .

31

2.1.
2.2.
2.3.
2.4.
2.5.

Los rganos articulatorios.


La creacin de un flujo de aire
La fonacin.
Tipos de fuente
........... ,
La resonancia en el tracto vocal: los formantes ..... . .

31
37

Tcnicas instrumentales , .. . .. .. ". ", ., .. ... . . . .. .. ,.


3.1. Los primeros mtodos. . . . . . .. . ............ .
3.2. Las nuevas tcnicas
....... , .
3.3. La sntesis del habla ..

49

La audicin y la percepcin de los sonidos . . . . . . . . . .. ,

61
61

4.1. La audicin.
.. ............ .
4.2 . La percepcin del sonido. . . . . . .
. ..... , .

EDITORIAL SNJESIS, S. A.
http://www.sintesis.com

Descripcin y clasificacin de los sonidos . . . . . .. . , .. . .

5.1.
5.2.
5.3.
5.4,

La segmentacin de la cadena hablada.


La diferenciacin vocalconsonante ..
Las vocales: caractersticas articulatorias
...... , .
Las vocales: caractersticas acsticas ........ , . , .

38

42
44

49
51

59

65
71
71

73
76
84

5,5, S mlvoca les y semiconsonantes: aspectos


a rtic ula torios y acsticos .
5,6. Las consonantes: caractersticas articulatorias
5.7, Las consonantes: caractersticas acsticas.
6.

Los
6.1.
6.2.
6.3.

88

91
99

aUabetos fonticos
La transcripcin fon;i~a' . : : . : . : : : : . . ... : : . : . : . : . . .. ,
Los alfabetos fonticos .. .... .. , ..
Ejemplos de transcripcin

7. La combinacin de los sonidos .. .. ... . .. .... ...........


7.1. La slaba
7.2. Otras agrupaciones de s;~id;s ~~. I~ ~ad~n~ ... . . .
7.3. La coarticulacin y otros fenmenos combinatorios

8.

Los rasgos prosdicos . .. ... .. ... ................ .....


8.1. El acento .
8.2. Los rasgos prosdicos de tono

9. Aplicaciones de la fontica
9.1. La enseanza de segundas i~~~~~~
9.2. El reconocimiento de la voz y la identificacin del
hablante . .. .... .. ' . ... .. . . .... , ' . .
9.3. La patologa del habla ... ...... . . . .. ... . .. . . . .

..

,:: :. :: ::: ' :: :....

Glosario . . . . .. .. . .. ...... .. . . , . . .. ..... . . .... . . .


Referencias bibliogrficas . . . . . . . . . . . . . . . . .

. . ...

107
107
108

112
115

presentacin

115

123

124
127

127
130
137

137
138
140
147
151

De todos es bien sabido que los seres humanos tendemos a no


reparar en los objetos, en los paisajes o en los hechos que nos resultan
familiares y habituales. Sin embargo, cuando, empujados por circunstancias diversas, nos detenemos a examinarlos con una cierta atencin,
d escubrimos frecuentemente en ellos motivos de inters o de admiracin. Pues bien, nada hay ms familiar ni ms habitual para nosotros
q ue los sonidos con los que nos expresamos, a travs de los cuales nos
relacionamos y manifestamos nuestros sentimientos: los estamos emitiendo y escuchando permanentemente, nos educamos y vivimos con
ellos. Este libro es una breve reflexin acerca de esos sonidos y del
modo en que llegamos a producirlos y percibirlos, en un intento por
despertar, tambin en este caso, el inters del posible lector por uno
de los aspectos ms fascinantes de su propia existencia.
Es sta una obra introductoria , y , por tanto, en ella hemos pretendido abordar las principales cuestiones referentes a la naturaleza y al uso
de los sonidos en forma tal que cualquier persona, aun sin poseer
ninguna formacin lingstica especial, pueda entenderlas y asimilarlas
con facilidad. No obstante, creemos que este trabajo puede resultar
particularmente til para los estudiantes de Lingstica o Filologa, en
concreto para aquellos que deban cursar asignaturas como Fontica o
Fonologa . En todo caso, el profesor deber suplir con sus explicaciones las carencias que se aprecien en su contenido , por lo que el libro
viene a ser un texto de apoyo para su labor docente.
A pesar de la mencin conjunta que acabamos de hacer a ambas
disciplinas, debemos aclarar que ste es un libro de Fontica y no de
Fonologa. En otras palabras, nos hemos ocupado de los sonidos en
cuanto realidades fsicas, mensurables y registrables mediante procedimientos instrumentales , estudiando sus caractersticas y su combinacin en la secuencia hablada. Hemos dejado de lado, en cambio , todo lo
7

que se refiere a la funcin que estos sonidos cumplen en las distintas


I nguas, es decir, todo aquello que constituye el centro de atencin de
los fonlogos. Explicaremos mejor esta diferenciacin con un ejemplo.
En espaol, existe un sonido [kJ que no se pronuncia del mismo
modo si va situado delante de una [iJ, como en kilo, que si va situado
d e lante de una [o], como en copa. En el primer caso , la [kJ, que es un
sonido articulado en la parte posterior o velo del paladar , adelanta su
zona de articulacin por contacto con la [iJ , que es una vocal muy
anterior; en e l segundo, mantiene su zona habitual d e pronunciacin
porque la vocal [al es ella misma posterior. Este tipo de matices son
muy importantes para el fonetista, cuyo trabajo consiste precisamente
en sealarlos y explicarlos, pero no poseen especial relevancia para el
fonlogo , desde el momento en que el oyente no los percibe e interpreta ambos sonidos como realizaciones de un mismo elemento Ik/,
bien diferenciado de los restantes elementos fnicos que constituyen su
lengua y capaz de distinguir significados: Ikopal frente a Ipopa/, por
ejemplo. Estas unidades abstractas que interesan al fonlogo - y que,
no lo olvidemos, se manifiestan en el habla por medio de sonidos- son
los denominados fonemas. Se conciben como conjuntos de propiedades
mnimas simultneas, de carcter articulatorio o acstico, llamadas rasgos distintivos. El adjetivo distintivos se debe a que son estas caractersticas , estos rasgos, los que oponen los fonemas entre s dentro del
sistema de cada lengua, de modo que la sustitucin de uno por otro
conlleve siempre una variacin en el significado d e la palabra de que
se trate .
Pues bien, segn decamos , en este libro hemos prescindido, excepto en alguna referencia aislada , de todas aquellas consideraciones
que pudieran interpretarse como fonolgicas. Lo hemos hecho as movidos por diversas razones.
En primer lugar , frente al nmero relativamente alto de manuales
introductorios de fonologa que pueden encontrarse hoy en el mercado
bibliogrfico espaol, originalmente escritos en castellano o traducidos
de otras lenguas, las introducciones a la fontica son mucho menos
numerosas . Pareca por ello oportuno contribuir con esta pequea obra
a equilibrar mnimamente la situacin.
En segundo lugar, en la actualidad existen dentro del mbito de la
fono loga diversas escuelas o corrientes, cuyos planteamientos y mtodos difieren considerablemente entre s. Resultaba por tanto casi imposible ofrecer una visin completa de todas ellas en el espacio del que
disponamos, sin caer en simplificaciones inadecuadas .
En tercer lugar, creemos que la fontica y la fonologa son materias
muy relacionadas --como corresponde a dos disciplinas que comparten el mismo dominio o campo de estudio- pero independientes. La
8

It I minologa, los procedimientos de investigacin,


111 ntacin, todo es, en principio, distinto para la

los estilos de arguuna y para la otra.


I'odramos aadir, incluso, que existe una cierta desconfianza entre
1011 tistas y fonlogos, nacida , sin duda, de los prejuicios albergados
po r ambas partes. A este respecto, cabe recordar la clebre frase del
lonlogo N. S. Trubetzkoy , para e l cual la fontica era a la fonologa lo
que la numismtica a la economa . frase que ha sido replicada por
,!I n fonetista con la idea de que la fontica es a la fonologa lo que la
IIs lca a la metafsica. En cualquier caso, y dejando ya aparte estas
I'omparaciones discutibles, la opinin ms generalmente aceptada en11 la comunidad cie ntfica internacional es la de que se trata de dos
!!loterias que pueden abordarse por separado . Es cierto que en ocasiolIes se hace preciso afrontar un problema desde ambas perspectlVdS con lo que podramos denominar un enfoque hbrido, porque
!!luchas cuestiones fonolgicas tienen una explicacin fontica, y mu('has observaciones fonticas no son realmente relevantes hasta que
110 se comprueba su trascendencia para el sistema de la lengua .
I:sto, sin embargo, no invalida nuestra afirmacin inicial de que fo1I010ga y fontica son dos materias bien diferenciadas e indepen,II e ntes.
En los dos primeros capitulas de este libro, intentamos responder a
IdS preguntas bsicas que toda persona interesada en e l tema suele
hacerse , esto es, cmo y por qu se producen los sonidos del lenguaje .
Para ello, tenemos que explicar algunas nociones fundamentales de
,lcstica , que pueden ayudar al lector -especialmente al estudiante de
I.etras, cuya formacin al respecto suele ser escasa- a comprender el
complejo conjunto de fenmenos fsicos que tienen lugar en su aparato
fonador cada vez que emite un sonido. Dichos fenmenos estn, en la
actualidad, bien estudiados gracias al variado grupo de medios instrumentales de que disponen los fonetistas y a los que dedicamos el
captulo tercero .
No sucede lo mismo en lo que se refiere al proceso de percepcin
del habla : todava hay muchos puntos sin aclarar por completo y muchas interrogantes sin contestar, segn detallamos en el Capitulo 4. Los
Captulos 5 y 6, por su parte, presentan una visin general de los
criterios utilizados para clasificar los diversos tipos de sonidos, as
como una descripcin de los distintos alfabetos empleados para transcribirlos.
En e l Capitulo 7, estudiamos las posibilidades combinatorias de los
e lementos fnicos dentro de la secuencia hablada, las clases de agrupaciones a que dan lugar , y , asimismo, las modificaciones que los propios
sonidos experimentan al entrar en contacto unos con otros. El Captulo 8 est destinado a los llamados rasgos prosdicos o suprasegmenta9

les, es decir, aquellas propiedades que caracterizan un fragmento determinado del decurso fnico, no necesariamente coincidente con un
sonido.
Finalmente, hemos dedicado el Captulo 9 a revisar las aplicaciones
prcticas que el anlisis fontico tiene en diversos campos de conocimiento, algunos de ellos muy distantes de la Lingstica, como la Medicina o el Derecho.
A lo largo de todo el libro hemos empleado los smbolos del Alfabeto Fontico Internacional para transcribir los distintos sonidos a que
hacemos mencin. Como es prctica habitual, estos sonidos aparecen
entre corchetes, en tanto que los fonemas -a los que aludimos en muy
pocas ocasiones- aparecen entre barras oblicuas. Aunque no se trata
de un estudio especfico sobre fontica espaola, sino de una introduccin general, siempre que ha sido posible nos hemos servido de ejemplos tomados del castellano, con la esperanza de que, por conocidos,
resultarn ms clarificadores para el lector.
Antes de concluir esta breve presentacin, queremos agradecer a
los profesores Victoria Rodellar y Pedro Gmez Vilda, del Departamento de Electrnica de la Facultad de Informtica de la Universidad
Politcnica de Madrid, su inestimable ayuda en la confeccin mediante
ordenador de algunas de las figuras que acompaan al texto. Igualmente, agradecemos al profesor Francisco Marcos Marn la confianza
que deposit en nosotros, su apoyo y su paciencia: fueron tres factores
decisivos para la realizacin de esta obra.

Nociones
de acstica
1 .1.

Las ondas sonoras

Los sonidos del habla no son ms que un pequeo grupo dentro


del conjunto enorme de sonidos que el odo humano es capaz de
percibir. Todos ellos tienen una causa ltima comn: el movimiento.
Evidentemente, este movimiento puede ser de muchos tipos segn sea
producido por una fuente de sonido o por otra. Cuando hacemos sonar

1.1.1.

las cuerdas de una guitarra, por ejemplo, su movimiento produce un

resultado muy diferente al que se obtiene moviendo un diapasn o


dejando caer un jarrn al suelo. En todos los casos, sin embargo, el
impulso motriz que hemos transmitido a la fuente del sonido (las cuerdas de la guitarra, el diapasn o el jarrn) ha causado una perturbacin
considerable en la masa de aire circundante. Esta alteracin se ir
propagando desde las zonas ms cercanas a la fuente hasta la ms
lejanas, para alcanzar finalmente nuestro tmpano. As pues, desde el
momento en que se ha producido el movimiento original hasta que
nosotros percibimos el sonido a que da lugar transcurre un cierto
periodo de tiempo, en la mayor parte de las ocasiones tan breve que
nos resulta imperceptible.
La velocidad de transmisin de esta perturbacin es, en efecto, muy
elevada y depende del medio a travs del cual se produzca. Es sabido
que el agua es, por ejemplo, mejor transmisor que el aire: la velocidad
de propagacin llega, en la primera, a los 1.500 m/seg., en tanto que, a
travs del aire, es de 348 m/seg., aproximadamente.
I

10

11

Imaginemos que disponemos de un diapasn y movemos sus


puntas hasta conseguir escuchar su sonido caracterstico. Qu es lo
que ha ocurrido para que hayamos obtenido ese resultado?
La masa de aire que rodea al diapasn est dividida en partculas.
En aras de una mayor claridad en la explicacin, centraremos nuestra
atencin en slo nueve de ellas, a cada una de las cuales le hemos
asignado una letra diferente para identificarlas. Si observamos con
atencin la Fig . 1.1 , vemos que en la primera lnea horizontal, que
suponemos anterior en el tiempo a las dems, el diapasn no vibra y las
nueve partculas se mantienen en su posicin de reposo.

1.1.2.

Diapasn - - - - - - - - - - - - - - - - - - - - - - - - - A
B
C
D
E
F
G
H

V
Q
V

A
A

BCD

BCD

E F

C
B

BCD

B
A

A B
Figura 1.1.

BCD

V
V

A B

y
Q

V
Q
V

BCD

D E F

C
BCD

CD

G
F

F
E

BCD

H
G

[Tomado de Denes y Pinsan : 1963: pg. 30]

En la segunda lnea , sin embargo, las puntas del diapasn se han


movido como consecuencia de nuestro impulso, y, al abrirse, han desplazado a la partcula A que se encuentra, as, mucho ms cercana a la
partcula B. En la tercera linea, los brazos del diapasn han vuelto a su
posicin original, como parte de su movimiento vibratorio, y lo mismo
ha sucedido con la partcula A, que ha vuelto a su punto de origen no
12

sin antes haber desplazado a la partcula 8 hacia la e, transmitindole ,


de esta forma, su propio movimiento . Cada lnea horizontal representa
un momento en el tiempo posterior al representado por la lnea precedente y anterior al representado por la siguiente. Por e llo, en la cuarta
lnea, la partcula A ha sobrepasado su punto de reposo en direccin
opuesta, a causa de su propia inercia, acercndose al diapasn -ahora
con las puntas casi juntas- para, por fin en la quinta lnea, volver, al
igual que el diapasn, al estado de reposo desde el que comenzar de
nuevo todo el ciclo vibratorio. Lo mismo sucede con las otras ocho
partculas, segn puede apreciarse claramente en la Fig. 1.1.
Podemos ver, entonces, que cada partcula recibe el impulso motriz
de la partcula vecina y que todas ellas se comportan como un pndulo,
esto es, se desplazan desde su punto de reposo hacia cada lado una
cierta distancia para regresar de nuevo a l y reiniciar el proceso . De
este modo se transmite , a travs de toda la masa de aire, la perturbacln causada por la fuente, en nuestro ejemplo el diapasn.
Cuando las partculas estn ms prximas entre s de lo normal
decimos que existe un estado de compresin. Por el contrario, cuand~
se encuentran ms distantes entre s de lo habitual, hablamos de un
estado de rarefaccin . Si ahora observamos de nuevo la Fig . 1.1 comprobaremos que las zonas de compresin y rarefaccin (es decir, las
variaciones en la presin del aire) van transmitindose desde el ngulo
supenor lzqUlerdo hasta el extremo inferior derecho , a medida que ,
con el paso del tlempo, la perturbacin ha ido propagndose. Cuando
por fin alcance nuestro odo, sern estos cambios de presin , ms alta
-<:ompresin- o ms baja - rarefaccin-, los que nos harn percibir
la sensacin de sonido, en la forma que explicaremos detalladamente
ms adelante.
1.1.3. El tipo de fenmeno descrito en el apartado anterior recibe
el nombre de onda. Puede definirse como la propagacin de una perturbacln a travs de un medio
material como es el aire. en forma de una serie sucesiva de
compresiones y rearefacciones
alternas que afectan a cada una
de las partculas componentes
de ese medio . Representada en
un diagrama, la onda descrita
por las partculas,.4. B. etc., de
nuestro ejemplo anterior, sera
tal y como se representa en la
Fig. 1.2.
Fig. 1.2.
13

Esta onda reproduce el movimiento ondulatorio ms simple y es


exactamente del mismo tipo que la que obtendra un matemtico al
trazar el grfico de los valores del seno de un ngulo indefinidamente
en aumento a partir de O (v. Brosnahan y Malmberg: 1970, 12). Por ello,
es conocida con el nombre de onda sinusoidal o pendlCa slmple
(vase ms adelante, apartado 1.1.4). Por supuesto, en la prctica es
dificil constatar la realizacin de ondas tan simples como la que aqu
presentamos: los sonidos con los que estamos ms familiarizados, y
particularmente los lingsticos, responden a movimientos ondulatorios
mucho ms complejos que el de nuestro diagrama, como posteriormente veremos. No obstante, sobre este esquema, hasta cierto punto
terico, podemos estudiar los principales rasgos que caracterizan a una
vibracin.

ese lapso la onda B ha realizado d os vibraciones completas. Decimos ,


e ntonces , que el perodo de la onda A, esto es, el tiempo que tarda en
completar un ciclo, es el doble del de la ond a B. Aqulla realizar en la
unidad de tiempo considerada -convencionalmente e l segundo- la
mitad de ciclos que sta y por ello decimos que su frecuencia es
menor. En efecto, la frecuencia es el nmero de ciclos completos que
tienen lugar en un segundo y se mide en Hertzios (abreviado c.p.s. o
Hz). Lgicamente , el perodo y la frecuencia guardan entre s una
relacin inversamente proporcional: cuanto mayor sea el perodo, menor ser la frecuencia y viceversa.
Cuando una onda presenta una frecuencia muy baja (como en el
caso de los infrasonidos), el odo humano no puede percibirla. Al pasar
las hojas de un libro. por ejemplo. producimos una perturbacin en

Consideremos otra vez la onda de la Fig . 1.2, pero comparndola ahora con otra un poco diferente , tal como se hace en la Fig. 1.3.

porque su frecuencia no es lo suficientemente alta. Nuestros odos


interpretarn como sonidos las frecuencias comprendidas entre los 1620 C.p.S. Y los 20.000 c.p.s. Por encima de este limite (ultrasonidos)
tampoco percibiremos nada, quiz porque nuestro tmpano no puede
vibrar a tales velocidades (vase Captulo 4. apartado 4.1.2). La mayora de las frecuencias importantes en e l habla se sitan entre los 50 y los
8.000 Hz.
Volviendo a nuestras dos ondas, A y B, comprobamos que mantienen entre s todava una diferencia ms. La masa que est vibrando y
describiendo con su movimie llto el perfil de la onda A (pensemos que
se trata de una de las nueve partculas de la Fig. 1.1) se separa ms de
su punto de reposo que aquella otra cuya vibracin representa la onda
B. La primera recorre, aproximadamente, el doble de la distancia que
se aleja la segunda. Por ello se dice que la onda A tiene mayor amplitud
que la onda B. La amplitud se define como el mximo desplazamiento o
elongacin de un cuerpo en vibracin con respecto a su punto de
reposo . En nuestro ejemplo, la amplitud de la onda A es la distancia
x- x' y la de la onda B es y-y'.
A pesar de todos estos rasgos que las distinguen, las dos ondas
tienen tambin, como sinusoides que son, una propiedad comn: ambas
son peridicas o repetitivas . Una onda peridica es aquella en la que el
mismo perfil del ciclo se repite a intervalos de tiempo regulares. Lgicamente , todas las ondas sinusoidales son peridicas, pero existen
otros muchos sonidos peridicos -como veremos en el siguiente
apartado- que no presentan esta forma tan simple. Tenemos un ejemplo en la Fig. 1.4, donde hemos incluido , asimismo, el perfil de una
onda aperidica o no repetitiva , con sus alteraciones caractersticas,
para que pueda apreciarse la diferencia entre ambos tipos de oscila-

1.1 .4 .

x'

Onda B

Onda A

Figura 1.3.

Es, en primer lugar. evidente que nuestras dos ondas, a las que
hemos llamado A y B, son dos sinusoides, es decir, dos movimientos
oscilatorios sumamente simples. En ambas, a un aumento d e presin le
sucede un descenso de sta, esto es, a la fase de compresin le sucede
la de rarefaccin. La suma de estos dos momentos es lo que denominamos ciclo . En otras palabras, un ciclo es una vibracin completa o, si se
prefiere, la variacin completa desde la cresta de la onda (mxima
compresin) hasta el valle de la onda (mxima rarefaccin) y nuevamente a la cresta (Borzone de Manrique : 1980, 20).
El ciclo de la onda A tarda en realizarse 0,0 1 seg., en tanto que en
11

el aire que a veces incluso llegamos a sentir, pero que no omos

ciones.

15

En el apartado anterior ya
sealbamos que existen ondas
peridicas no sinusoidales. Estas
ltimas no son, en realidad, sino el
tipo ms sencillo de ondas repetitivas y, como tambin dijimos , no
abundan entre los sonidos que nos
resultan familiares. En concreto,
las ondas sonoras que genera
nuestro aparato vocal y que aqu

1.1.5.

Onda peridica

nos interesan casi nunca son sinu-

soidales (la correspondiente a un


silbido sera quiz la ms similar

Onda A

Se'lal sinusoidal de amphtud UnIdad


y l OO Hz de frecuencia

en su forma acstica a una sinusoi-

de). No obstante, cualquier onda


peridica que podamos imaginar,
como la de la Fig. 1.4, por ejemplo,
est formada por la combinacin
de dos o ms ondas sinusoidales.
En este sentido, se la denominar
Onda aperidica

Figura 1.4.

Estrictamente hablando . cualquier sonido que consideremos posee


una onda aperidica. porque las variaciones de la presin del aire no
se repiten exactamente igual de forma indefinida. A medida que los
sonidos se van amortiguando, la amplitud disminuye y los ciclos no son
ya idnticos . Sin embargo, la prctica habitual es desatender estos
matices, puesto que no suponen errores importantes y, sin ellos, la
descripcin acstica resulta ms simplificada. As pues, seguiremos
dividiendo las ondas en peridicas y aperidicas (v. Ladefoged: 1962,
3 1 Y 48).

16

Senal sinusOidal de amphtud


0,5 y 200 Hz de frecuencia

onda compleja.

Cuanto ms compleja es una


onda , ms componentes sinusoidales o armnicos la conforman y ms
complicados son los movimientos
de las partculas de aire que le
han dado origen. Ello es as porque los cuerpos elsticos vibran
simultneamente de distinto modo
a como lo hara, por ejemplo, un
diapasn . Si pulsamos una cuerda
de guitarra o de piano, vibrar
como un todo, es decir, en su longitud total, a una velocidad o frecuencia determinada, pero cada
una de sus partes lo har tambin,
a la vez y a frecuencias ms altas.
De esa forma , se generan varias
ondas simples de diferentes valores frecuenciales, que, superpuestas, constituyen la compleja resultantes . En la Fig. 1.5 tenemos un
ejemplo .

Onda

C\

C\

C\

Seal sinusoidal de amplitud


0,25 y 300 Hz de frecuenCia

Suma

Suma tres sunusOldes;


(1 A-lOO Hz). (0,5 A-200 Hz)
(0,25 A-300 Hz)

Figura 1.5.

17

La onda de ms baja fr ecuencia, A, es la frecuencia fundamental CF;')


Las otras, B y e, son los armnicos , parciales o hipertonos. Estos armnicos se numeran como si el fundamental fuera de hecho el armnico
nmero 1: as, la onda B es el segundo armnico y la e, el tercero.
Como se puede observar en el diagrama, la frecuencia de la onda
compleja coincide siempre con su frecuencia fundamental, que , en
nuestro supuesto, es de 100 Hz, o c.p.s. Las frecuencias de los armnicos, por su parte, son todas ellas mltiplos de la fundamental: el segundo armnico tiene dos veces la frecuencia del fundamental , el tercero
tiene tres veces la frecuencia del fundamental, etc. Por consiguiente, la
frecuencia fundamental es el mximo comn divisor de las restantes
frecuencias componentes.
Este mtodo de descomposicin de la onda compleja peridica se
conoce con el nombre de anlisis de Fourier, porque el teorema en el
que se sustenta fue formulado por el matemtico francs del siglo XIX
Joseph Fourier. La sintesis de Fourier, por el contrario, permite el
proceso inverso, es decir, la reconstruccin de una onda compleja a
partir de todos sus componentes.
1.1.6. Una onda compleja perg
ridica puede representarse mu\
cho ms fcilmente de como lo
\
,,
hicimos en la Fig. 1.5 si nos ser,
,,
vimos de otro tipo de diagrama
,,
en el cual el eje de ordena,,
das registre la amplitud (esto es,
la mxima elongacin o desplazamiento) de cada componente, y e l de abscisas, su frecuenHz
100
200
300
cia respectiva. La onda de la
Fig. 1.5 serfa, por tanto, la de la
Figura 1.6,
Fig. 1.6.
Segn vemos, las amplitudes relativas de los armnicos se corresponden con la longitud tambin relativa de las lneas verticales que los
representan. No es preciso asignarles valores numricos absolutos
porque la forma de la onda compleja viene determinada por la fuerza
relativa de todas sus ondas integrantes. A un diagrama como el que
hemos logrado se le denomina espectro del sonido. En principio, es
posible obtener el espectro de cualquier onda compleja, pero conviene sealar que, aunque esta prctica nos informa acerca de qu frecuencias la componen y con qu amplitudes se presentan, no nos especifica el modo en que se combinan para configurar la onda. Puede
ocurrir, por ejemplo, que todas e llas se encuentren en el mismo mo-

mento de su ciclo vibratorio, o puede suceder. por el contrario. que


mientras algunas estn en un determinado estadio del ciclo . otras no
hayan llegado a l o lo hayan sobrepasado. En el primer caso, se dice
que las ondas estn en fase; en el segundo, que estn fuera de fase. El
perfil de la onda compleja vara en uno y otro caso. En la actualidad.
existe cierta polmica sobre si la diferencia de fase afecta o no a la
cualidad del sonido resultante. La mayora de los autores consideran
que el odo no capta el efecto de la discordancia de fase entre las
frecuencias componentes de una onda compleja (v. Quilis: 1981.50), as
que ste es un factor que no se tiene en cuenta habitualmente en
fontica.
Por lo que respecta a las ondas ape ridicas o no repetitivas, todas
ellas son complejas, pero, a diferencia de las peridicas, poseen componentes de todas las frecuencias y de ms o menos idntica amplitud.
As pues, pese a que tambin pueden analizarse en forma de espectro,
ste no estar formado por una serie de lneas verticales discretas
representando al fundamental y a sus armnicos mltiplos, sino que
constar de slo una lnea continua que. con su movimiento ascendente
o descendente. indicar la amplitud de la vibracin en cada frecuencia .
En la Fig . 1.7 presentamos una onda compleja aperidica y su correspondiente espectro. Obsrvese que en l la curva es lo que indica que

18

r--J

II
V

V
Figura 1.7a.

19

ms dbil dependiendo de varios factores que nosotros tendremos en


cuenta para conseguir el efecto deseado. Sabemos, adems, que este
sonido posee una cualidad absolutamente diferente a la que caracteriza
al producido por la cuerda de un violn, as que - aunque quiz slo
intuitivamente- somos conscientes de las tres principales formas en
que los sonidos pueden diferir entre s: en tono, en intensidad o sonia y
en timbre .

!OOO

2000

3000

4000

SOOO

6000

' 7000

0000

9000

Frecuencia (Hz)

Figura l.Ib.

la energa del sonido est muy dividida entre toda la gama de frecuencias,

Existen, por consiguiente, dos tipos de espectros: los de lnea, que


describen generalmente a las ondas complejas peridicas, y los continuos, que caracterizan a las aperidicas.
Para elaborar los espectros propios de cada sonido, en particular
de los del habla, se utiliza un aparato de fcil manejo denominado
espectrgrafo o songrafo. del que volveremos a hablar con detenimiento en prximos capitulas.

1.2.

Propiedades de los sonidos

De todo lo explicado anteriormente podemos extraer una primera clasificacin de los sonidos en sonidos m usicaJes o armnicos y
ruidos. Los primeros son el producto de ondas peridicas y, en consecuencia, son ms regulares, ms meldicos y ms agradables al odo.
Los segundos resultan de ondas aperidicas yeso les confiere su carcter irregular y poco musicabl. Adelantaremos que, por lo que se
refiere a los sonidos del habla, las vocales, por ejemplo, son sonidos
musicales, en tanto que algunas consonantes, como la [s], son ruidos .
Pero sta no es la nica diferenciacin posible entre sonidos. Para
cualquiera de nosotros es evidente que el sonido producido por la
cuerda de una guitarra puede ser ms bajo o ms alto y ms fuerte o

1.2.1.

20

1.2.2. El tono o la tona es la impresin auditiva que nos produce la


frecuencia de una onda sonora. Es, por tanto, una cualidad subjetiva
dependiente de una propiedad fsica. Cuanto mayor sea la frecuencia
de un movimiento oscilatorio, es decir, cuanto ms deprisa se sucedan
sus ciclos de vibracin, ms alto ser el tono del sonido resultante. As
pues, una onda con 100 Hz de frecuencia producir un sonido ms bajo
q~~rn~~fu
.
En una onda compleja peridica, el tono depende de su frecuencIa
fundamental (Fo) que, como dijimos, es la frecuencia de repeticin de la
onda . En una vibracin aperidica, sin embargo, la altura tonal vIene
dada por el conjunto de frecuencias componentes predominantes .
Lgicamente , los objetos ms pesados y de mayor tamao vibran
ms despacio que los pequeos y ligeros, por lo que los sonidos que
generan los primeros poseen un tono ms bajo que los originados por
los segundos: un contrabajo tiene cuerdas ms gruesas y largas que
un violn y ello explica la diferencia tonal de sus somdos caractersticos.

Si queremos variar el tono de un determinado sonido, habremos de


modificar su frecuencia, lo que puede lograrse de diversas maneras .
Podremos cambiar las dimensiones de la fuente, que, como acabamos
de sealar, son determinantes: cambiar, por ejemplo, la cuerda larga
del contrabajo por la corta del violn o al revs. Podemos, tambin,
aumentar o disminuir la tensin de esa misma fuente: si tensamos las

cuerdas del violn, la frecuencia ser mayor; si las aflojamos, la frecuencia disminuir . Y, finalmente, podemos alterar la masa de la fuente
y ello ha de afectar, asimismo, a la frecuencia : una cuerda ms gruesa
vibrar con menos rapidez que una ms fina. Conviene recordar estos
principios, porque se aplican al funcionamiento de las cuerdas vocales
durante el proceso de produccin del habla (vase Captulo 2, apartado 2.2.2).
En los sonidos de frecuencias bajas -inferiores a 1.000 Hz-. un
simple cambio de 2 o 3 c.p.s. entraa ya una variacin en el tono. En las
frecuencias altas, por el contrario, la modificacin ha de ser ms importante para que se interprete como una alteracin de la tona. Ello explica que las diferencias tonales entre sonidos de 400 y 600 fu, por
21

ejemplo, sean ms perceptibles que las existentes entre frecuencias d e


4,400 y 4.600 c.p .s .
La unidad utilizada para medir el tono de los sonidos es e l me/o
Convencionalmente se acepta que a un sonido con una frecuencia
de 1.000 Hz, le corresponde un tono de 1.000 meles . A partir de
ah pueden calcularse los valores tonales de cualquier sonido, de tal
modo que los pares de sonidos separados por idnticas cantidades de
meles mantendrn tambin entre s las mismas diferencias de altura
tonal.
Si, segn hemos explicado, la frecuencia de una onda sonora
condiciona e l tono del sonido percibido, su amplitud, en cambio, determina la intensidad de ese sonido, o, hablando en trminos psicolgicos
y subjetivos, su sonia.
Cuando pulsamos la cuerda de una guita rra con mucha energa, el
resultado que obtenemos es un sonido ms fuerte que el que conseguimos al taer esa misma cuerda con mayor delicadeza. En el primer
supuesto, hemos originado un movimiento ms amplio de la fuente, que
.se traduce en un movimiento tambin ms amplio de las partlculas del
aire, o lo que es igual, en una
mayor fluctuacin de la presin
area. Los ciclos de la onda soa'
nora correspondiente tendrn, en
consecuencia, una amplitud con- ( \ -siderablemente mayor que los
Onda A
a
V
de la onda provocada en el sev
gundo supuesto, lo que explica
el diferente grado de intensidad
de los dos sonidos resultantes.
Supongamos que deseamos
dilucidar cul de los dos sonidos
Onda B
representados por las ondas A
y a de la Fig. 1.8 posee ms so
na , esto es, cul sentiremos ca
mo ms fuerte y cul como ms
Figura 1,8.
dbil.
Si consideramos nicamente los mximos de amplitud alcanzados,
entonces la onda A seria con claridad el sonido ms fuerte , puesto que
la distancia a-a' es superior a la b-b'. Pero es claro que sta no sera
una compa racin vlida . Habremos de hallar e l valor medio de la
amplitud para cada onda y comparar posteriormente los resultados
alcanzados. El valor medio de la amplitud de una onda o valor de
eficacia se calcula anotando en una escala de presiones los valores que
1.2.3.

22

presentan todos los puntos por los que pasa una lnea como la x o la y
de la Fig . 1.8. Despus, esos valores se elevan al cuadrado, de forma
que los negativos pasen a positivos, se suman los cuadrados, se divide
el resultado entre el nmero de puntos considerado y se extrae la raz
cuadrada de la cantidad obtenida. Comprobamos as que la amplitud
de ondas como la a de nuestro ejemplo es mayor que la de ondas como
la A, a pesar de lo que pudiera pensarse a primera vista. Este procedimiento matemtico simple se emplea tambin cuando las ondas objeto
de anlisis son sinusoidales.
Dado que la onda a posee mayor amplitud media que la onda A,
segn acabamos de explicar, la intensidad de la primera ser igualmente mayor que la de la segunda. El trmino intensidad, utilizado en
este contexto, no debe interpretarse en e l sentido en que lo usamos
habitualmente, esto es, como fuerza, vehemencia o energa. sta
sera, ms bien, la definicin de la impresin subjetiva que hemos
denominado sonia. Por el contrario, la intensidad en acstica es una
caracterstica fsica inherente a la propia onda sonora, fcilmente mensurable en el laboratorio y definible como la potencia acstica que se
transmite a travs de una onda, medida en una superficie de un centmetro cuadrado perpendicular a la direccin de propagacin de dicha
onda. Qu entendemos por potencia acstica? Se trata simplemente de
la energa que posee cualquier partcula en movimiento y que se va
transmitiendo de unas a otras a partir del lugar en que se encuentra la
fuente de sonido .
La intensidad es proporcional al cuadrado de la amplitud de la onda
sonora, de manera que un aumento en sta de 10 dinas por centmetro
cuadrado (la dina es la unidad de fuerza que se emplea para medir la
presin del aire y se expresa siempre en relacin a un centmetro
cuadrado) supondra un aumento en la intensidad de 100 watios.
El watio por centmetro cuadrado es, en efecto, una de las unidades
en las que puede calcularse la intensidad. Una intensidad de 10 - 16
watios, esto es, de una diezmilsima de una millonsima de una millonsima de un watio/cm2 , es ya suficiente para producir un sonido audible. Con todo , la intensidad o potencia acstica de una onda sonora
suele medirse con mucha frecuencia en otra unidad distinta del watio y
que, a diferencia de ste, no tiene un valor prefijado, sino que es una
unidad relativa: nos estamos refiriendo al decibelio (abreviado da). El
hecho de adoptar esta unidad se debe a que , en la mayor parte de los
casos, los fonetistas, o los fsicos en general, no estn interesados en
conocer los valores absolutos de intensidad de un sonido, sino en saber
cul es su nivel de potencia con respecto a otro u otros. Consiguientemente, cuando decimos que la intensidad de un sonido es de x decibelios, queremos decir en realidad que ese sonido posee una intensi-

23

dad mayor en una proporcin determinada que la d e otro sonido. Lo


que importa, entonces, es la razn o ratio -en el sentido matemtico
del vocablo, esto es, en una comparacin, el exceso de un trmino
sobre el otro-- que mantienen entre s los sonidos confrontados.

En principio, podemos valorar la intensidad de una onda sonora con


respecto a cualquier otra con la que la relacionemos, pero , en la prctica, los especialistas han establecido como punto de referencia el sonido
que posee una pote ncia de 10 - 16 watios, del que hablbamos antes y en
torno al cual se ha e laborado toda la escala de decibelios. La diferencia
en decibelios entre dos sonidos, de acuerdo con dicha escala, se define
como diez veces el logaritmo de su razn de potencia acstica o intensidad. La explicacin ms simple puede darse sobre la tabla que presenta P. Ladefoged en sus Elements of Acoustic Phonetics (pg. 82):
Razn o relacin

de intensidad
entre los sonidos
la a 1

Logaritmo de
la razn

Diferencia en

10

decibelios

100 a 1

20

1.000 a 1

30

etc.

etc.

etc.

Para calcular el logaritmo, lo nico que hay que hacer es contar el


nmero de ceros que indican la proporcin o razn de los dos sonidos.
Despus, multiplicamos esa cifra por diez y ya obtenemos la cantidad
de decibelios que separan a los sonidos en cuestin.
Por lo que respecta, finalmente, al atributo psicolgico de la sona,
se ha propuesto como unidad de medicin conveniente el sano, hacindolo corresponder con la sona producida por una onda sonora de
1.000 Hz , con una intensidad de 40 dB. Los oyentes que hayan de juzgar
sobre el grado de sona de un sonido determinado utilizarn la escala
numrica construida en virtud de esta unidad, segn la cual una onda
con una sona de 2 sanos es dos veces ms intensa, desde el punto de
vista subjetivo, que una con slo 1 sano, y sta, por su parte , ser
tambin el doble de intensa que la onda que posea 1/2 sano.
1.2.4. En orden a entender correctamente la diferencia entre frecuencia y amplitud y sus propiedades derivadas, tono e intensidad, convie-

ne aclarar que un cambio en la amplitud no implica un cambio en la


frecuencia . Por ejemplo, un pndulo que describe un movimiento de
poca amplitud, porque se le ha transmitido un impulso pequeo, efec24

ta, en un segundo o en un minuto, el mismo nmero de vibraciones

que efectuara si sus movimientos tuvieran una mayor amplitud como


respuesta a un impulso inicial ms fuerte . Ello es debido a que la
frecuencia depende siempre de las caractersticas fsicas del cuerpo en
vibracin. As pues, si queremos cambiar la de nuestro pndulo, habremos de modificar sus dimensiones, hacindole ms largo (menor
frecuencia) o ms corto (mayor frecuencia) .
Un cambio en la intensidad de un sonido tampoco debe conllevar,
consecuentemente, una variacin en su tono. Sin embargo, esto no es
del todo cierto. En general, al aumentar la intensidad de un sonido cuya
frecuencia sea superior a 1.500 Hz, se produce una elevacin proporcional del tono . Por el contrario, si la frecuencia de la onda sonora
considerada es inferior a los 1.500 Hz, el aumento de la intensidad
provocar el descenso del tono. Estas modificaciones son, no obstante,
muy poco importantes, por lo que podemos seguir manteniendo a
efectos expositivos la asociacin de la intensidad con la amplitud y del
tono con la frecuencia.

La ltima propiedad que caracteriza a los sonidos y los diferencia entre s es, como hemos dicho (vase apartado 1.2.1), el timbre, la
cualidad acstica propia de cada uno de ellos. As, la misma nota
musical, tocada con idntico tono
e intensidad, no sonar igual en
[u]
una guitarra que en un lad; diferir en timbre .
El timbre depende de la configuracin particular que presente
el espectro (vase el aparta300 700
do 1.1.6) de la onda compleja,
de modo que dos sonidos se
F,
percibirn con timbre diferente
[i]
si el nmero y la amplitud relativa de los armnicos que compo-

1.2.5.

nen sus ondas son, asimismo,


2()()()
300
distintos. En la Fig. 1.9 aparecen
los espectros correspondientes a
Figura 1.9.
las vocales espaolas [u] e [i].
Puede apreciarse fcilmente que la vocal [u] tiene los armnicos de
mayor amplitud situados en la zona de frecuencias bajas, mientras que ,
e n el caso de la [i], hay una gran cantidad de armnicos, algunos de
ellos de considerable amplitud, en las fre cuencias altas. La primera
vocal, la [u], es, por tanto , un sonido grave; la [i] , en cambio, es un
sonido agudo.

25

Ahora bien, para explicar cmo es posible que dos ondas sonoras
como las que aparecen en la Fig. 1.9, producidas por la misma fuente
-la vibracin de las cuerdas vocales-, tengan una composicin tan
diferente , es preciso entender un concepto fundamental en fontica
acstica, el de resonancia , al que dedicaremos los prximos apartados.

1,3.

La resonancia

1.3.1, Los cuerpos en general tienen dos modos distintos de vibrar.


Pueden, en primer lugar, verse desplazados de su estado de reposo al
recibir un impulso externo y continuar, a partir de ese momento, vibrando libremente a su frecuencia natural, es decir, a la frecuencia que
le es propia de acuerdo con sus caracteristicas fsicas (vase nuestro
apartado 1.2.4). Si movemos, por ejemplo , las puntas de un diapasn,
ste vibrar exactamente en la forma que acabamos de describir. En
segundo lugar , los cuerpos pueden tambin comenzar a vibrar al verse
contagiados por la vibracin de otro cuerpo. Las oscilaciones del
diapasn anterior se transmitirn fcilmente a una mesa con tan slo
apoyar su base sobre ella. De igual manera, las vibraciones de las
cuerdas de una guitarra provocarn perturbaciones en la masa de aire
contenida en la caja del instrumento.
Pues bien, al fenmeno por el cual un cuerpo se p one en movimiento
a causa de las vibraciones de otro cuerpo se le conoce con el nombre
de resonancia. El cuerpo o volumen que se ve afectado se denomina
resonador.
Para que la resonancia se produzca es preciso que la frecuencia
natural de vibracin del resonador se asemeje a la de la fuente de
sonido. As, si colocamos muy prximos entre s a dos diapasones de la
misma frecuencia y hacemos vibrar a uno de ellos, los movimientos de
esta vibracin original actuarn como pequeos golpes en el otro
diapasn, al que pondrn tambin en movimiento. Pero esto slo se
producir si los golpes de las molculas llegan al segundo diapasn
en el momento adecuado, esto es, si la frecuencia natural de ambos
cuerpos coincide . Ladefoged (1962, 57) ejemplifica muy claramente esta
idea, utilizando un smil que Borzone (1980, 34) traduce:
Supongamos que un nio quiere hamacarse (sic) . Comenzamos por
dar un pequeo empujn a la hamaca, que se desplaza alejndose de
nuestra posicin. Luego, cuando la hamaca vuelve y se encuentra en el
punto mximo de su desplazamiento hacia atrs, aplicamos otro empujn. Este aumentar la amplitud del vaivn y as, con golpes sucesivos,
se alcanzar el mximo balanceo. ( ... ) Supongamos que se aplica el
segundo empujn a la hamaca cuando sta est todava volviendo hacia

26

nuestra posicin. En lugar de aumentar la amplitud del balanceo, el


vaivn disminuye, y si los golpes sucesivos se dan siempre antes de
que se complete el vaivn, la hamaca se detiene .
En otras palagras, la velocidad en que se suceden las compresiones
y rarefacciones de la onda incidente (la onda que produce el primer
diapasn) debe corresponderse con la frecuencia natural del resonador (nuestro segundo diapasn) y, entonces, no slo el primero resuena en el segundo, es decir, le hace moverse, sino que las amplitudes
de ambos movimientos se suman y el sonido que obtenemos se refuerza.
Estos objetos - los diapasones- producen, como hemos visto, ondas sinusoidales. Pensemos ahora qu sucede con las ondas complejas.
Sabemos que la composicin de dichas ondas se refleja con claridad en
el diagrama que denominamos espectro (vase apartado 1.1.6), el cual,
al indicarnos todas las frecuencias de vibracin de un cuerpo, y sus
amplitudes relativas, nos est informando tambin de cules son las
frecuencias a las que ese cuerpo responder mejor si acta como
resonador. Dado un espectro como el de la Fig. 1.6, por ejemplo,
podremos deducir que la fuente que ha producido esta onda compleja
entrar en vibracin fcilmente si le llega una onda de alrededor de
100 Hz de frecuencia, puesto que sta es su propia frecuencia natural
de vibracin. Por ello, y a pesar de que no coinciden estrictamente, la
frecuencia natural de vibracin de un cuerpo se considera tambin su
frecuencia de resonancia y de ah que la curva de resonancia de un
cuerpo coincida con la curva de su espectro. En nuestro ejemplo de la
Fig. 1.6, la curva nos indica que este cuerpo o volumen de aire resonara algo a las frecuencias de 200 y 300 Hz, pero con menor efectividad a
frecuencias mayores.
As pues, una curva de resonancia no es sino la representacin de la
conducta potencial de un resonador (v. Brosnahan y Malmberg:
1970, 26).
1.3.2. Los sonidos que estimulan a un resonador y lo ponen en movimiento, es decir, las ondas incidentes que llegan a l, se denominan
entrada del resonador. Las que resultan de la vibracin del resonador
en respuesta a esta entrada se conocen, en cambio, con el nombre de
salida.
Si al cuerpo cuya curva de resonancia se corresponde con la de
la Fig . 1.6 le hacemos llegar una entrada como la representada en
la Fig . 1.10, la salida resultante tendr la forma del diagrama de la
Fig . 1.11 : la vibracin ptima estar situada en torno a los 100 Hz y
ser la que posee mayor amplitud . Los armnicos de 50 y 150 Hz presentarn ya una menor amplitud, que ir descendiendo cada vez ms

27

a medida que nos acerquemos a las frecuencias ms alejadas de la


frecuencia natural de vibracin o frecuencia de resonancia del cuerpo
en cuestin.

,"
,,

100

200

300

Figura 1.10.

400

...

,,

500 Hz

Figura l.ll.

La gama de frecuencias a la que un resonador responde con efectividad se llama ancho de banda y abarca todas aquellas frecuencias con
una amplitud de por lo menos el 70,7 por 100 de la amplitud de su

que no deje pasar las frecuencias superiores a los 600 Hz. Como es
lgico, nuestro filtro dejar pasar los armnicos de 200, 400 Y 600 Hz y
eliminar todos los restantes componentes de la onda compleja inicial.
Se tratar, entonces , de un filtro de paso bajo. porque permite e l paso a
las seales comprendidas entre O y la frecuencia de corte (en nuestro
ejemplo, 600 Hz). Si, por el contrario, este resonador fuera diseado
para transmitir las frecuencias superiores a la frecuencia de corte y
eliminar las inferiores, sera un filtro de paso alto. Finalmente, un filtro
de pasa banda dejara pasar toda una banda de frecuencias cuyo ancho
se determina previamente.
Segn veremos en prximos captulos, el tracto vocal humano es un
tubo que acta como resonador y cuya forma varia como resultado de
los movimientos de los distintos rganos articulatorios. Estas modificaciones conllevan cambios en las frecuencias de resonancia de los volmenes de aire contenidos en cada una de las cavidades que lo conforman y ello constituye, realmente, la base de las diferencias entre los
sonidos del habla.

frecuencia de resonancia. En nuestro ejemplo anterior, el resonador

sera realmente efectivo en el margen comprendido entre los 50 y los


150 Hz, porque cualquier frecuencia dentro de esos lmites posee, al
menos, el 70,7 por 100 de la amplitud de la frecuencia de 100 Hz. El
efecto de un resonador puede describirse, por tanto, especificando su
frecuencia de resonancia (en nuestro ejemplo, 100 Hz), Y su ancho de
banda (en este caso, 100 Hz).
Ya explicamos que la intensidad de un sonido dependa del cuadrado de la amplitud (vase apartado 1.2.3). Eso significa que si la intensidad de un determinado sonido es la mitad que la de otro. la amplitud
de ese primer sonido ha de ser 0,707 veces la del segundo, puesto que
el cuadrado de 0,707 es 0,5, es decir, la mitad. Por consiguiente, la
cantidad de 70,7 por 100 que se marca como criterio para establecer el
ancho de banda no es arbitraria: todas las frecuencias que poseen una
amplitud de ese valor con respecto a la frecuencia de resonancia tienen
por lo menos la mitad de su intensidad y no se diferencian de ella en
ms de 3dB.
En algunos casos, un resonador puede actuar como filtro. De
hecho. un filtro no es ms que un resonador con capacidad selectiva
respecto a las frecuencias, utilizado para transmitir o pasar un sonido.

1.3.3.

Supongamos que tenemos una fuente de sonido que emite energa

acstica en forma de ondas de 200, 400, 600 Hz, etc., hasta un mximo
de 2.000 Hz , e imaginemos tambin que diseamos un filtro de tal modo
28

29

La produccin
del habla

2.1.

Los rganos articulatorios

2.1.1. Ninguno de los rganos que utilizamos habitualmente en la produccin del habla tiene como funcin principal esta actividad. Los pulmones, por ejemplo, nos sirven para respirar; la lengua y los dientes
intervienen en el proceso de ingestin de alimentos, etc. Sin embargo,
puesto que todos ellos son parte fundamental del mecanismo de articulacin del lenguaje, es lcito denominarlos rganos articulatorios y dedicar algn espacio a su descripcin.
2.1.2. En la Fig . 2.1 se muestra la seccin longitudinal de todo el
aparato fonador. En su parte inferior puede apreciarse con claridad el
diafragma , los pulmones y la trquea , los cuales constituyen las cavidades infraglticas .
El diafragma es un msculo delgado en forma de cpula que separa

el trax del abdomen y sobre cuya superficie superior se apoyan los


pulmones. Debido a la accin muscular, el diafragma puede alterar su
forma al perder parte de su curvatura, desplazndose hacia abajo y un
poco hacia adelante. Ello origina el aumento del tamao de la caja
torcica, en la que estn situados los pulmones, y la consiguiente expansin de stos.
Los pulmones son dos rganos de textura porosa y esponjosa, compuestos bsicamente por muchos pequeos saquitos de aire, los alveolos pulmonares, en los que se efecta el proceso de purificacin de la

31

Paladar
blando
Hioides
Epiglotis
Cartilago
cricoides _ _

Il -

do cricoides, que recuerda por su configuracin a una sortija de sello ,


con su parte ms ancha detrs. En realidad, el cricoides es el ltimo de
los anillos superiores de la trquea, segn puede apreciarse en la
Fig . 2.2. Sobre el cricoides, y articulado con sus laterales, est el cartlago ms importante, el tiroides, constituido por dos grandes lminas
cuadrangulares dispuestas en forma de escudo, unidas en ngulo agudo por la parte anterior y separadas por completo en la posterior. La
unin de ambas puede apreciarse con facilidad -especialmente en el
caso de los varones- como una protuberancia (por debajo de la piel)
conocida por nuez de Adn. Asimismo, sobre la zona posterior del
cricoides se asientan dos pequeos cartlagos con forma de pirmide,
los aritenoides, que poseen gran movilidad, pudiendo rotar y desplazarse paralelamente con respecto al eje longitudinal de la articulacin
cricoaritenoidea (Fig. 2.2) .
Hoides

Esfago

_-f,~o;':j

Epiglotis

Tiroides -'!&r'r'---;
Tiroides
Aritenoides
cricoaritenoideo
posterior

Cricoides

Figura 2.1.

sangre. Rodeados por una membrana, la pleura, los pulmones se encuentran, como hemos dicho, en la caja torcica, circundados por las
costillas y apoyados sobre el diafragma.
La trquea es un tubo de alrededor de 11 cm de largo, constituido
por anillos cartilaginosos abiertos, dividido en su parte inferior en dos
ramas o bronquios por los que conecta con los pulmones, y unido en
su parte superior con la laringe o cavidad gltica en el modo que a
continuacin se describe .
La laringe es una caja cartilaginosa situada en el extremo
superior de la trquea. La base de la laringe es el cartlago denomina-

2.1.3.

32

'Trquea -~..;,;;:

_ Trquea

Cartilagos de la laringe

Cartilagos de la laringe

(cara anterior)

(cara posterior)

Figura 2.2.

Desde las apfisis vocales de los aritenoides, esto es, las partes ms
salientes en su cara interna, hasta el ngulo interior de la parte delantera del tiroides (nuez), se extienden dos msculos gemelos, recubiertos
por mucosa larngea, con un cono elstico reforzado por fibras elsticas. Son los repliegues vocales, o, como se les ha llamado tradicionalmente, las cuerdas vocales.

33

El espacio triangular que existe entre las cuerdas vocales se denomina glotis, por lo que a la cavidad larngea se la conoce tambin como
cavidad gltica . La glotis puede variar de dimensin en funcin de la
posicin que adopten las cuerdas vocales. As. al rotar los aritenoides
hacia adentro, las cuerdas vocales se juntan, lo que provoca el cierre
de la glotis . Si, por el contrario , las cuerdas vocales se separan debido
a la rotacin hacia el exterior de
los aritenoides, la glotis se abre
en mayor o menor grado. En la
Fig. 2.3 se aprecian las posiciones ms frecuentes que suelen
ji;
presentar las cuerdas vocales . Su
tensin puede regularse llevando hacia adelante el cartlago tiroides (al que, recordemos, esCue rdas
Durante
En
vocales
la e misin
vibr acin
tn sujetas las cuerdas por uno
en la
de una
de sus extremos) de modo que
re spiracin
consonante
sorda
las partes anteriores de los cartlagos tiroides y cricoides se
acercan .
Figura 2.3.

Ji

la laringofaringe, desde el cartlago cricoides hasta el hueso hioides, la


orofaringe, desde el hueso hioides al velo del paladar y la rinofaringe
desde el velo del paladar hacia arriba, es decir, hacia la parte posterior de la cavidad nasal (Figs. 2.1 Y 2.2) .
Las dimensiones de la faringe no son uniformes a lo largo de toda su
e xtensin, segn puede apreciarse en nuestros diagramas . Su parte
media es ms ancha que las restantes, si bien el tamao de cada una de
estas zonas puede modificarse por los movimientos de distintos elementos: el volumen de la laringofaringe, en primer lugar, depende de
los desplazamientos de la laringe, la lengua y la epiglotis; el de la
orofaringe, de la posicin ms retrada o ms adelantada que adopte la
lengua, y, finalmente, el volumen de la rinofaringe y su intervencin en
el proceso de produccin del sonido depende de la disposicin de la
parte final del velo del paladar (vase, ms adelante, este mismo apartado).
La cavidad oral se extiende desde la orofaringe hasta los labios, que
la limitan por su parte anterior. Sus paredes laterales son la cara interna
de las mejillas, en tanto que su techo est formado por el maxilar
superior con los dientes, el paladar duro y el paladar blando . La parte
inferior -el suelo})- de la boca est ocupada casi por completo por la
lengua .

El control de la abertura gltica impide que penetren en las vas


respiratorias cuerpos extraos, funcin sta a la que contribuye en
gran medida la epiglotis, cartlago con forma de cuchara que, a modo
de lengeta, cierra la entrada de la laringe a los alimentos .
Toda la laringe puede desplazarse hacia arriba y hacia abajo. Se
eleva en el momento de la deglucin, por ejemplo, o durante la emisin
de sonidos agudos; desciende cuando bostezamos o producimos sonidos graves . Sus movimientos varan el volumen de las cavidades supraglticas y la presin del aire en ellas contenido . Veremos a continuacin cules son las caractersticas de dichas cavidades .
Las cavidades farngea , oral y nasal, conectadas entre s , completan el conjunto de los rganos del habla . Algunos autores distinguen
an una cavidad ms, la labial, que se formara al redondear los labios
por delante de los dientes para la pronunciacin de algunos sonidos
(vase, por ejemplo , Brosnahan y Malmberg : 1970, 39 y 43). Sin embargo , el criterio adoptado ms generalmente la considera parte integrante de la cavidad oral, sin dejar de sealar por ello la influencia que el
redondeamiento de los labios tiene en la caracterizacin acstica final
de los sonidos que lo requieren.
La faringe es un tubo membranoso que conduce de la laringe a la
boca y a las fosas nasales. En ella se diferencian, por tanto, tres zonas:

En la Fig. 2.4 se indican las principales zonas que se diferencian


dentro de la cavidad oral y que, posteriormente, nos servirn para
localizar y describir los distintos sonidos.
El tamao y la forma de la cavidad bucal varan en funcin de la
movilidad que caracteriza a algunas de las estructuras que la constituyen . As, los labios pueden -como decamos anteriormente- alargar
la cavidad al redondearse y proyectarse hacia afuera, en tanto que la

Incisivos

2.1.4.

34

YeIo del paladar

Labios

' \ - f - - - - vula

Lengua

Alveolos

Figura 2.4.

35

abertura y la conformacin general de la boca cambian de acuerdo con


los movimientos de la lengua y del maxilar inferior.
No todos los rganos que componen la cavidad oral son mviles o
activos. Los dientes superiores, la protuberancia alveolar o alveolos y
el paladar duro son rganos pasivos o inmviles sobre los que actan
la lengua o los labios para articular determinados sonidos.
La lengua es el articulador activo ms importante. Puede dividirse
en tres zonas: el pice o punta; el dorso, que, a su vez, se subdivide en
predorso, mediodorso y postdorso , y la ralz, que es, al mismo tiempo,
la pared anterior de la orofaringe (Fig. 2.5). La lengua, debido a su
peculiar estructura, puede tanto extenderse ms all de los dientes
aproximadamente 5 cm como retrotraerse hasta 3 cm dentro de la
cavidad; elevarse (como un todo O en las diversas partes que la componen) hasta llegar a tocar el techo de la boca, o bien descender para
dejar paso libre a la corriente de aire proveniente de los pulmones.
Todos estos movimientos, y algunos ms que aqu no mencionamos, son
fundamentales para la articulacin de cada sonido y por ello merecen
una descripcin ms detallada (vase el Captulo 5). Normalmente conllevan desplazamientos concomitantes de la mandbula o maxilar
inferior, el nico hueso mvil de
MediOdorso
Predorso
Postdorso
la cara, de modo que cuando la
lengua desciende para dar lugar
Dorso
a una articulacin abierta, la
mandbula tambin lo hace y el
ngulo formado por los dos maxilares se ensancha. Por el contrario, en las articulaciones ce-

rradas, la lengua se eleva y el


ngulo maxilar es, asimismo,
Figun 2.5. Partes de ta lengua.
ms agudo.
La cavidad nasal presenta una forma y unas dimensiones fijas : ninguna de sus partes realiza movimientos musculares independientes.
Est dividida por el tabique nasal en dos canales paralelos, o fosas
nasales, que se abren al exterior por los orificios o ventanas de la nariz
y que se comunican, en su parte posterior, con la rinofaringe por otros
orificios denominados coa nas. Las paredes de la cavidad nasal estn
recubiertas por una mucosa gruesa y hmeda.
Si la vula, esto es, el apndice final del velo del paladar, conocida
vulgarmente como campanilla, est elevada contra la pared de la
faringe, la comunicacin entre la boca y las fosas nasales se ve
interrumpida; si est cada y separada de la faringe, el paso entre
ambas cavidades permanece abierto .
36

2.1.5. Llamaremos al conjunto de las cavidades infraglticas, gltica y


supraglticas tracto vocal. Hay que precisar, sin embargo, que, en
opinin de muchos autores, el tracto vocal es tan slo la zona comprendida entre la laringe y los labios, con una longitud prxima a los 17 cm
(Denes y Pinson: 1963, 48; Borzone de Manrique: 1980, 45; Ladefoged:
1975, 3, entre otros). Si nosotros hemos optado por una interpretacin
ms amplia del trmino, siguiendo a algunos fonetistas (Catford : 1977,
17), es porque resulta ms til para la descripcin fontica utilizarlo con
tal sentido. De este modo, el tracto vocal puede entenderse como un
mecanismo neumtico consistente en un par de fuelles (los pulmones),
conectados con un tubo (la trquea) con un pistn (la laringe) en su
parte superior. Este pistn, que puede subir y bajar, tiene en su
interior una vlvula (la glotis) y, sobre l, tres cavidades (farngea, oral
y nasal) con, a su vez, un nmero determinado de vlvulas (la vula, los
labios, la lengua).
Aunque existen obvias diferencias entre el tamao del tracto vocal
en hombres, mujeres y nios - lo que explica sus distintas cualidades
de voz- no parece haberlas (al menos de importancia) entre los tractos
vocales de las diversas variedades tnicas, y ello permite considerar el
tracto vocal y su funcionamiento como factores universales, sobre los
que habr que basar la descripcin y clasificacin de todos los sonidos
que el hombre es capaz de producir. En los siguientes apartados trataremos de explicar cmo acta nuestro aparato fonatorio.

2.2.

La creacin de un flujo de aire

Dijimos en el Capitulo primero (vase apartado 1.1 .1) que para


que se produzca cualquier tipo de sonido es preciso que previamente
haya existido un movimiento en la fuente que lo origina. El caso de los
sonidos del habla no es una excepcin.
En primer lugar, se hace necesaria la creacin de una corriente, de
un flujo de aire en el tracto vocal. En la mayor parte de las ocaSlOnes,
los pulmones, a los que hemos comparado con dos fuelles (vase apartado 2.1.5) son los encargados de crear esa columna de aire que sale al
exterior durante la espiracin.
Para comprender todo el proceso, conviene recordar que el aire
fluye siempre de las zonas de presin ms alta a las zonas de presin
ms baja. Asi, para que se produzca la primera fase de la respiracin,
llamada inspiracin, el volumen de la caja torcica debe aumentar
mediante la accin del diafragma y los msculos intercostales externos.
Como todo aumento del volumen torcico supone una expansin de los
pulmones, la presin del aire en ellos contenido desciende hasta hacer-

2.2.1.

37

se menor que la presin atmosfrica y e llo produce un flujo de aire


ingresivo, es decir, que penetra en los pulmones. Durante la segunda
fase, la espiracin, e l diafragma y los msculos intercostales vuelven a
su situacin anterior (vase apartado 2.1.2) y, consiguientemente, el
volumen de los pulmones desciende, la presin interna aumenta y el
aire es expulsado hacia el exterior en una corriente egresiva.
Cuando hablamos, la fase de espiracin se prolonga un poco ms
q ue durante la respi racin habitual en silencio, debido a que la articulacin de un gran nmero de sonidos entraa la obstaculizacin de la
corriente de aire en alguna o varias zonas del tracto oral.
Aunque el sistema anteriormente descrito es el ms frecuentemente utilizado para crear un flujo areo, existen otros mecanismos de
los que podemos servirnos . La laringe, tiene, segn sealamos (vase
apartado 2.1.3) una cierta movilidad. Pues bien, e l ascenso de la laringe , con la glotis cerrada, disminuye el volumen de la faringe y origina
tambin una corriente egresiva de aire; su descenso causa, por el
contrario, un flujo ingresivo. Independientemente, la lengua puede llevar a cabo vahos movimientos que generen, asimismo , un flujo de este
tipo : si bloquea, por ejemplo, la cavidad oral en un punto del paladar y,
preservando el b loqueo, se desplaza hacia adelante producir una
corriente egresiva; si lo hace hacia atrs, una ingresiva.
Estos procedimientos larngeos y orales, sin embargo, provocan
flujos de pequea magnitud comparados con la corriente que crean los
pulmones, sobre la cual se articulan, por otra parte, todos los sonidos
de la lengua espaola .
2.2.2.

2.3.

La fonacin

Una vez que contamos con un flujo de aire continuo, el siguiente


paso consiste en poner ese volumen de aire en vibracin , de modo que
origine ondas sonoras tal y como explicamos en el captulo anterior. En
un gran nmero de sonidos esto se logra mediante la accin de las
cuerdas vocales, en el proceso que denominamos fonacin . En el momento en que va a iniciarse la emisin , los pliegues vocales se juntan e
impiden que el aire pase a travs de ellos, por lo que la presin del
aIre en la parte del tracto vocal inferior a la glotis aumenta considerablemente. Cuando esta presin subgltica excede a la presin que
mantiene juntas a las cuerdas, stas se separan y pasa un golpe de aire,
generndose de inmediato entre los propios pliegues una fuerza
de succin (conocida como efecto Bernoulli por el fsico suizo del
siglo XVIII , Daniel Bernoulli, que lo describi) que los acerca y cierra
2.3.1.

38

de nuevo la glotis. Suponiendo que no vare el ajuste muscular de los


uritenoides, este proceso contina repitindose en forma peridica y
cada uno de los golpes de aire que se van sucediendo pone en vibracin a los volmenes de aire contenidos en las zonas supraglticas del
tracto vocal, los cuales resonarn a diferentes frecuencias en funcin de
la configuracin que presenten las diversas cavidades.
A la vibracin producida de este modo en las cuerdas vocales se la
denomina tono larngeo. En la Fig. 2.6 aparecen representados su espectro y su perfil. Como puede apreciarse, se trata de una onda compleja peridica que posee una frecuencia fundamental (Fo) de considerable amplitud, y unos armnicos, mltiplos del fundamental, muy dbiles, pero abarcando un amplio margen de frecuencias (vase, a este
respecto, lo que explicamos en el apartado 1.1.5 sobre el modo de
vibrar de los cuerpos elsticos). La frecuencia de vibracin que alcanzan las cuerdas depende de su propia tensin, de su masa y de la
presin subgltica que exista en
lO
e l canal vocal: cuanto mayores
sean esta pr,?sin Y la tensin
de los pliegues, ms alta ser
la frecuencia de vibracin y el
tono del sonido emitido ser ms
agudo (vase Captulo 1, apartado 1.2.2); cuanto ms finas y
ms cortas las cuerdas -como
O ~~~~~~~~~600 1200 1800 2400 3000 3600
lo son las de las mujeres y los
Frecuencia
nios- ms elevados tambin
Figura 2.6. Tono glotal.
la frecuencia y el tono del sonido.
Por lo que se refiere al resto de los armnicos componentes su
debilidad es tal, que no podramos percibir ningn sonido si no existieran unas cavidades resonantes, a
lo largo del tracto vocal, que los
10
amplificaran. En la Fig. 2.7 pueden verse las modificaciones que
ha sufrido el tono larngeo al articularse la vocal [a). Lo que ha
sucedido, en efecto, es que las
cavidades situadas ms arriba de
la glotis - algunas, no todas , en
este caso-- han actuado como
OLU~~
~~1~200
~~~~LUILfiltros acsticos (vase apartaFrecuencia
do 1.3.3) sobre la onda compleja
Figura 2.7.
inicial facilitando el paso y refor-

39

zando a determinados componentes (concretamente los comprendidos


entre los 500 y los 1100 Hz y entre los 1200 y los 1500 Hz) y eliminando o debilitando las frecuencias ms alejadas de las resonantes .
Los armnicos que se refuerzan son distintos para cada sonido . Para
ello es necesario que varen las dimensiones de los resonadores en
cada caso, lo que se consigue por medio de la articulacin , esto es,
mediante los movimientos o posturas de los rganos articuladores para
interrumpir o modificar la salida de la corriente de aire, continua y
uniforme. Fonacin y articulacin no son, pues, trminos sinnimos y
as conviene recordarlo.
Ms adelante hablaremos con detenimiento de la articulacin, pero,
por lo que concierne a la fonacin, cabe an sealar que sO,bre ella se
han formulado diversas teoras. La que hemos expuesto aqUl se conoce
con el nombre de teora mioelstica de la produccin de la voz (entendiendo por voz la vibracin de las cuerdas vocales). En ella se
asume, segn hemos explicado , que los pliegues vocales vIbran como
resultado de la presin sub gltica combinada con el llamado efecto
Bernoulli y en funcin de las propiedades elsticas caractersticas de
las mismas cuerdas . Durante los aos cincuenta, sin embargo, el cientfico francs Raoul Husson propuso una nueva teora denominada neurocronxica, segn la cual las vibraciones larngeas no tendran este
origen mecnico o aerodinmico que se les supone, sino que responderail a la estimulacin y contraccin nerviosa experimentadas rtmicamente por los msculos de las cuerdas vocales, cuyo movimiento
estara, por tanto, dirigido por el cerebro mediante impulsos nerVIOSOS.
Esta teora neurocronxica no cuenta en la actualidad con muchos defensores, en tanto que la mioelstica es aceptada generalmente y, por
ello, la hemos presentado aqu.
La actividad fonatoria de la laringe descrita en el apartado anterior divide a los sonidos en sordos si la glotis est abierta y no hay, en
consecuencia, vibracin, y sonoros si se dan todas las condiciones
enumeradas y se produce un tono larngeo modificado con posterioridad en el tracto vocal. Pero, adems de stas, la laringe presenta otras
posibilidades fonatorias .
. .
Consideremos, en primer lugar, el caso de las lenguas que dlstmguen sonidos aspirados de sonidos no aspirados. En ingls, por ejemplo, determinadas consonantes como la [p], ~a [t] o la [k] ,. SI van en
posicin acentuada inicial de palabra, se realIzan como aspIradas. No
as en otros contextos . Pero, en qu consiste la aspiracin?
Cuando articulamos cualquier sonido, sea ste sonoro o sordo , las
cuerdas vocales empiezan a vibrar inmediatamente despus de que
desaparezca la constriccin existente en el tracto. De esta manera,

p ues, en un sonido sonoro la glotis vibrar antes y despus del relajamie nto de dicha constriccin (cierre absoluto o estrechamiento), en
tanto que en un sonido sordo slo lo har una vez que la salida del aire
se vea libre de obstculo . Pues bien , en el caso de los sonidos aspirados , sordos generalmente, las cuerdas vocales no comienzan a vibrar
hasta un cierto tiempo despus de desaparecer el obstculo formado
e n las cavidades superiores, por lo que una determinada cantidad de
aire escapa antes de iniciarse el sonido siguiente . Consecuentemente,
la dicotoma aspirado/no aspirado est basada en la sincronizacin de
los movimientos articulatorios con la actuacin de las cuerdas vocales.
La laringe puede presentar, por otra parte , estados intermedios en
los que la glotis no est ni abierta ni cerrada por completo .
Una posibilidad es que las partes posteriores de las cuerdas, es
decir, las zonas directamente unidas a los cartlagos aritenoides, estn separadas y las partes anteriores, sin embargo, estn juntas y vibrando .
En esas circunstancias, se producir un sonido que podramos denominar suspirado , porque su mecanismo de produccin es el mismo
q ue acta en los suspiros y, en general, siempre que la espiracin se
hace audible . En este tipo de emisiones, la velocidad de salida de la
corriente de aire experimenta un aumento considerable y , si queremos

2.3.2.

40

Sonido
sordo

Sonido
sonoro

Voz rota

Voz
suspirada

Voz susurrada
Figura 2.8.

41

suprimir el efecto obtenido, habr, por tanto, que reducirla por medio
de los msculos respiratorios. El sonido [h) del ingls comprehensive,
por ejemplo, responde a estas caractersticas.
Si, por el contrario, las partes posteriores de las cuerdas vocales
estn unidas y son las anteriores las que dejan pasar el aire, vibrando al
mismo tiempo, tenemos la as llamada voz rota o cascada.
Finalmente , en el susurro o murmullo, las cuerdas vocales se acercan e, incluso, pueden llegar a juntarse por su parte delantera , dejando
un espacio ms amplio entre los cartlagos aritenoides.
Todas estas modalidades de fonacin , esquematizadas en la Fig. 2.8,
junto con otras en las que no nos vamos ahora a detener , pueden
combinarse entre si, de modo que las variedades fnicas se multiplican. Vemos, pues, que la actividad de la laringe ofrece un gran nmero
de posibilidades para la realizacin de sonidos distintos.

2,4,

Tipos de fuente

2.4.1. Consideremos ahora el caso de los sonidos que hemos llamado


sordos, es decir , aquellos en los que la corriente de aire atraviesa la

glotis abierta sin generar turbulencia o ruido alguno. En ellos no acta


una fuente peridica o glotal o, dicho en otros trminos, no ha existido
una vibracin de las cuerdas vocales que haya originado el tono larngeo inicial. En consecuencia, debe haber otra fuente, aunque ya no sea
peridica (de pulsos repetidos a intervalos regulares) como la larngea,
sino que produzca ruido turbulento y/o transitorio . Dicha fuente de
ruido , creada mediante la accin de los diferentes articuladores, estar
situada en alguna zona del tracto vocal y consistir, bsicamente, en un
estrechamiento o un cierre de ste.
Si, por ejemplo, articulamos una [s)-que es un sonido consonntico
sordo- el flujo de aire atraviesa libremente la glotis, pero se ve obligado a pasar a travs de una zona estrechada del tracto, a la altura
aproximada de los alveolos superiores. Cuando una corriente rpida
de aire atraviesa una constriccin se crean, como sabemos, turbulencias en ella. Estas perturbaciones, que son aleatorias (en cuanto que no
son previsibles las alteraciones que sufren las partculas a partir de su
estado de reposo), constituyen una fuente de ruido turbulento . La [s) es,
pues, un tipo de sonido de ruido turbulento producido por un estrechamiento.
Si pronunciamos, en cambio , una [p) - tambin consonante sordajuntamos los labios, cerramos el canal e impedimos as la salida del aire
durante una o dos centsimas de segundo. En ese breve periodo de
tiempo no se genera energa acstica alguna (recordemos que la fuente
glotal no ha intervenido), pero la presin del aire detrs del cierre

42

formado por los labios aumenta de forma considerable, hasta que, al


separarse bruscamente stos, es liberada y acta como un nico estmulo para excitar los volmenes de aire contenidos en las cavidades
del tracto. Por lo tanto, la [p) es un sonido producido con un ruido de
explosin debido a la accin de una fuente transitoria .
2.4.2. Los dos tipos de fuente que acabamos de describir en el apartado 2.4.1 pueden combinarse entre s y con la fuente glotal. Por consiguiente, su actividad no est restringida a los sonidos sordos - aunque
en ellos es decisiva-, sino que se extiende tambin a algunos sonidos
sonoros. Veamos algunos ejemplos.
El sonido [6), de ido, por ejemplo, es el resultado de la accin de
la fuente peridica o glotal -dado que es sonoro- y de una
fuente de ruido turbulento ocasionada al crearse un estrechamiento entre la punta de la lengua y la cara interna de los incisivos superiores.
El sonido [b) posee tambin dos fuentes, la glotal-es sonoro- y
la de ruido transitorio , puesto que se articula con un cierre absoluto del canal, como la sorda [p).
La consonante [tn es decir, la eh espaola de chato, chopo, etc.,
combina una fuente de ruido transitorio con una de ruido turbulento, al articularse mediante un cierre inicial y un estrechamiento
posterior (vase Captulo 5, apartado 5.6).
Finalmente, el sonido [d3) - la y de cnyuge, yugo, etc.- ejemplifica la cuarta posibilidad: una fuente glotal (porque es sonoro),
junto con una fuente de ruido transitorio y otra de ruido turbulento (porque existe, como en el caso anterior, un cierre y un estrechamiento).
En el esquema de la Fig. 2.9 se recogen todas las posibilidades.
Consonantes

Vocales

Sordas

Sonoras
Oclusivas

Fuente

glotal

,
,

Fricativas

Fricativas

Oclusjvas

Fuente glotal + I Fuente glotal +


Fuente de ruido : Fuente de ruido
turbulento
transitorio

Fuente de ruido I Fuente de ruido

Afrjcadas

Africadas

Fuente glotal + Fuentes de ruido

Fuentes de ruido transitorio y

transitorio y turbulento

turbulento

transitorio

turbulento

Figura 2,9,

43

Asignamos las denominaciones oclusiva, frica tiva y africada, respectivamente, a los sonidos articulados con un cierre completo del
tracto oral ([p), lb), etc.), a los que s6lo requieren un estrechamiento
([s), [f), etc.) y a los que combinan ambos modos de articulacin ([j'J,
[d3), etc.). Explicaremos ms detenidamente estas clasificaciones en
prximos captulos. Por el momento basta recordar que la corriente
con que contbamos en un comienzo y los volmenes de aire contenidos en las distintas cavidades pueden verse perturbados por la accin
de varias fuentes diferentes, especialmente si estamos pronunciando
una consonante. En el caso de las vocales, todas ellas sonoras, acta
siempre la fuente glotal. (Para las vocales sordas existentes en algunas lenguas amerindias, v. Ladefoged: 1971 , 11.)

2.5.

La resonancia en el tracto vocal: los formantes

2.5.1. Hemos dicho que en todos los sonidos sonoros las cuerdas vocales producen un tono larngeo -un zumbido caracterstico- compuesto por la frecuencia fundamental y sus armnicos mltiplos . Hemos
explicado tambin que ese tono larngeo sufre modificaciones cuando
la vibracin se transmite a las cavidades superiores del tracto vocal, en
lo que constituye un ejemplo claro del fenmeno fsico de la resonancia
(vase apartados 1.3 y 2.3.1). En efecto, el canal vocal es un resonador
con varias frecuencias naturales de vibracin (puesto que se subdivide
en varias cavidades), que refuerza determinados componentes de distintas frecuencias de la onda glotal. Los valores de las frecuencias
naturales del tracto vocal dependen de su forma : en consecuencia,
cada modificacin del tracto implica el cambio de sus frecuencias naturales de vibracin y el reforzamiento de diferentes armnicos del tono
larngeo en cada caso.
Consideremos, por ejemplo, las vocales castellanas [a) e [i) , pronunciadas con la misma altura tonal y por la misma persona, es decir, con
la misma frecuencia fundamental. El tono larngeo del que se parte en
ambos casos ser idntico, pero, para cada uno de estos sonidos, se
reforzarn distintos hipertonos en funcin de la forma que presenta el
tracto vocal: para la [a) , la cavidad bucal totalmente abierta, con una
separacin de unos 10 mm entre los incisivos, y la cavidad farngea
disminuida por e l retroceso de la raz de la lengua: para la [i), el dorso
de la lengua elevado hacia el paladar duro dejando un canal estrecho
para la salida del aire y los labios estirados. El resultado es el que se
ofrece en la Fig . 2.10.
Mientras que en la vocal [a) se observan picos en torno a los 700
Hz y a los 1.200 Hz, en [i) estn situados en torno a los 300 y 2.000 Hz .

44

Pues bien, cada una de esas zonas espectrales en las que se


concentra la energa acstica se
denomina forman/e. Este trmino
es, en su origen, una palabra
alemana y lo us por vez primera el fsico Ludimar Hermann en
la segunda mitad del siglo XIX.
Los formantes de un sonido
dependen, como vemos, directamente de la configuracin que
presente el tracto vocal para
pronunciarlo y caracterizan a
ese sonido frente a todos los dems. En consecuencia, aunque
alteremos la frecuencia fundamental con la que lo pronunciamos, para obtener un tono ms
alto o ms bajo, la situacin de
los formantes no variar, es decir, no se alterar la cualidad o
timbre de dicho sonido y su espectro presentar el mismo trazado. Las caractersticas del tracto determinan su respuesta como
resonador, que ser la misma
para cualquier tono larngeo .
Vemoslo con los ejemplos de la
Fig. 2.11.
Con independencia de que las
lineas espectrales que representan los armnicos estn ms separadas entre s en la onda B
que en la onda A, como resultado
del aume nto de frecuencia fundamental , se observa que el espectro presenta la misma envolvente, o curva de respuesta con
similares cimas de amplitud en
idnticas zonas de frecuencias .
Este fenmeno explica que un
sonido particular se reconozca
como tal y no se confunda con

F,

10

[il

r,

300

r,

r,

10

[al

r,

700

1'00

FI!J1ll"l 2.10.

l(dB)

Onda A

[a]

F,100 Hz
1100

"00

P(Hz)

l(dB)

Onda B

[al

r, 200 Hz '-;;~~~':'::':-'-Ll::~-'-:+.
200 600 1100
2200 P(Hz)

Figura 2.11.

45

ningn otro tanto si es pronunciado por un hombre, una mujer o un nio,


pese a las considerables diferencias en las dimensiones del tracto vocal
y en la gama de frecuencias fundamentales que existen entre ellos.
El conjunto de los formantes y su especial disposicin es lo que
denominamos estructura [ormntica .
De todos los sonidos sonoros, los que presentan una estructura
formntica ms clara son las vocales. Para su reconocimiento y diferen
ciacin, basta sealar los valores que presentan los dos primeros foro
mantes en cada una de ellas. Cuando decimos dos primeros forman
tes" o, lo que es igual, FI y F" nos estamos refiriendo a los dos forman
tes que poseen frecuencias ms bajas. En el ejemplo de la Fig. 2.11, el
FI estaria situado en torno a los 600 Hz, Y el F, a los 1.000 Hz. Los valores del
tercer formante, F" y de los restantes que pudieran aparecer no suelen
citarse excepto para dar cuenta de algunas caractersticas peculiares
de ciertas vocales (nasalizacin, retroflexin, etc .) o para reflejar las
divergencias debidas a factores individuales (edad, sexo, particularidades anatmicas ... ) y sociales (lengua o dialecto utilizado, condicin
social, etc.).
En el Captulo 5 veremos cules son las estructuras formnticas de
las vocales del castellano, qu relacin guardan en cada caso con las
propiedades articulatorias, y cmo pueden compararse entre s mediante las llamadas cartas de [arman/es cuya elaboracin explicaremos
aqu con brevedad.
Una carta de forman tes es un grfico sobre cuyos dos ejes, el de
abscisas y el de ordenadas, se representan los valores del F, y el del F;,
respectivamente. Las escalas de frecuencia utilizadas son logartmicas,
de forma que los intervalos sonoros que nosotros percibimos como
iguales se corresponden con distancias tambin iguales, reproducien
do as mejor las impresiones tonales relativas que el oyente recibe . En
la Fig. 2.12 presentamos una carta de formantes, antes de que se hayan
trasladado a ella los valores de stos, para obtener finalmente un resultado como el que se muestra en la Fig. 5.6, del Captulo 5.
Las consonantes sonoras que poseen caractersticas voclicas, como
la [m] de mes o la [1] de luz, tambin ofrecen una estructura formntica
que, aunque definida, nunca es tan clara como la que ofrecen las vocales. La estudiaremos en detalle cuando consideremos, uno por uno, los
sonidos consonnticos del espaol.
2.5.2.

Si esto que acabamos de explicar es lo que sucede en todos los


sonidos sonoros, es decir , en los generados por una fuente peridica
glotal - las cuerdas vocales- , qu ocurre con aquellos otros que son
producto de una fuente de ruido turbulento o transitorio? Qu sucede ,

2.5.3.

46

Figura 2.12.

por ejemplo, en el caso de las consonantes sordas, sean fricativas u


oclusivas?
El tracto vocal acta, tambin en estas ocasiones, como resonador,
de modo que el ruido originado en alguna zona del canal -labios ,
alveolos, dientes, etc.- se ver modificado considerablemente en razn de la configuracin que presente el tracto a ambos lados del obstculo interpuesto a la salida del flujo de aire. As, la diferencia entre
una fricativa [O] , como la z de zapa/o , y una fricativa [x], como la j de
j amn , viene dada entre otros factores fsicos complejos por la distinta
longitud de las cavidades constituidas en uno y otro caso: en el de [O],
consonante interdental pronunciada con la lengua entre los bordes de
los incisivos, la formacin de un resonador posterior largo e indiviso,
que abarcara desde los dientes a la faringe, explica el predominio de
las frecuencias situadas por encima de los 5.000 Hz. En el caso de la [x],
por el contrario , la cavidad resonadora ms amplia est situada delante
del obstculo, esto es, del estrechamiento que produce el postdorso de
la lengua elevado contra el velo del paladar, por lo que se ven reforzadas frecuencias ms bajas. Comprobamos, pues, que el tracto vocal
acta como un [iltro (vase apartado 1.3.3), absorbiendo y reduciendo
las amplitudes de algunos de los mltiples componentes de los ruidos y

47

modificando las de aquellas otras frecuencias que coincidan con las


frecuencias resonantes de las distintas cavidades.
2.5.4. Sealemos, finalmente , que en aquellos sonidos producidos mediante la accin combinada de dos fuentes, la glotal y la de ruido
transitorio o turbulento, las modificaciones del tono larngeo y de la
turbulencia que la articulacin conlleva se superponen , de modo que el
espectro de sus ondas presentar al tiempo caractersticas propias de
los sonidos peridicos y de los aperidicos. As, una consonante fricativa sonora como la [z] ([s] sonorizada) que aparece en la palabra espaola asma exhibe un formante situado en las bajas frecuencias y, a la
vez, una distribucin desordenada de la energa a lo largo de una
amplia zona de altas frecuencias.
En resumen, hemos visto que los sonidos del lenguaje son producidos a partir de una seal , peridica o aperidica , generada por una
fuente y modulada posteriormente por las resonancias de las diferentes
cavidades. Este proceso es, en realidad, la base de toda la infinidad de
sonidos que los seres humanos podemos pronunciar y , por su especial
carcter, ha atrado la atencin. desde antiguo, de numerosos estudiosos.
En el prximo captulo , daremos un repaso a las principales tcnicas de
las que los fonetistas se han servido para investigar cientficamente la
naturaleza real de las emisiones fnicas.

48

Tcnicas
instrumentales
3.1.

Los primeros mtodos

La prctica totalidad de las descripciones fonticas clsicas estaban basadas sobre la observacin de los movimientos articulatorios y
las distintas impresiones auditivas que ellos producan. As pues , para
realizar su trabajo , los fonetistas se apoyaban, por una parte, en su
propia habilidad para reconocer, al orlos , los diversos tipos de sonidos y , por otra, en algunos mtodos no demasiado sofisticados, como ,
por ejemplo, el mtodo palatogrfico.
Este sistema consiste en introducir en la boca un paladar artificial
recubierto de una sustancia especial, de tal modo que, al entrar la
lengua en contacto con determinadas zonas del mismo durante la pronunciacin de los diferentes sonidos, estas partes de su super[cle
quedan limpias y claramente delimitadas. A pesar de que este mtodo
ha experimentado modificaciones y mejoras importantes , con las que,
como explicaremos ms adelante , sigue usndose en la actuahdad , los
palatogramas que con l se obtienen no informan ms que sobre lo
que sucede en la cavidad oral, dejando al margen la farngea o la
nasal. Adems, no se determina cul es el volumen y la forma de la
boca cuando se establece el o los contactos de la lengua con el falso
paladar.
.
Con posterioridad, la plastograffa supuso un importante avance
dentro del conjunto de tcnicas instrumentales de carcter fisiolgico
o , si se prefiere, articulatorio . Ideado por E. A. Meyer, este procedi3.1.1.

49

miento consista en introducir en


la boca un paladar artificial del
que pendan un conjuntos de finos hilitos de estao, los cuales
se doblaban en cada pronunciacin y adoptaban, as, la forma
de la lengua. Su mayor ventaja
era que proporcionaba la imagen de la configuracin que la
cavidal bucal presenta delante y
detrs de la zona de articulacin
de que se tratara, brindando as
una informacin ms completa
que la que ofreca el mtodo palatogrfico.

3.2.

Figura 3.1.

Un palatograma.

No faltaron, por otra parte , intentos de conseguir aparatos vlidos


par~ estudIar las condiciones aerodinmicas en que se generan los
somdos o los efectos acsticos que se producen en cada caso. El quimgrafo, por ejemplo, fue creado en 1847 por Karl Ludwig, con el principal objeto de regIstrar la cantidad de aire espirado en la unidad de
tIempo. En su variante ms antigua, el quimgrafo constaba de un
cIlmdro que giraba alrededor de su eje y que se recubra con papel
ennegrecIdo con el humo de una llama. Sobre este papel se recogan
los movm~Ientos de un estilete apoyado en l. Cuando se pona en
funcIOnamIento el aparato, la persona cuya pronunciacin interesaba
deba hablar por una bocina, conectada por un tubo de goma con una
membrana lo bastante tensa para vibrar, y los movimientos de esta
membrana se transmitan al estilete, unido a ella, que los inscriba
sobre el papel.
Ms tarde, el cientfico alemn Hermann Helmholtz invent los llamados resonadores de Helmholtz, conjunto de cavidades de frecuencias naturales de resonancia diferentes, con los que su creador intent
formar sonidos similares a las vocales. La frecuencia fundamental la
proporcionaba un diapasn, en tanto que los tonos ms elevados se
obtenan, a partir de ella, en los ocho resonadores que componan el
sistema.
. Con todo, es en la segunda mitad de este siglo cuando se ha produCIdo el avance ms espectacular en el diseo y la fabricacin de instrumentos aplicables al estudio de la fontica. Mencionaremos algunos de
ellos en el prximo apartado.

Las nuevas tcnicas

3.2.1. Conviene, ante todo, distinguir con claridad los procedimientos


aplicados a investigar la generacin del sonido y la articulacin qu~ lo
conforma, de aquellos otros destinados a analIzar los resultados acustIcos a los que da lugar la combinacin de ambas actividades . Vamos a
referirnos, en primer lugar, a los mtodos utilizados para medIr el
volumen, la presin o la velocidad de la corriente de .aire, factores
todos que, como ya explicamos, condicionan la generacIn de somdo
(v. al respecto Hardcastle, 1985).
Actualmente, el volumen de aire empleado en el habla puede medirse con el espirmetro, que podemos describir, a grandes rasgos,
como una caja vaca de metal con una tapadera que se desplaza al
penetrar el aire procedente de los pulmones en ella. El regIstro de este
desplazamiento se hace mecnica o elctricamente en un c~lmdro rotatorio y a partir de l se puede estimar cul es la capacIdad de los
pulmones y del tracto vocal del sujeto estudiado .
.
Por lo que respecta a la presin del aIre en las cavIdades oral y
farngea, es posible establecerla introduciendo en una de ellas, . o en
ambas un tubo conectado a un conversor que transforma las vanaClOnes d~ la presin area en variaciones de voltaje, reflejables en un
grfico. Ms en concreto, el nivel de presin sub glotal. ~uede obtenerse introduciendo un tubito en la trquea, por un onfIclO practIcado
debajo de la laringe, o bien, si se desea evita:- esta delicada intervencin sondando el esfago mediante un cateter termmado en un
globo, ~arcialmente inflado, que se sita en la parte inferior de la
laringe y que recoge las variaciones de presIn en ese punto.
El quimgrafo, del que hemos hablado antes (vase apartado 3.1.1)
ha sufrido varias modificaciones en relacin a su formato antIguo . Las
impresiones sobre papel ennegrecido se han sustituido; en los modelos
actuales, por mecanismos elctricos que sIguen utIlIzar:dose para reproducir la relacin volumen/velocidad del flUJO de aIre que sale o
entra en la cavidad oral y/o nasal.
Existen an otros muchos aspectos de la que, en terminologa de J.
C. Catford (1977), se denomina fase aerodinmica -es decir, elyroceso por el cual, bajo determinadas condiciones, se genera la cornente
de aire que origina el sonido- susceptibles de ser estudIados y r:nedIdos en laboratorio. No vamos a detenernos aqu en la descnpclo~ de
los equipos utilizados en esa labor. Baste sealar que puede, po~ eJemplo, investigarse la velocidad de las part~ulas de aIre, el tIpo de
corriente, turbulenta o no, de que se trata, e, mcluso, puede consegUIrse la visualizacin de la trayectoria del flujo de aire dentro y fuera de la
boca.

50

51

En lo que se refiere a la observacin y medicin de los movimientos articulatorios. las tcnicas son numerosas y muy diversas.
Para estudiar las variaciones en el tamao de la caja torcica suele
usarse la cinerradiografla. aunque hay otras opciones. Una de ellas, y
no la ms compleja, consiste en llevar a cabo una pneumografla, es
decir, un registro de los cambios en el permetro torcico, el cual,
previamente, se rodea por uno o varios cinturones. Mediante cualquier mecanismo apropiado para el caso, se van reflejando las alteraciones en la tensin o tirantez de estas bandas, lo que, claro est, nos
proporciona la informacin deseada sobre el tamao del trax.
Los desplazamientos verticales de la laringe (vase apartado 2.1.3)
se pueden observar a travs de la cinefotografa o con un instrumento
llamado cricrotirmetro, que rastrea estos movimientos con su brazo
telescpico, en tanto que la actividad de los cartlagos larngeos puede
recogerse mediante cinerradiografa.
La laringoscopia, por otra parte, supone la observacin directa o,
incluso, la fotografia desde arriba de la glotis. Actualmente se utiliza
para este propsito la fibra ptica, que ilumina la glotis al tiempo que
transmite su imagen a la cmara o al investigador. Otro conjunto de
tcnicas, encuadradas bajo la denominacin general de glotografia, se
emplean a menudo para estudiar los estados de la laringe. En todas
e llas, se hace pasar luz de un lado a otro de la glotis, de modo que los
cambios producidos en el rea de sta se traduzcan en variaciones en
la intensidad de la luz, fcilmente registrables.
Los movimientos producidos en las cavidades supraglticas, y las
propias cavidades, se examinan con la ayuda de radiografas o fotografias. En el caso de la vula, el procedimiento ms cmodo para averiguar su posicin es, sin duda, comprobar el flujo de aire que sale de la
cavidad nasal (vase apartado 2.1.4).
La palatografia contina usndose , como ya dijimos, para obtener
informacin sobre las zonas de contacto de la lengua con el paladar, si
bien ya no se utiliza el paladar falso, sino que se recubre directamente
el autntico con un polvo oscuro. Por lo general, el palatograma se
acompaa dellinguagrama, fotografa de la lengua en la que se observan cules de sus zonas estn coloreadas como resultado de haber
tocado el paladar.
En los laboratorios de fontica convenientemente preparados y provistos de material podemos encontrar todos los instrumentos necesarios para aplicar stas y otras tcnicas que aqu no mencionamos.
Cuando las circunstancias no son tan favorables y no se dispone del
equipo adecuado, es posible, sin embargo, extraer conclusiones concernientes a la articulacin de las mediciones de las condiciones aerodinmicas o acsticas .
3.2.2.

52

3.2.3. Una vez que el sonido ha sido generado y modulado,. las carac-

tersticas fisicas de la onda q ue lo produce pueden anallzarse con


diversos medios electrnicos, entre los cuales destacaremos el espectrgrafo de sonido y e l oscilgrafo u osciloscopio. Veremos, en primer
lugar, en qu consiste este ltimo aparato.
. '
El osciloscopio convierte la onda sonora en onda lummosa y SIrve,
bsicamente. para reproducir su forma en una pantalla. Su elemento
principal es un tubo de rayos catdicos con la pantalla en uno de sus
extremos. pero necesita, adems, una fuente de allmentacln, tres amplificadores y una base de tie mpos. Como parte mtegrante del tubo se
e ncuentra un ctodo, que no es sino un electrodo capaz de emItIr,
cuando se calienta al ser conectado a la red elctrica, un haz de electrones. Ese haz converge en la pantalla, dond e aparece como un punto
luminoso que, desplazndose vertical y horizontallnente, describe la
forma de la onda sonora. Los informantes utilizados en los expenmentos han de hablar por un micrfono directamente conectado al aparato ,
de modo que, al no utilizarse bocinas o mscaras como suceda en el
quimgrafo, se e liminan las consig uientes deformaCIOnes del habla de
cada individuo.
El espectrgrafo, tambin llamado songrafo, lleva a cabo el anlisis de la onda compleja en sus armnicos componentes. Es, por tanto, la
constatacin instrumental del teorema de Fourier (vase Capitulo 1,
apartado \. \. 5). Desarrollado en los laboratorios americanos de la Bell
Telephone Ca . durante el decenio 1930-1940, el principal
objetivo de sus diseadores
fue encontrar un mtodo para
volver visible el habla de forma que los sordos pudieran
leerla y vieran, as, aumentadas sus posibilidades de comunicacin. A lo largo de la
segunda guerra mundial, a
este propsito se sum el de
conseguir un instrumento para
analizar los mensajes inter-

ceptados e identificar , al mismo tiempo, a los emisores.

El espectrgrafo se compone bsicamente de cuatro elementos: un sistema de grabacin, un sistema de filtrado, un


tambor giratorio conectado al

Figura 3.2. Un espectrgrafo.

53

sistema de grabacin y recubierto de un papel especial y una aguja


elctrica para inscribir sobre este papel. Trataremos de explicar el
funcionamiento de todo el conjunto de modo simple.
Cuando queremos analizar una emisin tenemos, en primer lugar,
dos opciones: o hablar directamente frente al micrfono que el propio
espectrgrafo posee, o efectuar una grabacin de nuestra voz en cinta
con el magnetfono que el aparato lleva incorporado y operar despus
sobre ella. Esta segunda posibilidad es la ms recomendable porque
nos permite comprobar la calidad de la grabacin, reproducindola
cuantas veces deseemos, y porque posibilita tambin la conservacin
en archivo de la emisin analizada. La duracin mxima que puede alcanzar una emisin grabada, para este tipo de anlisis, es 2.4 segundos.
Una vez realizada dicha operacin, la grabacin se somete a un
proceso de filtrado para seleccionar slo unas determinadas bandas de
frecuencias (recurdese lo que explicamos sobre los filtros de pasa
banda en el apartado 1.3.3). Un filtro puede admitir, por ejemplo, todas
las frecuencias comprendidas entre los 155 y los 200 Hz y reducir la
intensidad de todas las que quedan fuera de estos mrgenes. En tal
caso, decimos que el ancho de banda del filtro abarca 45 Hz. Pues bien,
el sistema de filtrado de un espectrgrafo consta, en realidad, de un
nico filtro que normalmente posee un ancho de banda de 45 Hz o 300
Hz - banda estrecha o banda ancha- y cuyos mrgenes de frecuencia
se desplazan a lo largo de toda la gama recogida por el aparato (por lo
general, de los 80 a los 8.000 Hz). Esto quiere decir que, si optamos por
el ancho de banda de 45 Hz, el mismo filtro efectuar 176 filtrados
diferentes: de los 80 a los 125 Hz, de los 125 a los 170 Hz, de los 170 a los
215 Hz, etc., hasta los 8.000 Hz.
A medida que la grabacin o los sonidos pronunciados directamente en el micrfono pasan una y otra vez por este circuito, el filtro ir
variando sus mrgenes de frecuencia, captando, en cada caso, las
seales componentes de las ondas complejas comprendidas dentro de
ellos y eliminando las que queden fuera .
Si el sonido que analizamos tiene, por ejemplo, una frecuencia fundamental de 200 Hz Y estamos utilizando un filtro de banda estrecha (45
Hz) como el que explicbamos anteriormente, los dos primeros filtrados (de los 80 a los 125 Hz Y de los 125 a los 170 Hz) no producirn
ningn tipo de registro, simplemente porque en esa gama de frecuencias no hay energa alguna que registrar. El tercer filtrado, sin embargo, abarca todas las frecuencias desde los 170 Hz a los 215 Hz y, por
consiguiente, detectar la intensidad del fundamental, convirtindola
en corriente elctrica. La corriente activa la aguja y sta inscribir
sobre el papel sensible a las seales elctricas, colocado previamente
sobre el tambor, una linea oscura: el registro del fundamental.
54

De este modo, la onda compleja inicial va siendo descompuesta en


sus armnicos componentes, que aparecern ordenados de abajo arriba en el papel segn va aumentando su frecuencia. El resultado final
es lo que conocemos como sonograma o espectrograma . En la Fig. 3.3
reproducimos uno de estos registros .

Figuza 3.3. Espectrograma de banda ancha.

Como puede verse, en el eje de ordenadas se marcan las distintas


frecuencias y en el de abscisas, el tiempo. Este espectrograma es de
banda ancha, es decir, se ha realizado utilizando unos filtros de 300 Hz
cada uno, mientras que el que se presenta en la Fig . 3.4 es de banda
estrecha, obtenido mediante filtros de 45 Hz.
3.2.4, La representacin que brindan los sonogramas de banda ancha
es la ms adecuada para estudiar la secuencia de los sonidos del habla,
en tanto que los espectrogramas de banda estrecha resultan ser los ms
indicados para el anlisis de la entonacin de la frase . La razn de esta
diferenciacin es fcil de entender si pensamos que el filtro de banda
estrecha presenta una mejor resolucin de frecuencia y el de banda
ancha, una mejor resolucin de tiempo. Qu quiere decir esto?
Los filtros -o los resonadores en general- que responden bien a
una gama reducida de frecuencias (es decir , los que poseen un ancho
de banda menor , vase apartado \.3.2), tienen la particularidad de que
retienen bastante tiempo la vibracin que se les ha transmitido porque
la amortiguacin es muy pequea . Eso significa que, si a un filtro de
55

tado 2.5.1), si los tuviera , se observan mejor en este ltimo tipo de


registros, puesto que aparecen como anchas barras oscuras conformadas por armnicos de gran intensidad y situadas en zonas de frecuencia
diversas e n cada caso. Por otra parte, al tener una mejor resolucin de
tiempo, los filtros de banda ancha detectan y recogen todos los fenmenos acsticos que se produzcan, aunque se sucedan con una gran
rapidez. As, las finas estras verticales que se perciben en ellos se
corresponden con los impulsos de aire de la corriente glotal, producidos al abrirse las cuerdas vocales.
Un sonograma nos proporciona tambin informacin sobre la
intensidad global de los sonidos y sobre la amplitud de cada uno de sus
componentes.
Si contemplamos de nuevo la Fig. 3.3 observaremos en ella una
curva, situada en la parte superior del espectrograma y cuyos ascensos
y descensos representan, respectivamente, los aumentos y disminuciones de la intensidad a medida que se van sucediendo los sonidos. Esta
es la llamada curva de intensidad, mediante la cual podemos apreciar a
simple vista las diferencias existentes entre los segmentos que componen la emisin. Si deseamos expresar tales variaciones de modo exacto, podemos hacerlo aplicando la medida de conversin generalmente
aceptada, segn la cual 1 mm de distancia en el papel del sonograma
equivale a 1 dB de diferencia en la intensidad sonora.
En el caso de que nos interese conocer cul es la amplitud relativa
de cada armnico de un cierto sonido, debemos programar el espectrgrafo para que nos brinde
la seccin de ese sonido. En
[el
la Fig, 3,5 se reproduce la secccin correspondiente a la vocal [e].
Como puede apreciarse, se
trata de un corte del sonido
en un determinado momento
2
3
4
5
de su extensin, Las frecuencias componentes se ordenan,
Frecuencia (kHz)
de menor a mayor y de izquierda a derecha en el eje
Figura 3.5
horizontal, mientras que la intensidad relativa en dE que stas presentan se refleja en el eje verticaL
La mayor diferencia de intensidad que un filtro es capaz de registrar
es de 30 dB , de modo que cualquier armnico inferior es ms de 30 dB
al armnico ms fuerte aparecer en la seccin con intensidad cero,
Al margen de estos dos procedimientos, an podemos deducir el

3.2.5.

Figura 3.4.

Espectrograma de banda estrecha.

este tipo, que haya respondido ya a una primera seal, se le hace llegar
una segunda en un breve perodo de tiempo, la salida que obtendremos (vase apartado 1.3.2) ser la superposicin de los dos efectos, el
primero y el segundo, sin posibilidad alguna de distinguirlos.
Los filtros de banda ancha, en cambio, no diferencian las frecuencias demasiado prximas, pero tienen un alto grado de amortiguacin,
por lo que el fenmeno antes descrito no se produce nunca en ellos:
cuando la posible segunda seal los alcanza, el efecto de la primera ya
ha desaparecido. As pues, la resolucin de frecuencia (capacidad para
separar frecuencias cercanas) es mayor en un filtro de 45 Hz que en
uno de 300 Hz, pero la resolucin de tiempo (capacidad para distinguir
las seales prximas en el tiempo) es mucho menor en el primer caso
que en el segundo.
Si comparamos ahora los dos espectrogramas de las Figs. 3.3 y 3.4,
comprobaremos que entre ellos hay algunas diferencias evidentes,
atribuibles a las tambin distintas propiedades de los filtros con los que
fueron realizados, segn acabamos de explicar. En el sonograma de
banda estrecha, cada lnea horizontal representa un armnico y los
blancos que entre ellos quedan revelan la ausencia de energa en esas
frecuencias. En el sonograma de banda ancha, sin embargo, el anlisis
no llega a tales extremos y las manchas horizontales comprenden varios armnicos juntos. Los forman tes del sonido estudiado (vase apar56

57

grado de intensidad de un sonido a partir del negror con que se refleje


su estructura en el espectrograma: a mayor oscuridad, ms intensidad.
3.2.6. La frecuencia fundamental de la onda compleja peridica puede
estudiarse tanto sobre un espectrograma de banda ancha como sobre
uno de banda estrecha. En el primer caso, las finas estras verticales.
espaciadas a lo largo de toda la escala de frecuencias y que, como
explicamos (vase apartado 3.2.4), se corresponden con cada abertura
de las cuerdas vocales, nos sirven para calcular la Fo del sonido. En
efecto. la separacin que existe entre estas lneas representa el perodo de vibracin de manera que, si medimos esa distancia y calculamos
despus el perodo (a partir de la equivalencia 1 mm = 7,5 milsimas
de segundo), deduciremos la frecuencia con facilidad, puesto que sabemos que ambos valores son inversamente proporcionales (F = l/?).
La segunda posibilidad es realizar un espectrograma de banda
estrecha y determinar sobre l a qu altura del eje de ordenadas est
situado el primer armnico, esto es, la frecuencia fundamental. Actualmente se dispone de espectrgrafos que permiten obtener ampliaciones de las bajas frecuencias -en concreto, de los primeros 500 Hz- en
las que pueden apreciarse con toda claridad las variaciones de frecuencia que este armnico presenta y que, segn veremos (vase
Captulo 8), son indicativas de las fluctuaciones en el tono de la fras'! .
Los valores ms frecuentes del Fa son 125 Hz para las voces masculinas, 250 Hz para las femeninas y 350 Hz para las infantiles.
3.2.7. Observemos la Fig . 3.6. Se trata del espectrograma de banda
ancha correspondiente a la frase : Mis hechos dirn quin soy , obteni-

do por A. Quilis (Quilis, 1983: 425). Comprobamos la aparicin de la


curva de intensidad en su parte superior, la existencia de formantes a
diferentes alturas en los sonidos armnicos y, tambin en ellos, la
presencia de estrlas verticales o pulsos glotales. Fijmenos ahora en
aquellos otros sonidos que no poseen fuente pendlca, es decIr, los
inarmnicos: la [s], la rfl y la [k].
El primero es un ejemplo ptimo de ruido turbulento (vase apartado 2.4 .1) y, como tal, presenta una distribucin desordenada de la
energa, en este caso en las frecuencias altas.
La [k], por su parte, se debe a una fuente transitoria y es un ruido de
explosin. Su imagen espectrogrfica se resuelve en dos componentes
sucesivos: un espacio en blanco que refleja la ausencia de energa - la
salida del aire est obstaculizada por cierre del canal- y una barra
vertical, de mnima duracin y no siempre presente, que representa la
explosin producida al deshacerse el obstculo de manera brusca.
Finalmente, la [tn combina las caractersticas de los ruidos de explosin y de los turbulentos y ello se refleja con claridad en nuestro
espectrograma.
As pues, el anlisis espectrogrfico ilustra las diferencias entre
sonidos armnicos e inarmnicos, a la par que hace visible las caractersticas acsticas inherentes a cada uno de ellos.

3.3.

La sntesis del habla

3.3.1. La sntesis del habla no es sino una tcnica para simular los
sonidos del lenguaje humano , es decir, para producir habla artificial.
Numerosos han sido los intentos que, desde el siglo XVIII, se fueron
sucediendo a lo largo del tiempo, destinados todos ellos a conseguir
este objetivo . Nombres bien relevantes de la investigacin fontica se
han visto asociados en uno u otro momento a tales experimentos -van
Kempelen, Helmholtz, Stumpf, etc.- pero, ciertamente, es en este siglo
cuando se han logrado los primeros resultados por completo sallsfactorios.

~
,,

...
Figura 3.6.

58

Por qu tanto inters en reproducir el habla una vez que el desarrollo del anlisis espectrogrfico ha permitido conocer y entender
toda la complejidad de la onda sonora? La respuesta se desprende. del
propio planteamiento de la pregunta. La informacin que proporclOna
el espectrgrafo es tan abundante que resulta difcil saber qu datos
son los autnticamente decisivos para la comprensIn del mensaje y
qu otros responden slo a factores individuales o espordicos. Como veremos en el prximo capitulo (vase apartado 4.2.2), nosotros no
necesitamos toda la informacin acstica que llega a nuestros odos

59

para d e scodificar e interpretar la emisin de que se trate ; actuamos


B lectiva mente: seleccionamos claves, pistas, que nos revelan la naturaloza d e l sonido o sonidos que escuchamos. Son los llamados ndices
ac sticos.
El sintetizador de habla, en cualquiera de sus variantes, a las que

nos referiremos ms adelante, es un instrumento diseado para que e l


investigador pueda aislar y combinar rasgos acsticos sustituyendo
unos por otros y comprobando en qu medida estos cambios afectan a
la respuesta del oyente . De esta forma, al introducir variaciones controladas - lo que en el lenguaje natural es imposible- , el fonetista sabr
con certeza cules son los ndices sobre los que fundamentamos el
reconocimiento del habla.

todos ellos se basan en la idea de que el tracto es una estructura tubular


de seccin variable e irregular. Por consiguiente,. las propIedades
acsticas del habla se hacen equivaler con las propIedades elctncas
de un circuito de transmisin a travs de las dlstmtas seCCIOnes del
tubo. Actualmente se est aplicando este modelo a la snteSIS de voz por
ordenador.
Con todos estos procedimientos se han obtenido ya espectaculares
avances en el descubrimiento de los ndices acstlcos. En prxImos
captulos precisaremos cules de ellos se han revelado, a . travs de
diversos experimentos, como fundamentales para la ldentlflcacln de
las vocales y de las consonantes castellanas.

Existen esencialmente dos clases de sintetizadores: los anlogos


terminales y los anlogos del tracto vocal. Con los primeros se preten-

3,3.2.

de recrear la onda sonora partiendo de una simulacin de la actividad


de la fuente y de las cavidades de resonancia. Con los segundos, se
intenta obtener este mismo resultado pero reproduciendo, asimismo,
todas las operaciones que el s istema fonador humano lleva a cabo
durante la emisin.
Al primer grupo pertenecen modelos muy conocidos, como el Pattem Playback o los sintetizadores de formantes; al segundo , en cambio.
todos los modelos analgicos que remedan el tracto vocal.
El Pattern Playback se utiliz principalmente en los laboratorios
Haskins, de Nueva York, durante los aos cincuenta. Dado que este
aparato es capaz de convertir los espectrogramas, dibujados por el
investigador sobre una banda de celuloide transparente , en voz -mediante un sistema que hace coincidir la composicin espectral de los
sonidos con la de la corriente de luz posteriormente convertida en
ondas sonoras-, el mtodo seguido en los experimentos para los que
se emple consisti, por lo general, en sintetizar un conjunto de sonidos que slo difirieran e n un rasgo acstico. De la respuesta que los
oyentes dieran al or estos sonidos sintetizados se poda deducir la
importancia de dicho rasgo como ndice para la identificacin.
Los sintetizadores de formantes parten tambin del sonograma, pero actan de modo distinto al Pattern Playback . En ellos existe una serie
de circuitos elctricos resonantes que son excitados cuando les llega
una vibracin similar al tono glotal humano , o bien la energa producida por un generador de ruido (segn se trate de sonidos peridicos o
aperidicos). El espectrograma proporciona la informacin necesaria
para que tanto e l tipo de fuente como las resonancias subsiguientes se
ajusten a las caractersticas de los sonidos originales.
Por lo que se refiere a los modelos analgicos del tracto vocal,

60

61

~o
La audicin y la
percepcin del sonido

4.1.

La audicin

En los captulos anteriores hemos examinado el proceso de produccin de las ondas sonoras que constituyen los sonidos del lenguaje,
las fuentes que las generan y las modificaciones que sufren hasta el
punto en el que alcanzan nuestros oidos. A partir de ese momento,
entramos en un terreno menos conocido , en el que abundan las preguntas todava sin respuesta.
En efecto , aunque el proceso de la audicin comienza en el odo,
cuya anatoma y funcionamiento estn bien estudiados, sus fases ms
importantes y su culminacin tienen lugar en el sistema nervioso central, en el cerebro, en donde se produce un complicadsimo tratamiento de la informacin, en gran medida desconocido .
Por otra parte , hasta llegar a las zonas de la corteza cerebral aparentemente esenciales para la audicin, las seales recibidas han de
transmitirse a travs de una intrincada red de nervios y son, tambin,
algunos aspectos de esta transmisin los que permanecen an en el

4.1.1 .

misterio.

No obstante , en los apartados que siguen trataremos de explicar lo


que en este momento conocemos acerca de nuestra capacidad de or y
escuchar.
4.1.2. En el odo podemos distinguir tres partes principales (Fig. 4.1):
el odo externo, el oldo medio y el odo interno.

63

Figura 4.1.

Esquema del odo .

La primera de ellas, el odo externo, consta, a su vez, de dos partes:


el pabelln y el conducto auditivo externo. El pabelln recoge las
ondas que a l llegan y les facilita el paso hacia el conducto auditivo
externo. En algunos animales, no as en el hombre, este pabelln tiene
una considerable movilidad, de modo que reviste gran importancia en
la localizacin de la fuente del sonido . En los seres humanos, su funcin se limita a aumentar ligeramente la intensidad de las ondas incidentes.
El conducto auditivo externo tiene de 25 a 30 mm de longitud y es
un canal sinuoso por el que las ondas pasan en su camino hacia el odo
medio e interno. Acta como resonador, con una frecuencia natural de
unos 3.000 c .p.s., al tiempo que amortigua los sonidos demasiado agudos, potencialmente dainos para los rganos sensibles situados en el
odo interno.
Ya en el odo medio se encuentra el tmpano, delgada membrana
elstica, con una superficie de alrededor de 0,75 cm 2 y de forma cnica,
que cierra el conducto auditivo externo . Est situado en el interior de
una cmara de aire, la caja del tmpano, conectada con la rinofaringe
mediante el conducto denominado trompa de Eustaquio. Si la presin
en el interior de esta cavidad difiere en exceso de la presin atmosfrica, la trompa de Eustaquio se abre y el equilibrio se restablece.
Al estar rodeado de aire, el tmpano entra en vibracin cuando le
alcanzan las variaciones de presin que toda onda sonora conlleva. Sus
oscilaciones en ambos sentidos se transmiten a la cadena osicular que
lo conecta cori el odo interno. Dicha cadena est formada por tres

64

huesecillos conocidos como martillo, yunque y estribo. El martillo, unido por su mango al tmpano, vibra conjuntamente con l y este
movimiento pasa al yunque, de ah al estribo y, finalmente, a la ventana
oval, la entrada al odo interno.
El odo medio no acta simplemente como un mero transmisor de
las vibraciones, segn acabamos de explicar, sino que cumple, adems, la funcin de adaptador . Qu quiere esto decir? A partir de la
ventana oval, es decir, en el odo interno, el medio de propagacin de
las oscilaciones es ya lquido (el llamado lquido perilinftico, del que
hablaremos ms adelante). Esto significa que las ondas que, hasta ese
punto, eran areas van a ser lquidas. En ese cambio siempre se pierde intensidad y el odo medio es el encargado de recuperarla, convirtiendo los movimientos que llegan al tmpano, con poca fuerza
pero de grandes dimensiones (recordemos que el tmpano tiene una
superficie considerable), en movimientos de gran fuerza aunque de
pequea dimensin, como requiere el tamao inferior del estribo
y la ventana oval. En otras palabras, toda la energa recogida en el
tmpano se concentra en una superficie mucho ms pequea y as
se recuperan los decibelios perdidos, al tiempo que se vence la resistencia del lquido del odo interno a recibir energa proveniente del
exterior.
Por otra parte, en el caso de que los sonidos que llegan al tmpano
sean excesivamente intensos, el odo medio funciona como amortiguador, mediante la accin conjunta de un msculo que tensa el tmpano
para que vibre menos, y del msculo del estribo, que lo aleja de la
ventana oval y modifica su eje de rotacin. As, la capacidad transmisora del odo medio se reduce y no se produce dao en los sensibles
rganos del odo interno (Fig. 4.2) .
El odo interno, extremadamente complejo, se denomina tambin
laberinto y consta de dos partes principales: los canales semicirculares
y el caracola cclea. Los canales semicirculares, situados en tres planos rectangulares, se ocupan de controlar el sentido del equilibrio, en
tanto que el caracol es el rgano principal del mecanismo de la
audicin. Se trata de un tubo de paredes rgidas, completamente
cerrado y enrollado sobre s mismo dos veces y media. Est lleno de
un lquido denominado perilinfa y si lo desenrollramos ofrecera un
aspecto semejante al de la Fig. 4.3.
Como en ella puede observarse, el caracol est dividido en dos
zonas o rampas por medio de la lmina espiral cuyo interior constituye
una tercera regin. En la parte ms ancha del caracol, y conectndolo
con el odo medio, como anticipamos, estn las ventanas oval, directamente ligada al estribo, y redonda, situadas en cada una de las rampas,
a cada lado de la lmina espiral. La ventana redonda, que est cubierta
65

por una fina membrana elstica, tiene como funcin


Martillo Yunque Estribo
compensar, abombndose
hacia fuera o desplazndoVentana
se hacia dentro, los cambios
oval
de presin que se producen
dentro del caracol cuando
Ventana
el lquido perilinftico se
redonda
pone en movimiento por
Trompa
transmisin de las vibraciode
nes areas a travs del estribo.
Al vibrar, la perilinfa
transmite su oscilacin a
Figura 4.2. Odo medio.
una de las membranas que
separan las distintas zonas
de la cclea, la denominada
membrana basilar, cuya importancia reside en que es
el soporte del rgano de
Corti. ste est constituido
por unas 25.000 clulas ciliadas de las que parten las
Ventana
fibras nerviosas que, reuniCanal
Rampa
redonda
coclear
timpnica
das, conforman el nervio
auditivo. Cuando la vibracin llega al rgano de
Figura 4.3. Odo interno. (La cclea .)
Corti, ste acta como un
conversor de energa mecnica en energa elctrica, de modo que las oscilaciones se transforman en impulsos u ondas de naturaleza electroqumica que, a travs del
nervio auditivo, llegan hasta el cerebro. En cada uno de sus dos hemisferios, existen zonas de la corteza cerebral que podemos llamar zonas
auditivas, por lo que la destruccin de una de ellas no impide por
completo la audicin, si bien sta queda sensiblemente deteriorada .
Una vez revisada la anatoma del odo y explicado el proceso de
conversin de la energa acstica en energa elctrica en forma de
impulsos nerviosos, quedan por aclarar algunas cuestiones o.scuras.
Por ejemplo, cmo analiza el odo un sonido complejo en sus armnicos
componentes, si es que tal anlisis se lleva a cabo, de hecho , en este
rgano .
sta es una de las cuestiones, entre otras muchas referidas al funcio4.1.3.

66

namiento del sistema nervioso, que ha recibido distintos tratamientos a


lo largo del tiempo, algunos de ellos muy divergentes entre s. En
realidad, la carencia de pruebas experimentales, difciles de obtener
por cuanto se debe operar sobre sujetos vivos, facilita la formulacin
de hiptesis contradictorias. Veamos las ms importantes.
La Ley acstica de Ohm, postulada en el siglo XIX por el cientfico
alemn G. S. Ohm, sostiene que nuestros odos actan como autnticos
analizadores de las ondas complejas en sus frecuencias integrantes,
suponiendo que stas no sean ni demasiado numerosas ni demasiado
dbiles . De acuerdo con tal idea, Hermann van Helmholtz, en la segunda mitad del mismo siglo, sugiri que esta descomposicin de los
sonidos percibidos tiene lugar en el mismo caracol, concretamente en
la membrana basilar . Las fibras que la componen resonaran a frecuencias diferentes unas de otras, en funcin de su tensin y su peso . As,
una vez que el lquido perilinftico recibe las vibraciones procedentes
del odo medio, slo se veran contagiadas por la perturbacin aquellas
fibras de la membrana cuya frecuencia natural coincidiera con las del
estmulo y los tonos percibidos corresponderan a las frecuencias resonantes de estas fibras . Por ello, esta teora se denomina teora de la
resonancia, o perifrica , puesto que el anlisis de los sonidos tendra
lugar, segn sus supuestos, fuera del sistema nervioso central.
A comienzos de este siglo , E. Rutherford formul la teora telefnica, as conocida porque en ella la membrana basilar desempea el
papel de una central telefnica ligada al cerebro por el nervio auditivo .
ste vendra a ser un verdadero cable de transmisin, conductor de las
seales elctricas , no alteradas en su forma, al sistema nervioso central,
donde se desarrollara todo el procesamiento de la informacin . Cuando se elabor esta teora no se conocan los detalles sobre la transmisin elctrica en el sistema nervioso. Hoy se sabe que las neuronas no
funcionan como las lneas telefn~cas : la energa no se transmite de un
punto a otro a lo largo del axn o prolongacin principal de la neurona, sino que ms bien es un pulso de actividad elctrica local el que
se desplaza a lo largo de todo ese axn (v . Denes y Pinson: 1963, 127
Y 142).
Ciertamente, ninguna de estas dos hiptesis es aceptada en la actualidad . No obstante , aunque el planteamiento general de Helmholtz se ha
demostrado incorrecto, algunas de sus aportaciones, como la idea de
que es en el odo interno -en el caracol- donde se realiza el anlisis
frecuencial de los sonidos, parecen confirmarse por las investigaciones
ms recientes.
De acuerdo con estas mismas investigaciones, la descomposicin
del estmulo en sus diversos armnicos componentes se efecta mediante la perturbacin de distintas clulas del rgano de Corti para

67

cada una de dichas frecuencias , yen diferente medida segn la intensidad que presenten en cada caso. La estimulacin de clulas distintas
supone la subsiguiente estimulacin de diferentes fibras del nervio
auditivo y su proyeccin final en puntos distintos de la zona auditiva de
la corteza cerebral. Lo que sucede a continuacin sigue siendo un
misterio .

4.2.

La percepcin del sonido

Como explicamos en el Captulo 1, el hombre es capaz de percibir todos los sonidos cuyos valores de frecuencia e intensidad estn
comprendidos dentro de unos determinados mrgenes. As, sabemos
que el oido medio (definido como aquel cuyas caractersticas responden a la estimacin promediada de las de un gran nmero de odos
estudiados; v. Matras: 1986,42-43) percibe toda la gama de frecuencias
comprendida entre los 16-20 Hz y los 20.000 Hz aunque esta capacidad
se ve lgicamente disminuida con la edad.
En la Fig . 4.4 aparecen
marcados los lmites de la
percepcin, en funcin de
.~
140
....
( Umbral del dolor
e
IJO
la frecuencia y de la intene
120
~
:
sidad de los sonidos. A tae 110
100 ,
les limites se les denomina
9\l
campo
umbral de la audicin y um; \10
d.
70
audIcin
bral del dolor, porque to60
~ 50
dos los sonidos situados por
i
40
JO Umbral de la
debajo del primero son im~ 20
audicin
perceptibles para un odo
~
10
medio y todos los consigna~
31 62 125 250 500 1000 2(0)4000 800J 16000
dos por encima del segunFrecuenCia en Hz
do producen una sensacin
dolorosa.
Figura 4.4.
Segn puede apreciarse
en el diagrama , en la zona
de frecuencias medias podemos percibir sonidos de muy poca intensida, mientras que en las zonas de frecuencias bajas y altas, necesitamos aumentar la potencia en una cantidad variable de decibelios si
queremos que los tonos resulten audibles.
4.2.1.

----.

.
.
~

/'

La percepcin auditiva, y en general toda percepcin sensorial ,


es bsicamente selectiva (v. Malmberg: 1971, 140 y ss.). Ello quiere
decir que, de las mltiples impresiones que llegan a nuestros tmpanos

4 .2.2.

68

y que nosotros omos quermoslo o no, percibimos o, si se prefiere,


escuchamos slo aquellas que se ajustan a los modelos o patrones
adquiridos pGr la experiencia y que consideramos ,. por tanto, pertinentes. As pues, la percepcin no es una achvldad meramente
fisiolgica, sino que conlleva la seleccin y categorIzacin de lo percibido.
De toda la informacin que alcanza nuestro odo, el cerebro procesa
slo un porcentaje mnimo y desecha el resto. En ocasiones, si:, embargo, esa cantidad de ondas sonoras irrelevantes que acampanan a las
realmente pertinentes, mezclndose con ellas, pueden llegar a mterferi r de tal modo en el proceso, que impidan por completo la percepcin. Por lo que respecta, en concreto, a las ondas sonoras del habla,
est demostrado que el mejor modo de conseguir este efecto de anulacin es superponindoles otras ondas portadoras de seales lings~i
caso En otras palabras, es evidente la dificultad que para todos entrana
atender a dos personas hablando al mismo tiempo : el resultado ms
probable es que no percibamos ninguno de los dos mensajes comUnicativos.

Frente a esta vulnerabilidad de nuestro mecanismo de percepcin del lenguaje, que afecta a su principal caracterstica, la inteligibilidad, e l propio sistema lingstico opone una gran reslstencla a la dlstorsin, puesta de manifiesto en el considerable grado de redundanCia
que define a todos los hechos de habla . Ciertos fenmenos fontl~os,
por ejemplo, son redundantes, ya sea en todas las lenguas -:-asl, la
aparicin de transiciones en los formantes de una vocal anunClan, por
as decirlo, la presencia de una consonante- o en alguna lengua concreta -en espaol, la presencia de una vocal nasalizada lmphca la de
una consonante nasal adyacente (vase apartado 5. 1.2)-. El conOClmiento que poseemos, por otra parte, del idioma en el que nos expresamos, de sus reglas y de sus posibilidades, nos permlte dlstraer un
poco nuestra atencin en determinadas ocasiones sin que ello afecte a
la percepcin global del mensaje.
Las clasificaciones ms tradicionales de los sonidos siempre poseyeron un carcter o bien perceptivo o bien articulatorio, debido en
buena medida al escaso desarrollo alcanzado por la mvestlgacln puramente acstica antes del siglo XX. Denominaciones como, por ejemplo,
fricativo (sonido que requiere un estrechamiento en alguna zona del
canal, en la que se produce una friccin del aire) o explOSIVO (SOnido
articulado con cierre completo del canal y posterior abertura brusca de
ste) son claramente denominaciones de tipo perceptivo, puesto que es
el odo el que nos confirma.,si ha habido friccin, en el pnmer caso, .o Sl
se ha producido la pequea explosin, en el segundo. Sus respechvos

4.2.3.

69

trminos sinnimos, constrictivo y oclusivo, poseen, sin embargo, carcter articulatorio, ya que aluden claramente a la configuracin del
tracto vocal requerida para la pronunciacin.
Estos dos aspectos del hecho fnico , el articulatorio y el perceptivo,
mantienen entre s una relacin compleja todava no bien comprendida
por los fonetistas. No existe duda alguna, en la actualidad, de que para
la correcta articulacin de los sonidos es imprescindible el autocontrol
auditivo del propio hablante que los emite: slo de esta forma puede
ajustar los movimientos de sus rganos articulatorios de modo que el
resultado sea el deseado. Que esto es as resulta fcilmente comprobable con tan slo estudiar cules son los problemas de ndole articulatoria que caracterizan el habla de los nios sordos o, incluso, de las
personas que padecen trastornos auditivos considerables. Pero, por el
contrario, no est claro hasta qu punto es importante la influencia en
sentido inverso, es decir, en qu medida el oyente percibe en funcin
de sus propios hbitos articulatorios.
A. M. Liberman postul, a este respecto, la teorla motriz segn la
cual interpretamos los sonidos que escuchamos sobre la base de una
representacin motriz de los movimientos que nosotros mismos producimos para articular sonidos similares. Tal planteamiento resulta til
para explicar algunos hechos que, de otro modo, son difciles de analizar, como, por ejemplo, el que ciertas consonantes -especialmente las
oclusivas- presenten caracterizaciones acsticas (en el espectrograma) bastante diferentes, dependiendo del contexto en que se encuentren, sin que ello haga dudar al oyente en su identificacin. Si se acepta
la teora de Liberman, esto es debido a que los movimientos articulatorios que originan a estas consonantes, y que son la clave para su
correcta percepcin, son siempre los mismos en todos los contextos y
constituyen, por tanto, un elemento definitorio e identificador.
Pese a la evidente validez de este tipo de argumentacin a favor de
la teora motriz, muchos autores la han desechado sin reservas . Entre
ellos cabe destacar a B. Malmberg que , en su obra Les domaines de la
Phontique (1971) llega a afirmar: Los movimientos articulatorios requeridos para hablar solamente pueden constituir una ayuda apreciable para aquellas personas cuyo odo es defectuoso, para los que son
totalmente sordos, estos mismos movimientos son, claro est, el nico
punto de referencia (pg . 151, traduccin nuestra).
Sin llegar a posturas tan extremas, es preciso sealar que la articulacin puede tambin variar sin que esto implique una percepcin
diferente. En espaol , concretamente , diversas circunstancias hacen
que la articulacin de la consonante dental fricativa sonora -que representamos como [iI] y que aparece, por ejemplo, en Aida, seda, etc.
(vase ms adelante, Captulo 5)- vacile entre la posicin dentointer-

70

dental claramente fricativa y la posicin dental (Navarro Toms: 1971,


99), SID que el oyente perciba diferencia alguna entre los dos sonidos .
De igual forma, la vocal [<1>], anterior , media y redondeada, puede
pronunciarse, en los idiomas que la poseen, como una [e] con una
especial reduccin del orificio que forman los labios y un abocinamiento de stos, o como una [e] en la que la lengua se retrotrae: en ambos
casos percibiremos la misma vocal.
As pues, parece llcito concluir que la articulacin no debe ser el
nico condicionante del mecanismo de la percepcin, segn supona
Liberman, sino que tambin la caracterizacin acstica es determinante, especialmente en algunos casos. Con todo, como decamos al principio, restan an por esclarecer muchos aspectos de la compleja interrelacin entre nuestros movimientos articulatorios , las ondas que con
ellos producimos y la capacidad perceptiva de nuestro cerebro.

71

~D
Descripcin y clasificacin
de los sonidos

5.1 .

La segmentacin de la cadena hablada

5.1.1. Hasta el momento nos hemos venido refiriendo a los sonidos


como si stos se presentaran de forma aislada en la cadena hablada, es
decir, como si existieran lmites claros entre ellos, de modo que su
reconocimiento resultara sumamente sencillo. Sabemos , sin embargo,
que el movimiento de los rganos vocales es continuo, como lo es
tambin el producto acstico de l derivado , y que la tarea de deslindar dnde acaba un sonido y dnde comienza otro no se revela fcil.
No obstante, es el paso previo para poder describir y clasificar todos
los tipos de segmentos fnicos que el aparato fonador humano es capaz
de producir.
5.1.2. Consideremos la palabra espaola par. Cualquier hispanohablante, sin necesidad de poseer conocimientos fonticos de ningn
tipo, distinguir en ella tres elementos, convencionalmente representados por los simbolos [p] , [a] y [r]. Ello es debido, en primer lugar, a
que durante su pronunciacin se producen cambios especialmente sigo
nificativos en la articulacin que entraan diferentes percepciones, y ,
en segundo lugar , a que el hablante, conocedor de su propia lengua ,
sabe que estos fragmentos de sonido pueden aislarse e incluso intercambiarse con otros: la [p] puede sustituirse por [m] para obtener mar
la [a] por [o] para formar por; la [r] por [9] para constituir paz. Dicho d~
otro modo , el hablante conoce el funcionamiento y el valor contrastivo
73

de esos sonidos en su idioma y lo utiliza , ms o menos conscientemente,


para llevar a cabo la segmentacin. En este sentido podemos decir que
la divisin de la cadena hablada se realiza a partir de fundamentos
fonticos y fonolgicos (vase nuestra Presentacin). Si la lengua estudiada es la materna, aplicamos nuestro conocimiento de las unidades
funcionales (fonemas) al comenzar a segmentar, para precisar posteriormente cmo es su realizacin fontica . Si, por el contrario, operamos sobre una lengua desconocida, el proceso se invierte : tenemos
que saber primero cuntos posibles segmentos hay en la cadena para
despus comprobar cmo funcionan y corroborar as nuestra divisin
inicial.
El fonetista se interesa slo, en principio, por establecer el criterio
para segmentar el continuo fnico en funcin de la serie de parmetros articulatorios o acsticos que lo determinan , es decir, sin apoyarse en datos o informaciones no extrables del propio decurso fnico .
Ello no significa que no deba recurrir en un momento dado a consideraciones fonolgicas para resolver determinados problemas , como
veremos.
As pues, se trata de concretar, en primer lugar, cules son los
parmetros relevantes sobre los que basar la segmentacin . Volvamos
para ilustrar esta idea a nuestra palabra par. Podemos comprobar al
pronunciarla que la consonante [p] se articula con un cierre absoluto
del canal oral situado en los labios . La lengua, durante esta oclusin
labial , toma ya la posicin de la articulacin siguiente , la [a], esto es, se
extiende en el hueco de la mandbula inferior, toca con sus bordes los
molares inferiores de ambos lados y roza con la punta la cara inferior
de los incisivos inferiores, elevando un poco ms el dorso en la zona
media de la boca (v. Navarro Toms: 1971, 54). En este caso, por
consiguiente, el parmetro articulatorio que podramos denominar posicin de la lengua no nos sirve para fijar la frontera entre los segmentos [p] y[a] . Sin embargo , el parmetro accin de las cuerdas vocales
s nos seala el lmite claro entre estos dos sonidos . La [p] es un sonido
sordo , sin vibracin en la glotis , en tanto que la [a] es sonoro , como
todas las vocales, y lo mismo cabra decir de un parmetro modo de
articulacin que nos diferencia un sonido oclusivo [p] de uno articulado sin obstculo alguno, [a].
En segundo lugar, habr que determinar los momentos de la emisin en los que los cambios producidos en los parmetros observados
sean lo suficientemente apreciables para marcar las fronteras entre
segmentos. El movimiento de los rganos vocales, segn venimos diciendo, es continuo , gradual. y nunca brusco . Los cambios se producen
permanentemente, pero slo pueden considerarse lmites de segmentos aquellos puntos en que los movimientos se han completado, dando

74

paso a un breve perodo durante e l cual los valores de los parmetros


articulatorios no varan: e l segmento.
Esto es tambin aplicable al anlisis acstico. Un cambio brusco de
una perturbacin peridica a otra aperidica, por ejemplo, o bien un
punto de mxima velocidad de variacin en las caractersticas espectrales marcan los lmites entre dos segmentos . Habitualmente, las divisiones resultantes suelen coincidir con las unidades obtenidas en el
anlisis articulatorio, y, asimismo, con las unidades funcionales o fonemas, pero no siempre sucede as. El correlato acstico de un fonema
puede a veces estar constituido por uno o ms segmentos acsticos:
recordemos cul era la caracterizacin en el espectrograma de nuestra
consonante eh W] (vase la Fig. 3.6). De igual forma, un nico segmento acstico puede corresponderse con dos fonemas si as 10 requiere la
estructura de la lengua concreta de que se trate: las vocales diptongadas del ingls, por ejemplo, son en realidad segmentos unitarios largos, formados por un timbre fundamental ([a] , [e] , [o]) seguido de un
deslizamiento voclico ms cerrado ([i], [u]) o ms central , pero se
interpretan, sin embargo, como la combinacin de dos fonemas distintos, lo que ha llevado a muchos autores a intentar delimitar en el
espectrograma dos segmentos diferentes. (Los principios de la segmentacin acstica estn claramente descritos en Fant, 1973.)
Es interesante sealar que los Indiees (vase apartado 3.3) relevantes para la percepcin e identificacin de un cierto sonido no siempre
estn contenidos en el segmento acstico con el que lo hacemos corresponder. En los prximos apartados veremos que muchas consonantes
se reconocen en funcin de las vocales adyacentes, en las que estn
presentes los ndices decisivos para su determinacin. Igualmente, los
movimientos articulatorios influyen en la p ercepcin de los diversos
sonidos en todo su desarrollo, y no slo en la fase terminal. Por ejemplo, e l movimiento de la vula que supone la abertura de la cavidad
nasal a la corriente de aire para pronunciar la [n] de la palabra [In'solito] comienza ya durante la articulacin de la vocal [i] , nasalizndola y
contribuyendo con ello de forma redundante a la percepcin de la
consonante nasal. As pues, el proceso perceptivo no resulta necesariamente condicionado por las unidades discretas establecidas tras la
segmentacin.

5,2.

La diferenciacin vocal-consonanle

Una vez efectuada la segmentacin de la cadena hablada , la


primera distincin que debe mencionarse es la que se establece entre
sonidos voclicos y consonnticos . Esta dicotoma clsica , que ya esta5.2.1 .

75

bledan, con algunas variantes, los gramticos hindes y griegos, ha


sido revisada en nuestros das por un buen nmero de fonetistas.
En general, la idea de vocal se ha asociado siempre con una serie
de caractersticas auditivas, articulatorias y funcionales . La vocal sera
en principio el sonido ms audible, e l ms abierto , sin obstculo alguno
a la salida del aire y articulado con menor esfuerzo que la consonante.
sta, adems, requerira un mayor gasto de aire en su pronunciacin y
se caracterizara por la menor estabilidad de las posiciones articulatorias que la originan.
.
Todas las hiptesis anteriores fueron examinadas exhaustivamente
por G. Straka en un trabajo importante (Straka, 1963), para llegar a la
conclusin de que la diferencia entre vocal y consonante no es absoluta, sino gradual con respecto a los criterios aludidos. As, hay consonantes, como la [r] o [J] que en determinadas circunstancias resultan
ms audibles que las vocales [i] o [u] , que por otra parte son ms
cerradas y presentan mayor nivel de obstaculizacin que ciertas consonantes, como [s] o [9].
La mayor parte de los argumentos que se han aportado para justificar la divisin vocal-consonante carecen, por consiguiente, de validez
general. Pueden resultar exactos si enfrentamos sonidos extremos, como una [p] y una [al - los ms alejados entre s desde el punto de vista
fontico-, pero se revelan como slo parcialmente verdaderos en los
restantes casos.

5.2.2. Por lo que respecta a la funcin que los dos tipos de sonidos
desempean en la lengua , se adujo siempre como prueba irrefutable
de su distinta naturaleza que las vocales son imprescindibles en la
constitucin de una slaba, no as las consonantes. Dicho de otro modo,
las vocales podran funcionar sin el apoyo de las consonantes , pero no
al revs.
Evidentemente, este razonamiento queda invalidado en cuanto se
toman en cuenta los numerosos casos en los que una consonante, especialmente una nasal o una llquida ([1], [rJ) , puede constituir por s sola el
ncleo o centro de la slaba: el vocablo francs bisllabo perdre ['pudr] , el ingls collon ['ka-tn], el alemn Valer ['fa-tr], etc., son ejemplos
de este fenmeno. En todos ellos, las consonantes que llevan el diacrtico Ll suscrito son realmente el centro silbico y, en ese sentido, funcionan como autnticas vocales.

Este hecho movi a muchos autores a introducir nueva terminologa


que lo reflejara . K. L. Pike (1943) propuso, por ejemplo, los trminos
vocoide y contoide para sustituir a los antiguos vocal y consonante,
respectivamente, mientras que estas clsicas denominaciones se destinaron a distinguir los dos grupos de sonidos en virtud de su funciona76

miento en la lengua. As pues , un sonido vocoide reunira todas las


caractersticas articulatorias y acsticas peculiares de las antiguas
vocales y un sonido vocal, de acuerdo con Pike y sus continuadores,
sera todo aquel capaz de actuar como unidad central de la slaba.
Otros fonetistas, por el contrario, mantienen los trminos vocal y
consonante con su significado original, pero utilizan vocablos diferentes cuando clasifican a los segmentos por su funcin . Distinguen entonces entre sonidos sonantes y no-sonantes o sanan/es y consonantes. En
cualquier caso, tampoco existe coincidencia sobre qu sonidos deben
englobarse en cada grupo. Para P. Ladefoged (1975), las sonantes seran las nasales , las lquidas y, por supuesto, las vocales. Para otros
autores (los menos) en las sonantes no deben incluirse las vocales -a
las que se les presupone de antemano la capacidad para constituir
ncleo silbico- puesto que aunque nasales y llquidas posean caractersticas voclicas no pueden equipararse a las vocales reales. Volveremos ms adelante sobre esta cuestin, al hablar de las consonantes
(vase apartado 5.6).
5.2.3. Pese a tantas matizaciones y a tanta disparidad de criterios y
opiniones, se puede seguir hablando de vocales y de consonantes
segn se viene haciendo tradicionalmente?
Es el propio Straka quien, en el artculo antes citado, ofrece una
posible justificaci n de tipo fisiolgico para la divisin que nos ocupa,
y, por otra parte, el anlisis acstico proporciona tambin valiosa informacin.

Afirma Straka que la propiedad diferenciadora de vocales y consonantes aparece tan slo cuando se produce alguna variacin en la
energa articulatoria: Una consonante pronunciada dbilmente y la
misma consonante pronunciada con energa no se realizan de idntico
modo, y lo mismo sucede en una vocal ( ... ). Pero la disminucin y el
aumento de la energa articulatoria no producen los mismos efectos en
el comportamiento de una articulacin consonntica y en el de una
articulacin voclica ( ... ). Bajo el efecto del refuerzo de la energa
articulatoria , la consonante se cierra y la vocal se abre. Al contrario,
bajo el efecto del debilitamiento articulatorio, la consonante se abre y la
vocal se cierra (pg. 35, traduccin nuestra).
La razn de tal comportamiento dispar radica en la intervencin de
distintos grupos de msculos durante la pronunciacin de las vocales y
de las consonantes. En las primeras toman parte, principalmente, los
llamados msculos depresores, menos numerosos y potentes que los
msculos ele vadores, que intervienen en las articulaciones consonnticas. Dado que lo que entendemos por energa articulatoria no es sino la
fuerza de contraccin de los msculos operantes en el sonido de que se
77

trate, resulta comprensible que , si sta se incrementa durante la emisin de una vocal, los msculos depresores experimenten una contraccin ms enrgica que producir un descenso ms acusado de la lengua. Si, por el contrario, se refuerza la energa al pronunciar una
consonante, sern los msculos elevadores los que causarn una mayor
elevacin de la lengua hacia el paladar e, incluso , un contacto ms
fuerte entre estos dos rganos. Como es lgico, si se disminuye la
energa articulatoria se obtiene el efecto contrario.
El anlisis acstico proporciona tambin , como decamos, razones
para seguir manteniendo la dicotoma vocal-consonante. En primer
lugar, cuando se articula una vocal, las cuerdas vocales estn ms
tensas y ms juntas que cuando se trata de una consonante sonora, por
lo que la frecuencia de vibracin es mayor y el tono ms agudo en la
primera que en la segunda. Por otra parte, mientras que en las vocales
no existen apenas ruidos aperidicos -aunque stos no pueden ser
ignorados si hemos de ser precisos- en las consonantes, especialmente en las sordas, son estos ruidos los que determinan su naturaleza
y contribuyen a su identificacin (vase Captulo 2, apartado 2.4.1).
POI: 1timo,:,cabe aadir la mayor estabilidad acstica de la vocal
frente !a '.co,n~nimte, segn seal P. Delattre (1964). De acuerdo con
este emin"ht' fonetista, el reconocimiento de una consonante depende
de los camb.i os de frecuencia de los forman tes , propios O de las vocales
contiguas, e n tanto la estabilidad formntica se asocia siempre con una
vocal (vase a este respecto, lo que explicamos sobre las transiciones
voclicas en el apartado 5.7 de este mismo captulo).
Las investigaciones sobre esta compleja cuestin continan desde
perspectivas diferentes. Regularmente se proponen nuevos criterios
en la esperanza de que alguno de ellos, o la suma de todos, constituya
la confirmacin definitiva de la clsica divisin de los sonidos de la
lengua en voclicos y consonnticos. En todo caso, en una obra introductoria como sta, parece aconsejable aceptar la oposicin tradicional, aun conociendo los problemas que plantea, por las ventajas que
ello supone para la exposicin.

5,3.

Las vocales: caractersticas


articulatorias

Es prctica habitual y generalizada describir las caractersticas


articulatorias de las vocales y proceder a su clasificacin en funcin de
unos parmetros distintos a los considerados para llevar a cabo la de
las consonantes. stas, como veremos, se diferencian segn sea su
modo de articulacin (oclusivas, fricativas, etc.) y segn en qu zona
5.3.1.

78

del tracto se produzca dicha articulacin . Las vocales, en cambio, se


clasifican en virtud de la posicin vertical de la lengua -s decir, a
partir de lo ms o menos alejado del paladar que se encuentre su zona
ms alta-, de la posicin horizontal de la lengua -sto es, de lo ms o
menos adelantado que se encuentre ese punto en el eje anteroposterior de la boca- y de la disposicin de los labios, con o sin redondeamiento .
El primer criterio nos divide a las vocales en altas, medias y bajas o,
si se prefiere, cerradas, medias y abiertas segn el uso ms extendido
en Europa. Fijmonos en la Fig . 5.1, donde se han contrastado los
perfiles que la lengua adopta en la pronunciacin de las vocales castellanas [i), [e), [a), [u) y [o).

Figura 5.1.

Es evidente que la parte ms alta de la lengua se


ms
prxima al cielo de la boca en las vocales [i) y [u) que en [e) y [o) y en
estas ltimas ms que en la [a) . Por consiguiente, la [i) y [u) son cerradas, la [e) y [o) medias, y la [a) abierta.
El segundo parmetro divide a las vocales en anteriores (o palatales), si la zona ms elevada de la lengua se localiza en la parte anterior
de la boca, y posteriores (o velares) , si , por el contrario, est situada en
la zona posterior. An existe otro trmino, central, que califica a las
vocales pronunciadas en la zona central de la cavidad oral. Comprense, en la Fig. 5.1, los perfiles de las vocales espaolas [e], [i) , claramente anteriores, con los de la [o) y [u), ambas posteriores. La [a) es
central.
Vemos, pues, que mientras que en las consonantes se tiene en

cuenta la situacin de la zona de mayor constriccin (sea sta total,


como en las oclusivas, o parcial, como en las fricativas), para establecer
la localizacin de las vocales se considera la de la parte ms alta de la
le ngua , que no tiene que coincidir necesariamente con el punto en que
la constriccin sea mayor. Como han sealado varios autores (v . Delat79

tre : 1967, 22-23; Ladefoged: 1975, 13, entre otros), en la descripcin


articulatoria siempre se puede elegir entre distintas posibilidades sin
que sepamos muchas veces cul es la ms acertada, porque cada una
de ellas presenta, por lo general, ventajas e inconvenientes. Este sistema de especificacin de las vocales es, sin duda, el ms simple, pero
en cambio, no refleja las considerables diferencias en la forma de la
lengua para las vocales anteriores y posteriores, ni tampoco da cuenta
de la variacin del tamao de la faringe en algunas de ellas, que tan
apreciables cambios acsticos entraa. Por este motivo, muchos fonetistas han tratado de modificarlo, incorporando nuevos criterios, ya desde
principios de siglo (v. Fischer-J~rgensen, 1985), sin que por el momento ninguna de sus innovaciones haya sido unnimemente aceptada.
Por lo que se refiere al redondeamiento de los labios, se trata de un
tercer parmetro independiente de los dos anteriores y combinable
con ambos . Esto quiere decir que existen vocales anteriores redondeadas y no redondeadas como se encuentran tambin, en muchas lenguas, vocales posteriores redondeadas y no redondeadas . Lo mismo es
vlido para los diversos grados de abertura : todos son combinables
con una u otra disposicin de los labios. Ahora bien, conviene hacer
dos precisiones a este respecto .
La primera es que existe una cierta correlacin entre la altura de la
lengua y el grado de redondeamiento . Cuanto ms cerrada es una
vocal, ms pequea ser la abertura que dejarn los labios al redondearse, y cuanto ms abierta sea la vocal, ms amplia la abertura. El
abocinamiento de los labios en [u), por tanto, es mayor que el de [o),
siendo, como son ambas, vocales redondeadas.
La segunda observacin, ampliamente constatada, es que el re dondeamiento es ms frecuente en las vocales posteriores que en las
anteriores. El castellano, por ejemplo, posee slo dos elementos voclicos redondeados, la [o) y la [u), y los dos son posteriores. Este hecho
tiene, por lo dems, fcil explicacin. Dado que el redondeamiento
supone un descenso en el tono de la vocal, que, como detallamos ms
adelante, se hace ms grave (vase apartado 5.4), es lgico que sean
los sonidos de tonalidad ya originalmente grave -los posteriores- los
que lo presentan, consiguindose de esta forma la mxima diferenciacin perceptiva entre vocales anteriores y posteriores .
5.3.2. La descripcin de las vocales en los trminos anteriormente
sealados, no es todo lo precisa que sera deseable. Hemos apuntado,
por ejemplo, que con este sistema no se especifican las dimensiones
que presenta la cavidad de resonancia farngea en cada caso. Se ha
argumentado, asimismo, que no todos los sonidos denominados altos lo
son en igual media (la [u) lo es menos que la [iJ), ni todos los sonidos
80

posteriores o anteriores comparten la misma posicin en el eje anteroposterior de la cavidad bucal. Sin embargo, el mayor problema generado por la falta de precisin se constata al intentar describir una vocal
de una lengua concreta con referencia a las de otros idiomas, o una
vocal pronunciada en un cierto momento por un hablante determinado .
Si decimos, por ejemplo, que se trata de un sonido voclico alto o
cerrado, anterior o palatal y no redondeado, podemos estar refirindonos tanto a la [i) del espaol mi, como a la del ingls sit, o a la del ingls
bean, etc.
Para intentar suplir esta falta de puntos de referencia, con respecto
a los cuales situar cualquier eventual realizacin voclica sin posible
ambigedad, el fonetista britnico Daniel Jones ide, en 1917, un sistema de Vocales Cardinales, an empleado en la actualidad.
Adoptado por la Asociacin Fontica Internacional. el sistema de
Vocales Cardinales es una tcnica descriptiva, cuyo dominio constituye
ms un arte que un conocimiento cientfico. Conviene tener esto presente, porque algunos de los inconvenientes que se le han encontrado
provienen de una interpretacin errnea del concepto.
El sistema est integrado, en efecto , por vocales tericas (v. Monroy
Casas , 1980), que no han de confundirse con fonemas. Ninguna de estas
vocales debe asociarse, por tanto, con una lengua concreta , incluso
aunque en tal idioma existan uno o varios elementos voclicos coincidentes con los cardinales. Es por esto por lo que se ha repetido frecuentemente que la eleccin de las vocales cardinales por parte de
Jones fue arbitraria, lo que no es del todo cierto si tenemos en cuenta
que, para establecerlas, parti de la teora del limite voclicQ. De
acuerdo con ella, cada una de las vocales que los seres humanos
pode mos pronunciar, sean cuales fueren, se realiza con la parte ms
alta de la lengua situada dentro de un espacio bien delimitado de la
boca . De situarse la lengua ms all de este mbito, obtendramos de
inmediato, con condiciones normales de volumen y velocidad del flujo
de aire, una consonante fricativa .

El limite anterior de este espacio voclico est representado por


la W, que es la vocal cardinal nmero uno . La transcribimos con un
guin suscrito porque ste es el diacrtico que diferencia estas unidades de las restantes vocales . La W, como decimos, es la vocal ms
cerrada y ms anterior. Si elevramos y adelantramos la lengua en
mayo r medida, pronunciaramos una consonante fricativa palatal. El
lmite posterior, sin embargo, est representado por la vocal [gJ , la ms
abierta y la ms retrotrada de todas las vocales . De hecho , si acercramos ms a la faringe la raz de la lengua de lo que la aproximamos al
pronunciar esta vocal, la cardinal nmero cinco, daramos lugar a una
consonante farngea.
81

Entre ambos lmites estn situados otros seis sonidos auditivamente


e~uidistantes: la vocal cardinal nmero dos [!l), la nmero tres [~), y la
numero cuatro [), formadas todas ellas al descender poco a poco el
d?rso de la lengua a partir de la posicin de [i]; la nmero seis [Q], la
numero sIete [Q] y la nmero ocho [y] , resultado de la elevacin gradual del dorso lmgual desde la posicin ocupada en [l. As pues,
eXIsten dos series de vocales, [!-~-.--g) y [g-:;>-Q-\!], que mantienen
entre s distancias auditivas similares. En la Fig . 5.2, reproducimos el
esquema propuesto por Jones para representarlas y que sigue siendo
utIlIzado en la actualidad.
Las ocho vocales arriba transcritas se conocen como vocales cardinales primarias, para distinguirlas de las que ahora explicaremos, las
cardmales secundarias. Evidentemente, ninguna vocal puede ser ms
primaria que otra, todas ellas son iguales. La razn de estas denominaciones no tiene, pues, nada que ver con la primaca de unas vocales
sobre otras: las vocales primarias se establecieron antes que las secundarias y a ello deben su nombre .
Supongamos que pronunciamos los ocho sonidos de la Fig . 5.2 mantemendo la configuracin articulatoria de cada uno de ellos, pero cambIando la disposicin de los labios. De este modo, las vocales que antes
eran redondeadas son ahora no redondeadas y viceversa, con lo que
obtenemos otros ocho sonidos diferentes a los anteriores denominados
vocales cardinales secundarias. Sus smbolos son [K-~-oe-CE-Q-,,-I-W] y
en la FIg. 5.3 se muestra su disposicin paralela a la de las primarias:

16

15

l.
A

Figura 5.2. Sistema de vocales


cardinales primarias.

12

<E

13

Figura 5.3. Sistema de vocales


cardinales secundarias.

Llegar a pronunciar correctamente las vocales cardinales es una


tarea ardua que requiere mucha paciencia y muchas horas de prctica.
El fonetista britnico D. Abercrombie, alumno del propio Daniel Jones,
apunta a este respecto que el proceso de aprendizaje le result suma-

82

mente difcil aun contando con la gua y el asesoramiento constante del


creador del' sistema (Abercrombie : 1985, 18). Las diecisis vocales
representadas en las Figs . 5.2 y 5.3 pueden hacerse corresponder, m~s
o menos, con otros tantos sonidos voclicos de dIversas lenguas, segun
indicamos a continuacin, pero tal correspondencIa nunca es exacta y
debe entenderse ms como aproximacin que como equivalencia .
La vocal nmero 1, W, es un poco ms cerrada y anterior que la
vocal [i] del castellano si, por ejemplo.
La nmero 2, [!l], es, asimismo, mucho ms cerrada que la [e] del
espaol me y un poco ms anterior.
La nmero 3, lJ;], en cambio , se asemeja a la primera vocal del
francs bte o. del espaol guerra, es decir, es mucho ms abIerta
que la nmero 2.
La nmero 4, [], es ms anterior que la [a) castellana --que
tiende a ser posterior ms que central- y recuerda a la pnmera
vocal francesa de patte.
[a], vocal cardinal nmero 5, es un sonido muy posterior , semejante al de la primera [a) de ahora o de la palabra mglesa [ather.
La vocal nmero 6, [-], se parece al sonido voclico que se emite
en la palabra inglesa lost, por ejemplo, o a algunas variantes
abiertas de la [o] castellana .
La nmero 7, [Q], es una vocal posterior mucho ms cerrada que
la [o] espaola. Se asemeja , por tanto, a la [o] del francs pot o del
ingls go .
La vocal nmero 8, [y] , es tambin ms alta que la castellana [u) .
Aunque recuerda a la [u] del francs tout, es un poco ms posterior que esta ltima.
. .
La nmero 9, [y], es, en realidad, una [i] redondeada , SimIlar a la
del participio francs vu o el sustantivo alemn Mhe.
.
La vocal cardinal 10, [~], es ms cerrada y antenor que el somdo
de eu en la palabra francesa [eu o la alemana schn ..
La nmero JI, [oe], es ms abierta que la antenor, SImIlar a eu en
el posesivo francs leur o a la vocal alemana de zwlf.
La vocal cardinal nmero 12, [CE], es una [] redondeada .
La nmero 13, [Q], se asemeja a la vocal inglesa de hot, muy
posterior y redondeada.
La vocal cardinal 14, [,,), se corresponde con las vocales de las
palabras inglesas punch o cut, a pesar de que stas suelen ser
ms centrales que la cardinal.
La nmero 15, [1], es una [Q] sin redondeamiento. Vocales semejantes se encuentran fcilmente en lenguas asiticas, como el vIetnamita .

83

Finalmente, la vocal cardinal nmero 16, [w), equivale a una [u)


sin labializacin.
A estas diecisis vocales se suman otras seis que son consideradas
por algunos autores - no por todos (v. O'Connor: 1973, 106 y ss.}vocales cardinales tambin. Tres de ellas no son redondeadas (i, ;), ) Y
las otras tres s lo son (j,, s, e). Su situacin en el trapecio voclico sera
la que muestra la Fig. 5.4.

Figura 5.4.

Todas ellas , como puede comprobarse en este esquema, son vocales centrales c n diferentes grados de abertura.
El sistema de vocales cardinales fue concebido a partir de presupuestos de tipo auditivo (ya hemos dicho que todos estos sonidos son
auditivamente equidistantes) y de tipo articulatorio (cada vocal se corresponde con una determinada posicin <dmite de los rganos articulatorios) . Por consiguiente, al intentar utilizarlas en la prctica fontica diaria , conviene acudir al tiempo a los dos aspectos, al auditivo y al
articulatorio, apoyndonos en nuestras sensaciones de uno y otro tipo
para juzgar qu relacin guarda cualquier vocal con el sistema cardinal.
El procedimiento, as, constar de varios pasos. En primer lugar, se
trata de reproducir en el mejor modo posible el sonido que se desea
estudiar y clasificar. A continuacin, se debern examinar todos los
movimientos realizados por la lengua desde esa posicin hasta la cardinal ms prxima y ello nos proporcionar la clave para describir el
sonido investigado en relacin con el cardinal. En todo momento, nuestras impresiones auditivas y de contacto articulatorio actan como mecanismos de comprobacin, de manera que las decisiones sobre la
similitud o disimulitud de los sonidos son mucho ms rpidas que si
careciramos de puntos de referencia.

84

Los sonidos voclicos pueden experimentar una serie de modificaciones secundarias que afectan a sus caractersticas articulatorias y
acsticas . Las ms importantes son la nasalizacin y la retroflexin .
Las vocales nasalizadas u oronasales son aquellas durante cuya pro-

5 .3.3.

duccin la vula ha descendido, por lo que el flujo de aire ' proveniente


de los pulmones sale al exterior a travs de las cavidades nasal y oral.
Para que una vocal se nasalice es preciso que existan consonantes
nasales en el contexto inmediato. La primera [e) de la palabra espaola
mente, por ejemplo, es una [e) nasalizada, que representamos [e). A
diferencia de lo que ocurre en otras lenguas, como en francs o en
portugus, en espaol las vocales nasalizadas no poseen valor fonolgico, es decir, no sirven para distinguir significados.
Las vocales retroflejas se articulan con la punta de la lengua levantada y dirigida hacia el interior de la cavidad oral mientras toda la masa
de la lengua se contrae lateralmente. Este tipo de vocales, no existentes
en castellano, se escuchan con frecuencia en el ingls americano del
Medio-Oeste, en palabras como shirt o car en las que la consonante [r)
transmite a la vocal el r-colouring, es decir, la retroflexin.
Estas dos modificaciones secundarias, cuyos efectos acsticos explicamos en el apartado 5.4.2, no aparecen recogidas en el sistema de
vocales cardinales porque nunca alteran la naturaleza de la vocal a la
que se superponen, sino que nicamente la modifican en algn aspecto
(vase apartado 7.3 sobre coarticulacin).
A menudo se establece una diferenciacin entre vocales tensas
y vocales relajadas para dar cuenta de contrastes como los que se dan
entre las palabras inglesas seen (<<vistQ)') y sin (<<pecado), o [001 (<<tontO) y [ull (<<lleno). En general, se considera que una vocal tensa
requiere para su articulacin una tensin mayor de los rganos artIculatorios, asociada a una mayor deformacin del tracto vocal con respecto a su posicin neutra o de reposo.
A pesar de que esta distincin resulta til desde el punto de vista
fonolgico, los trminos en que se formula son, cuando menos, dudosos
desde el punto de vista fontico. En primer lugar, la llamada posIcIn
neutra es una cuestin muy controvertida. Muchos autores (v. Lass,
1976 y Catford, 1977, entre otros) cqnsideran que, de existir, debe ser
diferente para cada lengua - no universal- lo que comphca extraordinariamente la descripcin . En segundo lugar, el esfuerzo muscular
mayor que se supone entraan las vocales tensas no ha sido medido
con exactitud y, en todo caso, dnde situamos el limite?, cul es la
mnima cantidad de esfuerzo muscular que nos permite catalogar un
sonido como tenso? (v. Torreblanca , 1976).
Para explicar contrastes como los anteriormente citados, parece

5 .3.4.

85

ms conveniente, por tanto, hacer uso de otros parmetros. Las vocales


de seen y fool son, desde luego, ms altas o cerradas que las de sin y
full. Adems, las primeras se pronuncian con la raz de la lengua ms
separada de la pared farngea, es decir, con una cavidad farngea de
mayor tamao que las segundas. Finalmente, las vocales de seen y fool
tienen mayor duracin -son ms largas- que las de sin y full. Hablar
de vocales anchas frente a estrechas (Ladefoged, 1975) o largas frente a
breves, es, en consecuencia, preferible.

5.4.

Las vocales: caractersticas acsticas

Como explicamos en su momento (vase apartado 2.5.1), el timbre de una vocal depende de su estructura formntica, es decir, de la
disposicin que presenten sus formantes en el espectro . Ya adelantamos tambin en anteriores apartados (vase apartado 2.5.2) que, para
identificar una vocal y distinguirla de las dems, es suficiente , por regla
general, especificar los valores frecuenciales de sus dos primeros formantes, F; y F., si bien es cierto que, en ciertas ocasiones , como veremos, se hace preciso consignar la situacin del F,. La sntesis de habla
ha confIrmado, en efecto, que, partiendo tan slo de los dos valores de
los dos formantes ms bajos, se puede reproducir adecuadamente la
cualidad de la vocal que se desea simular.
A continuacin, en la Fig . 5.5, presentamos el esquema que refleja la
estructura formntica de las vocales espaolas, confeccionado a partir
de las mediciones obtenidas por Martinez Celdrn (1986).
Estos valores, que, como apunta Martinez Celdrn (1986 : 290), han
sido calculados sobre la pronunciacin de las cinco vocales aisladas
por un informante masculino , varan considerablemente de un hablante
a otro, en funcin de factores individuales (edad, sexo, caractersticas
anatmicas ... ) o contextuales . Sin
embargo, el elemento decisivo
2400
para el reconocimiento de cual2100
quier vocal no es el valor abso1800
luto de sus frecuencias formnti1500
cas, sino la relacin que sus for1200
mantes guardan entre s y con
900
respecto a los formantes de las
600
restantes vocales, por lo que las
300
variaciones a que nos referimos
[iJ
[eJ
[al
[oJ
[uJ
no dificultan en modo alguno .la
comunicacin .
Figll%a 5.5.
5.4.1.

86

Para medir el valor frecuencial de un determinado formante -que,


recordemos, no coincide con una nica frecuencia o arm6n.ic~ , sino
que abarca a varios de e11os- pueden seguirse dos procedImIentos:
o bien se toma el valor de la frecuencia central del formante , sobre
un espectograma de banda ancha, o bien , sobre una seccin (vase
apartado 3.2.5) , se registra la frecuencIa a la que est sItuado el
pico ms alto de la envolvente . En ambos casos, existen mrgenes de
error permisibles: en torno a los 20 Hz para el F I , Y entre 20 y 90 Hz
para el F, .
.
.
Segn resulta evidente si observamos de nuevo la Flg. 5.5 , eXIste
correspondencia entre la situacin del F, y la abertura de la caVIdad
oral, de manera que cuanto mayor sea dicha abertura, ms elevada
ser la frecuencia del F, . La [a] es el sonido ms abIerto del castellano ,
y, consecuentemente , su primer formante es el de frecuencIa ms alta .
La [i] y la [u] son las vocales ms cerradas yeso explica la dIspOSIcIn
de sus F en la zona inferior del espectrograma . La [e] y la [o] son
vocales ~edias y sus F tienen tambin valores medios.
Asimismo, podemo~ comprobar en nuestra Fig . 5.5 que cuanto ms
anterior sea una vocal, ms alto estar situado su F, y, al revs, cuanto
ms posterior sea la articulacin, ms bajo ser el valor frecuencial del
F. As, la distancia entre el F, y el F. en las vocales anterIores es la
mayor posible .
.
.
Finalmente , cabe sealar la e strecha relaCin eXIstente entre el redondeamiento o abocinamiento de los labios y el descenso de la frecuencia del F,: si redondeamos los labios estamos alargando la cavidad
de resonancia oral (algunos autores pIensan que, en realIdad , estamos
creando una nueva: vase nuestro apartado 2.1.4), Y todo alargamIento
de este resonador supone un descenso en el tono del sonido , es decir ,
un descenso de la frecuencia .
Como es lgico , las modificaciones articulatorias secunda~ias,
esto es , la nasalizacin y la retroflexin, producen unos efectos acuslIcos particulares.
.
No existe un criterio unnime todava sobre cules sean los ndIces
acsticos responsables de que percibamos una vocal como nasalizada .
Mientras que no pocos autores han supuesto que las resonancIas producidas en la cavidad nasal se aadam) a las resonancIas de la caVIdad
oral, apareciendo en el espectrograma como nuevos formantes - los
formantes nasales o FN- , las investigaciones recIentes muestran que
mucho ms importante que la presencia de estos formantes es el debIlItamiento de la intensidad de los formantes habituales, en concreto del
F, . El fenmeno se comprende si tenemos en cuenta que algunas de las
frecuencias que se producen en las fosas nasales se oponen a las que se

5.4.2.

87

originan en la boca, por lo que la energa de estas ltimas se anula o se


debilita en gran medida.
En cuanto a las vocales retroflejas, se observa en ellas un marcado
descenso en la frecuencia del tercer formante, F3 , que en nada afecta a
la entidad misma de la vocal.
Otras modificaciones articulatorias posibles, tales como la velarizacin o la palatizacin, es decir, el desplazamiento de la zona de articulacin de la vocal ms hacia el velo del paladar o ms hacia la parte
antenor de ste, se manifiestan en el espectrograma por un gran descenso de F, y F3 , la primera, y por una elevacin de los mismos formantes, la segunda.
5.4.3. A partir de la publicacin en 1951 de la obra de Roman Jakobson, Gunnar Fant y Morris Halle, Preliminaries lo Speech Analysis, las
caracterstICas acsticas mencionadas en los apartados anteriores, conocIdas merced al desarrollo del anlisis espectrogrfico, sirvieron de
base para establecer distintas categoras de sonidos voclicos: vocales
densas frente a difusas, gra ves frente a agudas, bemolizadas frente a no
bemolizadas. Las oposiciones creadas de este modo poseen, en la
teora fonolgica jakobsoniana, valor distintivo, esto es, tienen capacidad para diferenciar significados. Las propiedades que las definen - la
d ensidad, la bemolizacin ... - se denominan por ello rasgos distintivos
y, al menos en la formulacin clsica de la teora, slo pueden presentar dos especificaciones [+] o [-] , sin admitir valores intermedios.
Por consiguiente, si decimos que una vocal - un fonema voclico- es
[+ denso], estamos afirmando que las diversas realizaciones en el habla de
ese fonema comparten un rasgo comn, la densidad, por el que tal fonema se opone a otros y cuyos ndices acsticos detallamos a continuacin.
Los sonidos densos se caracterizan por el predominio relativo de
los formantes situados en la regin central del espectrograma. Los
difusos, en cambio, presentan un predominio de las regiones formnticas no centrales. El indicio ms revelador para saber si una vocal es o
no densa nos lo proporciona la posicin del primer formante. En la [a]
de nuestra Fig. 5.5, dicho F, est muy alto , de modo que se trata de un
sonido denso; en la [i] y la [u], difusos ambos , el F por el contrario,
"
est muy baJo. La [e] y la [o] no son ni densos ni difusos:
sus F ocupan
una posicin media.
1
Un sonido se categoriza como grave o agudo dependiendo de qu
parte del espectrograma predomine en cada caso : cuando lo que predomma es la parte baja, se trata de un sonido grave. Si, en cambio,
predomina la parte superior del espectro, el sonido es agudo. El ndice
ms caracterstico de este rasgo en las vocales es la posicin del segundo formante en relacin con la de otros formantes. Los sonidos graves

88

lo presentan ms cerca del primer formante que los agudos, en los


cuales se localiza prximo al tercer formante y dems formantes
superiores. Observando de nuevo nuestra Fig. 5.5, comprobamos que
la [i] y la [e] son agudas, en tanto que la [o] y la [u] son graves. La vocal
[a] no es ni lo uno ni lo otro .
El de bemolizacin es un rasgo de tonalidad, como el anterior. Las
vocales redondeadas son bemolizadas, las no redondeadas son no bemolizadas. El ndice acstico que las diferencia es, segn hemos dicho
anteriormente, el descenso del F, en las primeras.
Cada uno de estos rasgos, integrantes del conjunto de doce que
Jakobson, Fant y Halle concibieron para diferenciar entre s tanto vocales como consonantes, presenta considerables problemas y puede ser
discutido - y de hecho lo ha sido- desde diversos puntos de vista.
Pero ste no es un libro de fonologa (vase la Presentacin de esta
obra y, por tanto, no vamos a detenernos en examinar en profundidad
tan compleja cuestin, merecedora por s sola de toda una monografa.
Conviene recordar, no obstante, que es precisamente en este punto
donde fontica y fonologa se acercan ms actuando la primera en muchas ocasiones como disciplina de consulta a la que el fonlogo acude
para confirmar sus hiptesis. En este sentido, cuanto mejor sea nuestro
conocimiento de la realidad fontica, ms fcil nos resultar la comprensin de los constructos fonolgicos.
5.4.4. En la Fig. 5.6, reproducimos una carta de formantes (vase apartado 2.5.2), a la que se
han trasladado los valores del
F, y F, de las vocales espaolas, de acuerdo con las mediciones proporcionadas por Martnez Celdrn. Como puede observars8,la figura que resulta si

unimos los cinco puntos correspondientes a las cinco vocales es


un tringulo, semejante al que el
alemn C. F. Hellwag concibi en
el siglo XVIII para describir los
sistemas voclicos de algunas lenguas y que normalmente se cono-:
ce como el tringulo de Hellwag.

3000

20CXl

1000

500

250

Figura 5.6.

En su obra clsica Manual de Pronunciacin Espaola, Toms


Navarro Toms precisa cules son las diferentes variantes que las voca-

5.4.5.

89

les espaolas pueden presentar en funcin del contexto. Se distinguen


variantes abiertas y cerradas para las vocales rilo [e]. [o] y [u] . y se
sealan tres tipos diferentes de [a]. la media, la palatal y la velar.
Adems. se diferencia entre [i] y [u] semivocales e [i] y [u] semiconsonantes.
En general. y de acuerdo con las observaciones de Navarro Toms.
las variantes cerradas aparecen en slaba libre . salvo en el caso de la
[e] cerrada, que tambin puede aparecer en slaba trabada por [m],
[n] . [s], [d] O [e]. Las variantes abiertas suelen producirse en slaba
trabada (para la diferencia entre sHaba trabada y libre, vase ms
adelante, Captulo 7, apartado 7.1.8), en contacto con [rr] , delante de [x].
y, tratndose de [e] o de [o], en ciertos contextos adicionales, como los
diptongos [ej] y [oj].
Las semiconsonantes y semivocales slo pueden presentarse como
componentes iniciales o finales de diptongos. respectivamente.
Por lo que respecta a las variedades de [a], Navarro indica que la
palatal se encuentra ante consonantes palatales y en el diptongo [aj]; la
velar, en los grupos [au] y [ao], en slaba trabada por [1] y delante de [x];
finalmente, la media, en todos los dems contextos.
Emilio Alarcos, en su libro Fonologla Espaola (1964), ofreci una
justificacin acstica para las distinciones establecidas por Navarro
muchos aos antes y present los valores frecuenciales de los formantes de cada variante . El planteamiento del ilustre fonetista se vio as
corroborado, en un primer momento , por los nuevos datos brindados
por los espectrogramas , lo que contribuy a que se siguiera considerando como indiscutible. Sin embargo, los resultados de las investigaciones ms recientes ya no concuerdan con los de Alarcos. Si bien es
cierto que existe una gran variabilidad en la realizacin de cada vocal,
el contexto no parece ser el elemento responsable de la aparicin de
una u otra variante. Por el contrario, son otros factores de tipo individual , social o geogrfico los que determinan el empleo de las diversas
modalidades voclicas (v . Momoy Casas, 1980). Consecuentemente,
aunque admitamos la existencia de variantes, no podemos. a la vista de
los resultados del anlisis instrumental. prever de forma sistemtica la
situacin en que se presentarn.

5.5.

Semivocales y semiconsonantes: aspectos


articulatorios y acsticos

5.5.1. Como explicaremos ms detalladamente en el Captulo 7, en


algunas lenguas dos o ms vocales pueden aparecer agrupadas en una
sola slaba. Tenemos ejemplos de ello en muchas palabras espaolas :
90

cie-Jo , pei-ne, ha-cia , cua- ira , claus-tro, ais-Iar, etc . Vemos que todos

estos vocablos constan de dos sHabas , una de las cuales posee dos
vocales en su interior. Pues bien , estas combinaciones tautosilbicas (es
decir, pertenecientes a una misma sHaba) de dos vocales se denominan
diptongos . Si el nmero de vocales aumenta hasta tres. entonces hablamos de triptongo.
Hay idiomas en los que no existe este tipo de agrupaciones voclicas. Sin embargo en alemn o en ingls. por ejemplo, son muy abundantes. En ingls , adems. tambin es posible encontrar triptongos :
follower ['faloua], iron ['aian], player ['pleia] , etc . (Para la naturaleza
fonolgica de estos diptongos y triptongos, v. AJcaraz y Moody, 1976:
85, 98).
En los diptongos y en los triptongos no todas las vocales desempean el mismo papel. Existe en ellos una vocal que es el autntico ncleo
de la slaba, mientras que la otra u otras restantes constituyen sonidos
de transicin hacia las consonantes vecinas. Esos sonidos de transicin
o deslizamiento, que en la tradicin fontica anglosajona se conocen
como glides, son las articulaciones semiconsonantes y semivocales, a
las que dedicaremos los prximos apartados.
5.5.2. El ncleo silbico es, en cualquier lengua, el sonido que rene
las mejores cualidades de entre todos los sonidos que integran la
slaba: es el ms abierto , el ms perceptible, el ms intenso, etc. (vase
Captulo 7, apartado 7.1). Por consiguiente , de todas las vocales que
forman un diptongo o un triptongo, la que posea dichas caractersticas
en mayor medida ser la que ocupe la posicin nuclear . As, en espaol, la vocal abierta [a] y las medias [e] y [o] tienen prioridad' sobre las
vocales cerradas [i] y [u] para constituir el ncleo silbico. En una
slaba como pien, por ejemplo, la [e] es la vocal nuclear, de la misma
forma que lo son la [o] y la [a] en toi y pau, respectivamente . En cuanto
a los triptongos, su ncleo est formado siempre por la vocal central.
En castellano, pues, se consideran diptongos las uniones tautosilbicas [i, u] con [o, e, a] ; las de [o , e, a] con [i, u] ; y las de [u] con [i] o [i]
con [u]. Los primeros se denominan diptongos crecientes , puesto que
en ellos se produce, al pasar del segmento inicial al siguiente , un
incremento en la abertura, perceptibilidad, etc .; los segundos se llaman
decrecientes porque presentan una ordenacin opuesta a la de los
anteriores; finalmente, en el tercer y cuarto caso, en los que existe
igual grado de abertura, no se habla de diptongos crecientes o decrecientes: el ncleo lo ocupa la vocal que posea mayor intensidad , es
decir, la que recibe el acento (en los inacentuados, predomina siempre
la segunda vocal) .
Si el ncleo est situado en segunda posicin, como en todos los
91

d iptongos crecientes, se dice que el otro segmento voclico integrante


de la slaba tiene una articulacin semiconsonante; si, por el contrario,
el ncleo ocupa la primera posicin, segn Ocurre en los diptongos
decrecientes, el segmento que le sucede presenta una articulacin
semivocal. Esta diferenciacin, mantenida durante largo tiempo y revisada en la actualidad, se basa en la idea de que la semiconsonante es
una articulacin a medio camino entre la consonntica y la voclica, que
comienza con un grado de cierre casi similar al de una consonante
fricativa para ir abrindose paulatinamente, en tanto que la articulacin
semivocal responde a movimientos articulatorios de carcter inverso,
esto es, consiste en una transicin desde la abertura voclica a la
constriccin fricativa. Las vocales [i] y [u] de miedo y suelo son, de
acuerdo con lo anterior, articulaciones semiconsonantes y se representan fonticamente como D] y [w]; las vocales [i] y [u] de baile o feudal
son, en cambio, articulaciones semivocales, cuyos smbolos en el Alfabeto Fontico Hispnico (empleado en los pases hispanohablantes) son
[i] y [\,l] y, en el Alfabeto Fontico Internacional, los mismos que para las
semiconsonantes correspondientes (vase al respecto el Captulo 6).
Como decamos, en el momento actual se tiende a no efectuar esta
distincin y a considerar semiconsonantes y semivocales como sonidos
articulatoriamente similares - los dos suponen una transicin- englobados en un tipo articulatorio ms amplio que es el de los sonidos
aproximan tes. Dado que en este grupo se incluyen sobre todo sonidos
consonnticos (la vibrante fricativa [1] , por ejemplo, o la labiodental
[uJ), volveremos a ocuparnos de l en nuestro prximo apartado, 5.6.
Baste por el momento sealar que se denominan aproximantes todos
aquellos sonidos que presentan un grado de constriccin menor que el
que ofrecen las fricativas, aunque mayor que el de las vocales, y, en
consecuencia, no van acompaados de ruido de friccin. Algunos autores espaoles (v. Quilis: 1981, 176 y ss., y Martnez Celdrn: 1986,
171) no estn de acuerdo con la inclusin de las semivocales y semiconsonantes entre las aproximantes. El problema radica en que este ltimo
concepto ha sido elaborado por fonetistas anglosajones (es creacin de
P. Ladefoged), que lo han ejemplificado con las agrupaciones voclicas
existentes en ingls, no equiparables en modo alguno con los diptongos espaoles. As, los sonidos iniciales de las palabras inglesas you o
we seran, respectivamente, las aproximantes [j] y [w], que cumpliran
en realidad una funcin consonntica y que se diferencian en gran
medida de los sonidos espaoles D] y [w] de cielo o pueblo, autnticos
sonidos voclicos transitorios.
En determinados contextos, sin embargo, las semiconsonantes espaolas adquieren una articulacin bastante similar a la de las aproximantes inglesas a que nos referimos. En trminos como hiedra, hierro,
92

hueco, huevo, etc., es decir , cuando van en posicin inicial de palabra

o entre vocales, las vocales cerradas sufren un proceso de consonantizacin que las convierte en autnticas aproximantes , las cuales en ciertos casos pueden llegar a desarrollarse a su vez como plenamente
fricativas: ['rerro], ['Ywe~o]. Parece , pues, razonable , aunque mantengamos la diferenciacin semiconsonante-semivocal, tomar en consideracin la nueva categora de aproximante , en estrecha relacin, como
vemos, con las anteriores.

Acsticamente es posible saber si dos vocales forman o no diptongo a partir de la velocidad de transicin entre los formantes de una
y otra . Si esta transicin es relativamente larga y se produce,
por tanto, lentamente, las dos vocales constituyen un diptongo. Si,
:. " ~ ,,. '~~!
en cambio, el paso de los formantes de la primera a la segun"
" I~' ~ .
da es rpido y dura poco tiempo,
entonces las dos vocales no
forman diptongo, sino que estn en hiato, esto es, pertenecen
a dos slabas distintas (v. Borzone de Manrique: 1980). En la
Figura 5.7, se muestran las representaciones espectrogrficas
del diptongo [w] y del hiati

w
to [u.]. Pueden constatarse en
Flgun 5.7. Hiato [u.] y
ella las diferencias que seadiptongo [w].
lamoso

5.5.3.

~\

. .....

..

5,6.

Las consonantes: caractersticas articulatorias

Las consonantes se han descrito tradicionalmente en funcin de


tres parmetros: la accin de las cuerdas vocales durante su emisin, la
zona en que su articulacin tiene lugar y el modo en que se lleva a cabo
tal articulacin . Sin embargo, cabe considerar otro criterio ms, previo
si se quiere a los anteriores, por el que se divide a las consonantes en
virtud de la corriente de aire que se utilice en su pronunciacin.
As pues, las consonantes pueden ser, en primer lugar, egresivas,
ingresivas o eyectivas.
Las egresivas , que son las ms frecuentes, se articulan con el flujo

.5.6.1.

93

de aire proveniente de los pulmones . Todas las consonantes castellanas


son, como ya dijimos (vase Captulo 2), egresivas .
Las ingresivas , en cambio , se realizan mediante el aire que penetra
desde el exterior. Entre ellas, las llamadas inyectivas requieren la
formacin de una oclusin en la boca y otra en la glotis , que , cuando
estn constituidas, crean una cmara de aire cerrada. Es entonces cuan-

do la laringe desciende, con el consiguiente aumento del tamao de


esta cavidad y el consiguiente enrarecimiento del volumen de aire en
ella contenido. Esta rarefaccin de las partculas de aire explica que , al
relajarse la oclusin bucal , penetre aire del exterior (recurdese, a
este respecto, todo lo explicado en el apartado 2.2 .1). Existe otro tipo
de consonantes ingresivas , los clics, cuyo mecanismo de articulacin
difiere del que acabamos de explicar. En estos sonidos, tambin hay
una oclusin doble, en el velo del paladar y en la zona anterior de la
boca. En la cavidad as formada se origina el enrarecimiento del aire
haciendo que la lengua se arquee hacia abajo o descienda, para, de
este modo, lograr que el aire del exterior entre en la boca. Los clics no
existen en las lenguas europeas , pero abundan en ciertas lenguas africanas como las pertenecientes a la familia bant.
Finalmente , para articular las consonantes eyectivas -n realidad
un tipo especial de egresivas- se utiliza el aire almacenado en la cavidad creada entre dos oclusiones, una de ellas en la glotis. Si se eleva
la laringe, este volumen de aire se ve constreido hasta tal punto que
ha de salir bruscamente al exterior dando lugar a la consonante.
5.6.2. La actividad fonatoria de la laringe nos divide a las consonantes
en sordas y sonoras . Durante la emisin de las primeras , las cuerdas
vocales no vibran , mientras que s lo hacen en el caso de las segundas
(vase apartado 2.2 .3). En la relacin de la Fig . 6.1 puede verse cules
son las consonantes castellanas sonoras y cules las sordas .
A menudo se ha dicho que los sonidos consonnticos sordos son
tensos, fuertes o fortis, en tanto que los sonoros son relajados, dbiles o ,denis. Se alude con ello de nuevo al parmetro de tensin, al que
nos referimos a propsito de las vocales . E. Alarcos, por ejemplo ,
escribe (1964, 199 Y ss .): Esta correlacin [la sonoridad] aparece
muchas veces combinada con la anterior [la de tensin] , y, as, una de
ellas es redundante. Las ltimas experiencias muestran que para la
percepcin de la (sonoridad) no siempre es necesaria la vibracin de
las cuerdas vocales . La idea es, por tanto, que en las posiciones o
contextos en que se pierda la vibracin larngea (v.g. en la voz cuchicheada) , la distincin entre las consonantes sordas y sonoras se mantiene gracias a la propiedad concomitante de la tensin. Algunos
autores piensan incluso que es sta y no la sonoridad la propie-

94

dad realmente distintiva - al menos en castellano (v. Martnez Celdrn: 1984a).


Al igual que ocurra en el caso de las vocales, se considera que una
consonante tensa posee una duracin superior a la de una relajada y,
adems, se articula con una deformacin mayor del canal bucal con
respecto a la posicin neutra o de reposo y con una mayor intensidad.
En el caso de las oclusivas, la explosin con que se deshace la oclusin
es, asimismo, ms fuerte en las tensas que en las relajadas, y, en
general, la perceptibilidad es mayor en las primeras que en las segundas. Estas caractersticas han sido ampliamente investigadas y se han
visto corroboradas en muchas lenguas mientras que no lo han sido en
otras (v . Catford: 1977, 202 Y ss .). Por consiguiente, si, a pesar de las
objeciones que la tensin ha recibido como parmetro fontico independiente, se desea utilizarlo para describir una consonante, habr que
especificar en qu sentido se est manejando el concepto , es decir,
cules de las caractersticas anteriores lo manifiestan en la lengua concreta de que se trate y cules no .
En espaol parece que la tensin consonntica guarda una relacin
directa con la duracin y una relacin inversa con la intensidad, segn
se desprende de algunas pruebas experimentales (v . Martnez Celdrn: 1984b). As, por ejemplo, una oclusiva sorda, que no posee apenas intensidad y es comparativamente larga se considerar tensa y una
oclusiva sonora ser, en cambio, relajada . La cuestin, no obstante,
queda abierta: pueden existir otras propiedades acsticas y/o articulatorias, todava no definidas, que reflejen la tensin. Estudiar y precisar
estas caractersticas es el paso previo para poder abordar el problema
de la distintividad, esto es , para saber qu oposicin, sordo-sonoro o
tenso-relajado, es pertinente - sirve para diferenciar significados- en
nuestra lengua .
El tercer criterio de clasificacin de las consonantes se refiere a
la zona del tracto vocal en que se articulen. Preferimos emplear el
vocablo zona en lugar del ms difundido punto, porque este ltimo da a
entender que los articuladores se unen o aproximan en lugares muy
exactos, lo que no se ajusta del todo a la realidad: hay un cierto grado
de variacin dentro de los limites correspondientes a cada divisin del
tracto.
Podemos distinguir las siguientes zonas de articulacin:

5.6.3.

1. Zona labial. En ella se producen dos tipos de sonidos, los


bilabiales y los labiodentales . Los primeros se articulan juntando o

aproximando los dos labios; los segundos, juntando o aproximando el


labio inferior a los incisivos superiores . En castellano , son bilabiales la

95

[p], lb], W] y [m]; son labiodentales slo la [1] y la nasal [11)] que se
escucha, por ejemplo, en enfermo. Ello no quiere decir que no existan
muchas ms posibilidades de articulacin en esta zona. El sonido [q>] es
una fricativa sorda bilabial que se da en bastante lenguas, entre ellas el
aleman (schwer) y algunas variedades del espaol americano. El sonido [v] es una fricativa sonora labiodental con la que se pronunciaban en
castellano palabras como Valencia o vaca , antes de que se generalizara
su confluencia con [b]. Finalmente, la [u] es una aproximante, es decir,
una fricativa ms abierta de lo normal (vase apartado 5.6.5) , labiodental sonora.
2. Zona dental. Consideramos dentales a los sonidos articulados
en los dientes, ya sea situando el pice de la lengua entre los incisivos
superiores e inferiores, como en las interdentales, ya sea apoyndolo
contra la cara interna de los incisivos superiores, como en las dentales
propiamente dichas. Son articulaciones interdentales en espaol la [9],
interdental fricativa sorda, y [),l, UJ o [p,l cuando se encuentran delante
de esta consonante interdental, que les transmite su zona de articulacin. Consonantes dentales son, en castellano, la [t], la [d] y la [o]. La
primera es oclusiva y sorda; la segunda, oclusiva sonora; la tercera.
fricativa sonora.
3. Zona alveolar. Los alveolos son las protuberancias que marcan la insercin de los dientes en las mandbulas. En las llamadas
articulaciones alveolares, por tanto, el pice o el predorso de la lengua
toca o se acerca a los alveolos superiores y as se producen sonidos
como [s], su variante sonora [z], la en], las vibrantes simple y mltiple
[r] y [rr], la fricativa [1], y la [1], adems de otros sonidos no existentes
en espaol como las consonantes retroflejas [11.1, [~] , [r], etc., que se
caracterizan por pronunciarse con el pice de la lengua dirigido hacia
el interior de la cavidad oral (recurdese lo que explicamos sobre las
vocales retroflejas, vase apartados 5.3 y 5.4).
4. Zona pala tal. En la zona pala tal cabe hacer una distincin entre la parte del paladar que linda directamente con los alveolos y que
denominaremos zona prepalatal, y la superficie del paladar situada a
continuacin de sta, que se conoce como zona pala tal propiamente
dicha . Sonidos prepalatales son, por ejemplo, las consonantes [S] y [3],
que encontramos en la palabra inglesa she o en la francesa genou,
respectivamente, o las consonantes polacas [p] y [~]. A menudo se llama
a estos sonidos palatoalveolares, porque, segn decimos, se pronuncian en el limite de las dos zonas. En cuanto a los sonidos palatales, en espaol tenemos algunos: la (P] de and, la (J] de chal,
la [d3] de cnyuge, su variante fricativa rI], de mayo, por ejemplo,
y la [A] de llama, todas son consonantes pronunciadas en la zona cor respondiente al paladar duro. Otras lenguas, .como el alemn, poseen

96

una fricativa palatal sorda , [<;:], que suena en vocablos como ich o
nicht.
5. Zona velar.

En la zona del velo del paladar se articulan un


gran nmero de consonantes. Al igual que suceda en el caso anterior,
algunas de ellas pueden clasificarse, en realidad, como postpalatales,
puesto que se pronuncian en el limite entre la zona pala tal y la velar. En
castellano son velares la [g] oclusiva y la fricativa [Y], la [k], [x] (que no
debemos nunca confundir con la x ortogrfica, puesto que se trata
del smbolo fontico empleado para representar a la j de jin"te, por
ejemplo) y la [U] que se velariza ante consonantes velares: r;gel ['aU
xel].
6. Zona uvular. Los sonidos uvulares se realizan elevando la
parte posterior de la lengua hacia la vula, o acercando la vula hacia
el posdorso de la lengua: depende cul sea en cada caso el rgano
activo y el rgano pasivo. Son sonidos uvulares tpicos las erres
francesas, esto es, la [R] vibrante simple o mltiple que se escucha en
el francs hablado en Pars, as como su variante fricativa [11].
7. Zona faringea. Las consonantes farngeas se forman juntando
o aproximando la raz de la lengua a la pared farngea . As se articula,
por ejemplo, la [ farngea danesa. Sin embargo, los sonidos farngeos
ms caractersticos, como son los
rabes [n) y [ ~ ], suelen articularse mediante una contraccin
Pre palatal
lateral de la faringe , que puede
Alveolar
Pala tal
ir o no acompaada de una ligera elevacin de la laringe .
Bilabial
8. Zona glotal o larngea.
Uvular
En ella se pueden formar una
Farngea
Labiooclusiva como [?] - al cerrar las
dental
cuerdas vocales fuertemente- o
Glotal
fricativas como [h] o [fi], sorda
y sonora, respectivamente (vase lo expuesto en el apartaFigura 5.8. Las diferentes zonas
tado 2.3.2 sobre la aspiracin).
de articulacin .
5.6.4. Son muchas las lenguas, especialmente de Africa, en las que
existen sonidos que los fonetistas transcriben como [kp] o [gb]. Son las
lamadas consonantes con doble articulacin. Normalmente se trata de
oclusivas (aunque tambin hay fricativas) en las que la oclusin se
forma y se deshace de modo simultneo en dos zonas.
Este tipo de consonantes no debe confundirse con aquellas otras
que han visto modificada su articulacin mediante la adicin de alguna
caracterstica secundaria. Por ejemplo, si abocinamos los labios para

97

pronunciar [k] obtenemos una velar labializada que transcribimos [kW ].


Cabra pensar, entonces, que el sonido [kp], citado anteriormente y
que se describe como una labio-velar, y el sonido [kW ] al que nos
referimos ahora son una misma cosa, pero, sin embargo, en el primer
caso hablamos de doble articulacin y, en el segundo, de modificacin
secundaria. La razn es que en [kp]las dos articulaciones co-ocurrentes presentan el mismo grado de obstculo a la salida del aire, esto es,
estn situadas, por as decirlo, a la misma altura en la escala de abertura de los sonidos : en concreto, las dos son oclusivas porque cierran el
paso durante milsimas de segundo al flujo de aire egresivo . En [kW ],
por el contrario, las dos articulaciones simultneas no pertenecen al
mismo nivel; mientras que [k] sigue siendo una oclusiva, la articulacin
secundaria [w] es mucho ms abierta, cuasi-voclica. Aunque no siempre es fcil distinguir la una de la otra, ambas modalidades reciben
convencionalmente denominaciones distintas. Las dobles articulaciones
se nombran utilizando los trminos correspondientes a las dos zonas
implicadas separados por un guin (labial-velar, labial-palatal, etc.), en
tanto que las articulaciones secundarias se precisan empleando un adjetivo que acompaa a la denominacin de la zona de articulacin
propia de la consonante (velar labializada, velar palatizada, alveolar
velarizada, etc.).
Segn se desprende de lo que acabamos de explicar, las modificaciones articulatorias secundarias que puede experimentar una consonante son varias. Hemos visto ya que la labializacin consiste bsicamente en aadir el sonido original un componente similar a [w] . Pues
bien, adems de labializarse, las consonantes pueden palatalizarse,
velarizarse o faringalizarse .
La palatalizacin supone la adicin a la articulacin base de una
posicin de la lengua semejante a la requerida para pronunciar la
semiconsonante [j]. Las consonantes palatalizadas son muy abundantes
en ruso y otras lenguas eslavas .
La velarizacin entraa una elevacin de la parte posterior de la
lengua hacia el paladar blando, algo parecido a lo que ocurre cuando
pronunciamos la vocal cardinal nmero 16, es decir , la [w] o [u] sin
redondeamiento . La [1] velarizada , [1] , se escucha , por ejemplo , en
cataln, as como en ingls y en otras muchas lenguas.
Finalmente, la faringalizacin implica la superposicin a la articulacin base de un estrechamiento de la cavidad farngea , conseguido al
retrotraer la raz de la lengua o al contraer lateralmente la faringe y
subir la laringe . Las consonantes enfticas del rabe son muy a menudo faringalizadas .
Estas no son las nicas modificaciones posibles , pero s las ms
frecuentes . Su transcripcin fontica se realiza mediante la utilizacin

98

de signos diacrticos aadidos a los smbolos habituales para representar las consonantes no modificadas : [W] para la labializacin, l'] o [,] para
la palatalizacin, [ -] para la velarizacin y la faringalizacin (vase ms
adelante, Captulo 6).
5.6.5. La manera o el modo en que se articulan las consonantes es el
ltimo parmetro empleado para clasificarlas. Se trata de describir la
disposicin particular que presentan los rganos articulatorios en .Ia
zona en que se conforma el sonido. As, tenemos las slgUlentes poslblhdades:
1. Articulaciones oclusivas. Segn hemos venido sealando (vase apartado 2.4.2), en ellas los rganos crean un obstculo absoluto a la
salida del aire, un cierre completo, que dura milsimas de segundo y
que suele deshacerse mediante una pequea explosin . Hay oclusivas
labiales, como las espaolas [p] y lb]; oclusivas dentales como [t] y [d] ;
velares, como [k] y [g]. Aparte de ser sordas o sonoras , como sucede
en castellano, las oclusivas, especialmente las sordas, son con mucha
frecuencia aspiradas (vase apartado 2.3.3). Si la aspiracin es muy
fuerte, las aspiradas tienden a convertirse en africadas, grupo del que
hablaremos en seguida. Las oclusivas fuertemente aspiradas se representan con una [h] situada a continuacin de su propio smbolo; las de
aspiracin suave, con el apstrofo ['] pospuesto o una pequea [h]
volada .
2. Articulaciones fricativas . Su propiedad caracterlstica es que
los rganos empleados en su articulacin se aproximan, sin llegar a
juntarse como ocurrla en el caso de las oclusivas . Las fricativas son, por
regla general, ms numerosas que las oclusivas en las diferentes lenguas del mundo. En castellano, son fricativas la [s], la [9], la [~], la [5], la
[.], la [x], la [1] , la [J] y la [1], pero existen, claro est, muchas ms
realizaciones posibles (vase el Alfabeto Fontico Internacional de la
Fig . 6.3).
3. Articulaciones africadas o semioclusi vas. Muchos autores las
consideran un tipo especial de oclusivas . En realidad , en ellas se produce un cierre absoluto del canal en alguna de sus zonas que se
resuelve en un estrechamiento por el que el flujo de aire sale al exterior, acompaado de ruido de friccin. Son, pues, consonantes con dos
modos de articulacin sucesivos : oclusivo y fricativo. En espaol hay
dos africadas: la ch, representada (tJ), y la y inicial o tras nasal.
representada [d3].
4. Articulaciones aproximantes . Ya nos referimos a ellas al hablar
de las semiconsonantes y semivocales (vase apartado 5.5.2). Como
dijimos entonces, se trata de sonidos pronunciados con una constric-

99

cin del canal menor que la que presentan las fricativas, pero mayor
que la que se da en las vocales. En castellano, muchas de las fricativas
intervoclicas se convierten con facilidad en aproximan tes y se representan con el diacrltico [el suscrito. En realidad , la frontera entre las
dos categoras es bastante borrosa y no puede decirse que existan
lineas divisorias claras. Al margen de la discutible catalogacin de las
semiconsonantes y semivocales como tales , hay varias aproximantes
puramente consonnticas: la labiodental sonora [u], comn a muchas
lenguas de la India, y la [1] aproximante, a la que se le asigna el mismo
smbolo fontico que a la fricativa, son ejemplos de ello.
5. Articulaciones laterales. En las consonantes laterales , el rgano articulador activo , habitualmente la lengua, toma contacto con el
pasivo en alguna zona del canal vocal, pero este contacto slo tiene
lugar en la parte central de dicho canal, de modo que el flujo de aire
puede salir libremente por los dos lados del obstculo . Hay laterales
alveolares - la espaola [1]- ; dentales - la W dental francesa-; palatales - la [A]- y laterales velarizadas (vase, anteriormente , apartado 5.6.4).
6. Articulaciones vibrantes. Las vibrantes se caracterizan porque
el rgano activo, que generalmente es el pice de la lengua o la vula,
realiza varias oclusiones apoyndose en el rgano pasivo, es decir, los
alveolos o el dorso posterior de la lengua, respectivamente (aunque
tambin existen vibrantes bilabiales, en las que un labio golpea contra
otro, son poco frecuentes). Entre cada una de estas oclusiones, surgen
elementos de carcter voclico, de claro reflejo en el espectrograma
segn veremos en e l prximo apartado.
La [R] uvular ha sustituido de manera total o parcial a la [r] alveolar
en un gran nmero de lenguas, como el francs, alemn, dans, holands, etc . En la mayor parte de los casos, sin embargo , el significado de
las palabras no se ve alterado si se utiliza un tipo de erre en lugar de
otro. Ambos sonidos, adems, suelen experimentar en determinados
contextos un proceso de debilitamiento que les lleva a convertirse en
fricativos, es decir, a pronunciarse sin contacto completo entre el rgano activo y el pasivo.
En espaol , existen dos sonidos vibrantes: el simple , [r] , que aparece, por ejemplo, en la palabra pero, y el mltiple , [rr] , que encontramos en perro.
A las consonantes vibrantes se las asocia tradicionalmente con las
laterales para constituir el grupo de las liquidas. Es sta una antigua
denominacin reservada para los sonidos consonnticos con caractersticas acsticas similares a los voclicos, generalmente sonoros y con
rasgos articulatorios comunes, como puede ser la presencia combinada
de un obstculo con una abertura simultnea o subsiguiente .
100

7. Articulaciones nasales. Todas las modalidades de articulacin


vistas hasta ahora poseen un rasgo en comn: todas ellas se definen en
funcin de la cavidad oral, que es el resonador que interviene en todos
los casos . Pero, como sabemos, durante la emisin de algunos sonidos,
el velo del paladar puede estar caido y dejar por ello el paso a la
cavidad nasal abierto a la corriente de aire procedente de los pulmones. Es entonces cuando se articulan los sonidos nasales, en los que
acta una cavidad de resonancia suplementaria, la nasal. En castellano
hay varios sonidos nasales. Todos ellos presentan una oclusin en la
cavidad oral, situada en distinta zona en cada caso, mientras que la
salida a travs de las fosas nasales permanece libre de obstculo.
Tenemos as la [m], la [n], la [Q], etc. (vase Fig. 6.3).
Se debe poner especial cuidado en no confundir los sonidos nasales
puros con los sonidos oronasales o nasalizados, producto del fenmeno
combinatorio de la coarticulacin (vase apartado 7.3) Y a los que ya
nos referimos en el apartado 5.3.3.
Las nasales y las liquidas se agrupan con las vocales en el conjunto
de sonidos sonantes, esto es, aquellos sonidos que acsticamente comparten una estructura formntica clara y que funcionalmente pueden
desempear el papel de ncleo silbico o centro de la slaba.

5.7.

Las consonantes: caractersticas acsticas

Desde el punto de vista acstico, las consonantes son sonidos en


los que ha intervenido una fuente de ruido, bien sea transitorio o
turbulento (vase apartado 2.4.2). En ocasiones esta fuente de ruido
acta conjuntamente con la fuente glotal y la consonante resultante se
denomina sonora; en otros casos, no hay vibracin de las cuerdas
vocales y la consonante se clasifica como sorda. Algunas de ellas, por
otra parte, presentan una estructura formntica bien definida - las sonantes- y otras, en cambio, no presentan farmantes claros, sino energa acstica distribuida desordenadamente en determinadas frecuencias - las no sonantes u obstruyentes.
Como es natural, la descripcin de cada uno de estos tipos debe
hacerse de modo distinto. Las sonantes se describirn en funcin de la
posicin de sus formantes en la escala de frecuencias y de la relacin
que dichos formantes guardan entre s (al igual que hacamos en e l caso
de las vocales); las no sonantes se describirn a partir de la gama de
frecuencias en las que se distribuye su energa, por la presencia o
ausencia de perodos de silencio a lo largo de su duracin, o por las
especiales propiedades de la fase final de su emisin.
Toda esta informacin ha de extraerse del espectrograma. No siem-

5,7.1,

101

1" I (8 rcil hacerlo, porque a veces el mismo sonido pronunciado por


1" Ison S diferentes o en contextos distintos ofrece espectros que difieI n uno de otro considerablemente. Los ndices que se revelen deciSIVOS para la caracterizacin acstica de una consonante deben tener
pues, un cierto margen de variabilidad, al tiempo que han de servir d~
medio para su identificacin y descripcin. En los prximos apartados,
enumeraremos los ndices acsticos consonnticos ms importantes.
5.7.2. El nmero de consonantes diferentes que pueden encontrarse
en las diversas lenguas del mundo es enorme . Sin embargo, todas
tienen en comn el hecho de que su identificacin acstica depende, en
gran medida, de las modificaciones o inflexiones que producen en los
formantes de las vocales vecinas, As, mientras toda vocal se asocia con
unos ndices estables, la manifestacin acstica de cualquier consonante es sumamente variable y viene determinada por el contexto,
Las inflexiones a las que nos hemos referido se denominan transiciones y son el reflejo de los movimientos que efectan los rganos artIculatonos para pasar de un sonido a otro, es decir de las va-

riaciones que experimentan las cavidades de resonancia ~n su forma

y en su tamao. Ya explicamos que eran un ndice importantsimo


para dilucidar si dos vocales sucesivas constituan o no diptongo (vase apartado 5.5.3). Ahora explicaremos en qu sentido son decisivas
para el reconocimiento de las consonantes.
Supongamos que obtenemos
el espectrograma de la secuencia vaya (,baJa], que esquematizamos en la Fig. 5.9. Observamos que los segundos y terceros
formantes de las dos vocales [a]
sufren en sus extremos una variacin consistente en una ligera

elevacin con respecto a la altura media del cuerpo del formante. Si prolongamos, mediante lneas de puntos, el movimiento
ascendente del segundo formante de las dos vocales, compro(b] (]
(jJ (a]
baremos que las dos lneas se
cruzan en un punto de intersecFigura 5.9.
cin virtual que se conoce como acuso
El locus estar situado a diferente altura segn se trate de una u otra
consonante, de forma tal que cuanto ms posterior sea la zona de
102

articulacin de sta, ms elevada ser la disposicin del locus en la


escala de frecuencias. As, ellocus de las consonantes labiales se sita
en torno a los 700 Hz; el de las dentales, entre los 1.000 y los 1. 700 Hz; el
de las alveolares, alrededor de los 1.800 Hz; el de las palatales, entre
los 2,000 y los 2.500 Hz, Y el de las velares, a 3.000 Hz. En este ltimo
caso, si la vocal es posterior, ellocus desciende mucho, hasta situarse a
la altura de 800 Hz, ms o menos. (Quede claro que siempre hablamos
de valores aproximados.)
5.7.3. Cuando la consonante es una oclusiva, presenta en el espectrograma un espacio en blanco, correspondiente al tiempo en que los
rganos articulatorios se unen e impiden la salida al exterior del flujo
de aire procedente de los pulmones. Si la oclusiva, adems, es sonora,
la vibracin de las cuerdas vocales se reflejar en el espectrograma
como una barra de sonoridad, una franja gruesa similar a un formante
de frecuencia baja y situada inmediatamente encima del eje de abscisas.
No todas las consonantes oclusivas resuelven su oclusin mediante
una ligera explosin, aunque la denominacin de explosivas que a
veces se les atribuye as parece indicarlo. Lo cierto es que en muchos
contextos esa explosin no se produce. En caso de existir, su representacin en el espectrograma es una barra perpendicular (llamada barra
de explosin), localizada al final del sonido oclusivo y antes del sonido
voclico siguiente. El punto o la zona de mayor intensidad de dicha
barra , donde la energa est ms concentrada, puede estar situado a
diferente altura con respecto al eje de ordenadas (=eje de frecuencias), por lo que se convierte tambin en un indicio valioso para la
identificacin de la consonante de que se trate.
5.7.4. Si un sonido es producto de una fuente de ruido turbulento, y
adems es sordo, como por ejemplo ocurre con las fricativas castellanas [s], [f], [e] o [x], su imagen en el espectrograma se caracteriza por
el modo desordenado en que aparece distribuida su energa, que
desciende desde las altas frecuencias hacia las bajas en una banda
vertical de intensidad variable. Cuanto ms anterior sea la zona de
articulacin de la consonante, ms alto ser el comienzo de las frecuencias.
Por otra parte, en las fricativas sonoras del tipo [~], [iI] y [.] , en lugar
del espacio en blanco que distingue a las oclusivas correspondientes,
aparecen zonas de resonancia, de configuracin parecida a los formantes voclicos, ms numerosas cuanto ms pequea sea la constriccin
de los rganos articulatorios y, consecuentemente, ms fcil la salida
del aire al exterior.
103

De acuerdo con todo lo anterior, la representacin de las consonantes africadas, que, como explicamos, combinan estos dos modos de
articulacin (vase apartado 5.6.5), se compone de un primer momento
oclusIvo - un blanco en el espectrograma y una barra de explosin no
sIempre presente- y un segundo momento fricativo, con su turbulencIa caracterstica. Por regla general, el periodo de oclusin es mayor
que. el de fncacln, pero la duracin relativa de ambas fases depende,
en ultima mstancia, de factores dialectales o sociales.

8000

7500
7000

.,

6SOO

6000

5.7.5. Veamos ahora cules son los ndices acsticos caractersticos de


las consonantes sonantes.
. La estructura formntica de las lquidas es, segn dijimos, muy
SImIlar a la de las vocales, aunque su frecuencia fundamental y su
IntenSIdad son claramente menores que las de los sonidos voclicos.
Las laterales, en concreto, presentan tres formantes bien definidos cuyos valores frecuenciales varan de un idioma a otro y de un contexto a
otro. (Para todo lo referente a las laterales castellanas, vase Quilis et
al., 1979).
En cuanto a las vibrantes, es interesante sealar que el espectrograma refleja las rpidas oclusiones que se suceden en su articulacin
como brevsimas interrupciones de la corriente de aire, es decir, como
pequeos espacios en blanco. Si la vibrante es mltiple, entre las
InterrUpCIOnes sucesivas suelen aparecer elementos de tipo voclico,
que se corresponden con los momentos en que el aire sale libremente
al exterior. En espaol, adems, cuando la vibrante va formando grupo
con una consonante oclusiva o fricativa en posicin inicial de slaba
~om? en bro, traje , frotar, droga, etc.-, sus vibraciones no siguen
mmedIatamente a la consonante anterior, sino que entre una y otra se
produce a menudo un pequeo elemento voclico, de duracin variable y de configuracin similar a la de la vocal que constituye el ncleo
SIlbICO, conOCIdo con el nombre de elemento esvarabtico (v. Malmberg: 1965, 29-49, y Quilis: 1981 , 296-300).
Las consonantes nasales suelen presentar en los sonogramas dos o
ms formantes de menor energa que los voclicos. Asimismo , al igual
que sucede en las vocales nasalizadas (vase apartado 5.4.2), en ellas
apa~ecen formant~s complementarios que reflejan las resonancias prodUCIdas en la caVIdad nasal y que se denominan, por ello, forman tes
nasales. El ms importante de estos formantes, el FN" se sita en torno
a los 250 Hz; los restantes son sumamente dbiles y no parecen influir
de forma decisiva en la percepcin de la nasalidad.
En la Fig. 5.10 pueden observarse, esquematizados, todos los ndices acsticos a los que nos hemos estado refiriendo.

5OO:J

' 500
.000

3500
3000

'500
2000

1500
1000

500

-Figura 5.10.

a{l.'

FOT. 667
2. 0 For . 1333

.{",O
For',1 750
1 .' For 500?

Diferentes ndices acsticos (Tomado de Martinez

Celdrn: 1986, 211).


5.7.6. Las caractersticas acsticas mencionadas en los apartados anteriores sirvieron de base a Jakobson , Fant y Halle , para establecer ,
como en el caso de las vocales (vase apartado 5.4.3), distintas categoras fonolgicas de sonidos consonnticos. Los ndices acsticos sealados vienen a ser, pues, el correlato fsico de un conjunto establecido de
rasgos distintivos, en funcin de los cuales se definen las oposiciones
que mantienen entre s los fonemas de una lengua y que los hacen
capaces de diferenciar significados. As, hay consonantes que poseen
el rasgo voclico (todas las que tienen formantes claramente definidos)
y otras que no lo poseen (todas las obstruyentes o no sonantes). Tanto
unas como otras, sin embargo, se clasificarn como [+ consonnticas],
puesto que todas ellas tienen una energa global inferior a la que
caracteriza a las vocales.
Aparte de estos dos rasgos, voclico y consonntico, Jakobson, Fant

104

105

y Halle propusieron otros diez, con los cuales podra darse cuenta de
todas las oposiciones que distinguen a los diversos fonemas de las
distintas lenguas del mundo. Algunos de ellos son vlidos para las
vocales y las consonantes; otros slo se aplican al ltimo grupo. Los
enumeraremos rpidamente.

Sordo/sonoro . Las consonantes sonoras se caracterizan por la


superposicin de una fuente armnica a la fuente de ruido de las
sordas. Esta oposicin se utiliza con valor distintivo, aplicada a las
consonantes, en la prctica totalidad de las lenguas, mientras que las
vocales son, como sabemos, por lo general sonoras.
Denso/difuso. Ya explicamos en el apartado 5.4.3 que en los fonemas, tanto voclicos como consonnticos, caracterizados como densos,
la zona central del espectrograma predomina sobre las regiones no
centrales, al contrario de lo que ocurre en los sonidos difusos. En
castellano, por ejemplo, son densas las consonantes pala tales y velares,
en tanto que las labiales y dentales son difusas .
Gra ve/agudo. En los sonidos graves , la energa aparece distribuida en la zona baja del espectrograma; en los agudos, en la parte alta.
Para las vocales, el ndice ms caracterstico de este rasgo, como vimos , es la posicin del segundo formante en relacin con los otros
formantes . En cambio , para identificar el rasgo de gravedad de una
consonante es conveniente observar el segundo Carmante de la vocal
adyacente (si la hubiera): en el caso de las consonantes graves, dicho
formante suele descender y en las agudas, sin embargo, ascender. En
espaol son graves las consonantes labiales y velares; agudas, las dentales y palatales.
Estridente/mate . Los sonidos estridentes responden a ondas sonoras de forma irregular y en el espectrograma estn representados por
reas de frecuencias distribuidas desordenadamente. Los mates, por el
contrario, poseen ondas ms regulares y sus zonas de frecuencia forman estras verticales u horizontales. Las oclusivas suelen ser mates, y,
cuando son estridentes , son, en realidad , africadas. Las fricativas en
cambio , pueden ser tanto estridentes como mates, si bien la fricativa
ptima es estridente . La estridencia se origina por la mayor complejidad del obstculo opuesto a la salida del aire .
Inte rrupto/continuo. En las consonantes interruptas , el espectrograma presenta un periodo de completo silencio seguido o no de una
barra de explosin . Son interruptas , pues , las oclusivas, las africadas y
las vibrantes . En los fonemas continuos, sin embargo , no se produce
ningn blanco en el sonograma, puesto que el flujo de aire no deja de
salir al exterior en ningn momento. Las fricativas y las laterales sern,
pues, continuas.
106

Tenso/flojo . Los correlatos acsticos de este rasgo distintivo no


estn todava muy bien estudiados . Ya mencionamos el problema de la
tensin articulatoria de los sonidos en anteriores apartados (vanse
apartados 5.3.4 y 5.6.2). Acsticamente se hace difcil comprobar en el
sonograma la diferencia entre los sonidos supuestamente tensos y los
supuestamente flojos o relajados. En Preliminaries to Speech Analysis
(apartado 2.4 .3), se dice que las realizaciones de los fonemas tensos
manifiestan un intervalo de sonido ms largo y una energa mayor que
las de los fonemas relajados . Es decir, los tensos seran sonidos ms
largos y ms intensos que los flojos. Ambas caractersticas pueden
medIrse en el espectrograma, pero no siempre se obtienen resultados
acordes con los esperados.
Recursivo/infraglotal. Son fonemas recursivos los que no utilizan
en su realizacin la corriente de aire procedente de los pulmones, esto
es, las consonantes ingresivas y las eyectivas. Por el contrario, los
fonemas infraglotales se articulan siempre empleando el flujo de aire
proviniente de las cavidades infraglticas . Los primeros presentan dos
explosiones en el espectrograma, que se corresponden con las dos
aberturas que se suceden en su articulacin: la de la cavidad oral y la
de la glotis o -en el caso de los clics- el velo del paladar.
Bemolizado/normal. Segn ya explicamos en el apartado 5.4.3, a
propsito de la aplicacin de este rasgo a las vocales, un sonido es
bemolizado cuando se produce un descenso de su tono mediante la
disminucin de sus frecuencias ms elevadas . La labializacin de una
vocal o una consonante origina siempre este efecto, que tambin puede
conseguirse velarizando el sonido, es decir, reduciendo el orificio posterior de la cavidad oral y agrandndola. En el caso concreto de las
consonantes labializadas o velarizadas, la bajada del tono se refleja en
el descenso de la frecuencia de varios o todos los formantes de la vocal
contigua.
Sostenido/normal. Las realizaciones de un fonema sostenido presentan un aumento de la frecuencia con respecto a las realizaciones de

fonemas no sostenidos. Al palatalizar cualquier consonante logramos


crear este efecto : los forman tes superiores de la vocal adyacente experimentan una elevacin que se traduce en un agudizamiento del tiembre oSi la consonante era grave, al palatalizarla se har menos grave; si
e ra aguda, se har ms aguda .
Nasal/oral. El rasgo de nasalidad se manifiesta acsticamente, como ya dijimos. con una reduccin en la intensidad del FI , en el caso de
las vocales, y con la aparicin de formantes nasales a frecuencias determinadas, en el de las consonantes. Los fonemas orales no presentan,

claro est, ninguna de estas caractersticas.

107

(~t
Los alfabetos
fonticos
6.1.

La transcripcin fontica

6.1.1. Transcribir significa, segn el Diccionario de la Real Academia


Espaola de la Lengua, representar elementos fonticos, fonolgicos,
lxicos o morfolgicos de una lengua o dialecto mediante un sistema de
escritura (edicin de 1984, pg. 1330,3. acepcin). As pues, la transo
cripcin fontica, en particular, es la representacin escrita de los
sonidos que pronunciamos, concebida de forma tal que puedan quedar
bien reflejados en ella todos los matices que diferencian a estos sonidos
entre s.
La transcripcin fontica puede ser ms o menos detallada y , por
ello, los fonetistas hablan de transcripciones estrechas frente a transcripciones anchas o amplias. En las primeras, se intenta recoger la
mayor cantidad posible de informacin fontica mediante el empleo de
nuevos smbolos o de signos diacrticos especiales. En las segundas,
sin embargo, slo se anotan los rasgos fnicos que contribuyen a distinguir los elementos significativos de la lengua, es decir , los que tienen
valor diferenciativo (en este sentido, la transcripcin fontica amplia es
bastante similar a la fonolgica: vase la Presentacin de esta obra) .
La eleccin de uno u otro tipo de transcripcin depender en gran
medida de para qu o para quin se est transcribiendo . En un curso
de fontica, por ejemplo, no parece recomendable optar siempre por
la variedad ancha , porque esto impedira al alumno familiarizarse con
los smbolos y los hbitos articulatorios que ellos representan. Para
109

informar. en cambio. sobre la estructura general de un idioma , bastar

con sealar las peculiaridades ms sobresalientes en una transcripcin


amplia (vase Martinet: 1971, 161-166). Es importante tener presente ,
con todo, que, por muy estrecha y detallada que sea una transcripcin,
nunca representar exhaustivamente la realidad, sino que ser tan slo
una aproximacin imperfecta al complejo conjunto de movimientos articulatorios y fenmenos acsticos que constituyen el habla.

Vocales
51mboJo

Localizacin

Grado de
constriccin

Accin de
los labios

Anterior
Anterior
Anterior
Anterior
Central
Velar
Posterior
Posterior
Posterior
Posterior

Cerrada
Abierta
Media
Abierta
Abierta
Abierta
Media
Abierta
Cerrada
Abierta

No redondeada
No redondeada
No redondeada
No redondeada
No redondeada
No redondeada
Redondeada
Redondeada
Redondeada
Redondeada

e
~

6.2.

6.2.1 . Muchas de las personas que se inician en el estudio de los


sonidos del lenguaje tienden a considerar la transcripcin como la meta
de su esfuerzo, suponiendo que aprender fontica es, en realidad,
aprender a transcribir. Sin embargo, la transcripcin no es ms que un
instrumento del que se sirve el fonetista para efectuar su trabajo , es
decir , para describir y estudiar la capacidad fnica del ser humano . En
consecuencia, al ser la transcripcin un mtodo prctico , establecido
por convencin y de uso generalizado con diversos propsitos, ha de
estar basada en un conjunto de smbolos conocidos por lodos los especialistas. Estos smbolos conforman lo que se conoce con el nombre de
alfabeto fontico.

Con la ayuda que supone el empleo de un alfabeto fontico comparlido, se facilita la enseanza y el aprendizaje de idiomas extranjeros, la
investigacin lingstica en muchas de sus facetas - historia de la lengua, dialectologa, etc .- e, incluso, la aplicacin de los logros en esta
materia a otras reas de conocimiento, como la informtica o la medicina (vase Captulo 9).
A lo largo de la historia se han propuesto varios alfabetos fonticos
diferentes. En los apartados siguientes nos ocuparemos de aqullos de
empleo ms extendido.
6.2.2. Durante muchos aos, en todos los pases de habla espaola se
ha venido utilizando el llamado Alfabeto de la Revista de Filologa
Espaola (RFE)>>. Este alfabeto fue, en efecto, propuesto por la RFE en
1915, basndose fundamentalmente en el alfabeto empleado de forma
general por los fillogos romanistas europeos. Con este alfabeto se han
escrito, por tanto, obras tan clsicas dentro de la tradicin lingstica
hispana como el Manual de Pronunciacin Espaola, de Toms Navarro
Toms (1918), o los Elementos de Fontica General, de Samuel Gili
Gaya (1961).
En la Fig. 6.1 lo reproducimos ntegramente y presentamos algunos
ejemplos de cada realizacin.
110

Los alfabetos fonticos

o
~
u
~

Consonantes
51mboJo
b
!i

p
m
f
Ijl

O
~

Q
l
d

a
t
l

s
z

l
n
r
r

e
y

?
U
j
9
ge
k
x
Q

Accin de las
cuerdas
vocales

Localizacin

Modo de
articulacin

Ejemplo

Sonoro
Sonoro
Sordo
Sonoro
Sordo
Sonoro
Sordo
Sonoro
Sonoro
Sonoro
Sonoro
Sonoro
Sordo
Sonoro
Sordo
Sonoro
Sordo
Sonoro
Sonoro
Sonoro
Sonoro
Sonoro
Sordo
Sordo
Sonoro
Sonoro
Sonoro
Sonoro
Sonoro
Sordo
Sordo
Sonoro

Bilabial
Bilabial
Bilabial
Bilabial
Labiodental
Labiodental
Interdental
lnterdental
lnterdental
lnterdental
Dental
Dental
Dental
Dental
Dental
Dental
Alveolar
Alveolar
Alveolar
Alveolar
Alveolar
Alveolar
Palatal
Palatal
Palatal
Palatal
Palatal
Velar
Velar
Velar
Velar
Velar

Oclusivo
Fricativo
Oclusivo
Nasal
Fricativo
Nasal
Fricativo
Fricativo
Nasal
Lateral
Oclusivo
Fricativo
Oclusivo
Lateral
Fricativo
Nasal
Fricativo
Fricativo
Lateral
Nasal
Vibrante simple
Vibrante mltiple
Africado
Fricativo
Africado
Nasal
Lateral
Oclusivo
Fricativo
Oclusivo
Fricativo
Nasal

[bta]
[kDo]
[pta]
[mam]
[fwrOa]
[glfora]
[kOo]

Figura 6.1.

[~e]

(QOe]
[lOo]
[ds]
[Ma]
[tCIo]
[jto]
[~ta]

[.riila]
[il]
[zma]
[lO]
[n!ie]
[ro]
[rsa]
[kco]
[ya]
[kn?uxe]
[espua]
[kwjo]
[gto]
[Igeo]
[kpa]
[xo]
[uxel)

Alfabeto Fontico de la RFE.

111

La Asociacin Fontica Internacional (AFI), fundada en 1886 por


un grupo de renombrados fonetistas (Sweet, Passy, Jespersen, etc.),
propuso, en 1889, un alfabeto que , a partir de entonces, se conoce con
el nombre de Alfabeto Fontico lnternacional . Los principios que guiaron su elaboracin se recogen en el ya clsico librito Principles of the
lnternational Phonetic Association, publicado por la propia AFI en 1949.
Como es lgico, este sistema de escritura fontica ha sufrido, con el
COrrer de los aos, gran cantidad de modificaciones basadas en las
observaciones realizadas por los especialistas de todo el mundo, tendentes a perfeccionarlo y hacerlo vlido para la transcripcin de cualquier lengua (v. al respecto, Albright: 1958).
Los smbolos utilizados son, en su mayor parte , grafas latinas , si
bien ocasionalmente se emplean letras griegas, en particular cuando se
pretende diferenciar dos sonidos muy prximos acsticamente y emparentados entre s. En otros casos, se reCurre al uso de signos diacrticos
para evitar introducir nuevos smbolos o para representar los matices
fnicos ms sutiles.
En la actualidad, el Alfabeto Fon tico Internacional se generaliza
paulatinamente entre toda la comunidad cientfica, de modo que son ya
pocos los investigadores que , aun siendo hispanohablantes, siguen utilizando el Alfabeto de la RFE en sus trabajos. El fenmeno se comprende fcilmente si pensamos que este ltimo alfabeto resulta muy valioso
para transcribir propiedades especficas del espaol -en todos sus
dialectos- o incluso de algunas lenguas con l vinculadas, pero se
demuestra poco menos que inservible si pretendemos llevar a cabo un
estudio comparativo con otros idiomas ms diferenciados desde el
punto de vista fontico. En las Figs. 6.2 y 6.3, reproducimos los smbo6.2.3.

Vocales

no

Vocales

redondeadas

redondeadas

NO SONANTES
Oclusi ya.

Velar

Uvular

<t

Den/al

Sordas

Sonoras

Fricath"

Denloinlerdental

Labiodental

Bilabial

Sordas
Sonoras

<t>

A/veolar

Alveolar

fleja

,
,

9
6

retro-

~'"
'"
"'I:J

Velar

...z

'o"
Z

Bilabial

N .....e .

Labiodental

Alveolar

'"

'"

'"

<
l

Alveolar Palatoalveolar

pI

"

d,

bv

d,

SONANTES

Laterales
1 Alveolar aproximante
Alveolar frical. sorda
Alveolar fricat . sonora
l Alveolar retrofleja
Pala tal aproximante

>

Palatal

Z
O

,-

,J

Labial

z..

Afric.daa
Sordas
Sonoras

Farlngea Glotal

Glolal

Pa/alo- Alveoloalveolar palatal

;j
o

Den/al
retroflejd

BilabIal

r-

ou

Bilabial
Alveolar
Velar

Alveolar
retrofleja

Aproxhnantea centrales
" Labiodental
Post-alveolar
{ Alveolar retrofleja
j Palatal
Ul Velar
Q Labia l-palatal
w Labial-velar

Cllca
0 Bilabial cel)tral
1 Dental o alveolar central
Postalveolar, retrofleja o palatal
Alveolar o postalveolar lateral

e,

Pala/al

Velar

Uvular

"

Vibr.nte.
Alveolar mltiple
r Alveolar fricativa
Alveolar simple
( Alveolar simp retrof.
R Uvular simp y mlt

p' Bilabial
t' Alveolar
k' Velar

"'

o
Signos cUacriticoa

v-:

V + , Realizacin adelantada,
Vl.: Realizacin ms cerrada.
V: Realizacin centralizada.
y: Realizacin ensordecida.
V: Elemento dbil en un diptongo.

rig.6.2.

112

V:

V::

Vocal larga.

V':

Vocal semilarga,

y:

<>
C'

Realizacin
Realizacin
Realizacin
Realizacin

SIGNOS DIACRTICOS

retrotrada .
ms abierta
munnurada.
arenasal o nasalizada.

Alfabeto Fonetico Internacional (Vocales).

C ... :
C-'

c;,:

y.

C: :

C' :

Articulacin simultnea
Consonante palatalizada
Realizacin adelantada
Realizacin retrotrada
Realizacin dental
Realizacin silbica
Consonante larga
Consonante semilarga

C:

Consonante murmurada
Consonante con oclusin larngea
Ch: Consonante aspirada
y. Consonante ensordecida
y Fricativa muy abierta (aproximante)
Consonante velarizada o faringalizada
Cw : Consonante labializada

C':

...
<;:.

Consonante sonorizada

Figura 6.3. Alfabeto Fontico InternaCIonal (Consonantes).

113

los que el Alfabeto Internacional ofrece para representar las vocales y


las consonantes.

6.3.

Ejemplos de transcripcin

6.3.1. En la Fig. 6.4 hemos transcrito, con el Alfabeto de la Asociacin


Fontica Internacional y en transcripcin estrecha un fragmento de
Crnica de una muerte anunciada, de Gabriel Garca Mrquez (Brugera, 1981). En todo momento se ha intentado representar el tipo de
lectura que efectuara una persona culta, castellana de procedencia.
El da en que lo iban a matar, Santiago Nasar se levant a las 5.30 de la
maana para esperar el buque en que llegaba el obispo. Haba soado
que atravesaba un bosque de higuerones donde caa una llovizna tierna,
y por un instante fue feliz en el sueo, pero al despertar se sinti por

completo salpicado de cagada de pjaros (pg. 9).

mediante el smbolo ('-') suscrito . Este mismo s igno nos sirve para
sealar los grupos de vocales que han de pronunciarse en una sola
slaba.
Presentamos a continuacin la transcripcin del mismo texto en el
Alfabeto de la Revista de Filologa Espaola. En ella, la barra triple (j / j)
seala una pausa no inferior al segundo, dos barras (j j) representan
una pausa de unas cincuenta centsimas de segundo, y una sola barra ,
una pausa inferior a las veinticinco centsimas de segundo (v. Navarro
Toms : 1971,276).
6.3.2.

El da en que lo iban a matar, Santiago Nasar se levant a las 5.30 de la


maana para esperar el buque en que llegaba el obispo. Haba soado
que atravesaba un bosque de higuerones donde caa una llovizna tierna,
y por un instante fue feliz en el sueo, pero al despertar se sinti por

completo salpicado de cagada de pjaros (pg. 9).

despel'tal se sin'tjo pOl kom'pleto salpj'kapo pe ka 'yaoa pe 'paxarosl .]

[el da elJ..ke lo iDan a matlll sa~tjg:o nasl se lea~t6 ajas 9iUko trj~ta
de la mIJ~na TI para esperl el ke elJ..-ke !eg:a eLoispo!ll aia
sOIJc!o k~atraesa llII\P6ske dejg:er6ne~ 30~de kaia una !oi~na
tjrnall i por~unJn~tJte fw feliO e'V'l swIJo.l1 pero a).J:lespertl se
si~tj6 por komplto salpikaclo de kag:Ma de pxarosLIIIl

F1!J1ll'a 6.4.

FI!J1ll'a 6.5.

[e,l:.dla eQ.ke lo 'ipan &..;na'talj, san'tjayo na 'sal se lef3an'to vas '9il)ko

'tlejAta

~e la mapana T pali.espe'r;' el '~uke eqj<e l.e'y~~ eLo'~ispoL.

a'pla sO'J1a~o

ke. . atlat3e'sapa

'tlIl\Jboske ~e....jye'rones 30nde ka'ia 'una

1.0'~i9n? 'tjemal, i po'run n~'taAte 'fwe fe'liO en~et-sweJlO.l, pe1vl

Las flechas aadidas al final de determinadas porciones del texto


- las cuales, segn veremos, se d enominan unidades meldicas- representan las variaciones tonales que tales unidades experimentan en
su parte ltima, en su terminacin . Aunque lo explicaremos con mayor
detenimiento en el Captulo 8, adelantamos ahora que una flecha ascendente supone una elevacin en el tono y una descendente , un descenso .
Los smbolos T y .1 transcriben contrastes tonales menos marcados; son
valores intermedios.
Un apstrofo antepuesto a una slaba indica que sta es acentuada.
Son palabras habitualmente inacentuadas en espaol los pronombres
relativos, los adjetivos posesivos , el artculo determinado, las conjunciones y las preposiciones . Por ello, ninguna de esas partes de la
oracin aparece en el texto precedida por al apstrofo a que nos
referimos.

Por ltimo , los grupos de slabas que se pronuncian como si formaran una sola palabra, aunque de hecho no sea as, aparecen unidos
114

1I5

La combinacin
de los sonidos

7.1.

La slaba

7.1.1. En repetidas ocasiones, a lo largo de este libro , hemos afirmado


que los sonidos del lenguaje se presentan unidos en la cadena hablada,
de forma que a menudo resulta dificil precisar, desde el punto de vista
articulatorio o acstico, dnde acaba un sonido y comienza otro . La
segmentacin es, por tanto, una tarea complicada que no siempre ofrece garantas de fiabilidad (vase Capitulo 5, apartado 5.1 l. No obstante,
es un hecho comprobado en todas las lenguas del mundo que los
sonidos tienden a agruparse, dentro de la cadena, en unidades mayores, dotadas de una entidad propia y ms fcilmente aislables que los
propios segmentos: son las silabas.
7.1.2. La definicin y la naturaleza de la slaba han sido, y son an hoy,
aspectos muy debatidos de la investigacin fontica, hasta el punto de
que es problemtico encontrar puntos de vista coincidentes al respecto .
Paradjicamente, la existencia de la slaba, avalada por un considerable nmero de pruebas, parece fuera de toda duda en la actualidad.
Entre los argumentos aducidos en su favor destacamos el que hace
referencia a la capacidad demostrada por individuos sin conocimientos
linglsticos para silabear las palabras, o aquel otro que resalta el hecho
de que los hablantes afectados por afasia motriz subcortical realizan
tantos movimientos espiratorios como slabas contiene el mensaje que
117

intentan expresar, pero podran mencionarse muchos ms indicios de


su realidad fontica (Hla: 1973, 4).
El problema surge cuando se pretende definir la slaba, lo que
presupone el conocimiento previo de su autntica naturaleza . Han existido, desde la antigedad clsica hasta nuestro das, muchos y variados
intentos de definicin, que se han elaborado desde todos los enfoques
posibles - fisiolgico , articulado, auditivo o acstico-- sin que ninguno
de ellos haya alcanzado el respaldo unnime de los fonetistas . En los
prximos apartados haremos un breve repaso de los ms importantes.
7,1.3. La concepcin de la slaba como una unidad espiratoria, defendida por muchos autores (Henry Sweet entre otros) y segn la cual cada
slaba est formada por una sola espiracin, fue puesta en tela de juicio
al comprobarse que en un nico movimiento espiratorio pueden pronunciarse varias slabas, dependiendo su nmero, en ltima instancia,
de la capacidad pulmonar del hablante , entre otros factores. As pues ,
no puede hablarse de slaba espiratoria, si bien es cierto que en una
misma espiracin se producen pequeos impulsos coincidentes con
cada una de las slabas pronunciadas y particularmente intensos en el
caso de las acentuadas.
Tampoco la teo ra desarrollada por el psiclogo americano R. H.
Stetson, en su obra Motor Phonetics, de 1925, se ha visto confirmada por
investigaciones posteriores. Stetson conceba la slaba como el resultado del impulso originado por el movimiento peridico de los msculos
proyectores intercostales, de modo que podra definirse como cada
soplo de aire proveniente de la caja torcica . Aunque este planteamiento supuso un avance con respecto a las anteriores explicaciones de
carcter fisiolgico, estudios ms recientes han demostrado que no
existe una relacin constante y simple entre la actividad muscular y la
descomposicin silbica de la cadena hablada. Ninguna teora fisiolgica de las que se han formulado hasta el momento se ha visto, en
realidad , definitivamente ratificada por medios instrumentales, por lo
que no parece que la clave para comprender la naturaleza de la slaba
deba buscarse tan slo en estos trminos.
7.1.4. En su Curso de Lingstica General, Ferdinand de Saussure
defini la slaba desde el punto de vista articulatorio, basndose en una
previa difere nciacin de los sonidos en explosivos o implosivos, esto
es, abrientes o cerrantes, en funcin de su posicin en la cadena hablada (Saussure: 1971 , 109). En principio , cualquier sonido puede ocupar
un lugar en el que los movimientos articulatorios requeridos para su
emisin sean de cierre o de abertura, pero es evidente que cuanto
mayor sea el grado de abertura propio del sonido en cuestin, ms
lIS

difcil ser diferenciar en l dos variantes. La [a], por tanto, no presenta


implosin ni explosin porque su mxima abertura caracterstica hace
inapreciable cualquier matiz de este tipo. Sin embargo, s podemos
hablar de una [p] implosiva en apto y de una [p] explOSiva en pata .
Pues bien, toda slaba estar constituida, segn Saussure, por la
suma de las dos fases, la fase de explosin, en primer lugar, y, en
segundo, la de implosin. Ello implica que la secuencia de un sonido
implosivo y otro explosivo (como la [p] y la [t] de apto, respectivamente) conlleva la existencia de limite silbico entre ellos. De Igual
modo, el llamado ncleo silbico, es decir, el centro SilbiCO, se correspondera siempre con el sonido con el que comienza la fase de cierre o
implosiva: las [e] de en, pe o pez, por ejemplo.
.
Este anlisis no siempre concuerda con los datos que proporcIOnan
las diferentes lenguas . Las slabas inglesas skel y pants, por ejemplo,
no presentan la secuencia de aberturas crecientes, la primera, o decrecientes, la segunda, que deberan constituir sus fases de .explosln e
implosin, respectivamente , de acuerdo con la argumentacin de Saussure. M. Grarnrnont (1965) introdujo en ella vanas modifICaCIOnes, . la
ms importante de las cuales fue el cambio de la abertura por la tensIn
muscular como parmetros en torno a los que se estructura la slaba,
pero las objeciones presentadas a la nueva formulacin fueron tambin
numerosas. Ciertamente, es difcil medir con exactitud y dar expresin
numrica a la tensin de los diferentes sonidos (vase apartado 5.3.4),
y, por tanto, el planteamiento de Grammont no resuelve la cuestin.
7.1.5. O. }espersen propuso una teora de la slaba basada en el gra~o
de sonoridad posedo por los distintos sonidos de la lengua. Segun
este fonetista, el nivel ms alto de esta propiedad lo poseeran las
vocales abiertas seguidas en la escala por las vocales cerradas, las
consonantes liquidas y nasales, las consonantes fricativas sonoras, las
oclusivas sonoras, las fricativas sordas y, en el ltimo lugar, las OclUSIvas sordas. En cualquier sucesin de sonidos, el oyente siente que hay
tantas slabas como aumentos apreciables de sonoridad, en relacin
con los sonidos adyacentes menos sonoros. El sonido comparativamente ms sonoro es el "centro" silbico y se le considera, por consIguiente, "silbico", en oposicin a los sonidos, que le rodean, "no
silbicos" Uespersen: 1954, 452-453) . La ]erarqUla de los somdos en la
slaba segn su grado de sonoridad determina, pues, su ordenamiento
en torno al <<ncleo, de forma que antes de l se produzca un aumento
gradual de dicha sonoridad y, despus de l. un descenso hasta los
valores mnimos. Un buen ejemplo de ello seran las slabas de las
palabras espaolas [kor-'Oon] o ['pa-da], en las que la cima silbica
est ocupada por las vocales [o] y [a] , respectivamente .
119

Se ha sealado repetidas veces (v., por ejemplo, Hla: 1973, !O;


BlOsnahan y Malmberg: 1970, 142) que el trmino de sonoridad, empleado en este contexto, resulta un tanto impreciso y confuso, por
cuanto admlte dos mterpretaclOnes diferentes. Puede referise como
cabra deducir a partir de la mencin al oyente, al nivel de perc~ptibili
dad o audIbllIdad (capacidad de ser odo o percibido a cierta distancia)
que presentan los dlversos elementos fnicos , y puede entenderse en
el senhdo en que lo hemos venido haciendo hasta ahora, es decir, como
presencIa/ausencia de voz laringea y su resonancia complementaria en
el tracto vocal. Tanto si damos preferencia a esta ltima interpretacin
sobre la que parece estar realmente basada la escala de ]espersen
(plnsese que el sonido [s], caracterizado por su gran perceptibilidad,
ocupa en ella el penltimo lugar, junto con las restantes fricativas sordas), como si optamos por la primera (Ladefoged: 1975, 219-221), encontraremos un buen nmero de contraejemplos entre las distintas
estructuras silbicas de las diversas lenguas.
En efecto, slabas como spa del ingls, scha del alemn, o rty del
checo, entre otras muchas mencionables de diferentes idiomas, no presentan en su mtenor el ordenamiento de sonidos que la teora de
]espersen hacia prever. A este respecto, Hla escribe: No esperemos
encontrar, sm mnguna excepcin y con una precisin perfecta, en
todos los casos, una sucesin regular de los fonemas, segn los principlOS enunclados ( ... ). Exigir con rigor una sucesin absolutamente regular es condenarse a complicar demasiado el problema de la slaba
(Hla:.1973, 32-33). As pues, tampoco el criterio de la perceptibilidad o
sonondad nos abre el camino definitivo hacia la comprensin de la
slaba. Como sealan Brosnahan y Malmberg (1970, 142), la teora descnbe blen un cierto modelo de slaba ideah>, quiz aqul al que
henden todas las lenguas, pero que es inevitablemente cuestionado por
los hechos fonticos reales .
7.1.6: Si bien es cierto que el anlisis espectrogrfico, especialmente a
parhr de los trabajos de Bertil Malmberg en sntesis del lenguaje, ha
proporclOnado algunos datos valiosos para el entendimiento del problema de la slaba, no puede afirmarse que los estudios realizados
hasta el momento en este campo lo hayan resuelto. Afirma Malmberg
(1955) que las transiciones de una vocal (vase el Captulo 5, apartado
5. 7) vl~nen determinadas siempre por la consonante con la que constituye sllaba. En otras palabras, si una vocal es adyacente a una consonante pero entre. ellas no existen transiciones, se interpretarn como
somdos perteneclentes a slabas distintas. As, si combinamos dos vocales con una consonante oclusiva, interpuesta entre ellas , por ejemplo,
en [aka], los oyentes perciblrn [a-ka] o [ak-a] dependiendo de cul de

120

las dos vocales presente las transiciones . La slaba sera, entonces, una

unidad acstica determinada por el grado de fusin y de influencia que


ejercieran entre s vocales y consonantes.
Esta idea , que en los experimentos con sintetizadores se ve claramente confirmada, no siempre resulta evidente cuando se trata de
espectrogramas realizados sobre enunciados reales en los que las alteraciones de los formantes voclicos pueden variar en mayor medida.
Ciertamente, el trabajo de Malmberg supone el hallazgo, por vez primera, de un fundamento fsico para la nocin de slaba, pero sern
necesarios muchos ms estudios y comprobaciones experimentales para que esta primera aproximacin se vea definitivamente revalidada.
7.1.7. De todo lo expuesto en los apartados anteriores se desprende
que ninguna de las formulaciones concebidas por los diferentes fonetistas ha conseguido esclarecer la naturaleza de la slaba de forma irrefutable, segn adelantbamos al principio (vase apartado 7.1.2). Como
hemos visto, cada autor ha tomado en consideracin un aspecto determinado del fenmeno -sea ste la abertura, la perceptibilidad, la
tensin muscular o cualquier otro- sin valorar el papel desempeado
por los restantes, lo que conduce inevitablemente a explicaciones parciales y a simplificaciones inexactas en mayor o menor media. Por ello,
la definicin ms completa que puede darse de slaba es la resultante
de unificar toda la pluralidad de enfoques que se le han dado en una
nica formulacin de validez general. En palabras de G. de Granda,
[la definicin de slaba] debe abarcar la totalidad de los caracteres
que la constituyen como tal (aspecto psicolgico de la tendencia al
ritmo , fuerza motriz proporcionada por los msculos intercostales, tensin articulatoria, fuerza espiratoria, presin muscular, sonoridad, perceptibilidad y abertura voclica) , tanto en su aspecto articulatorio como
en el auditivo (De Granda: 1966, 40) . Diremos, entonces, con ].
Chlumsky (1935), que la slaba es una articulacin o grupo de articulaciones de tensin fisiolgica creciente al principio y decreciente al
final, que responde a un solo impulso de energa muscular, y cuyo
centro, formado por uno o ms sonidos, posee mayor intensidad espiratoria, mayor abertura, mayor perceptibilidad y mayor tensin muscular
que el resto de los sonidos que la integran . As pues, la slaba es a la
vez una unidad de tipo articulatorio, acstico, auditivo y psicolgico.

En la slaba podemos diferenciar dos tipos de elementos: el


ncleo, cima o centro silbico, y los mrgenes anterior y posterior.
El ncleo, cuya presencia es imprescindible para que pueda hablarse de slaba, est integrado por uno O varios sonidos. En el primer caso
se denomina ncleo simple y, en el segundo, ncleo complejo o com7.1.8.

121

puesto. En la forma verbal bailo, por ejemplo, la primera slaba bai


tiene una cima compleja formada por el diptongo [aj] y la segunda, lo,
una simple constituida por la vocal [o]. En espaol, los ncleos compuestos estn constituidos por diptongos o triptongos, en los cuales,
,"amo sabemos (vase apartado 5.5), una de las vocales es realmente
silbica y la otra u otras son semiconsonantes o semivocales. No obstante, a veces pueden unirse en una sola slaba dos o ms vocales contiguas pertenecientes a palabras distintas, en el fenmeno conocido como sinalefa, yeso permite que el nmero de vocales que constituyen el
ncleo se vea aumentado. Tenemos un ejemplo en la secuencia necio
ausente, en donde cuatro vocales se asocian en una nica slaba.
La pronunciacin del espaol, especialmente en el habla rpida y
poco esmerada, tiende a asociar en un grupo monoslabo cualquier
sucesin de vocales. Por ello, adems de producirse sinalefas como la
anterior, es frecuente que los hiatos se conviertan en diptongos, en un
claro ejemplo de sinresis, esto es, de reduccin silbica dentro de la
misma palabra. Es el caso de los vocablos bal o poeta que se pronuncian indistintamente con y sin hiato. Por esta razn , en ciertas ocasiones,
no resulta sencillo saber si dos o ms vocales han de considerarse
como pertenecientes o no a la misma silaba . La etimologa o la analoga
con otras palabras relacionadas pueden ayudar a decidir, en estos
casos, entre la interpretacin de una secuencia de vocales como diptongo o como hiato. Etimolgicamente, es preferible, por ejemplo,
hablar de hiato en palabras como veintiocho o piano; la analoga con
otros trminos as lo aconseja tambin en diario (vase da) o riada
(vase rlo) .
Por lo que se refiere a los mrgenes, el margen silbico anterior,
tambin denominado ataque, puede ser simple o compuesto, o puede
no existir. En la slaba ma, es simple - la consonante [m]- ; en pro, es
compuesto - las consonantes [p] y [r]- ; en el, no existe. Lo mismo
sucede con respecto al margen posterior o coda silbica: en in, es
simple; en ins, es compuesto, y en ta, no existe . Una slaba con los
dos mrgenes simples es, por ejemplo , mar; una slaba con los dos
mrgenes compuestos es trans, y finalmente , una silaba sin mrgenes es a.
Las slabas que no presentan coda , se conocen como slabas abiertas o libres . Las tres silabas de cabeza son, por tanto, abiertas. En
cambio, las slabas que s poseen el margen posterior se denominan
cerradas o trabadas . Las dos slabas de saltar son, as, cerradas . Cuando dos sonidos pertenecen a la misma slaba se dice que son tautosilbicos; cuando forman parte de dos slabas diferentes, se les llama
heterosilbicos. En la palabra pato , la [p] y la [a] son tautosilbicos; la
[a] y la [t], heterosilbicos.

122

La fijacin de los limites silbicos, es decir, de los puntos exactos en que han de situarse las fronteras entre las distintas slabas,
presenta algunos problemas. En lo que respecta al espaol -cada
idioma se comporta en este punto de modo diferente- , podemos sealar una serie de reglas bsicas, que ya enumer Navarro Toms (1971,
172-173) Y que siguen vigentes en la actualidad:

7.1.9.

a)

Una consonante entre dos vocales siempre forma slaba con la


vocal que le sigue: a-m o; sa-Ia .
b) Los grupos pr, br, tr, dr, cr, gr, pi, bI, el, gl, IJ Y fr forman slaba
con la vocal que les sigue. No hay frontera, por tanto, entre la
consonante oclusiva o fricativa y la lquida: IJar, ca-bra, a-clamar, etc.

e)

d)

En cualquier otra combinacin de dos consonantes, la primera


forma slaba con la vocal anterior y la segunda con la vocal
siguiente . Si hay tres, las dos primeras forman coda y la tercera
ataque silbico, excepto si las dos ltimas constituyen uno de
los grupos mencionados en b), en cuyo caso se unen a la vocal
siguiente: al-ma, as-no, cons-pi-rar, pers-pi-caz, com-ple-to ...
Dos o ms vocales contiguas pueden o no formar slaba segn
que exista diptongo o hiato , sinalefa o sinresis, como explicamos anteriormente .

Cabe aadir algunas observaciones complementarias que constituyen , hasta cierto punto, excepciones a las normas generales.
En primer lugar , hay que apuntar la tendencia de los hablantes
cultos, especialmente en la pronunciacin enftica, a marcar y separar ,
por influencia de la etimologa, los prefijos que conservan su significado original: sub-ra -yar, des-ar- /-cu-Iar, in-o-pe-ran-te, etc., lo que, en
efecto, va en contra de alguna de las reglas anteriormente apuntadas y
e n contra del llamado principio de delimitacin silbica , formulado por
Salvador Fernndez Ramrez (1986,49), segn el cual toda slaba trabada supone comienzo consonntico de la silaba siguiente, siendo la
enunciacin recproca falsa . De este principio se deduce que toda
slaba que comience con vocal implica una silaba anterior abierta . No
es menos cierto, sin embargo , que en la pronunciacin ms relajada , se
prescinde de consideraciones etimolgicas y se respetan las normas
e stablecidas.
En segundo lugar, cuando dos consonante s contiguas son iguales,
no se aplica la regla e) , sino que se pronuncian como si se tratara de
una nica consonante , un poco ms larga de lo normal, sin que a
menudo sea posible distinguir entre ellas una frontera silbica: lassemanas; diez-zapatos , etc.
En tercer y ltimo lugar, si dos vocales contiguas son iguales y no
123

van acentuadas, se reducen tambin a una sola vocal, que en algunos


casos se alarga un poco. El fenmeno, que se produce igualmente si al
menos una de ellas lleva acento, es habitual en el habla relajada y
conversacional. En una pronunciacin esmerada y lenta, en cambio, las
dos vocales pueden llegar a sonar en dos slabas distintas, como sucede, por ejemplo, en las palabras cre-encia, acre-edores, o aza-har.
En el castellano actual, el tipo de slaba que predomina es la
formada por consonante ms vocal (CV), es decir, una sflaba libre con
ataque pero sin coda. Le siguen en frecuencia de aparicin las agrupaciones CVC, CCV y V. Pueden encontrarse fcilmente en la bibliograffa
diversos recuentos estadsticos sobre esta cuestin (v. Navarro Toms:
1966; Delattre y Olsen: 1969; Guirao y Borzone: 1972; Monroy Casas:
1980, entre otros), por lo que no le dedicaremos aqu ms espacio. Es
interesante, sin embargo, sealar que la estructura CV parece ser la
ms corriente en gran nmero de lenguas, adems de ser la primera
que aparece en el habla de los nios y la ltima que desaparece en los
procesos de prdida de la capacidad lingstica. La sflaba abierta viene
7,1,10.

a ser, entonces, un tipo primitivo de slaba, presente, en mayor o

menor proporcin, en todos los idiomas.


El hecho concreto de que en espaol el grupo CV aventaje tanto a
las otras posibles combinaciones, a diferencia de lo que ocurre en otras
lenguas, explica algunos fenmenos fonticos a los que hemos aludido
o aludiremos en prximos apartados. La aparicin del elemento esvarabtico (vase Captulo 5, apartado 5.7.5), por ejemplo, puede explicarse a partir de esta tendencia a la sflaba CV. Del mismo modo, la
prdida o e l debilitamiento de consonantes en coda silbica (setiembre
por septiembre), las confusiones o trueques que en esa situacin se
producen (arma por alma), la vocalizacin de ciertas consonantes a final
de slaba (preceuto por precepto), la simplificacin de grupos consonnticos en coda (ispirar por inspirar), etc., todos son procesos que
resultan ms comprensibles si tenemos en cuenta la circunstancia de
que en espaol toda sflaba tiende, por principio, a realizarse como CV
(v. Malmberg: 1965).
Anotemos, finalmente, que en castellano predominan las palabras
bisflabas sobre las trisflabas y monoslabas. No obstante, la tendencia
se invierte cuando se trata de vocablos de nueva creacin o de prstamos de otras lenguas. En estos casos, se favorecen, como regla general, las voces de tres o cuatro silabas (v. Alcina y Blecua: 1975,266-267).

124

7.2.

Otras agrupaciones de sonidos en la cadena

Dentro de la cadena hablada podemos diferenciar unidades mayores que las slabas, porque stas no aparecen aisladas, sino reunidas
en conjuntos compuestos por un nmero variable de ellas. El primero
de estos grupos es el que se conoce tradicionalmente con el nombre de
palabra. El concepto, sobre el que se ha escrito y se ha discutido
mucho (en Gonzlez Calvo: 1982, puede encontrarse una exposicin de
las principales aproximaciones a la cuestin), no es especialmente relevante desde el punto de vista fontico, ya que en el habla no respetamos sus limites y, en el anlisis, slo resulta til como punto de referencia para establecer la distribucin de los diferentes segmentos fnicos.
Mucho ms interesante es la divisin inmediata superior de la cadena en grupos acentuales.
El grupo acentual (tambin llamado grupo de intensidad, aunque
esta denominacin no parece recomendable por las razones que explicaremos al hablar del acento en el prximo captulo) est constituido
por un conjunto de sflabas, de tres a cinco por regla general, subordinadas todas ellas a un mismo acento principal. Veamos un ejemplo. En
la secuencia Ernesto come mucha carne al da, podemos aislar varios
grupos acentuales: Ernsto / cme / mucha crne / al da. Los dos
primeros grupos abarcan una nica palabra; los otros, dos cada uno.
Las sflabas que reciben el acento principal se denominan tnicas, las
restantes se llaman tonas. A veces, algunas slabas tnicas se supeditan a otra que conlleva el acento dominante , por lo que puede hablarse
de acentos secundarios frente a acento principal. La frase Yo quiero
tenerlo se divide en dos grupos acentuales, Y quiro / tenrlo , el
primero de los cuales presenta un acento principal en quiro y otro
secundario en el pronombre y. De todos modos, el anlisis de las
secuencias habladas en grupos acentuales es ms complejo de lo que
puede parecer a la vista de estos ejemplos. Volveremos sobre la cuestin cuando tratemos el acento.
7.2.1.

Los fragmentos del discurso delimitados por dos pausas sucesivas se denominan grupos fnicos. El grupo fnico est dotado, pues, de
un contenido significativo propio que ha de relacionarse con el sentido
general de la secuencia a la que pertenece. Puede abarcar uno o varios
grupos acentuales, una o varias palabras, y de una a quince slabas
(aunque lo ms frecuente es que conste de siete u ocho). Las pausas
que lo condicionan pueden ser grandes -si coinciden con el final de
una frase, por ejemplo--, ms pequeas o mnimas e, incluso, pueden
no llegar a realizarse convirtindose as en pausas virtuales. En general, se deben a dos causas fundamentales : o bien la necesidad fisiolgi7.2.2.

125

ca de respirar que tiene el hablante, o bien razones de tipo lingstico,


como sealar el fin de un enunciado completo (pausa final absoluta),
separar los miembros de una enumeracin (pausa enumerativa), variar
el significado de la emisin (pausa significativa), etc. Canellada y Kuhlmann (1987) ofrecen el anlisis de una gran cantidad de grupos fnicos
extrados de textos literarios. Sealan , no obstante, la falta de acuerdo
que a menudo existe entre los estudiosos, o los hablantes en general,
para fijar los limites de los grupos fnicos de un texto cualquiera. En el
mismo sentido se manifiestan Alcina y Blecua (1975) cuando escriben:
"Para las diferentes divisiones confluyen causas de tipo muy diverso:
puede tratarse de elementos de tipo psicolgico o emocional; otros son
de carcter lgico; en algunas ocasiones, el hablante puede intentar
realzar determinados elementos de significacin dentro del mensaje,
lo que suele producir un aumento de unidades; en otros momentos,
depende del nfasis o del cuidado que se ponga en la diccin .. .
(pg. 456).
El grupo fnico posee una relevancia especial en fontica por dos
razones. En primer lugar, determina algunas modificaciones articulatorias y acsticas de los sonidos: cuando se habla de posicin inicial
absoluta o posicin final absoluta, el punto de referencia es el grupo
fnico. En segundo lugar, coincide - al menos en espaol- con la
unidad meldica , de la que hablaremos en el prximo captulo y que,
como veremos, es la unidad sobre la que se basa todo el estudio de la
entonacin.

7.3.

La coarticulacin y otros fenmenos


combinatorios

Cuando nos referimos al problema de la segmentacin en el


Captulo 5, sealbamos que llevarla a cabo entraaba una gran dificultad debido a la imposibilidad de establecer lmites articulatorios o
7.3.1.

acsticos claros entre los sonidos en la secuencia, Mientras pronunciamos la [p) de la palabra par, por ejemplo , nuestra cavidad oral ya est

disponindose para producir la vocal [a) siguiente. Las transiciones de


los formantes de dicha vocal , que, como tambin explicamos en el
Captulo 5, contribuyen decisivamente al reconocimiento de la consonante , son otras muestras ms de que los sonidos se superponen unos

a otros en el decurso hablado.


Pues bien , en fontica , este fenmeno se denomina coarticulacin.
El grado de coarticulacin que un sonido puede presentar al emitirse
en la cadena se mide articulndolo primeramente por separado de
modo que se aprecie bien cul es la configuracin del tracto vocal que
126

presenta y cul su manifestacin acstica, para despus comparar ambas observaciones con las que se obtienen si lo pronunciamos en el
contexto que nos interese. El hecho de que exista coarticulacin se
explica por la tendencia de los rganos articuladores a permanecer en
una posicin dada, una vez que han llegado a ella, durante un cierto
periodo de tiempo. Es, por as decirlo, una cuestin de inercia o de
acomodacin de unos sonidos a otros.
La nasalizacin voclica, por la influencia de una nasal adyacente, o
el abocinamiento de algunas consonantes, por la de una vocal redondeada vecina, son buenos ejemplos de coarticulacin. Estas dos modificaciones son, adems, muy habituales, en parte porque conllevan movimientos menos complejos y en mayor medida prolongables que los
de la lengua, y en parte porque guardan un alto grado de independencia con respecto a otras articulaciones, esto es, los msculos que
intervienen en la formacin de unas y otras difcilmente coinciden
(v. Kent, 1983).
7.3.2. Existen varios fenomenos combinatorios (algunos autores los
denominan fonosintcticos puesto que la fonosintaxis se ocupa de estudiar las modificaciones de los sonidos en la secuencia) relacionados
con el de la coarticulacin. El ms importante, sin duda, es la asimilacin.

En la asimilacin, un sonido modifica o altera alguna de sus caractersticas para identificarse con otro contiguo O prximo. Afecta tanto a
vocales como a consonantes y puede ser de varios tipos.
En primer lugar, cabe distinguir una asimilacin por contacto de
una a distancia.
En la asimilacin por contacto, los sonidos son adyacentes, no as en

la que se produce a distancia, que, en general, es menos frecuente. Por


ejemplo, cuando en castellano pr.onunciamos una [s) delante de una
[rr), como en el caso de la [s) final y la [rr) inicial de las palabras Ros
Rosas, la primera pierde todos sus rasgos peculiares para convertirse
en una [1) fricativa, segn seal Navarro Toms (197 1, 108). Hablamos
aqu de una asimilacin por contacto completa, pero tambin existen
- yen mayor nmero-- asimilaciones por contacto parciales: una [n)
alveolar situada delante de una [t) se dentaliza, esto es, cambia nicamente su zona de articulacin. Dentro del grupo de asimilaciones por
contacto parciales, como esta ltima citada, las hay regresivas. progresivas, reciprocas y dobles. Veamos en qu consiste cada una de ellas.
En la asimilacin por contacto, parcial, regresiva, un sonido adopta
alguna de las caractersticas articulatorias del sonido que le sigue. Es lo
que ocurra en el ejemplo anterior de la [n) dentalizada. En la asimilacin por contacto, parcial, progresiva , un~sonido adquiere alguno de
127

los rasgos del sonido que le precede: en castellano la dental [t] suele
hacerse interdental cuando sigue a una interdental [e]. La asimilacin
por contacto, parcial, reciproca supone que dos sonidos contiguos se
transfieran recprocamente alguna de sus propiedades: en el grupo
[p,d], la [n] se dentaliza por la influencia de la [d] y la [d] se mantiene
como oclusiva por la de la nasal. Finalmente, en la asimilacin por
contacto, parcial, doble, un sonido situado entre otros dos adopta caractersticas de ambos: la [e] nasalizada de mente, por ejemplo, toma su
nasalidad de la [m] y la [n] que la flanquean.
La asimilacin a distancia es, segn declamas, menos habitual. En
ciertas lenguas, como el turco, hngaro, mongol, fins y algunas africanas, la vocal de una de las slabas -normalmente la primera o la
acentuada- de una palabra determina total o parcialmente el timbre
de las otras vocales de esa misma palabra, en lo que se conoce con el
nombre de armonia voclica, metatonia o umlaut. El espaol no es una
lengua que sistemticamente presente armona voclica, pero se ha
sealado repetidas veces que el modo peculiar de formar el plural que
exhibe el andaluz oriental (v. Navarro Toms: 1939; Alonso, Zamora y
Canellada: 1950; Salvador: 1977, entre otros), esto es, aspirando la [s] ,
abriendo la ltima vocal y, con ella, todas las restantes de la palabra
en cuestin ([p::>/lE'r::>s::>h] para poderosos, por ejemplo) es una manifestacin de este tipo de asimilacin a distancia. Brosnahan y Malmberg
(1970, 134), por otra parte, citan como ejemplo de armonia consonntica , el nombre espaol Pepe, formado a partir de Josepe por asimilacin a distancia con la consonante final.
7.3.3. La disimilacin es el fenmeno contrario a la asimilacin. En este
caso, un sonido tiende a diferenciarse en lo posible de otro sonido
adyacente o prximo . Las vocales y las consonantes sonantes (nasales y
lquidas) son las que ms fcilmente se prestan a la disimilacin. En
espaol, este proceso se produce, sobre todo, en el habla vulgar o en
ciertas hablas dialectales. As, puede escucharse medecina por medicina, con disimilacin de la vocal [i]; almario por armario, con disimilacin de la primera [r], etc.
Finalmente , un tercer fenmeno de carcter fonosintctico es el que
se denomina mettesis. La mettesis entraa un cambio de orden de los
sonidos en la cadena hablada . Si ese cambio se da entre e lementos
contiguos , en lugar de mettesis suele hablarse de interversin. Tambin las consonantes sonantes, en particular las lquidas, son las que
con mayor frecuencia sufren los efectos de la mettesis o la interversin : cocreta en lugar de croqueta; Grabiel por Gabriel, etc.

128

~D
Los rasgos
prosdicos

8.1 .

El acento

En captulos anteriores hemos hablado acerca de cmo se producen los diversos sonidos del lenguaje , de sus atributos particulares
y del modo en que se combinan en la cadena hablada . Nos referiremos
ahora a la naturaleza fontica de algunas propiedades que caracterizan,
en dicha cadena, determinados fragmentos de extensin variable (slabas, morfemas, palabras, frases o prrafos). Tales propiedades se conocen con el nombre de rasgos prosdicos o suprasegmentales. Todos
ellos tienen en comn el hecho de que deben describirse siempre
poniendo en relacin varios elementos del enunciado estudiado, de
modo que lo que resulta interesante para el fonetista es el valor relativo, y no el absoluto, de los rasgos prosdicos en una parte concreta de
la emisin, con referencia a otras partes del mismo enunciado. Adems,
todos son irreductibles al anlisis en segmentos, como indica el mismo
trmino de suprasegmentales.
La primera propiedad prosdica que vamos a considerar es el
acento.

8.1 .1.

El acento tiene como objeto poner de relieve una slaba, formada por uno o ms sonidos, con respecto a las restantes slabas de una
palabra o de un grupo acentual (vase apartado 7.2. 1). Este propsito
puede conseguirse utilizando tres diferentes recursos fontico, que
8.1.2.

129

constituyen, por ello, la base de la distincin tradicional en tres tipos


de acento:
a) Acento de intensidad, de sonoridad, dinmico, espiratorio o
articulatorio. Como se desprende de todas las denominaciones que
recibe, esta modalidad de acento se obtiene produciendo un aumento
de la intensidad -de la fuerza espiratoria- en la unidad acentuada, lo
que se manifiesta acsticamente como un aumento de la amplitud de la
onda.
b) Acento tnico, musical, de altura, cromtico o meldico. Se logra introduciendo una variacin (generalmente un aumento) en el tono
de la unidad que lo recibe .
c) Acento de cantidad o cuantitativo. Supone una mayor duracin
relativa de la slaba acentuada frenta a las no acentuadas.

Esta divisin, durante mucho tiempo insalvable, resulta hoy inexacta


por cuanto las investigaciones ms recientes han demostrado que el
fenmeno del acento se materializa en muchas ocasiones mediante la
combinacin de dos o tres de los parmetros indicados. Unas veces
prevalecer uno de ellos; otras, en cambio, ser el propio efecto de la
combinacin el que nos har sentir que la silaba est acentuada.
Sucede que, segn explicamos en su momento (vase apartado 2.4),
la alteracin de la intensidad con que se pronuncia un sonido conlleva
una modificacin concomitante, leve pero apreciable, de su tono. En
efecto, el aumento de esfuerzo muscular supone una elevacin en el
volumen total del aire espirado que, a su vez, ejerce mayor presin
sobre las cuerdas vocales, tensndolas (es decir, creando lo que los
fisilogos denominan tensin pasiva) y obligndolas a vibrar a mayor
velocidad durante ms tiempo . As pues, la tensin pasiva de las cuerdas, responsable directa de la elevacin de la frecuencia fundamental
y del alargamiento del sonido, es consecuencia de la energa espiratoria y ello explica el entrelazamiento de los tres ndice (v. Gili Gaya:
1961, 52-53).
Por el contrario, la llamada tensin activa de las cuerdas se debe a
la contraccin de los msculos insertos en los cartilagos de la laringe y
no depende directamente de la presin del flujo areo. De hecho, la
tensin pasiva puede verse modificada por el aumento de la presin sin
que esto afecte a la tensin activa. Por tanto , slo cabe hablar de acento
tnico o musical, como modalidad acentual bien diferenciada, cuando
sea esta tensin activa de las cuerdas vocales la que haya actuado para
modificar el tono resultante de la silaba acentuada. En los dems casos,
parece ms conveniente hablar de acento en general, teniendo siempre presente que su manifestacin es una mezcla de fenmenos fsicos
interrelacionados.
130

Muchas son las opiniones acerca de cul pueda ser el ndice ms


importante para la percepcin del acento. Es evidente que la primaca
de uno sobre otro vara en funcin de la lengua de que se trate en cada
caso si bien la modificacin en la frecuencia fundamental , con la subsiguie~te alteracin del tono , se perfila pocoa poco , en la mayora de los
idiomas estudiados, como el factor deCISIvo para la percepcIn del
acento (v. Quilis: 1981, 320-326).
Por lo que se refiere ms concretamente al espaol, los puntos de
vista de los especialistas han sido divergentes al respecto: El Ilustre
fonetista Toms Navarro Toms defendi siempre la pnondad de la
intensidad como ndice principal, en tanto que otros investigadores ,
como D. Bolinger o H. Contreras mantuvieron posturas contra nas a la
de Navarro y asignaron a la frecuencia fundamental el papel preponderante (vase la polmica recogida en Bolinger: 1961. 33-48; Contreras:
1963, 223-237; Navarro: 1964, 231-235; Contreras: 1964, 237-239, Y las
ltimas aportaciones a la cuestin en Quilis: 1971 , 53-72 Y Momoy Casas: 1980, 133-140). Los resultados de los ms recientes trabajos sobre
el castellano coinciden en lneas generales con los realizados sobre
otras lenguas, en el sentido de que apuntan a la fre~uencia d~1 tono
fundamental, Y seguidamente a la duracIn, como los mdIces acustIcoS
ms destacados de las slabas acentuadas.
8.1 .3.

De acuerdo con el tipo de sistema de acentuacin que presenten, las lenguas se dividen en lenguas de acento fijo y lenguas <:le
acento libre. En las primeras, el acento ocupa siempre una pOSIcIn fIJa
en la palabra; en las segundas, admite dos o tres posiciones posibles
dentro de este mismo mbito de la palabra. El francs, por ejemplo, es
un idioma con acento fijo , puesto que el acento recae siempre sobre la
ltima slaba; el espaolo el italiano, por el contrario, son lenguas de
acento libre: en castellano, puede ir acentuada la ltima slaba, la penltima, la antepenltima ... (v. Garde: 1968, 5-12)..
..
En las lenguas de acento libre, los vocablos reCIben tradICIOnalmente diferentes denominaciones en virtud del lugar que ocupa en
ellos el acento. As, son palabras oxltonas o agudas las que reciben el
acento en su ltima silaba (cant, saln, por ejemplo); son paroxlonas,
gra ves o llanas, las que lo presentan en la penltima slaba (cr~el,
fcil); son proparoxltonas o esdrjulas las acentuadas en la antepenullIma slaba (lipico, cntaro) y, finalmente, superproparoxltonas o sobreesdrjulas son las palabras -en espaol, por lo general compuestas- acentuadas en slabas anteriores a la antepenltima (repsatelo,
pinsatelo).
Todas las voces, consideradas aisladamente, poseen un acento, el
llamado acento lxico en terminologa de Momoy Casas. Sin embargo,

8.1 .4.

131

algunas de esas palabras, cuando se integran en la cadena hablada,


Plerden su acento y se convierten, por ello, en elementos tonos. Por 10
comn, son trminos con valor nexivo que se supeditan al acento princlpal del grupo acentual (v. Captulo 7, apartado 7.2.1). El criterio para
r~conocer una palabra tona es su incapacidad para llegar a ser el
nucleo central de este grupo (salvo en casos de dislocacin acentual
muy forzada). Como decimos, aparecen subordinadas al acento dominante al que preceden o siguen, por 10 que se conocen como elementos
procllticos o encllticos respectivamente. En castellano, son palabras
habitualmente inacentuadas o tonas la mayor parte de las preposiciones Y cOn)UnClOnes, el artculo determinado, los pronombres tonos y el
ref1exlvo se, los adjetivos posesivos, las frmulas de tratamiento, los
pronombres relativos, etc. (v. Alcina y Blecua: 1975, 44 1-445).
8.1.5. Salvo algunas excepciones como pueden ser los adverbios espaoles terminados en -mente, las palabras slo poseen un acento. Sin
embargo. en ocasiones, para dar nfasis a una voz determinada se
coloca un segundo acento en una de las slabas habitualmente inacentuadas de esa palabra o del grupo acentua1. Por ejemplo: No es una
pelcula ms, es l pelcula, o es su rsponsabiJidad. Cuando este
procedimiento se repite en exceso confiere al discurso un ritmo especial que resulta un tanto afectado al odo.
Puede ocurrir tambin que la slaba destacada coincida con la acentuada, es decir. que se produzca un refuerzo mayor de la intensidad en
esa posicin: l hizo eso, no t pasara a ser L hizo eso, no t, si
queremos dar relieve al primer pronombre frente al segundo.
Estos dos mecanismos acentuales para subrayar determinadas partes de la cadena son manifestaciones del llamado acento de insistencia
o enftico y se utilizan en un gran nmero de lenguas , si bien unas
muestran preferencia por el primer procedimiento y otras por el segundo.

8.2.

Los rasgos prosdicos de tono

8.2.1. Por cuanto hasta ahora hemos explicado con respecto a la primera de las propiedades prosdicas tratadas, el acento , comprobamos
que los correlatos fisiolgicos y fsicos de todos estos fenmenos suprasegmentales estn inextricablemente ligados. As, veamos que , tanto
en el tipo de acento que se conoce como tonal como en el tradicionalmente denominado de intensidad, se producen variaciones en el tono

de la slaba acentuada , motivadas independientemente en el primer


caso o concomitantes con otras alteraciones fsicas en el segundo.
132

No obstante. todas las lenguas presentan. adems, otra clase de


cambios tonales que conllevan diferencias de significado y es a este
grupo al que nos referimos cuando hablamos de rasgos prosdicos de
tono. Cuando las variaciones de la frecuencia fundamental contienen
informacin lxica o morfolgica. esto es, se dan en el mbito de la
palabra y poseen valor distintivo, se llaman tonos y las lenguas que
presentan esta posibilidad. tonales. Cuando. por otra parte, las variaciones de frecuencia se producen en la oracin y aportan, por tanto,
informacin sintctica, se habla de entonacin.
En los siguientes apartados explicamos con ms detenimiento las
caractersticas de estas dos propiedades prosdicas basadas en la modificacin del tono.
8.2.2. Las lenguas tonales son muy numerosas. Se distribuyen principalmente en tres grandes reas lingsticas: 1) ciertos grupos de lenguas amerindias; 2) la mayor parte de las lenguas africanas, y 3) casi
todas las lenguas de la familia chinotibetana. junto con otras muchas del
Sudeste asitico . Las lenguas de este ltimo conjunto difieren de las de
los dos anteriores en que usan los tonos con valor casi exclusivamente
lxico (no morfolgico ni sintctico) y en que presentan un paradigma
mucho ms complejo que puede llegar a estar compuesto hasta de 10
tonos diferentes con valor distintivo .
Pike (1948) dividi a las lenguas tonales en lenguas de registro tonal
y lenguas de contorno tonal. El yoruba. por ejemplo, es una lengua
hablada en el suroeste de Nigeria que posee slo tres tonos diferentes.
Estos tonos tienen. asimismo, la particularidad de ser discretos y estables, identificables con puntos definidos de la gama tona1. El yoruba es,
por ello. como la mayor parte de las lenguas africanas, una lengua de
registro tona1. En chino mandarn, en cambio , cada uno de los cuatro
tonos distintivos existentes debe describirse en trminos de movimientos transitorios que se deslizan de un punto a otro de la escala de tonalidades. Por consiguiente, el chino mandarn, al igual que muchos idiomas del sur de Asia, es una lengua de contorno tona1.
La forma ms simple de transcribir los distintos tonos es utilizado un
acento agudo para indicar el tono alto, uno grave para representar el
bajo. y ninguno para sealar el tono medio. Este sistema resultar
vlido en casos como el del yoruba u otras lenguas de registro -en las
que. si hubiera ms niveles tonales, se emplearan signos adicionales,
como una barra horizontal superpuesta a la vocal o la consonante de
que se trate. por ejemplo-, pero no sirve cuando se trata de lenguas
de contorno. En la Fig. 8.1 se muestran algunos contrastes tonales
existentes en yoruba y en chino. con las formas respectivas de representarlos .
133

Yoraba (Registro tonal)


Represen. Transcrip-lacin
cin
Slgmficado

Chino (Contorno tonal)


Tono
nmero

DescripCIn

Represen
lacin

[6 w]

l viene

ff-

alto

[ wa)

l mir

altoascendente

[6 wa)

l eXIsti

2
3

bajo-descendente
ascendente

alto.-descendente

Ejemplo

Slgmficado

m.'
m.'
m.'

cilamo

m.'

rei'llr

madre
caballo

Figura 8.1.

Como se aprecia en la Fig. 8.1, cada uno de los smbolos usados


para los tonos del chino consta de una lnea de referencia situada a la
derecha, que abarca los cinco niveles establecidos en la gama tonal
-bajo, medio-bajo, medio, medio-alto y alto- y que va precedida de
otra lnea indicativa del movimiento concreto del tono. As, por ejemplo, el tono 3 comienza con un descenso de la frecuencia desde un nivel
medio-bajo hasta el nivel ms bajo posible, para luego ascender hasta
el nivel medio-alto; mientras que el tono nmero 1 se conforma por una
frecuencia alta que no vara.
La diferenciacin entre lenguas tonales y lenguas con entonacin
no es absoluta. Muchas lenguas tonales no entonativas presentan alteraciones del tono condicionadas por factores sintcticos y capaces de
modificar el significado de las oraciones, y, del mismo modo, algunas
lenguas no tonales y entonativas poseen palabras dotadas de tonos
propios.
8,2.3, La entonacin es la lnea o curva meldica con que se pronuncia
un enunciado. De todas las propiedades suprasegmentales es, sin duda, la ms compleja (tanto sustancial como formal y funCionalmente) y,
en relacin con las dems, es tambin la menos estudiada en la mayor
parte de las lenguas (v. Meier, 1984). A continuacin trataremos de
explicar en qu consiste esta complejidad sustancial y formal a que
nos refenmos. El aspecto funcional o distintivo de la entonacin queda,
como es lgICo, fuera del mbito de este trabajo.
El ndice acstico de mayor relevancia para la percepcin de la
entonacin es el concerniente a las variaciones de frecuencia del fundamental, dependientes, como sabemos, de la vibracin de las cuerdas
vocales. Estas alteraciones se pueden observar y medir en un sonogra-

ma de banda estrecha (vase apartado 3.2.6) con relativa facilidad. Para


ello se procede a ampliar la gama inferior de frecuencias de modo que
134

.....-

el fundamental se aprecie claramente, o bien se miden las varia!i.~


",_
.
ciones experimentadas por cual.~
J_
quiera de los armnicos superio-..."..res (por lo general se elige el
It
dcimo) que resultan ms visi"bles y que son siempre mltiplos
del fundamental y, por consiguiente, reflejan sus cambios de
frecuencia. En la Fig. 8.2, se re- Figura 8,2, Espectrograma de banda
produce un espectrograma de estrecha de Ouieres comer manzanas?
banda estrecha obtenido para (Tomado de Martlnez Ce1drn 1986.)
analizar la entonacin.
Los distintos fonetistas que han abordado el problema de la entonacin no coinciden sobre cul deba ser la magnitud del cambio en la
frecuencia para que se perciba como un cambio en la entonacin. As,
algunos establecen una variacin mnima de 6 Hz, en tanto que otros
sitan el lmite mnimo en 40 Hz. Parece, con todo, probado que, a este
respecto, es decisivo el contexto en que se produzca la modificacin
(v. Quilis: 1981, 359).
Las modificaciones de la frecuencia fundamental no son el nico
ndice en el reconocimiento de la entonacin, sino que en l intervienen otros factores, tales como la duracin y la intensidad. Tras la
medicin de todos estos parmetros y antes de extraer ninguna consecuencia, hay que tener en cuenta, sin embargo, cul sea la lnea de
modulacin -el nivel de entonacin- propio de cada individuo, determinado por el equilibrio entre los msculos tensores y distensores de
sus rganos del habla.
8.2.4. La unidad meldica, es decir, la parte mnima del enunciado
dotada de una forma entonativa determinada y de un significado diferenciado, constituye la unidad de anlisis de la entonacin.
En espaol, la unidad meldica coincide con el grupo fnico, del
que ya hablamos en su momento (e!. 7.2). Como ya dijimos entonces,
los grupos fnicos o unidades meldicas estn separados generalmente
por pausas, su extensin es variable y depende en gran manera del
idioma de que se trate en cada caso. As, en castellano los grupos
suelen ser ms largos que en francs , pero ms breves que en italiano
y ello confiere ritmos distintos a cada una de estas tres lenguas.
No existen reglas explcitas que nos marquen por dnde hemos de
efectuar la separacin entre una unidad y otra, si bien algunas divisiones quedan automticamente descartadas por antinaturales o absurdas.
Por ejemplo, en Una vez terminado el trabajo hubo de ser enmendado,

135

son posibles dos anlisis alternativos: uno separara los grupos fnicos:
Una vez terminado / el trabajo hubo de ser enmendado, y otro dividiria:
Una vez terminado el trabajo / hubo de ser enmendado. En ningn
caso, sin embargo, sera aceptable el anlisis Una vez terminado el
trabajo hubo / de ser enmendado.
Los investigadores no se han puesto hasta el momento de acuerdo
sobre el tratamiento que cabe dar a estar unidades, una vez establecidas. Algunos consideran que cada una de ellas est integrada por un
cuepo meldico no susceptible de mayores divisiones y por un final en
el que se localiza toda la informacin y la capacidad distintiva de la
entonacin . Otros, en cambio, piensan que a lo largo de cualquier
contorno entonativo pueden marcarse puntos relevantes de carcter
tonal coincidentes con ascensos o descensos determinados. As pues,
para el primer grupo de especialistas, lo realmente importante es la
configuracin general de la curva meldica , en tanto que para el segundo grupo son significativos los distintos niveles tonales que puedan
localizarse en ella. Finalmente, un tercer sector de fonetistas se inclina
por un punto de vista eclctico que concede validez a ambos aspectos
-configuracin y niveles- como facetas complementarias en el estudio general de la entonacin.
De acuerdo con Navarro Toms (1944), la unidad meldica puede dividirse en tres partes:
8.2.5.

l. La rama inicial, formada por todas las slabas hasta el primer


acento fuerte. En espaol, todas ellas se pronuncian con tono ms grave
que el que presenta la primera slaba acentuada .
2. El cuerpo de la unidad, constituido por la slaba fuerte inicial
ms todas las otras slabas hasta la slaba anterior al ltimo acento fuerte
(incluida). A lo largo del cuerpo entonativo , el tono apenas experimenta modificaciones importantes, de modo que se mantiene la altura tonal
alcanzada en la primera slaba acentuada.
3. La rama final, integrada por la ltima slaba fuerte y las siguientes slabas, si las hubiera. sta es la parte normalmente ms breve y
ms significativa de la unidad meldica. En todas las lenguas presenta
formas diferentes en funcin de la naturaleza sintctica de la unidad en
que se halle. En castellano, concretamente, se distinguen cinco tipos de
inflexin final: cadencia , anticadencia , semicadencia , semianticadencia
y suspensin.

dencia (.L) es una terminacin descendente , menos grave que la cadencia -segn se desprende de su misma denominacin- que se emplea
en la afirmacin insegura . La semianticadencia (T) es un final ascendente, en menor grado que la anticadencia, que seala contrastes secundarios y se corresponde con unidades de carcter continuativo. Finalmente , la suspensin (-+), con idntico nivel tonal que el cuerpo del
grupo, se presenta en las unidades de sentido incompleto .
La unidad El muchacho jugaba con la pelota en el parque)) podra
dividirse , segn lo expuesto anteriormente, en
El muchacho jugaba con la pelota en el parque!
~~-----~-----~~-

rama inicial

rama final

cuerpo

en tanto que T no sabes nada> se analizar en


T no sabes nada

,~

cuerpo

rama final

Las caractersticas generales de la unidad meldica varan, como es


lgico, de una lengua a otra, no slo, como ya dijimos , en lo que se
refiere a su tamao, sino tambin en lo que respecta a los patrones
entonativos que predominan en los distintos idiomas. En general, puede afirmarse, por ejemplo , que el grupo meldico francs es ms
breve que el espaol y tiende a la elevacin; la unidad meldica del
ingls es , por el contrario, ms larga y presenta a menudo una direccin descendente .

La unidad El muchacho jugaba con la pelota en el parque podra


enunciativa. La anticadencia (i) es una terminacin alta que caracteriza
a las oraciones inacabadas y marca el contraste mximo con la cadencia. Aparece con frecuencia en las oraciones interrogativas. La semica-

136

131

o
Aplicaciones
de la fontica

9.1.

La enseanza de segundas lenguas

9.1.1. Desgraciadamente, an en la actualidad el aspecto fontico es el


ms descuidado de todos los que implica la enseanza de una lengua
extranjera a hablantes no nativos. En principio, se suele prestar ms
atencin a la adquisicin por parte del alumno del vocabulario y de las
estructuras morfosintcticas caractersticas de la lengua en cuestin,
entendiendo que la buena o mala pronunciacin es un factor secundario y de difcil tratamiento.
Es evidente , sin embargo , que con buenos materiales tcnicos de
apoyo (grabaciones , vdeos , etc.), con un cierto conocimiento de los
conceptos fonticos bsicos y con una considerable dosis de paciencia
se pueden obtener resultados brillantes, equiparables en ocasiones a
los alcanzados tras la estancia prolongada del alumno entre hablantes
nativos . La fontica tiene, por tanto , una primera aplicacin dentro del
campo de la llamada lingstica aplicada .
9.1.2. El estudiante de una lengua extranjera debe , ante todo , aprender a dominar una nueva base articulatoria. Con este trmino se conoce
el conjuntos de hbitos articulatorios que caracterizan una lengua dada .
No se tratar, pues , de empezar a pronunciar algunos sonidos nuevos
que la lengua materna no posee , sino de ser capaz de apreciar y
reproducir las diferencias generales que existen entre los distintos
idiomas en cuanto a la tensin de los articuladores, energa articulato139

ria, utilizacin de los labios, etc. Malmberg (1976, 82 y ss.) enumera con
detenimiento algunos de los rasgos que oponen las bases articulatorias
del ingls, del francs y del espaol, concluyendo que las de las dos
primeras lenguas son completamente opuestas, en tanto que el espaol
ocupa una situacin intermedia. As, mientras que en francs, por ejemplo, abundan las articulaciones anteriores, las labiales y las nasalizadas,
en ingls --n particular, en ingls britnico-- no son frecuentes ninguno de estos tres tipos articulatorios. El espaol comparte algunas propiedades con cada uno de los dos idiomas anteriores.
Una vez que el alumno llega a adquirir una nueva base articulatoria
(que, no lo olvidemos, incluye tambin nuevos hbitos entonativos y
acentuales), el segundo paso consistir en el conocimiento del sistema
fonolgico de la segunda lengua. En otras palabras, no es suficiente con
saber distinguir entre dos sonidos diferentes, sino que se hace preciso
conocer el valor que ellos poseen en el idioma estudiado. Para un
hispanohablante, por ejemplo, no resulta difcil la distincin entre una
[d) oclusiva y una [) fricativa, puesto que ambos sonidos se dan en
castellano (pensemos en las palabras ('dao) o [sordao), entre otras
muchsimas mencionables). Lo que s le ocasionar algunos problemas
ser el valor funcional de que estn dotadas estas dos realizaciones,
por ejemplo en ingls, que las convierte en dos fonemas distintos con
capacidad para diferenciar significados. Por todo ello, un buen profesor de idiomas debe tener un amplsimo conocimiento de la fontica y
de la fonologa de su propia lengua y de la lengua extranjera que
ensee.

9.1.3. Destaquemos, por ltimo, el papel importante que los sistemas


de transcripcin fontica han desempeado en la enseanza de segundas lenguas. Est repetidamente comprobado que las personas que
dominan uno de estos sistemas cuentan con enormes ventajas cuando
se enfrentan a la pronunciacin de un idioma ajeno al suyo. Cada
smbolo se asocia, en efecto, con unas propiedades acsticas y articulatorias conocidas de antemano y que la ortografa al uso no puede de
ningn modo sugerir. Igualmente, el dominio de la tcnica descriptiva
basada en las Vocales Cardinales (vase Captulo 5) constituye una
ayuda insustituible para la adquisicin de sistemas voclicos nuevos, no
importa cun diferentes puedan ser del que posea la lengua materna.

9.2.

El reconocimiento de la voz y la
Identificacin del hablante

9.2.1. Durante toda la historia de la humanidad, el mtodo para la


identificacin de una persona a partir de su voz ha estado basado en los
140

juicios subjetivos, y a menudo fiables, emitidos por otra u otras personas familiarizadas con la forma de hablar del individuo en cuestin .
Hasta muy recientemente este procedimiento de identificacin auditiva
no se ha visto completado y, en su caso, revalidado por estudios o
experimentos en laboratorio. Despus de la Segunda Guerra Mundial,
sin embargo, con el desarrollo y la mejora de medios tcnicos como el
espectrgrafo, la grabadora y los ordenadores, han surgido nuevos
mecanismos de identificacin al tiempo que se ha abierto un nuevo
campo de estudio y se ha acrecentado el inters y el nmero de los
especialistas que a l se acercan. En la actualidad, los juicios emitidos
por estos expertos son ya admitidos como pruebas en los procesos
legales celebrados en muchos pases (v. Tasi: 1979).
9.2.2. El mtodo de identificacin de la voz consiste en la comparacin
auditiva y visual de una o ms voces conocidas con una voz desconocida. Para la evaluacin de tipo auditivo , se escuchan las grabaciones de
todas las voces y se intenta determinar las diferencias y similitudes
existentes entre ellas; la evaluacin visual, en cambio, se realiza cotejando los patrones acsticos de los distintos hablantes, extrados de
espectrogramas.
El examinador de sonogramas slo debe comparar las realizaciones
espectrogrficas de elementos fonticos iguales o similares y ha de fijar
su atencin, en particular, sobre los siguientes ndices o rasgos: frecuencia media de los formantes voclicos, ancho de banda de los formantes, silencios, estras verticales, duracin , contorno e intensidad de
los formantes, energa inter-formntica y transiciones entre sonidos .
Las caractersticas espectrales especialmente peculiares localizadas en
sonogramas de voces presuntamente diferentes constituyen claves importantsimas para su identificacin o equiparacin. Por ejemplo, es
poco probable que dos personas distintas produzcan un aumento de
energa igual en la misma situacin dentro de una palabra . (Para una
exposicin ms detallada , puede verse el Informe de The National
Research Council, On /he Theory and Pracuce of Voice Identification ,
publicado en los Estados Unidos en 1979).
Como paso previo a este minucioso anlisis , el experto tiene que
realizar una grabacin muy cuidadosa de las voces objeto de estudio y
transcribir fonticamente el texto en cuestin.
9.2.3. La idea que subyace en todos los procedimientos de identificacin, sean stos subjetivos --s decir, basados en juicios emitidos por
oyentes- u objetivos --sto es , llevados a cabo con medios electrnicos o mecnicos- es la de que las diferencias que existen entre el
habla de distintos hablantes (o diferencias inter-habIantes) son siempre
141

mayores que las que se encuentran en las sucesivas emisiones de un


mismo hablante (diferencias intra-hablantes) . En consecuencia, los investigadores en este campo se han esforzado en intentar descubrir el
conjunto de parmetros acsticos que conlleven en cualquier ocasin la
menor variabilidad intra-hablante y la mayor variabilidad inter-hablante posible y que aparezcan tanto en el habla normal como en el habla
deformada o imitada.
Son muchos los experimentos realizados en este sentido, pero, sin
embargo, hasta el momento no se ha llegado a conclusiones definitivas.
Ello es explicable si consideramos que en el proceso de identificacin
es preciso tomar en cuenta un alto nmero de variables (las introducidas por los propios hablantes, las que dependen de los examinadores
o de las mquinas empleadas, etc.), lo que, como es obvio, complica
extraordinariamente toda la cuestin. En todo caso, y dada la actualidad
y el inters suscitado por estas investigaciones, son esperables avances
rpidos y decisivos a corto y medio plazo .

9.3.

la patologa del habla

9,3.1, Los diferentes tipos de conducta lingstica anormal suelen


agruparse en dos grandes apartados con las denominaciones generales
de trastornos de la recepcin y trastornos de la produccin, si bien es
cierto que unos y otros estn, en numerosas ocasiones, claramente
interrelacionados. En el diagnstico y tratamiento de muchos de ellos la
labor del fonetista y del fonlogo es determinante, de forma que, para
cualquier equipo clnico dedicado a la terapia del habla, su colaboracin o su asesoramiento resultan insustituibles. En los siguientes apartados enumeraremos algunas de las dificultades lingsticas para cuyo
tratamiento es especialmente til la aplicacin de los hallazgos tericos
o metodolgicos de la fontica o de la fonologa.

El ms importante trastorno de la recepcin se conoce con el


nombre de sordera. Como es sabido, la sordera puede ser congnita,
es decir, presente en el nacimiento, o adquirida, esto es, resultado de
una enfermedad o trauma acaecido durante la infancia o la vida adulta
(v. Crystal: 1983, 173 Y ss.) .
Es difcil averiguar si un nio est afectado por sordera congnita o
no . De los estudios realizados hasta el momento parece desprenderse
que en el balbuceo de los nios sordos de alrededor de un ao se
pueden apreciar notables diferencias con respecto al de los nios con
capacidad auditiva intacta, en particular por lo que se refiere a la
entonacin. Por consiguiente, el anlisis fontico de los rasgos supra9,3,2.

142

segmentales contribuir en gran medida a la aclaracin del diagnstico.


La mayora de los sordos congnitos, por otra parte, tienen gran
dificultad en aprenden a hablar, lo que motiva el apelativo de sordomudos que habitualmente reciben. Para ayudarles a superar este problema se han experimentado diversos mtodos. Ya explicamos en su
momento (vase Captulo 3) que el espectrgrafo de sonido fue creado
y desarrollado con esta finalidad . Se pensaba que sera posible entrenar al paciente de modo que fuera capaz de comparar los sonogramas
de sus propias emisiones - naturalmente defectuosas- con los de las
del profesor , y as se dispondra de un mecanismo de autocontrol, si no
auditivo, al menos visual. Como dijimos, enseguida se comprob que
interpretar los espectrogramas no era tarea fcil y que las expectativas
iniciales no se vean confirmadas en la prctica diaria.
Con posterioridad se han realizado muchas investigaciones sobre el
habla de los nios sordos congnitos. De todas ellas se deduce que este
tipo de pacientes manifiesta una clara tendencia a desarrollar un sistema fontico diferente del que posee el oyente normal. Las vocales, por
ejemplo, suelen ser centralizadas y poco diferenciadas entre s. lo que
tambin influye en la inteligibilidad de las consonantes, en cuanto que ,
como vimos (vase Captulo 5) , stas se perciben dependiendo en gran
medida de sus transiciones con las vocales adyacentes.
Los estudios sobre la cuestin prosiguen. Sin duda, el conocimiento
profundo de las caractersticas fonticas del habla de los sordos es el
estadio previo para lograr avances en el proceso de su curacin.
9.3.3. Los sindromes afsicos constituyen un objeto de investigacin
especialmente adecuado para aplicar en l las tcnicas de la fontica o
la fonologa.
La afasia, en todas sus mltiples variantes, es, en efecto, un trastorno
de la comunicacin provocado por una lesin cerebral, que conlleva el
deterioro en la comprensin y el empleo del lenguaje , adems de otras
deficiencias en memoria , razonamiento lgico, etc. Puede afectar principalmente a la recepcin del habla o a la produccin. En el primer
caso, se conoce como afasia receptiva y, en el segundo, como afasia
expresiva . Esta ltima es interesante desde el punto de vista fontico
puesto que suele caracterizarse por el uso indebido de la entonacin y
de las pausas, adems de por una fuerte tendencia a sustituir o trasponer los sonidos.
Relacionada con la afasia expresiva, la apraxia articulatoria o dispraxia afecta a la capacidad del enfermo para controlar la posicin de
los msculos para hablar y la secuencia de movimientos que stos
deben efectuar. La diferencia con la afasia radica en que en esta ltima

143

el sistema fonolgico se ha visto afectado, porque el paciente no emplea determinados fonemas o confunde las reglas que gobiernan su
aparicin, mientras que en la dispraxia el sistema fonolgico queda
intacto y falla el control que el enfermo debe deter sobre l. Con todo,
a menudo resulta difcil distinguir claramente ambos sndromes.
9.3.4. Los trastornos de la produccin que ms conciernen al fonetista
y al fon logo son los referidos a la fonacin, a la resonancia o a la
articulacin. Los primeros surgen cuando por alguna razn el funcionamiento de la laringe no es normal y, en lugar de los sonidos esperados,
se producen distorsiones de muy diverso tipo. Los trastornos de la
resonancia se deben a interferencias creadas en las distintas cavidades
resonadoras, que dan lugar a alteraciones del timbre de los sonidos .
Finalmente , los trastornos de la articulacin son todos aquellos que
entraan una mala pronunciacin de algunos o de todos los sonidos que
constituyen la cadena hablada .
Entre los efectos que puede ocasionar un mal funcionamiento de la
laringe podemos destacar la afonJa o disfonJa, consistente en la emisin
de un susurro sin vibracin de las cuerdas, o bien en la emisin de una
voz ronca debida con frecuencia a un crecimiento anmalo del tejido
de las cuerdas vocales. Otra situacin distinta es la generada por el
empleo de alguna fuente de fonacin diferente de la laringe. Como es
sabido, cuando las cuerdas vocales se ven afectadas por una neoplasia
maligna (carcinoma de laringe) se hace preciso, en muchas ocasiones,
proceder a la extirpacin de la laringe, esto es, a una laringotoma. Los
enfermos que la sufren pierden las cuerdas vocales y con ellas la
posibilidad de emitir voz normal, por lo que deben acostumbrarse a
utilizar otros medios para expresarse. Normalmente en estos casos se
puede optar por emplear una laringe artificial o vibrador especial que
supla a las cuerdas, o por usar la parte superior del esfago en la que
se produce la vibracin del esfnter que lo cierra.
Los principales trastornos de la resonancia, por otra parte, son los
relacionados con el aumento o la disminucin de la nasalidad como
cualidad caracterstica de la voz. As , se distinguen voces hipernasales
de voces hiponasales , motivados ambos tipos por el estado en que se
encuentre la cavidad nasal.
Finalmente , los trastornos de articulacin puede ser de carcter
fontico o de carcter fonolgico . Es muy frecuente , por ejemplo, escuchar pronunciaciones defectuosas del sonido [r] o del sonido [s] . Sin
embargo, lo ms probable es que los hablantes a los que se los hemos
oido no confundan nunca estas dos consonantes con ninguna otra del
sistema fonolgico . Se trata, por consiguiente, de un trastorno puramente fontico . Si, por el contrario, la persona estudiada pronuncia,
144

por ejemplo, el fonema Ibl siempre como [p], est en realidad confundiendo fonemas, y el problema es ms grave, puesto que afecta al
significado de las palabras. Aqu la labor del fonlogo o del fonetista es
fundamental: no se podr recomendar ni iniciar terapia alguna hasta no
haber establecido con claridad qu constrastes fonolgicos ha perdido
el paciente, cul es la distribucin del error o errores cometidos, si son
sistemticos o no, etc. Este es, por tanto, el apartado en el que el
patlogo del habla ms necesita del fonetista o del fonlogo .

145

Closario

A continuacin presentamos una breve explicacin de algunos trminos


tcnicos utilizados en este libro. No se trata, pues, de definiciones en el ms
estricto sentido de la palabra, sino de aclaraciones de conceptos que pueden
ser tiles a los lectores no familiarizados con ellos .
En la distancia existente desde el punto de reposo al punto de
mximo alejamiento de una partcula en vibracin. Se corresponde, por
tanto, con el aumento o el descenso mximos de la presin area durante el
ciclo vibratorio de un determinado sonido.

.Am.plitud:

AIrlcado: Sonido consonntico compuesto por una fase inicial oclusiva y una

fase final fricativa, ambas homorgnicas, esto es, producidas en la misma


zona de articulacin.
Es la gama de frecuencias a las que responde con efectividad un resonador o un filtro, es decir, el margen de frecuencias dentro del
cual cada componente presenta una amplitud equivalente al menos al 70.7
por 100 de la que presenta el componente con mayor amplitud.

bcho de banda:

Aproxim.aDte: Sonido pronunciado con una constriccin del canal oral menor

que la que se produce en los sonidos fricativos, pero mayor que la que se
da en las vocales. Los sonidos aproximan tes no producen ruido de friccin .
Tambin denominado hipertono, un armnico es una frecuencia
componente de la onda sonora compleja que es mltiplo de la frecuencia
fundamental. As, si una onda tiene una frecuencia fundamental de 200 Hz,
los componentes de 200 y 600 Hz se conocen como segundo y tercer armnicos .

Armnico:

Conjunto de movimientos realizados por los rganos articuladores para interrumpir o modificar la salida de la corriente de aire al
exterior durante la emisin de cada sonido. Tambin suele denominarse
articulacin la posicin adoptada conjuntamente por los rganos en el momento de la produccin del sonido.

.Articulacin:

149

Articulador: Cada rgano o parte del canal vocal que desempea un papel
especfico en la produccin de un sonido. Los articuladores pueden ser
activos, como la lengua, o pasivos, como el paladar.
Aspirado: Sonido consonntico ---generalmente oclusivo sordo- a cuya articulacin sucede un breve escape de aire que retrasa el comienzo de la
subsiguiente vibracin de las cuerdas vocales.
Cardinal (vocal): Vocal terica establecida como punto de referencia para la
articulacin y descripcin de cualquier eventual realizacin voclica. El
sistema de vocales cardinales se compone de dos series, las cardinales
primarias y las cardinales secundarias, con posiciones de la lengua iguales
y disposicin opuesta de los labios.
Ciclo: Vibracin completa de una partcula, integrada por las fases de compresin y rarefaccin . As. un ciclo es la porcin de la onda sonora que se
extiende desde cualquier punto hasta el siguiente punto en el que la presin
area comience a sufrir idnticos cambios.
CHe: Consonante ingresiva en la que existe una doble oclusin: en el velo del
paladar y en la zona anterior de la boca. El enrarecimiento del aire acumulado en la cavidad asi formada se consigue haciendo descender el cuerpo de
la lengua, lo que provoca, al deshacerse la oclusin situada en la parte
anterior del tracto, la succin del aire exterior.
Compresin: Fase del ciclo vibratorio de la onda sonora durante la que se
produce el aumento de la presin area ,
Egresivo: Cualquier sonido producido con el flujo de aire que, procedente
de los pulmones, se dirige al exterior.
Elongacin: Separacin de la partCUla vibrante con respecto a su posicin
de reposo en un momento dado. La elongacin mxima es la amplitud .
Envolvente: Tambin denominada curva de resonancia , la envolvente indica
cules son las amplitudes relativas de las vibraciones que e?Cperimentara
un cuerpo en respuesta a distintas frecuencias incidentes.
Espectro del sonido: Diagrama que muestra las amplitudes relativas de las
diferentes frecuencias componentes de un sonido. Los espectros pueden
ser de linea o continuos, dependiendo del tipo de onda -peridica o
aperidica respectivamente- que representen.
Eyectivo: Sonido consonntico producido con el aire almacenado en la cavidad formada por una oclusin glotal y otra oclusin en la cavidad oraL El
aire sale al exterior al verse constreido por la elevacin de la laringe y
deshacerse, al tiempo, la oclusin oral.
Fase: Situacin del ciclo de vibracin en un momento dado.
Formante: Zona de la escala de frecuencias en la que un sonido presenta una
mayor concentracin de energa. Tambin puede definirse como cada una
de las resonancias del conducto vocal.
Fricativo: Sonido consonntico en cuya produccin los articuladores se aproximan y dan lugar a un estrechamiento del canal oral que genera una
friccin audible.

150

Frecuencia: Nmero de ciclos realizados en la unidad de tiempo, convencionalmente el segundo. La frecuencia se mide en Hertzios o ciclos por segundo.

Frecuencia fundamental: Es la frecuencia de repeticin de la onda compleja


y el mximo comn divisor de todas sus frecuencias componentes.
Filtro acstico: Resonador con capacidad selectiva respecto a las frecuencias, empleado para transmitir o pasar un sonido.
Fonacin: Proceso de produccin de una onda sonora mediante la accin de
una fuente de sonido. Esta fuente puede ser glotal, como en el caso de los
sonidos sonoros, o de ruido, como sucede en los sordos.
Glotis : Espacio existente entre las cuerdas vocales, a travs del cual pasa la
corriente de aire procedente de los pulmones,
Ingresivo: Sonido producido con un fluj o de aire proveniente del exterior
del tracto oral.
Intensidad: Potencia acstica transmitida a travs de una onda, medida en
una superficie de un centmetro cuadrado perpendicular a la direccin de
propagacin de dicha onda. La intensidad es proporcional al cuadrado de la
amplitud de l a onda.

Inyectivo: Sonido consonntico ingresivo en el que existe una doble oclusin: en la glotis y en la boca. El enrarecimiento del volumen de aire
contenido en la cavidad as! formada se logra mediante el descenso de la
laringe y el aumento del tamao de la cavidad, con la consiguiente entrada
de aire del exterior.
Lateral: Sonido consonntico cuyo canal vocal se forma a los lados de la
lengua, que constituye una obstruccin central a la salida del aire.
Liquida: Trmino utilizado para designar a los sonidos laterales y vibrantes.
Nasal: Consonante articulada con el paso a la cavidad nasal abierto -merced
al descenso de la vula- y una oclusin en alguna zona de la cavidad oral.
El aire, por tanto, sale al exterior a travs de las fosas nasales.
Nasalizado u oronasa1: Sonido en el que el flujo de aire sale al exterior
libremente a travs de la cavidad oral y de la cavidad nasal (a la que puede
acceder por hallarse la vula bajada).
Oclusivo: Sonido consonntico en cuya articulacin se establece un contacto
completo entre los articuladores activo y pasivo, que de esta forma cierran
momentneamente el canal vocal. Una vez deshecha esta oclusin, el aire se
precipita al exterior con una breve explosin.
Oncla aperidica: Onda en la que no se repite el mismo perfil de un ciclo a lo
largo del tiempo. En las ondas aperidicas existen componentes de todas
las frecuen cias.
Onda compleja: Onda resultante de la adicin de un nmero determinado de
onda. SImple .

Oada pel16dJca: Onda que repite el perfil de un ciclo a intervalos regulares


de tiempo

151

Onda sonora: Propagacin de una pertubacin a travs de un medio material


como es el aire, en forma de una serie de compresiones y rarefacciones
alternas que afectan a cada una de las partculas componentes de ese medio.
Onda slDusoidal o slDusoide: Movimiento oscilatorio sumamente simple que
se corresponde con tonos puros.
Rarefaccin: Fase del ciclo vibratorio durante la cual se produce un descenso en la presin area.
ResoDaDda: Fenmeno por el cual un cuerpo, denominado resonador y que
posee una tendencia natural a vibrar a determinada frecuencia , experimentar vibraciones de mayor amplitud cuando es puesto en movimiento por
otro cuerpo vibrante a una frecuencia similar.
RetroOejo: Sonido para cuya articulacin el pice de la lengua se eleva y se
vuelve hacia e l paladar.
Ruido: En fontica acstica, se conoce como ruido la sensacin perceptiva
originada por ondas sonoras complejas apridicas.
Sonoro: Sonido que presenta vibracin de las cuerdas vocales.
Sordo: Sonido producido sin vibracin de las cuerdas vocales.
Timbre: Cualidad acstica propia de cada sonido y dependiente de la configuracin general de su espectro.
Tono: Impresin auditiva de la frecuencia fundamental de una onda sonora.
Tono lmugeo: Vibracin producida en la g lotis mediante la abertura y cierre
sucesivos y continuados de las cuerdas vocales.
Tracto vocal: Conjunto formado por las cavidades infraglticas, gltica y
supraglticas.
Vib:nmte: Articulacin producida mediante la vibracin de un rgano activo
elstico (la lengua, por ejemplo), que obstruye y abre el paso al flujo de aire
rpidamente .

152

Referencias
bibliogrficas
Abercrombie, D. (1967): Elements of General Phonetics, Edinburgh University
Press, Edimburgo.
Abercrombie, D. (1985): "Daniel Jone's Teaching , Phonetics Linguistics. Essays
in honor of Peter Ladefoged, Academic Press, Nueva York, pgs. 15-25.
Alarcos, E. (1964): Fono/ogla espaola, Gredas , Madrid.
Albright, R. W. (1958): The International Ph onetic Alphabet. Its Backgrounds
and Deve/opment, Waverly Press, Baltimore.
Alcaraz, E., y Bryn Moody (1984): Fontica inglesa para espaoles, B. Moody,
Alicante.
Alcina, J. , y Blecua, J. M. (1975): Gramtica espaola, Arie!, Barcelona.
Alonso, D.; Zamora Vicente, A., y Canellada, M. J. (1950): "Vocales andaluzas.
Contribucin al estudio de la fonologa peninsulan), Nueva Revista de FiJo/ogla Hispnica , IV, pgs. 209-230.
Bolinger, D. (1961): Acento meldico, acento de intensidad)), Bolean de FiJoJogla de la Universidad de Chile, XlIl, pgs . 33-48.
Borzone de Manrique , A. M. (1980): Manual de fontica acstica, Hachette ,
Buenos Aires.
Brosnaham, L. F .. Y Malmberg B. (1970): Introduction to Phonetics, Cambridge
University Press, Londres.
Canellada, M.' J., Y Kuhlmann, J. (1987): Pronunciacin del espaol, Castalia,
Madrid.
Catlord , J. C. (1977): Fundamental Problems in Phonetics, Edinburgh University
Press, Edimburgo.
Cornmitee on Evaluation of Sound Spectrograms Assembly o( Behavioral and
Social 5ciences, (1979): On /he Theory and Practice of Voice Identifcation,
National Acaderny of Sciences, Washington.
Contreras, H. (1963): "Sobre el acento en espaob), Bo/etln de Filologla de la
Universidad de Chile , XV, pgs. 223-237.
Contreras, H. (1964): Tiene el espaol un acento de intensidad?), BoleUn de
Fllologlo de 18 Umversidad de Chile, XVI, pgs. 237-239.
Crystal , DaVId (1983): Pato/ogla del lenguaje, Ctedra, Madrid.

153

J. (1935): Analyse du Trait de Phontique de M. Grammonh>.


Archive Nerlandais de Phontique Exprimentale. XI. pgs. 73-106.
Delattre, P. (1964): Change as a correlate of the vowel consonant distinctioll),
Studia Linguistica. XVIII. pgs. 12-25.
Delattre, P. (1967): Acoustic ar articulatory invariance?, Glossa, J, pgs. 3-25.

ChlurnskY.

Delattre. P. y 0lsen. C. (1969): Syllabic Features and Phonic Impression in


English. German. French and Spanish. Lingua. XXII. pgs. 160-175.
Denes. P. y Pinson. E. (1963): The Speech Chain. The Physics and Biology of
Spoken Language. Waverly Press. Baltimore.
Fant. G. (1960): Acoustic Theory of Speech Production. Mouton. La Haya.
Fant. G. (1973): Speech Sounds and Features. MlT Press . Cambridge. Mass.
Fernndez Ramrez. S. (1986): Gramtica espaola. 11. Los sonidos, Arco/Libros.
Madrid.
Fischer-Nrgensen, E. (1985): Sorne basic vowel features, their articulatory
correlates, and their explanatory power in phonology, Phonetics Linguistieso Essays in honor al Peter Ladefoged, Academic Press, Nueva York.
Fry, D. B. (ed.) (1976): Acoustic Phonetics, Cambridge University Press, Londres.
Fry, D. B. (1979): The Physics of Speech, Cambridge University Press, Londres.
Garde, P. (1972): El acento. EUDEBA. Buenos Aires.
Gili Gaya, S. (1961): Elementos de fontica general. Gredos. Madrid.

Gonzlez Calvo, J. M. (1982): Consideraciones sobre la palabra como unidad


lingstica. Revista Espaola de Linglstica, 12, 2, pgs. 375-410.
Grarnmont, M. (1965): Trait de phontique, L. Delagrave, Pars.
De Granda, G. (1966): La estructura silbica, CSIC, Madrid.
Guirao, M., y Borzone de Mamique, A. M. (1972): Fonemas. silabas y palabras
del espaol de Buenos Aires. Filologla. XVI. pgs. 135-165.
Hala. B. (1973): La s11aba. CSIC. Madrid.
Hardcastle, W. (1985): Instrumental articulatory phonetics, Linguistic Abstracts. 1.3. pgs. 111 -123.
jakobson, R.; Fant, G .. y Halle, M. (1951): Preliminaries to Speech Analysis, MlT

Press. Cambridge, Mass .


jespersen. O. (1954): A modern English Grammar. 1. Sounds and Spe11ings,
Ejnar Munksgaard, Copenhague.
Kent, R. D. (1983): The segmental organization of speech, en P. MacNeilage

(ed.). 1983, pgs. 57-89.


Ladefoged. P. (1962): Elements of Acoustic Phonetics. The University ofChicago
Press, Chicago.

Ladefoged, P. (1971): Preliminaries to Linguistic Phonetics. The University of


Chicago Press, Chicago.

Malmberg, B. (1965): Estudios de fontica hispnica, CSIC, Madrid.


Malmberg, B. (ed.) (1968): Manual of Phonetics, North-Holland, Amsterdam.
Malmberg, B. (1971): Les domaines de la phontique, Presses Universitaires de
France, Pars.

Malmberg, B. (1976): La fontica, EUDEBA, Buenos Aires.


Martinet. A. (1971): Saber por qu y para quin se transcribe, La linglstica
sincrnica. Gredos, Madrid, pgs. 161-166.
Martnez Celdrn, E. (1 984a): Hasta qu punto es importante la sonoridad en
la discriminacin auditiva de las obstruyentes del castellano?, Estudios de
Fontica Experimental. I. pgs. 243-291.

Martnez Celdrn. E. (1984b): Cantidad e intensidad en los sonidos obstruyentes del castellano: Hacia una caracterizacin acstica de los sonidos aproximantes, Estudios de Fontica Experimental, 1, pgs. 73-129.
Martnez Celdrn. E. (1986): Fontica, Teide. Barcelona.
Matras, j. j . (1986): El sonido, Orbis. Barcelona.
Meier. Rolf (1984): Bibliographie zur lntonation, Max Niemeyer, Tubinga.
Monroy Casas, R. (1980): Aspectos fonticos de las vocales espaolas, SGEL,

Madrid .
Navarro Toms, T. (1939): Desdoblamiento de fonemas voclicos, Revista de
Filologla Hispnica.
pgs. 165-167.
Navarro Toms, T. (1964): La medida de la intensidad, Boletln de Filologla de
la Universidad de Chile, XVI, pgs. 231-235.
Navarro Toms. T. (1966): Estudios de fonologla espaola, Las Amricas, Nueva

n.

York.
Navarro Toms. T. (1971): Manual de pronunciacin espaola, CSIC, Madrid.
Navarro Toms, T . (1974): Manual de entonacin espaola, Guadarrama, Ma-

drid.
Nolan, F. (1982): The Phonetic Bases ofSpeaker Recognition, Cambridge University Press, Londres.

OConnor.
Pike. K. L.
Pike. K. L.
PuIlurn, G.

j. D. (1973): Phonetics, Penguin Books, Londres.


(1943): Phonetics, Ann Arbor, Michigan.
(1948): Tone Languages, Ann Arbor, Michigan.
K., Y Ladusaw, W. A. (1986): Phonetic Symbol Guide. The University

of Chicago Press, Chicago.


Quilis, A. (1971): Caracterizacin fontica del acento en espaol, Travaux de
Linguistique et Littrature, IX. pgs. 53-72.
Quilis, A. (1981): Fontica acstica de la lengua espaola. Gredos. Madrid.
Quilis. A. (1983): Lengua espaola, 1, UNED, Madrid.
Quilis. A. (1984): Bibliografla de fontica y fonologla espaolas, CSIC, Madrid.

Ladefoged, P. (1975): A Course in Phonetics, Harcourt. Brace and jovanovich.

Quilis. A.; Esgueva. M.; Gutirrez. M. L .. Y Cantarero, M. (1979): Cacractersti-

Nueva York.
Lass. R. (1976): English Phonology and Phonological Theory. Cambridge University Press, Londres.
MacNeilage. P. (ed.) (1983): The Production of Speech, Springer. Nueva York.
Malmberg. B. (1955): The phonetic basis for syllable divisionl> . Studia Linguistica, 9, pgs. 80-87.

cas acsticas de las consonantes laterales espaolas, Lingfstica Espaola


Actual. 1-2. pgs. 233-343.

154

Salvador, G. (1977): Unidades fonol6gicas voclicas en el andaluz orientah>.


Revista Espaola de Linglstica, 7, pgs. 1-23.
De Saussure , F. (1971): Curso de linglstica general. Losada. Buenos Aires.
Straka, G. (1963): La division des sons du langage en voyelles et consonnes

155

peut-elle etre justifie?, Travaux de Linguistique el Littralure, 1, pgs. 1774.


Thomas, J. M. C.; Bouquiaux, L., y Cloaree-Heiss, F. (1986): Iniciacin a la
fontica, Gredos, Madrid.
Torreblanca, M. (1976): La aplicacin de la fonologa transformacional a la
lengua espaola: la Spanish Phonology de J. Harris)), Revista de Filologa
Espaola, LVIII, pgs. 133-200.
Tosi, O. (1979): Voice Identification. Theory and Legal Applications, University
Park Press, Baltimore.

LINGSTICA
Director
Francisco Marcos Marn

1. Introduccin a la lingst ica: historia y modelos

Marcos Mar'l, Francisco

2. Lgica y lingstica
Garrido Medina, Joaqun

3. Los sonidos del lenguaje


Gil Femndez, Juana
4. Fundamentos de sintaxis general
Moreno Cabrera, Juan Carlos
5. Fundamentos de morfologa
Vareta Ortega, So/edad
6. Fontica experime ntal: teora y prctica
Martnez Ce/lIrn, Eugenio
7. Teora si ntctica: de las estructuras a la reccin
Demonte Barrero, Violeta
8. Fundamentos crticos de la gramtica de dependencias
Bez San Jos, Va/erio
9. Anlisis Contrastivo. Anlisis de Errores e Interlcngua
Santos Gargallo, Isabel
10. Las estructuras gramaticales desde el punto de vista histrico
Rillruejo Alonso, Emilio
11. Las ca tego ras gramaticales
Bosque Mwioz, 19,wcio
12. La semiologa
Bobes Naves, M." Carmen
13. Sociolingtistica
Rotaetxe Amusateg/li, Karmele

156

Das könnte Ihnen auch gefallen