Sie sind auf Seite 1von 9

Tema 5 Percepcin del habla

1. Introduccin
Lenguaje oral, material, referirse al habla, trminos lenguaje o habla humana de forma indistinta. Habla es
sonido, principales caractersticas del sonido. El sonido, cuando un cuerpo vibra y comunica la vibracin a las
molculas del entorno (aire, agua), recibida por el odo. Lo que se desplaza realmente es la onda. Vibra en el
aire, parecido, imaginar la onda en tres dimensiones: esferas concntricas. Cerebro, maquinaria biolgica,
extraer significados a partir de estos movimientos moleculares. Onda, o lnea ondulante que sube y baja. Picos,
presin positiva, molculas se juntan, valles, presin negativa, molculas se separan. Piezas bsicas del sonido
son las ondas puras o simples, no pueden descomponerse. Una onda comprende una sucesin de ciclos, cada
ciclo est formado por un pico que sube y un valle que baja en torno a un punto central, cero. Dependiendo de
la velocidad de vibracin, ondas varan en el nmero de ciclos, dimisin o variable frecuencia. Movimientos
vibratorios rpidos, frecuencia alta, muchos ciclos por segundo (o hercios), agudas. Ondas movimientos
vibratorios lentos, frecuencia baja, graves. Objeto solido tiene una frecuencia de vibracin, cuerpo largo
vibrar ms lentamente que uno corto. Voces masculinas, ms graves, cuerdas vocales largas. Intensidad o
amplitud del desplazamiento de la onda. Decibelio (dB) desde 0 dB, o umbral de la audicin, hasta ms de
140 dB, umbral del dolor al sonido. Conversacin entre 40 y 60 dB.
Suma de varias ondas simples, onda compleja. Naturaleza, ondas complejas, dos clases de ondas
complejas: peridicas, ciclos o patrones complejos y aperidicos, no se pueden apreciar ciclos repetitivos
Primeras, sonido dotado de un tono o tonalidad. Vocales y consonantes sonoras, las segundas, ruidos, sin tono,
consonantes sordas. El lenguaje, dos tipos de ondas peridicas, sonidos sonoros, vibracin de las cuerdas
vocales y aperidicas, sonidos sordos. Onda lingstica, carcter continuo, interrumpida por las consonantes
oclusivas. Naturaleza rtmica del lenguaje humano, momentos de menor (consonantes) y mayor energa
(ncleos voclicos). Onda acstica, segmentos peridicos, funcionan las cuerdas vocales y segmentos
aperidicos en los que estas no participan.
5.1. Onda del habla, parmetros, ciclos por segundo frecuencia fundamental de la voz o Fo. Frecuencia baja en los varones que
en las mujeres. Varones 70 y 170 ciclos por segundo o hercios (Hz) y mujeres entre 130 y 270 Hz. Hablamos, la frecuencia sube y
baja, entonacin prosdica, entonacin desempea un papel relevante en el procesamiento sintctico, Parkinson, disartrias, sndrome
del acento extranjero, prosodia se ve afectada y repercute negativamente en la inteligibilidad. Frecuencia fundamental, caracterstica
de cada individuo, sello, anclaje del sistema perceptivo del oyente sobre una voz particular, efecto cocktail-party. Se manipula
artificialmente la frecuencia fundamental, drsticos efectos sobre la percepcin de la identidad del hablante.

Espectrogramas. Onda acstica, mucha informacin. Una onda compleja se compone de muchas otras
simples, El sonido posee distintos grados de energa en unas frecuencias u otras. Espectrogramas obtenidos
mediante un espectrgrafo. 1940, Bell Telephone Labratories, espectrgrafo de sonido, analizar los sonidos
en sus diferentes componentes frecuenciales. Representacin visual del sonido. La investigacin se aceler
durante la Segunda Guerra Mundial, voces por radio del enemigo pudieran ser analizadas, la guerra acabo
antes de que la tcnica estuviera a punto. Prisma que descompone la luz en sus colores integrantes, coleccin
de filtros. Tambor o rodillo rotatorio sobre el que se colocaba un papel especial encerado que se oscureca por
efecto del calor. Efectuada la grabacin del sonido se haca pasar a travs de la coleccin de filtros mientras
giraba el tambor. La energa correspondiente a cada banda de frecuencia pasaba a travs del filtro respectivo,
que terminaba en una aguja apoyada sobre el papel. Mayor era la energa, ms la cantidad de corriente elctrica
circulaba por la aguja calentando el papel. Tres dimensiones bsicas del sonido: El tiempo, diferentes
frecuencias, y la amplitud.
til para el anlisis del habla humana, ordenadores, software. La onda es una variacin de energa que se
extiende a lo largo del eje del tiempo, y el espectrograma presenta sus tres dimensiones bsicas: el eje del

1
tiempo, horizontal; el eje de frecuencias, vertical, y la intensidad. Cuerdas vocales, estras, rpida sucesin de
movimientos de apertura y cierre de las cuerdas vocales, lnea oscura, cuerdas abiertas, espacio en blanco
cerradas. Fonemas sordos no estn activas. Importantes los formantes, franjas oscuras horizontales de gran
concentracin, F1, resonancias de la garganta. Segn los principios fsicos de la acstica de tubos,
Dependiendo de las formas que el tubo vocal adopta durante la articulacin de las palabras, los formantes
aparecen en diferentes posiciones o frecuencias, clave para identificar los fonemas y entender el lenguaje.
Podemos entender frases completas basndonos nicamente en dos o tres ondas puras, si estas siguen las
trayectorias de los formantes.
Sntesis del habla. Mediante el espectrgrafo se pasa de la onda al espectrograma No sera posible el
camino inverso? Un espectrograma reconstruir artificialmente la onda completa para ser escuchada. Sntesis,
pasar de las partes al todo; justamente lo contrario del anlisis pasar del todo a las partes. Crear una seal de
habla artificial recibe el nombre de sntesis de habla. Pattern Playback, Laboratorios Haskins, sistemas de
sntesis de voz mucho ms perfectos que el reproductor de patrones de los laboratorios Haskins. Sintetizador,
Dennis Klatt en el Instituto Tecnolgico de Massachussets, modelo matemtico del tracto vocal humano.
Ncleo de uno de los conversores texto-voz ms conocidos, el DECtalk.
2. Rasgos Generales de la percepcin del habla.
Habla humana, medio de comunicacin excelente, el lenguaje hablado. Rapidez. Habla rpida. Experto en
cdigo Morse, velocidades de desciframiento a lo sumo 10 veces ms lentas. Capacidad de resolucin temporal
acstica es muy limitada. Velocidad ms rpida a la que es posible identificar unidades discretas, 7-9 unidades
por segundo. Ms all, se funden, zumbido, segn aumenta el ritmo, se convierte en un tono. Habla, se
transmiten los sonidos, se encuentra entre 20-30 segmentos por segundo, sin que exista problema.
5.2. Pattern Playback, Haskins, transformaba el dibujo de un espectrograma en sonido, inventar un aparato capaz de leer textos
en voz alta a las personas ciegas, pianola. Objetivo primero de construir una maquina lectora para las personas ciegas fracaso,
variabilidad natural de los fonemas segn su contexto fontico. Cada fonema presenta espectrogramas muy distintos dependiendo
de los fonemas que van delante y los que van detrs.

Sonidos individuales 7-9 unidades por segundo. Sonidos del habla 20-30 unidades.
Robustez. Mantener conversaciones en las condiciones de ruido ms adversas, resistencia al recorte de los
picos del habla. Complejidad, proceso muy complejo, automtico, dificultad de simular artificialmente los
procesos de percepcin del lenguaje, modelos ocultos de Markov, redes neuronales artificiales. Los sistemas
que funcionan con hablantes mltiples solo pueden manejar un nmero limitado de palabras; los sistemas que
reconocen muchas palabras solo pueden funcionar con un nico hablante. Una palabra es confundida con otra
semejante. Aun cuesta imaginar que un ordenador realice lo que nosotros hacemos todos los das sin
problemas. Coctail-party. Automtica Naturaleza automtica, Ryalls, madre naturaleza, ocultado su
complejidad, concentrarnos al ciento por ciento en la construccin del significado. Diferente. Difiere de la de
los sonidos, sonidos del habla, 20-30 unidades por segundo, frente a las 7-9 unidades de cualquier otra clase
de sonidos. Comportamiento anmalo, tareas de discriminacin e identificacin. Nuestra maquinaria cognitiva
est construida de tal modo que nos resulta mucho ms fcil discriminar entre estmulos que identificarlos. En
el habla sucede al revs. Discriminacin, comparar dos estmulos, si son iguales o distintos Identificacin,
comparacin entre un nico estmulo y una representacin mental que tenemos almacenada en nuestra
memoria. Dominio auditivo, cualquier persona puede discriminar entre unos 350.000 tonos puros distintos,
pero identifica unos pocos. Individuos, excepcionalmente dotados, odo absoluto, pueden superar ese lmite.
La percepcin del habla sigue una pauta distinta: peores en discriminacin que en identificacin. Fonticos,
consonantes oclusivas, difciles de discriminar entre s. Esas variaciones son fsicamente distintas, las mismas
variaciones entre tonos puros las percibiramos inmediatamente, pero en un contexto de habla somos sordos a
ellas. Muy eficientes identificando los sonidos del habla. Percepcin del habla es: Rpida, robusta, compleja,

2
automtica, diferente a la de otros sonidos. Ausencia de invariancia. Percepcin del habla, seal altamente
variable activa representaciones mentales discretas. Problema que an no hemos sabido resolver: la ausencia
de invariancia. Variabilidad del habla intrasujeto es prcticamente tan amplia como la variabilidad intersujeto,
la seal es muy dependiente del contexto fontico. Las ondas que suenan /a/ han de tener algo en comn que
no tienen las ondas que suenen /e/. Ese algo comn es lo que se ha bautizado con el nombre de invariancia
fontica (invariancia o constancia). Dnde est fsicamente la invariancia en las ondas de la /a/? Camuflada
dentro de la informacin de la onda. La invariancia acstica podra estar en los formantes, como se ver ms
adelante.
Hay sonidos del habla, consonantes oclusivas, la invarianza no acaba de aparecer en la seal acstica.
Problema de la ausencia de invarianza del estmulo del habla. En alguna parte tiene que estar. Percepcin del
habla caractersticas llamativas que la separan de la percepcin de otros sonidos. Percepcin categrica,
mecanismo especial para percibir el habla.
5.3- 1950 Existe en nuestro cerebro un mecanismo perceptivo especializado en procesar los sonidos del lenguaje? Autores y
grupos de investigacin dos polos: 1- Defienden que, probablemente por evolucin, el ser humano ha desarrollado en su cerebro un
mecanismo especial, hiptesis considera que el mecanismo actuara como un verdadero mdulo de funcionamiento rpido,
automtico, encapsulado y blindado. 2- Lo especial es el estmulo (habla) no el mecanismo perceptivo, se percibe con el mismo
mecanismo general, estimulacin sobreaprendida.

2.1 Percepcin de las vocales


Lenguaje humano, sucesin de movimientos de apertura y cierre de la boca. Aperturas, vocales y cierres
consonantes. Vocales, ncleo de las silabas. Todas las lenguas, ambas clases de sonidos. Vocales mas
extremas, /i/, /a/, /u/, triangulo articulatorio de las vocales castellanas. Eje horizontal, vocales, anteriores
(lengua en posicin delantera) /i/ y en menor medida /e/; centrales /a/ y posteriores /o/ y /u/. Eje vertical,,
lengua alta media o baja. Grado de apertura de la boca, /a/ la vocal mas abierta, /e/ y /o/ semiabiertas y las
vocales /i/ y /u/ cerradas.
2.1.1 Papel de los formantes
Cambie la forma general del conducto vocal, variando sus resonancias acsticas o formantes. Formantes,
resonancias del tracto vocal, acstica de tubos. Frecuencias que son reforzadas como consecuencia de la forma
que adopta el tubo vocal. Franjas oscuras horizontales de mayor energa. En los formantes donde reside la
clave de la percepcin de las vocales. Sntesis de vocales artificiales, cuando se alteran los formantes, una
vocal distinta. Anlisis de las vocales naturales, a vocales distintas les corresponden formantes diferentes. Los
dos primeros son los ms importantes. La mayor parte de las vocales pueden ser identificadas solo con los dos
primeros formantes, F1 y F2. Esenciales para la inteligibilidad. Los siguientes, F3, F4 y F5, aaden naturalidad.
Importancia dos primeros, evidente en los trabajos Haskins. Vocal patrn caracterstico de F1 y F2.
F2, ms alto cuanto ms anterior es la vocal. El espacio que queda delante del estrechamiento causado por
la lengua es ms corto cuanto ms anterior se sita la lengua. Responsable de la segunda resonancia o F2. F1
es ms alto cuanto ms abierta es una vocal, F1 depende de la abertura del tubo vocal. /a/ tiene la F1 ms alto
de todos. Vocales semiabiertas /e/ /o/ F1 est ms abajo que en /a/ y en las vocales cerradas /i/ /u/, F1 baja ms
todava. Abocinamiento que se produce en la /u/, alargar todo el tubo vocal y, por lo tanto, el de bajar ambos
formantes
2.1.2 Variabilidad de los formantes.
Formantes dependen del tamao y la forma del tracto vocal, diferencias individuales. Las frecuencias de
los formantes son inversamente proporcionales a la longitud del tubo. Una misma vocal difiere
considerablemente en los valores absolutos de sus formantes. Estudio de vocales, Peterson y Barney. Cuando
los valores formanticos de cada vocal se representan en un diagrama de dispersin F1 x F2 aparecen nubes o

3
conglomerados de puntos extendidos a lo largo de grandes zonas. Alta variabilidad de los formantes.
Solapamientos entre las reas voclicas: coinciden a veces en el plano y tienen los mismos, o muy parecidos,
valores para F1 y F2, los oyentes no las confunden entre s. Esto no ocurre para el castellano, que cuenta con
un sistema voclico menos abigarrado: 5 vocales frente a las 10-12 del ingls. Los oyentes no tienen dificultad
en entender el lenguaje, normalizacin.
2.1.3 Normalizacin de las vocales
Si todos los hablantes fueran del mismo tamao, una vez que el odo ha llevado a cabo el anlisis y la
extraccin de los formantes, el cerebro podra relacionar directamente sus frecuencias con una vocal particular.
Los hablantes son muy distintos, fuertes disparidades individuales en tamaos del tracto vocal. Diferencias
fsicas entre hablantes resultan en diferencias considerables en los formantes para una misma vocal. Qu
operaciones perceptivo-cognitivas debe efectuar un oyente para interpretar ambos sonidos? Estandarizacin o
normalizacin que transforme los valores formanticos a una escala comn. Teora de la razn entre formantes,
la identificacin de las vocales no depende de los valores absolutos de los formantes, sino de la razn o
proporcin entre ellos. Funciona razonablemente bien. Hay algunas vocales que son distintas y, sin embargo,
presentan la misma razn F2/F1. Informacin adicional que los oyentes usan para el proceso de normalizacin.
Hiptesis: Normalizacin intrnseca, cada vocal porta suficiente informacin acstica en s misma para
permitir a normalizacin. Normalizacin extrnseca, los oyentes necesitan informacin externa a la vocal para
establecer un marco de referencia.
Normalizacin intrnseca, proporcin F2/F1, informacin adicional que permite resolver la ambigedad,
formantes superiores, F3, y la frecuencia fundamental de la voz. Kohhson, frecuencia fundamental es una pista
perceptiva importante. La percepcin de las vocales se halla influida por los valores que adopta Fo y tambin
por los de F3. Normalizacin externa, los oyentes interpretan los formantes en referencia a un contexto ms
amplio de habla. Inventario se extrae de los fragmentos de habla precedentes. Ladefoged y Broadbent,
identificacin de un conjunto de vocales inglesas sintetizadas artificialmente dentro de un contexto silbico
/b-vocal-t/. Contexto precursor, valores promedios de F1 y F2 se manipularon experimentalmente.
Identificacin de las vocales estaba influida por los cambios formanticos de la frase. En lnea con lo
establecido por la hiptesis: Dechovitz, resultados semejantes utilizando frases naturales, Nearey, listas de
palabras.
2.1.4 Percepcin contina de las vocales.
Las vocales se perciben de forma continua. Si sintetizamos un conjunto de vocales artificiales cuyos
formantes tengan valores que vayan desde los tpicos de una vocal a los de otra, todos los estmulos intermedios
se perciben como vocales intermedias. Vocales intermedias entre ambas. Esto no ocurre con las consonantes
oclusivas, de forma categrica y no continua.
2.2 Percepcin de las consonantes.
Consonantes producidas por movimientos o gestos articulatorios rpidos. Coordinacin de los gestos para
las consonantes con los gestos voclicos, unidades silbicas, ncleo es la vocal, las consonantes no pueden
formar el ncleo de una silaba. No es posible pronunciar algunas consonantes de forma aislada, silabas, vocales
alteradas por delante o detrs por consonantes. Percepcin de las consonantes es esencial para entender el
lenguaje y obedece a procesos ms complejos que las vocales. Percepcin categrica.
2.2.1 Transiciones formnticas.
Pistas perceptivas para la identificacin de los sonidos consonnticos, composicin del ruido en las
fricativas /s/ o la /f/, formantes propios /m/, /n/, /l/: las transiciones de los formantes voclicos. Vocal de modo
aislado, formantes, apariencia estable. Si la pronunciamos precedida o seguida de una consonante, se ve

4
alterada. Transicin consonante-vocal, silaba directa, vocal-consonante, silaba inversa. Transiciones de los
formantes, pista clave para su identificacin. Especialmente evidente en las consonantes oclusivas. Las
transiciones de F1 y F2 son cruciales para percibir las consonantes, sobre todo las de F2. Sistema perceptivo
se vale de ellas para identificar con gran rapidez los distintos sonidos consonnticos, transiciones son hacia
arriba, y en otros hacia abajo, tambin de la vocal. Espectrogramas esquemticos /di/ y /du/. Parte estable de
los formantes da lugar a la percepcin de las vocales. Transiciones las que nos hacen or la consonante /d/. La
transicin de F2 es distinta en cada silaba, pero en ambos casos suena igual: /d/. Problema terico sobre la
percepcin del habla ausencia de invariancia acstica. Ese algo constante si lo encuentra nuestro sistema
perceptivo.
2.2.2 Percepcin categrica
Las vocales se perciben de modo continuo, las consonantes, especialmente las oclusivas se perciben de
forma categrica. Estudio seminal de Liberman, Harris, Hoffman y Griffith, laboratorios Haskins, primero que
lo puso de manifiesto. Sintetizaron 14 estmulos, representaciones esquemticas. Todos los estmulos eran
iguales excepto en la transicin de F2. Perciban ejemplos claros de /be/, /de/ y /ge/, pero no lo hacan de modo
continuo, sino categorial. Parte estable, vocal. Cuando F2 tiene un inicio bajo, se oye /b/, intermedio, se oye
/d/, inicio es alto, se oye /g/ Qu ocurre con los estmulos intermedios? Es como si existieran valores crticos
o fronteras, sin diferencias internas dentro de cada categora. Experimentos que estudian la percepcin, dos
tipos de tareas.
Tareas de discriminacin, estmulos se comparan entre s. Paradigma AX, estmulo y la continuacin otro,
responder igual o diferente. ABX, dos estmulos que siempre son distintos, tercer estimulo que siempre
es uno de los dos anteriores: cul de los dos es este tercer estimulo. Tarea de identificacin, identificarlo
indicando la etiqueta o nombre del estmulo. Ambos tipos de prueba los estmulos se presentan en ensayos
aleatorios, evitar cualquier efecto de orden. Percepcin es de tipo categrico, la identificacin es constante
dentro de una categora y al cambiar de categora, la etiqueta cambia tambin bruscamente.
Discriminacin guarda relacin con la identificacin: cuando los estmulos que se comparan pertenecen a
categoras distintas, la discriminacin es casi perfecta, no aparece en la percepcin continua, donde los
resultados son proporcionales a la distancia entre los estmulos (cuanto ms distintos, mejor se discriminan).
Mecanismo especial para la percepcin del lenguaje han visto en ello una constatacin de su existencia.
Distintas teoras sobre la percepcin del habla. Percepcin categrica se ha hecho evidente.
2.2.3 Contraste sordo-sonoro
Parmetro estrella en la investigacin psicolingstica, voice onset time o VOT. Tiempo hasta el inicio
de la voz, tiempo de emisin de voz, TEV, tiempo de emisin voclica. Denominacin original, el acrnimo
VOT. De su valor depende que percibamos una oclusiva sorda o una sonora. Todas las lenguas del mundo
consonantes oclusivas, seis oclusivas en castellano. Mecnica articulatoria de las consonantes oclusivas.
Pronunciamos una de ellas, por ejemplo en posicin inicial de silaba, secuencia de los siguientes movimientos
articulatorios: Movimiento 1: oclusin o interrupcin completa de la salida del aire. Movimiento 2: liberacin
del aire. Movimiento 3: vibracin de las cuerdas vocales para el inicio de la vocal que sigue a la oclusiva.
Sincronizacin temporal muy fina. Perfecta coordinacin, mecanismo responsable, rea de Broca de la
corteza cerebral, alterada en ciertos trastornos del habla. Pares de fonemas que son iguales en todos sus rasgos,
salvo en el de la sonoridad. VOT es la distancia temporal entre los movimientos 2 y 3. Milisegundos que
transcurren desde la liberacin brusca del aire hasta el inicio de la vibracin de las cuerdas vocales. Puede ser
positivo o negativo. VOT de +45 ms significa que primero se produce el movimiento 2 (liberacin de aire y
explosin) y 45 ms ms tarde ocurre el movimiento 3 de comienzo de la vibracin. VOT de 0 ms, ambos
coinciden. Orden se invierte, VOT negativo. Oclusivas sordas se diferencian de las sonoras en que tienen un
VOT ms largo que estas. Distincin entre oclusivas sordas y sonoras segn el VOT. Valores numricos que

5
podra adoptar el VOT, hay lmites crticos. El ingls se comporta de distinta manera que el castellano. En
ingles la frontera de las labiales se sita en torno a 25-30 ms: consonante sorda /p/ tiene un VOT superior a
ese lmite, y la sonora /b/ inferior. Castellano, el limite se sita en torno a un VOT de 0 m. Lengua tai, tres
categoras, sorda, sonora y presonora. Abramson y Lisker, 31 estmulos artificiales, iguales en todo, salvo en
el valor de VOT. Percepcin era claramente categrica. VOT era inferior a 25-30 ms /b/, si superior a ese
lmite /p/. Inmediaciones del lmite, una estrecha zona de incertidumbre. Oyentes tenan dificultades para
distinguir entre pares de estmulos dentro de una categora, discriminaciones eran casi perfectas. Se ha
discutido mucho sobre si hay percepcin categrica en otros sonidos. Percepcin categrica confiere al oyente
la ventaja de centrarse en los aspectos de la seal importantes para identificar los fonemas e ignorar
variaciones. Ryalls: Percepcin categrica es caracterstica de ciertas distinciones de sonidos del habla,
manejar la enorme variacin entre las diferentes producciones del mismo sonido, las diferencias irrelevantes
se ignoran.
Descargara de trabajo al sistema perceptivo y permitira concentrar casi todos los recursos cognitivos en
lo que verdaderamente importa en el lenguaje: significado.
3. Percepcin del habla en animales
Autores, partidarios de la existencia de un mecanismo especializado para percibir el lenguaje, percepcin
categrica una prueba a su favor, propiedad especial y tpica de los sonidos del habla. Science, Peter Eimas,
percepcin categrica de algunos fonemas era innata, los seres humanos no nacen como una hoja en blanco.
Fuerte apoyo a la tesis de los especialistas, mecanismo perceptivo especfico, generalistas, mecanismo general,
la evidencia emprica se ha ido repartiendo. Patricia Kuhl y James Miller demostraron que la percepcin
categrica tambin ocurre en sujetos tan poco sospechosos de tener lenguaje humano como las chinchillas.
Dos fases: Fase de entrenamiento, solo los dos estmulos extremos de la serie. Responder ante los estmulos
de VOT = 0ms permanecer en el mismo lado ante los estmulos de VOT= 80ms. Otro grupo, estmulos
invertidos. Fase de prueba: enfrentados a toda la serie completa de estmulos, con todos los grados intermedios
entre 0 y 80 ms, los intermedios fueron siempre recompensados.
Mimetizaba los experimentos tpicos de identificacin con seres humanos. La chinchilla tena dos
respuestas para escoger: cruzar la barrera o permanecer en el mismo lado. Las chinchillas fueron muy
semejantes a las humanas, limite VOT= 33 ms, seres humanos 35 ms. Las fronteras entre categoras variaban
igual que en las personas, dependiendo del punto de articulacin de las consonantes. Dooling, Okanoya y
Brown, resultados parecidos en periquitos, codornices japonesas o monos macacos. Duro golpe a la percepcin
categrica como manifestacin o prueba de un mecanismo especial humano. No invalidan per se la posible
existencia de un mecanismo especial en las personas, restan peso al argumento que haba sido su buque
insignia. Percepcin categrica en sonidos que no son de habla.
4. Teorias sobre la percepcin del habla
Oyentes, pasar de una seal acstica continua y extremadamente variable a representaciones estables y
discretas, explicaciones distintas, aparente ausencia de invarianza, tres perspectivas.
4.1 Teora motora
Ms antigua, Laboratoris Haskins, Alvin Liberman, Franklin Cooper y Pierre Delattre, explicar la ausencia
de invarianza acstica del habla. En ambos estmulos el primer sonido suene /d/, pese a que los espectrogramas
no tienen aparentemente nada en comn. Algo hay en comn que nuestro sistema perceptivo es capaz de
capturar. Ese algo comn no hay que buscarlo en el plano acstico, plano motor, movimientos articuladores
que son el origen de los sonidos del habla. Los dos comparten el hecho de que se han pronunciado del mismo
modo. Segn la teora motora, el verdadero objeto de la percepcin no es la seal acstica en s, sino los
movimientos articulatorios. Oyentes dispondran de un mdulo o decodificador especializado en reconstruir

6
los gestos motores a partir de la seal acstica. Reconstruccin de los gestos articulatorios. Los oyentes se
sirven de sus mecanismos de produccin para percibir el lenguaje. La capacidad humana para percibir los
sonidos del habla no puede ser explicada en trminos de un mecanismo general de audicin o de aprendizaje
perceptivo, decodificador especializado en lenguaje que es nico y propio de los seres humanos. Este
decodificador incorpora informacin completa sobre las caractersticas anatmicas y fisiolgicas del tracto
vocal. Evidencias innegable relacin que existe entre los procesos de produccin y percepcin del lenguaje.
Ryalls, extranjero mover sus labios mientras intenta comprender. Muchas personas con sordera profunda
pueden leer el habla a partir de los gestos visibles articulatorios de los dems. Efecto McGurk. Los oyentes
combinan informacin visual sobre la produccin del habla con informacin auditiva. Cara de una persona
pronunciando la silaba velar /ga/, altavoz se presenta la silaba labial /ba/, fonema con un punto de articulacin
intermedio entre ambos: el dental /da/. El cerebro activa zonas motoras del habla mientras percibe el lenguaje.
5.5. Capacidad de las ratas para discriminar lenguas

Ratas tienen la capacidad de discriminar lenguas, frases artificiales sintetizadas en japons y holands. Apretar una palanca cada
vez que una frase en japons y a no hacerlo cuando era en holands. Entrenado a la inversa. Segunda fase, expuestas a un conjunto
nuevo de frases que no haban odo previamente, generalizar su aprendizaje, si las frases se administraban en sentido inverso las
ratas no discriminaban correctamente entre japons y holands. nico hablante, no cuando intervenan hablantes distintos en una
misma lengua. Semejantes a los monos tamarinos

5.6. Percepcin de sonido de no-habla

Se ha observado percepcin categrica en estmulos de no-habla. Tonos puros, es de tipo continuo, pero, en determinadas
condiciones, puede ser categrica. Instituto Tecnolgico de Massachusetts, ciertas tareas perceptivas con tonos simples presentaban
fronteras semejantes a las del VOT de las oclusivas. Estmulos, dos tonos simultneos. Pisoni creo una serie de 11 pares tonales.
Someti primero a los participantes durante dos das a una fase de entrenamiento para que aprendieran a categorizar los dos estmulos
extremos de la serie. Se enfrentaron a la serie completa de los 11 estmulos en una tarea de identificacin y otra de discriminacin.
Discriminacin, paradigma ABX, presentacin sucesiva de tres estmulos, los dos primeros son distintos, y el tercero siempre es uno
de los dos anteriores; determinar cul de ellos. Identificacin haba sido ms de tipo categrico que contiua. Los datos no mostraron
una funcin continua, brusco incremento en torno a diferencias temporales. Coinciden con las fronteras que el parmetro VOT
presenta en muchas lenguas. 20 ms es la diferencia mnima necesaria para poder identificar el orden temporal de dos eventos:
estmulos con diferencias entre sus comienzos mayores a 20 ms son percibido como sucesivos, estmulos con asincronas inferiores
a ese lmite se perciben como simultneos. Limitacin del sistema auditivo. Miriam, Holt y McClelland, sonidos de no-habla,
percepcin depende de su naturaleza acstica. Se perciben de modo ms claramente categrico que cuando tienen una estructura
con frecuencias estables.

4.2 Teora realista directa.


Alternativa a la teora motora, teora realista directa. Carol Fower, el objeto de la percepcin es de tipo
articulatorio o motor, pero no supone que el oyente deba tener acceso a su sistema de produccin para
reconstruir los gestos fonticos. Niega la existencia de un mdulo especializado. Perspectiva ecolgica de la
teora de la percepcin directa desarrollada por el psiclogo James Gibson. Enfoque gibsoniano. Gibson
considera que la propia estructura del estmulo ya incorpora toda la informacin necesaria para percibir los
objetos y eventos del entorno. Perciben de forma directa todos los elementos de su medio ecolgico.
Percepcin, proceso directo. Los sistemas sensoriales ya estn, segn Gibson, perfectamente calibrados para
captar el mundo fsico en que se desenvuelven. Fowler entiende que la percepcin del lenguaje puede
caracterizarse en los mismos trminos que la percepcin visual, vision, la luz reflejada por las superficies,
estimulo cercano o proximal o estmulos distales. La seal acstica es un estmulo proximal que proporciona
informacin sobre los estmulos distales, o gestos articuladores que la han producido. Cuando un oyente
escucha el lenguaje capta de forma directa los movimientos articulatorios, del mismo modo en que percibe el
origen de otros sonidos de su entorno. Critica, contra la hiptesis de que los objetos propios de la percepcin
del lenguaje sean los gestos articulatorios. Procede principalmente de quienes defienden la teora auditiva
general. Contraponen ejemplos en los que existe percepcin sin conocimiento directo.
4.3 Teora auditiva general

7
Varios hallazgos pusieron en cuestin la teora motora de la percepcin del habla y la existencia de un
mecanismo especifico. Percepcin categrica por parte de animales no humanos, ciertos estmulos de no-
habla. No se presupone la existencia de mecanismos especficos o de un mdulo decodificador especial. Los
sonidos del lenguaje se perciben y dependen del sistema general de audicin y de los principios del aprendizaje
perceptivo La percepcin del lenguaje no est mediada ni se basa en la percepcin de gestos articuladores.
Capacidad general del oyente de hacer uso de mltiples seales acsticas imperfectas para categorizar
estmulos complejos. La constancia de los objetos en la visin es el resultad de combinar mltiples atributos
visuales, constancia perceptiva fontica, mltiples pistas acsticas. No requiere la recuperacin de gestos
articuladores. Kluender, Diehl y Killeen, pjaros, responder a estmulos naturales que comenzaban por el
fonema /d/ seguido de distintas vocales y no responder a otros, percibir la invarianza. Hiptesis de la
potenciacin auditiva, sistemas de sonidos de las distintas lenguas se han adaptado para convertirse en robustas
seales que explotan las caractersticas del sistema auditivo. Lenguas, inventario de fonemas optimiza la
distintividad fontica entre ellos.
5. Efecto del contexto en la percepcin del lenguaje
Fin ltimo de la percepcin del lenguaje oral es extraer significados del sonido, dos fuentes de informacin,
informacin acstica, abajo-arriba; bottom-up. Otra informacin fluye en sentid contrario y procede de los
niveles superiores de procesamiento. Arriba abajo o top-down. Modelos artificiales, simular razonablemente
bien los primeros, dificultades con los segundos.
5.1 Restauracin fonmica
Efecto del contexto sobre la percepcin, restauracin fonmica. Richard Warren, frases en las que se haba
sustituido un elemento fontico, por ejemplo el fonema /s/ de la palabra legislatura por un sonido no lingstico
de intensidad semejante, haban percibido todas las palabras intactas. Se mantena incluso al repetir la
grabacin y una vez que los oyentes eran informados. La informacin cognitiva procedente de procesos
superiores era capaz de suplir la informacin fsica. No ocurra cuando se trataba de estmulos que no eran
palabras. Cuando detectaban el ruido intruso no podan ubicar correctamente el lugar de la frase en que haba
sudo insertado. El fonema era reemplazado por un silencio, no se produca la restauracin. El proceso de
restauracin fonmica necesitara algn material de entrada. Warren y Warren, presentacin de frases, idnticas
excepto en la ltima palabra. La palabra eel tena el primer fonema remplazado por una tos, restauracin
fonemica dependiente del contexto, el fonema que era congruente con cada frase. Afirmaban que en cada caso
haban odo la palabra completa. Si los oyentes realmente perciben el fonema ausente o simplemente lo
adivinan Perceptivo o es posperceptivo. Efecto verdaderamente perceptivo. La influencia de las palabras en la
percepcin de los fonemas es perceptiva, la influencia de la frase es principalmente de tipo posperceptivo.
Escrito restauracin grafemica letras ilusorias, letras donde estas no existen. Prueba para estudiar la legibilidad
de las palaras y las listas se presentaron a cierta distancia para que seleccionaran as palabras que les parecan
ms legibles. La mitad de las palabras escogidas como ms legibles contenan caracteres extraos, los sujetos
no se han percatado. Sombreado (shadowing) de frases, Marslen-Wilsn. Sombrear una frase es seguirla como
una sombra, repetir sus palabras. Los oyentes pueden repetir las frases de forma ms rpida cuando estas estn
bien formadas desde el punto de vista sintctico y semntico. Influencia ejercida por informacin procedente
de los niveles superiores, arriba-abajo. Los oyentes pueden seguir las frases con latencias muy cortas, del orden
de 250ms. En los vocablos polisilabicos, son capaces de reconocer una palabra incluso antes de que sea
presentada.
5.2 Efectos arriba debajo de alto nivel.
Procesos de alto nivel ejercen su accin desde representaciones superiores. La palabra pincel se identifica
ms rpidamente si aparece en un texto sobre pintura, leemos mejor y ms deprisa un texto con estructura y
significado coherente. La naturaleza del estmulo, aprovechamos informacin de arriba-abajo, menos

8
informacin estimular de abajo-arriba. Cuanta ms informacin de contexto (arriba-abajo) tengamos, menos
informacin entrante necesitaremos del estmulo (abajo-arriba). Habla en situaciones naturales, apoyada por
los efectos del contexto. Palabras presentadas en un fondo de ruido se identifican mejor en el contexto de una
frase que cuando se presentan de forma aislada. Grabaron en cintas magnetofnicas conversaciones y
narraciones, cortaron algunos fragmentos. Solo la mitad de las palabras aisladas se reconocan correctamente,
en el contexto de la frase se identificaban prcticamente en su totalidad.
Su dificultad sensorial hace ms difcil aprovechar informacin no solo del estmulo hablado (abajo-arriba)
sino tambin informacin de tipo arriba abajo o del contexto. Vocabularios ms restringidos. Largo historial
dislxico.
Resumen:
Lenguaje oral o habla, patrn de energa variable, analizable mediante el estudio de su onda acstica y su
composicin espectrografica (espectrogramas). Patrn de energa ingresa en el sistema perceptivo humano y
es procesado, extraer los fonemas de una lengua como paso previo para construir una representacin del
significado. Percepcin del habla presenta unas caractersticas que la diferencian de la percepcin de otros
sonidos. Cuestin central, si esta peculiaridad obedece a un mecanismo perceptivo especfico, o se trata del
mismo mecanismo general de percepcin de los sonidos aplicado sobre una seal a la que estamos
sobreexpuestos a lo largo de la vida. Percepcin del habla, cuestiones especficas, ausencia de invarianza de
la seal y la percepcin categrica de ciertos fonemas consonnticos. Comparaciones con la percepcin del
habla en animales. Papel clave que desempean los formantes del habla. Intentos explicativos de los procesos
comprometidos han dado lugar a distintos modelos tericos sobre la percepcin del habla.

Das könnte Ihnen auch gefallen