Beruflich Dokumente
Kultur Dokumente
www.elsevier.es/otorrino
ARTÍCULO ORIGINAL
a
Escuela de Fonoaudiología, Universidad de Chile, Santiago, Chile
b
Escuela de Fonoaudiología, Universidad del Mar y Universidad de Valparaíso, Valparaíso, Chile
c
Escuela de Fonoaudiología, Universidad del Mar, Reñaca, Valparaíso, Chile
d
Departamento de Voz y Carrera de actuación teatral de la Universidad de Valparaíso, Valparaíso, Chile
e
Facultad de Medicina, Universidad de Chile, Santiago, Chile
0001-6519/$ – see front matter © 2012 Elsevier España, S.L. Todos los derechos reservados.
http://dx.doi.org/10.1016/j.otorri.2012.11.003
Document downloaded from http://www.elsevier.es, day 11/12/2018. This copy is for personal use. Any transmission of this document by any media or format is strictly prohibited.
Cambios acústicos de la voz como signos de fatiga vocal en locutores de radio: resultados preliminares 177
KEYWORDS Acoustic changes of the voice as signs of vocal fatigue in radio broadcasters:
Vocal fatigue; Preliminary findings
Broadcasters;
Acoustic analysis; Abstract
Vocal loading; Introduction and objectives: Vocal fatigue is one of the most common voice symptoms. It usua-
Cepstrum lly refers to the sensation of vocal tiredness after a long period of speaking or singing. The
purpose of this study was to compare the acoustic characteristics of the voice before and after
a long period of voice use in a group of radio broadcasters.
Methods: Eight radio broadcasters with normal voices were assessed. We used cepstrum, energy
ratio, noise to harmonic ratio and soft phonation index as acoustic variables to assess the
possible pre-post vocal loading changes objectively.
Results: There were no statistically significant pre-post differences in any of the acoustic para-
meters. Although cepstrum at high pitch did not show a significant difference, it obtained the
greatest difference among the acoustic variables.
Conclusions: The acoustic measurements used in the present study might not be sensitive
enough or appropriate for detecting vocal changes after a long period of voice use, whet-
her in reading (as reported in previous research) or speaking tasks. Moreover, a longer period
of vocal loading would eventually reveal more evident and consistent acoustic voice changes.
© 2012 Elsevier España, S.L. All rights reserved.
178 M. Guzmán et al
vocal, o la carencia de una correcta formación vocal35 . Male- --- Lectura de un texto fonéticamente balanceado de 104 pa-
brán y Saldívar reportaron que más de la mitad del grupo labras durante 1 min utilizando una intensidad media y
de locutores evaluados presentaba signos de fatiga vocal y cómoda para cada sujeto.
carencia de una adecuada técnica vocal36 .
El propósito de este estudio es comparar las caracte- Para el control de la frecuencia fundamental utilizada
rísticas acústicas vocales antes y después de un periodo durante la fonación sostenida de la vocal/a/ (3 tonos dife-
prolongado de uso de la voz en una población de locuto- rentes), uno de los autores igualó el tono medio hablado
res radiales. Dos de los marcadores acústicos utilizados en de la primera vocal/a/ de cada sujeto (tono cómodo) a un
el presente estudio nos han sido utilizados previamente. tono del teclado electrónico. Luego, a partir de este tono,
el experimentador presentó un sonido ubicado una octava
Método más aguda que el tono medio hablado y posteriormente un
sonido una tercera mayor más debajo de tono original. Se
Participantes solicitó a cada participante reproducir cada uno de estos
tonos presentados mediante vocal/a/. Una vez que el sujeto
La muestra estuvo compuesta por 8 locutores de radio con demostró la habilidad para realizar la tarea fonatoria en el
edades comprendidas entre 34 y 61 años, promedio de tono entregado por el examinador, se inicio la grabación.
44 años, portadores de voces perceptualmente normales. A pesar de que este fue el objetivo planteado para todos los
Dos de los sujetos incluidos en el estudio fueron de sexo sujetos evaluados, en ciertos casos la falta de oído musical
femenino y 6 de sexo masculino. Este grupo de participantes no permitió una coincidencia exacta de los tonos solicitados.
corresponde al total de locutores que trabajan en la esta-
ción de radio seleccionada para la recolección de datos en la
presente investigación. Ninguno de ellos tenía antecedentes
Análisis acústico
de tratamiento vocal previo a la realización de este estudio
y ninguno reportó algún grado de impedimento auditivo. Las El análisis acústico de todas las muestra de voz tomadas pre y
evaluaciones fueron llevadas a cabo con el entendimiento de poslocución incluyeron: cepstrum, relación ruido-armónico
todos los participantes y previa firma de un consentimiento (NHR), índice de fonación suave (SPI) y energy ratio (diferen-
informado. Es importante destacar que este grupo de par- cia entre el pico más alto entre 0-2.000 Hz y el pico más alto
ticipantes fue elegido considerando que las quejas vocales entre 2.000-4.000 Hz). Esta última medida se utilizó para
que presentaban estaban siempre relacionadas con signos de valorar los cambios de la pendiente espectral. Dos de estas
abuso y cansancio vocal después de la jornada de locución medidas (cepstrum y energy ratio) no han sido utilizadas
(1 h). previamente como posibles marcadores acústicos de fatiga
vocal.
Para el análisis cepstral, SPI y NHR se utilizó el software
Grabación Multi-Speech Main Program® , model 3700, v.3.2.0 (Kay Ele-
metrics, Lincoln Park, NJ, EE. UU.). El análisis de Cepstrum
Se grabó la voz de cada sujeto en forma previa a la sesión de fue realizado con una window sample de 1024 y una window
locución y otra posterior a esta. La grabación se realizó uti- type Hamming. Los valores de energy ratio fueron obteni-
lizando un micrófono de condensador marca AKG® modelo dos con el software Wavesurfer® v.1.8.5 (Jonas Beskow and
Perception 120. El micrófono fue puesto sobre un pedes- Kåre Sjölander, Suecia) mediante la ventana de análisis de
tal y situado a 10 cm de la boca de los sujetos. Los sujetos espectro promedio a largo plazo (LTAS).
permanecieron de pie durante la grabación. Como sistema
de preamplificación y digitalización se utilizó la interfaz de
sonido M-Audio® v.1.03. Las grabaciones se realizaron con Análisis estadístico
una frecuencia de muestreo de 44 KHz y 16 bit de cuanti-
zación dentro de un estudio de grabación sonoamortiguado. Los datos fueron analizados mediante el programa esta-
La captura y grabación de las señales de voz fueron realiza- dístico Stata® 12.1 (StataCorp. 2011, College Station, TX:
das con el programa Praat® (Boersma & Weenink, 2008)37 . StataCorp LP, EE. UU.). Los parámetros acústicos de la voz
Para el control del nivel de presión de sonido se utilizó un se expresan en media y desviación estándar. Para compa-
sonómetro 8810 CE-IEC 651 type ii. rar los valores pre y postratamiento utilizamos la prueba t
de Student para datos pareados. En toda dócima de hipó-
tesis se consideró un valor p < 0,05 como estadísticamente
Tareas fonatorias
significativo.
Las tareas fonatorias solicitadas a los participantes durante
el proceso de grabación fueron las siguientes: Resultados
--- Vocal/a/ en forma sostenida en un tono cómodo para cada Los resultados (promedio pre y poslocución, deviación están-
sujeto (rango medio). dar y valor de p) para el análisis acústico de los parámetros
--- Vocal/a/ en forma sostenida utilizando una F0 una octava de cepstrum en distintas frecuencias, LTAS y medidas de
más arriba del tono cómodo producido con anterioridad. ruido se presentan en la tabla 1. Ninguno de los parámetros
--- Vocal/a/ en forma sostenida utilizando una F0 una ter- evaluados mostró una diferencia estadísticamente signifi-
cera mayor más abajo del tono cómodo producido con cativa entre las muestras pre y poslocución. Sin embargo,
anterioridad. y a pesar de no ser significativo, el parámetro que obtuvo
Document downloaded from http://www.elsevier.es, day 11/12/2018. This copy is for personal use. Any transmission of this document by any media or format is strictly prohibited.
Cambios acústicos de la voz como signos de fatiga vocal en locutores de radio: resultados preliminares 179
Tabla 1 Promedio pre y poslocución, desviación estándar y valor p para el análisis acústico de los parámetros de cepstrum en
distintas frecuencias, LTAS y medidas de ruido
Parámetro Pre Post Diferencia Valor de p
Cepstrum (aguda) 36,32 ± 11,93 28,54 ± 4,70 7,77 ± 9,68 0,0574
Cepstrum (media) 30,53 ± 13,85 32,41 ± 12,79 1,88 ± 12,41 0,6807
Cepstrum (grave) 19,05 ± 7,24 21,05 ± 8,28 2,007 ± 8,00 0,5009
0-2/2-4 Ratio 22,28 ± 4,86 23,77 ± 4,56 1,48 ± 5,86 0,4962
NHR 0,22 ± 0,21 0,13 ± 0,02 0,09 ± 0,22 0,2856
SPI 8,91 ± 5,49 10,67 ± 5,23 1,76 ± 3,34 0,1787
LTAS: espectro promedio a largo plazo; NHR: relación ruido-armónico; SPI: índice de fonación suave.
10
clínicos este descenso en el valor del cepstrum implica una
voz más inestable, con menor energía y una señal menos
0 periódica. El cepstrum es definido como una doble trans-
formada rápida de Fourier (FFT)38,39 . Un pico cepstral alto
−10 (valor alto) es obtenido en voces caracterizadas por una
estructura armónica bien definida. Por el contrario, una voz
soplada o ronca tiene una estructura armónica débilmente
−20
definida y, por lo tanto, el pico cepstral es bajo (bajo valor).
El cepstrum fue elegido como una de las variables para
1 2 3 4 5 6 7 8 el presente estudio ya que no ha sido previamente utili-
Sujeto zado como un posible marcador acústico de fatiga vocal.
Cepstrum (media) Cepstrum (aguda) Adicionalmente, investigaciones previas han reportado que
Cepstrum (grave)
el valor del cepstrum es el mejor predictor de disfonía en
comparación con los índices de perturbación e índice de
Figura 1 Efecto del periodo de locución en los valores de
ruido glótico40---43 . Además, el pico del cepstrum ha mostrado
cepstrum en las diferentes F0 utilizadas por cada sujeto del
una alta correlación con el grado de severidad de la altera-
estudio en forma individual.
ción vocal44---48 . El cepstrum como indicador de fatiga vocal
o deterioro de la cualidad de la voz, se reflejaría en una
mayor diferencia pre y poslocución fue el cepstrum durante disminución de su valor. En el presente estudio la diferen-
la fonación de F0 aguda (7,77 ± 9,68) (p = 0,0574). La figura 1 cia entre pre y post fue clínicamente notoria solo para las
muestra el efecto del periodo de carga vocal en los valo- vocales sostenidas en F0 alta (7,77 ± 9,68). Las diferencias
res de cepstrum en las diferentes F0 utilizadas por cada para F0 bajas y medias fueron de 2,007 ± 8,00 y 1,88 ± 12,41
sujeto del estudio en forma individual. Se observa en dicha respectivamente.
figura que el valor de cepstrum que obtuvo un descenso de La diferencia espectral 0-4/2-4 KHz (energy ratio) revela
forma más sistemática fue en las muestras producidas con F0 un incremento desde 22,28 dB (prelocución) a 23,77 dB (pos-
altas. Siete de los 8 participantes descendieron el valor del locución). El propósito de esta medida espectral es calcular
cepstrum al comparar las emisiones pre y poslocución. Las la diferencia entre la energía del pico espectral más alto
figuras 2 y 3 muestran a modo de ejemplo los picos cepstrales en el rango de 0-2 KHz y la energía del pico más alto entre
pre y postratamiento respectivamente obtenidos durante la 2-4 KHz. Este parámetro ha sido ampliamente estudiado en
vocal/a/ aguda en forma sostenida para el sujeto número 3. los cantantes profesionales como un marcador acústico de
La figura 4 muestra el efecto del tratamiento en energy ratio la calidad vocal, es decir, cuan resonante es percibida de la
(0-2/2-4 ratio), HNR y SPI para cada sujeto en forma indivi- voz. Esta variable no ha sido utilizada en estudios previos
dual. El SPI es la variable que muestra mayor sistematicidad como posible marcador acústico de fatiga vocal.
en la diferencia entre pre y poslocución. Específicamente, 5 Aunque este cambio (incremento de esta diferencia
de los 8 sujetos obtuvieron un incremento del valor de SPI. espectral) no alcanzó significación estadística, sugiere desde
Adicionalmente, es importante destacar que a pesar de no el punto de vista clínico, un cambio en la distribución de la
haber diferencia significativa, el SPI fue el segundo pará- energía espectral después de un periodo largo de uso vocal.
metro con menor valor de p en el análisis de significación Los mayores valores de esta variable después del periodo
estadística (p = 0,1787). de uso vocal representan una disminución de la energía en
los armónicos altos del espectro. En otros términos, hay
Discusión mayor diferencia entre la energía de los armónicos bajos
y la energía de los armónicos altos (mayor pendiente del
Los resultados del presente estudio revelan que ninguno de espectro).
los parámetros acústicos mostró una diferencia estadística- Relacionado con este cambio espectral, también es inte-
mente significativa entre los valores pre y poslocución. A resante observar que el SPI experimentó un incremento
Document downloaded from http://www.elsevier.es, day 11/12/2018. This copy is for personal use. Any transmission of this document by any media or format is strictly prohibited.
180 M. Guzmán et al
Figura 2 Pico cepstral preperiodo de locución obtenidos durante la vocal/a/ aguda en forma sostenida.
después del periodo de carga vocal (desde 8,91 a 10,67). valores de SPI y energy ratio después del uso prolongado
Este parámetro es también considerado como una medida de la voz, puede estar determinada por las características
de la pendiente espectral. El valor de SPI es obtenido desde vibratorias de los pliegues vocales. Existe una relación siste-
el cociente entre la energía armónica espectral de baja mática entre la velocidad de cierre de los pliegues vocales
frecuencia (70-1.600 Hz) y la energía armónica de alta fre- y la pendiente espectral: mientras más rápido es el cierre
cuencia (1.600-4.500 Hz). Por lo tanto, un aumento del valor de los pliegues vocales (más rápido retorno de los pliegues
de SPI significa desde el punto de vista clínico que la ener- a la línea media), menor es la pendiente espectral (mayor
gía de los armónicos altos esta disminuida. Es decir, un valor energía en los armónicos altos)49 . Esto es ejemplificado en
alto de SPI es obtenido cuando existe una mayor pendiente las figuras 5 y 6, donde se muestra la pendiente espectral
espectral. En nuestro estudio se observa una relación inte- del sujeto número uno para la muestra pre y poslocución
resante entre SPI y energy ratio, ambos experimentaron un respectivamente. Este sujeto en particular experimentó un
aumento después del periodo de carga vocal, siendo ambos aumento de la pendiente espectral (menos energía armónica
medidas objetivas de pendiente del espectro. en la zona espectral alta).
La posible explicación fisiológica de esta disminución Este cambio en la declinación del espectro no está sola-
de la pendiente espectral reflejada en el aumento de los mente asociado a la velocidad de cierre de los pliegues
Figura 3 Pico cepstral posperiodo de locución obtenidos durante la vocal/a/ aguda en forma sostenida.
Document downloaded from http://www.elsevier.es, day 11/12/2018. This copy is for personal use. Any transmission of this document by any media or format is strictly prohibited.
Cambios acústicos de la voz como signos de fatiga vocal en locutores de radio: resultados preliminares 181
10
y recordando que en nuestro estudio la pendiente espec-
tral mostró una disminución, es posible especular que tal
5 vez, posterior al periodo de uso vocal experimentado por los
locutores, la vibración de los pliegues vocales cambió hacia
una diminución del cociente de contacto y disminución en
0
la velocidad de cierre.
Desde el punto de vista clínico es interesante observar
−5 que el promedio grupal de NHR hubo un descenso en lugar de
lo que posiblemente se esperaría, un incremento. Además,
1 2 3 4 5 6 7 8
individualmente 5 de los 8 sujetos experimentaron un menor
Sujeto
NHR después de la locución. Un aumento en NHR ocurriría si
0-2/2-4 Ratio HNR existiese un incremento de la energía de ruido glótico y/o
SPI
una disminución de la energía armónica. Ambos casos esta-
Figura 4 Efecto del periodo de locución en energy ratio (0- rían relacionados con una disminución en el cierre cordal
2/2-4 ratio), HNR y SPI para cada sujeto en forma individual. producto de la fatiga vocal, tal como ha sido aportado en
dB
-10
-20
df: 1611
-30
db: 20.9
-40
-50
-60
-70
-80
-90
-100
0.2 0.4 0.6 0.8 1,0 1,2 1.4 1,6 1,8 2,0 2,2 2,4 2,6 2,8 3,0 3,2 3,4 3,6 3,8 4,0 4,2 4,4 4,6 4,8 5,0 5,2 5,4 kHz
Figura 5 Pendiente espectral para la muestra prelocución obtenida de la lectura de un texto fonéticamente balanceado.
dB
-10
-20
-40
db: 26,7
-50
-60
-70
-80
-90
-100
0.2 0.4 0.6 0.8 1,0 1,2 1.4 1,6 1,8 2,0 2,2 2,4 2,6 2,8 3,0 3,2 3,4 3,6 3,8 4,0 4,2 4,4 4,6 4,8 5,0 5,2 5,4 kHz
Figura 6 Pendiente espectral para la muestra poslocución obtenida de la lectura de un texto fonéticamente balanceado.
Document downloaded from http://www.elsevier.es, day 11/12/2018. This copy is for personal use. Any transmission of this document by any media or format is strictly prohibited.
182 M. Guzmán et al
Cambios acústicos de la voz como signos de fatiga vocal en locutores de radio: resultados preliminares 183
23. Netsell R, Lotz W, Shaughnessy AL. Laryngeal aerodynamics 38. Hillenbrand J, Cleveland RA, Erickson RL. Acoustic correlates of
associated with selected voice disorders. Ant J Otolaringol. breathy vocal quality. J Speech Hear Res. 1994;37:769---78.
1984;5:397---403. 39. Hillenbrand J, Houde RA. Acoustic correlates of breathy vocal
24. Titze IR. Principles of voice production. Prentice Hall: Engle- quality. J Speech Hear Res. 1996;39:311---21.
wood Cliffs, NJ; 1994. p. 67---81. 40. Heman-Ackah YD, Heuer RJ, Michael DD. Cepstral peak promi-
25. Titze IR. The physics of small amplitude oscillation of the vocal nence: a more reliable measure of dysphonia. Ann Otol Rhinol
folds. J Acoust Soc Am. 1988;83:1536---52. Laryngol. 2003;112:324---33.
26. Solomon NP, diMattia MS. Effects of a vocally fatiguing task and 41. Heman-Ackah YD, Michael DD, Goding Jr GS. The relationship
systemic hydration on phonation threshold pressure. J Voice. between cepstral peak prominence and selected parameters of
2000;14:341---62. dysphonia. J Voice. 2002;16:20---7.
27. Finkelor BK, Titze IR, Durham PL. The effect of viscosity chan- 42. Heman-Ackah YD. Reliability of calculating the cepstral peak
ges in the vocal folds on the range of oscillation. J Voice. without linear regression analysis. J Voice. 2004;18:203---8.
1988;1:320---5. 43. Zieger K, Schneider C, Gerull G, Mrowinski D. Cepstrum analysis
28. Jiang J, Ng J, Hanson D. The effects of rehydration on phonation in voice disorders. Folia Phoniatr Logop. 1995;47:210---7.
in excised canine larynges. J Voice. 1999;13:51---9. 44. Eadie TL, Baylor CR. The effect of perceptual training on inex-
29. Verdolini K, Titze IR, Fennell A. Dependence of phona- perienced listeners’ judgments of dysphonic voice. J Voice.
tory effort on hydration level. J Speech Hear Res. 1994;37: 2006;20:527---44.
1001---7. 45. Awan SN, Roy N. Toward the development of an objective index
30. Verdolini-Marston K, Titze IR, Druker DG. Changes in phona- of dysphonia severity: a four-factor acoustic model. Clin Lin-
tion threshold pressure with induced conditions of hydration. guist Phon. 2006;20:35---49.
J Voice. 1990;4:142---51. 46. Radish Kumar B, Bhat JS, Prasad N. Cepstral analysis of voice in
31. Morrow SL, Connor NP. Voice amplification as a means of persons with vocal nodules. J Voice. 2010;24:651---3.
reducing vocal load for elementary music teachers. J Voice. 47. Balasubramanium RK, Bhat JS, Fahim 3rd S, Raju 3rd R. Cepstral
2011;25:441---6. analysis of voice in unilateral adductor vocal fold palsy. J Voice.
32. Rantala L, Vilkman E. Relationship between subjective voice 2011;25:326---9.
complaints and acoustic parameters in female teachers’ voices. 48. Lowell SY, Colton RH, Kelley RT, Hahn YC. Spectral- and
J Voice. 1999;13:484---95. cepstral-based measures during continuous speech: capacity to
33. Titze IR, Lemke J, Montequin D. Populations in the U.S. work- distinguish dysphonia and consistency within a speaker. J Voice.
force who rely on voice as a primary tool of trade: a preliminary 2011;25:223---32.
report. J Voice. 1997;11:254---9. 49. Hixon T, Weismer G, Hoit J. Preclinical Speech Science. San
34. Roy N, Merrill RM, Thibeault S, Parsa RA, Gray SD, Smith EM. Diego: Plural Publishing; 2008. p. 78---80.
Prevalence of voice disorders in teachers and the general popu- 50. Titze IR. Interpretation of the electroglottographic signal.
lation. J Speech Lang Hear Res. 2004;47:281---93. J Voice. 1990;4:1---9.
35. Landazuri E. Prevención vocal: una responsabilidad fonoau- 51. Neils LR, Yairi E. Effects of speaking in noise on vocal fatigue
diológica en los profesionales de la voz; aportes de una and vocal recovery. Folia Phoniatr. 1987;39:104---12.
investigación en locutores de Bogotá. Umbral científico. 52. Niebudek-Bogusz E, Kotylo P, Sliwinska-Kowalska M. Evaluation
2008;12:33---51. of voice acoustic parameters related to the vocal-loading test
36. Malebran C, Saldívar. Elaboración del perfil vocal para un grupo in professionally active teachers with dysphonia. Int J Occup
de locutores radiales chilenos. Primer Congreso Iberoamericano Med Environ Health. 2007;20:25---30.
de Voz Cantada y Hablada. 2010. 53. Laukkanen AM, Jarvinen K, Artkoski M, Waaramaa-Mäki-
37. Boersma P, Weenink D. Praat Manual: doing phonetics by Kulmala T, Kankare E, Sippola S, et al. Changes in voice and
computer (v.5.0.23) [computer program]. Disponible en: subjective sensations during a 45-min vocal loading test in
http://www.praat.org/ [consultado 12 May 2012]. Lastretrie- female subjects with vocal training. Folia Phoniatr Logop.
ved September 3, 2008. 2004;56:335---46.