Sie sind auf Seite 1von 6

XIII Congresso Brasileiro em Informtica em Sade CBIS 2012

COMPARAO ENTRE MEDIDAS DE ENTROPIA E COMPLEXIDADE


APLICADAS EM SINAIS DE VOZ SIMULADOS
Helder Luiz Schmitt1 e Paulo Rogrio Scalassara2
1
Graduando em Engenharia Eltrica, Universidade Tecnolgica Federal do Paran (UTFPR),
Cornlio Procpio, Brasil
2
Docente do Departamento de Engenharia Eltrica, Universidade Tecnolgica Federal do Paran
(UTFPR), Cornlio Procpio, Brasil

Resumo: As anlises acsticas de sinais de voz auxiliam profissionais da sade na realizao de diagnsticos
no invasivos e eliminam a dependncia da experincia do profissional em suas anlises percepto-auditivas.
Neste artigo, apresenta-se um simulador de sinais de voz, por meio do qual possvel controlar os principais
parmetros acsticos dos sinais, como o jitter, shimmer e o nvel de rudo. Em seguida, so calculadas medidas
de entropia relativa e de complexidade de sinais reconstrudos a partir de coeficientes da transformada wavelet,
para sinais simulados e para dois sinais reais. Com os resultados obtidos apresentados, pode-se sugerir o uso
desse simulador e dessas medidas para auxiliar o diagnstico e validar tcnicas de discriminao de sinais de voz
saudveis e com patologias na laringe.

Palavras-chave: Voz, Distrbios da Voz, Anlise de Wavelets, Entropia.

Abstract: The acoustical analysis of voice signals aids voice therapists in conducting non-invasive diagnosis and
decrease the dependence of professional experience in their perceptual-auditory analysis. This paper presents
the application of a voice signal simulator, that provides control to the main acoustic parameters of the signals,
such as jitter, shimmer and noise level. We also obtain measures of relative entropy and complexity of
reconstructed signals from the wavelet coefficients of simulated signals and two real voice signals. Based on the
obtained result, we suggest the use of this simulator and these measures for diagnosis assistance and validation
of the techniques for discrimination of healthy and pathological voice signals.

Keywords: Voice, Voice Disorders, Wavelet Analysis, Entropy.

Introduo

O sistema de produo de voz responsvel pela principal ferramenta de comunicao do


ser humano. A voz resultado de uma interao entre diversos sistemas fisiolgicos, entre
eles o sistema respiratrio, o sistema muscular, o sistema fonatrio e diversos rgos que
compem o trato vocal, sendo eles: a lngua, os lbios e as pregas vocais, sendo esse ltimo o
responsvel pelo incio da gerao dos sinais1.
Durante o processo de produo de voz, as caractersticas acsticas dos sinais gerados nas
pregas vocais sofrem interferncias dos rgos presentes no trato vocal, como alterao da
amplitude, da frequncia fundamental e, at mesmo, do nvel de rudo. A presena de
patologias na laringe provoca ainda mais distrbios nesses sinais, pois as patologias afetam
diretamente os rgos presentes do trato vocal.
Entre os diagnsticos mais comuns realizados pelos especialistas e fonoaudilogos,
destacam-se anlises percepto-auditivas, processos dependentes da experincia do profissional,
e exames de laringoscopia, considerada uma tcnica invasiva e de alto custo. Com o uso do
processamento digital de sinais, possvel realizar anlises dos sinais de voz, avaliando a
presena de distrbios que possam ser indcios da presena de patologias na laringe.
Alm disso, medidas da teoria da informao podem ser utilizadas para anlises de sinais
de voz, com o objetivo de diferenciar sinais saudveis dos sinais patolgicos. A perda da
riqueza dos sinais e o aumento da incerteza sobre o sistema so algumas das consequncias

1
XIII Congresso Brasileiro em Informtica em Sade CBIS 2012

causada pela presena de patologias na laringe2. Sendo assim, medidas de incerteza, como a
entropia e entropia relativa, podem ser utilizadas para a diferenciao dos sinais.
Diversos autores tm utilizado medidas de entropia para a discriminao de sinais de voz,
em um trabalho, foi utilizada a entropia relativa3 para avaliar a previsibilidade dos sinais, e em
outro, foi realizada uma anlise no-linear4 utilizando a entropia aproximada para quantificar
a complexidade e a regularidade dos sinais.
A complexidade dos sinais pode ser avaliada por meios de tcnicas de anlise no-linear4,
aonde os sinais de voz so analisados com medidas de dimenso fractal e a complexidade de
Lempel-Ziv, que permite avaliar o grau de periodicidade dos sinais.
O objetivo desse trabalho apresentar o simulador de sinais de voz como uma ferramenta
til para a simulao de distrbios que so encontrados nos sinais patolgicos, permitindo
assim, avaliar a eficincia de tcnicas utilizadas para a diferenciao de sinais saudveis e
patolgicos. Apresentam-se exemplos com medidas de entropia relativa e de complexidade e,
por fim, analisam-se dois sinais reais, sendo um sinal saudvel, e o outro com edema de uma
pessoa com edema de Reinke.

Mtodos

A anlise acstica no domnio do tempo uma tcnica no-invasiva que pode ser utilizada
pelos profissionais da sade, nessas anlises, so necessrios apenas equipamentos de baixo
custo como microfones e computadores. Os principais parmetros acsticos analisados so as
variaes da frequncia fundamental dos sinais (Jitter), variaes de amplitude (Shimmer) e
medidas do nvel de rudo5.
O simulador de sinais utilizado nesse artigo foi inicialmente apresentado em2, com o
objetivo de localizar eventuais problemas durante as anlises de sinais propostas, auxiliando
tambm nos testes que foram realizados.
Nesse simulador, os sinais de voz so gerados a partir de uma amostra de um ciclo de voz
feminina normalizada da vogal \a\ sustentada. Esse trecho de sinal foi retirado do banco de
dados do Laboratrio de Processamento Digital de Sinais (LPS), da Escola de Engenharia de
So Carlos (EESC) da Universidade de So Paulo, e foi diagnosticado por avaliaes
percepto-auditivas por profissionais especializados como sendo um sinal com caractersticas
saudveis. A Figura 1 apresenta esse trecho de sinal. Os sinais de teste tambm pertence ao
LPS, tendo sido classificados por profissionais especializados, o primeiro como saudvel e o
segundo como um sinal com a patologia de edema de Reinke. Esses os sinais foram coletados
com uma frequncia de amostragem igual a 22.050 Hz, em um nico canal, diretamente no
computador, em um ambiente acusticamente preparado usando 16 bits de quantizao de
amplitude.
1
Amplitude Normalizada

0.5

-0.5

-1
0 0.5 1 1.5 2 2.5 3 3.5 4
Tempo [ms]

Figura 1: Trecho do sinal saudvel de voz feminina da vogal \a\ sustentada.


2
XIII Congresso Brasileiro em Informtica em Sade CBIS 2012

As variaes da frequncia fundamental dos sinais so um dos principais sintomas


causados por patologias na laringe. Em7, foi utilizado um procedimento de filtragem inversa
para extrair diversas caractersticas acsticas de sinais com diferentes patologias. Foi
verificado que a melhor medida para discriminar sinais com patologias foi o jitter.
Em outro trabalho8, os valores de jitter de sinais reconstrudos a partir da transformada
wavelet, foram aplicados em um classificador SVM para discriminao de sinais saudveis,
com edema de Reinke e ndulo nas pregas vocais, obtendo resultados satisfatrios na
classificao de sinais saudveis e patolgicos.
Sendo assim, o jitter dos sinais se apresenta como um parmetro importante a ser analisado,
e com o uso do simulador possvel realizar ensaios variando esse parmetro, permitindo
analisar a influncia causada nas medidas de entropia relativa e de complexidade.

Decomposio por transformada wavelet

A utilizao da decomposio pela transformada wavelet (DWT) para a anlise de sinais de


voz tem apresentado bons resultados nos ltimos anos9. A maior vantagem da DWT a
possibilidade de realizar anlises tempo-frequncia dos sinais em diferentes resolues,
diferentemente da Transformada de Fourier de Tempo Curto (STFT), em que a resoluo
fixa.
O resultado da aplicao da DWT, uma representao do sinal como uma combinao de
verses escalonadas e deslocadas de uma nica funo-me, chamada wavelet. Em sua verso
discreta, os coeficientes da transformada so obtidos por um processo de filtragem digital com
filtros passa-baixa e passa-alta, seguido de uma decimao por um fator dois, obtendo os
coeficientes de aproximao e de detalhe, respectivamente10.
Para as anlises atravs das medidas de entropia relativa e de complexidade, foi utilizada a
DWT para criar estimativas do sinal original, partindo do primeiro nvel at o quinto, o sinal
foi divido em seis componentes de frequncia distintos, assim como utilizado em3. Para cada
uma dessas componentes, foi avaliado medidas de entropia relativa entre o sinal original e o
erro de estimativa, e a complexidade dos sinais reconstrudos, considerando apenas uma
componente de cada vez.

Entropia Relativa

A medida de entropia relativa pode ser entendida como uma distncia estatstica entre duas
distribuies de probabilidade definidas sobre um mesmo alfabeto, tambm conhecida como
Distncia de Kullback-Leibler8, calculada pela Equao (1).
N
p
Dp||q pi .log 2 i (1)
i 1 qi
em que pi e qi so duas funes de densidade de probabilidade (PDFs), e N o nmero de
pontos das PDFs.
A entropia relativa pode ser estimada de diversas maneiras, nesse artigo foi, estimada a
entropia relativa de forma no-paramtrica baseada em histogramas, como descrito em2.
Calculam-se medidas de entropia relativa entre os sinais simulados e os erros de estimativa
desses sinais obtidos pelas componentes da DWT. Para esse clculo, os sinais so
decompostos at o quinto nvel, utilizando a funo wavelet-me da famlia Daubechies, com
comprimento do filtro igual a 20.

3
XIII Congresso Brasileiro em Informtica em Sade CBIS 2012

Complexidade de Lempel-Ziv

A medida de complexidade de Lempel-Ziv utilizada para avaliar o grau de periodicidade


de uma sequncia finita de dados e est relacionada ao nmero de etapas em que possvel
generalizar uma dada sequncia.
Para avaliar a complexidade de um sinal, em12 definido um algoritmo prtico, onde numa
primeira etapa, o sinal a ser analisado transformado em um conjunto de elementos
representados por dois smbolos. Na segunda etapa do clculo, feita uma busca pelo nmero
de subsequncias presentes no sinal transformado c(n), o qual utilizado para o clculo da
complexidade, Equao (2), sendo n o tamanho do sinal. Para eliminar a influncia do
tamanho do sinal, utilizado o clculo da complexidade normalizada, como descrito em12.

c(n).log 2 (n)
0 C (n) 1 (2)
n
Sinais Simulados

Para as anlises realizadas nesse artigo, foram criados dois grupos de sinais, ajustando-se
em relao amplitude do sinal para o primeiro grupo uma pequena faixa de variao dos
parmetros, nvel de rudo: de 1% a 8%, shimmer: de 0,5% a 4% e jitter: 0,5% a 2%, que so
valores caractersticos para sinais saudveis. No segundo grupo, foi realizado um aumento
em todos os parmetros, caracterizando sinais patolgicos2, sendo rudo entre 6% a 20%,
shimmer entre 0.4% a 8% e jitter entre 2% a 6%.

Resultados

No primeiro teste, foram avaliadas as variaes das medidas de complexidade e de entropia


relativa entre os sinais simulados utilizando os componentes de aproximao do quinto nvel,
e de detalhe do quinto ao primeiro nvel. A Figura 2 apresenta os resultados para o primeiro
teste.
Nas Figuras 2 e 3, os componentes de 1 a 6 se referem aos sinais reconstrudos utilizando
primeiramente os coeficientes de aproximao do quinto nvel da transformada (A5) e, em
seguida, os coeficientes de detalhe do nvel 5 ao nvel 1 (D5, D4, D3, D2 e D1).

1.4 0.9
Grupo 1 Grupo 1
0.8
1.2 Grupo 2 Grupo 2
0.7
1
Entropia Relativa

0.6
Complexidade

0.8 0.5

0.6 0.4

0.3
0.4
0.2
0.2
0.1

0 0
0 1 2 3 4 5 6 7 0 1 2 3 4 5 6 7
Componentes Componentes
(a) (b)
Figura 2: Primeiro teste: valores mdios e desvios padro para (a) entropia relativa entre o
sinal simulado e o erro de estimativa e (b) complexidade normalizada dos
sinais reconstrudos.
4
XIII Congresso Brasileiro em Informtica em Sade CBIS 2012

No segundo teste, utilizaram-se as mesmas rotinas, porm para avaliar as medidas para
dois sinais reais, sendo o Grupo 1 e 2, o sinal saudvel e o patolgico respectivamente. A
Figura 3 apresenta os resultados para esse teste.
0.9 0.9
Grupo 1 Grupo 1
0.8 0.8
Grupo 2 Grupo 2
0.7 0.7
Entropia Relativa

0.6 0.6

Complexidade
0.5 0.5

0.4 0.4

0.3 0.3

0.2 0.2

0.1 0.1

0 0
0 1 2 3 4 5 6 7 0 1 2 3 4 5 6 7
Componentes Componentes
(a) (b)
Figura 3: Segundo teste utilizando sinais reais: valores mdios e desvios padro para (a)
entropia relativa entre o sinal simulado e o erro de estimativa e (b) complexidade dos
sinais reconstrudos.

Discusses e Concluses

Analisando a Figura 2(a), possvel notar que as maiores variaes ocorreram nos trs
primeiros componentes (A5, D5 e D4), os quais abrangem faixas das baixas frequncias. Para
o Grupo 2, que possui maior variao dos parmetros, os erros de estimativa utilizando os
componentes da DWT, resultaram em PDFs mais prximas dos sinais originais, isso leva a
entender que os sinais de erro foram mais semelhantes ao sinais originais, ou seja, os modelos
gerados a partir da DWT foram distintos dos sinais originais. E para o Grupo 1, os valores de
entropia relativa foram mais elevados, pois as PDFs dos componentes, foram mais distintas
do que as PDFs dos sinais originais.
As medidas de complexidade normalizada, apresentadas na Figura 2(b), que variam de
zero para sinais mais peridicos, at a unidade, para sinais totalmente aleatrios, apresentaram
pequenas variaes entre os dois grupos. Porm, como era esperado, o Grupo 2, com maiores
valores da variaes da frequncia fundamental (jitter) e com maior nvel de rudo, apresentou
maior complexidade que os sinais do Grupo 1, permitindo uma discriminao desses sinais ao
utilizar as componentes 3 e 4 (D4 e D3).
Para os testes com sinais reais, os resultados de entropia relativa foram semelhantes ao
teste com sinais simulados, apresentando as maiores variaes nos trs primeiros
componentes, (A5, D5 e D4), porm para as medidas de complexidade, os resultados
apresentaram valores muito prximos para os dois sinais.
Com base nos resultados, foi possvel observar que as medidas de entropia relativa, podem
ser utilizadas para auxiliar tcnicas de diferenciao de sinais que apresentem variaes em
seus principais parmetros acsticos, como jitter, shimmer e nvel de rudo. Assim como
apresentado em2.
E as medidas de complexidade se mostraram sensveis s pequenas variaes na frequncia
fundamental dos sinais simulados, mostrando ser uma medida promissora, pois assim como
descrito em6,7 e 2 e em2, a variaco de jitter um dos parmetros mais utilizados em anlises
acsticas para diferenciao dos sinais, podendo ainda ser ressaltado que o nvel de rudo dos
sinais influencia nessa medida. Para os sinais reais, os testes de complexidade no

5
XIII Congresso Brasileiro em Informtica em Sade CBIS 2012

apresentaram grandes variaes, porm para futuros estudos, sugere-se a realizao de outras
anlises, como por exemplo a utilizao da transformada wavelet-packet, que permite anlises
mais especficas.
Pode-se concluir nesse artigo, que o simulador de voz1, uma promissora para a utilizao
como meio de validao de tcnicas de processamento de sinais aplicadas na discrimao de
sinais saudveis e patolgicos, auxiliando os profissionais da sade especializados nos
diagnsticos de pacientes com patologias da laringe. A capacidade de controlar as variaes
dos principais parmetros acsticos dos sinais de voz permite simular sinais com a presena
de distrbios semelhantes aos encontrados em sinais patolgicos reais.

Agradecimentos

Os autores agradecem Conselho Nacional de Desenvolvimento Cientfico e Tecnolgico


(CNPq) pelo auxlio financeiro, e a Universidade Tecnolgica Federal do Paran.

Referncias

[1] Behlau M. Voz O Livro do Especialista, v. 1. So Paulo: Revinter; 2001.


[2] Scalassara P R. Utilizao de Medidas de Previsibilidade em Sinais de Voz para
Discriminao de Patologias de Laringe [tese]. So Paulo: Universidade de So Paulo
Escola de Engenharia de So Carlos; 2009.
[3] Scalassara PR, Maciel CD, Pereira JC. Predictability Analysis of Voice Signals. IEEE
Engineering in Medicine and Biology Magazine. 2009; Set-Out: 30-34.
[4] Aghazadeh, B.S, Khadivi, H, Nikkhah-Bahrami, M.. (2007) Nonlinear Analysis and
Classification of Vocal Disorders, In: Proceedings of the 28th Annual International
Conference of the IEEE EMBS, Lyon, 23-26 ago.
[5] Vaziri G, Almasganj F, Behroozmand R. Pathological assessment of patients speech
signals using nonlinear dynamical analysis. Comp. in Biology and Med. 2010; 40: 54-63.
[6] Davis S B. Acoustic Characteristics of Normal and Pathological Voices. In Lass, N. J.
(Ed.), Speech and language: advances in basic research and practice, 271-314. New
York: Academic Publishers, 1979.
[7] Rosa MO, Pereira JC, Grellet M. Adaptive Estimation of Residue Signal for Voice
Pathology Diagnosis. IEEE Trans Biomed Eng 2000, 96-105.
[8] Fonseca E, Pereira JC. Normal Versus Pathological Voice Signals. IEEE Engineering in
Medicine and Biology Magazine. 2009; Set-Out: 44-48.
[9] Guido R.C, Pereira J.C, Fonseca E.S, Sanchez F.L, Vieira L S. Trying diferent wavelets
on the search for voice disorders sorting, In: Proceedings of the 37th Southeastern
Symposium on System Theory (SSST05), 495-499.
[10] Diniz PSR, Silva EAB Netto SL. Digital Signal Processing: System analysis and design.
Cambridge: Cambridge Univ. Press; 2010.
[11] Cover T, Thomas J. Elements of information theory. New York: J.Wiley and Sons, 2006.
[12] Kaspar F, Schuster H G. Easily calculable measure for the complexity of spatiotemporal
patterns. Physical Review A, 1987; 36(2): 842-848.

Contato
Helder Luiz Schmitt
Centro Integrado de Pesquisa em Controle Avenida Alberto Carazzai, 1640.
Automao CIPECA Universidade Tecno- Cornlio Procpio PR. CEP: 86300-000
lgica Federal do Paran UTFPR. E-mail:helderschmitt@gmail.com