Sie sind auf Seite 1von 34

1

MIT
Teoria Acstica da Produo de Voz 6.345 Sistema de Reconhecimento de Voz
Teoria Acstica da Produo da Voz
Resumo
Fontes do som
Funo de transferncia do trato vocal
Equaes de onda
Propagao do som em um tubo acstico uniforme
Representao do trato vocal com tubos acsticos
simples.
Estimando freqncias naturais a partir de funes de
rea.
Representao do trato vocal com mltiplos tubos
uniformes.
2
MIT
Teoria Acstica da Produo de Voz 6.345 Sistema de Reconhecimento de Voz
Estrutura Anatmica Para a Produo da Voz
Cavidade Nasal
Palato Duro
Traquia
Lngua
Maxilar
Cartilagem da Tireide
Pulmo
Cordas Vocais
Palato Mole
3
MIT
Teoria Acstica da Produo de Voz 6.345 Sistema de Reconhecimento de Voz
Fonemas no Ingls Americano
4
MIT
Teoria Acstica da Produo de Voz 6.345 Sistema de Reconhecimento de Voz
Local de Articulao Para Sons Vocais
5
MIT
Teoria Acstica da Produo de Voz 6.345 Sistema de Reconhecimento de Voz
Formas de Onda Vocais: Um exemplo
Two plus seven is less than ten. (Dois mais sete menos que dez.)
6
MIT
Teoria Acstica da Produo de Voz 6.345 Sistema de Reconhecimento de Voz
Um Espectrograma Faixa Larga
Two plus seven is less than ten. (Dois mais sete menos que dez.)
7
MIT
Teoria Acstica da Produo de Voz 6.345 Sistema de Reconhecimento de Voz
Teoria Acstica da Produo da Voz
As caractersticas acsticas da voz so geralmente modeladas
como uma seqncia de fonte, filtro do trato vocal, e caractersticas
de radiao.
P
r
(j) = S(j) T (j) R(j)
Para produo de vogais:
S(j) = U
G
(j)
T (j) = U
L
(j) /U
G
(j)
R(j) = P
r
(j) /U
L
(j)
8
MIT
Teoria Acstica da Produo de Voz 6.345 Sistema de Reconhecimento de Voz
Fonte do Som: Vibrao das Cordas Vocais
Modelado como a velocidade do volume gerado pela fonte na glote
(abertura entre cordas vocais), UG(j)
500 200 300 Crianas
350 150 225 Mulheres
200 80 125 Homens
F
0
mx
(Hz)
F
0
mn
(Hz)
F
0
mdia
(Hz)
9
MIT
Teoria Acstica da Produo de Voz 6.345 Sistema de Reconhecimento de Voz
Fonte do Som: Rudo de Turbulncia
Rudo de turbulncia produzido na contrio do trato vocal.
Rudo de Aspirao produzido na glote,
Rudo de Frico produzido acima da glote.
Modelado como sries de fontes de presso na contrio, PS (j).
V : Velocidade na contrio D: Dimenso critica =
A
A

4
10
MIT
Teoria Acstica da Produo de Voz 6.345 Sistema de Reconhecimento de Voz
Equaes de Onda do Trato Vocal
Defina: u(x,t) velocidade de partcula
U(x, t) velocidade do volume (U = uA)
p(x, t) variao da presso do som (P = P
0
+ p)
densidade do ar
c velocidade do som
Supondo propagao de onda plana (para uma dimenso << ), e
movimento unidimensional, pode ser provado que:
Solues no domnio do tempo e da freqncia so da forma.
t
u
x
p


t
p
c x
u

2
1

2 2
2
2 2
2
1
t c
u
c x
u

( )
|
.
|

\
|
+
|
.
|

\
|
=
+
c
x
t u
c
x
t u t x u , ( )
(

+
c
sx
c
sx
e P e P
c
s x u

1
,
( )
(

|
.
|

\
|
+
|
.
|

\
|
=
+
c
x
t u
c
x
t u c t x p ,
( )
c
sx
c
sx
e P e P s x p

+
= ,
11
MIT
Teoria Acstica da Produo de Voz 6.345 Sistema de Reconhecimento de Voz
Propagao do Som em Tubo Uniforme
A funo de transferncia do trato vocal das velocidades do volume
:
Usando as condies de contorno U (0,s)= U
G
(s) e P(-l, s)=0
Os plos da funo de transferncia T (j) esto onde cos(l/c)=0
( )
( )
( )
( )
( )

=

=
j
j l U
j U
j U
j T
G
L
, 0
,
( )
c
sl
c
sl
e e
S T

+
=
2
( )
( )
c
l
T

=
cos
1
j
( ) ( )

2
1 2 2
=
n
c
l f
n
( ) 1 2
4
= n
l
c
f
n
( ) 1 2
4

=
n
l
n
n = 1, 2, ...
12
MIT
Teoria Acstica da Produo de Voz 6.345 Sistema de Reconhecimento de Voz
Propagao do Some Em Um Tubo Uniforme
(continuao)
Para c =34.000cm/s, l =17 cm, as freqncias naturais (tambm
denominadas formantes) esto em 500Hz, 1.500Hz, 2.500Hz.
A funo de transferncia de um tubo sem ramos laterais, excitado de um
lado e tendo a resposta medida no outro lado, somente tem plos.
As freqncias dos formantes tero uma largura de faixa finita quando as
perdas do trato vocal forem consideradas (ex., radiao, paredes,
viscosidade, calor).
O comprimento do trato vocal, l, corresponde a , , , , onde
i
o
comprimento de onda da i
th
freqncia natural.
1
4
1

2
4
3

3
4
5

13
MIT
Teoria Acstica da Produo de Voz 6.345 Sistema de Reconhecimento de Voz
Estabelecendo Padres de Onda
Em Um Tubo Uniforme
Um tubo uniforme fechado de um lado e aberto no outro e
freqentemente chamado de ressonador de um quarto de
comprimento de onda.
lbios glote
14
MIT
Teoria Acstica da Produo de Voz 6.345 Sistema de Reconhecimento de Voz
Freqncias Naturais de Um Simples Tubo
Acstico
Ressonador de um quarto de
comprimento de onda
Ressonador de meio comprimento
de onda
( )
c
x
P j x P

=
+
cos 2 ,
( )
c
x
P
c
A
j j x U

=
+
sen 2 ,

c
l
tg
c
A
j Y
l

=

A
C j
pc
Al
j =
2
1 << c l
2
c
Al
C
A

=
( ) 1 2
4
= n
l
c
f
n
n = 1, 2, ...
Conformidade acstica
( )
c
x
P j j x P

=
+
sen 2 ,
( )
c
x
P
c
A
j x U

=
+
cos 2 ,

c
l
g
c
A
j Y
l

=

cot

A
M
j
l
A
j

1 << c l
A
l
M
A

=
massa acstica
n
l
c
f
n
2
=
n = 1, 2, ...
15
MIT
Teoria Acstica da Produo de Voz 6.345 Sistema de Reconhecimento de Voz
Aproximando Formas Para o Trato Vocal
16
MIT
Teoria Acstica da Produo de Voz 6.345 Sistema de Reconhecimento de Voz
Estimando Freqncias Naturais de Ressonncia
Freqncia de ressonncia ocorre quando a funo de impedncia
(ou admitncia) igual s condies de contorno naturais (ex.:
circuito aberto).
Para uma aproximao com dois tubos mais fcil resolver para
Y
1
+ Y
2
=0.
0 cot tan
2 2 1 1
=

c
l
c
A
j
c
l
c
A
j

0 cos cos sen sen
2 1
1
2 2 1
=


c
l
c
l
A
A
c
l
c
l
17
MIT
Teoria Acstica da Produo de Voz 6.345 Sistema de Reconhecimento de Voz
Desacoplando Aproximaes Com Tubo Simples
Se nas freqncias A
1
>> A
2
, ou A
1
<<A
2
, os tubos podem ser
desacoplados natural que cada tubo possa ser calculado
independentemente.
Para a vogal /i
y
/, as freqncias formantes so obtidas a partir de:
aproximaes simples
Nas baixas freqncias:
n
l
c
f
n
1
2
=
n
l
c
f
n
2
2
=
2
1
2
1
2 1 1
2
2 1
1
2
1
2
(
(

=
(

=
A A
M C l l A
A c
f

Esta freqncia de ressonncia baixa denominada de ressonncia de Helmholtz.
mais
18
MIT
Teoria Acstica da Produo de Voz 6.345 Sistema de Reconhecimento de Voz
Exemplo de Produo de Vogais

F3
F2
F1
Formante


2917 2917 2917 2808 F3
1944 1905 1093 1276 F2
268 256 972 789 F1
Estimado Real Estimado Real Formante
19
MIT
Teoria Acstica da Produo de Voz 6.345 Sistema de Reconhecimento de Voz
Exemplo de Espectrograma de Vogal
20
MIT
Teoria Acstica da Produo de Voz 6.345 Sistema de Reconhecimento de Voz
Estimando Freqncias de Anti-Ressonncia
(Zeros)
Zeros ocorrem em freqncias onde no existe uma sada mensurvel.
Para consoantes nasais, zeros em UN ocorrem onde Y
0
=
Para fricativas, zeros em UL ocorrem onde a impedncia atrs da fonte
infinita (ou seja existe uma parede atrs da fonte).
Zeros ocorrem quando as medidas so feitas no trato vocal interno.
21
MIT
Teoria Acstica da Produo de Voz 6.345 Sistema de Reconhecimento de Voz
Produo de Consoantes
Plos Zeros
Plos Zeros
22
MIT
Teoria Acstica da Produo de Voz 6.345 Sistema de Reconhecimento de Voz
Exemplo de Espectrograma de Consoante
23
MIT
Teoria Acstica da Produo de Voz 6.345 Sistema de Reconhecimento de Voz
Teoria da Perturbao
l
A
j Y
l


Para l pequeno
Considere um tubo uniforme, fechado de um lado e aberto no outro.
Reduzindo a rea de uma pequena parte do tubo perto da abertura (onde U
mx) tem o mesmo efeito de manter a rea fixa e aumentar o
comprimento do tubo
Desde que aumentar o comprimento do tubo abaixa as freqncias
ressonantes, estreitando o tubo perto dos pontos onde U (x) mximo em
um padro de onda para um dado formante decresce o valor deste
formante.
24
MIT
Teoria Acstica da Produo de Voz 6.345 Sistema de Reconhecimento de Voz
Teoria da Perturbao (continuao)
2
c
Al
j Y
l

Para l pequeno
Reduzindo a rea de uma pequena parte do tubo prxima
extremidade fechada (onde p mximo) tem o mesmo efeito que o
de manter a rea fixa e encurtar o tubo.
Desde que encurtando o tubo iro aumentar os valores dos
formantes, estreitando o tubo nos pontos prximos onde p(x) um
mximo na onda padro de um dado formante ir aumentar o valor
daquele formante.
25
MIT
Teoria Acstica da Produo de Voz 6.345 Sistema de Reconhecimento de Voz
Sumrio dos Resultados da Teoria da
Perturbao
26
MIT
Teoria Acstica da Produo de Voz 6.345 Sistema de Reconhecimento de Voz
Ilustrao da Teoria da Perturbao
27
MIT
Teoria Acstica da Produo de Voz 6.345 Sistema de Reconhecimento de Voz
Ilustrao da Teoria da Perturbao
The ship was torn apart on the sharp (ref)
28
MIT
Teoria Acstica da Produo de Voz 6.345 Sistema de Reconhecimento de Voz
Ilustrao da Teoria da Perturbao
(The ship was torn apart on the sh)arp reef
29
MIT
Teoria Acstica da Produo de Voz 6.345 Sistema de Reconhecimento de Voz
Aproximao Multi-Tubo do Trato Vocal
Podemos representar o trato vocal como uma concatenao de N tubos
sem perdas com rea constante {A
k
} e de igual comprimento
O tempo de propagao de onda atravs de cada tubo :
N
l
x =
Nc
l
c
x
=

=
30
MIT
Teoria Acstica da Produo de Voz 6.345 Sistema de Reconhecimento de Voz
Equaes de Onda Para um Tubo Individual
As equaes de onda para o k
th
tubo tem a forma
( )
(

|
.
|

\
|
+ +
|
.
|

\
|
=
+
c
x
t U
c
x
t U
A
c
t x p
k k
k
k

,
( )
|
.
|

\
|
+
|
.
|

\
|
=
+
c
x
t U
c
x
t U t x U
k k k
,
Onde medido no lado esquerdo (0)
31
MIT
Teoria Acstica da Produo de Voz 6.345 Sistema de Reconhecimento de Voz
Expresses de Atualizao nos
Contornos do Tubo
Podemos resolver expresses de atualizao usando restries de
continuidade nos contornos do tubo por ex., p
k
(x, t) = p
k+1
(0,t), e
U
k
(x, t) = U
k+1
(0,t)
( ) ( ) ( ) ( ) t U r t U r t U
k k k k k

+
+ +
+
+ + =
1 1
1
( ) ( ) ( ) ( ) t U r t U r t U
k k k k k

+
+
+ = +
1
1
k k
k k
k
A A
A A
r
+

=
+
+
1
1
1
k
r
note
32
MIT
Teoria Acstica da Produo de Voz 6.345 Sistema de Reconhecimento de Voz
Modelo Digital do trato Vocal Multi-Tubo
Atualizaes nos contornos do tubo ocorrem sincronicamente a cada 2
Se a excitao limitada em faixa, entradas podem ser amostradas a cada T =2
Cada seco do tubo tem um atraso de z
-1/2
A escolha de N depende da amostragem

Perdas em srie e em paralelo podem tambm ser introduzidas nas junes do tubo
Larguras de faixa so proporcionais razo entre energia perdida e energia
armazenada
Energia armazenada proporcional ao comprimento do tubo
Nc
l
T 2 2 = =
cT
l
N
2
=
33
MIT
Teoria Acstica da Produo de Voz 6.345 Sistema de Reconhecimento de Voz
Tarefa 1
34
MIT
Teoria Acstica da Produo de Voz 6.345 Sistema de Reconhecimento de Voz
Referncias
Zue, 6.345 Course Notes
Stevens, Acoustic Phonetics, MIT Press, 1998.
Rabiner & Schafer, Digital Processing of Speech Signals, Prentice-
Hall, 1978.

Das könnte Ihnen auch gefallen