Beruflich Dokumente
Kultur Dokumente
stimmhaft F1
Glottis- x
filter F2
Grundfrequenz +
+
F3
Rausch-
generator x
stimmlos
Fn
Anregung Vokaltrakt
1
3. Grundlagen der menschlichen Spracherzeugung
Anregung und Lautformung.
Resultierende Sprachsignale:
T0 = 1/f0 T0
Zeitbereich:
t
t
t t
H(jω)
Frequenzbereich:
f0
f f
f f
Anregung Sprachsignal
2
4. Sprachsignalanalyse
Spektralanalyse.
Möglichkeiten:
Spektralanalyse mittels eines Bandpassfilters
Durchstimmbares Bandpassfilter und Demodulator
Modulator und festes Bandpassfilter
Spektralanalyse mittels einer Bandpassfilterbank
Spektralanalyse mittels direkter Transformationsberechnung
3
4. Sprachsignalanalyse
Spektralanalyse.
Durchstimmbares Bandpassfilter und Demodulator:
Ωm variabel
x(k) x ( k ) ∗ hB ( k ) ( x ( k ) ∗ h B ( k ) ) e − jΩ mk
HB(ejΩ)
X(ejΩ) X(ejΩ)⋅HB(ejΩ) X (e j ( Ω + Ω m ) ) ⋅ H B (e j ( Ω + Ω m ) )
e − jΩ m k
Ωm fest
4
4. Sprachsignalanalyse
Spektralanalyse.
Modulator und festes Bandpassfilter: Suchtonanalyse
e− jΩmk Ωm variabel
Ωm fest
HT(ejΩ)
x(k) x(k ) ⋅ e− jΩmk ( x(k ) ⋅ e− jΩmk ) ∗ hT (k )
5
4. Sprachsignalanalyse
Spektralanalyse.
Bandpassfilterbank:
Bandpassfilterbank mit vielen parallelen Filtern (2. Möglichkeit)
Typische Realisierungen:
Filter konstanter absoluter Bandbreite: ΔΩ = konstant
Filter konstanter relativer Bandbreite: ΔΩ / Ω = konstant
Bei zeitlich instationären Signalen ist wiederum eine Fensterung notwendig
Multiplikation mit Fensterfunktion im Zeitbereich
→ Faltung mit der Fourier-Transformierten des Fensters im Frequenzbereich
„Fenstereffekte“
6
4. Sprachsignalanalyse
Spektralanalyse.
3. Möglichkeit:
Direkte Berechnung der Transformationen
∞
x(k ) ( ) = ∑ x(k ) ⋅ e
X e jΩ − jkΩ
= F {x(k )}
k = −∞
M −1 2π M −1
−j μk
X μ = ∑ x( k ) ⋅ e = ∑ x(k ) ⋅ wM = DFT {x(k )}
M μk
x( k )
k =0 k =0
7
4. Sprachsignalanalyse
Spektralanalyse.
Vergleich DFT-Filterbank zeigt:
DFT ist eine spezielle Filterbank mit
M äquidistanten Kanälen
Unterabtastung um den Faktor M
Filter mit Rechteckfunktion als Impulsantwort
⎛M ⎞
Frequenzgang dieses Filters: M −1 sin ⎜ Ω⎟
H T (e jΩ ) = e 2 ⋅ ⎝
−j Ω 2 ⎠
⎛Ω⎞
sin ⎜ ⎟
⎝2⎠
⎛ 2π ⎞
Allgemeine Fensterfunktionen: T
h ( k ) = α + β ⋅ cos ⎜k ⎟
⎝ M ⎠
Hamming-Fenster: α = 0.54, β = -0.46
Hann-Fenster: α = 0.5, β = -0.5
Rechteck-Fenster: α = 1, β = 0
8
4. Sprachsignalanalyse
Spektralanalyse.
Fensterfunktionen:
G ( jω ) = S ( jω ) ⋅ H ( jω )
C ( x) = F {ln G ( jω ) }
X: quefrency
= F {ln S ( jω ) + ln H ( jω ) }
C(x): Cepstrum
= C1 ( x) + C2 ( x)
11
4. Sprachsignalanalyse
Cepstrum.
Beispiele:
(Blauert, 1994)
13
4. Sprachsignalanalyse
Lineare Prädiktion.
Transversalfilter T(jω):
berechnet aus vergangenen Werten g(t) ein aktuelles
g(t) – A ⋅ s(t)
sagt die Differenz zwischen Sprache und Anregungssignal voraus
→ lineare Prädiktion, LPC-Analyse
Bestimmung der Parameter:
A: quadratischer Mittelwert
ai: minimaler mittlerer quadratischer Fehler zwischen S(jω) und S‘(jω)
bzw. s(t) und s‘(t)
Neuberechnung für jeden Signalabschnitt notwendig
14
4. Sprachsignalanalyse
Lineare Prädiktion.
Genauere Analyse:
Nach der LPC-Analyse bleibt Periodizität bei stimmhaften Anregungen
Extraktion durch weiteren „Langzeit-Prädiktor“
T0 : Grundperiode
15
Kapitel 5: Grundlagen der auditiven
Wahrnehmung.
5. Grundlagen der auditiven Wahrnehmung
Übersicht.
Anatomie des Gehörs:
18
5. Grundlagen der auditiven Wahrnehmung
Außenohr.
Kopfbezogenes Übertragungssystem:
20
5. Grundlagen der auditiven Wahrnehmung
Mittelohr.
Aufbau: Hebelapparat mit 3 Gehörknöchelchen
(Blauert, 1994)
21
5. Grundlagen der auditiven Wahrnehmung
Mittelohr.
Funktion:
Impedanzanpassung Luft ↔ Lymphe
durch Hebelwirkung (Faktor 1,3) und Flächenverhältnis (14)
→ Gesamtverstärkung ca. 15 (frequenzabhängig!)
zusätzlich: Schutzfunktion (Stapedius-Reflex)
22
5. Grundlagen der auditiven Wahrnehmung
Innenohr.
Aufbau: Hauptbestandteil Schnecke (Cochlea)
(Blauert, 1994)
23
5. Grundlagen der auditiven Wahrnehmung
Innenohr.
Ohmsches Gesetz der Psychoakustik:
Das Gehör führt eine Spektralanalyse nach Art der Fourier-Transformation
durch!
Funktionsweise:
Frequenz-Orts-Transformation durch Wanderwelle auf der Basilarmembran
→ frequenztypisches Maximum
→ Ort des Maximums ∼ Log. der Frequenz
Auf der Basilarmembran: Corti‘sches Organ
→ Sinneszellen = Haarzellen
24
5. Grundlagen der auditiven Wahrnehmung
Innenohr.
Frequenz-Orts-Transformation:
Basilarmembran
0 8 16 24 32 x/mm
15.5 4.4 1.72 0.63 f/kHz
25
5. Grundlagen der auditiven Wahrnehmung
Innenohr.
Schnitt durch den Cochlea-Kanal:
28
5. Grundlagen der auditiven Wahrnehmung
Tonhöhenwahrnehmung.
Hörfläche des Menschen:
(Blauert, 1994)
29
5. Grundlagen der auditiven Wahrnehmung
Tonhöhenwahrnehmung.
Skalen der Tonhöhenwahrnehmung:
30
5. Grundlagen der auditiven Wahrnehmung
Lautsheitswahrnehmung.
Lautheit eines 1 kHz-Tones und UEN als Funktion des Schalldruckpegels:
31
5. Grundlagen der auditiven Wahrnehmung
Lautsheitswahrnehmung.
Lautstärkepegel und Lautheit:
(Blauert, 1994)
32
5. Grundlagen der auditiven Wahrnehmung
Lautsheitswahrnehmung.
Maskierung im Frequenzbereich:
LT / dB
Testschall
Maskierer
TM t / ms
34
5. Grundlagen der auditiven Wahrnehmung
Lautsheitswahrnehmung.
Breite der Frequenzgruppen:
35
5. Grundlagen der auditiven Wahrnehmung
Lautsheitswahrnehmung.
Erregungspegel und Tonheit: