Sie sind auf Seite 1von 38

Rückblick.

3. Grundlagen der menschlichen Spracherzeugung


Modelle.
Quelle-Filter-Modell:

stimmhaft F1
Glottis- x
filter F2
Grundfrequenz +
+
F3
Rausch-
generator x
stimmlos
Fn

Anregung Vokaltrakt

Quelle: Modellierung des Anregungssignals


Filter: akustische Röhre beschrieben als lineares Filter

1
3. Grundlagen der menschlichen Spracherzeugung
Anregung und Lautformung.
Resultierende Sprachsignale:
T0 = 1/f0 T0
Zeitbereich:
t
t

t t

H(jω)
Frequenzbereich:
f0
f f

f f

Anregung Sprachsignal
2
4. Sprachsignalanalyse
Spektralanalyse.
Möglichkeiten:
ƒ Spektralanalyse mittels eines Bandpassfilters
ƒ Durchstimmbares Bandpassfilter und Demodulator
ƒ Modulator und festes Bandpassfilter
ƒ Spektralanalyse mittels einer Bandpassfilterbank
ƒ Spektralanalyse mittels direkter Transformationsberechnung

3
4. Sprachsignalanalyse
Spektralanalyse.
Durchstimmbares Bandpassfilter und Demodulator:

Ωm variabel

x(k) x ( k ) ∗ hB ( k ) ( x ( k ) ∗ h B ( k ) ) e − jΩ mk

HB(ejΩ)

X(ejΩ) X(ejΩ)⋅HB(ejΩ) X (e j ( Ω + Ω m ) ) ⋅ H B (e j ( Ω + Ω m ) )

e − jΩ m k
Ωm fest

4
4. Sprachsignalanalyse
Spektralanalyse.
Modulator und festes Bandpassfilter: Suchtonanalyse

e− jΩmk Ωm variabel
Ωm fest

HT(ejΩ)
x(k) x(k ) ⋅ e− jΩmk ( x(k ) ⋅ e− jΩmk ) ∗ hT (k )

X(ejΩ) X (e j (Ω+Ωm ) ) X (e j ( Ω+Ωm ) ) ⋅ H T (e jΩ )

5
4. Sprachsignalanalyse
Spektralanalyse.
Bandpassfilterbank:
ƒ Bandpassfilterbank mit vielen parallelen Filtern (2. Möglichkeit)
ƒ Typische Realisierungen:
ƒ Filter konstanter absoluter Bandbreite: ΔΩ = konstant
ƒ Filter konstanter relativer Bandbreite: ΔΩ / Ω = konstant
ƒ Bei zeitlich instationären Signalen ist wiederum eine Fensterung notwendig
ƒ Multiplikation mit Fensterfunktion im Zeitbereich
→ Faltung mit der Fourier-Transformierten des Fensters im Frequenzbereich
„Fenstereffekte“

6
4. Sprachsignalanalyse
Spektralanalyse.
3. Möglichkeit:
ƒ Direkte Berechnung der Transformationen

x(k ) ( ) = ∑ x(k ) ⋅ e
X e jΩ − jkΩ
= F {x(k )}
k = −∞

M −1 2π M −1
−j μk
X μ = ∑ x( k ) ⋅ e = ∑ x(k ) ⋅ wM = DFT {x(k )}
M μk
x( k )
k =0 k =0

ƒ Aus Gründen der Realisierbarkeit: Nur M Frequenzkomponenten (DFT)


→ beschreiben Signale endlicher Länge oder Periodizität exakt,
sonst nur näherungsweise

7
4. Sprachsignalanalyse
Spektralanalyse.
Vergleich DFT-Filterbank zeigt:
ƒ DFT ist eine spezielle Filterbank mit
ƒ M äquidistanten Kanälen
ƒ Unterabtastung um den Faktor M
ƒ Filter mit Rechteckfunktion als Impulsantwort
⎛M ⎞
ƒ Frequenzgang dieses Filters: M −1 sin ⎜ Ω⎟
H T (e jΩ ) = e 2 ⋅ ⎝
−j Ω 2 ⎠
⎛Ω⎞
sin ⎜ ⎟
⎝2⎠
⎛ 2π ⎞
ƒ Allgemeine Fensterfunktionen: T
h ( k ) = α + β ⋅ cos ⎜k ⎟
⎝ M ⎠
ƒ Hamming-Fenster: α = 0.54, β = -0.46
ƒ Hann-Fenster: α = 0.5, β = -0.5
ƒ Rechteck-Fenster: α = 1, β = 0

8
4. Sprachsignalanalyse
Spektralanalyse.
Fensterfunktionen:

(Vary et al., 1998, 84)


9
4. Sprachsignalanalyse
Spektralanalyse.
FFT-Realisierung: Radix-2/Decimation-in-Time

(Vary et al., 1998, 78)


10
4. Sprachsignalanalyse
Cepstrum.
Quelle-Filter-Modell:

G ( jω ) = S ( jω ) ⋅ H ( jω )

Sprache Anregung Vokaltrakt


ln G ( jω ) = ln S ( jω ) ⋅ H ( jω )
= ln S ( jω ) + ln H ( jω )

C ( x) = F {ln G ( jω ) }
X: quefrency
= F {ln S ( jω ) + ln H ( jω ) }
C(x): Cepstrum
= C1 ( x) + C2 ( x)
11
4. Sprachsignalanalyse
Cepstrum.
Beispiele:

(Flanagan, 1972, 175)


12
4. Sprachsignalanalyse
Lineare Prädiktion.
Idee:
ƒ Quelle-Filter-Modell → Inverse Filterung

(Blauert, 1994)
13
4. Sprachsignalanalyse
Lineare Prädiktion.
Transversalfilter T(jω):
ƒ berechnet aus vergangenen Werten g(t) ein aktuelles
g(t) – A ⋅ s(t)
ƒ sagt die Differenz zwischen Sprache und Anregungssignal voraus
→ lineare Prädiktion, LPC-Analyse
ƒ Bestimmung der Parameter:
ƒ A: quadratischer Mittelwert
ƒ ai: minimaler mittlerer quadratischer Fehler zwischen S(jω) und S‘(jω)
bzw. s(t) und s‘(t)
ƒ Neuberechnung für jeden Signalabschnitt notwendig

14
4. Sprachsignalanalyse
Lineare Prädiktion.
Genauere Analyse:
ƒ Nach der LPC-Analyse bleibt Periodizität bei stimmhaften Anregungen
ƒ Extraktion durch weiteren „Langzeit-Prädiktor“

s ' ' (t ) = s ' (t ) − b[s ' (t − T0 )]

T0 : Grundperiode

15
Kapitel 5: Grundlagen der auditiven
Wahrnehmung.
5. Grundlagen der auditiven Wahrnehmung
Übersicht.
Anatomie des Gehörs:

(Zwicker, 1982, 22)


17
5. Grundlagen der auditiven Wahrnehmung
Außenohr.
Aufbau und Funktion:
ƒ Außenohr umfasst Kopf (soweit akustisch wirksam), Ohrmuschel (Pinna)
und Gehörgang
ƒ Wichtigste Funktion: Richtwirkung
→ Umkodierung räumliche in zeitliche/spektrale Information
ƒ Technische Anwendung der Richtwirkung:
„ Kopfbezogene Übertragungssysteme
„ Kunstkopf

18
5. Grundlagen der auditiven Wahrnehmung
Außenohr.
Kopfbezogenes Übertragungssystem:

(Blauert, 1998, 50)


19
5. Grundlagen der auditiven Wahrnehmung
Außenohr.
Aufbau und Funktion:
ƒ Ohrmuschel (hautüberzogenes Knorpelgerüst) + Gehörgang (mit
Trommelfell abgeschlossen)
→ Resonatorsystem (5 kHz, 3 kHz, 1 kHz)
ƒ Beschreibung der Richtwirkung:
Außenohr-Übertragungsfunktionen (HRTFs)
ƒ Binaurales Hören: Positionsbestimmung durch
ƒ Zeitdifferenzen (ITDs)
ƒ Pegeldifferenzen (ILDs)
→ Cocktail-Party-Effekt

20
5. Grundlagen der auditiven Wahrnehmung
Mittelohr.
Aufbau: Hebelapparat mit 3 Gehörknöchelchen

(Blauert, 1994)
21
5. Grundlagen der auditiven Wahrnehmung
Mittelohr.
Funktion:
ƒ Impedanzanpassung Luft ↔ Lymphe
durch Hebelwirkung (Faktor 1,3) und Flächenverhältnis (14)
→ Gesamtverstärkung ca. 15 (frequenzabhängig!)
ƒ zusätzlich: Schutzfunktion (Stapedius-Reflex)

22
5. Grundlagen der auditiven Wahrnehmung
Innenohr.
Aufbau: Hauptbestandteil Schnecke (Cochlea)

(Blauert, 1994)
23
5. Grundlagen der auditiven Wahrnehmung
Innenohr.
Ohmsches Gesetz der Psychoakustik:
ƒ Das Gehör führt eine Spektralanalyse nach Art der Fourier-Transformation
durch!

Funktionsweise:
ƒ Frequenz-Orts-Transformation durch Wanderwelle auf der Basilarmembran
→ frequenztypisches Maximum
→ Ort des Maximums ∼ Log. der Frequenz
ƒ Auf der Basilarmembran: Corti‘sches Organ
→ Sinneszellen = Haarzellen

24
5. Grundlagen der auditiven Wahrnehmung
Innenohr.
Frequenz-Orts-Transformation:

Basilarmembran

0 8 16 24 32 x/mm
15.5 4.4 1.72 0.63 f/kHz

25
5. Grundlagen der auditiven Wahrnehmung
Innenohr.
Schnitt durch den Cochlea-Kanal:

(Flanagan, 1972, 92)


26
5. Grundlagen der auditiven Wahrnehmung
Innenohr.
Anordnung der Haarzellen:

(Zwicker & Fastl, 1999, 26)


27
5. Grundlagen der auditiven Wahrnehmung
Innenohr.
Nervenimpulse:
ƒ Feuerrate bestimmt Stärke der Nervenanregung
→ A/D-Wandlung
ƒ Hörnerv führt zum Großhirn (auditorische Cortex)
→ Frequenz-Orts-Darstellung bleibt erhalten

28
5. Grundlagen der auditiven Wahrnehmung
Tonhöhenwahrnehmung.
Hörfläche des Menschen:

(Blauert, 1994)
29
5. Grundlagen der auditiven Wahrnehmung
Tonhöhenwahrnehmung.
Skalen der Tonhöhenwahrnehmung:

(Zwicker & Fastl, 1999, 162)

30
5. Grundlagen der auditiven Wahrnehmung
Lautsheitswahrnehmung.
Lautheit eines 1 kHz-Tones und UEN als Funktion des Schalldruckpegels:

(Zwicker & Fastl, 1999, 207)

31
5. Grundlagen der auditiven Wahrnehmung
Lautsheitswahrnehmung.
Lautstärkepegel und Lautheit:

(Blauert, 1994)
32
5. Grundlagen der auditiven Wahrnehmung
Lautsheitswahrnehmung.
Maskierung im Frequenzbereich:

(Zwicker, 1982, 41)


33
5. Grundlagen der auditiven Wahrnehmung
Lautsheitswahrnehmung.
Maskierung im Zeitbereich:

LT / dB

Testschall
Maskierer

TM t / ms

34
5. Grundlagen der auditiven Wahrnehmung
Lautsheitswahrnehmung.
Breite der Frequenzgruppen:

(Zwicker, 1982, 51)

35
5. Grundlagen der auditiven Wahrnehmung
Lautsheitswahrnehmung.
Erregungspegel und Tonheit:

(Zwicker & Fastl, 1999)


36
Backup.

Das könnte Ihnen auch gefallen