Sie sind auf Seite 1von 3

Übungsblatt 3 - Beispiellösung

1. Spektralanalyse (siehe Skript S. 60ff)


Was ist der Unterschied zwischen der Spektralanalyse mit durchstimmbaren
Bandpassfilter und der Suchtonanalyse?
Bestimmung mit Bandpassfiltern (Fensterung im Frequenzbereich)
Zur Berechnung der spektralen Anteile bei allen Frequenzen f kann das interessierende
Sprachsignal z.B. gespeichert und durch einen Bandpass, d.h. ein Filter,
dass nur Frequenzen in einem bestimmten engen Bereich (Frequenzband ΔΩ) um die
Mittenfrequenz Ωm durchlässt, geschickt werden. Die Amplitude der Mittenfrequenz Ωm ist
dann der Mittelwert der Amplituden im Frequenzband ΔΩ.
Man erhält dann am Ausgang des Bandpasses eine Schwingung mit der Bandpass-
Mittenfrequenz und einer (komplexen) Amplitude, die proportional dem Spektralwert des zu
untersuchenden Signals bei der Frequenz Ω = Ωm ist.

Bestimmung mit Suchtonanalyse(Fensterung im Zeitbereich)


Hier wird das Signal mit einem einstellbaren Suchton multipliziert, bevor es durch einen
Filter geht, der die gleiche Mittenfrequenz hat wie der Suchton. Im ersten Abschnitt werden
die Anteile des Eingangssignals verstärkt, die dem Suchsignal entsprechen. Im zweiten
Abschnitt werden die Anteile, die nicht der Frequenz des Suchtons entsprechen ausgefiltert.
Was übrig bleibt ist die Amplitude der Suchfrequenz im Eingangssignal.

Was ist das grundsätzliche Prinzip bei beiden Analysearten? Berechnung der spektralen
Anteile bei allen Frequenzen (Kurzzeitspektrum) - Das grundsätzliche Prinzip beider
Analysearten ist es über ein Filter (Bandpass, bzw. Tiefpass) die gerade nicht
interessierenden Spektralanteile auszublenden und nur die gerade interessierenden Anteile
durchzulassen für welche die Amplitude bestimmt werden soll.

Welche dritte Analysemethode wird im Skript vorgestellt? Bandpassfilterbank

Mit Praat vergleiche die Auswirkung verschiedener Filter bei der Erstellung eines
Spektrograms:

Welche Bedeutung haben die einzelnen Parameter, was passiert wenn man die Voreinstellung
verändert?

Window length: Länge des gleitenden Zeitfensters, in dem jeweils ein


Leistungsdichtespektrum berechnet wird. Die zeitliche Auflösung wird höher oder niedriger.
Ein Vergrössern der Fensterlänge führt dazu, dass mehr Samples im Fenster liegen. Dadurch
kann ein genaueres Spektrum für dieses Fenster berechnet werden, als für ein kleineres
Fenster.
Durch die Verringerung der Fensterbreite erhält man ein Breitbandsonagramm (0.003s bis
0.01s), das die Formantstruktur deutlicher zeigt, oder ein Schmalbandsonagramm (0.02s bis
0.04s), das eher die Harmonischen der Grundfrequenz betont.

Maximum frequency: Höchstfrequenz des Spektrograms


Time Step: Zeitauflösung des Spektrogramms (zeitlicher Abstand zwischen zwei Fenstern) an.
Je grösser dieser Parameter ist, desto grober wird die zeitliche Auflösung.
Frequency Step: Spektrale (Frequenz-)auflösung
Wähle verschiedene Fenster mit verschiedenen Einstellungen aus und vergleiche die
Spektrogramme. Was fällt dir auf? Welche Einstellung / Fensterfunktionen eignen sich
gut wofür?
Die Wahl der Fensterfunktion ist immer mit einem Kompromiss verbunden und eine Frage
der Anwendung. Kriterien sind:
-Breite des Hauptmaximums
-Relative Amplitude des Nebenmaximums
-Leakage Factor
-Maximaler Abtastfehler
Das Rechteckfenster bietet einen sehr schmalen Durchlassbereich, hat dafür aber keine
besonders gute Sperrdämpfung, Dass Hamming- oder Hanningfenster hingegen bietet
eine gute Sperrdämpfung, aber haben dafür auch einen breiteren Durchlassbereich.

2. Cepstrum

Abb. 1 : stimmhaft
Abb. 2 : stimmlos

Was erkennst du auf den Grafiken?


Beim stimmhaften Laut lässt sich die Grundfrequenz ablesen, das Cepstrum dient zum
Beispiel zur stimmhaft-stimmlos-Entscheidung

Worin unterscheiden sich die Cepstrum Plots für stimmhaft/stimmlos?


Hauptsächlich unterscheiden sich die Plots in den regelmäßigen Spitzen, die im stimmhaften
Laut die Periodizität anzeigen. Diese fehlen entsprechend im Plot für den stimmlosen Laut.

3. Lineare Prädiktion
Erkläre in Stichworten das Prinzip der Linearen Prädiktion.
Ziel: Trennung von Quellsignal und Filterfunktion
Notwenige Annahme: Quellensignal ist ein Impulssignal bzw. weißes Rauschen
Wo findet die lineare Prädiktion Anwendung?
 als eine Form der Sprachkompression (in Mobiltelefonen),
 zur digitalen und verschlüsselten Übertragung von
 Sprache über schmalbandige Kanäle,
 zur Formantenanalyse (auch andere Verfahren...)

Das könnte Ihnen auch gefallen