Sie sind auf Seite 1von 3

Vortragsthema: PEAQ - Ausarbeitung Jasper Eberhard Einleitung

Diese Ausarbeitung zum Vortrag PEAQ im Rahmen des Seminars Modelle Auditiver Wahrnehmung an der Technischen Universit at Berlin 2010/11 besch aftigt sich mit dem 2001 erschienenem Empfehlungsbericht BS.1387-1 [1]. Diese Empfehlung der ITU Radiocommunication Assembly beschreibt ein technisches, objektives Verfahren zur Messung auditiv wahrgenommener Audio-Qualit at PEAQ (Perceptual Evaluation of Audio Quality). Diese Arbeit wird den genannten Bericht zusammenfassen. ve Tonh ohenwahrnehmung, Lautheitswahrnehmung und andere adaptive, nicht-lineare Prozesse. Es gen ugt also nicht technisch leicht messbare Eigenschaften des zu testenden Signals - wie Signal-Rausch-Abstand - heranzuziehen, um die menschlich empfundene Wahrnehmung von Qualit at zu modellieren. Ziel ist es also ein equivalentes, objektives Ma zum Subjective Dierence Grade (SDG) bereit zu stellen - den Objective Dierence Grade (ODG). Wie Abbildung 2 zeigt existiert kein direkter,

Motivation
Verfahren zur qualitativen Beurteilung auditiver Wahr nehmung von Ubertragungssystemen und verlustbehafteten Kodierverfahren haben viele Anwendungsbereiche. Sie stellen eine Darstellung von Qualit at als Basic Audio Quality (BAQ) bereit. In der Vergangenheit wurden aufwendige Versuchsabl aufe mit Testpersonen durchgef uhrt um subjektiv wahrgenommene Qualit at von sog. Signal Under Test (SUT) zu beurteilen. Um allgemein g ultige Aussagen zu erhalten m ussen diese Tests mit einer groen Anzahl von Testpersonen und Wiederholungen durchgef uhrt werden um individuelle, subjektive Pr aferenzen und Abweichungen einzelner Testpersonen zu kompensieren. Hierbei wird das Signal Under Test (SUT) als zu testendes und ein Referenzsignal der Testperson dargeboten, die die qualitativen Unterschiede der beiden Signale als Subjective Dierence Grade (SDG) nennt. Hierbei wird jedes der beiden Signale auf einer kontinuierlichen Skala (Abb. 1) mit f unf Ankern bewertet und anschlieend die Dierenz der beiden Bewertungen gebildet, so dass ein SDG von 0 f ur v ollig unh orbare und ein SDG von -4 f ur sehr stark st orende Qualit atsunterschiede steht. Diese Versuchsdurchf uhrungen

Abbildung 2: Konzept der Validit at

deterministischer Zusammenhang zwischen subjektivem SDG und objektivem ODG. In diesem Zusammenhang beschreibt der Absolute Error Score (AES) das statistisch ausgewertete Verh altnis zwischen dem Kondenzintervall des SDG und der Dierenz zwischen SDG und ODG. Je kleiner der AES, desto aussagekr aftiger ist der gemessene ODG und das zugrunde liegende Messverfahren.

Das PEAQ-Model

Abbildung 1: kontinuierliche Skala mit 5 Ankern (ITU-R BS.562)

sind sehr aufw andig und kostenintensiv und so besteht ein gerechtfertigter Bedarf nach einem technischen, objektiven Verfahren, das auditiv wahrgenommene Qualit at von beliebigen Audio-Signalen und Systemen darstellen kann. Dieses Verfahren muss m oglichst viele Aspekte der auditiven Wahrnehmung ber ucksichtigen, unter anderem temporale und spektrale Verdeckungen, auditi-

Das empfohlene PEAQ-Model erzeugt aus dem Referenzund dem zu messenden Signal eine Vielzahl von Modelparametern so genannten Model Output Variables (MOVs) aus denen wiederum ein ODG mit m oglichst geringem AES erzeugt wird. Dieser letzte Schritt wurde mit einem neuronalen Netz realisiert, dem die MOVs einer Vielzahl von Versuchen, sowie den dazugeh origen SDGs und dem Kondenzintervall zugef uhrt wurden, wobei die jeweiligen AES -Werte minimiert wurden. Als Ausgang liefert dieses neuronale Netz also ODG Werte mit minimalem Fehler (AES ). Je nach Anwendungszweck wird empfohlen entweder die Basic - oder die Advanced -Version von PEAQ zu verwenden. F ur die Basic -Version wird ein spezielle diskrete FourierTransformation (DFT) der Eingangssignale, f ur die Advanced -Version von PEAQ eine Kombination der speziellen diskrete Fourier-Transformation (DFT) und einer speziellen Filterbank (FB) verwendet um die Modelparameter zu bestimmen.

Blockdiagramm des Models

Tabelle 2: Ubersicht u ber die DFT-MOVs

Model Output Variable WinModDi1B

AvgModDi1B

AvgModDi2B

Abbildung 3: PEAQ-Blockdiagramm

RmsNoiseLoudB

BandwidthRefB

Model Output Variables - MOVs

BandwidthTestB TotalNMRB

Folgende Model Output Variables - MOVs werden generiert.

RelDistFramesB

AvgSegmNMRB

Tabelle 1: Ubersicht u ber die Filterbank-MOVs

Model Output Variable RmsModDiA

Beschreibung quadr. Mittel der Modulationsunterschiede RmsMissingquadr. Mittel der im ComponentsA Testsignal fehlenden Rausch-Komponenten RmsNoiseLoudAsymA Summe aus RmsNoiseLoudB und RmsMissingComponentsA AvgLinDistA Mittel der der Lautheiten von Komponenten, die durch Tonheits-Adaption verloren gingen

MFPDB

ADBB

EHSB

Beschreibung Durchschnitt der gefensterten (ca. 100ms) AmplitudenModulations-Dierenzen aller Frequenzb ander momentaner Durchschnitt der AmplitudenModulations-Dierenzen u ander mit ber alle B zeitabh aniger Gewichtung wie AvgModDi1B, allerdings mit anderen Koezienten f ur die zeitabh angige Gewichtung quadr. Mittel der Lautheit der Verzerrungen mittlere Bandbreite des Referenzsignals mittlere Bandbreite des Testsignals lin. Mittel der RauschMaskierer-Verh altnisse Anzahl der B ander mit signikanten Rausch-Komponenten segmentweise berechnetes Mittel der Rausch-MaskiererVerh altnisse (Maximum Filtered Probability of Detection) maximale Wahrscheinlichkeit der Detektion; modelliert die Gewichtung der wahrgenommenen Fehler u ber die Zeit. durchschnittliche, perzeptiv wahrgenommene binaurale Verzerrung durchschnittlicher Fehler der harmonischen Skruktur der Signale

Basic- & Advanced-Versionen von PEAQ


Die vorliegende Empfehlung der ITU beschreibt verschiedene Anwendungsszenarien und teilt diese beiden Varianten von PEAQ zu - Basic und Advanced.
Tabelle 3: Anwendungsszenarien von PEAQ

Anwendung

Beschreibung

Beurteilung Untersuchung von Implemenvon tierungen Ubertragungssystemen z.B. Audio-Codecs Einpegeln schnellere perzeptiv wahr- Prozedur als genommener fr uhere Ger ate/ Qualit at Schaltungen echtzeit kontinuierliche Kontrolle Beurteilen eines Audio Ubertragungskanals Status von ausf uhrliche Ger aten und Analyse von UbertragungsGer aten/ Ubertragungsmedien medien Codecausf uhrliche Identizierung Analyse zur Identizierung von Codecs und deren Implementierung CodecBeurteilung der Entwicklung Ezienz eines Codecs NetzwerkEzienz- und Planung Kostenoptimierung eines u bertragenden Netzwerks Unterst utzung Klassizieren von subjektiven von kritischen Untersuchun- Testsignalen in gen subjektiven Tests

PEAQVariante Basic/Advanced

bildung 4 zeigt die Korrelation zwischen SDG und ODG in unterschiedlichen Varianten von PEAQ in Phase 1 und Phase 3. Die Variante B3 ist das zur Verizierung herangezogene Referenzmodell, das 1996 von der ITU-R bereits getestet wurde. Wie dem Diagramm zu entnehmen weisen die Varianten CombODG sowie CombNnODG eine sehr hohe Korrelation zu den subjektiv ermittelten Werten, den SDGs auf. Allerdings wurden zur Auswertung zwei grundlegende Anforderungungen an das Verfahren gestellt: Echtzeitf ahigkeit und hohe Genauigkeit. So stellten sich FFTNnODG als optimale Variante f ur EchtzeitAnforderungen und CombNnODG als optimale Variante f ur h ochste Genauigkeit heraus.

Basic

Basic

Advanced

Advanced

Abbildung 4: Korrelation zwischen SDG und ODG in Phase 1 und 3

Literaturverzeichnis
Basic/Advanced Alle Inhalte und Graken entstammen [1]. Als LayoutVorlage wurde [2] verwendet.

Basic/Advanced

Literatur
[1] The ITU Radiocommunication Assembly: Method for objective measurements of perceived audio quality, RECOMMENDATION ITU-R BS.1387-1 (1998-2001), URL: http://www.itu.int/rec/R-REC-BS. 1387-1-200111-I/en [2] DAGA-TeX-Vorlage, URL: https://www.isis.tu-berlin.de/file.php/ 4258/LaTex-Vorlage-DAGA2010.zip

Basic/Advanced

Verizierung
Die vom ITU empfohlene Methode PEAQ wurde anhand von subjektiven Tests veriziert. Das neuronale Netzwerk erlernte durch Minimierung des Fehlers zwischen zugef uhrten subjektiven und auszugebenden objektiven Qualit atsmaen die Zuordnung von Modellparametern (MOVs) auf ODG-Werte. Die eigentliche Verizierung wurde in drei Phasen durchlaufen, wobei Phase 3 alle optimierten Koezienten enthielt, die durch beide vorhergehende Phasen approximiert wurden. Folgende Ab-