Sie sind auf Seite 1von 176

Skript zur Vorlesung ber physikalische, technische und medizinische Akustik

Prof. Dr. Dr. Birger Kollmeier

Physikalische Grundlagen der Akustik

Vorwort
Die Akustik ist ein klassischer Zweig der Physik, der ein wenig aus der Mode gekommen zu sein scheint, obwohl akustische Phnomene und die Beherrschung der Akustik fr das tgliche Leben des Menschen eine groe Bedeutung haben: Angefangen von der Bedeutung akustischer Signale als Orientierungshilfe in der Umwelt und Warnsignale, denen man anders als im optischen System nicht etwa durch Zuklappen der Ohren entgehen kann, bis hin zur Sprachkommunikation, zur Wahrnehmung und Empfindung von Musik, zur fr den Menschen in westlichen Industrienationen am meisten beeintrchtigenden Umweltverschmutzung Lrm bis hin zu medizinischen Anwendungen etwa in der Stimm- und Sprachdiagnostik, dem medizinischen Ultraschall, der Lithotripsie oder der Audiologie - die Liste von alltglichen Bereichen, in denen die Akustik eine wesentliche Rolle spielt, liee sich beliebig fortsetzen. Dabei zeigt sich, da die in den letzten Jahren heien Forschungsthemen der Akustik weniger in dem Grundlagenbereich, sondern eher in den Anwendungen und der berlappung der Akustik mit anderen Gebieten, wie etwa der Medizin liegen. Aus diesem Grund ist die vorliegende Ausarbeitung der medizinischen Akustik gewidmet, die sich natrlich auf die ebenfalls zu behandelnde physikalische und technische Akustik entscheidend bezieht. Neben den Grundlagen sollen demnach die Bedeutung akustischer Phnomene fr die Anwendung in der Medizin und praktische Beispiele behandelt werden. Der Aufbau und die Stoffauswahl gliedert sich dabei an den Katalog zur Weiterbildungsordnung zum Medizinphysiker, der Deutschen Gesellschaft fr Medizinische Physik. Dabei wird unterschieden zwischen der medizinischen Akustik und der Audiologie bzw. audiologischen Akustik, so da das groe und fr praktische, klinische Anwendungen wichtige Gebiet der Audiologie in der vorliegenden Ausarbeitung nur sehr knapp angerissen wird. Fr die Teilgebietsbezeichnung Audiologie ist neben den bereits genannten Kursen Audiologie und medizinische Akustik noch der Kurs physikalische Metechnik in der Medizin erforderlich, so da die Inhalte dieser drei Kurse thematisch aufeinander abgestimmt sind. Die vorliegende Ausarbeitung gliedert sich dabei wie folgt:

Physikalische Grundlagen der Akustik

Physikalische Grundlagen der Akustik

GLIEDERUNG
I Physikalische Grundlagen der Akustik

I.1 -Schwingungen und Wellen I.2 -Wellenausbreitung in Festkrpern I.3 -Wellenausbreitung in Gasen und Flssigkeiten I.4 -Wellenwiderstand/Reflexion

II

Erzeugung, Ausbreitung, Messung und Bewertung von Schall

II.1 -Erzeugung von Schall II.1.1 -Monopolstrahler (Strahler 0.Ordnung) II.1.2 -Dipolstrahler (Strahler 1.Ordnung) II.1.3 -Punktstrahler-Synthese II.2 -Ausbreitung von Schall II.2.1 -Gefhrte Schallwellen II.2.2 -Freie Schallausbreitung/Geometrische Akustik II.3 -Druck-, Schnelle- und Intensittsmessung II.4 -Schallpegel, Schalldosis, Lautheit und Lstigkeit II.4.1 -Schallpegel II.4.2 -Schallwirkungund Schalldosis II.4.3 - Lautheit und Lstigkeit

III

Verarbeitung und Analyse akustischer Signale

III.1 -Aufnahme- und Wiedergabetechnik: Bestandteile der bertragungskette III.2 -Diskrete Spektralanalyse III.3 -Zeit-Frequenz-Analyse

4
IV Akustik von Stimme und Sprache

Physikalische Grundlagen der Akustik

IV.1 -Spracherzeugung IV.2 -Akustische Phonetik IV.3 -Sprachbertragung und Sprachsynthese IV.4 -Spracherkennung IV.4.1 -Dynamic-Time-Warping (DTW)-Algorithmus IV.4.2 -Hidden-Markov-Modelle (HMM) IV.4.3 -Neuronales Netz IV.5 -Stimmpathologie

Lrmbekmpfung, Schalldmmung und Schalldmpfung

V.1 -Schallemission und -Immission V.2 -Schalldmmung V.2.1 -Luftschalldmmung V.2.2 -Krperschalldmmung V.3 -Schallabsorption

VI Raum- und Bauakustik

VI.1 -Wellenakustik in Rumen VI.2 -Statistische Raumakustik VI.3 -Subjektive Raumakustik

VII Elektroakustik

VII.1-Mikrofone VII.2-Lautsprecher VII.3 Elektromechanische Analogien VII.4 Kalibrieren elektroakustischer Wandler

Physikalische Grundlagen der Akustik

I. Physikalische Grundlagen der Akustik


I.1. Schwingungen und Wellen
Die periodische Schwingung stellt ein grundlegendes Phnomen der Akustik dar, die in sehr unterschiedlichen Variationen auftreten kann. Als Prototyp eines schwingungsfhigen Systems, an dem man eine Reihe von prinzipiellen Eigenschaften sehr gut studieren kann, betrachten wir eine schwingende Saite, die an beiden Enden in einem Abstand von l eingespannt ist. Dabei bezeichne Fx die Lngsspannung der Saite, d. h. die / Kraft, mit der die Saite angespannt wird und m bezeichne die Massendichte (Masse pro Lnge). Die einfachste Modellvorstellung, wie eine derartige Saite schwingen kann, setzt voraus, da die Gesamtmasse der Saite m in einem Punkt, dem Mittelpunkt vereinigt ist: a) Masse im Mittelpunkt vereinigt:

Abbildung 1.1: Schwingende Saite als 1-Massen-System

Wenn wir mit m = m l die Gesamtmasse bezeichnen, so wirkt auf diese Masse eine Rckstellkraft von
/

Dabei bezeichnet den Auslenkungswinkel und bezeichnet die Auslenkung des idealisierten Massepunktes. Obige Gleichung besagt also, da die Rckstellkraft proportional zur Auslenkung und zur Zugspannung ist, und da diese Rckstellkraft gleich der Trgheitskraft (Masse mal Beschleunigung) der sich bewegenden Masse ist. Durch Auflsung dieser Gleichungen gelangen wir auch auf eine Schwingungsgleichung: 4 Fx = + 2 = 0 0 / 2 ml

Die allgemeine Lsung dieser homogenen, linearen Differentialgleichung zweiten Grades in beschreibt eine harmonische Schwingung mit einer vorgegebenen Amplitude und Phasenlage. Zur Vereinfachung der Rech-

2 Fx = 2 Fx

! / = m l l/2

(I.1)

(I.2)

Physikalische Grundlagen der Akustik

nung und Schreibweise wird diese Lsung gleich als komplexe Gre geschrieben, wobei der physikalisch relevante Teil der Realteil dieser Funktion ist: ( t ) = Re e i 0 t

(I.3)

ist die komplexe Amplitude, deren Betrag die (Maximal)-Amplitude der Schwingung angibt und deren Argument die Phasenlage der Lsung angibt. Als Grundfrequenz 0, d. h. Kreisfrequenz, mit der die allgemeine Lsung eine Schwingung beschreibt, errechnet sich ein Wert zu:

0 =

Fx 2 l m/

(I.4)

Diese Abhngigkeit der Schwingungs-Eigenfrequenz von der Wurzel aus dem Quotienten aus Zugspannung und Massenbelegung sowie von einer Gre, die umgekehrt proportional zur Lnge ist, ist leider nur approximativ richtig. Die Abhngigkeit von der Lnge der Saite wird zwar richtig beschrieben und damit wird auch die pythagorische, musikalische Tonskala beschrieben: Bei der reinen Stimmung, die Pythagoras anhand von systematischen Lngennderungen von schwingenden Saiten untersucht hat, ergibt sich eine Oktave gerade bei Halbierung der Saitenlnge, eine Quinte gerade bei Verkrzung der Saitenlnge um den Faktor 2/3, eine Quarte bei 3/4, eine groe Terz bei 4/5 usw.. Obwohl durch die Einfhrung der wohltemperierten Stimmung in der musikalischen Praxis nicht exakt diese pythagorischen Frequenzverhltnisse eingehalten werden, zeigt jedoch diese einfache Betrachtung bereits qualitativ den richtigen Zusammenhang zwischen Saitenlnge und Eigenfrequenz. Die errechnete Eigenfrequenz 0 ist allerdings um den Faktor /2 falsch, so da eine bessere Nherung an die Schwingung einer wirklichen Saite erforderlich ist. b) 2-Massen-Modell: Diese Nherung teilt die Gesamtmasse der schwingenden Saite in 2 TeilMassen auf, die jeweils l/4 von einem Ende der Saite entfernt aufgehngt sind. Wenn die Auslenkung der ersten Masse mit 1 und der zweiten Masse mit 2 bezeichnet wird, gelten die folgenden beiden Bewegungsgleichungen fr die beiden Massen, die jeweils aus der Rckstellkraft und der Beschleunigungskraft abgeleitet werden:

Physikalische Grundlagen der Akustik


/ 1 1 m l Fx 2 + = 1 l/2 l / 4 2

7
(I.5)

/ 2 2 m l Fx 1 + 2 = l/2 l / 4 2

(I.6)

Abbildung 1.2: Schwingende Saite als 2-Massen-System

Durch Ausmultiplizieren dieser gekoppelten, linaren Differentialgleichung zweiter Ordnung mit der Variablen-Substitution

0 =

2 Fx l m

(I.7)

folgt: 1 2 + 32 = 0 2 0

1 +

(I.8)

Um dieses System lsen zu knnen, setzen wir fr die Schwingungen 1 bzw. 2 an:

2 1 + 3 2 2 = 0 0

Eine nichttriviale Lsung fr dieses Gleichungssystem in 1 und 2 ergibt sich, falls die Koeffizientendeterminante gleich 0 ist, so da die Gleichung umgeformt werden kann zu: 2 3 2 1 = 0 0
2

1/ 2 = Re 1/ 2 e it

2 3 2 1 2 = 0 0

(I.9)

(I.10)

Physikalische Grundlagen der Akustik

Hieraus folgt, da es zwei Eigenschwingungen gibt, deren jeweilige Frequenz wir mit und bezeichnen: I. I = 2 0 , 1 = 2 , gleichphasig II = 2 0 , 1 = 2 , gegenphasig

(I.11)

II.

(I.12)

Die erste Eigenschwingung ist eine bessere Nherung an die Grundmode der Saitenschwingung als das Ein-Massen-Modell, die Frequenz I ist allerdings immer noch um 10% falsch. Die zweite Schwingungsform weist einen Schwingungsknoten in der Mitte auf, wobei jede Hlfte der Gesamtsaite mit derselben Nherung beschrieben wird wie das Ein-Massen-Modell der Gesamtsaite (s. o.). Es handelt sich hierbei um die erste Oberschwingung.

Abbildung 1.3: Eigenmoden des 2-Massen-Systems

Die allgemeine Lsung dieses Zwei-Massen-Modells wre die Linearkombination aus den Schwingungsmoden I und II, so da mit den jeweiligen komplexen Schwingungsamplituden insgesamt 4 Parameter festzulegen wren. c) n-Massen-Modell Die Annherung an eine kontinuierliche Massenverteilung lt sich beliebig fortfahren, wenn die schwingende Saite als ein System von n Massen aufgefat wird, wobei fr jede Teilmasse mit der Auslenkung k die folgende Gleichung auftreten wrde:

Physikalische Grundlagen der Akustik


/ k k k 1 m l Fx k +1 k = l/n l/n n

9
(I.13)

Dieses n-Massenmodell wrde damit n Eigenschwingungen der Saite als Resultat liefern, so da 2n Parameter als Anfangsbedingungen zur eindeutigen Festlegung der jeweiligen Schwingungsform notwendig wren. Erfolgversprechender ist jedoch der d) Modellansatz als eindimensonales Kontinuum:

Abbildung 1.4: Schwingende Saite als eindimensionales Kontinuum

Auf ein differentielles Lngs-Element der Saite mit der Lnge dx lt sich das Gleichgewicht aus Rckstellkraft und Beschleunigungskraft aufgrund des sich entlang von dx ndernden Auslenkungswinkels berechnen als:
d m' dx = Fx + dx dx

2 d2 Fx 2 d 2 2 = c 2 , c = dt dx m' Eindimensionale Wellengleichung

(I.14)

Es folgt also direkt die allgemeine Form der Wellengleichung fr diesen speziellen Fall der eindimensionalen Wellenausbreitung, bei der die zweite zeitliche Ableitung proportional zur zweiten rtlichen Ableitung ist. Die Proportionalittskonstante c beschreibt dabei die Phasengeschwindigkeit. Eine allgemeine Lsung dieser Wellengleichung nach dAlembert beschreibt eine beliebig geformte Strung, die sich entweder in + oder x-Richtung mit der Geschwindigkeit c ausbreiten kann:
(x, t ) = + (x ct ) + (x + ct )

(I.15)

Die Saitenschwingung kann also als berlagerung zweier gegengesetzter gleicher fortschreitender Wellen aufgefat werden, was auch als stehende Welle bezeichnet wird:

10

Physikalische Grundlagen der Akustik

( x, t ) = Re ( e ik ( x+ ct ) + e ik ( x ct ) ) = Re 2 e ikx cos kct

(I.16)

Charakteristisch fr diese Form der stehenden Welle ist die multiplikative Verknpfung der periodischen Ortsabhngigkeit mit der periodischen Zeitabhngigkeit, so da die Welle nicht fortschreitet, sondern ortsfest ist, aber sich zeitlich sinusfrmig verndert. Diese Separation zwischen Zeitund Ortsabhngigkeit wird in der spezielleren Lsungsmethode nach Bernoulli bereits im Ansatz vorweggenommen:

( x, t ) = Re (x) e it

(I.17)

Beim Einsetzen dieses Ansatzes in die Wellengleichung ergibt sich: d2


2 2 = d + k 2 = 0 ( x) = e ikx + e ikx + 1 2 dx 2 c dx 2

(I.18)

Diese Lsung ist periodisch im Ort x, wobei die Gre 2 = c

k=

(I.19)

den Betrag des Wellenvektors darstellt, der umgekehrt proportional zur Wellenlnge ist. Unter den Randbedingungen der schwingenden Saite: x = 0: = 0 x = l: = 0

(I.20)

ergibt sich als Lsung:

( x) = n sin k n x , mit knl=n

(I.21)

Fr die schwingende Saite lt sich also eine unendliche Zahl von Eigenschwingungen angeben, die sich durch jeweils ein n IN beschreiben lassen und fr die die Schwingungsfrequenz n auftritt:

n =

nc nc , ist bzw. f n = l 2l

(I.22)

Physikalische Grundlagen der Akustik

11

Abbildung 1.5: Einige Eigenmoden des eindimensionalen Kontinuums

Diese verschiedenen Schwingungsmoden beschreiben gerade den F Grundton mit der Frequenz 1 = x mit den Obertnen, die jeweils l m' ganzzahlige Vielfache dieser Grundfrequenz sind und durch Unterteilung der Gesamt-Lnge der schwingenden Saite in n gleich groe Abstnde zwischen benachbarten Knoten charakterisiert werden. Welcher dieser Schwingungsmoden mit welcher Amplitude angenommen wird, mu allerdings durch die Randbedingungen bzw. die Anfangsbedingungen festgelegt werden. Die allgemeine Lsung hat die Form: ( x, t ) = Re n sin k n x e i n t
n =1

(I.23)

Die Koeffizienten n sind eindeutig durch die Anfangsverteilungen (x,0) bzw. durch die zeitlichen Ableitungen zum Zeitpunkt 0 festgelegt. Fr das praktische Beispiel des Klangs eines Musikinstruments bedeutet das, da der Frequenzgehalt der Saitenschwingung durch die Form der Schwingungsanregung der Saite vollstndig festgelegt ist. Man kann also einem Gitarrenton selbst einige Zeit nach dem Anzupfen noch anhren ob er hart oder weich angezupft wurde (obwohl in der Realitt eine unterschiedliche Dmpfung der verschiedenen Schwingungsmoden vorhanden ist, die hier der Einfachheit halber nicht bercksichtigt werden).

I.2 Wellenausbreitung in Festkrpern


In Festkrpern sind sowohl Longitudinalwellen als auch Transversalwellen ausbreitungsfhig. Bei den Longitudinalwellen schwingen die Partikel des (sich als elastisch verformbar vorgestellten) Festkrpers parallel zur Ausbreitungsrichtung des Schalls um ihre Ruhelage herum, so da es lokale Verdichtungszonen und Zonen mit geringerer Dichte ergibt. Bei den Transversalwellen schwingen die Teilchen dagegen senkrecht zur Ausbreitungsrichtung um ihre Ruhelage (vgl. Abbildung 1.6). Beide Wellenformen sind in einem unendlich ausgedehnten Festkrper nicht unabhn-

12

Physikalische Grundlagen der Akustik

gig von einander zu betrachten, wobei die genaue Form der Wellenausbreitung von der Geometrie des Festkrpers bzw. seinen Abmessungen in Relation zur Wellenlnge abhngt. Generell ist jedoch die Ausbreitungsgeschwindigkeit fr die Longitudinalwellen schneller als die fr Transversalwellen. Um die Wellenausbreitung in Festkrpern quantitativ verstehen zu knnen, mssen zunchst die elastischen Eigenschaften des Festkrpers beschrieben werden, da sie fr die mikroskopische Beschreibung der Wellenausbreitung von Bedeutung sind.

Abbildung 1.6: Transversal- und Longitudinalwelle

Als elastische Konstanten des Festkrpers sind die folgenden Gren definiert: Der Elastizittsmodul E setzt die Dehnung eines Krpers (d. h. die relative Lngennderung l / l, die durch eine Zugspannung auf dem Festkrper hervorgerufen wird) in eine Proportionalittsbeziehung zu dieser Zugspannung, die als Kraft F geteilt durch die angreifende Flche S ausgedrckt wird: l 1 F Dehnung = Spannung l E S

(I.24)

Diese Beziehung wird auch als Hookesches Gesetz bezeichnet. Wenn der Festkrper nun in die eine Richtung ausgedehnt wird, schrumpft er zugleich in den beiden Abmessungen, die quer zu der Ausdehnungsrichtung liegen, so da mit einer relativen Lngennderung l / l zugleich eine Verringerung des Querschnitts A / A verbunden ist. Dieses Verhltnis aus Querkontraktion und Lngsdehnung wird als Poissonsche Querkontraktionszahl bezeichnet, fr die gilt:

Physikalische Grundlagen der Akustik

13
A l / A l
Quer
  

=


(I.25)

Lngs
 

Dehnung

Aufgrund der Massenerhaltung ist der Bereich von mglichen Querkontraktionszahlen stark eingeschrnkt, so da fr die meisten Stoffe ein Wert von = 0,25 angenommen wird. Wenn im Gegensatz zu der LngsDehnung des Festkrpers eine allseitige Kompression des Festkrpers auftritt, wird aufgrund einer hnlichen Gesetzmigkeit wie bei Gleichung (I.24) eine Proportionalittsbeziehung zwischen einer Druckerhhung p (d. h. Kraft pro Flcheneinheit) und der relativen Volumennderung V / V eintreten. Die zugehrige Proportionalittskonstante wird als Kompressionsmodul K bezeichnet: V V


p
Druckaenderung


= K

Volumenaenderung

Als letzte elastische Konstante, die die elastischen Eigenschaften eines Festkrpers kennzeichnet, sei der Schubmodul G erwhnt, der bei einer Scherung des Festkrpers auftritt, z. B. bei einem Wrfel, bei dem die Oberseite nach rechts und die Unterseite nach links gezogen wird, so da 2 ein Schubspannung F / d auftritt, die zu einem Scherwinkel fhrt, um den der Wrfel sich schrg verformt; d bezeichnet dabei die Kantenlnge des Wrfels an der Stirnflche. Fr den Schubmodul G gilt damit: F Schubspannung 2 = G Scherwinkel d

Da smtliche elastischen Konstanten hnliche Eigenschaften des Festkrpers beschreiben, hngen sie bei isotropen Krpern so zusammen, da es nur zwei unabhngige Konstanten gibt und die restlichen Konstanten aus diesen berechenbar sind. Beispielsweise gilt fr den Schubmodul: E 2(1 + )

G=

Anhand dieser elastischen Konstanten lassen sich nun fr verschiedene Festkrper die unterschiedlichen Wellenausbreitungsformen mit den zu-

(I.26)

(I.27)

(I.28)

14

Physikalische Grundlagen der Akustik

gehrigen Ausbreitungsgeschwindigkeiten angeben. Fr den Fall des unendlich ausgedehnten Festkrpers wird die sich darin ausbreitende Longitudinalwelle als Dichtewelle bezeichnet, weil sie zu lokalen Vernderungen der Dichte des Krpers fhrt. Die zugehrige Schallgeschwindigkeit cL betrgt: E(1 ) (1 + )(1 2 )

cL =

(I.29)

Wobei die Dichte des Krpers beschreibt. Die in dem Krper ebenfalls ausbreitungsfhige Transversalwelle wird als Schubwelle bezeichnet, weil sie zu einer Scherung des Krpers in mikroskopischem Mastab fhrt. Die zugehrige Schallgeschwindigkeit der Transversalwelle betrgt:
2(1 ) ~ 3 , da = 0.25 fr viele Stoffe 1 2

ct =

c G L = S ct

(I.30)

Die Schallgeschwindigkeit der Longitudinalwelle ist also deutlich grer als die der Transversalwelle. Wenn man einen ausgedehnten Festkrper daher an einer Seite mechanisch zur Schwingung anregt, kann an einer anderen Stelle im Festkrper, die weit genug von dieser Anregungsstelle entfernt ist, zu zwei unterschiedlichen Zeitpunkten eine von diesem Ereignis angeregte Wellenfront auftreten. Dieses Phnomen tritt bei Luft- und Wasserschall nicht auf, da dort nur Longitudinalwellen auftreten (siehe I.3). In begrenzten Festkrpern hngt die Form der verschiedenen Wellentypen und ihre zugehrigen Ausbreitungsgeschwindigkeiten z. T. von der Geometrie des Festkrpers ab. Als Prototyp betrachten wir die Wellenausbreitung in einem rechteckfrmigen Stab, bei dem die Longitudinalwelle als Dehnwelle bezeichnet wird. Die Longitudinalwelle fhrt zu lokalen Verdichtungen (mit Vergrerung des Querschnittes) und Verjngungen des Stabs. Wenn wir ein Volumenelement des Stabes an der Position x0 betrachten, das sich von x0 bis nach x0 + dx0 erstreckt, so tritt bei x0 die Zugspannung und die Auslenkung in Longitudinalrichtung auf. An dem Ort x0 + dx0 treten die entsprechenden, um das Differential vernderte Gren auf, also: F l = E = E x 0 S l

(I.31)

Physikalische Grundlagen der Akustik

15

Abbildung 1.7: Differentielles Volumenelement eines rechteckfrmigen Stabes bei dem sich eine Dehnwelle ausbreitet

Wenn S die Querschnittsflche bezeichnet, kann somit die Kraft auf das Volumen aus der Differenz der beiden Zugspannungen berechnet werden. Weiterhin kann die Masse als Volumen Dichte errechnet werden, so da nach dem Newtonschen Gesetz sich die Beschleunigung des Volumenelements errechnet zu: S dx 0 = S dx 0 x 0
Masse Kraft auf Volumen
$ % ' % & $ % " # !

2 t 2
Beschleunigung

(I.32)

Aus dieser Proportionalitt zwischen zweiter partieller Ableitung nach dem Ort und zweiter partieller Ableitung nach der Zeit kann (zusammen mit (I.31)) die Schallgeschwindigkeit der Dehnwelle angegeben werden mit:
2 2 = x 2 E t 2 E in Stben

c Dehnw. = c Dehnw.

E = 1 2

(I.33)

in Platten

Als weitere Ausbreitungsform in begrenzten Festkrpern existiert die Torsionswelle, bei der sich eine Drehschwingung oder Torsionsschwingung senkrecht zur Ausweitungsrichtung ausbildet, fr deren Ausbreitungsgeschwindigkeit gilt:

16
cT =

Physikalische Grundlagen der Akustik

G kreisfrmiger Querschnitt

(I.34)

G = 0.92 qudratischer Querschnitt

Die Transversalwelle in begrenzten Festkrpern wird als Biegewelle bezeichnet, weil der Festkrper (im mikroskopischen Mastab) verbogen wird. Fr einen Stab der Dicke d ergibt sich die Schallgeschwindigkeit zu: Ed 2 12

c B St = 4

(I.35)

Whrend sie sich fr eine Biegewelle auf Platten

c B Pl = 4

12 1 2

Ed 2

(I.36)

ergibt. Im Gegensatz zu den vorher behandelten Wellenausbreitungsformeln hngt bei dieser Wellenausbreitungsform die Schallgeschwindigkeit von der Frequenz ab, so da eine sogenannte Dispersion auftritt, bei der die unterschiedlichen Frequenzen eine unterschiedliche Laufzeit von einem Ende des Festkrpers zum anderen aufweisen. Wenn also auf der einen Seite des Festkrpers ein aus mehreren Frequenzen bestehendes Wellenpaket (oder Wellengruppe) auf das Medium gegeben wird, kommt am anderen Ende des Festkrpers eine andere, unter Umstnden verschmierte Form dieses Wellenpakets an, da bestimmte Frequenzen voreilen und andere Frequenzen relativ spt eintreffen. Diese Dispersion ist also dadurch gekennzeichnet, da die Phasengeschwindigkeit ungleich der Gruppengeschwindigkeit ist: cPhase cGruppe (I.37)

Aufgrund dieser Dispersionseigenschaft und auch der Ausbreitung von verschiedenen Wellentypen mit unterschiedlichen Laufzeiten wurden frher groe Metallplatten in der Studiotechnik als Nachhallplatten verwendet. Bei Ihnen wurde der in natrlichen, groen Rumen durch die Reflexion auftretende Nachhall dadurch simuliert, da innerhalb der Nachhall-

Physikalische Grundlagen der Akustik

17

platte unterschiedliche Wellenausbreitungen zwischen einem Schwingungserreger und einem an einer anderen Stelle angebrachten Schwingungsaufnehmer ausgenutzt wurden. Aufgrund der Verfgbarkeit digitaler Hallgerte ist die Anwendung dieser z. T. sehr groen und schweren mechanischen Gerte jedoch aus der Mode gekommen. An der Oberflche von Festkrpern knnen sich sogenannte Rayleighwellen fortpflanzen, die eine Transversalwelle direkt auf der Oberflche sind, aber nur eine begrenzte Eindringtiefe in den Festkrper besitzen. Fr sie gilt: G < c Schubwelle, Festkoerper , mit = 0.93 fr Metalle

cR =

(I.38)

I.3 Wellenausbreitung in Gasen und Flssigkeiten (Longitudinalwellen)


Da in Gasen und Flssigkeiten die mikroskopischen Partikel nicht elastisch an einen festen Ort im Raum gebunden sind, sondern sich frei bewegen knnen, sind in Gasen und Flssigkeiten nur Longitudinalwellen ausbreitungsfhig. Mit diesen Longitudinalwellen werden wir uns daher im folgenden fast ausschlielich beschftigen. Um auf die Wellengleichung und die zugehrige Schallgeschwindigkeit fr die Ausbreitung von Schallwellen in Luft bzw. Flssigkeiten zu kommen, mssen wir zunchst festhalten, da sowohl der Druck als auch die Dichte in diesen Medien eine statische Gleichkomponente aufweist (z. B. der statische Luftdruck auf der Erdoberflche und die zugehrige Dichte der Luft) und das durch den Schalldruck bzw. durch die Schallausbreitung hervorgerufene Dichtenderungen sich als (u. U. sehr kleine) Wechselgre auf diese statischen Werte aufaddieren: p( x, t ) = p + p ~ (I.39)

(x, t) = - + ~

(I.40)

Dabei hngt sowohl der Druck als auch die Dichte vom Ort x und der Zeit t ab. Um die Schallausbreitung vollstndig zu beschreiben, bentigen wir noch die Schallschnelle, d. h. den vom Ort x und der Zeit t abhngigen Vektor v(x,t), der die Wechsel-Geschwindigkeitskomponente der an der Schallausbreitung beteiligten Teilchen kennzeichnet.

18

Physikalische Grundlagen der Akustik

Um nun zur Wellengleichung zu kommen, betrachten wir wieder ein infinitesimales Volumenelement, auf das als Kraft gerade der Gradient des Schalldrucks wirkt (d. h. die lokale nderung des Schalldruckes), und bei dem aufgrund des Newtonschen Gesetzes die Beschleunigung als zeitliche Ableitung der Schnelle auftritt. Die Masse dieses Volumenelements wird durch die Dichte beschrieben, also:

Abbildung 1.8: Infinitesimales Volumenelement eines Gases oder einer Flssigkeit

grad p =
)

Kraft

Masse

d v dt

= v + (v grad )v t

(I.41)

Diese Kraftgleichung auf das infinitesimale Volumenelement wird als Eulersche Gleichung bezeichnet. Weiterhin bentigen wir die Kontinuittsgleichung, die die aus einem Volumenelement dV herausstrmende Masse proportional zu der Dichtenderung in diesem Volumen-Element setzt:
div( v)
aus dV herausstrmende Masse
7 6 5 6 4

Dichtende rung

Als dritte Gleichung bentigen wir eine Beziehung zwischen dem SchallWechseldruck und dem Wechselanteil der Dichte , die in dem oben behandelten Fall des Festkrpers gerade durch die elastischen Konstanten des Festkrpers gegeben wurde. Diese Proportionalitt wird beschrieben als p~ = c2 ~ (I.43)

Bei Gasen wird diese Proportionalitt zwischen komprimierenden Druck und Zunahme der Dichte durch die adiabatische Zustandsgleichung gegeben, also

( 3 2 2

Beschleunigung

(I.42)

Physikalische Grundlagen der Akustik

19
(I.44)

p V = const.

Aus der adiabatischen Zustandsgleichung folgt: dp p const. d dV = , = = dV V V V p dp = d

(I.45)

c Gas =

(I.46)

bezeichnet dabei den adiabatischen Expansionskoeffizienten und p und die Gleichanteile von Druck bzw. Dichte des Gases. In Flssigkeiten ist die Proportionalitt zwischen Durckerhhung und Volumenverringerung gerade durch den Kompressionsmodul gegeben, also:

K = p

V = p~ V ~
K

(I.47)

c Flss =

Um nun zur Wellengleichung zu gelangen, wenden wir den DivergenzOperator auf die Eulersche Gleichung an, sowie eine partielle zeitliche Differentiation auf die Kontinuittsgleichung Also:
div grad p ~ = -div v - div[ ( v grad )v] t
vernachls sigen 2 2 (div( v)) = div t- v + div t v = - t = - c12 t 2p 2 t vernachls sigen, da ~ <<
A @ 9 @ 8 A @ @ @ 9 @ @ 8

(I.48)

(I.49)

Unter Vernachlssigung der konvektiven Terme in Gleichung (I.48) und des ersten Terms in Gleichung (I.49), knnen wir dann beide Gleichungen zusammenfassen zur Wellengleichung:

20
p ~ = 1 c2 p~ t
2

Physikalische Grundlagen der Akustik

(I.50)

Die allgemeinste Lsung der Wellengleichung hat die Form: x x0 p( x, t ) = p 0 g t c

(I.51)

D. h. eine beliebige Strung, die sich mit der Geschwindigkeit c in x-Richtung ausbreitet, ist eine Lsung der Wellengleichung. Da es sich um eine lineare, homogene Gleichung handelt, ist aber auch eine beliebige Linear-Kombination von Lsungen der Wellengleichung eine weitere Lsung der Wellengleichung. Daher bietet es sich an, jede mgliche Lsung der Wellengleichung als Linearkombination von elementaren Wellen zu beschreiben, d. h. ebenen, fortschreitenden Wellen mit der Kreisfrequenz und der Ausbreitungsrichtung k/|k|, deren Zeitfunktion propor-i( t+k x) tional zu dem Realteil von e ist, also: p(x, t ) = Re P(k , ) e i(t + kx )

(I.52)

Diese elementare Lsung beschreibt also eine sinusfrmig in k-Richtung fortschreitende, ebene Welle mit der Kreisfrequenz = 2f (f = Frequenz). Dabei mu der Betrag des Wellenvektors k die folgende Bedingung aufweisen:

k =

2 = c

(I.53)

P(k, ) beschreibt damit die Amplitude dieser Elementarwelle, die zugleich die Phaseninformation enthalten kann, wenn man P(k, ) ebenfalls als komplexe Zahl whlt und als physikalische Gre nur den Realteil der Welle nach Gleichung (I.52). Damit lt sich jedes beliebige Feld von Wellen zerlegen in Elementarwellen p(x, t), die sich jeweils eindeutig durch die Amplituden P(k, ) festlegen lassen. Diese Beziehung zwischen der Darstellung des Wellenfeldes im Orts-Raum und als Funktion der Zeit p(x, t) und der dazu quivalenten Darstellung des Wellenfeldes als Funktion des Wellenvektors k und der (Kreis-)Frequenz stellt gerade die Fouriertransformations-Beziehung dar:

Physikalische Grundlagen der Akustik

21
(I.54)

p(x, t ) = P(k , ) e i(t + k x ) dk d P( k , ) = 1 2

p( x, t ) e

i ( t + k x )

dx dt

(I.55)

p(x, t) und P(k, ) lassen sich also eindeutig auseinander hervorrechnen. Diese Art der quivalenten Beschreibung wird auch in der Quantenmechanik zur Beschreibung von Zustnden angewand, die entweder im Ortsraum oder im Impulsraum dargestellt werden, wobei der Impuls gerade den Wellenvektor multipliziert mit entspricht. Fr den Fall der Akustik sind die folgenden Spezialflle von Wichtigkeit: Fall A: Ort x und Raumfrequenz k sind fest vorgegeben. In diesem Fall interessiert nur die Zeitfunktion p(t) und das zugehrige Spektrum P(), weil beispielsweise nur das Schallfeld an einem festen Ort betrachtet wird und die Richtungsabhngigkeit des Schallfeldes keine Rolle spielt. Dies kann beispielsweise fr ein Mikrophon der Fall sein, das an einem festen Ort steht und empfindlich fr alle Schalleinfallsrichtungen ist (Kugelcharakteristik). Fall B: Zeitpunkt t und Frequenz sind vorgegeben. In diesem Fall wird fr eine vorgegebene Frequenz zu einem eingefrorenen Zeitpunkt die rumliche Verteilung des Schalldrucks p(x) betrachtet, die als Fouriertransformierte zur Raumfrequenz-Verteilung P(k) aufgefat werden kann. Die verschiedenen Wellenvektoren k werden auch als Raumfrequenzen bezeichnet, weil hohe Betrge von k zu kleinen Wellenlngen gehren, was in hnliche Weise fr hohe zeitliche Frequenzen gilt. Da die Wellenvektoren k jedoch auch immer eine rumliche Komponente aufweisen, ist diese Analogie zu der eindimensionalen Frequenz nur sehr begrenzt zu ziehen. Ein Beispiel fr diesen Fall bietet die Schalldruckverteilung, die ein Lautsprecher in einen bestimmten Raum fr eine bestimmte Abstrahlfrequenz hervorruft. Dabei interessiert weniger das zeitliche Signal, dafr aber mehr die Orts- und Richtungsabhngigkeit des Schallfeldes.
B

22 I.4 Wellenwiderstand/Reflexion

Physikalische Grundlagen der Akustik

Um den Zusammenhang zwischen dem Schalldruck und der Schallschwelle aufzeigen zu knnen, gehen wir von einer beliebigen Schalldruckwelle p = g(t + kx) (I.56)

aus. Fr diese allgemeine Lsung der Wellengleichung gilt aufgrund der Eulerschen Gleichung (I.41): grad p = -g (t + k x) k = v t Durch zeitliche Integration ergibt sich damit fr die Schnelle: k g(t + kx)

(I.57)

v=

(I.58)

Durch Einsetzen von g(t + kx) ergibt sich dann: 1 p c

v =

(I.59)

Dabei ist der Betrag von v im Sinne eines vektoriellen Betrags zu verstehen, da Schalldruck und Schallschnelle zeitlich nicht unbedingt in Phase sein mssen. Dies lt sich dadurch ausdrcken, da die Proportionalittskonstante zwischen (rumlichen) Betrag der Schallschnelle und dem Schalldruck eine komplexe Gre ist. Diese Proportionalittskonstante zwischen Schalldruck und Schnelle wird als Wellenwiderstand bezeichnet: p~ = c v~

Z=

(I.60)

Der Ausdruck Widerstand soll damit die Analogie zum elektrischen Widerstand R = U/I signalisieren, da die Spannung hnlich wie der Schalldruck mit der Kraft zusammenhngt und die Schnelle mit einem Teilchenstrom.

Physikalische Grundlagen der Akustik

23

Der Wellenwiderstand spielt eine wichtige Rolle bei der Reflexion einer fortschreitenden Welle bei dem bergang von einem Medium mit dem Wellenwiderstand Z in ein anderes Medium mit dem Wellenwiderstand Zw. Unter der Annahme, da die einfallende Welle den Schalldruck pe und die Schnelle ve aufweist, sowie die reflektierte Welle die entsprechenden Gren pr und vr und die weitergeleitete Welle die Gren pw und vw, gilt fr die Schalldrcke eine skalare Addition (d. h. pe + pr = pw, whrend fr die Schallschnellen eine vektorielle Addition (ve - vr = vw) resultiert. Unter der Annahme, da der Schall senkrecht auf die Begrenzungsflche einfllt, so da der reflektierte Schall um 180 Grad seine Richtung ndert und der weitergeleitete Schall in der gleichen Richtung wie der einfallende Schall sich weiter ausbreitet, gilt dann: Z w = p w / v w = Z(p e + p r ) / (p e p r ) (I.61)

Abbildung 1.9: Senkrechter Einfall von Schall auf eine Grenzflche zwischen einem Medium mit Wellenwiderstand Z (links) und Wellenwiderstand Zw (rechts)

Falls die Einfallsrichtung nicht senkrecht auf der Begrenzungsflche steht, gelten die Gesetzesmigkeiten des Brechungsgesetzes (vgl. Kapitel II). Mit Hilfe der Gleichung I.61 und den vorhergehenden Annahmen lt sich der Reflexionsfaktor r angeben als das Verhltnis des Schalldrucks der reflektierten Welle zum Schalldruck der einfallenden Welle, also: r = p r / p e = (Z Z w ) / ( Z + Z w ) (I.62)

Je nach Verhltnis zwischen Z und Zw kann r verschiedene Werte zwischen +1 und -1 annehmen, die u. U. auch komplex sind (d. h. wenn eine Phasenverschiebung zwischen einfallender und reflektierter Welle auftritt, die ungleich 0 oder ungleich ist). Fr den Fall eines schallharten bergangs (Zw ) ergibt sich ein Reflexionsfaktor r = -1, d. h. smtlicher Schall wird reflektiert und eine Phasendrehung der Schalldruckwelle um 180 Grad findet statt. hnlich sind die Verhltnisse beim schallweichem bergang (Zw 0), bei dem ein Reflexionsfaktor r = +1 auftritt, so da smtliche Schallenergie reflektiert wird und kein Phasensprung der Schalldruckwelle auftritt. Fr den Fall gleicher Wellenwiderstnde (Zw = Z)

24

Physikalische Grundlagen der Akustik

betrgt der Reflexionsfaktor r = 0, d. h. es treten keinerlei Reflexionen auf und der Schall wird ohne Energieverluste in das Medium 2 weitergeleitet. Wenn man an einer mglichst verlustfreien berleitung der Schallenergie von einem Medium an das andere Medium interessiert ist, sollte daher der Wellenwiderstand mglichst gut einander angeglichen werden. Ein Beispiel fr eine relativ schlechte Anpassung ist das Verhltnis aus dem 6 -2 -1 Wellenwiderstand von Wasser, der den Wert Z = 1,4810 kg m s an-2 -1 nimmt, whrend Luft einen Wellenwiderstand Z = 414 kg m s aufweist. Als Reflexionsfaktor ergibt sich damit r = 0,9994, d. h. fast die gesamt Schallenergie wird an der Grenzflche zwischen Luft und Wasser reflektiert und nur ein kleiner Anteil (Abschwchung um den Faktor 3.000, entsprechend etwa 29 dB Abschwchung) wird durchgelassen. Aus diesem Grund ist im Wasser der ber dem Wasser in der Luft fortgeleitete Schall nur sehr schwer hrbar und umgekehrt. Im Ohr besteht das Problem, die in Luft fortgeleiteten Schallwellen in das mit Flssigkeit gefllte Innenohr zu bertragen. Damit dieses mglichst verlustfrei und ohne Reflexionen geschehen kann, tritt das Mittelohr in Aktion, da eine Impedanztransformation etwa um einen Faktor 40 bewirkt und damit die potentiell starke Abschwchung beim bergang zwischen Luftschall und Schall im Innenohr stark reduziert.

Erzeugung, Ausbreitung, Messung und Bewertung von Schall

25

II Erzeugung, Ausbreitung, Messung und Bewertung von Schall


II.1 Erzeugung von Schall
Fr die Erzeugung von Luftschall existieren ebenso wie fr die Anregung von Krperschall eine Reihe von unterschiedlichen Mechanismen. Dabei werden unterschiedliche Formen von Energie in mechanische Schwingungsenergie umgewandelt, die sich in Luft bzw. Materie ausbreitet. Beispiele fr eine mechanische Anregung einer Luftschallwelle sind Saiteninstrumente, Schlagzeug und die Knalltte. Strmungsmechanische Anregungen treten dabei bei Blasinstrumenten, Orgelpfeifen, der menschlichen Stimme und dem Autoauspuff auf. Bei der elektromechanischen Anregung im Lautsprecher oder Ultraschall-Wandler wird dagegen elektrische Energie in mechanische Schwingungsenergie umgesetzt. Es gibt aber auch Beispiele von thermisch aktivierter Schwingungsanregung (z. B. Gaspfeifen), bei denen die Wrmezufuhr in Interaktion mit der Schallwelle tritt und bei richtiger Phasenlage dieser Interaktion zu einer Verstrkung einer periodischen Schwingung fhrt. Obwohl es so viele unterschiedliche Anregungsformen von Schall gibt, ist die Schallausbreitung in Luft, die durch diese Anregungen hervorgerufen wird, fr alle Flle weitgehend gleich. Eine wichtige Rolle spielt dabei die charakteristische Abmessung der Schallquelle a, die im Verhltnis gesetzt wird zur Wellenlnge bzw. Wellenvektor |k| = 2/. Dafr gilt ka << 1: Form der Anregung ist irrelevant (Kugelwelle, Monopolstrahler) ka = 1: Beugungseffekte durch Form der Anregungsflche ka >> 1: Geometrische Akustik (Schallstrahlen)

Abbildung 2.1: Abstrahlcharakteristik fr verschiedene Frequenzen, die durch das Verhltnis aus Abmessung der Quelle a und Wellenlnge gekennzeichnet sind.

26

Erzeugung, Ausbreitung, Messung und Bewertung von Schall

Da in dem Frequenzbereich der Hrakustik von ca. 20 Hz bis ca. 20.000 Hz fr realistische Lautsprecheranordnungen smtliche dieser drei Flle vorkommen, mu sich fr jede Strahleranordnung berlegt werden, ob es sich um eine Langwellen-Nherung (k a << 1) oder eine Nherung fr sehr kleine Wellenlngen handelt, bei denen die Wellennatur der Akustik in den Hintergrund tritt und eine geometrische Akustik in Kraft tritt, die eher den Charakter einer Schallteilchen-Beschreibung hat.

II.1.1 Monopolstrahler (Strahler 0.Ordnung)


Die einfachste Approximation fr einen Schallstrahler ist das Modell der atmenden Kugel, d. h. eines radialsymmetrischen Kugelstrahlers des Radius r = a, dessen Oberflche mit der radialen Schnelle va bei einer vorgegebenen Frequenz vibriert:

Abbildung 2.2: Radialsymmetrischer Kugelstrahler ("atmende" Kugel)

Um den Schalldruck auszurechnen, der von diesem Strahler abgestrahlt wird, wenden wir die Wellengleichung an: 1 d2 p = + 2 2 p c dt

(II.1)

Fr den rotationssymmetrischen Fall, fr den wir ein Kugelkoordinatensystem benutzen, bei dem der Schalldruck nur von dem Radius, nicht aber von den und abhngt, hat der Laplace-Operator die Form:

2 2 + r2 r r

(II.2)

Daraus folgt fr die Wellengleichung: 2 p 2 1 2 + p 2 2 p = 0 r2 r r c t

(II.3)

Zur Lsung dieser Wellengleichungen fhren wir eine Hilfsgre p r = ein, so da sich die folgende Wellengleichung ergibt:

Erzeugung, Ausbreitung, Messung und Bewertung von Schall

27
(II.4)

2 () 1 2 () 2 =0 r2 t2 c

Diese Gleichung hat die gleiche Form wie die eindimensionale Wellengleichung fr den Schalldruck p. Als allgemeine Lsung ergibt sich daher fr den Schalldruck die folgende Form: 1 i k r t + i k r + t p = +e ( 0 ) + e ( 0 ) r divergierend konvergierend

(II.5)

Die Lsung besteht damit aus einer divergierenden, kugelsymmetrischen Schallwelle, die die eigentliche Lsung der Abstrahlung einer atmenden Kugel darstellt und einer konvergierenden Teillsung, die die Abstrahlung von der Kugeloberflche nach innen beschreibt. Letztere macht physikalisch wenig Sinn, so da wir nur die divergierende Lsung betrachten. Im Gegensatz zur eindimensionalen Wellengleichung ist die Lsung fr die Schnelle nicht mehr formal gleich der Lsung fr den Schalldruck, so da wir fr die Schnelle in radialer Richtung aus der Gleichung folgende Lsung erhalten:
1 1 dp + + 1 ik ikr + it 1 ikr + it v+ = = + e = + + 2 e i dr i r 2 r cr ir Fernfeld Nahfeld
  

(II.6)

Im Gegensatz zum Schalldruck hat die Schnelle hier also zwei Komponenten, von denen die eine mit 1/r abfllt und in Phase mit dem Schalldruck ist, so da diese Lsung das Fernfeld mit einer Wirkleistung beschreibt, d. h. die auf diese Art und Weise fortschreitende Welle entzieht dem Schallsender Energie. Der zweite Bestandteil der Schnelle fllt 2 mit 1/r ab, beschreibt also das Nahfeld, das zudem um 90 Grad phasenverschoben mit dem Schalldruck ist. Dieses Nahfeld wird auch als hydrodynamische Komponente bezeichnet, weil es sich um eine reine Blindleistung handelt, d. h. es wird dem Schallsender keine Energie entzogen, sondern die Energie oszilliert zwischen dem Schallsender und dem umgebenden Medium hin und her. Zur nheren Bestimmung, der in den o. a. Lsungen noch offenen Gre + mssen wir die Randbedingungen in die Gleichung einsetzen. So gilt fr r = a:

28


Erzeugung, Ausbreitung, Messung und Bewertung von Schall

1 1 ika + it ia 2 ika v = va = + + e + = va e 1 + ika ca ia 2




(II.7)

Um nun die effektive Abstrahlung des Monopolstrahlers im Fernfeld in Abhngigkeit von der vorgegebenen Schnelle va anzugeben, mssen wir zwei Flle unterscheiden: 1.) ka = 2a/ >> 1: Fr diese Kurzwellennherung, fr die die geometrische Akustik als Nherung zutrifft, werden Wellenausbreitungseffekte, also insbesondere das Nahfeld vernachlssigbar, so da gilt: + = c a v a e ika , p a = c v a


(II.8)

Das resultierende Feld hnelt also dem einer ebenen Welle in einer Raumrichtung bzw. der eindimensionalen Lsung der Wellengleichung. Es handelt sich hier also um die einfachste Lsung, die beispielsweise bei einem Hochtonlautsprecher erst fr sehr hohe Frequenzen (entsprechend sehr kleine Wellenlngen) erfllt wird. Wesentlich hufiger tritt dagegen der folgende Fall auf: 2.) ka << 1: Fr diese Langwellennherung spielen Wellenphnome wie z. B. Beugung und die Blindleistung eine wesentlich grere Rolle. Als Lsung ergibt sich aus den o. a. Randbedingungen + = i a 2 va , pa = i a va


(II.9)

An der Oberflche der atmenden Kugel sind Druck- und Schallschnelle daher um 90 Grad in der Phase verschoben. Auerhalb der Kugel errechnet sich fr das Fernfeld der folgende Schalldruck: 1 e ikr it p = + e ikr + it = i a 2 v a e r r


(II.10)

p( r ) =

i e ikr , wobei q a = 4 a 2 v a qa 4 r

(II.11)

Die Gre qa beschreibt dabei den Schallflu der atmenden Kugel, d. h. die ber die Kugeloberflche integrierte Schnelle. Diese Beziehung gilt ganz allgemein fr jeden Strahler, dessen Abmessungen klein gegen die

Erzeugung, Ausbreitung, Messung und Bewertung von Schall

29

Wellenlnge sind, so da diese Formel noch fter im folgenden auftreten wird. Die zugehrige Schnelle errechnet sich wieder nach Gleichung (II.6). Als Spezialfall der oben abgeleiteten Gesetzmigkeiten fr den Monopolstrahler betrachten wir einen Kegelstrahler, d. h. einen Kegel mit den Raumffnungswinkel , der vor einem Schallsender angeordnet ist. Der Schalldruck des Kegelstrahlers ergibt sich aus Gleichung (II.11) fr den allseitig abstrahlenden Punktstrahler, wenn anstelle des Raumwinkels 4 (d. h. der gesamten Kugeloberflche) der Raumwinkel eingesetzt wird. p Kegel ( r ) = i e ikr qa r

(II.12)

Umgekehrt erscheint diese Beziehung plausibler, denn wenn in Gleichung (II.12) der Winkel durch 4 ersetzt wird, ergibt sich die Abstrahlung des Punktstrahlers als Spezialfall fr einen maximalen Raumffnungswinkel . Als Verhltnisse der Schalldrcke, die bei gleichem ursprnglichen Schallflu qa einmal fr einen Kugelstrahler und zum anderen fr einen Kegelstrahler resultieren, ergibt sich: p Kegel p Kugel 4

(II.13)

Das Verhltnis der abgestrahlten Schalleistung errechnet sich damit zu:


Leistung Kegel Leistung Kugel Intensitt Kegel Flche Kegel 4 2 4 = = Intensitt Kugel Flche Kugel 4

(II.14)

Bei vorgegebener Schnelle (bzw. vorgegebenen ursprnglichen Schallflu qa) wird durch den Kegeltrichter eine um den Faktor 4/ grere Leistung abgegeben als durch die kugelfrmige Abstrahlung. Dies liegt daran, da durch den vorgeschalteten Trichter eine bessere Anpassung der Quelle an das umgebende Medium mglich ist, d. h. weniger Blindleistung und dafr mehr Wirkleistung wird von demselben Schallsender abgestrahlt. Dieses Prinzip wird bei der Flstertte benutzt, bei der ein Trichter vor der Schallquelle eine bessere Schallabstrahlung bewirkt.

2.1.2 Dipolstrahler (Strahler 1.Ordnung)


Nachdem der akustische Monopolstrahler die einfachste Form der Schallabstrahlung darstellt, ist die nchsteinfachste Form der Schallausbreitung

30

Erzeugung, Ausbreitung, Messung und Bewertung von Schall

der akustische Dipolstrahler (Strahler 1. Ordnung), der als eine Anordnung von zwei entgegengesetzt gleichen Monopolstrahlern entlang einer vorgegebenen Achse (der z-Achse) aufgefat werden kann: q 1 = q 2 = q (II.15)

Dabei soll jeweils nur die radiale Komponente des Schallflusses betrachtet werden, so da nur der Betrag q1 bzw. q2 hier von Interesse ist. Die Schnelle errechnet sich nach dem Gesetz: 1 grad p = v r e r + v e i
 

v=

(II.16)

Wobei es eine radial gerichtete Schnelle und eine in Richtung des Elevationswinkels gerichtete Schnelle-Komponente gibt. An einem vorgegebenen Ort mit dem Abstand r1 zur Schallquelle q1 und r2 zur Schallquelle q2 errechnet sich dann der Schalldurck zu (vgl. II.11): i e ikr1 e ikr2 q1 + q2 4 r1 r2

p=

(II.17)

Fr das Dipolfeld wird nun der Grenzbergang gemacht, so da der Abstand der beiden Dipole 2h 0 geht, whrend das Dipolmoment 2 h q = M konstant bleiben soll. Dieser Grenzbergang kann auch als Differentiation des gesamten Feldes nach der z-Richtung aufgefat werden, wie die folgenden berlegungen zeigen: 1 e ikr1 e ikr2 i M lim 2h 0 2 h r 4 r2 1 =
ikr e z r
          

p=

(II.18)

Fr eine Variation entlang der z-Achse gilt dann die folgende Verbindung zur Variation entlang des Radius:

Erzeugung, Ausbreitung, Messung und Bewertung von Schall

31

dz =

dr i e ikr p= M cos cos 4 r r i ik ikr 1 = M cos 2 + e 4 r r Nahfeld Fernfeld




(II.19)

hnlich wie beim Monopolstrahler tritt also auch hier wieder eine Nahfeldund eine Fernfeldkomponente auf, die jeweils um 90 Grad phasenverschoben ist. Im Gegensatz zum Monopolstrahler tritt dieses Nah- bzw. Fernfeld schon beim Schalldruck und nicht erst bei der Schallschnelle auf. Die Richtcharakteristik des Dipolstrahlers weist die Form einer rumlich rotierenden Acht auf, fr die gilt: p( r, ) = cos p( r,0)

(II.20)

Abbildung 2.3: Richtcharakteristik des Dipolstrahlers

Als Schnelle in die radiale Richtung errechnet sich die Gre vr zu: 1 p M 2 2ik k 2 = cos 3 2 + e ikr r i r 4 r r

vr =

(II.21)

= v r ( r,0) cos = Schnelle einer mit v r ( r,0) oszillierenden Kugel

32

Erzeugung, Ausbreitung, Messung und Bewertung von Schall

Abbildung 2.4: Lngs der z-Achse oszillierende Kugel

Das Feld des Dipolstrahlers kann sich demnach vorgestellt werden, als das Feld von einer um den Nullpunkt in z-Richtung oszillierenden Kugel. Fr Kugeln mit kleinem Radius a << , ka << 1 (Langwellennherung) gilt: v r (a,0) = M ua 2 a 3

(II.22)

oder 3 VKrper + VMedium u a M = 2 a u a = 2 3 4 a 3 a 3 3


# " ! # " !

(II.23)

ua bezeichnet dabei die Schnelle in z-Richtung an der Oberflche der Kugel und M das Dipolmoment, so da das Dipolmoment aufgefat werden kann als Produkt aus der effektiv mitschwingenden Masse, die sich aus dem Volumen der Kugel und dem Volumen des im Nahfeldbereich mitschwingenden Mediums, und der Schnelle ua berechnet. Im Fernfeld des akustischen Dipols entsteht dann folgender Schalldruck in der Langwellennherung: c ( ka ) i ik a 2 a 3 u a cos e ikr = u a cos e ikr 4 r 2 r
2

p1 =

(II.24)

Falls dieselbe Dipolquelle in eine Schallwand mit einer unendlichen Ausdehnung eingebaut wird (d. h. fr den Fall des Lautsprechers), so da der akustische Kurzschlu zwischen Vorder- und Rckwand des Lautsprechers durch den Einbau in eine unendlich ausgedehnte Schallwand aufgehoben wird, so wirkt sie auf die Halbrume zu beiden Seiten als Monopolstrahler mit jeweils dem halben Flu einer atmenden Vollkugel:

Erzeugung, Ausbreitung, Messung und Bewertung von Schall

33
(II.25)

q a = a 2 u a .
2

Dabei beschreibt der Ausdruck a die Flche (Kreisflche in z-Richtung) auf der die Schnelle ua anliegt. Im Fernfeld wird dann der folgende Schalldruck erzeugt: i e ikr i c ka a qa = u a e ikr 2 r 2 r p1 = ika cos ~ p0

p0 =

(II.26)

(II.27)

Fr den Fall des Lautsprechers bewirkt also der akustische Kurzschlu eine schlechtere Schallabstrahlung als beim Einbau desselben Lautsprechers in eine Schallwand. Dieser Unterschied des Schalldrucks im Fernfeld wird allerdings mit zunehmender Frequenz (kleinerer Wellenlnge) kleiner, da die Schallausbreitung sich immer mehr der geometrischen Akustik nhert, fr die der akustische Kurzschlu nicht zu bercksichtigen ist. Demnach wirkt ein akustischer Kurzschlu wie ein Hochpafilter bei der Schallabstrahlung.

II.1.3 Punktstrahler-Synthese
Die nchste Nherung an eine beliebige Verteilung von Schallquellen im Raum ist nach dem Monopol- und Dipolstrahler die PunktstrahlerSynthese, bei der sich eine schallabstrahlende Flche bzw. ein schallabstrahlendes Volumen zusammengesetzt gedacht wird aus einer Reihe von Punktstrahlern. Dieses Vorgehen ist quivalent zu dem Huygensschen Prinzip in der Wellenoptik, so da hnliche Gesetzmigkeiten wie in der kohrenten Optik zu erwarten sind. Weiterhin ist diese Punktstrahlersynthese besonders in dem Wellenlngen-Bereich anzuwenden, in dem die Abmessungen der Schallquellen-Anordnung ungefhr dieselbe Grenordnung wie die Schallwellenlnge hat, dabei kann bei greren Wellenlngen die gesamte Schallquellenanordnung als Monopol- oder Dipolstrahler angenhert werden kann, whrend bei kleineren Wellenlngen die geometrische Akustik anzuwenden ist. Wir betrachten also eine beliebige Strahleranordnung in einem Halbraum, wobei der Ort ri des Strahlers i die folgenden Koordinaten aufweist:

34

Erzeugung, Ausbreitung, Messung und Bewertung von Schall

r i = x Si , y Si ,0

Abbildung 2.5: Aus mehreren Teilflchen Si mit unterschiedlichen Schnellen vi zusammengesetzter Schallstrahler

Der Schalldruck im Fernfeld kann also aus den jeweiligen Beitrgen der einzelnen Strahler zusammengesetzt werden:
i 2
ik r r i

p(r ) =

v i Si

r ri

(II.28)

Hierbei wurde zugrundegelegt, da die Strahler jeweils nur in einen Halbraum strahlen, so da der Faktor 2 (anstelle von 4 beim Monopolstrahler) eingesetzt wurde. Wenn wir eine kontinuierliche Flchenbelegung mit differentiellen Sendern vdS im Grenzfall annehmen, geht die obige Summe ber in ein Flchenintegral, das bereits von Lord Rayleigh angegeben wurde: i e ikR 2 2 v( x S , y S ) dS mit R = ( x x S ) + ( y y S ) + z 2 2 S R

p( v) =

1 2

(II.29)

In diesem Integral drfen wir Nherungen fr den Fall anwenden, da wir uns im Fernfeld befinden und der Abstand r sehr viel grer ist als die Koordinaten der Schallquellen, also R >> x S , yS : R xS R yS

R=Rx

S = yS = 0

xS +
xS = yS = 0

yS
xS = yS =0

(II.30)

1 2x y x y = R0 + ( xS ) R yS = R 0 R xS R yS 2 R0 0 0 0

Erzeugung, Ausbreitung, Messung und Bewertung von Schall


-ikR

35

Diese Nherung fr R ist insbesondere fr den Phasenfaktor e anzuwenden, da kleine nderungen von R aufgrund der Periodizitt dieses Faktors eine groe nderung des Integranden (z. B. nderung des Vorzeichens) bewirken. Das R im Nenner des Integranden kann dagegen einfach durch R0 approximiert werden, weil dort kleine nderungen von R einen nur vernachlssigbaren Einflu haben. Aufgrund dieser berlegungen resultiert die sogenannte Fraunhofer-Nherung des BeugungsIntegrals:
x y

x S + y S ik i e ikR 0 R R0 v( x S , y S ) e 0 p( v) = dx S dy S 2 R 0
' & & & & & % & & & & & $

(II.31)

2-dimensionale Fourier-Transformation von v ( x S ,y S )

Das hier auftretende Integral stellt nichts anderes als die zweidimensionale Fouriertransformation der Strahlungssender-Verteilung v(xs,ys) dar. Ebenso wie sich das Beugungsbild in der kohrenten Optik aus der Fouriertransformierten des beugenden Objekts berechnet, berechnet sich also das Fernfeld einer beliebigen zwei-dimensionalen Strahlerverteilung aus der Fouriertransformation der Anordnung dieser Strahler v S (x S , y S ) k x , k y , mit x, y: Raumfrequenzen = Winkeln
(

(II.32) x y , R 0 R0

Die hier in Anologie zur Fourier-Beziehung zwischen dem Zeitbereich und dem Frequenzbereich als Raumfrequenzen auftretenen Variablen x,y knnen dabei als Auslenkungswinkel von der akustischen (bzw. optischen) Achse x/R0, y/R0 aufgefat werden. Je kleiner also das beugende Objekt bzw. die Schallsenderanordnung, desto grer sind die Beugungseffekte und bei desto greren Ablenkungswinkeln (Raumfrequenzen) treten noch Anteile des Beugungsbildes auf. Diese Beziehung zwischen beugendem Objekt und Beugungbild wird in Analogie zur Fourier-Optik als Fourier-Akustik bezeichnet. Sie erlaubt es, mit den bereits sehr gut entwickelten Methoden der (kohrenten) Fourier-Optik die Phnomene bei der Schallausbreitung gut und relativ einfach mathematisch handhabbar zu beschreiben. Als Beispiel betrachten wir die Konstruktion einer Lautsprecherzeile, d. h. einer vertikalen Anordnung von Lautsprechern, die eine vorgegebene Schnelle v0 jeweils erzeugen. Der Schalldruck, der im Abstand r0 bei einem Winkel von und einer Elevation auftritt, nimmt dann, aufgrund der

36

Erzeugung, Ausbreitung, Messung und Bewertung von Schall

an den rechteckfrmigen (spaltfrmigen) Brandungen der Lautsprecher in Ordnung auftretenden Beugungseffekte, folgende Werte an P( R 0 , , ) = i e ikR 0 B H v0 (, , ) 2 R0 (II.33)

kH kB sin sin sin sin 2 2 = P( R 0 ,0,0) kH kB sin sin 2 2

In horizontaler Richtung tritt also eine Beugung an einem relativ schmalen Objekt mit einer breiten Richtwirkung auf, whrend in vertikaler Richtung die grere Abmessung der Lautsprecherbox zu einer geringeren Beugung und damit zu einer strkeren Richtwirkung fhrt, so da weniger Energie von der Lautsprecherzeile auf den Fuboden und an die Decke des Raumes gestrahlt wird.

Abbildung 2.6: Abstrahlcharakteristik einer Lautsprecherzeile in der Horizontal- und Vertikalrichtung

II.2 Ausbreitung von Schall


Nachdem wir zunchst die verschiedenen Erzeugungsformen von Schall behandelt haben, soll im folgenden die Ausbreitung von Schall behandelt werden. Dabei ist zwischen einer Ausbreitung des Schalls in vorgegebenen Strukturen (gefhrte Schallwellen, z. B. im Rohr oder in einem Schalltrichter) und der freien Ausbreitung vom Schall im unbegrenzten Medium zu unterscheiden.

II.2.1 Gefhrte Schallwellen


II.2.1 a) Kundtsches Rohr Der Prototyp der Wellenausbreitung in einem Schallwellenleiter (in diesem Fall: Rohr) stellt das Kundtsche Rohr da, mit dem sich beispielsweise in

Erzeugung, Ausbreitung, Messung und Bewertung von Schall

37

der technischen Akustik die Eigenschaften von akustischen Absorbermaterialien ausmessen lassen. Dabei wird vor der einen Seite einer Rhre ein Schallsender (Lautsprecher) mit einer vorgegebenen Schnelle v0 angebracht und in dem gegenberliegenden Ende (x = l) ein Absorber.

Abbildung 2.7: Gefhrte Schallausbreitung im Kundt'schen Rohr

Um die Gleichung fr die Wellenausbreitung in dem Rohr abzuleiten, greifen wir wiederum auf die Euler-Gleichung (Gleichgewicht der Krfte), die Kontinuitts-Gleichung und die Kompressibilittsbeziehung zurck, die wir bereits in Kapitel I.3 kennengelernt haben. dp v = = i v dx t

(II.34)

dv 1 p i = = p dx c 2 t c 2
2

(II.35)

d2p = p = k 2 p 2 c dx Eindimensionale Wellengleichung

(II.36)

Hierbei wurde bereits vorausgesetzt, da es sich bei dem Schalldruck um eine periodisch mit der Zeit ndernde Gre mit der Kreisfrequenz handelt. Als Lsungsansatz fr die eindimensionale Wellengleichung kommen zwei entgegenlaufende Wellen in Frage, wobei die allgemeine Lsung eine Linearkombination dieser beiden Teillsungen darstellt: p(x) = ~ + e ikx + ~ e + ikx p p (II.37)

Aufgrund der Tatsache, da bei x = l Absorbtion stattfindet, wird die Amplitude der rcklaufenden Welle ~ vom Betrag her kleiner sein als die p ~ . Amplitude der hinlaufenden Welle p +

38

Erzeugung, Ausbreitung, Messung und Bewertung von Schall

Als (komplexen) Reflexionsfaktor r definieren wir nun das Verhltnis aus reflektierter Schallwelle und einschallender Schallwelle, also:
~ e ikl p r = ~ ikl = r e i , mit : Phasensprung am Absorber p+ e

(II.38)

Es ergibt sich damit eine Druckverteilung im Rohr wie folgt: p( x) = ~ + e ikx 1 + r e ( p

i 2 k ( l x ) )

(II.39)

Abbildung 2.8: Druckverteilung im stehenden Wellenfeld

Es bildet sich also ein stehendes Wellenfeld aus, das maximale Druckp max werte mit den Werten ~ = 1 + r und minimale Druckwerte mit den Werp+ p min ten ~ = 1 r aufweist. Das Verhltnis aus minimalem und maximalem p+ Schalldruck wird damit als Stehwellenverhltnis bezeichnet und berechnet sich zu: p min p max 1 r = r= p 1+ r 1 + min p max 1

p min p max

(II.40)

Damit kann der Betrag des Reflexionsfaktors aus dem Verhltnis zwischen maximalem und minimalem Schalldruck gemessen werden. Das 2 Betragsquadrat des Reflexionsfaktors, der sogenannte Reflexionsgrad r beschreibt dann das Verhltnis aus reflektierter zu einfallender Intensitt, whrend der Absorptionsgrad = 1 r 2 gerade den Teil der Schallintensitt beschreibt, der vom Absorber im Kundtschen Rohr absorbiert wird. Neben dem Betrag des Reflexionsfaktors lt sich auch die Phase des

Erzeugung, Ausbreitung, Messung und Bewertung von Schall

39

Reflexionsfaktors aus der Bedingung messen, so da die Minima in dem o. a. Stehwellenfeld sich fr die Bedingung ergeben, da

2 k (l x) = (2 n + 1)
Das erste Minimum liegt demnach bei

(II.41)

x =

1 + 4

(II.42)

Eine vollstndige Bestimmung des (komplexen) Reflexionsfaktors mit dem Kundtschen Rohr erfordert daher die Bestimmung des Verhltnisses aus minimalem und maximalem Schalldruck im Rohr sowie eine Bestimmung der Minima-Verschiebung, die durch den jeweiligen Reflektor hervorgerufen wird. Das Kundtsche Rohr kann ebenfalls als Prototyp eines akustischen Resonators (Helmholz-Resonator) aufgefat werden. Um die Abhngigkeit der Resonanz im Rohr vom Absorbtionsgrad bzw. vom Reflexionsfaktor r und von der Frequenz auszurechnen, betrachten wir die Schnelle im Rohr: v( x) = 1 dp 1 ~ i 2 k l x = p + e ikx 1 r e ( ( ) ) i dx c

(II.43)

Fr den Rohranfang (d. h. x = 0) ergibt sich damit: p+ 1 r e i( 2 kl ) c

v0 =

(II.44)

Die Amplitude der in +x-Richtung laufenden Welle errechnet sich dann zu: v0 c maximal fr 2 kl = 2 n 1 r e i( 2 kl ) Gleichphasigkeit zwischen Lautsprecher (x=0) und 1 x reflektierter und rcklauf ender Welle
2 1 1 0 1 1 )

p+ =

(II.45)

Diese Gre wird maximal, wenn die einmal bei x = l mit dem Reflexionsfaktor r reflektierte Welle beim Wiedereintreffen bei x = 0 dieselbe Pha-

40

Erzeugung, Ausbreitung, Messung und Bewertung von Schall

senlage aufweist wie die vom Lautsprecher gerade abgestrahlte Welle. Fr diesen Fall tritt die Bedingung auf: c + n l 2

max =

(II.46)

Um nun die Abhngigkeit der Resonanz von kleinen Frequenznderungen zu untersuchen, fhren wir kleine Frequenznderungen ein mit 2 kl = 2

max 2l l + c c
v0 c 2l ~1i c
6 5 4 5

(II.47)

p+ =

1 r e
3

2l i 2 n + c

(II.48)

p+ p + max

1 r 1 1 = r 2l 2l 2l 1 r + ir 1 + i 1+ i c 1 r c (1 r )c
= Zeit, in der der Schall durch Reflexion auf 1/e abgeschwaecht wird
7 A @ 9 @ 8

(II.49)

Der Vorfaktor von in (II.49) ist als charakteristische Zeitkonstante des Rohres (Abfall der Schallenergie auf 1/e des ursprnglichen Werts) zu interpretieren, da mit dieser Gleichung die Frequenzabhngigkeit eines Resonators blicherweise beschrieben wird. Der errechnete Wert -1 -1 2l(1-r) c ist plausibel, weil sich diese Zeit aus dem Weg errechnet, den die Schallwellen in dieser Zeit zurcklegt haben, geteilt durch die Schallausbreitungsgeschwindigkeit c. Dieser Quotient aus Weg/c entspricht gerade 2l/ln(r), wobei ln(r) approximiert werden kann durch -(1 - r). II.2.1 b) Vernderlicher Querschnitt des Rohres Wir betrachten nun den Fall einer Querschnittsnderung des Rohres von einem Querschnitt S1 auf einem Querschnitt S2 am Ort x = 0. Der sich in xRichtung ausbreitende Schall wird an diesem bergang zum Teil reflektiert und zum Teil weitergeleitet. Um die dabei auftretenden Reflexionen ausrechnen zu knnen, gehen wir zunchst davon aus, da die Schalldrcke beim Punkt x = 0 gleich sind, d. h. p1 = p2. Im Gegensatz zu den Schalldrcken addieren sich die Schallschnellen nicht als skalare

Erzeugung, Ausbreitung, Messung und Bewertung von Schall

41

Gre, sondern als vektorielle Gre. Beim bergang werden jedoch nicht die Schallschnellen vektoriell addiert, sondern die Schallflsse q1 = S1 v1 und der Schallflu q2 = S2 v2, deren Summe gerade gleich 0 sein mu. Diese Gleichheit des einlaufenden und auslaufenden Schallflusses folgt aus der Kontinuittsgleichung
div( v) = 1 p (Kontinuitaetsgleichung II) c2 t

(II.50)

Wenn man diese Gleichung in Integralschreibweise auf ein dosenfrmiges Gebiet bei x = 0 anwendet (der Deckel der Dose sei bei x 0 und der Boden der Dose bei x > 0), so folgt:

vdS = c t pdV
2

(II.51)

Unter der Annahme, da die Schnellen v1 bzw. v2 ber den gesamten Querschnitt konstant sind, folgt aus (II.51) fr eine gegen 0 gehende Dikke der Dose: (S1 v1 S2 v 2 ) =

t pdV 0,

fr V 0

(II.52)

Da wir nun gesehen haben, da die Schallflsse eine wesentliche Rolle fr die Berechnung der Reflexion an der Rohr-Verengung spielen, knnen + wir die einlaufende Welle auch durch ihre Fluamplitude q1 charakterisieren, so da fr die einfallende Welle gilt:

+ p1 e ikx =

c + ikx q1 e S1
-

(II.53)

Fr die reflektierte Welle nehmen wir an, da der Schalldruck p1 sich aus dem Reflexionsfaktor r und dem Schalldruck der einlaufenden Welle berechnet zu:
+ p1 = r p 1

p1 e ikx =

c ikx q1 e S1

(II.54)

42

Erzeugung, Ausbreitung, Messung und Bewertung von Schall

Die transmittierte Welle hat dann die Form

+ p 2 e ikx =

c + ikx q2 e S2

(II.55)

Aus den beiden o. a. Randbedingungen (Gleichheit der Flsse und der Schalldrcke) folgt dann: S1 S + + p1 p 1 = 2 p 2 c c
+ 1 1 + 2

q1 = q 2 :

(II.56)

p1 = p 2 : p + p = p

+ p 1 p 1 1 r S2 S S2 , mit r = 1 = = + p1 + p1 1 + r S1 S1 + S2

(II.57)

Als Absorptionsgrad wird nun der relative Anteil der einfallenden Energie bezeichnet, die nicht reflektiert wird und somit (durch die Weiterleitung der Schallwelle) absorbiert wird. Da diese Energie eine quadratische Gre ist, errechnet sich der Absorptionsgrad zu: = 1 r2 = 4 S1 S2
2

(S1 + S2 )

(II.58)

Abbildung 2.9: Absorptionsgrad an einer Grenze zwischen den Flchen S1 und S2

Dabei ist Schallabsorbtion maximal, wenn keine nderung in der Querschnittsflche auftritt (ideale Weiterleitung des Schalls), wobei der Absorptionsgrad bei relativ kleinen Vernderungen des Verhltnisses S2/S1 nur relativ langsam abnimmt. Aufgrund dieses Zusammenhangs ist eine nderung des Rohrquerschnitts (z. B. in Klima- oder Lftungsanlagen) ein relativ untaugliches Mittel, um die Schallausbreitung in Rohren zu verhin-

Erzeugung, Ausbreitung, Messung und Bewertung von Schall

43

dern. Selbst bei extremen Querschnittsnderungen ist die durchgelassene Schallenergie noch relativ hoch, so da z. B. ein relativ kleiner Trspalt schon fast den gesamten Schall von der einen Seite der Tr auf die andere Seite der Tr passieren lt. II.2.1 c) Kontinuierliche Querschnittsnderung

Abbildung 2.10: Schallausbreitung in einem differentiellen Rohrstck mit ortsabhngigem Querschnitt

Wir betrachten nun den Fall, da sich der Rohrquerschnitt als Funktionen des Ortes verndert, wobei die Funktion S(x) zugrundegelegt wird. Um auf die entsprechende Form der Eulerschen Gleichung zu gelangen, werden zunchst alle auf das Volumenelement einwirkende Krfte aufaddiert:
Druck d. Mantelfl che

p S ( p + dp) (S + dS) + ( p + dp)dS


E F F C D D B

(II.59)

Die Kraft auf das Volumenelement in x-Richtung berechnet sich also zu: dv dt
G

S dx
Masse
Q P I P H

(II.60)

Beschleunigung

dp dv = S dx dt

(II.61)

Die Kontinuittsgleichung, die fr die Herleitung der passenden Wellengleichung notwendig ist, berechnet sich in diesem Fall zu:

44

Erzeugung, Ausbreitung, Messung und Bewertung von Schall

( v S (S + dS)(v + dv)) =
dS dv v + S dx dx d( v S) dq = , dx dx mit q=vS : Schallflu
U T T S T T R

d Sdx dt S dp c2 dt

(II.62)

(II.63)

Aus der rumlichen Ableitung von Gleichung (II.61) bzw. der zeitlichen Ableitung von Gleichung (II.63) ergibt sich dann: d ( II.61): dx dS dp d2p dS dv d2v S 2 = + S dx dx dx dx dt dxdt

(II.64)

d dv dS d2v S d2p + S (II.63): =- 2 2 dt dt dx dxdt c dt Insgesamt ergibt sich dann: d 2 p dS dp S d 2 p S 2 + 2 2 = 0 dx dx dx c dt

(II.65)

(II.66)

Dieses ist die sogenannte Trichtergleichung (auch als Webster'sche Horngleichung bekannt), die die Wellenausbreitung in einem sich als Funktion von x vernderlichem Hohlleiter beschreibt. Fr den Fall eines dS konstanten Querschnitts = 0 geht diese Trichtergleichung in die dx Wellengleichung (2.35) fr das Rohr ber. Es mu jedoch festgehalten werden, da diese Gleichung fr den Schalldruck p eine andere Form hat, als eine vergleichbare Gleichung fr die Schallschnelle v. Im Gegensatz zur eindimensionalen Wellengleichung ergeben sich damit unterschiedliche Lsungen fr den Schalldruck p und die Schnelle v als Funktion des Ortes. II.2.1 d) Exponentialtrichter Als Spezialfall einer kontinuierlichen Querschnittsnderung betrachten wir den Exponentialtrichter, fr den der Durchmesser und die Flche exponentiell mit der Ortskoordinate x ansteigt:

Erzeugung, Ausbreitung, Messung und Bewertung von Schall

45

Abbildung 2.11: Wellenausbreitung in Exponentialtrichter

Die exponentielle Querschnittsnderung bedeutet, da die differentielle relative Querschnittsnderung dS = 2 g S dx lngs des Trichters konstant ist. d2p dp 1 d 2 p + 2g =0 dx c 2 dt 2 dx 2

(II.67)

(II.68)

Mit dem Ansatz p = p 0 e it ex , d. h. eines sinusfrmigen zeitlichen Schalldruckverlaufs, dessen Amplitude vom Ort abhngig ist, ergibt sich fr und die folgende charakteristische Gleichung zweiten Grades: 2 =0 c2

2 + 2 g +

(II.69)

mit den beiden Lsungen:

1/2 = g g2 k 0 ,
2

fr g > k 0 =

= g i k 0 g ,
2 2

c fr g < k 0 = c

(II.70)

Fr den 1. Fall ( g = g c , wobei g die Grenzfrequenz bezeichnet) ist keine Ausbreitung als fortschreitende Welle mglich, es tritt eine soge-

46

Erzeugung, Ausbreitung, Messung und Bewertung von Schall

nannte Blinddmpfung auf und das Schallfeld fllt exponentiell zu ~ e x ab. Im zweiten Fall ( > g ) ist dagegen eine Schallabstrahlung mglich, so da sich die Gesamlsung als Linear-Kombination von beiden Teillsungen ergibt: g i p e p= +
W Y V

Der zweite Term beschreibt dabei die in negative x-Richtung laufende, am Ende des Trichters reflektierte Schallwelle. Wenn wir davon ausgehen, da die Reflexion an der Trichterffnung vernchlssigbar ist, knnen wir diesen zweiten Term vernchlssigen. Als Phasengeschwindigkeit ergibt sich fr die Schallausbreitung der Welle oberhalb der Grenzfrequenz des Exponentialtrichters: = k k 0 g2
2

cp =

c g 1
2

und als Gruppengeschwindigkeit der Wert: 2 2 2 g2 2 g 1 c = = c 1 2 / c 2 2 2 g c2 d

cg =

d = dk d

Sowohl die Phasen- als auch die Gruppengeschwindigkeit hngen damit von der jeweiligen Kreisfrequenz ab. Dieses bezeichnet man als Dispersion. Fr Frequenzen dicht oberhalb der Grenzfrequenz geht die Phasengeschwindigkeit gegen unendlich (bergang in die Blinddmpfung), whrend die Gruppengeschwindigkeit gegen 0 geht und das Produkt aus Phasen- und Gruppengeschwindigkeit konstant ist. Die Dispersion fhrt damit zu einer unterschiedlichen Ausbreitungsgeschwindigkeit von ver-

k o 2 g 2 x k
` a X

( g+i k 02 g2 )x e it + p e Am Ende ist die reflektierte Welle vernachlaessigbar, da die Reflexion gering ist.
b

(II.71)

~ f ( )

(II.72)

(II.73)

Erzeugung, Ausbreitung, Messung und Bewertung von Schall

47

schiedenen Wellenlngen im Exponentialtrichter und kann beispielsweise zur Pulskompression verwendet werden: Wenn ein akustisches Signal am Eingang des Exponentialtrichters sich ber einen bestimmten Zeitbereich erstreckt, so kann bei geeigneter Form dieses Eingangssignals die Dispersion dazu fhren, da am Ausgang des Exponentialtrichters das Zeitsignal auf einen wesentlich krzeren Bereich konzentriert ist, so da akustische Stowellen auftreten. Um nun errechnen zu knnen, welche Schalleistung von einem Exponentialtrichter bei welcher Frequenz abgestrahlt werden kann, betrachten wir zunchst die Schnelle als Funktion des Ortes:
2 1 dp + g + i k 0 g = p+ v + (x) = i dx i 2

(II.74)

Als Wellenwiderstand, (d. h. als Verhltnis aus Schalldruck und Schallschnelle) fr jeden Ort x im Exponentialtrichter ergibt sich zusammen mit (II.71) damit: p+ = v+ i 2 g + i 2 g2 c

Z=

(II.75)

Es ergibt sich also der komplexe, vom Ort x unabhngige Wellenwiderstand zu:
2 g 1 + i g = c Z = c 2 g g i + 1

(II.76)

Whrend der Imaginrteil des Strahlungswiderstands den Blindanteil umgibt, (d. h. den Teil, bei dem Schalldruck und -schnelle nicht in Phase sind und zu keinem Energietransport fhren) wird durch den Realteil des g Strahlungswiderstands Re{Z} = c 1 bei vorgegebener Schnel
2

le v + die abgestrahlte Leistung bestimmt:

48
P+ =

Erzeugung, Ausbreitung, Messung und Bewertung von Schall

1 1 S Re{p + v* } = S v + 2 Re{Z} + 2 2
g

(II.77)

Der Verlauf des Realteils von Z weist einen steilen Anstieg oberhalb der Grenzfrequenz g auf, so da mit dem Exponentialhorn der Wirkungsgrad von Lautsprechern vergrert werden kann: Whrend bei der Schallabstrahlung von einem Lautsprecher ohne Horn in einer unendlich ausgedehnten Schallwand in der Langwellennherung ein betrchtlicher Teil der Anregungs-Energie in Blindleistung umgesetzt wird, fhrt die Verwendung eines Exponentialhorns zu einer besseren Anpassung der LautsprecherBewegung an die umgebende Luftmasse, so da nur noch ein kleinerer Prozentsatz in Windenergie umgesetzt wird. Zum Vergleich ist in unten stehender Abbildung der Wellenwiderstand eines Kegeltrichters eingezeichnet, der sich berechnet zu: 1 1 1 + c i x

Z=

(II.78)

(k0a )2 Re{Zx= a } = c 2 1 + (k0a)

(II.79)

Abbildung 2.12: Wirkwiderstand (Strahlungsleistung) von Exponential- und Kegeltrichtern

Der Kegeltrichter fhrt demnach bei hohen Frequenzen ebenfalls zu einer vollstndigen Abstrahlung des Schalls in der Wirk-Komponente, es wird dafr aber keine Grenzfrequenz angenommen, unterhalb derer keine Ausbreitung ist. Allerdings ist die Abstrahlung des Kegeltrichters bei niedrigen Frequenzen sehr gering bzw. mit starken Blindleistungs-Verlusten verbunden.

Erzeugung, Ausbreitung, Messung und Bewertung von Schall

49

II.2.2 Freie Schallausbreitung / Geometrische Akustik


Nachdem wir in den vorherigen Abschnitten die Schallausbreitung in begrenzten Strukturen (Rohre, Trichter) betrachtet haben, soll im folgenden die Schallausbreitung im Freien, bzw. in einem unendlich ausgedehnten Medium betrachtet werden. Fr niedrige Frequenzen (groe Wellenlngen) spielen Beugungseffekte eine groe Rolle, die bereits bei der Schallabstrahlung beschrieben wurden. Fr sehr hohe Frequenzen (kleine Wellenlnge) sind die Beugungseffekte allerdings sehr gering, so da in Analogie zur geometrischen Optik von der geometrischen Akustik gesprochen werden kann. So kann beispielsweise die Schallausbreitung hinter einer ffnung nherungsweise als Schallstrahl aufgefat werden, wenn die Abmessung a dieser ffnung sehr viel grer ist als die Wellenlnge :

Abbildung 2.13: Schallstrahl bei der geometrischen Akustik

Ebenso wie in der kohrenten Optik wrde sich bei greren Wellenlngen (bzw. kleineren Abmessungen der ffnung) keine gradlinige Ausbreitung, sondern eine Ausbreitung gem einer Kugelwelle mit Interferenzfiguren ergeben. Fr diesen Grenzfall der geometrischen Akustik knnen wir auch das Brechungsgesetz herleiten: Wenn der akustische Strahl vom Medium 1 mit der Ausbreitungsgeschwindigkeit c1 unter dem Winkel 1 auf eine Grenzflche zu dem Medium 2 (Ausbreitungsgeschwindigkeit c2 ) auftritt, kann der Austrittswinkel aus folgender Gleichung errechnet werden: c1 sin 1 = c 2 sin 2

(II.80)

50

Erzeugung, Ausbreitung, Messung und Bewertung von Schall

Abbildung 2.14: Brechung von Schallstrahlern

Dieses Berechnungsgesetz kann zum einen aus dem Fermatschen Prinzip abgeleitet werden (die Laufzeit vom Punkt S im Medium 1 zum Punkt E im Medium 2 soll minimiert werden, dies kann durch Variation an den Winkeln 1 und 2 geschehen). Andererseits folgt das Brechungsgesetz aus der Kontinuitt der Spurwellenlnge, d. h. der Projektion der (geradlinigen) Wellenausbreitung im Medium 1 auf die Grenzflche, bei der die Spurwellenlnge

S =

1 sin 1

(II.81)

resultiert. Dieselbe Spurwellenlnge mu bei der Projektion der Welle im Medium 2 auftreten, so da gilt:

S =

2 sin 2

(II.82)

sin 1 1 c1 = = sin 2 2 c2

(II.83)

In der Praxis (z. B. in der Schallausbreitung in der Erdatmosphre) tritt dagegen oft keine diskontinuierliche, sondern eine kontinuierliche nderung der Ausbreitungsgeschwindigkeit c auf, so da eine krummlinige Schallausbreitung resultiert. Beispielsweise folgt fr folgende einfache Annahme ber die Ausbreitungsgeschwindigkeit: c( z) = c0 (1 ( z z 0 )) (II.84)

(Z: Hhe ber Erdboden, c0: Ausbreitungsgeschwindigkeit am Erdboden, : Konstante) Die folgende Annahme fr den Brechungswinkel:

Erzeugung, Ausbreitung, Messung und Bewertung von Schall

51
(II.85)

sin =

c = 1 ( z z0 ) c0
2

1 dz sin ~ 1 wegen sin = cos(90- ) 2 dx <<1 dz = 2 (z z 0 ) dx


q p i p h

(II.86)

(II.87)

z z0 =

(x x 0 ) 2 2

(II.88)

Als resultierenden Strahl des Schalls vom Ausgangspunkt S folgt eine Parabel mit dem Krmmungsradius 1/. Fr einen Teil der Schallstrahlen fhrt diese krummlinige Ausbreitung zu einer Reflexion am Erdboden, whrend ein anderer Teil gar nicht erst den Erdboden erreicht und in die Atmosphre nach oben abgestrahlt wird. Auf diese Art und Weise entsteht eine akustisch tote Zone, d. h. ein Bereich in einem gewissen Abstand des Sendepunktes S, der von keinem der mglichen Schallausbreitungswege erreicht wird.

Abbildung 2.15: Schallausbreitung in der Atmosphre mit linear mit der Hhe z abnehmender Schallgeschwindigkeit

Ein andere Anwendung der geometrischen Akustik ist die Spiegelung von Schallstrahlen, fr die das Spiegelungsgesetz Einfallswinkel = Ausfallswinkel gilt. Dieses folgt ebenfalls aus der Kontinuitt der Spur. Fr den Empfangspunkt E hat der gespiegelte Schallstrahl die scheinbare Herkunft von der Spiegelschallquelle S, die sich jenseits der spiegelnden Oberflche befindet. Mit dieser in der Raumakustik nher zu behandelnden Spiegelquellenmethode kann beispielsweise die Echodichte von Raumimpulsantworten berechnet werden.

52

Erzeugung, Ausbreitung, Messung und Bewertung von Schall

Abbildung 2.16: Schallspiegelung und Spiegelschallquelle S'

Eine andere praktische Anwendung der Spiegelung von Schallstrahlen findet sich bei gekrmmten Oberflchen, die zur Bndelung oder Zerstreuung von Schallstrahlen eingesetzt werden knnen. Die allgemeine Gleichung fr eine Ellipse, die beispielsweise einen akustischen Hohlspiegel beschreibt, lautet: 1 1 2 + = s e r r elliptischer Fall 2 (fr s = r = e fallen S und E zusammen) s> r :parabolischer Fall 2 (Scheinwerfer)

(II.89)

(II.90)

s=

(II.91)

r :hyperbolischer Fall 2 (Ausgangspunkt ist Spiegelschallquelle) s<

(II.92)

Der elliptische Fall ist fr Flstergalerien von Interesse, weil smtliche von einem Sendeort S ausgehenden Schallstrahlen auf den Empfngerort E konzentriert werden. Der parabolische Fall ist dagegen fr Konzertmuscheln von Bedeutung, bei denen die von den Musikinstrumenten nach hinten abgestrahlte Schallenergie mglichst nicht verloren gehen soll, sondern auf das vor der Konzertmuschel sich befindliche Publikum umgelenkt werden sollen. Beim bergang zum hyperbolischen Fall kann die Richtwirkung dieser Konzertmuschel noch weiter aufgefchert werden.

Erzeugung, Ausbreitung, Messung und Bewertung von Schall

53

Abbildung 2.17: Schallspiegelung in einer elliptischen Begrenzung (Flstergalerie)

II.3 Druck-, Schnelle- und Intensittsmessung


Im folgenden soll behandelt werden, wie die akustischen Basisgren Druck und Schnelle metechnisch erfat werden knnen und wie daraus abgeleitete Gren (z. B. die Intensitt) ermittelt werden knnen. Der Schalldruck p stellt eine skalare Gre dar, die im Fall des Luftschalls mit einem Mikrophon ermittelt wird. Fr andere Medien (z. B. Wasser) gibt es Hydrophone und fr Festkrper Krperschallaufnehmer, die im folgenden nicht gesondert behandelt werden sollen. Die prinzipiellen Elemente eines Mikrophons sind eine schwingungsfhig (elastisch) aufgehngte Membran, ber deren Flche S der Schalldruck aufintegriert wird, so da insgesamt eine Kraft F entsteht. Mit dieser Kraft wird ein mechanoelektrischer Wandler bettigt (z. B. eine in einem Magnetfeld aufgehngte Spule oder ein Piezo-Kristall oder ein geladener Kondensator).

Abbildung 2.18: Ersatzschaltbild eines Mikrophons

Unter der Annahme, da die Membran-Masse m die Steifigkeit der Aufhngung s und eine Reibungskomponente s/ auftritt, knnen wir als Bewegungsgleichung der Mikrophon-Membran aufstellen:

Fr den Ansatz einer periodischen Auslenkung (x = x0 e ) folgt dann:


i t

F = mx +
r r

s 2 x + s x = m 0 x + s x (1 + i)

(II.93)

54

Erzeugung, Ausbreitung, Messung und Bewertung von Schall

F s , x= 2 1 2 0

mit 0 =
2

s (1 + i) m

(II.94)

Die Auslenkung der Mikrophon-Membran ist damit proportional zum Schalldruck p solange fr << Mikrophon-Resonanzfrequenz 0. Fr die praktische Schallmessung bedeutet dies, da jedes Mikrophon nur unterhalb seiner charakteristischen Grenzfrequenz betrieben werden sollte. Fr den Fall des (Elektret-) Kondensatormikrophons ist die Ausgangsspannung Ua proportional zur Auslenkung x und damit proportional zum Schalldruck p. Das Kondensator-Mikrophon stellt damit einen Druckempfnger mit einem relativ konstanten, ber einen weiten Frequenzbereich hin glatten Frequenzgang dar, der in der Metechnik besonders beliebt ist. Im Gegensatz dazu ist beim dynamischen Mikrophon die Ausgangsspannung gegeben durch den Abfall des in der Tauchspule durch die Bewegung induzierten Stromes IA am Innenwiderstand RI IA, so da gilt: Dynamisches Mikrophon: ~ Schnelle x ~ x
s

UA = R I A

(II.95)

Beim dynamischen Mikrophon ist die Ausgangsspannung daher nicht direkt dem Schalldruck, sondern der (zeitlichen) Ableitung des Schalldrucks proportional, so da es sich um einen Druckempfnger mit einem eingebauten Hochpafilter handelt (d. h. niedrige Frequenzen werden im Mikrophon-Signal stark abgeschwcht). Whrend der Schalldruck sich als skalare Gre relativ einfach und (bei entsprechender Richtcharakteristik des Mikrophons bzw. in niedrigen Frequenzen) unabhngig von der Ausrichtung des Mikrophons bestimmen lt, ist die Schnelle eine vektorielle Gre, von der in der akustischen Metechnik jeweils nur eine Komponente, d. h. die Projektion der Schnelle auf eine vorgegebene Raumrichtung ausgemessen werden kann. Dabei macht man sich den Zusammenhang zwischen Schalldruck und Schallschnelle zu nutzen: v = grad p
s

(II.96a)

Erzeugung, Ausbreitung, Messung und Bewertung von Schall

55

Wenn man nun zwei Mikrophone (Druckempfnger) in einem Abstand d entlang einer vorgegebenen x-Achse anordnet, kann man die Schnelle in x-Richtung approximieren durch
t

v x ( t)
0

( p ( t') p ( t'))dt'
1 2

(II.96b)

Abbildung 2.19: Prinzipieller Aufbau einer Schallschnelle bzw. Intensittsmesonde

Die Schnelle in x-Richtung wird daher durch numerische Integration ber die Zeit ermittelt und die Richtung der Schnelle kann durch Ausrichtung der x-Achse der Schnelle-Sonde abgetastet werden. Fr die Praxis ist als wesentlich wichtigere Megre die Schallintensitt I I = p(t ) v(t )

(II.97)

von groer Bedeutung, bei der es sich um eine vektorielle Gre handelt, die der Schalleistungsfludichte entspricht. Die Schalleistung, die durch eine vorgegebene Flche S geht, ist nmlich gegeben durch P = IdS = p( t ) v( t ) dS
S S

(II.98)

Dieser Ausdruck ist analog zu der Leistung im Wechselstromkreis, die bekanntlich durch das gemittelte Produkt aus Wechselspannung und Wechselstrom auftritt. Da sowohl Spannung als auch Strom eine komplexe Gre sind, mu genauso wie hier im Fall des Schalldrucks und der Schallschnelle die jeweilige Phasenlage beachtet werden. Wir nehmen also an, da wir sowohl fr den Schalldruck als auch die Schallschnelle eine Amplitude p0 bzw. v0 und eine Phase und haben:

56

Erzeugung, Ausbreitung, Messung und Bewertung von Schall

p( t ) = Re{p o e i e it }, v( t ) = Re{v o e i e it }

(II.99)

Die Intensitt ergibt sich dann als Produkt aus diesen beiden Gren im zeitlichen Mittelwert zu: I = v o p 0 Re( e i e it ) Re( e i e it ) = 1 v 0 p 0 cos( ) 2

(II.100)

Diese Intensitt hngt neben den Amplituden von Schallschnelle und druck nur von der Phasendifferenz - ab, wobei eine formal hnliche Beziehung wie bei der Phasendifferenz zwischen Spannung und Strom im Wechselstromkreis auftritt. Eine maximale Intensitt und damit eine besonders hohe Schallenergieabstrahlung wird erreicht, wenn Schalldruck p und Schallschnelle v zeitlich in Phase sind. Dies entspricht der Abstrahlung einer Wirkleistung. Wenn p und v dagegen 90 Grad zeitlich phasenverschoben sind, tritt nur eine Blindleistung auf, d. h. es wird keine Energie nach auen transportiert und im Schallfeld wird die Energie lokal hin und her gepumpt. In der Praxis kann nun die Intensitt mit einem Mikrophonpaar aufgenommen werden, dessen Anordnung wir schon oben bei der SchnelleBestimmung kennengelernt haben. Als numerisches Integral wird aus den beiden Schallsignalen p1(t) und p2(t) folgender Ausdruck gebildet: 1 1 p1 ( t ) + p 2 ( t ) p1 ( ) p 2 ( ) d dt Ix = 2 d T 0 0
T

] [

(II.101)

Das erste Integral approximiert dabei den mittleren Schalldruck p(t) und das zweite Integral approximiert die Schnelle vx(t). Das Ausmessen der Schallintensitt besitzt nun einen groen Vorteil, wenn zugleich die Intensitt ber einen geschlossenen Integrationsweg (z. B. die Umrandung einer Maschine) ausgefhrt werden kann. Durch vektorielle Addition der entlang dieses Integrationsweges aufgenommenen Intensitts-Vektoren wird erreicht, da von auen einfallende Strschallquellen herausgerechnet werden, da sich ihre Intensitts-Komponenten in dem Integral gerade wegheben. Nur die von der eingeschlossenen Schallquelle ausgestrahlte Schalleistung bleibt bei der vektoriellen Addition ber diesen Integrationsweg erhalten. Auf diese Weise ist es mglich, verschiedene Schallquellen voneinander getrennt auszumessen, ohne diese von ihrem Standort entfernen zu mssen.

Erzeugung, Ausbreitung, Messung und Bewertung von Schall

57

II.4 Schallpegel, Schalldosis, Lautheit und Lstigkeit II.4.1 Schallpegel


Bei der Hrakustik ergibt sich zwischen dem niedrigsten auftretenden Schalldruck (der Ruhehrschwelle) und dem praktisch hchsten Schalldruck (d. h. der Schmerzschwelle) beim Menschen ein sehr groer Bereich. Bei 1 kHz betrgt z. B. Ruhehrschwelle: p 0 = 2 10 5 N / m 2 Schmerzschwelle: p max 20 N / m 2 Bei der Umsetzung dieser Schalldrcke in Sinneseindrcke (also bei der Wahrnehmung von Lautstrke) gilt zudem das Weber-Fechnersche Gesetz: I = const. fr alle I I

Wahrnehmung =

(II.102)

Dieses Gesetz besagt, da die kleinste wahrnehmbare nderung bei einer Reizgre gerade proportional zur Reizgre selbst ist. Durch Aufintegrieren dieser Bedingung folgt, da die Lautstrkenwahrnehmung proportional zum Logarithmus der Schallintensitt (bzw. des Logarithmus des Schallpegels) ist: Wahrnehmung ~ log I (II.103)

Aus diesen beiden Grnden bietet es sich an, als praktikable Einheit des Schalldrucks (bzw. der Schallintensitt) nicht den Druck direkt, sondern den Logarithmus des Schalldrucks zu verwenden. Bei dieser logarithmischen Skala hat man allerdings noch einen Skalierungsfaktor frei, den man gerade so whlen kann, da eine Einheit auf dieser logarithmischen Skala gerade ungefhr der kleinsten wahrnehmbaren Schallpegelnderung entspricht. Diese Forderung fhrt zur dB-Skala, fr die gilt: p p ref

Schalldruckpegel: L = 20 log 10

p ref : Bezugsschalldruck (II.104)

Die ursprnglich zu Ehren von Alexander Graham Bell benannte PegelEinheit Bel ist gerade eine um den Faktor 10 grbere Skala, die eine Fein-

58

Erzeugung, Ausbreitung, Messung und Bewertung von Schall

Unterteilung in zehntel notwendig macht, so da diese Pegelskala als Dezibel bezeichnet wird. Fr quadratische Gren (z. B. die Schallintensitt I = pv, oder die Schalleistung P) wird anstelle des Faktors 20 der Faktor 10 verwendet:
I I ref

L = 10 log10

(II.105)

Durch diese Definition ist gewhrleistet, da eine Pegelnderung in dB davon unabhngig ist, ob gerade ein Verhltnis von Schalldrcken (lineare Gre) oder ein Verhltnis von quadratischen Gren (z. B. Schallintensitt) gebildet wird. Weiterhin ist festzuhalten, da die dB-Skala immer einen Bezugswert braucht und damit als relative Skala anzusehen ist. Die folgenden Werte von Pegelnderungen sind fr die Praxis dabei von besonderer Bedeutung: 1 dB 3 dB 6 dB 10 dB 20 dB kleinster hrbarer Pegelunterschied Verdoppelung der Leistung ( log10 2 0,3) Verdoppelung der Amplitude, Vervierfachung der Leistung Verdoppelung der subjektiven Lautstrke, zehnfache Leistung zehnfache Amplitude, 100-fache Leistung

Je nach Wahl des Referenz-Schalldrucks wird der jeweilige Schallpegelwert unterschiedlich bezeichnet. Wenn wir genau wie oben wieder den Pegel definieren als: p p ref

L = 20 log

(II.106)

gibt es die folgende Festlegung: dB SPL (Sound Pressure Level): Dieser Pegelwert bezieht sich auf die absolute Ruhehrschwelle bei 1 kHz, fr die gilt:

Erzeugung, Ausbreitung, Messung und Bewertung von Schall

59
(II.107)

p ref = p 0 = 2 10 5

N = 2 10 4 bar 2 m

Diese Definition kann fr beliebige Schalle von beliebiger Bandbreite angewandt werden. Der angenommene Referenzschalldruck pref mu dabei nicht genau der individuellen Ruhehrschwelle entprechen. Beispielsweise weicht die genormte (ber ein groes Versuchspersonenkollektiv gemessene) Ruhehrschwelle etwas von diesen Wert bei 1kHz ab. dB HL (Hearing Level): Damit wird der auf die genormte Ruhehrschwelle von Normalhrenden bezogene Schalldruckpegel bezeichnet, also: pref = Ruhehrschwelle bei der jeweiligen Frequenz (Normwert) (II.108) Diese Pegeldefinition ist nur sinnvoll anzuwenden fr SchmalbandSchalle, da die Ruhehrschwelle stark frequenzabhngig ist. dB SL (Sensation Level): Bei dieser auf die individuelle Ruhehrschwelle bezogenen Pegeldefinition gilt: pref = Individuelle Ruhehrschwelle bei der jeweiligen Frequenz (II.109) Bei Normalhrenden ist diese Definition weitgehend mit der Definition dB HL identisch. Abweichungen ergeben sich jedoch bei angehobener Ruhehrschwelle (z. B. Schwerhrigen) aber auch bei sehr kurzen Signalen, bei denen die Ruhehrschwelle erst bei hheren Schalldruckpegeln erreicht wird, als bei lngeren bzw. stationren Signalen. Diese Pegeldefinition ist ebenfalls nur sinnvoll anzuwenden bei Schmalbandschallen. dB A (mit Filter A bewertet): Bei dieser Pegeldefinition wird die Ruhehrschwelle bzw. die Lautheitsempfindung bei niedrigen Lautstrken insofern bercksichtigt, als sehr niedrige und sehr hohe Frequenzen weniger gewichtet werden als die mittleren Frequenzen. Dazu wird das Eingangssignal zunchst mit dem Filter A gefiltert, der die Hhen- und Tiefenabsenkung bei niedrigen Pegeln simuliert. Das Ausgangssignal wird dann in dB SPL gemessen.

60

Erzeugung, Ausbreitung, Messung und Bewertung von Schall

Abbildung 2.20: Verschiedene Referenzpegel und Pegeldefinitionen

dB Pe (Peak Equivalent): Diese Definition wird bei sehr kurzen Reizen verwendet. Dazu ist der Maximal-Pegel angegeben, der bei einer Hintereinanderkettung der auszumessenden kurzen akustischen Stimuli auftreten wrde. Dieser Pegel entspricht im wesentlichen dem Spitzenpegel des kurzzeitigen Signals dBeq oder Leq: Dieser als quivalenter Dauerschallpegel bezeichnete Mewert wird fr zeitlich fluktuierende Schalle verwendet. Dabei wird die GesamtSchallenergie ber einen Bezugszeitraum T gemittelt. Der zu diesem Mittelwert zugehrige Pegel wird dann als Leq bezeichnet also : 1 T 2 2 Leq = 10 log 10 p (t ) / p 0 dt T 0

(II.110)

Die Bezugszeit T ist dabei von der jeweiligen Anwendung abhngig. Um den verschiedenen mglichen zeitlichen Verlufen von akustischen Signalen Rechnung zu tragen, kann der Schallpegel entweder ber einen langen Zeitraum gemittelt werden (dabei fallen etwaige Schwankungen des Kurzzeit-Pegels unter den Tisch und flieen in den Mittelwert ein) oder ganz kurze Mittelungskonstanten, bei denen auch kurzfristige PegelFluktuationen aufgelst werden. Fr Schallpegelmegerte werden daher verschiedene Mittelungszeitkonstanten bentigt, deren Gre wie folgt festgelegt wird:

Erzeugung, Ausbreitung, Messung und Bewertung von Schall

61

I (Impuls): Anstieg 35 ms, Abfall 1500 ms F (Fast): S (Slow): beide je 125 ms beide je 1000 s

Fr die Messung von Sprache wird zumeist die Einstellung Impuls oder Fast benutzt, um den Spitzenwert des Sprachpegels ermitteln zu knnen. Dann wird ein mittlerer Spitzenpegel errechnet. Die Gesamt-Aussteuerung des Sprachsignals sollte einige dB oberhalb dieses mittleren Spitzenpegels liegen, um bersteuerungs-Artefakte zu vermeiden.

II.4.2 Schallwirkung und Schalldosis


Neben den erwnschten Wirkungen von Schall (z. B. fr die zwischenmenschliche, akustische Kommunikation) gibt es unerwnchte Schallwirkungen, die insbesondere dann auftreten, wenn Menschen nicht freiwillig, sondern unfreiwillig einer Schalleinwirkung ausgesetzt sind. Die dabei auftretenden negativen Wirkungen knnen grob nach dem Pegelbereich klassifiziert werden, in dem sie auftreten. Bei dieser Aufteilung (s. Abbildung) wird der quivalente Dauerschallpegel Leq mit A-Bewertung eingesetzt. Dieser Pegel entspricht zwar nicht exakt der wahrgenommenen Lautstrke (s. u.) und auerdem wird bei der Schallbewertung nicht bercksichtigt, welchen Bedeutungsgehalt das jeweilige Schallsignal besitzt, trotzdem knnen diese Werte als Orientierung dienen.

Abbildung 2.21: Pegelbereiche, fr die unterschiedliche schallwirkungen beim Menschen auftreten

Im Bereich oberhalb von 35 dB(A) kommt es zu Schlafbeeintrchtigungen, d. h. die Erholungsphasen im Schlaf werden gestrt und die diesen Lrmeinflu unterliegenden Personen fhlen sich morgens nicht erholt. Als Richtwert sollte daher der Schallpegel in Schlaf- und Ruherumen 35 dB(A) nicht berschreiten. Oberhalb von etwa 40 dB(A) wird das Ruhebedrfnis whrend der Erholungsphasen (auch im Wachzustand) beeintrchtigt, so da Strungen bei der Erholung auftreten knnen. Ein Schallpegel von grer etwa 45 dB(A) fhrt zum Aufwachen und Schall-

62

Erzeugung, Ausbreitung, Messung und Bewertung von Schall

pegel von mehr als 55 dB(A) fhren zu physiologisch mebaren und durch psychologische Tests erfabaren Stre-Reaktionen (z. B. Anstieg des Blutdrucks, Vernderung des Hautleitwertes durch Schweiabsonderung, Vernderung des Fingerpulses). Falls der Lrmpegel noch weiter ansteigt, treten neben diesen reversiblen Strungen auch schdigende Schallwirkungen im Sinne einer Lrmschwerhrigkeit auf. Obwohl die Empfindlichkeit gegenber Dauerlrm sehr stark von Person zu Person schwankt, wird als Grenzwert fr die beruflich bedingte Lrmexposition ein Wert von 85 dB(A) festgesetzt. Oberhalb dieses Grenzwertes drfen beruflich lrmexponierte Personen (z. B. Diskjockeys) nicht ohne persnlichen Gehrschutz arbeiten. Fr sich freiwillig dem Lrm aussetzende Personen, bei denen von einer lngeren Rekreationsphase des Gehrs ausgegangen werden kann, gibt es keine derartigen Grenzwerte (d. h. die Diskobesucher auf der Tanzflche sind nicht durch gesetzliche Regelungen vor zu lauten Schallpegeln geschtzt). Eine Lrmexposition bei einem entsprechend hohen Pegel fhrt im gnstigsten Fall zu keiner oder zu einer zeitlich wieder zurckgehenden Schwellenverschiebung (Temporary Threshold Shift , TTS). Dabei wird davon ausgegangen, da sich die im Gehr geschdigten Mechanismen wieder rekreieren knnen. Ist das Lrmereignis von zu groer Intensitt (z. B. Knalltrauma) oder reichen die Erholungsphasen zwischen aufeinanderfolgenden Lrmexpositionen nicht aus, so entwickelt sich eine permanente Schwellenabwanderung (Permanent Threshold Shift, PTS). Diese Lrmschwerhrigkeit macht sich anfangs im Audiogramm besonders im 5 Bereich um etwa 4 kHz durch eine Schwellenabwanderung (c -Senke) bemerkbar, die sich bei Fortschreiten der Exposition bzw. des Krankheitsprozesses zu hheren und tieferen Frequenzen ausbreitet und typischerweise zu einer Hochtonschwerhrigkeit mit reiner Innenohrkomponente entwickelt. Leider gibt es derzeit keine kausalen Behandlungsmglichkeiten, um eine Lrmschwerhrigkeit zu beheben. Es stehen lediglich Rehabilitationsmanahmen zur Verfgung, mit denen versucht wird, das Hrvermgen von Lrm-Schwerhrenden mglichst gut an das Hrvermgen von Normalhrenden wieder anzugleichen (Hrgerte). Da nach wie vor in vielen Lrmbetrieben die Lrmschutz-Vorschriften nicht ausreichend beachtet werden bzw. von den Mitarbeitern zugunsten besserer Kommunikation umgangen werden, ist die Lrmschwerhrigkeit nach wie vor eine hufige Berufskrankheit und die am hufigsten zu Entschdigungsrente fhrende Berufskrankheit. Die Disposition (Veranlagung zur Entwicklung einer Lrmschwerhrigkeit) bei Lrmeinwirkung ist sehr stark unterschiedlich. Beispielsweise gibt es Glas-Ohren, die schon bei geringen Gesamtlrm-Dosen zerbrechen und auf der anderen Seite Stahl-Ohren, die wesentlich hhere Schalldosen vertragen knnen, ohne eine signifikante nderung im Hrvermgen aufzuweisen. Aufgrund dieser sehr star-

Erzeugung, Ausbreitung, Messung und Bewertung von Schall

63

ken individuellen Unterschiede und der Schwierigkeit eine Gesamt-Dosis fr den einwirkenden Schall exakt zu ermitteln (es gibt noch kein der radioaktiven Strahlenexposition quivalentes Dosimeter fr Schall) ist es auch sehr schwierig, eine Dosis-Wirkungsbeziehung fr die Schwerhrigkeit exakt anzugeben. Die derzeitig verfgbaren Daten ber die Entwicklung von Hrverlust in Abhngigkeit von der Schalldosis sind in der ISO-1999 enthalten, deren prinzipielle Angaben im folgenden abgebildet sind:

Abbildung 2.22: Entwicklung von Hrverlust in Abhngigkeit von der Schalldosis gem ISO-1999

Aufgetragen ist fr unterschiedliche mittlere A-bewertete Schalldruckpegel der Prozentsatz an Personen, die bei einer bestimmten Expositionsdauer mit diesem Schallpegel eine signifikante Schwerhrigkeit entwickeln. Dieser Prozentsatz steigt naturgem mit zunehmendem Schalldruckpegel und besitzt eine untere Grenze von etwa 85 dB(A), die sich kaum vom altersabhngigen Hrverlust unterscheidet. Auch aus diesem Grund erscheint die Einfhrung des Grenzwertes 85 dB(A) fr beruflich schallexponierte Personen sinnvoll.

II.4.3 Lautheit und Lstigkeit


Bereits oben wurde das Problem angesprochen, da der A-bewertete quivalente Dauerschallpegel Leq nicht fr smtliche mglichen Schalle ein Ma fr von normalhrenden Versuchspersonen tatschlich wahrgenommene Lautstrke darstellt. Er stellt zwar eine brauchbare Nherung dar, die insbesondere auf dem Weber-Fechnerschem Gesetz und einer Frequenz-Gewichtung fr kleine Eingangspegel (A-Bewertung) beruht, fhrt aber zu signifikanten Abweichungen bei groen Pegeln, bei zeitlich schwankenden Signalen und kann den wahrnehmbaren Lautstrkenun-

64

Erzeugung, Ausbreitung, Messung und Bewertung von Schall

terschied zwischen breitbandigen und schmalbandigen Signalen mit demselben Pegel nicht richtig wiedergeben. Eine genauere Beschreibung des vom Menschen empfundenen Schalleindrucks bei einem vorgegebenen akustischen Signal liefert die Lautheit, die in der psychophysikalischen Literatur eingehend untersucht wurde. Fr die Lautheit sind die folgenden Faktoren des akustischen Signals von Bedeutung: a) Intensittsabhngigkeit Gem den Experimenten des Psychophysikers Stevens ist die wahrgenommene Lautheit proportional zur Schallintensitt hoch einem Exponenten p, der den Wert von ungefhr 0,3 annimmt, also: Lautheit [Zahlenangaben] Intensitt , p 0.3 (Stevenssches Potenzgesetz)
p

(II.111)

Dieses Potentzgesetz gilt in hnlicher Form auch fr eine Reihe anderer Modalitten, z. B. die Helligkeitsempfindung in Abhngigkeit von der Lichtintensitt, die Schmerzempfindung bei mechanischen Reizen usw. , wobei fr jede Sinnes-Modalitt eine eigene, charakteristische Potenz p auftritt. Gemessen wird wahrgenommene Lautheit mit einer freien (oder relativen) Grenschtzung, bei der die Versuchsperson fr jeden vorgegebenen Testschall die empfundene Lautheit mit einer Zahl aus einem beliebigen Bereich kennzeichnen mu. Abwandlungen von dieser Methode sind die eingeschrnkte Grenschtzung, bei der der Zahlenbereich vorgegeben wird, oder die Grenschtzung mit Anker-Schall, bei der ein fester Referenzschall (z. B. ein 1-kHz-Ton bei 40 dB) mit einer festen Einheit (z. B. dem Wert 1) als Referenz vorgegeben wird. Diese Verfahren fhren ebenso wie ein Herstellungsverfahren, bei dem die Versuchsperson beispielsweise die doppelte oder die Hlfte der Lautheit eines vorgegebenen Tones einregeln mu, alle in hnlicher Weise zu dem o. a. Potenzgesetz. Aus diesem Grunde hat das Stevensche Potenzgesetz fr die Psychophysik eine sehr hohe Bedeutung erlangt. Fr den Fall der akustischen Wahrnehmung wird die Lautheit, die ein 1-kHz-Dauerton bei einem Schalldruckpegel von 40 dB SPL erzeugt, mit der Lautheit von 1 sone bezeichnet. Eine Verdoppelung der Lautheit wird durch eine Anhebung des Pegels um etwa 10 dB erreicht, so da ein 50 dB-Ton bei 1 kHz etwa die Lautheit von 2 sone aufweist. Die Einfhrung der sone-Skale und die internationale Normierung der Lautheit fr stationre Schalle geht wesentlich auf die Arbeiten von Stevens und Zwicker zurck. Der Zusammenhang zwischen Lautheit (in sone) und Schalldruckpegel (in dB SPL) ist fr einen 1-kHz-Ton schematisch in der folgenden Abbildung dargestellt.

Erzeugung, Ausbreitung, Messung und Bewertung von Schall

65

Abbildung 2.23: Lautheit eines 1kHz-Tones in Abhngigkeit vom Schalldruckpegel

Obwohl das Konzept der Lautheit inzwischen weite Verbreitung gefunden hat und es auch kommerziell erhltliche Lautheits-Megerte ergibt, soll auch die Kritik an dem Konzept der Lautheit nicht verschwiegen werden: So wird bezweifelt, da naive Versuchspersonen einer Reihe von Stimuluswerten die empfundene Lautheit auf einer Zahlenskala so zuordnen knnen, da die Verhltnisse zwischen den angegebenen Zahlen auch tatschlich dem wahrgenommenen Lautheitsverhltnissen entsprechen. Vielmehr kann davon ausgegangen werden, da es sich eher um eine Rang-Skale (Ordinal-Skala) und weniger um eine Verhltnisskala (Rational-Skala) handelt. Auerdem neigen Versuchspersonen bei der Angabe von groen Zahlen zu einem Logarithmic Response Bias, d. h. bei sehr groen Zahlen wird nur noch die Anzahl der Nullen als wichtig erachtet und nicht mehr der absolute Unterschied zwischen den Zahlen (beispielsweise ist anschaulich der Abstand zwischen 9 und 10 grer als der Unterschied zwischen 10.000 und 10.001). Wenn die Anzahl der mglichen Antwortalternativen fr die Versuchspersonen (Antwortkategorien) auf eine berschaubare Anzahl beschrnkt bleibt, tritt der Logarithmic Response Bias nicht auf. Dies ist z. B. bei der KategorialBeurteilungs-Methode nach Heller der Fall, bei der fnf Antwortkategorien zur Verfgung stehen oder bei der in Oldenburg angewandten 11-stufigen Kategorial-Beurteilung. Fr eine derartige Beurteilungstechnik tritt nicht das Stevensche Potenzgesetz, sondern vielmehr das WeberFechnersche Gesetz auf, d. h. die von der Versuchsperson angegebene Lautheit (in Kategorien) ist proportional zum Logarithmus der Intensitt (und nicht zu der Intensitt mit einer Potenz kleiner als 1).

66

Erzeugung, Ausbreitung, Messung und Bewertung von Schall

b) spektrale Abhngigkeit der Lautheit Fr reine Tne knnen die Kurven gleicher Pegellautstrke (Isophonen) ermittelt werden, die fr jede Frequenz den Tonpegel angeben, der zu demselben Lautstrkeeindruck fhrt, wie ein 1-kHz-Ton bei dem jeweils vorgegebenen Pegel. Fr sehr kleine Referenz-Pegel nhert sich diese Kurve gleicher Pegellautstrke stark der Ruhehrschwelle an (z. B. die 10-Phon-Isophone, s. u.). Bei hohen Pegeln ist der Verlauf der Isophone dagegen relativ flach.

Abbildung 2.24: Kurven gleicher Pegellautstrke (Isophone), d.h. Kombination von Pegeln und Frequenzen, fr die ein Sinuston als gleich laut empfunden wird wie ein 1kHz-Ton bei dem entsprechendem Schalldruckpegel.

Wenn man anstelle von Sinus-Tnen dagegen breitbandigere Schalle verwendet, knnen die Isophonen nicht mehr exakt angewandt werden. Stattdessen geht man davon aus, da im Gehr eine Aufspaltung in Frequenzgruppen stattfindet, deren Breite bei Frequenzen unterhalb von 500 Hz etwa 100 Hz betrgt und oberhalb von 500 Hz etwa 1/5 der Mittenfrequenz. Die Energie innerhalb jeder Frequenzgruppe wird aufaddiert und fhrt zur spezifischen Lautheit, d. h. zur Lautheit in dieser Frequenzgruppe. Der Gesamtlautheitseindruck wird nun durch Summation ber die spezifischen Lautheiten in den einzelnen Frequenzgruppen ausgefhrt. Eine wesentliche Begrndung fr diese Modellvorstellung liefert die sogenannte Lautheitssummation, d. h. der Anstieg der Lautheit bei Verteilung der gleichen Schallenergie in immer breitere Frequenzbereiche:

Erzeugung, Ausbreitung, Messung und Bewertung von Schall

67

Abbildung 2.25: Lautheitssummation: Im linken Teilbild ist schemetisch die spektrale Verbreiterung des Stimulus bei gleichbleibender Leistung dargestellt. Das rechte Teilbild gibt den Pegel eines als gleich laut eingestuften Referenzstimulus an als Funktion der Bandbreite f des Teststimulus dessen Leistung konstant gehalten wird.

Wenn die Gesamt-Leistung eines Rauschsignals konstant ist, aber die Bandbreit f zunimmt, nimmt der Lautstrkeneindruck zu. Wenn man ein Schmalbandgerusch und ein Breitbandgerusch auf denselben Lautheitseindruck bringen mchte, wird ein Pegelunterschied bis zu 10 dB bentigt, d. h. ein breitbandiges Gerusch wird als etwa doppelt so laut wie ein schmalbandiges Gerusch mit demselben Pegel wahrgenommen. Die Bandbreite, ab der dieser Lautheitsanstieg zu beobachten ist, wird als die Frequenzgruppenbreite fr Lautheit bezeichnet. Eine Erklrung fr diesen Effekt folgt aus dem o. a. Frequenzgruppen-Konzept, da die GesamtLautheit grer ist, wenn erst die Energie in den verschiedenen Frequenzgruppen komprimiert wird (Lautheitsbildung durch Logarithmierung oder Potenzierung mit einem Exponenten kleiner 1) und dann summmiert wird.Sie steht im Gegensatz zu der schmalbandigen Anregung, wo erst smtliche Intensitt in einem Frequenzband aufaddiert wird und dann die Gesamt-Intensitt komprimiert wird (d.h. logarithmiert bzw. mit einem Exponenten kleiner 1 potenziert wird). Bei der Berechnung der spezifischen Lautheit mu allerdings bercksichtigt werden, da eine schmalbandige Anregung bei einer Frequenz auch Auswirkungen auf niedrige und hhere Frequenzen hat: Diese Verschmierung der spektralen Energie, die im Gehr stattfindet, kann man durch Maskierungsexperimente ausmessen, bei denen ein schmalbandiger Test-Stimulus in Gegenwart eines anderen, ebenfalls schmalbandigen Maskierers detektiert (d. h. herausgehrt) werden soll. Bei systematischer Vernderung der Testton-Frequenz lt sich ein Maskierungsmuster erhalten, das relativ steile Flanken zu niedrigen Frequenzen hin und relativ flache Flanken zu hohen Frequenzen hin aufweist. Hohe Tne werden von tieferen Tnen also strker verdeckt (maskiert) als umgekehrt. Dies ist zum Beispiel der Grund dafr, da in einem gemischten

68

Erzeugung, Ausbreitung, Messung und Bewertung von Schall

Chor relativ wenige Mnnerstimmen gleich gut hrbar sind wie die zahlenmig berlegenden Frauenstimmen bei hohen Frequenzen. Aufgrund dieser Eigenschaften des Gehrs geht man bei der rechnerischen Ermittlung der Lautheit bei einem vorgegebenen Schall von einem Erregungspegelmuster aus, d. h. man ermittelt in jeder Frequenzgruppe, ob die Maskierungsflanken von benachbarten Frequenzgruppen grer sind als die in dieser Frequenzgruppe vorliegende Schallenergie und nimmt das jeweilige Maximum als den Beitrag an, den die betrachtete Frequenzgruppe zum Gesamt-Lautheitseindruck beitrgt. Dieses Vorgehen hat den Vorteil, da Schallkomponenten, die maskiert sind (d. h. durch die Anwesenheit anderer Schallkomponenten nicht gehrt werden knnen) auch nicht zum Lautheitseindruck beitragen.

Abbildung 2.26: Erregungsmuster eines schmallbandigen Maskierers, d.h. ber der Frequenz(gruppe) aufgretragene Pegel eines Sinustones, der bei Anwesenheit des Maskierers soeben nicht mehr wahrgenommen wird.

c) Zeitabhngigkeit Um die Zeitabhngigkeit der Lautheit zu erfassen, mu zum einen die Zeitabhngigkeit der Maskierung bercksichtigt werden: Im Zeitbereich vor Anschalten eines Schalls tritt eine Maskierungswirkung (Vorverdeckung) auf, die etwa einen Zeitbereich von maximal 10 ms berdeckt. Nach Abschalten des Maskierers tritt analog dazu eine Nachverdeckung auf, d. h. kurz nach dem Ende des Maskierers angebotene Schalle mssen in ihrem Pegel stark erhht werden, um hrbar zu sein. Die Nachverdeckung berstreicht einen Zeitbereich von etwa 200 ms. Sie baut sich langsam auf, d. h. bei sehr kurzen Maskierern fllt die Nachverdeckung viel schneller ab als bei lngeren Maskieren. Auerdem ist der Abfall der Nachverdeckung bei Maskierern mit hoher Intensitt wesentlich schneller als bei Maskierern mit niedriger Intensitt. Wird ein Testschall gleichzeitig mit dem Maskierer angeboten, so tritt das Phnomen der Simultanverdeckung auf. Aus den Phnomenen Vorverdekkung, Simultanverdeckung und Nachverdeckung kann auf die zeitliche Verschmierung der Schall-Wahrnehmung geschlossen werden, die fr die Modellierung der Lautheitswahrnehmung von Bedeutung ist.

Erzeugung, Ausbreitung, Messung und Bewertung von Schall

69

Abbildung 2.27: Zeitliches Maskierungsmuster fr drei Maskierer mit: Linkes Teilbild: jeweils unterschiedlicher Dauer. Rechtes Teilbild: zeitliche Integration des Testschalls (aufgetragen ist der Schwellenpegel eines Testschalls bei Vorliegen eines Maskierers als Funktion seiner Dauer).

Eine weiterer zeitlicher Aspekt der Lautheitswahrnehmung kann aus der Test-Ton-Integration geschlossen werden, d. h. den fr die Detektion eines Testschalls notwendigen Pegels in Abhngigkeit von der Dauer des Testschalls. Fr sehr kurze Test-Schall-Dauern (kleiner als 200 ms) ist der fr eine Detektion des Testschalls (im Beisein eines stationren Maskierers) notwendige Pegel sehr hoch. Er nimmt mit Zunahme der TesttonDauer mit etwa 3 dB pro Verdopplung der Test-Schalldauer ab, so da dieser Vorgang in erster Nherung durch eine Energie-Integration ber eine Dauer von 200 ms beschrieben werden kann. Whrend die bisher betrachteten Faktoren die zeitliche Verschmierung und Integration von Energie im Ohr beschrieben haben, die fr die Zeitabhngigkeit der Lautheit von Bedeutung ist, soll im folgenden betrachtet werden, wie die Gesamt-Lautheit eines im Zeitverlauf stark schwankenden Schalls ermittelt werden mu. Dies ist fr die Praxis sehr wichtig, weil die wenigsten Lrmquellen stationr sind und viele Gerusche (z. B. Vorbeifahrgerusch von Autos an einer belebten Strae) durch Fluktuationen beschrieben werden. Dabei hat sich gezeigt, da nicht etwa ein Mittelwert oder ein Medianwert des Lautheits-Verlaufs ber der Zeit die GesamtLautheitswahrnehmung am besten reprsentiert, sondern die sogenannte Perzentil-Lautheit.

70

Erzeugung, Ausbreitung, Messung und Bewertung von Schall

Abbildung 2.28: Berechnung der 5%-Perzentillautheit Ns als der Wert, der in 5% der Zeit berschritten wird.

So bezeichnet die 5 %-Lautheit N5 denjenigen Lautheitswert, der nur in 5 % der Zeit berschritten wird. Damit werden den Lautheitsspitzen besondere Bedeutung zugemessen, da dies am ehesten mit dem GesamtLautheitsurteil von Versuchspersonen bei fluktuierenden Schallen korreliert. Es ist aber festzuhalten, da dieses Konzept einer Perzentil-Lautheit stark von dem Konzept des quivalenten Dauerschallpegels Leq abweicht. Whrend der Leq die Intensitt zeitlich mittelt, mittelt die Perzentil-Lautheit die Lautheit und nimmt auch nicht den Mittel- oder Medianwert, sondern einen Wert, der sich eher an den auftretenden Intensittsspitzen orientiert. Dieses Verfahren liefert bei den praktisch wichtigen zeitlich fluktuierenden Geruschen daher hhere Wert als der Leq und wrde daher einen hheren Lrmschutz der betroffenen Personen erfordern. Da es sich mehr an dem tatschlich von Versuchspersonen empfundenen Lautheitseindruck orientiert als der (primr physikalisch definierte) Leq, ist die Einfhrung von gehradquaten Lautheitsmessverfahren und eine Ablsung der bisherigen Lrmmevorschriften zu fordern. Die hier beschriebenen Einflufaktoren fr die Bildung der Lautheit sind in dem von Zwicker entwickelten Lautheitsmodell enthalten, das die vom Menschen empfundene Lautheit fr jeden beliebigen Schall vorhersagt. Dieses Lautheits-Vorhersage-Verfahren ist (zumindestens fr stationre Schalle) inzwischen genormt und soweit etabliert, das es in verschiedenen Megerten bereits implementiert wurde und in der Praxis eingesetzt werden kann. Die Lautheit korreliert zwar mit der Lstigkeit von Schallen, kann aber nicht Effekte vorhersagen, die einen Klang als besonders unangenehm erscheinen lassen. Die Unangenehmheit eines Schalls ist zwar auch durch den Kontext bestimmt (d. h. durch die individuelle Bedeutung, die der Schall fr jede Person aufweist) dennoch gibt es einige Anstze, kontextfreie oder unbeeinflute Lstigkeitsvorhersagen von Schallen durchzufhren. Von Zwicker wurde beispielsweise ein Verfahren zur

Erzeugung, Ausbreitung, Messung und Bewertung von Schall

71

unbiased annoyance (UBA) vorgeschlagen, das als Einheit die Annoyance Unit (AU) aufweist. Dieses Verfahren bewertet neben der Lautheit auch einige Klangparameter (z. B. die Rauhigkeit und die Schrfe des Klangs). Dabei handelt es sich um ein theoretisch interessantes Konzept, das aber noch nicht hinreichend validiert ist und von der Seite der Schallwirkungsforschung einer starken Kritik ausgesetzt ist.

72

Erzeugung, Ausbreitung, Messung und Bewertung von Schall

Verarbeitung und Analyse akustischer Signale

73

III Verarbeitung und Analyse akustischer Signale


III.1 Aufnahme- und Wiedergabetechnik: Bestandteile der bertragungskette
Die Aufnahme, Analyse, Verarbeitung und Wiedergabe akustischer Signale erfordert eine Reihe von technischen Elementen und Techniken, deren detaillierte Behandlung fr jedes Einzelelement den Rahmen der vorliegenden Ausarbeitung bei weitem sprengen wrden. Es soll daher zunchst in groben Zgen erleutert werden, welche Prinzipien bei den einzelnen Schritten von Bedeutung sind und was bei den einzelnen technischen Elementen an Besonderheiten zu beachten ist. Die bertragungskette der Aufnahme- und Wiedergabetechnik kann aufgeteilt werden in den Schallaufnehmer, den bertragungskanal bzw. Speicher des Schallsignals und Elemente zur Schallwiedergabe (vgl. Tabelle 3.1). Bei den Schallaufnehmern ist das Mikrophon das praktisch wichtigste Element. In einer praktischen Aufnahme-Situation werden zumeist mehrere Mikrophone in unterschiedlicher Anordnung verwendet, die eine gewisse Richtcharakteristik jeweils aufweisen. Fr einfache StereoAufnahmen gengen beispielsweise zwei Mikrophone in einem gewissen Abstand voneinander, deren Richtcharakteristik sich rumlich etwas unterscheidet (z. B. Super-Nieren-Charakteristik, die jeweils etwas nach rechts bzw. links von der Mitte geschwenkt wird). Durch eine derartige Anordnung werden im Stereo-Signal sowohl Intensitts- als auch Laufzeit (bzw. Phasen-) Unterschiede codiert, die beim Abhren der Aufnahme (z. B. ber Kopfhrer) einen rumlichen Eindruck vermitteln. Um ein nachtrgliches Abmischen beispielsweise einer Musikaufnahme zu ermglichen, werden dagegen mehrere Mikrophone verwendet, die jeweils dicht vor den auszunehmenden Schallquellen angeordnet sind und deren Richtcharakteristik eine maximale bertragung der gewnschten Schallquelle mit grtmglicher Dmpfung unerwnschter Richtungen ermglichen sollte. Je nach Verstrkung eines Mikrophon-Ausgangs-Signals fr den linken oder rechten Stereokanal kann die rumliche Position dieser Schallquelle in der Aufnahme eingestellt werden, wobei allerdings keine Phasenunterschiede, sondern nur Intensittsunterschiede zwischen den beiden Stereokanlen auftreten (Intensitts-Stereophonie). Die Verringerung des Abstandes zwischen Mikrophon und Schallquelle dient auch zur Verringerung des Einflusses des Grundrauschens der Mikrophone, das selbst bei den rauschrmsten erhltlichen Mikrophonen noch ber dem Pegel der Ruhehrschwelle bei Normalhrenden liegt. Dieses Rauschen wird bei der Wiedergabe unter die Ruhehrschwelle von Normalhrenden erst gedrckt, wenn eine Abschwchung des aufgenommenen akusti-

74

Verarbeitung und Analyse akustischer Signale

schen Signals erfolgt, die aufgrund des geringen Mikrophon-Abstandes zur Schallquelle oder aufgrund der Vielzahl der aufgenommenen Schallquelle notwendig wird. Die Weiterleitung des Mikrophon-Signals an die nachfolgende Schallbertragung oder Speicherungs-Einheit kann entweder drahtgebunden erfolgen oder drahtlos, d. h. durch eine Infrarot- oder Hochfrequenz-Sende-Empfangs-Anordnung. Um eine mglichst realistische und naturgetreue Schallwiedergabe zu ermglichen, wird anstelle von Mikrophonen oft ein Kunstkopf eingesetzt, bei dem eine Schulter-, Kopf-, und Auenohr-Nachbildung verwendet wird, bei der anstelle der Gehrgnge Mikrophone eingesetzt sind. Bei Kopfhrerwiedergabe der mit diesen Mikrophonen an einem bestimmten Ort aufgenommenen Schallsignale wird der Eindruck erweckt, als befnde man sich an dem Aufnahmeort, an dem der Kunstkopf sich befunden hat. Am originalgetreusten und am wenigsten richtungsverzerrend wirkt die Aufnahme dann, wenn sie mit den individuellen, eigenen Ohren der abhrenden Person aufgenommen wurde. Dies kann z. B. durch die Verwendung von Sondenmikrophonen im eigenen Gehrgang bei der Schallaufnahme erfolgen oder durch virtuelle Akustik, bei der die Auenohrbertragungsfunktion fr jede Versuchsperson individuell fr jede in Frage kommende Schalleinfallsrichtung ausgemessen wird. Zur Simulation des Schalleinfalls aus einer bestimmten Richtung wird dann im Computer das entsprechende Schallsignal mit der gemessenen, individuellen AuenohrImpulsantwort gefaltet, so da die Kunstkopftechnik damit simuliert wird. Zur Aufnahme von akustischen Phnomenen, die nicht von dem Medium Luft, sondern von anderen Medien bertragen werden (z. B. Wasser, andere Flssigkeiten oder Festkrper) gibt es eine Reihe von spezialisierten Schallaufnehmern (z. B. Hydrophone, Krperschallaufnehmer), auf die hier nicht nher eingegangen werden soll.

Verarbeitung und Analyse akustischer Signale

75

Tabelle 3.1: Mgliche Bestandteile einer Schallbertragungskette Schallaufnehmer: Mikrophon Anzahl Anordnung Richtcharakteristik Empfindlichkeit Rauschen drahtgebunden/drahtlos Kunstkopf realer Kopf nachgebildeter Kopf simulierter Kopf bertragungskanal/Speicher: Impedanzwandler/Verstrker Mischpult (analog/digital) Tonband (analog/digital) Equalizer (End-)Verstrker Signalleitung Signalbertragung (IR, HF) Schallwiedergabe: Lautsprecher Bauform Frequenzgang Leistung Raumakustik Kopfhrer Bauform Frequenz-Gang Phasengang max.Pegel Schwingungsgeber

Die mittlere Spalte von Tabelle 3.1 enthlt einige wichtige Beispiele von bertragungs-Elementen von Schallsignalen bzw. von Speicherelementen. Fr Aufnahmen mit einem Audio- oder Memikrophon ist meistens die Verwendung eines Impedanz-Wandlers und Vorverstrkers notwendig, die fr eine mglichst strungsfreie bertragung des vom Mikrophon erzeugten, sehr kleinen elektrischen Signals an den eigentlichen Verstrker bzw. das Speichermedium notwendig sind. Whrend beispielsweise die meisten dynamischen Mikrophone eine kleine Ausgangsimpedanz von wenigen 100 Ohm aufweisen (d. h. nur geringe Spannungen, dafr aber realtiv hohe Strme liefern knnen), haben die meisten Eingangsstufen von Leistungsverstrkern eine relativ hohe Eingangsimpedanz (d. h. bei Anlegen einer gewissen Wechselspannung fliet nur ein kleiner Wechselstrom). Da auf der Kabelverbindung zwischen Mikrophon und Endverstrker von einer gewissen Streinstreuung mit konstanter Leistung ausgegangen wird, mu nach Mglichkeit mglichst viel von der in elektrische Energie umgewandelten Schallenergie von Mikrophon zum (End-) Verstrker bertragen werden. Diese Leistungsbertragung ist optimal, wenn die Impedanz des Mikrophons mit der Eingangs-Impedanz des Verstrkers bereinstimmt, was beispielsweise durch die Verwendung eines bertragers (Transformator zur Impedanzanpassung) oder durch einen Vorverstrker bewerkstelligt werden kann, der im Mikrophon bzw. in unmittelbarer Nhe des Mikrophons angebracht wird und eine Impedanzwandlung mit gleichzeitiger Vorverstrkung der Mikrophon-Signale erreicht. In der Studio-Technik werden die Mikrophon-Signale dann einem Mischpult zugefhrt, bei dem der Pegel, der Klang (durch Anheben/Absenken bestimmter Frequenz-Bereiche), die Kanalzuordnung (linker bzw. rechter Stereokanal) und weitere Kontrollparameter (z. B. bertragung fr die Bhnen-Monitor-Anlage) eingestellt werden kann. Neben der konventionellen Analog-Technik setzt sich zunehmend auch die Digital-Technik fr den Studio-Bereich durch. Dies betrifft auch die Ab-

76

Verarbeitung und Analyse akustischer Signale

speicherung von Schall-Signalen, die beispielsweise mit Tonbandgerten (analoge Technik) bzw. digitalen Bandgerten (z. B. DAT-Tape) nahezu erfolgen kann. Mit Hilfe mit eines Equalizers kann der Gesamt-FrequenzGang der Aufnahme beeinflut werden und anschlieend einem Endverstrker zugefhrt werden, der die Leistung des elektrischen Eingangssignals soweit verstrkt, da das Signal ber Lautsprecher wieder hrbar gemacht werden kann. Am Ausgang des Endverstrkers befindet sich ber eine Signalleitung verbunden beispielsweise ein Lautsprecher. Ebenso wie bei den Eingangssignalen des Mischpults (z. B. bei drahtlosen Mikrophon-Anlagen) kann die bertragung des Ausgangssignals auch drahtlos (ber Infrarot oder Hochfrequenz-Verbindungsstrecke) erfolgen. Diese bertragungsart weist einige praktische Vorteile auf (z. B. Verringerung des Verlegeaufwandes von Leitungen, Beweglichkeit von Musikern auf der Bhne). Bei der Schallwiedergabe ist das hufigste Grundelement der Lautsprecher, der in verschiedenen Bauformen erhltlich ist und in unterschiedliche Gehuse eingebaut werden kann. Das Ziel ist dabei ein mglichst ausgewogener Frequenzgang, d. h. eine mglichst glatte bertragungsfunktion vom elektrischen Signal zum akustischen Signal in einiger Entfernung des Lautsprechers. Neben dem Frequenzgang des Lautsprechers ist auch die maximal abgebbare Leistung ein wichtiger Parameter, bei der zum einen zwischen der Eingangsleistung (d. h. maximal verkrafteter elektrischer Antrieb des Lautsprechers) und der akustischen Leistung (d. h. effektiv abgestrahlte akustische Signal-Leistung) unterschieden werden mu. Gebruchliche HiFi-Lautsprecher weisen einen Wirkungsgrad von nur wenigen Prozent auf. Obwohl die bertragungsfunktion einer Lautsprecher-Box im reflektionsarmen Raum durchaus einen glatten Verlauf aufweisen kann, ist fr den Betrieb derselben Lautsprecher-Box in einem geschlossenen, mit reflektierenden Wnden versehenen Raum mit einer deutlichen Vernderung der bertragungsfunktion zur rechnen: Beispielsweise werden durch die Anregung von Raumresonanzen ausgeprgte Minima und Maxima in der bertragungsfunktion bewirkt, so da bei der Beurteilung der Qualitt von Lautsprecher-Boxen neben den reinen akustischen Eigenschaften auch die Interaktion zwischen der Box und dem Raum zu beachten ist. Dieses Problem tritt nicht bei Kopfhrer-Wiedergabe auf, wobei sich die einzelnen Kopfhrer ebenfalls in ihrer Bauform (z. B. circumoral, d. h. das gesamte Ohr umschlieend, supraaural, geschlossen / offen) und in ihrem Frequenz- und Phasengang unterscheiden. Fr den Frequenzgang von Kopfhrern wird eine bestimmte Vorgabe (z. B. Freifeld entzerrt oder Difffusfeld entzerrt) verlangt, d. h. die elektroakustische bertragung des Kopfhrers soll die Situation nachbilden, bei der im Freifeld die hrende

Verarbeitung und Analyse akustischer Signale

77

Person das Schallsignal von vorne (freifeldentzerrt) bzw. statistischerweise von allen Richtungen (Difffusfeld-Entzerrung) angeboten bekommt. Ebenfalls ist der maximal mit einem Kopfhrer erreichbare Pegel von Bedeutung, einerseits weil eine Begrenzung notwendig erscheint, (z. B. bei Walkman-Kopfhrern, die bei sehr hohen Darbietungspegeln zu irreversiblen Gehrschden fhren knnen) oder anderererseits bei Audiometrie-Kopfhrern, bei denen zu Testzwecken auch bei hochgradig schwerhrigen Versuchspersonen noch gengend akustische Energie bertragen werden mu. Auf die Diskussion von Schwingungsgebern fr die Anregung von Schallwellen auf anderen Materialien (z. B. Festkrpern oder Flssigkeiten) soll hier verzichtet werden. Die meisten der von den bisher betrachteten Komponenten der akustischen bertragungskette durchgefhrten Operationen sind lineare, zeitinvariante Filterungs- bzw. Verstrkungsoperationen. Ohne auf die genaue Filterwirkung bei den einzelnen Techniken nher einzugehen, sollen zwei Prototypen von Filtern stellvertretend diskutiert werden, und zwar ein analoges und zum anderen ein digitales Filter. Ein analoges Filter besteht aus einem Netzwerk aus passiven Bauelementen wie Widerstnden, Kondensatoren und Induktivitten, sowie aktiven Elementen, die durch Operationsverstrker erzeugt werden, in deren Gegenkopplungszweig sich wiederum passive Bauelemente befinden. Ein Beispiel eines derartigen analogen Filters ist in untenstehender Figur abgebildet.

Abbildung 3.1: Schaltbild eines analogen Filters (schematisch)

Zur Berechnung der Wirkungsweise des Filters und der Dimensionierung der Bauelemente sei auf die einschlgige Literatur (lineare Systemtheorie, Laplace-Transformation, Design analoger Filter) verwiesen. Der Vorteil analoger Filter ist ihr relativ geringer Implementierungsaufwand und ihrer Einsetzbarkeit auch bei sehr hohen Frequenzen. Der Vorteil digitaler Filter

78

Verarbeitung und Analyse akustischer Signale

dagegen ist die Einsetzbarkeit auch bei sehr niedrigen Frequenzen, die hohe erzielbare Genauigkeit und Stabilitt der Filter- bertragungsfunktion und die Mglichkeit, dispersionsfreie Filter (d. h. linearphasige Filter) zu konstruieren. Der hohe Implementierungsaufwand wird mit zunehmendem Fortschritt der Mikroelektronik allerdings immer weniger ausschlaggebend, so da zum Beispiel in jedem Kompakt-Disk-Spieler bereits komplexe digitale Filter eingebaut sind. Der prinzipielle Aufbau eines digitalen Filters, das auf zeit- und wertediskreten Signalen (abgetasteten Signal-Samples) operiert, ist im folgenden aufgefhrt:

Abbildung 3.2: Schema eines digitalen Filters (schematisch)

Nach Analog-Digital-Wandlung, bei der das zeit- und wertekontinuierliche elektrische Eingangssignal bei einer festen Abtastfrequenz in ein zeit- und wertediskretes, im Computer darstellbares Signal umgewandelt wird, besteht das eigentliche Filter aus einem rekursiven und einem nichtkursiven Teil. Beiden Teilen ist gemeinsam, da die vorhergehenden Werte gespeichert werden und fr die Berechnung der nachfolgenden Ausgangswerte verwendet werden. Beim rekursiven Anteil (links in der Abbildung) wird das Ausgangssignal des Filters nach Zeitverzgerung wieder mit den Koeffizienten 1, 2, bis M multipliziert, aufaddiert und wieder auf das Eingangssignal gegeben, wobei M die Ordnung des Filters bezeichnet. Diese rekursive Berechnung des Ausgangssignals fhrt zu unendlich langen Impulsantworten, so da sie auch als Infinite Impulse Response (IIR)Filter bezeichnet werden. Sie haben den Vorteil einer hohen Filterschrfe aber den Nachteil, bei bestimmten Parameter-Kombinationen instabil zu werden und unter Umstnden Probleme bei Quantisierungs-Fehlern zu bereiten. Unproblematischer, aber mit einem hheren Aufwand versehen, sind dagegen die nichtrekursiven oder Finite Impulse Response (FIR)Filter, bei denen das zeitverzgerte Eingangssignal nach Multiplikation mit dem Koeffizienten 1 M aufaddiert und auf den Ausgang des Filters gegeben werden. Dieser Ausgang wird dann durch D/A-Wandlung wieder in ein zeit- und wertekontinuierliches Signal verwandelt. Zur genaueren Analyse und zum Design digitaler Filter sei auf die einschlgige Literatur ber di-

Verarbeitung und Analyse akustischer Signale

79

gitale Signalverarbeitung und das Skript zur Vorlesung Physikalische Metechnik und digitale Signalverarbeitung verwiesen. Whrend in der akustischen Aufnahme- und Wiedergabetechnik die oben prinzipiell erluterte Filterung von elektrischen Signalen an mehreren Stellen des bertragungsweges bentigt wird (z. B. zum Abschneiden unerwnschter, hoher Frequenzen, die nur Rauschanteile enthalten oder vom Ausgleichen der elektroakustischen bertragungsfunktion mit einem Equalizer) werden in der akustischen Metechnik Filter vorwiegend fr die Analyse von akustischen Signalen verwendet. Dieses ist z. B. fr die frequenzabhngige Schallpegel-Bestimmung notwendig, bei der das Mikrophon-Signal erst ber ein Bandpafilter an das Pegelmegert angeschlossen wird, so da nur die in dem Durchlabereich des Bandpafilters fallenden Frequenzen zu dem gemessenen Schallpegel beitragen und eine grobe Approximation des Frequenz-Spektrums des zu messenden Signals mglich ist, in den eine gesamte Bank von Bandpafiltern verwendet wird. Das Prinzip einer derartigen Filterbank, die in der akustischen Metechnik zumeist in Oktavschritten oder in Terzschritten erfolgt, ist in folgender Abbildung aufgefhrt:

Abbildung 3.3: Prinzipieller Aufbau einer Filterbank

Das Eingangssignal wird in N verschiedene Ausgangssignale aufgespalten, die unterschiedlichen Bandpacharakteristiken entsprechen. Bei Oktav-Filterbnken sind die Grenzfrequenzen im Verhltnis einer Oktave angeordnet (d. h. 1:2), whrend bei Terz-Filterbnken, das Abstandsverhltnis 4:5 betrgt. Die fr die akustische Metechnik normierten Grenzfrequenzen von Oktav- bzw. Terzbndern sind in der folgenden Tabelle aufgefhrt:

80
Tabelle 3.2:

Verarbeitung und Analyse akustischer Signale

Mittenfrequenzen fm von Terz- und Oktavbndern mit den Frequenzengrenzen fu und fo fu (Hz) 11 Oktave fo (Hz) 22 fm (Hz) 16 fu (Hz) 14,1 17,8 22,4 28,2 35,5 44,7 56,2 70,7 89,1 112 141 178 224 282 355 447 562 708 891 1122 1413 1778 2239 2818 3548 4467 5623 7079 8913 11220 14130 17780 Terz fo (Hz) 17,8 22,4 28,2 35,5 44,7 56,2 70,7 89,1 112 141 178 224 282 355 447 562 708 891 1122 1413 1778 2239 2818 3548 4467 5623 7079 8913 11220 14130 17780 22390 fm (Hz) 16 20 25 31,5 40 50 63 80 100 125 160 200 250 315 400 500 630 800 1000 1250 1600 2000 2500 3150 4000 5000 6300 8000 10000 12500 16000 20000

22

44

31,5

44

88

63

88

177

125

177

355

250

355

710

500

710

1420

1000

1420

2840

2000

2840

5680

4000

5680

11360

8000

11360

22720

16000

Weil diese Oktav- bzw. Terzanalyse praktisch von groer Bedeutung ist, seien im folgenden einige der prinzipiellen Eigenschaften dieser Art von Frequenzanalyse aufgefhrt: - Jedes der Frequenzbnder hat eine konstante relative Bandbreite f/f , d. h. die Frequenzbnder sind nicht quidistant, sondern quidistant auf einer logarithmischen Frequenz-Skala. - Fr smtliche Ausgangskanle ergibt sich approximativ die gleiche Ausgangsleistung, wenn als Eingangssignal rosa Rauschen anliegt, d. h. die 2 spektrale Leistungsdichte S (f) 1/f. Dieses rosa Rauschen oder 1/fRauschen findet sich sehr hufig bei natrlichen Rauschvorgngen. Fr die meisten natrlichen akustischen Signale (z. B. Umweltgerusche und

Verarbeitung und Analyse akustischer Signale

81

Sprache) findet sich ebenfalls approximativ ein 1/f Spektrum. Durch die entsprechende Wahl der Filterbank ist so sichergestellt, da im hchsten Frequenzband ungefhr dieselbe Energie wie im niedrigsten Frequenzband erfat wird, so da smtliche Frequenzbnder fr die Beurteilung des Schalls etwa die gleiche Wichtigkeit haben. - Die konstante relative Bandbreite entspricht ungefhr der Frequenzanalyse im Gehr. Bei der im Innenohr stattfindenen Frequenz-Ortstransformation werden die hchsten Frequenzen zu Beginn der Basilarmembran im Innenohr und die niedrigsten Frequenzen am Ende (Apex bzw. Helicotrema) abgebildet, wobei approximativ der Ort auf der Basilarmembran dem Logarithmus der Frequenz entspricht. Diese logarithmische Abbildung gilt allerdings erst oberhalb von etwa 500 Hz bis etwa 20 kHz. Unterhalb von 500 Hz befindet sich dagegen eine ungefhr lineare Frequenzabbildung. - Die Oktav- bzw. Terzanalyse entspricht der in letzter Zeit hufig diskutierten Wavelet-Analyse, bei der ein Zeitsignal mit selbsthnlichen Analysefunktionen (den Wavelets, zu Deutsch etwa Wellenpaketchen) analysiert wird. Fr den allgemeinen Fall einer Wavelet-Analyse wird die Wavelet-Analyse-Funktion h(t) definiert, die z. B. die Form der Impulsantwort eines Bandpafilters aufweist:

Abbildung 3.4: Beispiel fr eine Wavelet-Analyse-Funktion h(t)

Durch Dehnung bzw. Stauchung dieses Wavelets knnen nun FilterImpulsantworten generiert werden, die selbsthnlich zu der ursprnglichen Impulsantwort sind und zu Filtern fhren, die genau die gleiche relative Bandbreite haben wie der ursprngliche Bandpafilter. Wenn wir also einen Zeit-Stauchungs-Faktor a mit dem zugehrigen gestauchten Wavelet h(at) definieren (siehe Abbildung 3.5), knnen wir die Wavelet-AnalyseFunktion als Ausgangssignal des Bandpafilters mit dem FrequenzStauchungsparameter a betrachten:

82

Verarbeitung und Analyse akustischer Signale

Abbildung 3.5: Mit dem Parameter a gestauchte Wavelet-Analyse-Funktion aus Abb. 3.4

S a (t ) =

s(t t') h(at')dt = s(t ) h(at )

(III.1)

Somit stellt sich die Wavelet-Analyse als eine Zeit-FrequenzVerteilungsfunktion mit konstanter relativer Bandbreite dar, die in guter Nherung der Analyse im menschlichen Ohr entspricht. Eine hnliche Analogie lt sich auch fr die zweidimensionale Wavelet-Analyse und der Transformation finden, die im visuellen System des Menschen durchgefhrt wird.

III.2 Diskrete Spektralanalyse


Eine der hufigsten Anwendungen der digitalen Signalverarbeitung zur Auswertung von physikalischen Mesignalen ist die Spektralanalyse von digitalisierten Signalen. Um die dabei auftretenen Probleme verstehen zu knnen, soll zunchst das Spektrum von analogen und digitalisierten Signalen betrachtet werden. Dabei wird fr die digitale Signalverarbeitung der Fall angestrebt, da sowohl das Zeitsignal als auch das Spektrum als diskrete Folgen im Rechner abgespeichert werden knnen. Um zu dieser Eigenschaft zu gelangen, betrachten wir zunchst aperiodische Signale, die entweder kontinuierlich oder diskret sein knnen. Fr den diskreten Fall kann man das Signal auch als Produkt des kontinuierlichen Signals mit einem -Kamm auffassen, so da sich das Spektrum dieses diskretisierten Signals als Faltung des Orginal-Spektrums mit der FourierTransformierten des -Kamms, nmlich dem -Kamm mit der inversen Periodizitt schreiben lt:

Verarbeitung und Analyse akustischer Signale

83

Aperiodische Signale
Kontinuierliche Signale Diskrete Signale

s(t), < t < +

s( t ), t = n s(n), n , s(n)= 0 sonst (III.2)

S( f ) =

2ift s( t ) e dt

Sd (f ) = S(f )

1 (f ) = T

n =

T S f T 1 n (III.3)

Spektrum aperiodisch, kontinuierlich

Spektrum periodisch, kontinuierlich

Fr periodische Signale gilt: s(t+nT') = s(t), wobei T die Periodenlnge bezeichnet. Man kann ein periodisches Signal daher als die Faltung einer Periode dieses Signals mit einem -Kamm der Periodizitt T auffassen. Das Spektrum ist daher aperiodisch und diskret mit der Periodizitt 1/T. Fr das periodische diskrete Signal ergibt sich dagegen wiederum eine Multiplikation des periodischen Signals mit einem -Kamm der Periode T, so da als Fouriertransformierte die Faltung resultiert:

84

Verarbeitung und Analyse akustischer Signale

Periodische Signale
Kontinuierliche Signale Diskrete Signale

s(t)=s1(t)

(t)

sd(t) = (s1(t)

(t) )

(t) (III.4)

S(f) = S1(f)

1/T

(f)

Sd(f) = (S1(f)

1/T

(f))

1/T

(f) (III.5)

Das Spektrum eines periodischen, diskreten Signals ist dabei wieder periodisch und diskret, wobei die Feinstruktur des Zeitsignals (d. h. die Abtastperiode) zur Grostruktur des Spektrums wird (d. h. zur Periodizitt des Spektrums) whrend die Grobstruktur des Zeitsignals (d. h. die Periodizitt des Zeitsignals) zur Feinstruktur des Spektrums wird (d. h. zur Linienstruktur des Spektrums). Dieser Fall ist fr die digitale Signalverarbeitung aber besonders wichtig, weil sowohl das Zeitsignal als auch das Spektrum sich als diskrete Folge darstellen lassen. Die Beziehung zwischen einer Periode dieses diskreten, periodischen Zeitsignals und einer Periode des zugehrigen diskreten, periodischen Spektrums wird als diskrete Fouriertransformation bezeichnet. Fr sie gilt: S ( k ) = s( n)e
n=0 N 1 2 i nk N

s(n)

S(k)

2 i 1 N 1 s( n) = S( k )e N N K =0

nk

(III.6)

Bei der diskreten Fouriertransformation wird also die Integration in eine Summation ber eine Periode verwandelt. Da es sich auch hierbei um eine lineare, zeitinvariante Transformation handelt, sind die meisten Eigenschaften der Fouriertransformation auch fr die diskrete Fouriertransformation die gleichen. Hin- und Rcktransformation der DFT unterscheiden sich nur durch das Vorzeichen des Exponenten. Die Normierung mit 1/N wird oft weggelassen. Ein wichtiger Unterschied zur kontinuierlichen Fouriertransformation ist jedoch die Faltung: Da die DFT nur als eine Pe-

Verarbeitung und Analyse akustischer Signale

85

riode des (unendlich langen, periodischen) Spektrums verstanden werden kann, gilt der Faltungssatz nicht fr die exakte Faltung, sondern nur fr die zyklische Faltung: Die diskrete Fourier-Rcktransformation des Produkts zweier diskreter Spektren ist nicht die Faltung der zugehrigen Zeitfunktionen, sondern der periodische fortgesetzten Zeitfunktionen, so da sich u. U. das Ende der Periode in den Anfang des betrachteten Zeitbereichs hinein verschmiert. Aufgrund der Definition der DFT bentigt die Berechnung eines Spektralwertes S(k) n Multiplikationen und n Additionen, so da der Rechenaufwand fr eine vollstndige diskrete Fouriertransformation proportional mit 2 m N geht. Falls N eine Zweierpotenz ist, d. h. N = 2 lt sich der Rechenaufwand durch die Anwendung der Fast Fouriertransformation (FFT) erheblich verringern. Dieses wird durch eine geschickte Zerlegung der fr die Berechnung einer vollstndigen DFT notwendigen Operationen erreicht, die sich in eine Abfolge von Elementar-Filterfunktionen mit zwei Eingngen und zwei Ausgngen (sogenannten Butterfly-Operationen) zerlegen lassen. Nachdem man log2(N) Zwischenschritte berechnet hat, bei denen jeweils fr jeden Wert eine weitere Butterfly-Operation durchgefhrt wurde, knnen die Ausgangswerte in Bit-verkehrter Reihenfolge abgespeichert werden.

Abbildung 3.6: Schema der FFT

In jedem dieser Teilschritte werden dabei N Multiplikationen und N Additionen durchgefhrt, so da der Gesamt-Rechenaufwand proportional zu N log2 N wird. Da diese Gre mit zunehmenden N wesentlich geringer

86
2

Verarbeitung und Analyse akustischer Signale

ansteigt als N , ist gerade bei groen Signallngen eine Anwendung der FFT sinnvoll, so da eine Spektralanalyse mit dem Computer fast immer eine FFT benutzt. Dies kann fr Signale mit einer Anzahl von Samples, die nicht einer Zweierpotenz entspricht, z. B. durch Anfgen von Nullen erreicht werden. Auerdem existiert eine Zahl von zahlentheoretischen Fouriertransformationen, die fr andere Primzahlen als fr die 2 gelten, so da auch bei Signallngen, die nicht einer Zweierpotenz, sondern einer gnstigen Primzahlzerlegung entsprechen, effiziente Algorithmen fr die Spektralanalyse eingesetzt werden knnen. Im folgenden sollen zwei Probleme bei der diskreten Spektralanalyse nher behandelt werden, die von groer praktischer Bedeutung sind, und zwar die Fensterung und die zeitabhngige Spektralanalyse. Das Problem der Fensterung ergibt sich immer dann, wenn das Spektrum eines kontinuierlichen, aperiodischen Signals s(t) mit Hilfe einer endlichen, diskreten Fouriertransformation geschtzt werden soll. Dazu wird das Signal mit einem Analyse-Zeitfenster zeitlich begrenzt und zudem quidistant abgetastet:

Abbildung 3.7: Vom kontinuierlichen aperiodischen Signal zum diskreten, gefensterten Signal

Whrend das kontinuierliche, aperiodische Signal ein kontinuierliches, aperiodisches Spektrum S(f) besitzt, mit der Zusatzannahme, da S(f) bandbegrenzt ist, besitzt das entsprechende abgetastete, aperiodische Signal Sd(t) ein periodisches, kontinuierliches Spektrum. Bei der Fensterung des abgetasteten Signals, d.h. bei der Multiplikation mit dem Fenster

Verarbeitung und Analyse akustischer Signale

87

w(t), wird im Spektralbereich eine Faltung mit der Fouriertransformierten der Fensterfunktion W(f) durchgefhrt, so da das resultierende Spektrum ein periodisches Linienspektrum ist, da mit W(f) gefaltet, also verschmiert ist. Mit der diskreten Fouriertransformation (DFT) wird jeweils nur eine Periode dieses periodisch fortgesetzten, mit dem Fenster w(t) abgeschnittenen und abgetasteten Signals sw(t) betrachtet. Das resultierende diskrete Spektrum ist demnach die diskrete Version des mit W(f) verschmierten Orginalspektrums. Um den dabei entstehenden Fehler mglichst klein zu halten, sollte ein Fenster w(t) mit mglichst -frmiger Fouriertransformierten W(f) gewhlt werden. Dies kann durch ein mglichst langes Analyse-Fenster und durch eine optimierte Fensterfunktion approximativ erreicht werden. Am hufigsten werden die folgenden Fensterfunktionen gewhlt: 2n M 1 2n M 1

Hanning-Fenster:

w1 ( n ) = 0,5 0,5 cos

(III.7)

Hamming-Fenster:

w 2 ( n ) = 0,54 0,46 cos

(III.8)

Blackman-Fenster: w 3 ( n ) = 0,42 0,5 cos

2n 4n + 0,08 cos M 1 M 1

(III.9)

88

Verarbeitung und Analyse akustischer Signale

Abbildung 3.8: Die verschiedenen Fenster im Zeit- und Frequenbereich

Um fr die Spektralanalyse einen mglichst geringen Rechenaufwand durch Verwendung einer FFT zu bentigen, kann das Fenster mit Nullen aufgefllt werden, so da die Gesamtfensterlnge gerade eine Zweierpotenz von Abtastwerten umfat. Durch dieses Hinzufgen von Nullen im Zeitbereich wird die Abtastung des verschmierten Spektrums im Frequenzbereich zwar verbessert, es wird jedoch keine zustzliche Information gewonnen. Man kann daher eine Interpolation im Frequenzbereich dadurch berechnen, da man eine entsprechend lngere FFT whlt, fr die man an das ursprngliche Analyse-Fenster eine entsprechend greren Zahl von Nullen anhngt. Das grundlegende Problem bei der zeitlichen Fensterung des zu analysierenden Zeitsignals ist die Zeit-Frequenz-Unschrfe:

Verarbeitung und Analyse akustischer Signale

89

Wenn eine hohe Frequenzauflsung gewnscht wird, mu W(f) mglichst -frmig sein. Dies ist quivalent damit, da w(t) mglichst lang ist, was wiederum mit einer geringen Zeitauflsung korrespondiert, d. h. das Spektrum wird ber einen entsprechend langen Zeitausschnitt errechnet, so da die auftretenden Spektralanteile nicht einem definierten Zeitpunkt zugeordnet werden knnen. Genau wie bereits in dem ersten Abschnitt besprochen, kann das Zeit-Bandbreitenprodukt aufgrund der Unschrferelation nicht unterschritten werden, so da man sich entweder fr eine hohe Zeitauflsung oder fr eine hohe Frequenzauflsung entscheiden mu. Auch die im folgenden Abschnitt zu behandelnde Zeit-FrequenzAnalyse kann dieses prinzipielle Problem nicht lsen.

III.3 Zeit-Frequenz-Analyse
Das Ziel einer gleichzeitig mglichst guten Zeit- und Frequenzauflsung wird mit der diskreten Zeit-Frequenz-Analyse angestrebt: Dabei soll der momentane Frequenzgehalt eines Signals als Funktion der Zeit dargestellt werden. Es wird also eine Funktion S(f, t) gesucht, die im diskreten Fall einem Raster von Werten in der Zeit-Frequenz-Ebene entspricht, d. h. es werden Funktionswerte nur fr diskrete Zeitpunkt ti und diskrete Frequenzen fj berechnet. Die klassische Zeit-Frequenz-Verteilungsfunktion ist die Kurzzeit-Fourier-Analyse (oder Spektrogramm) mit der allgemeinen Form fr den analogen Fall

S( f , t ) =

s( t '+ t) w( t ') e

2ift '

dt '

(III.10)

Dabei handelt es sich also um die Frequenzanalyse des um t zentrierten Signalausschnittes s(t+t), der mit dem Fenster w(t) gewichtet wird.

90

Verarbeitung und Analyse akustischer Signale

Abbildung 3.9: Zeitfrequenzanalyse

Im diskreten Fall wird ein Signalausschnitt zum Zeitpunkt tm ausgewertet und die diskrete Fouriertransformation zu den Frequenzen fk gebildet: S(fk , t m ) = s( nT + t m )w( n )e
n=0 N 1 2 i nk N

(III.11)

Bei dieser diskreten Kurzzeitfourieranalyse treten die folgenden Variablen auf: 1.) Die Abtastfrequenz fs= 1/T, die bei der Diskretisierung von s(t) in die diskrete Zahlenfolge s(n) auftritt. 2.) Die Fensterlnge M(in Anzahl von Samples) der Fensterfunktion w(n) 3.) Lnge N der diskreten Fouriertransformation (DFT) 4.) Abstand aufeinanderfolgender 1/Framerate F. Analyse-Zeitpunkte tm , d. h.

Diese vier Variablen sollten so gewhlt werden, da das Originalsignal s(t) aus dem diskreten Spektrogramm vollstndig rekonstruiert werden kann. Es darf also bei der Berechnung des Spektrogramms bei entsprechender

Verarbeitung und Analyse akustischer Signale

91

Wahl der Parameter kein Informationsverlust auftreten. Aus diesen Forderungen resultieren die folgenden Abtasttheoreme: 1.) Abtasttheorem: 1 2 fgrenz T

fs =

(III.12)

D. h. die hchste im Originalsignal vorkommende Frequenz fgrenz darf maximal die Hlfte der Abtastfrequenz betragen. Dieses ist das bereits behandelte Abtasttheorem der digitalen Signalverarbeitung. 2.) Die Lnge des Analysefensters M ist umgekehrt proportional zur Zeitauflsung der Kurzzeitfrequenzanalyse und ist proportional zur Frequenzauflsung der Kurzzeitfrequenzanalyse, d. h. die Fensterlnge ist ein freier Parameter der Kurzzeitfrequenzanalyse, die je nach Anforderung entweder eine hohe Zeit- und niedrige Frequenzauflsung oder umgekehrt aufweist. Bei Sprachsignalen ist eine gngige Fensterlnge etwa 20 ms. 3.) N Fensterlnge M, d. h. die Lnge der DFT mu mindestens so gro sein wie die Lnge des Analysefensters. In der Regel wird die DFT sogar lnger als das Analyse-Fenster gewhlt, um einerseits eine bessere Abtastung des Spektrums zu erreichen und um andererseits mgliche Artefakte durch zirkulres Aliasing zu vermeiden, das bei der Durchfhrung von Modifikationen im Frequenzbereich und anschlieender Rekonstruktion des Signals auftreten kann: Anhand der Kurzzeitspektralanalyse ist es nmlich mglich, gezielt zu bestimmten Zeitpunkten eine nderung des Spektrums (Filterung) durchzufhren. Fr das modifizierte Spektrum gilt dann: S'( f k , t m ) = H ( f n ) S( f k , t m ) s' ( n + t m ) = h( n ) (s( n + t m ) w( n )) (III.13)

D. h., da bei bei der Rcktransformation des im Spektralbereich vernderten Signals in den Zeitbereich eine Faltung des gefensterten Originalsignals mit der Impulsantwort h(n) auftritt, so da sich der Bereich des Signals, in dem keine Nullen auftreten, um die Lnge der Impulsantwort h(n) verlngert. Damit sich diese Verschmierung des ursprnglich durch das Zeitfenster zeitlich begrenzten Signals nicht ber die Rnder hinweg

92

Verarbeitung und Analyse akustischer Signale

erstreckt (und damit ein berflieen vom Ende des DFT-Zeitsignals in den Anfang dieses Signals passiert) mu also die Lnge der DFT N gengend gro sein. Dieses zweite Abtasttheorem besagt also, da N Fensterlnge M + Lnge von h(n) (III.14)

Bei der Hintransformation mssen demnach eine gengend groe Anzahl von Nullen an das gefensterte Signal angefgt werden, um die entsprechende DFT-Lnge zu erreichen. 4.) Das dritte Abtasttheorem der Kurzzeitfrequenzanalyse beinhaltet eine Forderung fr die Analyse-Frame-Rate. Die Kurzzeit-Fouriertransformierte S(f,t) kann auch als Filterbank aufgefat werden, bei der in einer Reihe von Bandpakanlen jeweils ein Ausgangssignal erzeugt wird, das sich zeitlich nur sehr langsam ndert (bandbegrenzte Signale):

S( f , t ) =

s( t' + t )w( t' )e 2 ift' dt' = e 2 ift s( t' ) e 2 ift' w( t' t )dt'

(III.15)

|S(fk,tm)| ist daher fr ein festes fk als Funktion von tm eine Tiefpasignal. Die obere Grenzfrequenz dieses Signals fgrenz entspricht bei einem Hamming-Fenster w(t) gerade der ersten Nullstelle der bertragungsfunktion 2 (bei M ) und betrgt damit: 2 fs M

fgrenz

(III.16)

Da ein derartiges Tiefpasignal mit mindestens der doppeltem vorkommenden Frequenz abgetastet werden mu, folgt daraus, da die FrameRate (d. h. die Hufigkeit, mit der dieses Tiefpasignal abgetastet werden mu) gerade den Wert annehmen mu: fs M

F = 4

(III.17)

Dieses entspricht einem berlapp aufeinanderfolgener Analyse-Frames von 3/4. Diese Forderung, da zur vollstndigen Reprsentation des Eingangssignals ein berlapp der aufeinanderfolgenden Analyse Intervalle von 3/4 auftreten sollte, stellt ein drittes Abtasttheorem dar. Falls ein grerer Fehler toleriert werden kann und als obere Grenzfrequenz des Bandpa-Signals nicht die erste Nullstelle des Hamming-Fensters, son-

Verarbeitung und Analyse akustischer Signale

93

dern bereits eine Abschwchung um ca. 10 dB ausreichend ist, gengt der halbe berlapp aufeinanderfolgender Analyse-Frames.

94

Verarbeitung und Analyse akustischer Signale

Akustik von Stimme und Sprache

95

IV Akustik von Stimme und Sprache


IV.1 Spracherzeugung
Der menschliche Sprachapparat ist ein uerst komplexes biologisches System, an dem mehrere Organe und Muskeln beteiligt sind (z. B. Zwerchfell, Lunge, Brustkorbmuskulatur, Kehlkopf, Zunge, Schlund- und Mundmuskulatur) und der einer uerst diffizilen neuronalen Steuerung und Regelung unterliegt. Mit unserer Stimme sind wir in der Lage, einen breiten Frequenz- und Pegelbereich zu berstreichen und andererseits auch Stimmungslagen und Emotionen auszudrcken, so da dieses biologische System als ein Wunderwerk betrachtet werden kann, dessen genaue Funktionsweise im Detail noch lngst nicht bekannt ist. Aus physikalisch-akustischer Sicht ist die Schwingungserzeugung und anschlieende akustische Filterung und Schallabstrahlung von Interesse, sowie Methoden zur Charakterisierung und Analyse von Sprache, Sprachlauten und der akustischen Vorgnge bei Stimmstrungen. Durch das Zwerchfell und die Brustkorb-Muskulatur wird die in der Lunge gespeicherte Luft unter Druck gesetzt, so da eine Luftstrmung durch die Luftrhre, den Kehlkopf und den Nasen- und Rachentrakt entsteht. Einen berblick ber die Anatomie des Kehlkopfes gibt die unten stehende Abbildung. Bei der normalen Atmung wird diese Luftstrmung nicht unterbrochen, bei der Phonation (d. h. der Erzeugung von Stimmlauten) wird dagegen dieser Luftstrom entweder im Kehlkopf bei den Stimmlippen unterbrochen (dort wird eine periodische Schwingung erzeugt) oder an anderer Stelle zur Erzeugung von aperiodischen, rauschfrmigen Schwingungen (z. B. an den Schneidezhnen zur Erzeugung eines scharfen s).

Abbildung 4.1: Kehlkopfinneres; Frontalschnitt mit Blick nach vorne und Sagittalschnitt mit Seitenansicht.

96

Akustik von Stimme und Sprache

Abbildung 4.2: Der Bandapparat des Kehlkopfes von vorne gesehen.

Abbildung 4.3: Der Bandapparat des Kehlkopfes von hinten gesehen.

Der Kehlkopf besteht dabei aus dem greren Schildknorpel (vor dem sich die Schilddrse befindet) und dem darunter befindlichen Ringknorpel auf dessen Hinterseite zwei spiegelsymmetrisch angeordnete kleine AryKnorpel sind (Cartilaginae Arytaenoideae). Zwischen der Vorderkante des Schildknorpels und den vorderen Anstzen der Ary-Knorpel sind die Stimmlippen als eine Falte in der auskleidenden Schleimhaut angeordnet,

Akustik von Stimme und Sprache

97

die man sich wie eine gelatineartige Masse vorstellen kann, die auen mit einer dnnen Haut umgeben ist und in deren Kern eine etwas festere, sehnige Struktur zu finden ist, die sich zwischen Vorderseite des Schildknorpel und Ansatz der Ary-Knorpel spannt. Durch die Einwirkung entsprechender Muskel (Einzelheiten im Anatomie- bzw. Physiologiebuch) knnen die Ary-Knorpel nun eine Translations- und Rotationsbewegung durchfhren, bei der die Stimmlippen in ihrem hinteren Ende einander in der Mitte angenhert und angespannt werden knnen. In dieser Phonationsstellung besitzt der Kehlkopf dann folgenden schematischen Querschnitt:

Abbildung 4.4: Stimmlippenschwingungen

Durch die Druckdifferenz zwischen den Lungen (bzw. der Trachea, d. h. Luftrhre) und dem Vokaltrakt wird eine Kippschwingung der Stimmritze (Glottis) erzeugt, die mit einer periodischen ffnung und Schlieung der Stimmritze verbunden ist. Der schematische Bewegungsablauf ist in Abb. 4.4 dargestellt. Zunchst wird der Glottis-Verschlu durch den berdruck der Lungen gesprengt. Anschlieend verschliet sich die Glottis wieder, einerseits, weil es sich um ein in der Resonanz betriebenes, schwingungsfhiges System handelt und andererseits, weil es durch den Bernoullischen Unterdruck zu einer Sogwirkung zwischen den Stimmlippen kommt. Dieser Bernoulli-Effekt beschreibt den Druckabfall des statischen Drucks p, wenn eine Strmung mit der Geschwindigkeit v in einem Medium der Dichte auftritt:
p+ 1 2 v = const . = p 0 2

(IV.1)

Ist die Strmungsgeschwindigkeit v = 0, wird der statische Luftdruck p0 angenommen, whrend mit zunehmender Strmungsgeschwindigkeit der statische Druck p stark absinkt. Dieser Effekt wird auch bei den Tragflchen von Flugzeugen ausgenutzt, um eine Auftriebskraft zu erzeugen. Seine Bedeutung fr den Stimmlippenverschlu ist zwar von theoretischer Bedeutung, sein Einflu wird jedoch berschtzt, weil eine Rckstellkraft

98

Akustik von Stimme und Sprache

zum Zusammenschlu der Glottis auch aufgrund der Elastizitt der Glottis bewirkt wird, die letztlich durch Muskelanspannung verndert werden kann und zu einer Vernderung der Stimmfrequenz fhrt. Die einfachste Beschreibung der Stimmlippen-Schwingung wird daher mit einem Ein-Massenmodell erreicht, das im Prinzip wie folgt aufgebaut ist:

Abbildung 4.5: Ein-Massenmodell (links) und Zwei-Massenmodell (rechts)

Smtliche schwingende Masse wird in die symmetrisch angeordnete Masse m verlagert, whrend die Elastizitt durch die Federkonstante D und die Dmpfung durch einen zustzlichen Parameter modellmig angesetzt wird. Ein derartiges Ein-Massen-Modell der Glottis liefert eine mathematische Beschreibung der Schwingung mit der Grundfrequenz:

f0 =

1 D 2 m

(IV.2)

Eine realistischere Beschreibung der tatschlichen Form der Glottis und der Phasenverschiebung zwischen der Ober- und Unterseite der Stimmritze liefert ein Zwei-Massenmodell, was in der Abbildung 4.5 schematisch rechts dargestellt ist. Dabei sind die Massen m1 und m2 durch eine weitere Feder miteinander verbunden und knnen zu einer phasenverschobenen Schlieung des Vokaltraktes fhren. Neben dieser periodischen Schwingungsanregung, die bei Vokalen eine entscheidene Rolle spielt, wird bei Verschlu-Konsonanten (Plosive, Frikative) der Vokaltrakt nicht im Bereich der Stimmritze, sondern in seinem weiteren Verlauf im Rachen-Mundraum am weitesten eingeengt. Bei einer starken Einengung des Vokaltraktes bewirkt die starke Querschnittserniedrigung bei gleichzeitig anhaltendem Luft-Volumen-Strom einen Umschlag von einer laminaren Luft-Strmung in eine turbulente Strmung.

Akustik von Stimme und Sprache

99

Dieser Umschlag wird dadurch charakterisiert, da die Reynolds-Zahl Re einen gewissen kritischen Wert berschreitet:

Re =

vd > 1700

(IV.3)

Dabei bezeichnet die Dichte der Luft, v die Strmungsgeschwindigkeit, d den Durchmesser und die Viskositt der Luft. Die Reynoldszahl beschreibt damit das Verhltnis zwischen Trgheits-Krften und ReibungsKrften in der Flssigkeit. Falls die Reibungs-Krfte im Verhltnis zu stark abnehmen, steigt die Reynolds-Zahl an und eine turbulente Strmung resultiert, die zu einer rauschartigen Schwingungsanregung im Vokaltrakt fhrt. Durch diese Rausch-Anregung knnen beispielsweise Frikative (z. B. das f (wie Fa) und das (wie Scheibe)) artikuliert werden.

Die bisherigen Vorgnge beschftigen sich mit der Schwingungsanregung im Vokaltrakt, also der akustischen Quelle. Diese von der Quelle erzeugte akustische Energie wird weiter im Vokaltrakt fortgeleitet und durch die verschiedenen Einengungen und Erweiterungen des Vokaltraktes in unterschiedlicher Weise akustisch gefiltert. Die dabei auftretende Filterwirkung des Vokaltraktes kann am ehesten durch die folgende Analogie zwischen dem Vokaltrakt und einem Schalldmpfer-Rhrensystem verdeutlicht werden:

Abbildung 4.6: Analogie zwischen Vokaltrakt und Schalldmpfer-Rhrensystem

Wie in Kapitel 2 vorgestellt, fhrt jede Querschnittsnderung in einer Rhre zu einer Reflektion und teilweisen Transmission der einfallenden Schallwelle. Bei einer Hintereinanderschaltung von Rhrensegmenten mit

100

Akustik von Stimme und Sprache

unterschiedlichem Durchmesser wird so eine Filterstruktur geschaffen, die formal einem digitalen Filter sehr hnelt (Zeitverzgerung und Multiplikation mit einer Konstanten sowie anschlieende Aufaddition). Dadurch wird deutlich, da man durch unterschiedliche Wahl der Rhrendurchmesser (d. h. unterschiedliche Stellung des Artikulationstraktes) eine unterschiedliche akustische Filterwirkung erzeugt, die letztlich zu der Klangverfrbung fhrt, die fr jeden Sprachlaut (insbesondere fr jeden Vokal) von Bedeutung ist. Die Erzeugung von Sprache kann daher in erster Nherung beschrieben werden als die zeitvariante, akustische Filterung des Quellensignals (Glottis-Schwingung oder aperiodische Anregung) durch den Vokaltrakt. Die Aufgabe des Empfngers ist es nun, anhand dieser zeitvarianten Klangnderung auf die zugrundliegende Artikulationsstellung zurckzuschlieen, aus der dann wiederum auf den Sprachlaut geschlossen werden kann, den der Sprecher artikuliert hat.

IV.2 Akustische Phonetik


Die akustische Phonetik beschftigt sich mit der Beziehung zwischen der (abstrakten) Sprache und der akustischen Realisation dieser Sprache. So ist das kleinste bedeutungstragende Element der Sprache das Phonem d. h. durch Vernderung oder Weglassen eines Phonems wird der Sinn eines Wortes verndert. Ein derartiges Phonem kann (mu aber nicht) einem geschriebenem Buchstaben entsprechen. Beispielsweise hat das Wort Sinn die drei Phoneme , und . Wenn an Stelle des Phonems ein anderes Phonem (z. B. der Vokal ) steht, ndert sich der Sinn. Dasselbe Phonem kann allerdings von sehr unterschiedlichen Sprechern ausgesprochen werden, die zu einer deutlich anderen akustischen Realisation ein und desselben Phonems fhrt. Auerdem wird die akustische uerung desselben Phonems bei ein und derselben Person jedesmal ein anderes akustisches Signal erzeugen. Zu jedem Phonem gibt es daher eine (unendlich) groe Zahl mglicher akustischer Realisierungen (Phone). Um zu einer geeigneten akustischen Analyse gesprochener Sprache zu gelangen, anhand derer sich die Phone unterscheiden und klassifizieren lassen, bedient man sich des Spektrogramms, d. h. einer KurzzeitSpektralanalyse als Funktion der Zeit, die wir bereits im vorigen Kapitel kennengelernt haben. Wenn s(t) das Sprachsignal bezeichnet, wird das (diskrete) Spektrogramm (Sonagramm) bei einem bestimmten Zeitpunkt tm und einer Frequenz fn definiert als:
( N 1) / 2

S( t m , fn ) =

n = ( N 1)/ 2

s( t m + n ) w( n ) e

2 i

k a N

(IV.4)

Akustik von Stimme und Sprache

101

Man erhlt also eine zwei-dimensionale Abbildung, bei der auf der Abszisse die Zeit und auf der Ordinate die Frequenz aufgetragen ist. Die Schwrzung bezeichnet dabei den Betrag des Kurzzeit-Leistungspektrum zu diesem Zeitpunkt t und zur betreffenden Frequenz f. Diese Darstellung entspricht ungefhr der Kurzzeit-Spektralanalyse, die auch im menschlichen Gehr durchgefhrt wird. Als Beispiel ist im folgenden die Zeit-Funktion und das Spektrogramm des Wortes Phoniatrie aufgezeichnet. Whrend man im oberen Teilbild nur grob aus dem Verlauf der Zeitfunktion ersehen kann, da erst ein Konsonant, dann drei unterschiedliche, halbwegs stationre Vokale und dann wieder ein Konsonant mit anschlieenden ausklingenden Vokal erfolgt, liefert das untere Teilbild (Spektrogramm) wesentlich mehr Informationen. Insbesondere kann man bei den Vokalen die Struktur eines harmonischen Tonkomplexes entdecken, d. h. eine Periodizitt im Spektrum, die durch eine Grundfrequenz (Glottis-Frequenz) mit ihren harmonischen Obertnen erzeugt wird. Charakteristisch sind nun fr diese Vokale die Lage der Maxima im Spektrum, die sogenannten Formanten, die gerade ResonanzFrequenzen des Vokaltraktes entsprechen. Sie knnen als Bereiche besonderer Schwrzung in den Vokalen identifiziert werden. Die Konsonanten knnen dagegen durch ihren Zeitverlauf, das Auftreten von Pausen und den berdeckten Spektralbereich ansatzweise klassifiziert werden. Obwohl es nicht immer eindeutig mglich ist, anhand von Spektrogrammen auf die zugrundeliegenden Sprachelemente zu schlieen (das Ohr ist auf diese Aufgabe wesentlich besser spezialisiert und Sprachwissenschaftler bentigen einige bung, bis sie Spektrogramme lesen knnen), soll im folgenden aufgezeigt werden, welche charakteristischen akustischen Merkmale von Sprachlauten auftreten und wie man so zu einer Identifizierung von Sprachlauten anhand akustischer Merkmale gelangen kann.

102

Akustik von Stimme und Sprache

Abbildung 4.7: Zeitfunktion und Spektrogramm des Wortes Phoniatrie

Eine wichtige akustische Information sind die bereits erwhnten Formanten, die sich als (zeitlich vernderliche) Maxima der Vokaltraktbertragungsfunktion bemerkbar machen. Mnner: 100-400 Hz, Frauen: 200-800 Hz 300-1000 Hz 600-2500 Hz 1500-2500 Hz

Grundfrequenz F0 1. Formant F1 2. Formant F2 3. Formant F3

Fr die einzelnen Vokale gibt es relativ charakteristische Lagen dieser Formanten, die auch gut mit der Artikulationsweise der jeweiligen Vokale zusammenhngen: Beispielsweise weist das u einen niedrigen ersten und niedrigen zweiten Formanten auf, whrend das i einen hohen zweiten und einen relativ niedrigen ersten Formanten besitzt (s. Abbildung 4.8). In der Mitte von diesem als Vokaldreieck bezeichneten Graphen liegt der sogenannte Reduktionsvokal , der im Englischen auch als schwa-Laut bezeichnet wird und im Deutschen als Zeichen heftigen Nachdenkens interpretiert wird (z. B. die uerung ...h).

Akustik von Stimme und Sprache

103

Abbildung 4.8: Vokaldreieck

Das in der F2/F1-Ebene aufgespannte Vokal-Dreieck kann auch als artikulatorisches Vokaldreieck interpretiert werden: Die Lage des zweiten Formanten korreliert relativ gut mit der Unterkiefer-Stellung (beim i ist der Mund relativ weit geschlossen, whrend er beim u und a relativ weit geffnet ist). Der erste Formant korreliert relativ gut mit der Vorne-HintenArtikulation, wobei das a relativ weit vorne mit offenem Mund artikuliert wird, whrend das u weit hinten mit gerundetem Mund artikuliert wird (d. h. 1. Formant: Zungenhhe, 2. Formant: Mundffnung). Eine Liste der im Deutschen vorkommenden Vokale (als Phoneme) ist im folgenden aufgefhrt. Man unterscheidet dabei zwischen Monophthongen und Diphthongen (d. h. bergnge zwischen zwei Vokalen) und zwischen langen und kurzen Monophthongen.
Monophthonge lang kurz Diphthonge Reduktionsvokal

Whrend die Vokale aufgrund ihrer Formantlage (die whrend der Dauer des Vokals relativ stabil ist) und ihrer Lnge auch von der akustischen Analyse her relativ eindeutig zu klassifizieren sind, ist es bei den Konsonanten wesentlich schwieriger, zu einer Klassifikation zu gelangen. Eine Unterteilung aufgrund artkulatorischer Merkmale (d. h. aufgrund der Art, wie sie artikuliert werden und dem jeweiligen Artikulationsort) ist dagegen relativ einfach und fhrt zu der im folgenden aufgefhrten Tabelle fr die im Deutschen gebruchlichen Konsonanten:
Approximanten lateraler Approximant

Frikative stimmhaft stimmlos

Plosive

Nasale

104

Akustik von Stimme und Sprache

Ein erster Schritt in die Richtung, eine Klassifikation von Sprachlauten aufgrund von rein akustischen Merkmalen zu erhalten, wird im System der Distinktiven Sprachmerkmale versucht. Diese Sprachmerkmale sind binr (d. h. ein + zeigt das Vorliegen des jeweiligen Sprachmerkmals an und ein - bedeutet, da das Merkmal nicht vorliegt). Jeder Konsonant ist gem nachstehender Tabelle (mit Beispielen) eindeutig durch eine Kombination von Merkmalen bestimmt. Whrend einige Sprachmerkmale artikulatorischer Natur sind (z. B. nasal, vokalisch bzw. konsonantisch) weisen andere Merkmale eher akustischer Natur auf (z. B. scharf, dunkel, abrupt).

Eine vollstndige akustische Klassifikation von Phonemen ist jedoch schwierig, weil es keine eineindeutige Beziehung zwischen Phonemen und ihrer akustischen Realisation gibt, d. h. fr jedes Phonem gibt es eine fast unendlich groe Vielzahl von akustischen Realisationsmglichkeiten.

Das Zeitsignal von sprachlichen uerungen ist zu dieser akustischen Klassifikation relativ ungeeignet, da nur sehr wenige Spracheigenschaften direkt abgelesen werden knnen (z. B. Einhllenden-Verlauf, Sprachpausen, silent interval bei stimmlosen Plosiven). Eine bessere Visualisierung von sprachlichen uerungen bietet dagegen das Spektrogramm (s.o.).

Akustik von Stimme und Sprache

105

Im Spektrogramm lassen sich die Formanten und die Formant-bergnge als Merkmale ablesen. Unterschiedliche Vokale lassen sich daher durch die Lage der Formanten relativ gut charakterisieren. Stimmhafte bzw. stimmlose Konsonanten (z. B. ba-pa oder pa-fa) lassen sich durch die sogenannte voice-onset-time von etwa 20 ms unterscheiden, die sich bei stimmlosen Konsonanten zwischen dem initialen Burst (z. B. Sprengung der Lippenffnung bei pa) und dem Einsetzen der Stimmlippenschwingung beobachten lt. Ein unterschiedlicher Artikulations-Ort (z. B. zur Unterscheidung von ba und ga) lt sich durch den Zeitverlauf der Formanten unterscheiden. Dieser unterschiedliche Zeitverlauf ist durch den bergang des Vokaltraktes von der Artikulationsstellung des jeweiligen Konsonanten zum darauffolgenden Vokal bestimmt. Dabei sind die vom Gehr ausgewerteten Formanttransitionen relativ kurz, so da es bei der Auswertung von Spektrogrammen selbst dem erfahrenen Sprachwissenschaftler schwerfllt, die einzelnen Phoneme voneinander zu unterscheiden. Nasale (z. B. ma ) sind im Spektrogramm durch ihre Eigenschaft als Halbvokale gekennzeichnet (d. h. relativ stationre Abschnitte im Zeitverlauf mit geringerer Energie als bei reinen Vokalen). Bei ihnen treten Nullstellen im Spektrum aufgrund der Interferenz zwischen der Abstrahlung durch die Nase und der Abstrahlung durch den geschlossenen Mund auf. Fr weitere Details im Bereich der akustischen Phonetik sei auf die einschlgige Literatur (z. B. Kohler, K. Akustische Phonetik) verwiesen.

IV.3 Sprachbertragung und Sprachsynthese


Die bertragung von Sprachsignalen mit niedrigen Bit-Raten ist insbesondere fr das Telefonieren von Interesse, bei der einerseits mglichst viele Telefongesprche gleichzeitig auf einem bertragungsweg (z. B. bersee-Kabel, Satelliten-bertragung oder Funk-Relais-Station fr Funktelefone) bertragen werden mssen und andererseits keine wesentlichen Sprachverstndlichkeits- und Qualittsverluste hingenommen werden sollen. Verwandt mit diesem Problem ist das ebenfalls hochaktuelle Problem der Sprachsynthese, mit der z. B. in automatischen Auskunftssystemen Informationen ber akustische Kommunikation weitervermittelt werden sollen oder eine akustische Mensch-Maschine-Kommunikation ermglicht werden soll. Das den meisten Sprach-bertragungsverfahren zugrundliegende Prinzip ist im folgenden Bild angegeben:

106

Akustik von Stimme und Sprache

Abbildung 4.9: Prinzip der LPC-basierten Sprachbertragung

Das Ziel ist dabei, die hohe Redundanz im Sprachsignal auszunutzen, um nicht das gesamte Audio-Signal mit hoher Abtastrate bertragen zu mssen (z. B. 16 Bit pro Abtastwert bei einer Abtastrate von 20 kHz, die fr die naturgetreue Sprachwiedergabe notwendig ist). Statt dessen soll die wirklich notwendige Information mit weniger Bits bertragen werden. Die grundstzliche Idee ist dabei, da das einkommende Sprachsignal zerlegt wird in eine langsam vernderliche (Vokaltrakt-)Filterfunktion und eine schnell vernderliche Anregungs-Funktion des Vokaltraktes mit einem flachen Spektrum, die entweder ein periodisches Signal (bei stimmhaften Konsonanten oder Vokalen) oder ein Rauschen darstellt (bei stimmlosen Vokalen bzw. Frikativen). Whrend die erste Gre in Form von Filterkoeffizienten (z. B. LPC-Filterkoeffizienten (s. u.) bzw. als hypothetischer Vokaltrakt-Lngsschnitt) mit sehr niedriger Abtastrate bertragen werden kann, mu das zweite Signal mit relativ hoher Abtastrate bertragen werden. Allerdings enthlt dieses sogenannte Restsignal oder Anregungssignal nur noch wenig Sprachinformation, so da es mit einer sehr groben Quantisierung (d. h. mit hoher Ungenauigkeit) bertragen werden kann. Alternativ kann dieses Restsignal auch berhaupt nicht bertragen werden bzw. nur die Information bertragen werden, ob es sich um ein stimmhaftes oder ein stimmloses Signal handelt. In diesem Fall wird auf der Empfangsseite nicht mehr die Original-Stimme zur rekonstruieren versucht, sondern es wird eine Sprachsynthese nach dem Prinzip des Vocoders betrieben. Beim bergang von der vollstndigen bertragung beider Signale ohne Quantisierungsfehler und der bertragung der Sprache mit sehr niedriger Datenrate (und entsprechend hherem Quantisierungsfehler) nimmt die Qualitt der bertragenen Sprache ab, so da sie im Extremfall des Vocoders zwar noch verstndlich ist, aber sehr unnatrlich klingt. Als weitere

Akustik von Stimme und Sprache

107

Literatur fr Einzelheiten des Aufbaus von Sprachbertragungssystemen und Vocodern sei auf das Buch von Ince, Automatic Speech Processing, Kluver 1992 verwiesen. Als gngigste Standardmethode zur Extraktion der effektiven Vokaltraktbertragungsfunktion, die in jedem modernen Funktelefon integriert ist, wird das Verfahren des Linear Predictive Coding (LPC) verwendet. Dieses Verfahren wurde unabhngig sowohl fr die Sprachkodierung als auch fr Anwendungen in der Geophysik entwickelt und ist formal quivalent mit der minimalen Entropie-Spektralanalyse (vgl. Schroeder, M. R., 1989). Dabei wird das n-te Sample des Zeitsignals x(n) aus M vorhergehenden Samples x(n-k) wie folgt geschtzt: x( n ) = a k x( n k ) + e( n ),
k =1 M

(IV.5)

mit e( n ): Prdiktio nssignal

Die Koeffizienten ak stellen die sogenannten Prdiktions-Koeffizienten dar, die so optimiert werden mssen, da das sogenannte PrdiktionsFehlersignal e(n) minimal ist, d. h. da das Signal x(n) optimal aus den vorhergehenden Sampeln vorhergesagt werden kann. Als Bedingung dafr folgt fr den mittleren Fehler EM: E M = e 2 ( n) = x 2 ( n ) 2 a k x( n ) x( n k ) + a k a l x( n k ) x( n l ) k =1 k =1 l =1 = k 0 = kl ! = min
M 0= E M = 2 k 0 + a l kl a k l =1

(IV.6)

(IV.7)

Diese Gleichung kann man fr smtliche kl auch als Matrix schreiben, so da gilt:

108
= a, wobei a = (a 1 , , a M ) ,
T

Akustik von Stimme und Sprache

= ( 10 , 20 ,

, M0 ) = ( R(1),
T

, R( M )) ,
T

da kl = x( n k ) x( n l ) = R( k l ) = R( l k ) (Autokorrelationsfunktion) Die Elemente der Matrix sind dabei die Autokorrelations-Funktionswerte fr die Verschiebungen um 0, 1 bzw. M 1 Samples. Da diese Autokorrelationsfunktionen symmetrisch bzgl. ihres Arguments sind, ist auch die Matrix symmetrisch und hat zudem eine Diagonal-Streifen-Form, die auch als Toeplitz-Form bezeichnet wird (positive Diagonal-Streifen mit Maximum in der Hauptdiagonalen). Fr dieses einfache lineare Gleichungssystem, das auch als Jule-Walker-Gleichungen bezeichnet wird, gibt es einen effizienten Algorithmus, der als Levinson-RobinsonDurban Algorithmus bezeichnet wird. Durch die Existenz dieses Algorithmus wird die LPC-Analyse mit einem hnlich geringen Rechenaufwand praktisch berechenbar wie eine FFT (vgl. Markel, J. D, Gray, A. H.: Linear Prediction of Speech, Springer Verlag, Berlin 1976). Um die Auswirkung der LPC-Analyse fr den spektralen Gehalt des Analyse-Signals besser zu verstehen, betrachten wir die Darstellung der vorhergehenden Schritte im Frequenzbereich: Wenn das Zeitsignal x(n) ein Spektrum X(f) aufweist, denn gilt fr das zeitverzgerte Zeitsignal x(n) x( n ) X( f ) x( n k ) X( f ) e 2 if T K , mit k: Zeitverzgerung um k T
 

Fr die Darstellung der Prdiktions-Gleichung ergibt sich dann im Frequenzbereich: x(n) = a k x(n k ) + e(n)
k =1 M

X(f ) = a k e 2if Tk X(f ) + E(f )


A ( F)
   

k =1


11 = M1

R(0) R(1) 1M R(1) R(0) = MM R( M 1)

R(M 1) , R( 0 )

(IV.8)

(IV.9)

(IV.10)

(IV.11)

Akustik von Stimme und Sprache

109
X(f ) = E( f ) (IV.12)

X(f ) (1 A(f )) = E(f ),

1 A (f )

Durch das Berechnen der Prdiktions-Koeffizienten ak wird daher ein Filter A(f) konstruiert, mit dem das Signal x durch Filterung des Fehlersignals e 1 erzeugt wird. Die dabei auftretende bertragungsfunktion besitzt 1 A(f ) dabei nur Nullstellen im Nenner, d. h. es ist eine Nur-Polebertragungsfunktion. Das zugehrige Modell, da eine spektrale Schtzung aufgrund der Filterung mit einer Nur-Polebertragungsfunktion vorsieht, wird als AR-Modell (Auto-Regressive Model) bezeichnet. Analog dazu gibt es auch ein nicht-rekursives Modell, das als Moving Average (MA) bezeichnet wird, sowie eine Kombination, die als ARMA bezeichnet wird. Die hier vorgenommene Beschreibung des Sprachsignals durch die Filterung des Anregungssignals mit einer Nur-Pole-bertragungs-Funktion entspricht daher gut der Vorstellung einer Resonanz-Filterung im Vokaltrakt, bei der die Formant-Frequenzen aufgrund von HelmholtzResonatoren erzeugt werden, die wiederum durch Pole in ihrer LaplaceTransformierten gekennzeichnet sind. Diese Analogie zur ResonanzFilterung im Vokaltrakt kann sogar noch etwas weiter verfolgt werden, wenn anstelle der Prdiktor-Koeffizienten ak, die daraus eineindeutig berechenbaren ParCor-Koeffezienten rk berechnet werden, die nur einen sehr eingeschrnkten Wertebereich zwischen -1 und 1 annehmen knnen. Diese ParCor-Koeffizienten knnen als Reflexions-Koeffizienten in Rhren-Segmenten des Rhren-Modells vom Vokaltrakt aufgefat werden. Diese Interpretation kann auch in der strukturellen Nachbildung der Wellenausbreitung im Vokaltrakt durch die sogenannte Lattice-Struktur erreicht werden, bei der jeweils eine hin- und rcklaufende Welle an aufeinanderfolgenden Grenzschichten reflektiert oder weitergeleitet werden knnen und die ParCor-Koeffizienten den jeweiligen Reflexionsgrad bestimmen.

IV.4 Spracherkennung
Um eine vollstndige akustische Mensch-Maschine-Kommunikation mit gesprochener Sprache zu realisieren, ist neben der oben behandelten Sprachsynthese auch die Spracherkennung von gesprochener Sprache notwendig. Obwohl es in der Vergangenheit viele Anstrengungen in diese Richtung gegeben hat und auch einige Fortschritte erzielt worden sind, sind selbst die leistungsfhigsten Rechner und Algorithmen heute noch immer nicht in der Lage, eine hnliche Leistungsfhigkeit bei der Spra-

110

Akustik von Stimme und Sprache

cherkennung auch unter ungnstigen akustischen Situationen zu erreichen, wie der Mensch. Heutige Spracherkennungsalgorithmen erreichen bei sprecherabhngiger Erkennung (d. h. Sprecher ist bekannt) eine Erkennungsrate von etwa 95 % und bei sprecherunabhngiger Erkennung etwa eine Rate von 90 %. Dieser Wert ist natrlich stark abhngig vom verwendeten Sprachmaterial und dem Wortschatz, sowie einer Reihe weiterer Parameter wie den akustischen Aufnahmebedingungen. Der grundlegende Aufbau von Spracherkennungssystemen ist in unten stehender Abbildung 4.10 skizziert: Das akustische Sprachsignal wird zunchst in einer Vorverarbeitungsstufe in eine spektrogrammhnliche Darstellung transformiert. Dazu wird zumeist eine Filterbank fr die FrequenzAnalyse benutzt und der Zeitverlauf wird als Folge aufeinanderfolgender Analyse-Frames dargestellt. Um unabhngig von der jeweiligen GesamtEnergie des Sprachsignals zu sein, ist eine Energie-Normierung zudem notwendig, die z. B. durch Logarithmierung der Zeit-Frequenz-Darstellung oder durch andere Adaptions-Algorithmen (z. B. Division durch die Gesamt-Energie des Eingangssignals) erreicht werden kann. In diesem Zusammenhang ist auch die Premphase zu erwhnen, d. h. die Anhebung der hohen Frequenzen im Spektrum mit etwa 6 dB pro Oktave (Differenzierung des Zeitsignals), damit das analysierte Spektrum in erster Nherung die gleiche Energie bei hohen und tiefen Frequenzen aufweist. Auf dieser normierten Zeit-Frequenz-Darstellung knnen bereits einige Sprachmerkmale markiert oder besonders hervorgehoben werden (z. B. die Formanten, die sich insbesondere bei der LPC-Spektralanalyse als scharfe Maxima im Spektrum deutlich abzeichnen).

Abbildung 4.10: Prinzipieller Arbeitsweise eines Spracherkennungssystemes

Akustik von Stimme und Sprache

111

Auf diesem vorverarbeiteten, zweidimensionalen Signal operiert in einem weiteren Schritt ein Mustererkennungs-Algorithmus, der das Muster des jeweils zu erkennenden Wortes aufgrund seiner hnlichkeit mit gelernten Mustern aus dem Trainings-Wortschatz erkennt. Fr diesen Mustererkenner gibt es genau wie fr die Vorverarbeitung eine groe Vielzahl von Variations-Mglichkeiten, von denen die drei gngigsten im folgenden vorgestellt werden sollen:

IV.4.1 Dynamic-Time-Warping (DTW)-Algorithmus


Diesem Algorithmus liegt die Annahme zugrunde, da das zu erkennende Wort durch lokale Zeit-Stauchungen und -Dehnungen aus einem der gespeicherten Referenzwrter entsteht. Dies kann z. B. bei der uerung desselben Wortes vom selben Sprecher, aber zu unterschiedlichen Zeiten bedingt sein. Der DTW-Algorithmus versucht nun, den Zeitverlauf der Einhllenden des gesuchten Wortes mit der entsprechenden Einhllenden des jeweiligen Referenz-Wortes mglichst gut in Einklang zu bringen, indem ein optimaler Pfad in der Ebene gesucht wird, die von dem Zeitverlauf des einen Wortes auf der X-Achse und dem Zeitverlauf des anderen Wortes an der Y-Achse aufgespannt wird (als Zeitfunktion kann auch jeweils eine Bandpa-gefilterte Version des jeweiligen Wortes verwendet werden. Dasjenige Wort aus dem Trainingswortschatz wird erkannt, bei dem nach Optimierung des Angleichungs-Pfades der geringste Abstand resultiert. Der Vorteil dieses Verfahrens ist der sehr geringe Trainingswortschatz (fr jedes zu erkennende Wort des Wortschatzes braucht im Prinzip nur eine akustische Realisation aufgenommen werden) und der relativ geringe Rechenaufwand beim Training, der allerdings einem etwas hheren Rechenaufwand in der Erkennungsphase gegenbersteht. Der Nachteil des DTW-Algorithmus ist seine Sprecherabhngigkeit (d. h. bei Verwendung eines anderen Sprechers als beim Referenz-Wortschatz sinkt die Erkennungsrate deutlich) und die insgesamt relativ hohe Fehlerrate des Algorithmus. Dieser Algorithmus wird daher in jngerer Zeit relativ selten eingesetzt.

IV.4.2 Hidden-Markov-Modelle (HMM)


Diesem Muster-Erkennungs-Algorithmus liegt die Annahme zugrund, da das gesprochene Wort durch eine Abfolge von Zustnden generiert wird, die mit einer gewissen Wahrscheinlichkeit aufeinander folgen und eine jeweils zufllige akustische Realisation bewirken. Jeder dieser Zustnde kann beispielsweise ein Phonem (oder ein Teil eines Phonemes oder eine Phonemenkette) reprsentieren, das im nchsten Zeitschritt entweder noch immer vorliegt oder durch ein nachfolgendes Phonem abgelst wird. Aufgrund der bergangswahrscheinlichkeiten von einem Zustand zum nchsten Zustand kann dieser Vorgang als eine Markov-Kette

112

Akustik von Stimme und Sprache

beschrieben werden. Die einzelnen Zustnde dieser Markov-Kette sind jedoch nicht direkt beobachtbar, weil man zwar die akustische Realisation, nicht aber das hier zugrundeliegende Phonem kennt. Aus diesem Grunde redet man von versteckten Zustnden der Markov-Kette (Zustnde 1, 2, 3, 4, ... in unten stehender Abbildung). Fr jeden Zustand j tritt bei seinem Vorliegen eine (zufllige) Auswahl von akustischen Realisationen dieses j Zustandes S k statt.

Abbildung 4.11: Struktur des Hidden-Markov-Modells

In der Trainingsphase mu nun fr jedes Wort ein eigenes Modell gelernt werden, das durch die Anzahl der versteckten Zustnde, ihre bergangswahrscheinlichkeiten und ihre akustischen Realisationen mit jeweiliger Auftretenshufigkeit charakterisiert wird. Diese Gren knnen nur durch eine Statistik ber eine Vielzahl von Realisationen ein und desselben Wortes gewonnen werden, so da ein HMM-Spracherkenner einen sehr groen Trainingswortschatz bentigt. Der Vorteil eines derartigen Algorithmus ist die relativ hohe Trefferquote, die auch sprecherunabhngig erreicht werden kann (solange der Trainingswortschatz auch von mehreren Sprechern aufgenommen wurde). Zu den Nachteilen des HMMAlgorithmus gehrt der extrem hohe bentigte Trainingswortschatz, ohne den das Modell nicht erfolgreich funktionieren kann. Ein weiterer Nachteil ist der relativ hohe Rechenzeitaufwand, weil zu einem vorgegebenen Wort die Wahrscheinlichkeit fr jedes Referenz-Modell errechnet werden mu, da dieses jeweilige Modell die beobachtete Sequenz von akustischen Realisationen erzeugt hat. Aufgrund seiner hohen Erkennungsrate und sonstiger Vorteile ist der HMM-Erkenner derzeit die am hufigsten eingesetzte Form der knstlichen Spracherkennung.

Akustik von Stimme und Sprache

113

IV.4.3 Neuronales Netz


In den letzten Jahren wurden zunehmend neuronale Netze fr klassische Aufgaben der Mustererkennung eingesetzt aufgrund ihrer Eigenschaft, sich selbst zu organisieren und bei entsprechender Wahl der Parameter auch die einmal gelernten Klassifikationsregeln generalisieren zu knnen. Das am hufigesten dabei angewandte Netz ist das Multi-LayerPerceptron. Bei ihm tritt ein klarer Signalflu auf, der bei einer Eingangsschicht von Neuronen startet, die Verbindungen zu einer (oder mehreren) Zwischenschichten aufweisen. Diese weisen wiederum nur Verbindungen zu den darauffolgenden Schichten (bzw. der darauffolgenden Schicht) auf. Auf die Eingangsschicht wird dabei die zweidimensionale Zeit-FrequenzDarstellung des Sprachsignals gegeben. In der Ausgangsschicht sollte die Zelle die maximale Aktivitt entfalten, die zu dem zu erkennenden Wort gehrt. Um das Netz zu trainieren werden mehrere Realisationen desselben Wortes bentigt, fr die jeweils das Eingangsmuster und das gewnschte Ausgangsmuster dem Netz vorgegeben wird. In dem Lehrvorgang werden nun die Gewichte, mit denen die in der vorausgehenden Schicht liegenden Neuronen-Aktivitten (fr jedes Neuron in der nachfolgenden Schicht) verrechnet werden, gem einer Lernvorschrift adaptiert. Fr das hufigst genutzte Beispiel des Multi-Layer-Perceptrons gibt es einen effizienten Adaptionsalgorithmus der Gewichte, den sogenannten Backpropergation-Algorithmus (vgl. Rummelhard McClellan., s. Literaturliste). Die zugrundeliegende Idee ist nun, da das Wortmuster vom Netz in Form eines Eins-aus-n-Kodierers klassifiziert wird. Falls die Anzahl der Neuronen im Netz gnstig gewhlt ist, kann das Netz generalisieren, d. h. es kann auf wesentliche Eigenschaften der Eingangssignale ansprechen und fr die Klassifikation unwichtige Eigenschaften der ZeitFrequenz-Darstellung des Wortes ingnorieren. Der Vorteil von einem neuronalen Netz-Erkenner ist die sehr einfache und schnelle Berechnung des erkannten Wortes, sobald das Netz erst einmal trainiert ist. Der Nachteil des neuronalen Netz-Spracherkenners liegt in dem relativ groen Trainingswortschatz und den leider sehr begrenzten Erkennungsraten. Obwohl das Konzept des neuronalen Netzes sich eng an der Struktur von biologischen Nervensystemen anlehnt und auch einige interessante Eigenschaften (z. B. selbst organisiertes Lernen) damit erreicht werden knnen, ist dieses Konzept den konventionellen Verfahren zur Mustererkennung und Musterklassifikation (z. B. HMM-Algorithmus fr die Spracherkennung) nicht berlegen (vgl. Behme, H., Dissertation, Universitt Gttingen).

114 IV.5 Stimmpathologie

Akustik von Stimme und Sprache

Entsprechend den bereits unter IV.1 beschriebenen Einzelheiten zur Stimmerzeugung und zur Physiologie der Stimme kann es eine Reihe von sehr unterschiedlichen Strungen in der Stimm-Mechanik geben, die zu pathologischen Stimmvernderungen fhren. Neben Regulations- und Steuerungsstrungen durch das zentrale Nervensystem (vgl. PhoniatrieLehrbuch, z. B. Wendler et al., 1996) wird oft die Mechanik der Stimmlippen-Schwingung beeintrchtigt, auf die allerdings nur kurz eingegangen werden soll. Aus akustischer Sicht sind dabei die drei Grundtypen von Stimmpathologien zu unterscheiden: Hauchigkeit, Rauhigkeit und Diplophonie. Eine Hauchigkeit der Stimme tritt bei einem unvollstndigen GlottisSchlu auf, der beispielsweise durch eine einseitige Glottis-Lhmung hervorgerufen werden kann. Fr die Phonation wird daher ein sehr groer Luftstrom bentigt, so da zustzlich zu der periodischen Schwingung starke Atemgerusche hrbar werden und der akustische Eindruck einer verhauchten, nicht rein tnenden Stimme entsteht. Fr die Rauhigkeit von Stimmlippenschwingungen sind Verdickungen bzw. Strukturunregelmigkeiten der Stimmlippen verantwortlich (z. B. Polypen, Schleim oder eine Entzndung). Sie fhrt zu vernderten Schwingungseigenschaften (z.B. zu Amplituden- und Frequenzmodulationen) und zu einem vernderten Spektralgehalt der Glottis-Schwingung, was sich subjektiv als rauhe Stimme bemerkbar macht. Diese Rauhigkeit ist dabei nicht mit der psychoakustischen Rauhigkeit zu verwechseln. Fr die Diplophonie (d. h. Phonation mit zwei unterschiedlichen Frequenzen) ist eine Asymmetrie der Stimmlippen verantwortlich, die beispielsweise durch eine einseitige Lhmung oder durch einen asymmetrischen Befall mit Polypen bedingt ist. Dabei knnen die beiden Stimmlippen mit unterschiedlicher Frequenz schwingen, so da der Eindruck einer nichtstabilen Grundfrequenz auftritt. Als wichtigste Untersuchungstechnik in der Stimmdiagnostik wird die Stimmgrundfrequenz-gesteuerte Stroboskopie verwendet. Bei ihr wird die Glottis mit Hilfe eines starren oder flexiblen Endoskops beobachtet und zugleich mit einem Blitzlicht beleuchtet, das eine Blitzfolge-Frequenz aufweist, die leicht gegenber der Stimmfrequenz verschoben ist. Durch die dabei auftretende Schwebung lassen sich smtliche Phasen der periodischen Stimmlippenschwingung im zeitverlangsamten Ablauf beobachten, so da man einen berblick ber die dynamische Bewegung der

Akustik von Stimme und Sprache

115

Stimmlippen erhalten kann. Da diese Technik nur mit lang angehaltenen Vokalen mit relativ stabiler Grundfrequenz angewandt werden kann, stt sie in der Praxis bei Patienten auf Schwierigkeiten, die nicht in der Lage sind, einen Ton vorgegebener Tonhhe eine gewisse Zeit lang unter Endoskopbetrachtung auszuhalten. Als Alternative bietet sich daher die in jngerer Zeit eingefhrte Hochgeschwindigkeitsglottografie an, bei der die Stimmlippen-Schwingung mit mehreren Belichtungen bei jeder Periode der Stimmlippenschwingung abgebildet wird. Auf diese Weise knnen auch kurze Zeitabschnitte von Stimmlippen-Schwingungen beurteilt werden.

116

Akustik von Stimme und Sprache

Lrmbekmpfung, Schalldmmung und Schalldmpfung

117

V Lrmbekmpfung, Schalldmpfung

Schalldmmung

und

V.1 Schallemission und -Immission


Aufgrund der groen Bedeutung von Schall als Faktor der Umweltverschmutzung (vgl. Kapitel III, Schallwirkung) werden erhebliche Manahmen zur Lrmbekmpfung durchgefhrt, die sich in entsprechenden gesetzlich vorgegebenen Richtlinien bewegen. hnlich wie bei der Umweltverschmutzung mit Substanzen unterscheidet man auch beim Schall zwischen der Schall-Imission und -Emmission. Unter Schall-Emission versteht man dabei die Schalleistung (bzw. den Schalleistungspegel), die von einer bestimmten Quelle (z. B. einer Maschine oder einer Fabrik) nach auen abgestrahlt (d. h. emittiert) wird. Unter Schall-Immission versteht man dagegen die Schalleistung (bzw. den Schalleistungspegel), die an einem bestimmten Ort (z. B. am Ohr der betroffenen Person) auftritt. Zur Bestimmung der Schallemission gibt es verschiedene Meverfahren, die sich aufgrund der erfaten Schallmegre und im Hinblick auf die erreichbare Genauigkeit unterscheiden. Beim Hllflchenschalldruckmeverfahren geht man von exakten bzw. genherten Freifeldbedingungen aus, d. h. es drfen keine Reflexionen eines umgehenden Raumes das Meergebnis stark verflschen. Auf einer Meflche S, die die zu bestimmende Schallquelle mglichst vollstndig umschliet und nach Mglichkeit einen konstanten Abstand von der Schallquelle aufweist (z. B. 1 Meter) wird nun der Geruschpegel Lp gemessen.

Abbildung 5.1: Schallquelle mit Meflche S

Die insgesamt von der Schallquelle abgestrahlte Schalleistung P berechnet sich dann zu: P = p v dS
S

1 p2 dS c S

(V.1)

118

Lrmbekmpfung, Schalldmmung und Schalldmpfung

Daraus wird der Leistungspegel LW der Emission berechnet zu: LW = 10 log P = L P + LS + C o P0

mit: LP : mittlerer Pegel auf der Flche S S LS = 10 log S0 c C0 = 10 log ( c)0

(V.2)

Dabei bezeichnet P0 die Bezugsschalleistung, S0 bezeichnet eine Refe2 renz-Schallflche (10 m ) und C0 bezeichnet eine Korrekturkonstante, die z. B. die Temperaturabhngigkeit der Dichte und der Schallgeschwindigkeit von Luft beinhaltet. Obwohl dieses Verfahren direkt aus der Definition von Schalleistung und Schallflu resultiert, weist es doch einige Nachteile auf (z. B. Stranflligkeit durch von auen einfallenden Schall oder bei Nichteinhaltung der Freifeldbedingungen). Diese Strfaktoren knnen vermieden werden, wenn anstelle des Schalldrucks die Schallintensitt gemessen wird. Bei dem Hllflchen-Schallintensittsmeverfahren wird daher auf einer die Schallquelle umgebenen Flche die Schallintensitt bestimmt, also: P = I dS LW = LIn + LS
S

(V.3)

Dabei bezeichnet L In den mittleren Schallintensitts-Pegel auf der Hllflche S und der Wert LS die Abweichung der Gre der aktuellen Meflche von der Bezugs-Meflche (vgl. V.2). Der Vorteil dieses Verfahrens ist, da die Phasenbeziehung zwischen Schallschnelle und Schalldruck mit bercksichtigt wird, so da die Blind-Komponente der Schalleistung (z. B. im Nahfeld einer Schallquelle, in dem die Schnelle v nicht in Phase mit dem Schalldruck p steht) eliminiert wird. Weiterhin werden Streinflsse kompensiert, z. B. externe inkohrente Schallquellen oder Reflexionen, indem die von diesen ueren Schallquellen erzeugten Schallflsse vektoriell entlang der Meflche aufaddiert werden. Dadurch wird der in das umschlossene Volumen eintretende Schallflu gerade mit negativen Vorzeichen zu dem wieder austretendem

Lrmbekmpfung, Schalldmmung und Schalldmpfung

119

Schallflu zuaddiert, so da sich insgesamt eine Kompensation dieser Streinflsse ergibt. Beim Hallraummeverfahren geht man zu dem anderen Extremfall ber, da sich das Meobjekt in einem Hallraum mit (fast) ideal reflektierenden Wnden befindet, so da die Mittelung ber die verschiedenen Schallabstrahl-Richtungen durch das diffuse Schallfeld im Hallraum geschieht. 3 Wenn man von einem Hallraum mit einem Volumen V(m ) mit einer Nachhallzeit T(s) und einer Oberflche SR ausgeht, bei dem bei der Mittenfrequenz fm und dem Luftdruck B (mB) gemessen wird, ermittelt sich der Schalleistungspegel zu:
T V S c B L p = L pm + 10 log + 10 log 3 10 log 1 + R 10 log 14dB 8Vfm m [s] [1000mb]

[ ]

(V.4)

Dabei bezeichnet Lpm den mittleren Pegel im Hallraum, d. h. den ber verschiedene Mikrophonpositionen gemessenen Pegel. Da bei diesem Verfahren der Einflu externer Strquellen eliminiert wird (bei entsprechender akustischer Isolation des Hallraums) und die Reflexionen an den RaumBegrenzungen nicht stren, sondern explizit in die Rechnung mit einbezogen werden, stellt dieses Hallraumverfahren das derzeit gngigste Przisionsmeverfahren dar. Es setzt natrlich eine entsprechende HallraumGte voraus (d. h. geringe Absorption des Schalls an den Wnden des Hallraums). Je hher die Gte des Hallraums, desto grer ist bei gleichem Schalleistungspegel LP der mittlere Pegel im Hallraum Lpm, so da ein entsprechend hoher Signal-Rauschabstand bei der Messung dieses Hallraum-Pegels auftritt. Ein Nachteil dieses Verfahrens ist jedoch die Tatsache, da die gesamte Schallquelle sich im Meraum befinden mu. Dies bereitet bei groen Schallquellen (z. B. Maschinen oder ganzen Fabriken) jedoch erhebliche Probleme. Diese Probleme werden beim Vergleichsverfahren umgangen, indem am Ort der zu messenden Schallquelle eine Prfschallquelle aufgestellt wird, deren insgesamt abgestrahlte Schalleistung bekannt ist. Unter der Annahme, da die Prfschallquelle dieselbe Abstrahlcharakteristik wie die zu bestimmende Schallquelle hat, kann nun durch einen Pegelvergleich zwischen dem Schallpegel, der an einem bestimmten Meort von der vorgegebenen Schallquelle und dem Schallpegel, der von der Prfschallquelle erzeugt wird, auf die Abstrahlleistung der vorgegebenen Schallquelle zurckgeschlossen werden.

120

Lrmbekmpfung, Schalldmmung und Schalldmpfung

Die auf diese verschiedenen Arten gemessenen Schalleistungspegel sind fr die jeweilige Schallquelle charakteristisch. Beispielsweise hngt der Schalleistungspegel von Maschinen mit der Gesamt-Leistung der Maschine zusammen unter der Voraussetzung, da ein bestimmter Prozentsatz der Maschinennennleistung in Schallenergie umgewandelt wird. Je nachdem wie hoch dieser Prozentsatz ist, handelt es sich um relativ leise bzw. laute Maschinen. Die Angabe der Geruschemission einer Maschine bzw. die entsprechende Klassifizierung ist fr die Planung der SchallImmission an einem bestimmten Ort von groer Bedeutung. Sie ist vorgeschrieben fr alle Arbeitsmittel, fr die 70 dB (A) in unmittelbarer Nhe dieser Arbeitsmittel berschritten wird. Zur Beurteilung der Schall-Immission wird der Bezugspegel LR verwendet, d. h. der fr die Schallwirkung relevante Pegel, der whrend der Beurteilungsdauer anliegt. Diese Gre beinhaltet neben dem A-bewerteten Leq eine Reihe von Zu- bzw. Abschlgen, die aufgrund der besonderen Qualitt des auftretenden Schalls erforderlich sind. Fr den Beurteilungspegel LR gilt also: (V.5)

Die Summanden KI bezeichnen die folgenden mglichen Zu- bzw. Abschlge: KI: bezeichnet den Zuschlag fr Impulshaltigkeit (d. h. bei Auftreten impulshafter nderungen des Momentan-Pegels). KI betrgt etwa 3 dB oder 6 dB und kann beispielsweise berechnet werden nach: KI = LAIeq LAeq (DIN 45645) (V.6)

Kton bezeichnet den Tonhaltigkeits-Zuschlag, der ebenfalls 3dB oder 6dB betragen kann und vom Gutachter nach Gehreindruck vergeben wird. Eine Mglichkeit zur objektiven Berechnung des Tonhaltigkeitszuschlages berechnet den Unterschied zwischen dem ber ein relativ breites Frequenzband gemittelten Pegel LN und dem Pegel LT, der schmalbandig um dem jeweiligen Ton herum gemittelt wurde. Wenn die entsprechenden Pegel (bzw. auf die Frequenz bezogenen Dichtepegel) einen Unterschied von < 6 dB aufweisen, kann der Zuschlag gewhrt werden.

Lrmbekmpfung, Schalldmmung und Schalldmpfung

121

Kinf bezeichnet den Zuschlag fr Informationsgehalt des strenden Schallsignals (z. B. bei Lautsprecherdurchsagen oder Musikwiedergabe). Dieser Zuschlag kann ebenfalls 3 dB oder 6 dB betragen. KR bezeichnet den Zuschlag fr Lrm-Einwirkungen whrend der Ruhezeit am Tage (d. h. zwischen 6-7 Uhr, 19-22 Uhr) und betrgt 6 dB. Dieser Zuschlag ist notwendig, weil whrend der Tageszeit und der Nachtzeit unterschiedliche Kriterien angelegt werden. Whrend der Randzeiten am Tage kann daher ein Zuschlag von 6 dB gewhrt werden. Ksit und KQu bezeichnen den Zu- oder Abschlag fr bestimmte rtliche Situationen bzw. fr bestimmte Geruschquellen, die vom Gutachter aufgrund seines Gehreindrucks vergeben werden knnen. Diese Mglichkeit trgt dem Umstand Rechnung, da nicht smtliche Aspekte von emitiertem Schall durch objektive Meverfahren in hnlicher, fr den Menschen gerechter Weise erfat werden knnen, wie von einem erfahrenen Schall-Gutachter. Der auf die oben beschriebene Weise erhobene Beurteilungspegel wird nun verglichen mit Grenzwerten (d. h. Werte, deren Nicht-Einhaltung unmittelbar rechtliche Folgen hat, wie es beispielsweise bei Fluglrm der Fall ist). Die Beurteilungspegel knnen auch mit Richtwerten verglichen werden (d. h. kann-Vorschriften, die das Erreichen eines Schutz-Ziels verfolgen). Anhaltswerte werden dagegen bei noch unsicherer rechtlicher Entscheidungslage angestrebt und dienen eher zur Orientierung. Im folgenden sind exemplarisch einige Immissionsgrenzwerte tabellarisch aufgefhrt.

Tabelle 5.1: Immissionsgrenzwerte fr Lrmschutz bei neuen Bundestraen Immissionsort Krankenhuser, Schulen, Kurheime, Altenheime reine und allgemeine Wohngebiete, Kleinsiedlungsgebiete Kern-, Dorf-, Mischgebiete Gewerbegebiete Immissiongrenzwerte in dB(A) tags 57 59 64 69 nachts 47 49 54 59

122

Lrmbekmpfung, Schalldmmung und Schalldmpfung

Tabelle 5.2: Immissionsgrenzwerte fr Lrmschutz an bestehenden Bundesstraen: Immissionsort Krankenhuser, Schulen, Kurheime, reine und allgemeine Wohngebiete, Kleinsiedlungsgebiete Kern-, Dorf-, Mischgebiete Gewerbegebiete 72 75 62 65 70 60 Immissiongrenzwerte in dB(A) tags nachts

Die Immissionsgrenzwerte fr bestehende Bundesstraen sind offenbar nicht so streng wie fr die Planung neuer Bundesstraen, bei denen der Aspekt des Schallschutzes strker bercksichtigt wird. Aus diesem Grund mu die Planung z. B. von Ortsumgehungsstraen auch immer eine akustische Planung mit beinhalten. Als Beispiel fr Anhaltswerte sei in folgender Tabelle der Innengeruschpegel fr von auen in Aufenthaltsrume eindringenden Schall angegeben:

quivalenter Raumart Dauerschallpegel LAeq in dB(A) Schlafrume nachts in reinen und allgemeinen Wohngebieten, Krankenhaus- und Kurgebieten in allen brigen Gebieten 25...30 30...35 Wohnrume tagsber in reinen und allgemeinen Wohngebieten, Krankenhaus- und Kurgebieten in allen brigen Gebieten 30...35 35...40

mittlerer Maximalpegel LAFmax,m in dB(A)

35...40 40...45

40...45 45...50

Kommunikations- und Arbeitsrume tagsber Unterrichtsrume, ruhebedrftige Einzelbros, wissenschaftliche Arbeitsrume, Bibliotheken, Konferenz- und Vortragsrume, Arztpraxen, Operationsrume, Kirchen, Aulen Bros fr mehrere Personen Groraumbros, Gasttten, Schalterrume, Lden 35...45 40...50 45...55 50...60 30...40 40...50

Lrmbekmpfung, Schalldmmung und Schalldmpfung

123

Beispielweise orientiert sich der in Schlafrumen nachts zu herrschende quivalente Dauerschallpegel bzw. mittlere Maximalpegel an dem Pegel, der als Grenzwert fr Schlafstrungen in der Schallwirkungsforschung gefunden wurde (vgl. Kapitel IV.2). Da dieser Wert jedoch kein harter, metechnisch exakt bestimmbarer Pegel darstellt, knnen die entsprechenden Schallschutz-Bestimmungen auch diesen Pegel nicht rechtlich bindend vorschreiben. Als Anhaltswert ist dieser Wert dagegen sicher sinnvoll. Weitere Richtlinien fr beispielsweise Schienenverkehr, Luftverkehr, Industrie-, Gewerbe- und Freizeitanlagen, fr den Arbeitsplatz und fr haustechnische Anlagen finden sich im Taschenbuch der technischen Akustik (Heckl/Mller, 1994).

V.2 Schalldmmung
In diesem Abschnitt wollen wir uns mit Lrmschutzmanahmen beschftigen, die entweder auf eine Dmmung des Luftschalls (d. h. des von der Schallquelle zum mglichen Empfnger direkt ber den Luftweg bertragenen Schalls) abzielen oder auf eine Verminderung des Krperschalls (d. h. des Schallanteils, der mit Hilfe von schwingenden Krpern wie z. B. Decken und Wnden an den Ort des Empfngers gelangt).

V.2.1 Luftschalldmmung
Um eine Schallbertragung zwischen Schallquelle und Empfnger ber Luftschall zu verhindern, wird blicherweise eine mehr oder weniger schalldichte Wand angebracht, die den direkten Schallweg unterbricht. Die Schalldmmung dieser Wand oder darin enthaltener Elemente (z. B. Fenster und Tren) kann mittels eines bauakustischen Prfstandes wie folgt ermittelt werden:

Abbildung 5.2: Bauakustischer Prfstand zur Messung der Schalldmmung

124

Lrmbekmpfung, Schalldmmung und Schalldmpfung

Von dem Lautsprecher im Raum 1 wird ein Testsignal abgestrahlt, dessen Pegel L1(f) (z. B. als Funktion der Frequenz mit Hilfe eines Terz-BandFilters) gemessen wird. Ebenso wird der Pegel L2(f) in Raum 2 (ggf. frequenzabhngig) gemessen. Als Luftschalldmm-Ma R (in dB) ergibt sich dann folgende Gre: S A

R' = L1 (f ) L 2 (f ) 10 log

(V.7)

Dabei bezeichnet S die Oberflche des Testobjekts und A die quivalente Absorptionsflche des Empfangraums. Um eine mglichst hohe Megenauigkeit zu erzielen, ist der Empfangsraum meist als Hallraum ausgefhrt und die quivalente Absorptionsflche lt sich aus der Nachhallzeit dieses Hallraums berechnen. Dieser letzte Faktor (10log S/A) soll den Einflu der akustischen Eigenschaften des Empfangsraums weitestgehend eliminieren. Um von diesem gemessenen Luftschalldmm-Ma auf eine realistische Eigenschaft schlieen zu knnen (z. B. wie gut eine Wandkonstruktion sich im Gegensatz zu konventionellen Wnden fr den Schallschutz eignet) wird das bewertete Schalldmm-Ma Rw durch Vergleich mit einer Sollkurve ermittelt. Diese Sollkurve ist das Luftschalldmm-Ma einer verputzten Ziegelwand und ist in unten stehender Abbildung als durchgezogene Linie gekennzeichnet. Dieses Sollkurve wird nun solange vertikal verschoben, bis die gemessene Kurve eine mittlere Unterschreitung von 2dB aufweist, d. h.:

mittlere Unterschreitung =

Pegel
Zahl der Frequenzen

! 2dB

(V.8)

Die Luftschalldmmung des zu bewertenden Bauteils darf also an vielen Stellen besser sein als die verschobene Sollkurve, darf aber nur um den Wert von 2 dB im Durchschnitt schlechter sein. Als bewertetes Schalldmm-Ma Rw ergibt sich nun der Wert R bei 500 Hz der verschobenen Sollkurve. Das bewertete Schalldmm-Ma behandelt demnach einen beliebigen Frequenz-Verlauf des Luftschalldmm-Ma in hnlicher Weise wie den Frequenz-Verlauf einer verputzten Ziegelwand.

Lrmbekmpfung, Schalldmmung und Schalldmpfung

125

Abbildung 5.3: Bestimmung des bewerteten Schalldmm-Maes RW

Ein qualitatives Verstndnis ber die Luftschalldmmung von Wnden kann man durch Betrachtung der Schalldmmung an homogenen Platten beginnen, die in folgender Abbildung schematisch dargestellt ist:

Abbildung 5.4: Luftschalldm-Ma aufgetragen ber das Produkt der Frequenz und Dicke

Dargestellt ist das Luftschalldmm-Ma als Funktion des Produkts aus Frequenz f und Dicke d der Platte, die ein Flchengewicht m aufweisen soll. Bei diesem Frequenzgang kann man drei Bereiche unterscheiden: a) Bei tiefen Frequenzen betrgt R: f m'' R = 20 log 3 dB c

(V.9)

126

Lrmbekmpfung, Schalldmmung und Schalldmpfung

Dabei bezeichnet c den Wellenwiderstand von Luft und f die Frequenz, so da fr die Gre von R bei tiefen Frequenzen ausschlielich die Flchendichte m entscheident ist. Fr diese niedrigen Frequenzen gilt also der Leitsatz: die Masse machts. b) Mit zunehmender Frequenz tritt die Platte in Resonanz mit der anregenden Schwingung, so da die Schalldmmung verschlechtert wird. Diese Resonanz tritt bei der Frequenz fg auf mit: c2 fg = 2 m'' 1 6.4 104 P Hz B d E

(V.10)

Dabei bezeichnet E den Elastizitt-Modul und p das spezifische Gewicht der Platte. c) Oberhalb der Resonanz-Frequenz wird die Platte nicht mehr wesentlich zu Schwingungen angeregt, so da eine bessere Schalldmmung mit zunehmenden Frequenzen resultiert (ca. 25dB / Dekade). Dies entspricht der bauakustischen Realitt, da hohe Frequenzen besser und leichter gedmpft werden knnen als niedrige. Hier berechnet sich das Schalldmm-Ma R zu: fg f m'' 1 dB 10 log R = 20 log c 2 f

(V.11)

Dabei bezeichnet einen vom Plattenmaterial abhngigen Verlustfaktor. Neben der oben bereits besprochenen Verbesserung der Schalldmmung durch eine hhere Masse kann auch eine Verbesserung durch mehrschalige Bauweise erreicht werden, in dem der Schall mehrere ImpedanzSprnge passieren mu (mit entsprechenden Reflexions- und Absorptionsverlusten). Als Prototyp einer doppelschaligen Bauweise sei hier die federnde Verbindung zwischen zwei Platten der Massendichte m1 und m2 aufgefhrt, die mehr oder weniger stark miteinander gekoppelt sind.

Lrmbekmpfung, Schalldmmung und Schalldmpfung

127

Abbildung 5.5: Prototyp (schematisch) einer doppelschaligen Bauweise

Im Vergleich zur einschaligen Bauweise weist diese zweischalige Bauweise bei tiefen Frequenzen eine Verschlechterung auf, weil eine Resonanz zwischen den beiden Massen der Schalung und der dazwischen bei niedrigen Frequenzen als Feder wirkenden Verbindung auftritt. Weil die gesamte Konstruktion bei dieser relativ niedrigen Resonanz-Frequenz mitschwingen kann, resultiert also zunchst eine Verschlechterung der Schalldmmung. Mit zunehmender Frequenz wird die SchalldmmWirkung jedoch hher, hat allerdings bei der bereits fr einschalige Dmmung beschriebenen Resonanz-Frequenz fg wiederum ein Minimum. Bei dieser Frequenz schwingen die beiden Schalungen nicht mehr gegeneinander (wie bei der niedrigen Resonanz mit der Frequenz fR), sondern sie schwingen unabhngig voneinander jeweils mit der Resonanzfrequenz fg. Insgesamt kann eine Verbesserung der Luftschalldmmung durch folgende Manahmen erreicht werden: Zunchst ist eine luftdichte Abdichtung zwischen den voneinander akustisch zu trennenden Rumen notwendig, weil schon relativ kleine Luftffnungen zu einem relativ guten Schalldurchgang fhren. Dieses Phnomen kann auch bei Tren beobachtet werden, die bei vollstndiger ffnung den Schall nur geringfgig besser passieren lassen als bei fast vollstndiger Schlieung (mit einem Luftspalt). Erst wenn die ffnung sehr klein ist (z. B. Schlsselloch) wird eine ausreichende SchalldmmWirkung erreicht, obwohl es noch immer die sprichwrtliche Mglichkeit zum Abhren durch das Schlsselloch gibt!

128

Lrmbekmpfung, Schalldmmung und Schalldmpfung

Durch Vergrerung der Dicke bzw. Vergrerung der Masse der Trennwand kann die Dmmung verbessert werden (s. o.). ein mehrschichtiger Aufbau der Dmmung bewirkt ebenfalls bei gleicher Gesamtmasse ber einen groen Frequenzbereich eine Verbesserung der Schalldmm-Wirkung. Um einen Anhaltspunkt ber die in der Realitt bei verschiedenen Wandausbauten erreichtbaren Schalldmm-Werte zu informieren sei folgende Tabelle (aus Heckl/Mller, 1993) angegeben:

Verbindung Wandaufbau, Schalen Holzspanplatte, Gipskartonplatten Gipskartonplatten Gipskartonplatten Gipskartonplatten 2 Lagen Holzspanplatten (innenseitig beschwert mit 1mm Bleiblech) 5cm HolzwolleLeichtbauplatten, verputzt keine 140 ber Holzstiele 80 zwischen den Schalen ber Holzstiele ber gemeinsame Blechstnder keine (getrennte Stnder) keine (getrennten Stnder) Dicke mm 80...100 125 125 155

Flchengewicht kg/m
2

bewertetes Schalldmm-Ma RW in dB 37...40 49 52 60 RW in dB 37...40 48 50 55

20...25 30 30 52

35...40

48

47

85

60

55

V.2.2 Krperschalldmmung
Um die Krperschallbertragung von einem Raum zu einem anderen Raum messen zu knnen, wird der Krperschall im Senderaum mit einem Trittschallgeber angeregt, d. h. einem Hammerwerk mit 5 Hmmern 500 g, die mit einer Frequenz von 10 Hz aus einer Hhe von jeweils 4 cm auf den Boden auftreffen. Im Empfangsraum wird dann der auftretende Schallpegel mit einem Schallpegelmesser gemessen und in den NormTrittschallpegel umgerechnet, in dem der Einflu von SchallabsorptionsMaterialien im Empfngerraum eliminiert wird:

Lrmbekmpfung, Schalldmmung und Schalldmpfung

129

LN = L + 10 log

A A0

(V.12)

Abbildung 5.6: Messung der Krperschallbertragung von einem Raum zu einem anderen

Dabei bezeichnet A die effektive Absorptionsflche im Empfngerraum (sie kann z. B. anhand der Nachhallzeit des Raums bestimmt werden) und A0 eine Referenz-Absorptionsflche, die mit 10 qm festgelegt wurde. Diese Definition ist quivalent zur Bestimmung des Luftschalldmm-Maes (vgl. Formel V.7). Um wiederum eine Bewertung des aufgenommenen Normtrittschallpegels mit realistischen Trittschalldmm-Maen zu erreichen, wird genau wie bei der Luftschalldmmung das aufgenommene Schalleistungsspektrum mit einer Sollkurve verglichen, die der Krperschalldmmung einer Decke entspricht, die aus einer 12 cm dicken Betonschicht mit einer daraufliegenden 2,4 cm dicken Holzdielenschicht mit Lagerung besteht.

Abbildung 5.7: Bestimmung des bewerteten Norm-Trittschallpegels

Die Sollkurve wird nun soweit verschoben, bis die mittlere Unterschreitung der Sollkurve (d. h. der Betrag der Unterschreitung gemittelt ber mehrere

130

Lrmbekmpfung, Schalldmmung und Schalldmpfung

Frequenzen) kleiner oder gleich 2 dB ist. Als bewerteter NormTrittschallpegel LNW wird dann der 500 Hz-Wert der verschobenen Sollkurve bezeichnet. In der nachfolgenden Tabelle sind einige praktisch erreichbare bewertete Norm-Trittschallpegel aufgefhrt. Dabei ist zu bercksichtigen, da es sich um Pegel und nicht um Dmmae handelt, d. h. die Krperschalldmmung nimmt mit abnehmendem Normtrittschallpegel zu:

LNW Massive Rohdecke (ohne Belag) Maximal zulssig bei Wohnbauten (DIN 4109) Grenzwert fr gehobenen Trittschallschutz Maximal praktisch erreichbar 73...83 53 46 40

Eine Verbesserung der Krperschalldmmung (bzw. Trittschalldmmung) kann durch die Verwendung von weichen Bodenbelgen erreicht werden, die einen Teil der kinetischen Anregungsenergie bereits abdmpfen und damit verhindern, da berhaupt viel Trittschall erzeugt wird. Weiterhin ist ein mehrschichtiger Aufbau von Decken sinnvoll, der allerdings eine unterschiedliche Fortleitung von Krperschall in den einzelnen Schichten als Voraussetzung hat. Dies wird z. B. beim sogenannten schwimmenden Estrich angestrebt, bei dem auf die Beton-Rohdecke eine schallweiche, elastische Schicht (Trittschall-Dmmatten, spezielle Polymerwerkstoffe, z. B. Elastomer) gelegt wird. Auf diese Schicht wird eine weitere Betonschicht als schwimmender Estrich aufgebracht. Dabei ist darauf zu achten, da es keine starre Verbindung zwischen dem Estrich und der Betondecke bzw. der fest mit der Betondecke verbundenen Wand gibt. Jede dieser dabei auftretenden Schallbrcken wrde zu einer drastischen Reduktion der Krperschalldmmung fhren, die den gesamten betriebenen Aufwand zunichte macht.

Abbildung 5.8: Aufbau des "schwimmenden Estrichs

Die grte Dmmwirkung wird oberhalb der Resonanzfrequenz der Konstruktion erreicht, bei der die Estrich-Schicht in Gegenphase mit der Betondecke schwingt, die durch die bei niedrigen Frequenzen als federwir-

Lrmbekmpfung, Schalldmmung und Schalldmpfung

131

kende Trittschalldmmatte gekoppelt sind (vgl. Resonanzfrequenz fR bei doppelschaligem Wandaufbau). Diese Resonanzfrequenz betrgt: s [ Hz] m e

fR = 160

(V.13)

s bezeichnet dabei die dynamische Steifigkeit der Dmmschicht (in 3 3 MN/m ), me bezeichnet das Flchengewicht des Estrichs (in kg/m ). Die Trittschallminderung fr Frequenzen weit oberhalb der Resonanzfrequenz fR betrgt damit: L = 40 log f [dB] fr f >> fR fR

(V.14)

Ein hnliches Prinzip wird auch bei der Krperschalltrennung von Gebuden (z. B. Einfamilien-Reihenhusern) angewendet, bei denen zwischen den jeweiligen aneinandergrenzenden Auenmauern eine kleine Luftschicht gelassen wird, die eine krperschall-technische Entkopplung beider Huser bewirken soll. Sobald jedoch eine auch sehr geringgradige schallharte Verbindung auftritt (z. B. durch Kieselsteine, die zwischen den beiden Wnden liegen und zu beiden Seiten Kontakt haben) ist der gesamte Krperschalldmmeffekt fast vollstndig verschwunden. Dieses Beispiel mag illustrieren, wie schwierig eine suffiziente Krperschalldmmung in der Bauakustik praktisch durchgesetzt werden kann.

V.3 Schallabsorption
Whrend wir uns in den vorangehenden Abschnitten mit dem Durchgang von Schall durch verschiedene Bauelemente beschftigt haben, soll im folgenden die Schallabsorption betrachtet werden, d. h. die bei der Reflexion des Schalls an begrenzenden Flchen auftretenden Leistungsverluste. Dabei betrachten wir den allgemeinen Fall, da der Schall vom Medium 1 (Luft) mit dem Wellenwiderstand Z1 auf das Medium 2 (z. B. eine porse Wand bzw. ein Schallabsorber) mit dem Wellenwiderstand Z2 auftriftt.

132

Lrmbekmpfung, Schalldmmung und Schalldmpfung

Abbildung 5.9: Schallreflexion an einer absorbierenden Wand

Fr das Verhltnis aus reflektiertem zu einfallenden Schall errechnet sich der Reflexionsfaktor r, der im allgemeinen komplex sein kann:
Z 2 Z1 , Z1 + Z 2 1- r Z1 = 1+ r Z 2

r=

(V.15)

r ist rein reell, wenn durch die Reflexion an der Wand kein Phasensprung bzw. nur ein Phasensprung von 180 Grad erzeugt wird. Falls jedoch die Wandimpedanz Z 2 =
p2 v2 = W neben dem Amplitudensprung auch einen

Phasensprung verursacht, ist r komplex. Als Absorptionsgrad der Wand wird der Prozentsatz der einfallenden Schalleistung bezeichnet, der an der Wand absorbiert wird. Man definiert also den Absorptionsgrad :

= 1 r =
2

(W'+ Z1 )2 + (W'')2

4 W'Z1

(V.16)

Diejenigen (komplexen) Werte von Z2, die zu dem gleichen Absorptionsgrad fhren, werden in der komplexen Ebene (Z2 = W + iW) durch Kreise (apollonische Kreise) gekennzeichnet: r = const. W Z1 = W + Z1 const. (V.17)

Lrmbekmpfung, Schalldmmung und Schalldmpfung

133

Abbildung 5.10: Kurven gleichen Absorptionsgrades fr verschiedene komplexe Wandimpedanzen W = W' i W''

Um die Eigenschaften von Absorbern besser verstehen zu knnen, soll zunchst das grundlegene Prinzip von Absorbern erlutert werden. Die Grundidee ist, da die Schallenergie in Wrme umgewandelt wird, indem die Teilchenbewegung vor dem Absorber eine Schwingung in den Poren des Absorbers anregt, bei der aufgrund der hohen inneren Reibung viel Energie bertragen wird.

Abbildung 5.11: Funktionsprinzip eines porsen Absorbers

Wenn vor dem Absorber die Schallschnelle va herrscht, dann soll in der v Grenzflche des Absorbers die Schallschnelle vi = a auftreten, wobei die Porsitt bezeichnet, d. h. den Anteil der Poren-ffnungsflche an der Gesamtflche. Als Wandimpedanz berechnet sich fr eine unendlich dicke porse Schicht: c 1 i ' VPor VGesamt

W1 =

(V.18)

(V.19)

134

Lrmbekmpfung, Schalldmmung und Schalldmpfung

Die Porositt eines Krpers kann durch folgende Meanordnung bestimmt werden, bei der ein Volumen V1 einmal in Abwesenheit und zum anderen in Gegenwart des porsen Krpers komprimiert wird. Dabei tritt jeweils die Volumennderung V und eine Drucknderung p in beiden Fllen auf:

Abbildung 5.12: Zur Definition der Porsitt eines Krpers mit Volumen V2

p1 = p 0 p 2 = p 0

V V1 V V1 V2 (1 ) p V1 1 1 p2 V2 (V.20)

= 1-

Die Gre in Gleichung V.18 bezeichnet die dynamische Viskositt des Mediums (in diesem Falle der Luft), die sich aufgrund folgender Gleichung ergibt:

(V.21)

Dabei wird ein Krftegleichgewicht zwischen den auf ein Volumenelement einer zhen Flssigkeit in einem engen Rohr angreifenden Krften angenommen. Unter der Annahme, da die Poren sehr eng sind und deshalb die Beschleunigungs-Komponente (d. h. die Geschwindigkeitsnderung in x-Richtung) vernachlssigt werden kann, ergibt sich fr die Strmungsgeschwindigkeit v einer laminaren Strmung in x-Richtung als Funktion der Position y im Rohr die Geschwindigkeit: 4 y2 2 v = v max 1 2 , v = v max b 3

(V.22)

Lrmbekmpfung, Schalldmmung und Schalldmpfung

135

wobei b die Breite des Rohres und vmax die maximale Strmungsgeschwindigkeit angibt, whrend v die Durchschnittsgeschwindigkeit im Rohr angibt. Unter der Annahme, da die Strmungsgeschwindigkeit in den Poren vi betrgt und die entsprechende Geschwindigkeit auerhalb des Krpers (vor den Poren) va betrgt, folgt damit fr die Drucknderung mit der Eindringtiefe x

(V.23)

dp und va kann auch durch den spezifidx schen Strmungswiderstand (Strmungskennwiderstand ) bezeichnet werden, also: Diese Proportionalitt zwichen dp va dx

Mit diesem spezifischen Strmungswiderstand und unter Zugrundelegung eines Strukturfaktors , der 1 ist, kann nun der Frequenzparameter definiert werden, der in Gleichung V.18 auftrat:

' =

(V.24)

Dieser Frequenzparameter beschreibt anschaulich das Verhltnis des eingeschlossenen Luftvolumens zum an der Schallschwingung teilnehmenden Luftvolumen. Aufgrund der Frequenzabhngigkeit des Frequenzparameters ergibt sich folgende Frequenzabhngigkeit fr eine unendlich dicke Wand bzw. eine porse Wand endlicher Dicke:

136

Lrmbekmpfung, Schalldmmung und Schalldmpfung

Abbildung 5.13: Absorptionsgrad als Funktion der Frequenz fr verschiedene absorbierende Wnde

Der Absorptionsgrad der porsen Wand endlicher Dicke ist zu niedrigen Frequenzen hin kleiner, weil die Wandimpedanz aufgrund der inneren Reibung nicht so gut an die Impedanz des ueren Mediums angepat ist, so da Reflexionen auftreten und der Absorptionsgrad entsprechend geringer wird. Eine weitere Mglichkeit zur Schallabsorption kann durch das Anbringen eines porsen Vorhanges mit einem bestimmten Abstand von der (mehr oder weniger stark reflektierenden) Wand erreicht werden. Fr diesen Fall ist die Absorption immer maximal, wenn der porse Vorhang genau in einem Schnelle-Maximum liegt, so da mglichst viel Schallenergie durch innere Reibung im porsen Vorhang umgewandelt wird. Da aufgrund der schallharten Reflexion an der dahinterliegenden Wand dort ein Druckknoten entsteht, ist dieses Absorptionsmaximum immer dann erreicht, wenn der Abstand gleich /4 betrgt (z. B. fr f = 100Hz tritt das Absorptions-Maximum fr d = 85 cm auf).

Abbildung 5.14: Anordnung eines porsen Vorhangs mit Wandabstand zur Schallabsorption

Lrmbekmpfung, Schalldmmung und Schalldmpfung

137

Abbildung 5.15: Frequenzgang des Absorptionsgrades fr die Anordnung aus Abbildung 5.14

Fr die maximal dabei erreichbare Absorption max gilt: 4 b c

max =

( b + c)2

(V.25)

= 1, falls b = c Dabei bezeichnet b die Dicke des Vorhanges. Das Problem beim Anbringen des porsen Vorhanges vor der Wand sind die notwendigen, aber leider relativ groen Abstnde zur Wand, die sich insbesondere bei kleinen Rumen verbieten. Eine Mglichkeit, diese Abstnde zu verringern,besteht darin, einen (komplexen) Impedanz-Sprung kurz vor der Wand einzufhren, so da die Resonanz-Bedingung (absorbierendes Material im Abstand /4 von der Wand entfernt) schon bei kleineren Abstnden erfllt ist. Diese Idee liegt den weit verbreiteten Resonanz-Absorbern zugrunde, dies sich typischerweise als Form von Lochabsorberplatten an Decken oder Wnden von ffentlichen Gebuden befinden. Dabei wird im Abstand d von der Wand eine Loch-Platte mit den Lochdurchmessern 2a und dem (mittleren) Abstand zwischen benachbarten Lchern e angebracht, die eine Dicke l0 aufweist. Das porse, absorbierende Material mte sich streng genommen vor der Lochplatte befinden, aus praktischen Grnden ist es jedoch zwischen der Lochplatte und der schallharten Wand angebracht, was bei entsprechender Abstimmung der Platten einen vergleichbaren Effekt bringt.

138

Lrmbekmpfung, Schalldmmung und Schalldmpfung

Abbildung 5.16: Anordnung von Lochabsorber-Platten

Der Absorptionsgrad erhlt damit die folgende Form:

Abbildung 5.17: Absorptionsgrad von Lochabsorber-Platten

Die maximale Absorption tritt dabei bei der Resonanz-Frequenz k 0 = auf. m bezeichnet dabei die scheinbare akustische d m'' Massenbelegung der Lochplatte, d. h. m'' = (l 0 + 1,6a ) e2 a2

(V.26)

und die dabei auftretende akustische Steifigkeit wird durch das Verhltnis aus Kompressionsmodul k und den Wandabstand d hervorgerufen. Mit diesen beiden Gren tritt bei der Frequenz 0 eine Resonanz auf (d. h. maximale Schnelle am Ort der Lochplatten), so da bei dieser Frequenz am meisten Verluste in den dahinterliegenden porsen Absorber auftreten und die maximale Absorption der Lochplatten-Absorber erreicht werden kann. Trotz ihrer beschrnkten Abmessungen wird daher auch bei niedrigen Frequenzen mit diesen Elementen eine relativ gute Schalldmmung erreicht.

Raum- und Bauakustik

139

VI Raum- und Bauakustik


In der Raumakustik beschftigt man sich mit der Ausbreitung von Schall in Rumen und den Eigenschaften der dabei auftretenden Schallfelder. Dieses Gebiet ist wichtig, um die Geometrie und Ausstattung eines Raumes an die jeweiligen Erfordernisse anzupassen, z. B. fr die Nutzung als Konzertsaal, als Konferenzraum oder als Sprecherstudio. In der Bauakustik versucht man dagegen, die akustische Isolierung von Rumen in einem Gebude gegeneinander zu beschreiben und zu verbessern und die Auswirkung von baulichen Gegebenheiten auf die Ausbreitung von Schallwellen im Gebude und im jeweiligen Raum zu beherrschen.

VI.1 Wellenakustik in Rumen


Bei der Ausbreitung von Schallwellen in begrenzten Rumen treten aufgrund der Reflexionen an den Wnden stehende Wellen auf, die bei bestimmten Frequenzen zu einer resonanzfrmigen Anregung des Raumes fhren knnen (d. h. wenn beispielsweise ein ganzzahliges Vielfaches von halben Wellenlngen zwischen zwei parallel zueinander stehenden Wnden pat). Diese speziellen Schwingungsformen im Raum werden als Eigenmoden des Raumes bezeichnet, die bei bestimmten Resonanzfrequenzen auftauchen. Beispielsweise treten bei einem quaderfrmigen Hohlraum mit schallharten Wnden und den drei Dimensionen l1, l2, l3 (Schuhkarton) die folgenden Eigenmoden auf: n1 x n y n z cos 2 cos 3 l1 l2 l3
2

n = cos

(VI.1)

n n c n fn = 1 + 2 + 3 2 l1 l2 l3

(VI.2)

n bezeichnet dabei das Schallpotential, aus dem Schalldruck und -schnelle durch Differentiation bzw. Gradientenbildung hervorgehen; n1, n2 und n3 bezeichnen die Kennziffern der Mode, d. h. die Anzahl der Knotenlinien, die in x-, y-, bzw. z-Richtung in dem Raum auftreten. Die Resonanz-Frequenzen fn sind bei tiefen Frequenzen relativ selten, ihre Dichte nimmt jedoch bei hohen Frequenzen stark zu. Je weniger absorbierend die Wnde und die Luft in dem Raum sind, desto strker ausgeprgt sind die Raumresonanzen und umso entscheidender ist es fr die Ausbreitung einer bestimmten Schallwelle, ob sie genau auf einer Resonanz-Frequenz liegt oder nicht. Diese exakte Bestimmung des Schallfeldes durch die Randbedingungen macht eine Analogie zur Quantenmechanik (Teilchen

140

Raum- und Bauakustik

in einem abgeschlossenen Kfig mit quantisierten Energiezustnden) mglich, die hier aber nicht weiter vertieft werden soll. In der Realitt tritt diese Modenstruktur jedoch nicht so ausgeprgt auf, weil schon kleinste Abweichungen von der idealen Geometrie und die zustzliche Einfhrung von kleinsten Strungen im Schallfeld bereits zu einer starken Vernderung der Modenstruktur fhren. Damit lassen sich die auftretenden Moden nicht mehr deterministisch berechnen, sondern es lt sich nur noch Statistik ber die Modendichte und die Art der Moden fhren (statistische Raumakustik). Beispielsweise betrgt die Modendichte N im Frequenzbereich f fr eine beliebige Raumgeometrie N = V f 2 4 f c3

(VI.3)

Die statistische Anwesenheit von Moden fhrt zu einer stark schwankenden Raumbertragungsfunktion als Funktion der Frequenz und als Funktion des Ortes. Sie schwankt typischerweise um etwa 10 dB und der Abstand benachbarter Maxima f betrgt etwa: f 4 T

(VI.4)

Wobei T die Nachhallzeit des Raumes bezeichnet, d. h. die Zeit, in der die im Raum eingespeiste Schallenergie um 60 dB abgeklungen ist.

Abbildung 6.1: Schema einer im Mittel um ca. 10 dB schwankenden Raumbertragungsfunktion

VI.2 Statistische Raumakustik


Neben der statistisch schwankenden Raumbertragungsfunktion sind auch die zeitlichen Eigenschaften der Schallausbreitung in Rumen von

Raum- und Bauakustik

141

Bedeutung, die ebenfalls einer statistischen Betrachtung bedrfen. Fr die Berechnung der Raumimpulsantwort (d. h. des Schalldruckverlaufs an einem bestimmten Ort im Raum als Funktion der Zeit, wenn an einem anderen Ort im Raum eine -frmige akustische Welle ausgesandt wird) kann z. B. die sogenannte Spiegelschallquellenmethode verwendet werden. Bei ihr wird die Reflexion eines Schallstrahls an einer Wand dadurch beschrieben, da der Raum an dieser Wand gespiegelt wird und die reflektierte Schallwelle scheinbar von einer Spiegelschallquelle in diesem reflektierten Raum zustande kommt, von der aus eine geradlinige Schallausbreitung auf den Empfnger hin erfolgt.

Abbildung 6.2: Spiegelschallquellmethode (schematisch): Bei Empfnger E trifft neben dem Direktschall auch an den Wnden reflektierter Schall ein, dessen Weg durch Spiegelung des Raumes an den Grenzflchen gut beschrieben werden kann.

Die n-te Reflexion wird daher durch Spiegelsender aus dem n-fach gespiegelten Raum reprsentiert. Unter der Annahme eines quaderfrmigen Raums, der an allen sechs Wnden eine Spiegelung zult (d. h. nicht schallabsorbierend ausgekleidet ist), werden die ersten Reflexionen durch Spiegelschallquellen in den sechs dem ursprnglichen Quader benachbarten Quader reprsentiert. Zur Reprsentation der zweifachen Spiegelung mssen wiederum die Rume als Spiegelrume angefhrt werden, die aus Spiegelungen der sechs Rume der ersten Generation hervorgehen. Wenn man diese Konstruktion fortsetzt, passen smtliche Spiegelschallquellen, von denen zum Zeitpunkt t Reflexionen an den Empfnger einfallen, in eine Kugel mit dem Radius R = ct (c: Schallgeschwindigkeit). Die Energiedichte En des zur Zeit t eintreffenden Impulses (ohne Bercksichtigung von Verlusten) mte demnach betragen: 1 P 2 4R c

En =

(VI.5)

142

Raum- und Bauakustik

P bezeichnet dabei die gesamte abgestrahlte Leistung. Die Anzahl N der Impulse, die bis zum Zeitpunkt t beim Empfnger eintreffen, berechnet sich dabei aus dem Volumen einer Kugel mit dem Radius R = ct geteilt durch das Volumen des Raumes V, also: 4 3 (ct ) N= 3 V

(VI.6)

Die Impulsdichte, d. h. die Anzahl der Impulse N, die im Zeitintervall t beim Empfnger eintreffen, berechnet sich aus der Ableitung von VI.6 zu: 4 (ct ) c t V
2

N =

(VI.7)

Abbildung 6.3: Schematischer Verlauf der Raumimpulsantwort nach der Spiegelschallquellenmethode

Als Asymptote E ergibt sich dann nach unendlich langer Zeit das Produkt aus Anzahldichte und Energie pro Impuls zu: 4 (ct ) P/c P c t = t 2 V V 4 (ct )
2

E = E n N =

(VI.8)

Dieses Ergebnis spiegelt die Annahme wieder, da keine Energie verloren geht und beschreibt die Tatsache, da gegen Ende des Nachhallvorgangs smtliche einmal eingestrahlte Schallenergie in statistischer Weise auf einen Raum mit dem Volumen V verteilt ist, so da keine weitere Abnahme (oder etwa Zunahme) der Energiedichte am Empfngerort zu erwarten ist. Obwohl dieser Fall hypothetisch ist, beschreibt er relativ gut den Endzustand eines realen Nachhallprozesses, bei dem nach dem Eintreffen

Raum- und Bauakustik

143

der ersten (deterministischen) Reflexionen (von den verschiedenen Wnden und den ersten Spiegelschallquellen) der Nachhall eher durch eine statistische Anordnung von weiteren Reflexionen gekennzeichnet ist, die in den Rauschuntergrund bergehen. In der Realitt tritt jedoch Absorption auf, die zu einem endlichen Nachhallvorgang mit einem exponentiellen Abfall der Gesamt-Energie fhrt: E = E 0 10 6 t / T (VI.9)

Dabei bezeichnet T die Nachhallzeit d. h. die Zeit, in der die Schallenergie um 60 dB abgeklungen ist. Diese zunchst willkrlich erscheinende Definition beruht auf den historischen Untersuchungen von W. C. Sabine, der schon ca. 1900 raumakustische Messungen durchgefhrt hat. Er definierte die Nachhalldauer als die Zeit, in der ein von einem Knall ausgelster Nachhallvorgang in einem Raum noch hrbar ist. Aufgrund der Dynamik des Ohres und der begrenzten maximalen Energie, die mit Knallquellen in einem Raum erzeugt werden kann (z. B. mechanische Klappe, Knallfunkengenerator, Pistolenschu) betrgt der Dynamikbereich zwischen der Schallanregung und der Hrschwelle etwa 60 dB, so da die von Sabine definierte Nachhalldauer sehr gut mit der exakt definierten Nachhallzeit bereinstimmt. Die von Sabine empirisch angegebene Formel fr die Nachhallzeit beschreibt ihre Abhngigkeit vom Raumvolumen V und der effektiven Absorptionsflche A folgendermaen:
3 24 ln10 V 0,163 V m = c A A m2

T=

[ ] [ ]

[s ]

(VI.10)

Die Gre A wird als quivalente offene Fensterflche bezeichnet, d. h. als die Flche, auf die man smtliche absorbierenden Flchen unterbringen knnte, wenn sie den Absorbtionsgrad = 1 aufweisen wrden, d. h. A = Si i (VI.11)

(Si = Gre der i-ten Flche des Raumes mit der Absorption i). Eine heuristische Herleitung dieser Nachhallformel folgt aus der Annahme, da die ber den gesamten Raum verteilte Energiedichte E mit dem Exponenten 2 abnimmt also:

144
d (VE) = 2 (VE) , mit E = E o e 2 dt

Raum- und Bauakustik

(VI.12)

Fr diesen Abklingkoeffizienten ergibt sich durch Integration ber den Raumwinkelbereich, aus dem die Energie auf die Flche Si einfllt, ein Wert von (vgl. Cremer, Hubert, Kap. 3.2): cA 4V

2 =

(VI.13)

Wenn noch zustzlich die Dissipation von Schall in Luft mit der Abklingkonstante angenommen wird, gilt also fr die reine Dissipation in Luft: E = E 0 e 2ct so da fr die Gesamt-Abklingkonstante 2 gilt: A 2 = c + 2 4V 0,163V A + 8V (VI.14)

(VI.15)

T=

(VI.16)

Diese Formel wurde von V. O. Knudsen in die Raumakustik eingefhrt und stellt eine bessere Nherung fr realistische Rume dar als die Formel nach Sabine. In beiden Formeln ist jedoch eine gleichmige Verteilung der Absorption ber den gesamten Raum vorausgesetzt und eine Gleichverteilung der Energie auf alle Raumeinfallsrichtungen (diffuses Schallfeld). In der Realitt knnen jedoch erhebliche Abweichungen aufkommen, wenn beispielsweise nur eine Flche absorbierend ausgekleidet ist und die anderen Flchen nicht absorbierend oder wenn die gleiche Absorberflche im ersten Fall nur auf einer Wand und im anderen Fall auf smtliche Wnde verteilt ist. Dabei knnen erhebliche Abweichungen von den (empirischen) Nachhallformeln von Knudsen und Sabine auftreten, die sich z. B. durch numerische Simulationen der Raumakustik erst gut erklren lassen. Durch verschiedene Techniken des Ray-Tracing ist es heute mglich, die Raumakustik (insbesondere die Nachhallzeit) bei vorgegebener Raumgeometrie und vorgegebenen Absorbtionsgraden der einzelnen Flchen sehr gut vorherzusagen (vgl. Kuttruff, Roomacoustics). Ein weiterer wichtiger Parameter zur Beschreibung der Eigenschaften des

Raum- und Bauakustik

145

Schallfeldes in einem realen Raum ist der Hallradius, d. h. der Radius des Umkreises um eine Schallquelle, in dem der Direktschallanteil grer ist als der Anteil des Nachhall-Schallfeldes. Innerhalb des Hallradius berwiegt damit der Eindruck des Direktschalls (z. B. mit einer hohen Sprachverstndlichkeit) whrend auerhalb des Hallradius das diffuse Nachhallfeld dominiert, das aufgrund der Verwrfelung der Zeitfunktion und der Korrelation des ursprnglichen Signals beispielsweise eine schlechtere Verstndlichkeit des Quellensignals bewirkt. Der Nachhallradius in Meters betrgt (gem Cremer, Hubert, 1992)

rH = 0,057

V m3 T[s]

[ ] [ m]

(VI.17)

Genau wie oben bezeichnet V dabei das Volumen des Raumes und T die Nachhallzeit (in Sekunden). Die optimale Nachhallzeit eines Raumes hngt von seiner gewnschten Eigenschaft ab: Ein reflexionsarmer Raum sollte eine Nachhallzeit von weniger als 0,01 sec. aufweisen, ein Konferenzraum, in dem eine gute Sprachbertragung mglich sein soll, sollte etwa Nachhallzeiten zwischen 0,5 und 1,5 sec. aufweisen, und Konzertsle sollten je nach der verwendeten Musik Nachhallzeiten zwischen 1,5 und 2,5 sec. (klassische Musik) bzw. 2-10 sec. (geistliche Musik) haben. Speziell fr die in Kirchen auftretenden Nachhallzeiten von mehreren Sekunden ist die geistliche Musik angepat, bei der langanhaltende, mit geringen Modulationsfrequenzen versehene Tne dominieren (z. B gregorianische Gesnge). Eine extreme Nachhallzeit tritt bei einem Hallraum auf, d. h. ein Raum mit mglichst geringgradig absorbierenden Wnden, der eine Nachhallzeit von grer als 10 sec. aufweisen sollte. Ein derartiger Hallraum wird u. a. fr die Messung des Absorptionsgrades von Schallabsorbern verwendet, weil das in ihm auftretende statistische Wellenfeld eine Mittelung ber smtliche mgliche Einfallsrichtungen des Schalls ermglicht. Neben der Nachhallzeit sind fr den (subjektiven) Wohlklang eines Raumes auch andere akustische Faktoren wichtig, deren Bedeutung in umfangreichen Studien (u. a. durch Simulation verschiedener Konzertsle, Kunstkopftechnik) eingehend untersucht wurde. Gem den Untersuchungen von M. R. Schroeder ist ein wichtiger subjektiver Faktor die interaurale (d.h. zwischen den Ohren auftretende) Ungleichheit der ersten den Zuhrer nach dem Direktschall erreichenden Reflexionen. D. h. die erste Reflexion sollte mglichst nicht von der Decke, sondern beispielsweise von der Seitenwand auf den Zuhrer einfallen, weil bei der Deckenreflexi-

146

Raum- und Bauakustik

on der gleiche Schall auf beide Ohren gelangt, whrend bei einer seitlichen Reflexion der Schall zeitversetzt die beiden Ohren des Zuhrers erreicht. Ein Ma fr die hnlichkeit der an beiden Ohren anliegenden Schallsignale ist die interaurale Kreuzkorrelation, die mglichst gering sein soll, um einen mglichst guten rumlichen Eindruck des Konzertsaals zu vermitteln. Diese Forderung steht allerdings im krassen Widerspruch zu der gngigen Praxis, groe Konzertsle mglichst breit und mit mglichst niedriger Decke zu bauen, um bei vorgegebenem Bauvolumen eine mglichst groe Anzahl von Personen unterbringen zu knnen. Dies fhrt zu einem subjektiv schlechten Klang von modernen, groen Konzertslen mit niedriger Decke, die im Vergleich zu historischen Slen mit relativ hoher Decke (Schuhkastenform, z. B. der Wiener Musikvereinssaal), wesentlich schlechter ausfallen. Eine Abhilfe bieten die von M. R. Schroeder vorgesehenen Phasendiffusoren auf der Basis der quadratischen Reste. Bei diesen als Schroeder-Diffusoren bezeichneten quadratischen RestDiffusoren wird beispielsweise an der Decke eines Konzertsaals reflektierendes Material mit einer Oberflchenstruktur angebracht, die eine Phasendrehung der einfallenden Schallwelle als Funktion des Ortes bewirkt, die gerade proportional zum Quadrat des Ortes (modulo einer Primzahl P) ist: rn = e 2in
2

/P

(VI.18)

Dabei bezeichnet n die rumliche Position des Reflektorblocks und P die verwendete Primzahl.

Abbildung 6.4: Schematische Bauform eines quadratischen-Restklasse Diffusors

Eine derartiger Diffusor zeigt ein breites Streuverhalten ohne Absorption der einfallenden Schallwelle. Ein weiterer Vorteil ist, da die spiegelnde Reflexion eliminiert wird, d. h. der auf die Decke fallende Schall wird in alle Richtungen zerstreut und nicht in die der geometrischen Akustik gehorchenden reflektierte Richtung geworfen.

Raum- und Bauakustik

147

Abbildung 6.5: Richtdiagramm (schematisch) der Reflexion des in Abbildung 6.4 dargestellten Diffusors bei Schalleinfall aus 0-Grad-Richtung

VI.3 Subjektive Raumakustik


Die subjektive Raumakustik beschftigt sich mit der Optimierung der Raumakustik anhand von (subjektiven) Aussagen der Hrer ber die empfundene Qualitt der Akustik. Ein derartiger Qualittsvergleich wird erst durch die Technik des direkten Vergleichs mglich (d.h. durch Hineinhren in verschiedene Konzertsle, Studios etc.). Zur technischen Realisierung dieses Vergleichs steht die Kunstkopftechnik, die Modelltechnik oder die digitale Simulation zur Verfgung. Bei der Kunstkopftechnik wird eine Aufnahme des Schallfeldes (z. B. eines Konzertes) im realen Raum mit einem Kunstkopf durchgefhrt, d. h. einer Kopfnachbildung mit nachgebildeten Auenohren, bei der anstelle der Trommelfelle Mikrophone angeordnet sind, um die akustische bertragung vom Freifeld zum wahrgenommenen akustischen Schall nachzubilden. Beim Abspielen dieser Kunstkopfaufnahmen ber Kopfhrer entsteht der Eindruck, da man sich an derselben Stelle in dem Raum befindet, wie bei der Aufnahme der Kunstkopf. Ein hnlicher Effekt kann durch die digitale Filterung eines trockenen (d. h. in einem reflexionsarmen Raum aufgenommenen) Musiksignals mit der Raumimpulsantwort erreicht werden, die bei Abstrahlen eines -Impulses von der Bhne mit einem Kunstkopf aufgenommen wurde. Auf diese Weise kann dasselbe Musiksignal beim Abspielen in unterschiedlichen Rumen nachgebildet werden, so da ein Vergleich der Rume unabhngig vom verwendeten Musiksignal mglich ist. Bei der Modelltechnik (beispielsweise im Mastab 1:10 oder 1:50 = 1/) wird dagegen die Berechnung bzw. Messung einer Raumimpulsantwort nicht von realen, sondern nachgebildeten Rumen mglich, was beispielsweise fr die Planungsphase eines Konzertsaals von groer Bedeutung ist. Dabei wird das akustische Signal (z. B. Musik) mit einem Frequenztransformator im Verhltnis 1: zu hheren Frquenzen transformiert und mit einem Miniatur-Lautsprecher im originalgetreu nachgebildeten Modellraum abgestrahlt. In diesem Modellraum befindet sich ein ModellKunstkopf (im selben Verkleinerungsmastab wie der Modellraum), mit

148

Raum- und Bauakustik

dem das Signal aufgenommen, im Frequenzverhltnis :1 heruntertransformiert und anschlieend ber Kopfhrer einer Beurteilungs-Person vorgespielt wird.

Abbildung 6.6: Beurteilung der Raumakustik durch die Modelltechnik

Der Vorteil dieser Methode liegt darin, da ein akustisches Design bereits vor Fertigstellung des realen Gebudes erfolgen kann und der Einflu etwaiger Modifikationen des Baues direkt abgeschtzt werden kann. Der Nachteil dieser Methode ist der relativ hohe Aufwand bei der Erstellung des Modells, die zumeist falschen Reflexionseigenschaften der Materialien im verwendeten hheren Frequenzbereich und die falsche Dmpfung der Luft im Modellraum, die nicht im gleichen Mae transformiert werden kann wie die Frequenz. Daher verwendet man zumeist getrocknete Luft oder Stickstoff als Atmosphre im Modellraum. Als dritte Mglichkeit, mit der auch Rume in der Planungsphase akustisch simuliert werden knnen, bietet die digitale Simulation die Konstruktion der Impulsantwort zwischen dem Ort eines Schallsenders in einem virtuellen Raum und dem Empfnger im virtuellen (u. U. geplanten) Raum.

Abbildung 6.7: Berechnung einer Raumimpuls-Antwort nach dem Ray-tracing-Verfahren

Raum- und Bauakustik

149

Fr jede beliebige, im Rechner angenommene Geometrie lt sich so unter der Annahme einer Schallteilchenkanone am Ort des Schallsenders und eines Zielvolumens am Ort des Empfngers eine binaurale Raumimpulsantwort berechnen. Je mehr Details des in Planung befindlichen Raums in die digitale Simulation einbezogen werden knnen (z. B. zustzliche reflektierende Flchen, effektiver Absorptionsgrad der einzelnen Flchen, Frequenzgang der Absorption), desto realistischer kann die Raumsimulation erfolgen. Eine typische damit errechnete Raumimpulsantwort sieht schematisch folgendermaen aus:

Abbildung 6.8: Schematischer Verlauf einer binauralen Raumimpulsantwort

Obwohl in diesen Raumimpulsantworten die ersten Reflexionen unter Nachhall unter Umstnden wesentlich mehr Energie beinhalten als der erste Anteil der Impulsantwort, die durch den Direktschall hervorgerufen wird, wird die Schallquelle zumeist richtig in der Richtung geortet, aus der der Direktschall kommt. Diese subjektive Unterdrckung der frhen Reflexion des Nachhalles auf die empfundene Lokalisation wird als Gesetz der ersten Wellenfront (Przedenzeffekt) bezeichnet. Er wird beispielsweise bei Beschallungsanlagen in guten Auditorien verwendet, bei denen die ber Lautsprecher in rckwrtigen Anteilen des Raumes abgestrahlten, verstrkten Schallsi-

150

Raum- und Bauakustik

gnale zeitlich gegenber dem Sprecher verzgert sind, so da zunchst das (unverstrkte) Signal vom Sprecher direkt zum Zuhrer gelangt und erst nach einer gewissen Verzgerung das verstrkte Signal. Auf diese Weise wird der Lokalisationseindruck nicht gestrt, obwohl zugleich der Sprecherpegel angehoben wird. Die Unterdrckung des ersten Echos bei der Wahrnehmung des Ortes der ersten Wellenfront wird im folgenden Bild dargestellt.

Abbildung 6.9: Unterdrckung wahrgenommener Echos al Funktion der Zeitverzgerung zwischen Direktschall und Echo

Bei sehr kleinen Verzgerungen berlagert sich das erste Echo mit dem Direktschall zur Bildung einer neuen Richtung (Pseudorichtung), d. h. Direktschall und erste Reflexionen werden zusammen zu einem neuen Lokalisationsort zusammengefat. Mit zunehmender Verzgerungszeit nimmt die Empfindlichkeit gegenber dem zustzlichen Echo ab, so da die Wahrnehmungsschwelle fr das Echosignal stark ansteigt. Bei weiter zunehmender Verzgerung kann man das Echo getrennt vom Direktschall wahrnehmen, so da die relative Echo-Schwelle wieder sinkt. Anhand der o. a. schematisch dargestellten Raum-Impulsantworten lassen sich verschiedene Qualittskriterien fr die Akustik eines Konzertsaals oder Auditoriums ableiten, die mit dem subjektiven Eindruck korrelieren. So wird der erste Anteil der Impulsantwort mit dem Direktschall und den frhen Reflexionen als ntzlich, die Klarheit und die Verstndlichkeit der damit zu bertragenden Sprach- und Musiksignale erhhend angesehen. Dagegen wird der nach einer bestimmten Zeit t2 auftretende Schwanz der Raumimpulsantwort, der diffuse Nachhall, als schdlich bzw. als Strschall angesehen. Gem diesen Vorstellungen knnen zwei Zeiten t1 bzw. t2 zur Abgrenzung von ntzlichen und schdlichen Anteilen der Raumimpulsantwort definiert werden, so da eine Gewichtsfunktion a(t) den gewnschten Anteil bezeichnet. Die in diesen beiden Anteilen lie-

Raum- und Bauakustik

151

gende Energie der Impulsantwort wird durch folgende Integrale ausgedrckt:

Abbildung 6.10: Schemtische Darstellung einer Raum-Impulsantwort und Aufteilung in Nutz- und Strschallanteil

E N = a( t )[g( t )] dt, E S = [g( t )]2 dt


2 0 t2

t1

(VI.19)

Darauf aufbauend wurden in der Literatur die folgenden subjektiven Qualittskriterien definiert: EN E N + ES E 10 log N ES EN E N + E nur Nachhallspitzen S E 10 log N ES

Deutlichkeit (Thiele) Klarheitsma (Reichhardt) Echograd (Niese) Strabstand (Lochner und Bergner)

t 1 = t 2 = 50 ms t 1 = t 2 = 80 ms t 1 = 17 ms t 2 = 33 ms t 1 = 35 ms t 2 = 95 ms

Beim Echograd nach Niese bezeichnet ES das Integral ber den Nachhall-Schwanz bei dem nicht die Impulsantwort selbst, sondern nur die im Nachhall auftretenden Spitzen der Impulsantwort ausgewertet und linear interpoliert werden. Smtliche dieser subjektiven Qualittskriterien liefern eine hnliche Aussage ber das Verhltnis von ntzlichen Schallanteilen der Raumbertragung im Verhltnis zum diffusen Nachhallfeld. Eine berprfung dieser Kriterien durch den Vergleich mit empirisch erhobenen subjektiven Qualittskriterien von Beobachtern ist jedoch nicht in allen Fllen erfolgt.

152

Raum- und Bauakustik

Fr die Beurteilung von Konferenz- und Sprechrumen ist die Sprachverstndlichkeit in Rumen von groer Bedeutung. Sie kann anhand von Messungen mit einer greren Zahl von Versuchspersonen entweder direkt bestimmt werden (was allerdings einen groen Aufwand bedeuted) oder durch Berechnungsverfahren bestimmt werden, die aufgrund von empirischen Daten zur Abhngigkeit der Sprachverstndlichkeit von verschiedenen akustischen Parametern aufgestellt wurden. Die wichtigste dabei zugrundeliegende Annahme ist, da der gesamte HrFrequenzbereich in verschiedene Frequenzbnder (z. B. Oktav-, Terzoder Frequenzgruppenbnder) aufgeteilt wird. Jedes dieser Frequenzbnder (mit dem Index k) trgt nun mit einem Gewichtungsfaktor gk zur Verstndlichkeit bei, wobei dieser Beitrag maximal ist, wenn im jeweiligen Frequenz-Band blo das ungestrte Sprachsignal vorliegt. Im Fall einer kompletten Strung des Sprachsignals im Frequenzkanal k ist dieser Beitrag dagegen 0. Als Articulation-Index (AI) bzw. als Speech Transmission Index (STI) wird nun die Summe ber smtliche gewichtete FrequenzBnder der in diesen Bndern vorliegenden Signal-Rauschverhltnisse bezeichnet:
AI = STI
(k)

S ( gk N

k)

(VI.20)

Dabei bezeichnet (S/N) den Signal-Rausch-Abstand in Band k, der auf den relevanten Pegelbereich (z. B. +15 dB bis -15 dB) begrenzt ist. Diese Begrenzung ist sinnvoll, weil bei Signal-Rausch-Abstnden von 15 dB bereits eine maximale Sprachverstndlichkeit erreicht wird und eine weitere Erhhung keinen weiteren Gewinn bringt bzw. bei SignalRauschabstnden von -15 dB bereits eine Sprachverstndlichkeit von 0 vorliegt und eine weitere Verringerung des Signals-Rausch-Abstandes diese Situation nicht weiter verschlechtern kann. Die Gewichtungsfaktoren gk stellen dabei eine vom Sprachmaterial abhngige Frequenzgewichtung dar. Beispielsweise weisen bei Stzen und mehrsilbigen Wrtern die tiefen Frequenzen eine relativ hhere Wichtigkeit auf als bei einsilbigem Sprachmaterial, bei dem weniger Redundanz im Material zugrundeliegt. Fr die vollstndige Erkennung der Sprache sind zudem die hochfrequenten Anteile der Konsonanten von entscheidenderer Bedeutung als bei Stzen. Der resultierende Index ist dann eine auf den Bereich von 0 bis +1 begrenzte Gre, die ein Ma fr die Verstndlichkeit darstellt und streng monoton mit der Sprachverstndlichkeit fr das jeweils verwendete Sprachmaterial zusammenhngt. Dieser Zusammenhang zwischen Articulation-Index bzw. Speech-Tranmission-Index und Sprachverstndlichkeit mu fr jeden Sprachtest getrennt ermittelt werden, allerdings gibt es Anhaltswerte fr bestimmte Sprachmaterialien. Die beiden Indizes unter-

Raum- und Bauakustik

153

scheiden sich in der Ermittlung des effektiven Signal-Rauschabstandes (k) in Band k (S/N) . Beim Articulation Index mu das Leistungsspektrum sowohl vom Sprachsignal (mittleres Leistungsspektrum) als auch vom Strsignal vorliegen, so da der Signal-Rausch-Abstand direkt berechnet werden kann. Dieses Verfahren ist daher nicht anwendbar, wenn beispielsweise nur das Nutzsignal und die Summe aus Nutz- und Strsignal vorliegt. Eleganter ist daher die beim Speech-Transmission-Index benutzte Methode, bei der der effektive Signal-Rauschabstand aus der Modulations-Transfer-Funktion (MTF) berechnet wird. Sie wird gemessen, indem man ein sinusfrmig moduliertes Signal (z. B. ein sinusfrmig amplitudenmoduliertes Schmalbandrauschen) in das auszumessende System schickt und am Ausgang den verbleibenden Modulationsgrad mit.

Abbildung 6.11: Schematische Auswirkung der Raumakustik auf Modulationen eines Eingangssignales (linkes Teilbild), die eine Verringerung der Modulationen im Ausgangssignal (rechtes Teilbild) bewirkt

Wenn wir den Trger des Eingangssignals mit c(t), den Modulationsgrad mit m und die Modulationsfrequenz mit bezeichnen, dann betrgt das Eingangssignal: c(t ) (1 + m cos t ) und das Ausgangssignal: c ( t ) (1 + m cos ( t t )) (VI.22) (VI.21)

Wenn im bertragungskanal (z.B. im Raum) nun ein stationres Rauschen dem Eingangssignal aufaddiert wird oder ein Nachhallvorgang auftritt, werden die Modulationsmaxima und -minima einander angenhert, so da ein Auffllen der Modulationstler auftritt, das mit zunehmender Nachhallzeit und niedrigerem Signal-Rausch-Abstand strker ausgeprgt ist. Auf diese Weise kann man aus der Abschwchung der Modulationsbertragung auf den effektiven Signal-Rausch-Abstand im Ausgang des Systems schlieen, wobei der Einflu von Nachhall und Rauschen auf die gleiche Weise behandelt wird und zudem nur das Eingangssignal und das Ausgangssignal bekannt sein mu, nicht jedoch das Rauschen und das

154

Raum- und Bauakustik

Str- und Eingangssignal getrennt. Die Modulationstransferfunktion ist nun definiert als: m ( ) m

MTF() =

F g 2 (t )

(VI.23)

g (t) bezeichnet die quadrierte Raum-Impulsantwort. Daraus folgt


S N
(k)

m m m

MTF 1 MTF

(VI.24)

Die eckige Klammer bezeichnet dabei eine Mittlung ber smtliche fr die Sprachwahrnehmung relevanten Modulationsfrequenzen , die nach Houtgast und Steeneken (1972) im Bereich zwischen 1 Hz und 50 Hz liegen. Beim sogenannten RASTI-Verfahren (Rapid-STI) wird die Modulations-Transferfunktion nur bei 500 Hz und 2 kHz gemessen und auch nur bei den 4 Modulationsfrequenzen im Bereich zwischen 0,7 Hz und 11,2 Hz ausgewertet. Mit dieser Methode lt sich sehr schnell die MTF in Rumen bestimmen und daraus der STI ableiten. Diese Methode hat sich aufgrund des einfachen Mevorgangs und der relativ hohen Robustheit des Verfahrens fr die Anwendung in der Raumakustik bewhrt, so da es kommerzielle Gerte auf dem Markt gibt, die diese Messungen automatisch durchfhren. In jngerer Zeit ist man dazu bergegangen, Elemente des AI und STI in einer neuen Norm zusammenzufassen und zu einem Speech Intelligibility Index (SII) zusammenzufassen. Es bleibt jedoch festzuhalten, da die Anwendung von AI, STI und SII vorwiegend fr additives Strrauschen und Nachhall sowie fr den ber viele Versuchspersonen und Sprachtests gemittelten Verstndlichkeitswert beschrnkt sind, whrend die Aussagen des Verfahrens fr andere Arten von Strungen (z. B. nichtlineare Verzerrungungen, Dynamikkompression) und fr kurze Sprachproben und eine kleinere Anzahl von Versuchspersonen nicht hinreichend gltig sind. (Kollmeier. 1992)

Elektroakustik

155

VII Elektroakustik
In der Praxis ist die Erzeugung, Verarbeitung und Aufnahme von Schall fast ausschlielich durch elektroakustische Systeme realisiert, bei denen eine Umwandlung zwischen akustischer (d. h. mechanischer) Energie und elektrischer Energie stattfindet. Aufgrund der groen praktischen Bedeutung ist es notwendig, sich mit den prinzipiellen Eigenschaften von elektroakustischen Wandlern und den dabei auftretenden Gesetzmigkeiten nher zu beschftigen.

VII.1 Mikrophone
Das erste brauchbare Mikrophon wurde von Philipp Reis (1861), dem Erfinder des Telefons verwendet. Bei seinem Kontaktmikrophon ist eine schwingungsfhige Membran mit einer feinen Spitze verbunden, die einen Kontakt in einen mehr oder weniger leitenden Zustand versetzt. Entsprechend der Leitfhigkeit fliet ein Strom ber den Kontakt und ruft am Widerstand eine pulsierende Gleichspannung hervor. Da die Kontaktnderung mehr oder weniger diskontinuierlich vor sich geht (d. h. entweder geschlossener oder offener Kontakt) handelt es sich bei dem Kontaktmikrophon um einen stark nichtlinearen Wandler, der am ehesten als ein EinBit-Quantisierer beschrieben werden kann (d. h. entweder Ausgangszustand 0 oder Ausgangszustand 1). Es gehrt zu den erstaunlichen Eigenschaften menschlicher Sprache, da sie selbst bei einer darartigen groben Quantisierung noch eine gewisse Verstndlichkeit erhlt, so da das von Philipp Reis entwickelte Telefon trotz uerst schlechter Sprachbertragungsqualitt dennoch eine gewisse Sprachverstndlichkeit ermglichte.

Abbildung 7.1: Kontaktmikrophon (schematisch) mit Membran (links), die einen Kontakt steuert, der wiederum einen Stromkreis schliet

Eine bessere Abbildung des Schalldrucks in eine elektrische Spannung ist durch das spter in Telefonen eingesetzte Kohlemikrophon mglich, bei dem die Membran mit einer Kohlekapsel verbunden ist, in der sich viele

156

Elektroakustik

Partikel befinden, die unter Druck einen besseren Kontakt mit einer hheren Leitfhigkeit ermglichen. Aufgrund der Vielzahl der sich bei einem bestimmten Druck ndernden Kontakte zwischen den einzelnen Kohlepartikeln ist die Leitfhigkeitsnderung dieser Kohlekapsel ungefhr proportional dem anliegenden Schalldruck, so da ein linearer Wandler von Schallenergie in elektrische Energie resultiert. Dementsprechend ist die Aufnahmequalitt von Sprachsignalen wesentlich besser als bei dem Kontaktmikrophon, obwohl der Frequenzbereich und die Linearitt bei weitem nicht ideal sind. Aufgrund seiner Robustheit ist das Kohlemikrophon noch heute in vielen Telefon-Sprechgarnituren zu finden. Es handelt sich jedoch um einen nichtreversiblen Wandler, d. h. Schallenergie lt sich zwar in elektrische Energie umwandeln, aber beim Anlegen einer elektrischen Spannung wird keine mechanische Arbeit verrichtet.

Abbildung 7.2: Schematische Darstellung des Kohlemikrophons, bei dem die Membran (links) die Leitfhigkeit der Kohlekapsel moduliert.

Ein lineares, reversibles Mikrophon wurde dagegen in Form des elektromagnetischen Mikrophons von Alexander Graham Bell (1876) verwendet. Bei ihm bewegt sich die mit einem magnetisierbaren Anker verbundene Membran im Feld eines Permanent-Magneten, auf dem sich eine Induktionsspule befindet. Die Membranschwingungen fhren zu einer nderung des magnetischen Flusses durch den Permanent-Magneten und damit zu einer in der Spule induzierten Wechselspannung. Mit diesem Mikrophon kann man eine wesentlich hhere Empfindlichkeit und aufgrund der Linearitt eine wesentlich bessere bertagungsqualitt erreichen, so da letztendlich der grere Erfolg des von Bell entwickelten Telefons resultierte, der ihn als den vermeintlichen Erfinder des Telefons spter auszeichnete.

Elektroakustik

157

Abbildung 7.3: Schema des elektromagnetischen Mikrophons

Der Nachteil einer mit einer groen Masse behafteten Membran des elektromagnetischen Mikrophons wird beim elektrodynamischen Mikrophon vermieden, bei dem eine Tauchspule mit der Membran verbunden ist, die in den ringfrmigen Spalt eines Topfmagneten eintaucht. Bei Bewegung der Membran mit der Geschwindigkeit v wird die Spannung Uind induziert, fr die gilt: U ind = B l v = U a + L I + R i I

(VII.1)

Abbildung 7.4: Schematischer Aufbau des elektrodynamischen Mikrophons

Dabei bezeichnet B die magnetische Induktionsfludichte, l die Lnge des Leiters im Magnetfeld quer zur Schwingungsrichtung, Ua die am Ausgangswiderstand Ra anliegende Spannung, L die Induktivitt der Tauchspule, I den in der Spule flieenden Strom und Ri den Ohmschen Widerstand (Innenwiderstand) der Tauchspule. Unter der Annahme einer sinusfrmigen Schallanregung mit der Kreisfrequenz folgt fr die Ausgangsspannung damit: Ua = B l v (i L + Ri ) I (VII.2)

Die Ausgangsspannung ist damit direkt proportional zu der Geschwindigkeit (Schnelle) der Membran, so da das elektrodynamische Mikrophon auch als Schnelle-Empfnger bezeichnet wird (wobei allerdings nicht die

158

Elektroakustik

vektorielle Komponente der Schnelle bercksichtigt wird). Die Verluste an den Ohmschen und den induktiven Innenwiderstand der Tauchspule sind in VII.2 als additive Konstante bercksichtigt. Ein anderes Konzept liegt dagegen dem Kondensator-Mikrophon zugrunde, bei dem zwischen der elektrisch leitenden Membran und einer dahinter im Abstand d liegenden Kondensatorplatte eine Gleichspannung U angelegt wird, mit der der resultierende Kondensator (Kapazitt C) aufgeladen wird (Ladung Q). Bei Druckschwankungen ndert sich nun der Abstand zwischen der Membran und der dahinterliegenden KondensatorPlatte, so da sich die Kondensatorladung verndert und eine Spannungsschwankung resultiert, die die nderung der Membran-Auslenkung reflektiert. Wenn wir die Kondensator-Ladung in einen Gleich- und einen Wechselanteil aufspalten, also: Q = Q + q ~ mit Q U (VII.3)

C =

(VII.4)

q ~ = I dt

(VII.5)

erhalten wir fr die Wechselspannungs-Komponente U ~ am Ausgang des Kondensator-Mikrophons:

U = U ~

(Q + q ~ ) = U
C

- (Q- + q ~ )

1 1- C- d

(VII.6)

wegen 1 d-

C~

(VII.7)

1 1 = 1 C C d

(VII.8)

Elektroakustik

159

Dabei bezeichnet die Auslenkung der Membran. Unter der erneuten Annahme einer sinusfrmigen Schalldrucknderung an der Membran erhalten wir als Ausgangsspannung bei der Kreisfrequenz : 1 I dt d C

U ~ = U-

(VII.9)

U a ( ) =

U 1 I d i C
komplexer Innenwiders tan d

(VII.10)

Die Ausgangsspannung ist damit proportional zur Auslenkung , so da man auch von einem Auslenkungsempfnger (im Gegensatz zum oben beschriebenen Schnelleempfnger) spricht. Im Gegensatz zu den induktiven Innenwiderstandsverlusten des elektrodynamischen Mikrophons treten hier kapazitive Verluste am komplexen Innenwiderstand auf, die in VII.10 bercksichtigt wurden. Wenn man die Ausgangsspannung als Funktion der Membranschnelle berechnen will, so fhrt dies unter der Bercksichtigung, da die Schnelle die zeitliche Ableitung der Auslenkung ist mit v = i: U a ( ) = U 1 v I i d i C

(VII.11)

D. h. bei konstanter Schnelle sinkt die Ausgangsspannung mit wachsen1 dem ab, so da das Kondensator-Mikrophon eine mit abfallende Schnelleempfindlichkeit aufweist. Wenn anstelle eines Luftspaltes zwischen der Membran und der dahinterliegenden Kondensatorplatte ein Elektret eingebracht wird (d. h. ein mit einer permanenten elektrischen Polarisierung versehener Stoff, z. B. spezielle Kunststoff-Folie mit ausgerichteten Elementar-Dipolmomenten) kann man auf das Anlegen einer statischen Vorspannung U verzichten und man erhlt das sogenannte Elektret-Kondensator-Mikrophon. Es wurde von G. M. Sessler bei den Bell Laboratories in den 60er Jahren entwickelt. Aufgrund seiner geringen Abmessungen, einfacher Herstellungsweise und hohen Wiedergabetreue ist diese Art von Mikrophon das derzeit weitverbreitetste Mikrophon, das in jedem Kassettenrekorder oder Diktiergert eingebaut ist. Ein anderes Wandlerprinzip wird beim piezoelektrischen Mikrophon ausgenutzt, bei dem zwischen der Membran und einer feststehenden Masse ein piezoelektrischer Kristall eingespannt ist, an dem bei Deformation (z.

160

Elektroakustik

B. durch den von auen einwirkenden Schalldruck) eine Spannung ableitbar ist, die der auftretenden Kraft proportional ist. Als Ersatzschaltbild kann das Piezo-Mikrophon daher durch eine ideale Stromquelle ersetzt werden, deren Stromflu der Schnelle proportional ist und einem parallel geschalteten Kondensator, der die kapazitiven Eigenschaften des PiezoKristalls beinhaltet:

Abbildung 7.5: Schematischer Aufbau (links) und elektrisches Ersatzschaltbild (rechts) des piezoelektrischen Mikrophons

Fr die beiden auftretenden Teilstrme I1 und I2 gilt damit: I1 = k v I2 = C U

(VII.12)

(VII.13)

Als Ausgangsstrom ist daher der um den Kurzschlu-Strom I2 verminderte Strom I1 abgreifbar fr den gilt: I = I1 I 2 = k v i C U a (VII.14)

Das Piezo-Mikrophon ist damit ebenfalls ein Schnelleempfnger, wobei die Konstante k charakteristisch fr das jeweilige Mikrophon ist. Neben den bereits eingefhrten Unterschieden zwischen einem Auslenkungsempfnger (d. h. einem Mikrophon, bei dem das Verhltnis aus Ausgangsspannung und Membran-Auslenkung ber die Frequenz annhernd konstant ist) und einen Schnelle-Empfnger (d. h. Verhltnis aus Ausgangsspannung und Schnelle der Membran ist annhernd konstant ber der Frequenz) lassen sich die Mikrophone noch aufgrund ihrer rumlichen Empfindlichkeit als Schalldruckempfnger oder als Druckgradientenempfnger charakterisieren. Beim Schalldruckempfnger ist die

Elektroakustik

161

auf die Membran ausgebte Kraft F proportional zum Schalldruck p und zur Membranflche s also: F = S p (VII.15)

Beim Druckgradientenempfnger kann der Schall dagegen auch hinter die Membran gelangen (z. B. durch geeignet geformte Ausgleichskanle), so da die resultierende Kraft auf die Membran nicht gleich dem Schalldruck, sondern der Schalldrucknderung in einer vorgegebenen Richtung (xRichtung) ist: p x x

Fi = S

(VII.16)

Dabei bezeichnet x den Abstand zwischen Vor- und Rckseite der Membran bzw. der Druckausgleichsffnung hinter der Membran. Diese Anordnung ist sinnvoll, weil mit diesem Mikrophon nicht nur die skalare Gre des Schalldrucks, sondern die vektorielle Gre der Schallschnelle in ihrer Projektion auf die jeweilige x-Richtung bestimmt werden kann. Durch eine geeignete Kombination lt sich damit auch die Schallintensitt bzw. der Schallflu am Mikrophonort bestimmen. Eine weitere Unterscheidung der Mikrophon-Typen in reversible Wandler und irreversible Wandler wurde bereits oben angesprochen: Whrend das Kontakt- und Kohlemikrophon nur eine Energiewandlung in eine Richtung ermglichen und damit irreversibel sind, ermglichen die brigen vorgestellten Mikrophon-Arten die Erzeugung von Schall bei Anlegen einer elektrischen Spannung. Dieses wird beispielsweise fr die Reziprozitts-Eichung von Mikrophonen angewendet (vgl. Kapitel VII.4). Auerdem werden Kondensator-Mikrophone zuweilen als Lautsprecher fr spezielle Anwendungen (z. B. hohe Frequenzen und kleine Intensitten bei kleinen Abmessungen beispielsweise in der Neurophysiologie) eingesetzt.

VII.2 Lautsprecher
Beim Lautsprecher wird elektrische Leistung in mechanisch-akustische Leistung umgewandelt, wobei hnliche Prinzipien wie bei den Mikrophonen auftreten. Beim elektrodynamischen Lautsprecher befindet sich eine Schwingspule im Ringfrmigen Spalt eines Topfmagneten, die mit dem Lautsprecherkonus verbunden ist, in der sie wiederum federnd aufgehngt ist, um eine Schwingung durchfhren zu knnen.

162

Elektroakustik

Abbildung 7.6: Schematischer Aufbau des dynamischen Lautsprechers

Die auf die Membran ausgebte Kraft setzt sich zum einen aus der Kraft Fmech zusammen, die die mechanischen Elemente (Masse, Feder, Reibung und Schallabstrahlung) auf die Membran ausben und zum andern aus der Lorenzkraft, die auf den stromdurchflossenen Leiter im Magnetfeld der Strke B ausgebt wird: F = Fmech + B x I (VII.17)

Dabei bedeutet x die Lnge der Leiterschleife im Magnetfeld, die vom Strom I durchflossen wird. Damit ist die anregende Kraft proportional zum anregenden Strom, so da eine lineare Umsetzung erfolgen kann. Beim elektrostatischen Lautsprecher wird hnlich wie beim elektrostatischen Mikrophon ein Kondensator gebildet, dessen Platten durch eine Wechselspannung unterschiedliche Krfte aufeinander ausben. Dabei ist eine Elektrode als massiver Metallkrper ausgefhrt, whrend die andere Elektrode eine dnne Metallflche darstellt, die auf einer elastischen Folie vor dem Metallkrper aufgedampft ist, um die schwingende Masse mglichst klein zu halten.

Abbildung 7.7: Prinzipieller Aufbau des elektrostatischen Lautsprechers

Die zwischen den beiden Elektroden wirkende Kraft Fel lt sich aus der im Kondensator gespeicherten elektrischen Energie Wel errechnen zu:

Elektroakustik

163
1 Q2 2 C

Wel =

(VII.18)

Fel =

dWel Q2 = d 2 C d

(VII.19)

Dabei bezeichnet Q die auf dem Kondensator angesammelte Ladung, C die Kapazitt des Kondensators, die Auslenkung der Membran in Richtung auf den Metallkrper und d den Abstand der beiden Elektroden. Letztere Gleichung folgt aus der Voraussetzung, da Wel proportional zu (d - ) ist, da die Kapazitt umgekehrt proportional zu dieser Gre ist. Cbezeichnet dabei die Kapazitt in der Ruhelage, d. h. fr = 0. Fr die Ladung auf dem Kondensator gilt dann: Q = U C + q ~ (VII.20)

Damit folgt fr den Wechsel-Anteil der zwischen den Kondensatorplatten auftretenden Kraft: 2 U C q ~ U + ... C U ~ 2 C d d

F~ =

(VII.21)

Dabei wurde vorausgesetzt, da die quadratischen Terme in q~ vernachq lssigbar klein sind und da der Wechselspannungsanteil U ~ = ~ ist. C Damit berechnet sich die auf die Membran des elektrostatischen Lautsprechers ausgebte Kraft zu: U C U d

F = Fmech +

(VII.22)

Dabei bezeichnet Fmech genau wie oben die von den mechanischen Elementen des Lautsprechers ausgebten Krfte auf die Membran. Im Vergleich zwischen Gleichung VII.17 und VII.22 stellt man fest, da die Kraft im elektrodynamischen Lautsprecher proportional zum Strom und im elektrostatischen Lautsprecher proportional zur Spannung ist. Beide hier vorgestellten Lautsprechertypen sind reversibel, d. h. sie sind auch als Mikrophon verwendbar, da sich der Umwandlungsproze zwischen elek-

164

Elektroakustik

trischer und mechanischer Energie aufgrund des gewhlten Prinzips jeweils umkehren lt. Dieses Prinzip der Reversiblitt und der Mglichkeit, fr eine vorgegebene mechanische Gre zwei unterschiedliche elektrische Gren als proportional anzusetzen, wird im folgenden Abschnitt nher beleuchtet.

VII.3 Elektromechanische Analogien


Sowohl die in VII.1 beschriebenen Mikrophone als auch die in VII.2 beschriebenen Lautsprecher sind Beispiele fr elektromechanische Systeme, die man als eine Hintereinanderkopplung von linearen Vierpolen auffassen kann, d. h. Bauelementen mit zwei Eingngen und zwei Ausgngen, deren an den Ein- bzw. Ausgngen liegende Gren ber lineare Gleichungssysteme miteinander gekoppelt sind. Der Prototyp eines derartigen elektromechanischen Systems sieht folgendermaen aus:

Abbildung 7.8: Elektromechanisches System als Verkettung von Vierpolen

Dabei wird die elektrische Seite anhand ihrer elektrischen Kenngren v und I in die am idealen Wandler (d. h. mit Kopplung bezeichnetes Element) angelegt. Im Ausgang dieses Wandlers resultiert die Kraft F und die Schnelle v, die in einem sich anschlieenden mechanischen Vierpol in die entsprechenden mechanischen Ausgangsgren umgewandelt werden. Fr den eigentlichen idealisierten elektromechanischen Wandler gelten dann die folgenden Vierpolgleichungen, die in Matrix-Schreibweise geschrieben werden knnen: U = K11 F + K 12 v , I = K 21 F + K 22 v U K 11 K12 F = I K 21 K 22 v

(VII.23)

Unter der Annahme eines reversiblen Wandlers (d. h. prinzipielle Betriebsrichtung von mechanisch nach elektrisch oder umgekehrt von elektrisch nach mechanisch) darf bei der Umwandlung keinerlei Energie verlorengehen, so da die elektrische Eingangsleistung U I gleich der mechanischen Ausgangsleistung F v sein mu: UI = F v (VII.24)

Elektroakustik

165

Als Konsequenz daraus folgt, da in der Koppelgleichung (VII.23) entweder K12 = K21 = 0 oder K11 = K22 = 0 sein mu. Je nach Wahl, welche dieser beiden Alternativen gelten soll, gibt es also zwei mgliche elektromechanische Analogien, die im folgenden vorgestellt werden sollen: Bei der ersten elektromechanischen Analogie (FU-Analogie) ist die Kraft proportional der Spannung und fr die Kopplungsfaktoren K11 bzw. K22, die als einzige ungleich Null sind, gelten: K11 = 1 = K 22 0 1 (VII.25)

(VII.26)

U = I 0

F v

(VII.27)

Fr die elektrische Impedanz Zel ergibt sich dann folgende Umrechung in die mechanische Impedanz Zmech: Z el = U F = = 2 Z mech 1 I v

(VII.28)

Ausgehend von dieser Analogie zwischen Kraft und Spannung bzw. Strom und Schnelle transformieren sich die entsprechenden Differentialgleichungen fr den elektrischen Fall in entsprechende Differentialgleichungen fr den mechanischen Fall wie folgt:

UC = I Kapazitt

F = S v ( F = S x) Federsteife

(VII.29)

166

Elektroakustik

U = + LI Induktivitt U = RI Widerstand

F = Mv Masse F = Wv Reibung

(VII.30)

(VII.31)

Abbildung 7.9: Umsetzung einer elektrischen Parallelschaltung in eine mechanische Reihenschaltung bei der FU-Analogie

Die erste elektrische Analogie ist zwar sehr einleuchtend, weil die elektrische Spannung ja auch als Kraft x mal Weg pro Ladung aufgefat werden kann und daher allein von den physikalischen Dimensionen einer mechanischen Kraft sehr nahe kommt. Diese elektromechanische Analogie hat jedoch den Nachteil fr die anschauliche Umsetzung, da eine Parallelschaltung von mechanischen Elementen in eine Reihenschaltung elektrischer Elemente umgewandelt wird und umgekehrt, so da die direkte bertragung von mechanischen Schaltkreisen in elektrische Schaltkreise u. U. etwas erschwert wird. Weniger Schwierigkeiten in dieser Hinsicht macht die zweite elektromechanische Analogie (FI-Analogie), bei der die Terme K12 bzw. K21 ungleich Null sind: 1 = K 21

K12 =

(VII.32)

Als Koppelgleichung bzw. als Impedanz-Transformation ergibt sich: 0 U 1 F = 0 I v

(VII.33)

Elektroakustik

167
2 U v = = 1 I F Z mech

Z el =

(VII.34)

Genau wie oben kann man sich nun die elektromechanischen Analogien fr diese zweite Analogie ansehen. Dabei stellt man fest, da sich die Rolle der Bauelemente genau verschoben hat, so da eine Kapazitt nicht lnger der Federsteife, sondern der Masse entspricht und eine Parallelschaltung von mechanischen Elementen in eine Parallelschaltung von elektrischen Elementen berfhrt wird (hnliches gilt fr die Reihenschaltung). Diese zweite elektromechanische Analogie hat zwar den Nachteil, da die Proportionalitt zwischen Kraft und Strom nicht direkt aus der Physik heraus motiviert wird, dafr fllt aber die bertragung von mechanischen in elektrische Schaltkreise einfacher. Eine Gegenberstellung der verschiedenen Analogien ergibt sich in folgender Tabelle: U F I I v U L m C R W 1/R 1/C S 1/L LI /2 mv /2 CU /2
2 2 2

CU /2 FU-Analogie F /(2S) FI-Analogie LI /2


2 2

Dualitt

Die Beziehung zwischen den beiden verschiedenen Schaltungen, die aufgrund der unterschiedlichen Analogien aus derselben mechanischen Schaltung resultieren, wird als Dualitt bezeichnet. Beim bergang von einer Schaltung zu einer dualen Schaltung gehen Widerstnde in Leitwerte, Impedanzen in reziproke Impedanzen und Parallelschaltungen in Reihenschaltungen ber u. s. w.. Prinzipiell ist mit beiden Schaltungen jedoch dasselbe Verhalten nachweisbar. Als Beispiel fr einen aufgrund der elektromechanischen Analogien zu berechnenden elektrodynamischen Wandler soll der dynamische Lautsprecher behandelt werden:

Abbildung 7.10: Vierpol-Darstellung des dynamischen Lautsprechers

168

Elektroakustik

Der elektrische Eingangs-Vierpol besteht aus der Spule Ls, d. h. der Induktivitt der Lautsprecher-Schwingspule, und dem Ohmschen Verlustwiderstand Rs, die in Reihe mit dem idealen Wandler geschaltet sind, der eine Wandlerkonstante haben soll. Als Ausgangsgre dieses Wandlers steht die Schnelle v und die Kraft F zur Verfgung, die aus den mechanischen Elementen (Masse, Feder und Reibung ) mit den entsprechenden Parametern (m, S und W) zusammengesetzt sind. Die Wahl der elektromechanischen Analogie steht im Prinzip frei, es bietet sich jedoch an, fr die elektromechanische Analogie das zugrundeliegende physikalische Gesetz zu benutzen, das im Fall des dynamischen Lautsprechers gerade das Induktionsgesetz bzw. die Lorenzkraft darstellt, also: F = B x I U = B x v Es resultiert damit fr die Wandlerkonstante : 2 2 m , L= , R= 2 S W (VII.35) (VII.36)

= B x , C =

(VII.37)

Durch diese Umwandlung knnen die mechanischen Gren W, S und m direkt in entsprechende elektrische Gren umgesetzt werden, so da folgendes Ersatzschaltbild resultiert, bei dem noch die Ankopplung an das Schallfeld auf der rechten Seite des Ersatzschaltbildes zu klren ist:

Abbildung 7.11: Elektrisches Ersatzschaltbild des dynamischen Lautsprechers (ohne Ankopplung an das Schallfeld)

Fr die am Ausgang dieses elektromechanischen Systems (ohne Ankopplung an das Schallfeld) anliegende Kraft und Schnelle ergibt sich dann die folgende Koppelgleichung, die durch Hintereinanderausfhrung der Matritzenmultiplikation erzeugt werden kann, die jeweils einen Vierpol kennzeichnet:

Elektroakustik

169
0 0 1 1 F v 0

+ 1 U 1 R S i L S = I iC + 1 + 1 1 0 R i L R + i L S 1 S = 1
2

1 1 + ( R S + i L S ) i C + + R i L F 1 1 v i C + + R iL

(VII.38)

Fr den Betrieb des Lautsprechers lassen sich nun drei verschiedene Flle unterscheiden: Fall a) Festgebremste Membran (z. B. durch Beschweren der Lautsprecher-Membran mit einer sehr groen Masse): Hierfr gilt v = 0, Zmech = , so da ein quivalenter Abschluwiderstand von 0 (Kurzschlu) resultiert, der den Parallel-Schwingkreis aus Widerstand, Kondensator und Spule kurzschliet. Mit dieser Anordnung lt sich daher der Spulenwiderstand Rs und die Induktivitt Ls fr einen gegebenen Lautsprecher bestimmen. Fall b) Lautsprecher im Vakuum: Dabei tritt eine mechanische Impedanz von 0 auf, da keine Kraft an das uere Medium bertragen werden kann. Dies wird in eine elektrische Impedanz der Gre unendlich transferiert, d. h. ein offenes Ende des Parallel-Schwingkreis resultiert als Abschluwiderstand. Mit dieser Anordnung lassen sich daher die elektrischen Gren C, L und R bestimmen, die u. a. die Resonanz-Frequenz des Lautsprechers festlegen. Fall c) Lautsprecher in einer Schallwand: In diesem Fall resultiert als meF chanische Impedanz : v i k a eff F = 2 S v 1 + i k a eff

(VII.39)

Dabei bezeichnet S die Membranflche und aeff den Radius eines quivalenten Kugelstrahlers, d. h. aus R Kolben 2

a eff =

(VII.40)

170

Elektroakustik

Diese Impedanz fhrt zu einem mechanischen Ersatzschaltbild, das aus einer Parallelschaltung zwischen den Reibungsverlusten (d. h. abgestrahlte Wirkleistung des Lautsprechers in das Schallfeld) und einer Masse resultiert (d. h. abgestrahlte Blindleistung des Lautsprechers in das Schallfeld, die zwischen dem Feld und dem Lautsprecher hin- und herpendelt, ohne Arbeit zu verrichten).

Abbildung 7.12: Mechanisches Ersatzschaltbild der Abtrahlimpedanz des Lautsprechers

Als elektrisches Ersatzschaltbild resultiert damit als Abschluwiderstand eine Hintereinanderschaltung des Ohmschen Widerstandes RL und der Kapazitt CL, die die entsprechende Transformation der mechanischen Widerstnde in die elektrischen Gren darstellen.

Abbildung 7.13: Vollstndiges Ersatzschaltbild des dynamischen Lautsprechers

Anhand dieses Ersatzschaltbildes lt sich die von einem Lautsprecher abgestrahlte Wirkleistung als Funktion der Frequenz angeben, d. h. diejenige mechanische Ausgangsleistung des Lautsprechers, die in das akustische Fernfeld umgesetzt wird und zu einer effektiven Schallabstrahlung fhrt. Diese Wirkleistung entspricht der Verlustleistung in dem Wirkwiderstand RL. Bei sehr niedrigen Frequenzen (unterhalb der ResonanzFrequenz fRes des Lautsprechers) nimmt die abgestrahlte Wirkleistung mit 4 zunehmender Frequenz mit zu, um zu einem Plateau oberhalb der Resonanz-Frequenz bis zu einer Kolbenstrahler-Grenzfrequenz fg zu gelan2 gen, oberhalb der die abgestrahlte Wirkleistung mit 1 / abfllt. Die Resonanz-Frequenz berechnet sich dabei zu:

Elektroakustik

171

Abbildung 7.14: Wirkungsgrad des Lautsprechers in Abhngigkeit von der Frequenz

S fRe s = 1 2 m Die Kolbenstrahler-Grenzfrequenz fg berechnet sich zu: fg = 1 c 2 a eff

(VII.41)

(VII.42)

Der nutzbare Bereich der Abstrahlcharakteristik des Lautsprechers liegt dabei oberhalb der Eigenresonanz-Frequenz und unterhalb der durch die ueren Abmessungen des Lautsprechers gegebenen KolbenstrahlerGrenzfrequenz, oberhalb derer der Lautsprecher nicht mehr wie ein akustischer Monopol abstrahlt, sondern die Wellenlnge klein gegenber der Lautsprecher-Abmessungen wird und vorwiegend Blindleistung abgestrahlt wird. Um den nutzbaren Frequenzbereich eines gegebenen Lautsprechers mglichst nach unten hin zu erweitern, sollte daher die Resonanz-Frequenz mglichst niedrig gelegt werden. Dies kann insbesondere durch eine sehr weiche Aufhngung (geringe Federsteifigkeit) erzielt werden, sowie ein groes Boxenvolumen, da die in der Box eingeschlossene Luftmasse als zustzliche Federung wirkt. Dies ist der Grund dafr, wieso groe Lautsprecherboxen eine tiefere Grenzfrequenz bei gleichem Lautsprechersystem aufweisen als kleine Lautsprecherboxen.

VII.4 Kalibrieren elektroakustischer Wandler


Sowohl fr Lautsprecher als auch fr Mikrophone ist es notwendig, die akustischen Gren in entsprechende elektrische Gren umzurechnen, da elektrische Gren mit einer wesentlich hheren Genauigkeit als akustische Gren bestimmt werden knnen. Unter der Annahme eines reversiblen akustischen Wandlers (den man sowohl als Schallsender als auch als Schallempfnger betreiben kann) knnen wir die SendeEmpfindlichkeit S und die Empfangs-Empfindlichkeit E wie folgt definieren:

172
F I U v

Elektroakustik

S=

(VII.43)

E=

(VII.44)

Dabei bezeichnet F die mechanische Kraft auf den schwingenden Teil des Senders (insbesondere beim elektrodynamischen System), I den dabei flieenden Strom, U die aufgenommene Spannung und v die fr die Erzeugung dieser Spannung erforderliche Schwelle. Zur Bestimmung dieser Sende- bzw. Empfangs-Empfindlichkeit gibt es verschiedene Kalibrierungsmethoden. Die fr praktische Anwendungen hufigste Kalibrierungsmethode benutzt eine geeichte Schallquelle, d. h. einen Schallsender, der in einem definierten Luftvolumen bei vorgegebenen Bedingungen (Raumtemperatur, Luftfeuchtigkeit) einen gewissen Schalldruck erzeugt. Durch das Umsetzen dieses Schalldrucks in eine bestimmte elektrische Spannung U kann die Empfangs-Empfindlichkeit bestimmt werden und daraus gegebenenfalls die Sende-Empfindlichkeit eines anderen Systems, was an dieselbe Stelle der geeichten Schallquelle angebracht werden kann. Eine andere Mglichkeit ist die optische Kalibrierung , bei der die mechanische Auslenkung direkt optisch betrachtet werden kann (z. B. unter dem Mikroskop bei stroboskopischer Beleuchtung). Diese Kalibrierung eignet sich vorwiegend fr tiefe Frequenzen und Systeme mit relativ groer Auslenkung. Die prziseste Kalibrierung geschieht mit der sogenannten Reziprozittseichung, bei der ein reversibles elektroakustisches System und ein Hilfssender verwendet werden, die jeweils in einem definierten Aufbau mit einer vorgegebenen, bekannten Impedanz Z erfolgt:

Abbildung 7.15: Anordnung bei der Reziprozittseichung (1. Schritt, schematisch)

Im ersten Schritt wird mit dem Hilfssender ein geeignetes Schallfeld erzeugt, was sowohl in dem zu eichenden System eine Spannung UI als auch in dem reversiblen Wandler eine Spannung U2 erzeugt. Unter Zugrundelegung der (noch nicht bekannten) Empfangs-Empfindlichkeiten E1 bzw. E2 bzw. der noch nicht bekannten Schnelle v, die fr die beiden Sy-

Elektroakustik

173

steme aufgrund des symmetrischen Aufbaus als gleich anzunehmen ist, gilt: UI , v U2 v

E1 =

E2 =

(VII.45)

Im zweiten Schritt wird der reversible Wandler als Lautsprecher betrieben, wobei wieder dieselbe Schnelle erzeugt wird (bzw. auf sie hochgerechnet wird) wie beim ersten Aufbau, so da dieselbe Spannung U2 an dem zu kalibrierenden System auftritt:

Abbildung 7.16: 2. Schritt der Reziprozittseichung

Whrend an dem zu kalibrierenden System wieder dieselbe EmpfangsEmpfindlichkeit E1 aufgrund der gemessenen Spannung UII und Schnelle v entsteht, bestimmt sich die Sende-Empfindlichkeit des reversiblen Wandlers zu: U II , v F , I

E1 =

S2 =

F = Z12 v

(VII.46)

Fr die dabei auftretende Kraft F kann aber aufgrund der bekannten (bzw. theoretisch berechenbaren) Impedanz Z12 die Beziehung zur Schnelle v aufgestellt werden, und auerdem gilt fr einen reversiblen Wandler, da die Sende- gleich die Empfangs-Empfindlichkeit ist, also S2 = E2. Daraus folgt fr die noch unbekannte Schnelle v: U I I = 2 = Z12 v Z12 U2 I Z12

v = S2

(VII.47)

Auf diese Weise werden die fr die Eichung bzw. Kalibrierung notwendigen mechanischen (bzw. akustischen) Gren v und F nicht direkt durch relativ ungenaue mechanische Messungen bestimmt, sondern indirekt durch elektrische Messungen, die sich mit einer wesentlich hheren Przision durchfhren lassen. Auf diese Weise lassen sich Przisionsmessungen in der Akustik und die notwendigen przisen Eichungen der verwendeten Wandler durchfhren, so da diese Methode beispielsweise

174

Elektroakustik

zum Kalibrieren von Memikrophonen verwendet wird. Sie beruht jedoch auf der Voraussetzung der Reziprozitt des reversiblen Wandlers sowie der Voraussetzung, da die Impedanz bzw. die Schallausbreitung in der gewhlten Meanordnung mit gengender Genauigkeit bekannt ist.

Literatur

175

Literatur
Cremer, C.; Hubert, M.: Vorlesungen ber technische Akustik, SpringerVerlag, Berlin 1990 Meyer, E.; Neumann, E. G.: Physikalische und Technische Akustik, Vielweg, Braunschweig 1967 Zwicker, E.; Zollner, M.: Elektroakustik, Springer-Verlag, Berlin 1984 Heckl, M.; Mller, H. A.: Taschenbuch der technischen Akustik, SpringerVerlag, Berlin 1994 Pierce, A. D.: Acoustics: An Introduction to Ist Physicals and Applications, Acoustical Society America, New York, 1989 Kuttruff, H.: Room Acoustics, 3rd edition, Elsevier, London, 1991 Kent, R. D.; Atal, B. S.; Miller, J. L.: Papers in Speech Communication I-III, Acoustical Society America, AIP, 1991 Kultruff, H.: Raumakustik, (S.140) Kohler, K.: Akustische Phonetik, (S.101) Schroeder, M.R.: Minimale Entropy spectral estimation, 1989 Markel, J.D.; Gray, A.H.: Linear Prediction of Speech, Springer Verlag, Berlin 1976