Sie sind auf Seite 1von 49

Akustik 1 – kurze Fassung WS

Bücher: Rene Bruderlin – Akustik für Musiker

1. Musikakustik, Teilgebiete der Akustik, historische Information

2. Schall
1. Die physikalischen Eigenschaften des Schalls: Schallerzeugung-wie entsteht Schall
2. die Geschwindigkeit des Schalls, Schalldruck
3. Schallübertragung und Schallausbreitung, wie wird er von einem Ort zu einem anderen übertragen
4. Schallwahrnehmung (wie beeinflusst der Schall die Sinne und Emotionen eines Hörers)

Musik im Freien

3. Wellen
Wellenformen

4. Strukturen in der Musik:


Melodik, Harmonie, Metrum, Rhythmus, Intervalle usw.

5. Menschliches Ohr
Tonhöhenwahrnehmung,
Mechanismen der Tonhöhenwahrnehmung
Die moderne Theorie der Tonhöhenwahrnehmung

6. Menschliche Stimme, Tonerzäugung.

1
Akustik 1 – kurze Fassung WS

Jeder musikalische Vorgang, allgemein auch jeder Schallvorgang, stellt ein Ereignis dar, das in der
Zeit abläuft. Musikalische Vorgänge pflegen wir in einem Notensystem darzustellen. Für den Physiker ist
eine solche Notation nichts anders als ein Diagramm, wobei auf der waagrechten Achse die Zeit dargestellt
wird, auf der senkrechten Achse dagegen die Tonhöhe.
Die Einteilung auf den Achsen braucht nicht linear zu sein. Sie kann zB logarithmisch sein. Regel:
eine logarithmische Skala gestattet auf demselben Längenabschnitt einen größeren Bereich darzustellen,
wobei sich aber zu größeren Werten hin die Genauigkeit vermindert.
Es ist üblich, bei der Untersuchung von Schallvorgängen diese in elektrische Vorgänge umzuwandeln
und auf einem Kathodestrahl-Oszillographen darzustellen. Ein solcher Oszillograph gestattet, in der Zeit
ablaufende elektrische Vorgänge gewissermaßen als „lebendes Diagramm“ aufzuzeichnen. Diese Methode
werden wir oft in weiteren Erklärungen benützen.
Man verwendet ab und zu mathematische Formeln, da die Akustik immerhin über weite Bereiche mit
physikalischen Begriffen behandelt werden kann.
In der Musik werden bekanntlich die Töne mit Buchstaben bezeichnet, deren Abfolge sich in jeder
Oktave wiederholt. Zur Unterscheidung der Oktavlagen sind verschiedene Verfahren gebräuchlich. Wir
werden das im deutschsprachigen Raum bekannteste System, das auf der ersten Zeile dargestellt ist,
verwenden.
Bis zu den frühesten Zeugnissen menschlicher Bestätigungen sind Erscheinungen von Lautbildungen zu
verzeichnen. Es handelt sich um Erscheinungen, die in den Bereich dessen fallen, was mit unseren
akustischen Betrachtungen im engeren oder weiteren Sinne zu tun hat. Die bildlichen Darstellungen in
früheren Hochkulturen mit Instrumenten sind Legion und seien hier nur am Rande erwähnt, sie sind für die
Instrumentenkunde von besonderem Interesse.
Für die Akustik von größerer Bedeutung ist das Erfassen von Gesetzmäßigkeit im Reiche der Töne
und somit das, was hier mit musikalischer Akustik angesprochen wird.
Die ältesten Mitteilungen über akustische Gesetze kommen von den Ägyptern in der Zuordnung der Töne
zu den Offenbarungen der Gottheiten und der Verbindung derselben zu den Beziehungen zu Jahres- und
Tageszeiten, den Himmelrichtungen etc., in denen sie bereits die mathematischen Grundlagen einfachster
Intervallverhältnisse erkannten. Ähnliches ist von den Mesopotamiern und den Babyloniern bekannt.

Akustik und Musik


Mit Akustik bezeichnet man die physikalische Wissenschaft von den Schallwellen, sie ist einer der
Hauptbereiche in der klassischen Physik neben der Mechanik, der Thermodynamik, der Optik und der
Elektrizitätslehre.
Obwohl die Akustik nach wie vor ein Hauptgebiet der Physik bleibt, hat sich doch ihr Gegenstandsbereich
beträchtlich erweitert. Man hört die Vorträge über Psychologie und Psychoakustik, über die Experimente, in
denen das menschliche Ohr nichts hören kann. Akustik umschließt heute verschiedene andere Bereiche, die
direkt oder indirekt mit dem, was wir "hörbaren Schall" nennen, verknüpft sind.
Mit Musik bezeichnen wir jene beabsichtigten Kombinationen von Schallereignissen, die wir für unsere
ästhetischen Vergnügen auswählen. Sprache hat einiges mit Musik gemeinsam, unterscheidet sich aber in
ihrem Zweck: sie vermittelt den ganzen Kosmos menschlicher Ideen durch Wortsymbole und weniger durch
direkte Übermittlung von Emotionen. Mit Geräusch bezeichnen wir gewöhnlich etwas vage alle anderen
Schallereignisse, aber meistens meinen wir damit solche, die als ungeordnet oder auch als unangenehm oder
unerwünscht erscheinen, laute Geräusche bezeichnen wir als Lärm.

Teilbereich der Akustik:


1. Ultraschall - Schwingungen, die so schnell schwingen, dass unser Gehör sie nicht mehr wahrnimmt
2. Infraschall - Schwingungen, die zu langsam für unser Gehör erfolgen
3. Unterwasserschall - er wird mittels Sonargeräte bei der Suche nach Unterwasserobjekten angewendet.

2
Akustik 1 – kurze Fassung WS

4. Physiologische Akustik beschäftigt sich mit der Funktionsweise von Gehör und Gehirnnerven, sowie
deren Erkrankungen
5. Physioakustik hat die menschliche Wahrnehmung und Verarbeitung des Schalls, die Beurteilung,
Vergleich von und Reaktion auf verschiedene Schallereignisse zum Gegenstand
6. Sprache und Hören
7. Lärmmessung und -kontrolle
8. Raumakustik: Entwurf und Materialverwendung für die Schalleigenschaften von Wohnungen, Büros,
Konzerthallen usw.
9. musikalische Akustik beschäftigt sich mit den Mechanismen der Schallerzeugung durch
Musikinstrumente, den Auswirkungen der Schallwiedergabe und/oder der Wiedergaberäume auf den Klang;
schließlich der menschlichen Wahrnehmung von Klang/Geräusch als Musik.

Die Grenze zwischen Musik und Geräusch ist jedoch nicht präzise festlegbar. Jede neue Teenager-
Generation scheint sich für jene Musik zu begeistern, die ihren Eltern nur Kopfweh verursacht. Und viele
Komponisten, die heute zum klassischen Standartrepertoire gehören, wurden bei ihrer Uraufführung als
unerhört und abscheulich bezeichnet. Die Krawalle bei der Erstaufführung von Strawinskys Sacre di
Printemps waren ein extremer Fall, aber feindselige Reaktionen auf neue musikalische Ideen, wie zB die in
den 50er Jahren entstehende elektronische Musik sind ziemlich verbreitet.

Schall:

Man unterscheidet:
1.Luftschall
2.Wasserschall
3. Körperschall

Dem Ohr wird Schall durch das Medium Luft


übermittelt. Gemessen am statischen Luftdruck von ca.
100.000 Pascal (= 1 bar) ist der Wechseldruckanteil
(=Schalldruck) äußerst gering. Bereits bei 100 Pa (=134
dB SPL) ist die Schmerzgrenze des menschlichen Gehörs
erreicht.

Physikalische Grundlagen
1. Schall und Schallausbreitung
Jeder akustische Vorgang wickelt sich zwischen einem (oder mehreren) Schallsender (z.B. sprechende
Person) und einem Schallempfänger (z.B. Gehör, Mikrophon) ab.
Zwischen Sender und Empfänger liegt der Übertragungsweg. Als Übertragungsweg kann jede feste,
flüssige oder gasförmige Materie dienen. Im Vakuum findet keine Schallausbreitung statt.
Was ist Schall? Schall kann definiert werden als momentane und örtliche Änderungen des Druckes
und damit der Dichte der Materie.
Jede Materie besteht aus einzelnen kleinen Teilchen (Atome, Moleküle usw.), die sich in einem
bestimmten Abstand voneinander befinden. Dieser Abstand ist gegeben durch herrschenden Druck (z.B.
Luftdruck) oder die Dichte. Ändert sich der Druck, so ändert sich der Abstand der Teilchen. z.B. wenn eine
äußere Kraft auf die Moleküle wirkt (z.B. man schlägt mit einem Hammer auf ein Stück Holz), werden sie
alle in einer Richtung gedrängt. Es kommt zu einer Bewegung, die sich mit der thermischen Bewegung
überlegt und folglich entsteht eine Bewegungsrichtung. Wenn die Kraft auf bestimmten Ort wirkt, werden die
Moleküle in einer bevorzugten Richtung sich bewegen. So erzeugt man eine mechanische Schwingung, die
man als Schall bezeichnet.

3
Akustik 1 – kurze Fassung WS

Anders gesagt: Schall ist eine Störung der Luft, durch die er sich ausbreitet.
Luft als Übertragungsweg. Luft, der uns allen bekannte Schallträger, besteht aus Molekülen. Der Abstand
dieser Moleküle ist durch den Luftdruck gegeben. Schall besteht nun in einer örtlich begrenzten Änderung
des Abstandes dieser Teilchen. Das Teilchen kehrt nachher wieder in seine Ruhelage zurück. Es kann auch
eine Hin- und Herbewegung ausführen
Schall ist eine periodische Druckschwankung (verursacht durch Sprechen, ein Musikinstrument, etc.), die
sich in einem elastischen Medium (z.B. Luft, Wasser, Festkörper, etc.) ausbreitet.
Schall wird in der Luft durch Wellen übertragen, welche die Energie von der Entstehungsquelle nach
Außen abtransportieren. In Gasen oder Flüssigkeiten pflanzt sich der Schall immer nur in Form von
Längswellen (Longitudinalschwingungen: örtliche Verdichtungen und Verdünnungen) aus.
Bei wiederholter Krafteinwirkung bildet sich eine Folge von Maxima und Minima aus. Diese können
zeitliche regelmäßig oder unregelmäßig auftreten, je nach dem sich die Kraft zeitlich verhält. Einzelne oder
wenige derartige Druckwechsel empfinden wir als Knall, Schlag. Die kontinuierlichen Wechsel hören wir als
anhaltendes Geräusch, es handelt sich um HÖRSCHALL.
Für unsere Ohren sind die zwei wichtigsten Eigenschaften von musikalischem Schall seine Tonhöhe und
Lautstärke.
• Tonhöhe ist die Wahrnehmung, wie "hoch" oder "tief" ein Klang ist. (entsprechend links oder
rechts auf der Klaviertastatur). Wir nennen die Klänge mit hoher Tonhöhe oft auch einfach
"Höhen" und die tieferen entsprechend "Bässe".
• Mit Lautstärke bezeichnen wir die Wahrnehmung der Stärke oder Schwäche eines Klanges.
Für die Wahrnehmung eines Schalls sind 2 Parameter von der Bedeutung:
• Die Frequenz der Welle
• Die Amplitude der Druckschwankung
Die Frequenz wird von uns als die wahrgenommene Tonhöhe definiert, und der Amplitude entspricht die
Wahrnehmung der Lautstärke.
Die Schallausbreitung in der Luft kann nämlich durch eine besonders einfache Art von Gleichungen
beschrieben werden, die von Mathematikern als linear bezeichnet werden. Die physikalische Bedeutung der
Linearität ist, dass sich viele verschiedene Schallwellen durch ein und denselben Raum gleichzeitig
ausbreiten können, ohne dass eine die andere beeinflusst.

Frequenzbereiche und Tonhöhe

Der Bereich hörbaren Frequenzen umfasst ca 10 Oktaven und liegt im Allgemeinem etwas zwischen 20 Hz
und 20.000 Hz. Wir als Hörer sprechen über tiefen und hohen Tonhöhen, Akustiker und Physiker
unterscheiden folgende Frequenzbereiche:

4
Akustik 1 – kurze Fassung WS

Diese Einteilung ist subjektiv und je nach Eigenheit von Instrument oder stimme unterschiedlich.
Wichtig ist, dass unser Gehör Vielfach von Frequenzen als gleichmäßige Schritte in der Tonhöhe
empfindet. Verdoppeln wir die Frequenzen öfters, erscheint das unserem Ohr immer als gleich große
Erhöhung der Tonhöhe.

Schall mit höheren Frequenzen wird als Ultraschall genannt. Ein Schall mit tieferen Frequenzen
bezeichnet man als Infraschall.

Die Geschwindigkeit des Schalls


In Wellenlängen entspricht der hörbaren Bereich Werten von λ= 2cm für höchsten noch hörbaren, bis zu λ=
10m für die tiefsten Töne. Man kann somit die Schallausbreitung in Luft durchrechnen. Die
Schallgeschwindigkeit ist das Produkt aus Wellenlängen und Frequenz (v - Schallgeschwindigkeit, λ –
Wellenlänge, f – Frequenz):

Bei einem gewöhnlichen Gespräch scheinen die Schallwellen im gleichen Augenblick in unseren Ohren
anzukommen, in dem sie gesprochen werden. Ab den Abständen von 20 m oder mehr kann man aber
feststellen, dass die Schallwellen doch etwas Zeit für ihre Reise brauchen.

Die Geschwindigkeit von Schallwellen hängt von der Temperatur und Dichte der Luft ab. So z.B. in
trockener Luft bei Raumtemperatur von ca. 20 °C und Normaldruck von 1bar (oder 105 Pascal) beträgt die
Geschwindigkeit des Schalls: 344 m pro Sekunde, d.h. der Schall braucht ungefähr drei Sekunden, um einen
Kilometer zurückzulegen.
v20 = 344 m/s

5
Akustik 1 – kurze Fassung WS

Für uns Musiker ist wichtig, dass alle Schallwellen, gleichgültig welche Frequenz sie auch haben, sich mit
der gleichen Geschwindigkeit ausbreiten. Man stelle sich vor, wie es im hinteren Teil eines Konzertsaals
zugehen würde, wenn dies nicht der Fall wäre. Hohe und tiefe Töne, die zur gleichen Zeit von den Musikern
auf der Bühne gespielt werden würden, würden unsere Ohren zu verschiedenen Zeiten erreichen, sodass jede
akkordische Musik hoffnungslos chaotisch wahrgenommen werden würde.

Schalldruck und Schalldruckamplitude


Druck wird mit Pascal gemessen. Unter Druck versteht man der senkrechten Betrag einer auf eine Fläche
wirkenden Kraft durch die Größe dieser Fläche:

Die Veränderung des Druckes ist für unser Empfinden von Schallereignissen ausschlaggebend. Den
höchsten Wert, den der Druck während eines solchen Ereignisses innerhalb von einer der Dynamik gerechten
Zeitspanne erreicht, nennt man Schallamplitude. Beispiel: eine kurze Schwingung nd die langsame
Schwingung würde mehrere Sekunden abgespielt. Die langsamen Änderungen hören wir nicht, wir merken
aber dass die Amplitude des schnelleren Signal mit der zeit zum schwanken begonnen hat.
Der Abstand, den jedes Luftteilchen zu seinem normalen Ruhepunkt nach beiden Seiten hin erreicht,
während es vibriert. Dies nennen wir die Auslenkungsamplitude.

Wie beim Frequenzen gibt es auch beim Druck sog. Grenzbereiche unseres Hörens. Wir hören keine
absoluten Drücke. Da wir bei einem Schall um die Druckschwankungen sprechen, kann man sagen, dass wir
die entstehenden Druckunterschiede wahrnehmen. Der kleinste Druckunterschied, den wir noch wahrnehmen
können ist von der Frequenz und der Komplexität des Signals abhängig. Für eine Sinuschwingung von 200
Hz ist der Druck 2·105 Pa. Für sehr tiefen und sehr hohen Frequenzen liegt dieser Wert höher. So benötigt
ein Ton von 30 Hz 1000fache an Schalldruck m hörbar zu sein.

Die Druckamplitude verwendet man öfter. Diese ist als maximaler Anstieg des Luftdrucks in einer
Schallwellenverdichtung definiert.
Schalldruckamplituden sind ebenfalls sehr klein, aber sie können leicht gemessen werden, da
Mikromembranen sehr sensibel auf Druckschwankungen reagieren. Sie beschreiben nicht den absoluten
Druck, sondern die maximalen Abweichung des Druckes an einem Ort vom normalen Druck der Umgebung.

Man soll erklären, was Wörter wie Stärke und Druck im physikalischen Sinn bedeuten:
Immer, wenn man ein beliebiges Objekt drückt oder schiebt, übt man eine Kraft (bezeichnet als F) auf es
aus. Die Maßeinheit für Kraft ist das Newton (N), ungefähr 9,8 N entsprechen 1 kp (Kilopond).

6
Akustik 1 – kurze Fassung WS

Wellen und Schwingungen


Wellen sind also Schwingungen, die sich im Raum ausbreiten. Dazu müssen die schwingenden Teilchen
miteinander gekoppelt sein (verbundene Kettenglieder usw.) oder durch Stöße Bewegungsenergie
austauschen können (Flüssigkeiten).

7
Akustik 1 – kurze Fassung WS

Man soll zwischen Vibrationen und Wellen unterscheiden.


1) Wir bezeichnen mit Vibration die schnelle Hin- und Herbewegung eines einzelnen Objektes oder eines
kleinen Teils eines größeren Objektes, wie z.B. die Spitze einer Zinke der Stimmgabel.
2) Die Welle soll dagegen eine Störung bezeichnen, die sich von einer vibrierenden Quelle nach allen
Richtungen fortpflanzt.

Der Schall breitet sich in Form von Wellen aus. Alle Wellen haben gewisse gemeinsame Eigenschaften.
Wir können Schall manchmal besser erklären und verstehen, indem wir das entsprechende Verhalten von
anderen Wellenarten betrachten.
Einige Wellen können danach klassifiziert werden, ob die örtlichen Störungen quer (Transversal) oder
längs (Longitudinal) zur Ausbreitungsrichtung des Störungsmusters liegen.
• Wenn man ein horizontal gespanntes Seil hin- und herschwenkt, erzeugt man eine Querwelle
(Transversalwelle). Transversalwellen sind nur in festen Körpern möglich, z.B. Saitenschwingung,
Stäbe, Membrane.
• Erfolgt die Schwingungsbewegung entlang der Ausbreitungsrichtung der Welle, so bezeichnet man
diese als Längs- oder Longitudinalwelle.

Die Schallwellen sind nicht sichtbar und in Grafiken schwierig zu zeigen. Reine Longitudinal- und
Transversalwellen treten nur in solchen Körpern auf, deren Ausdehnung nach allen Richtungen als unendlich
groß oder zumindest als sehr groß gegenüber der Wellenlänge angesehen werden darf. Diese beiden
Wellenarten sind daher praktisch nur im Ultraschallbereich realisierbar.

Ein Teilchen bewegt sich, gibt seine Bewegung an die benachbarten Teilchen weiter: der Schall breitet
sich aus. Die Geschwindigkeit dieser Ausbreitung oder sog. Schallgeschwindigkeit ist von der Materie im
Übertragungsweg und deren Zustand abhängig. In Luft beträgt diese Ausbreitungsgeschwindigkeit etwa 340
m pro Sek. Zum Vergleich: Licht breitet sich etwa eine Million mal schneller aus.
Im freien Luftraum breitet sich der Schall nach allen Seiten aus. Man nennt das eine kugelförmige
Ausbreitung. Dieselbe Art der Ausbreitung besitzt z.B. die Wärme, die von der Sonne abgestrahlt wird.
Die Energie pro Fläche (cm2) nimmt mit zunehmender Entfernung vom Schallsender ab.
Man kann bei einem Schallvorgang zwei Bewegungen unterscheiden:
1) die Bewegung des einzelnen Teilchens des Übertragungsmediums, gemessen als Schnelle
2) die Ausbreitung des Schallereignisses, gemessen als Schallgeschwindigkeit.

8
Akustik 1 – kurze Fassung WS

Der Abstand von einem Wellenhügel zum nächsten entlang der Ausbreitungsrichtung wird als
Wellenlänge bezeichnet. Beachten Sie, dass Wellenlänge nicht in Richtung der Wellenhöhe gemessen wird.
Als Symbol für die Wellenlänge wird der griechische Buchstabe λ (Lambda) benutzt. Die Wellenlänge des
Schalls reicht von ungefähr λ = 2 cm für die höchsten noch hörbaren bis zu λ = 20 m für die tiefsten Töne.

Bei Saiten z.B. könnte man von Transversalschwingungen sprechen, wenn man sich die Saite
unendlich dünn vorstellt. Auch ein auf welliger Wasseroberfläche tanzender Kork macht annähernd eine
Transversalschwingung.

l=c/f
f=1/T
l Wellenlänge (m)
c
Schallgeschwindigkeit
(m/s)
f Frequenz (Hz)
T Periodendauer (s)

Schallwellen entwickeln und verändern sich in der Zeit, sie sind dynamisch. Im Gegensatz zu einem Bild
hält die Musik nicht still.
Es gibt mehrere charakteristische Zeitskalen für musikalische Ereignisse. Die Größte ist die Gesamtzeit
eines Werkes vom Beginn bis zum Ende, in der sich dessen Struktur entfaltet, sie kann zwischen einer
Minute und mehreren Stunden betragen.
Einzelne Töne dauern typischerweise ungefähr eine Sekunde, obwohl durchaus auch Dauern von
mehreren Sekunden ebenso wie solche von Sekundenbruchteilen auftreten können; wir wollen diesen Bereich
von Klangdauer die mittlere Zeitskala nennen.
Jeder erklingende Ton eines Musikstückes enthält viele einzelne Schallschwingungen, deren
Aufeinanderfolge so schnell ist, dass wir sie nicht mehr einzeln unterscheiden können. Die kleine Zeitskala
bewegt sich in der Größenordnung von Tausendstelsekunden.
Im frühen 17. Jh. erzeugte Galileo Galilei Klänge, indem er eine Spielkarte gegen die gezackte Kante
einer Münze rieb.

Manchmal sprechen wir auch von Periode (P) einer Schwingung, um die Zeit für einen einzelnen
vollständigen Schwingungsdurchlauf anzugeben. Man spricht über die Periodendauer (T) in der Sekunde,
somit bezeichnet man die Zetspanne, die während einem Wechsel von Maximum und Minimum vergeht. In
dem Bild ist das Abstand zwischen dem Anstieg und die Rückkehr zum ursprünglichen Punkt.

9
Akustik 1 – kurze Fassung WS

Periodendauer kann gleichbleiben, kann sich mit der Zeit verändern. Über Periode spricht man, wenn es
sich um wiederholende Muster handelt, bei denen man die Dauer messen kann. Das nennt man periodische
Schwingung. Die Schwingungen, bei welchen keine Wiederholung des Musters gibt, nennt man aperiodische
Schwingungen.

Frequenz (f), Maßeinheit – Herz (Hz)


Im 19. Jh. führten mehrere Forscher genaue Messungen der Schwingungsraten verschiedener Tonhöhen
durch, und zwar mit Hilfe von Sirenenscheiben oder Zahnrädern, die mit einer bekannten Geschwindigkeit
rotierten. Die Ergebnisse werden üblicherweise mit dem Begriff der Frequenz der jeweiligen Schwingung
angegeben.
Unter Frequenz versteht man die Häufigkeit, wie oft sich ein Wechsel zwischen Minimum und Maximum
in der Sekunde ereignet. Frequenz ist somit der Kehrwert der Periodendauer. Frequenz zeigt, wie viel
Sekunden den solchen Wechsel dauert.
Wir werden das Symbol "f" für die Frequenz benutzen, die in Schwingungen pro Sekunde angegeben
wird, meist mit der Benennung Hertz (Hz, benannt nach dem Physiker Heinrich Hertz, 1857-1894). So
beträgt die Stimmfrequenz, nach der die meisten Orchester stimmen f=440 Hz, der sog. Kammerton. Diese
Frequenz bedeutet, dass die Trommelfelle des Ohres 440 mal pro Sekunde schwingen
Der Bereich hörbarer Frequenzen umfasst ungefähr 10 Oktaven und ist allgemein als ungefähr zwischen
20 Hz und 20.000 Hz liegend bekannt. Wir bezeichnen niedrige Frequenzen als tiefe, hohe Frequenzen als
hohe Tonhöhen.
Die Träger-Frequenzen in der Rundfunktechnik sind viel höher. AM-Rundfunk (Mittelwelle) benutzt
einen Sendebereich um 1 MHz (1 Mio. Schwingungen pro Sekunde) und Fm-Rundfunk (Ultrakurzwelle,
UKW einen Bereich um 100 MHz; die Fernsehsender benutzen sogar noch um mehrere hundert MHz höhere
Bereiche).

Auslenkung: darunter versteht man die Änderungsstärke der beobachteten Größe (z.B. Druck) zu einem
Zeitpunkt in Relation zur Ausgangslage.

Amplitude: ist der größte Wert der Auslenkung.

Phasen (φ), Maßeinheit: rad (Radiant / ° Grad): Phasenanlage zeigt, wie weit eine Schwingung in
Relation zu einer anderen Schwingung (deren Anfang sich genau zum Zeitpunkt t=0befindet) verschoben ist.

10
Akustik 1 – kurze Fassung WS

Wir beschreiben die Schwingungen mit der Winkelfunktion Sinus und Cosinus, weil deren Verlauf zu
dem passt, was man bei den Schwingungen beobachtet. Die Phase ist eine Winkelverschiebung von
Schwingungen zueinander. Diese Schwingung ziehen wir als Referenz hinein.

11
Akustik 1 – kurze Fassung WS

12
Akustik 1 – kurze Fassung WS

Um Schwingungen (die nicht endlos sind) zu erhalten braucht man weitere Funktionen, die festlegen,
welche Frequenzen für die Summe mit welchen Amplituden einbezogen werden.

Wellenformen
Die moderne Technologie macht es uns noch leichter, entsprechende Information zu erhalten. Eine
Schlüsselrolle spielt dabei das Oszilloskop.

Oszilloskop

Ein Gerät, mit dem die Veränderungen eines elektrischen Signals über die Zeit sichtbar gemacht werden
können. Wir benötigen nur noch ein Mikrophon, das die akustischen in elektrische Signale umwandeln kann,
und können sofort jedes kleine Detail einer komplexen Schwingung sehen, sobald wir das Mikrophon an das
Oszilloskop anschließen.
Die Zahl möglicher Wellenformen von akustischen Schwingungen ist praktisch unendlich groß.
Schallwellen, die sich nach allen Seiten gleichmäßig ausbreiten, bezeichnet man daher als Kugelwellen.

13
Akustik 1 – kurze Fassung WS

Die Frequenz einer einfachen Schwingung ist immer bestimmt durch die Größe der Widerstandskraft und
die Größe der Massenträgheit. Die Schwingungen sind umso schneller, je steifer z.B. eine Feder ist. Und
umso langsamer, je größer die Masse ist. Die Frequenz hängt aber nicht von der Größe der Amplitude ab.
Energie ist eine unvermeidbare Eigenschaft jedes Körpers, auf dem wir Arbeit verrichten. Energie
verschwindet nicht irgendwohin. Energie kann von einem Körper auf einen anderen übertragen werden, oder
von einer Form in eine andere wechseln, aber die Gesamtsumme innerhalb des betrachteten Systems ändert
sich niemals.

Schallwellen transportieren ebenfalls Energie.

Eine besonders effektive Methode, um Energie gleichmäßig an einen Oszillator zu liefern, ist die mittels
Resonanz1, die dann eintritt, wenn die anregende Kraft ungefähr die gleiche Schwingungszahl aufweist, wie
diejenige, die der Oszillator natürlicherweise bevorzugen würde.

Schallquellen
Man kann natürliche und künstlichen Schallquellen unterscheiden.
Uns interessieren sowohl der Perfektionsgrad, mit dem die Reproduktion das Original wiedergibt, als auch
die technischen Prozesse des Aufnehmens, Speicherns und Wiedergebens von Schallwellen.
Es gibt grundlegende Unterschiede zwischen kurzen, schlagartigen- und gleichmäßigen Geräuschen
und Klängen.

***
SCHALLAUSBREITUNG

Schallwellen können ihre Ausbreitungsrichtung aus mehreren Gründen ändern.


Eine davon ist Reflexion an harten Oberflächen, was uns in der Form des Echos vertraut ist. Weitweniger
vertraut sind uns Brechnung (Refraktion) und Beugung (Diffraktion) der Schallwellen, welche umlenkende
bzw. zerstreuende Effekte beschreiben. Diffraktion spielt eine äußerst wichtige Rolle in der musikalischen
Akustik.

Reflexion und Refraktion


In der wirklichen Welt können sich Schallwellen niemals unendlich lange in die gleiche Richtung
ausbreiten. Wenn Schall auf ein Hindernis trifft, erwarten wir, dass er reflektiert wird. Schall wird von jeder

1
Wenn ein elastischer Körper nicht durch direkte Berührung, sondern durch einen anderen schwingenden Körper zum Schwingen
gebracht wird, spricht man von Resonanz. Diese Resonanz spielt vor allem bei Streichinstrumenten eine große Rolle, da bei ihnen
die Schwingungen der Saite durch den 'Resonanzkörper' sehr verstärkt werden.

14
Akustik 1 – kurze Fassung WS

Oberfläche mit beliebiger Form und Größe reflektiert. Ist die Oberfläche glatt, so ist die Reflexion
regelmäßig und wohlgeordnet. Eine raue Oberfläche führt hingegen zu unregelmäßiger oder diffuser
Reflexion.
Reflexion und Absorption haben somit einen großen Einfluss darauf, ob ein Raum für
Musikaufführungen geeignet ist oder nicht

Schallreflexion an einer ebenen


Fläche
Es gilt: a =a '

Brechung bezeichnet die Richtungsänderung einer Welle aufgrund einer lokalen Änderung ihrer
Ausbreitungsgeschwindigkeit, die durch die bei Brechzahl n beschrieben wird. Während Brechung die
Richtungsänderung einer Welle durch veränderte Geschwindigkeit in verschiedenen Medien ist, bedeutet
Beugung die Ablenkung an einem Hindernis (Spalt, Gitter, Linsenrand usw).

Brechung an Wassertropfen, die wie eine Sammellinse wirken (Motiv: Golden Gate Bridge)
Brechung bezeichnet die Richtungsänderung einer Welle aufgrund einer lokalen Änderung ihrer Ausbreitungsgeschwindigkeit,

Brechung mit Elementarwellen. Die gelben Punkte zeigen dabei gedachte Ausgangspunkte neuer Wellen.

Wellenbeugung (Diffraktion) an Öffnungen


Schall kann sich auch um Ecken herum ausbreiten, was wir uns innerhalb von Gebäuden als durch
vielfache Reflexionen bewirkt erklären. Die Beugung oder Diffraktion ist die „Ablenkung“ von Wellen wie
Licht- und anderen elektromagnetischen Wellen, Wasser oder Schwallwellen) an einem Hindernis. Bei
Beugungkann sich die Welle im geometrischen Schattenraum des Hindernisses (wie z.B. Spalt, Gitter usw.)
ausbreiten. Zur Beugung kommt es durch Entstehung neuer Wellen entlang einer Wellenfront gemäß des
Huygens-Fresnelschen Prinzip. Diese können durch Überlagerung zu Erscheinung einer Interferenz führen.

15
Akustik 1 – kurze Fassung WS

Beugung am Einfachspalt: es entsteht der sog. Minimum, bei dem die oberen und unteren Strahlen sich gegenseitig auslöschen.

Beugung an einer rechteckigen Öffnung Beugung an einer Kreisöffnung

Auch Lichtwellen können sich beugen, aber nicht stark genug. Wenn man aber Licht durch eine haarfeine
Spalte in einen verdunkelten Raum schickt kann man ein schönes Beugungsmuster beobachten.

Schallwellen sind wesentlich länger. Daher können wir bei Schallwellen an normal großen Gegenständen
starke Beugungserscheinungen erwarten.
Schallreflexion an einer rechtwinkeligen
Ecke:
Trifft ein Schallstrahl auf eine
rechtwinkelige Ecke, so wird er zweimal so
reflektiert, daß er parallel zum einfallenden
Strahl zurückkehrt.

Zwischen parallelen, reflektierenden


Wänden kann es zu sog. "stehenden Wellen"
kommen. Stehende Welle (Stehwelle) ist die
Interferenz zweier Wellen gleicher
Wellenlänge, aber mit entgegengesetzter
Ausbreitungsrichtung.Eine senkrecht
auftreffende Schallwelle wird hier immer
wieder mit ihrer eigenen Reflexion überlagert.
Dadurch können sich an gewissen Punkten die
Schallwellen ganz oder teilweise gegenseitig
auslöschen, an anderen verstärken. Im
Gegensatz zur fortschreitenden Welle gibt es
also ortsfeste Auslöschungen, die bei
Aufnahmen (z.B. tiefe Orgeltönen) und bei

16
Akustik 1 – kurze Fassung WS

Messungen stören.

Interferenz und Schwebungen

Was passiert, wenn gleichartige Schallwellen aus unterschiedlicher Richtung in einem Punkt zur gleichen
Zeit aufeinandertreffen?
Die Art und Weise, mit der Schallwellen sich gegenseitig verstärken oder auslöschen, wird als Interferenz
bezeichnet.
Interferenz beschreibt die Überlagerung von zwei oder mehr Wellen nach dem sog.
Superpositionsprinzip (d.h. durch Addition der Amplituden, und nicht der Intensitäten). Sie tritt bei allen
Arten von Wellen auf, also Schall, Licht, Materiewellen, usw.

Regenbogenfarben bei einem dünnen Ölfilm auf Wasser entstehen durch Interferenz an dünnen Schichten.

Destruktiver Interferenz bedeutet das gegenseitigen Auslöschen der Wellen.


Konstruktiver Interferenz ist das Verstärken der Amplituden der Wellen. Das Muster aus Stellen
konstruktiver und destruktiver Interferenz wird als Interferenzmuster bezeichnet.

Die Oberflächenwellen unterschiedlicher Richtungen durchdringen sich ungehindert. Im Kreuzungsbereich tritt Interferenz auf.

17
Akustik 1 – kurze Fassung WS

z.B. zwei Schallquellen, die identische Klänge erzeugen - zwei Lautsprecher, beide an einem Verstärker
mit einem monauralen (keine Stereo) Signal angeschlossen: Jedes mal wenn ein Wellenhügel vom ersten
Lautsprecher den Wellenhügel-Punkt erreicht, kommt dort gleichzeitig auch ein Wellenhügel vom zweiten
Lautsprecher an: wir sagen in diesem Fall, die beiden Signale sind bei Punkt A in Phase. Die gesamte
Störung bzw. Interferenz bei A hat also die doppelte Amplitude wie eine Welle alleine.
Was geschieht, wenn Wellen von zwei Schallquellen zwar ähnlich die gleiche Frequenz haben, aber nicht
ganz genau? In diesem Fall spricht man über sog. Schwebungen. Erklingen zwei Töne mit nur geringem
Frequenzunterschied gleichzeitig, hört man einen Ton mit wechselnder Lautstärke - Schwebung. Überlagert
man zwei Wellen mit ungleichen, aber nahe beieinander liegenden Wellenlängen λ1 und λ2, so ergibt sich
durch die Schwebung ein Muster.

In diesem Beispiel nähert sich einer von zwei nahe beieinanderliegenden Tönen den andern bis auf einen
Frequenzunterschied von 2 % an.
Das Resultat dieser Annäherung ergibt folgendes Bild:

Die Schwebung wird um so langsamer, je näher sich diese beiden Frequenzen kommen.

Um die Beziehung zwischen einer Schwebungsfrequenz und den beiden Originalfrequenzen


herauszufinden, wird ein 1-Sekunden-Intervall betrachtet und es wird exakt zu dem Zeitpunkt beginnen zu
lassen, in dem die beiden Wellen sich genau in Phase befinden.
Schwebungen werden oft von Musikern zum Stimmen ihrer Instrumente benutzt. Je schnellere
Schwebungen sie hören, wenn sie Ihr Instrument und ein anderes gleichzeitig anspielen, umso größer ist der
Unterschied in den beiden Frequenzen. Wenn sie nach dem Stimmen überhaupt keine Schwebungen mehr
wahrnehmen, dann sind die beiden Instrumente gleichgestimmt.

Musik im Freien
Musik wird meistens in geschlossenen Räumen aufgeführt. Jede Klangquelle im Freien klingt schwächer
als in einem Raum, jede Schallwelle, die bei ihrer Ausbreitung nicht auf Ohren trifft, ist für immer verloren,
während sie durch einen geschlossenen Raum gefangen und wiederholt hin und her geworfen wird.

18
Akustik 1 – kurze Fassung WS

Musik im Freien klingt „trocken“. Der Grund ist der gleiche: der ersten Schallwelle, die das Ohr erreicht,
hat kaum sich überlappenden Reflexionen, dadurch fehlen den charakteristische Hall und die Wärme eines
Raumklanges.
Man kann mit verschiedenen Strategien versuchen, diese Probleme in den Griff zu bekommen und den
Schall dahin zu lenken, wo er gebraucht wird. Wichtigstes Ziel ist es, irgendeine reflektierende Struktur so
hinter den aufführenden Musikern anzuordnen, dass der Teil der Schallenergie, der sonst in Richtungen
verschwendet würde, wo keine Zuhörer sind, in deren Richtung reflektiert wird.
Wenn das Publikum sich auf allen Seiten der Aufführenden befindet, kann zumindest noch der Teil des
Schalls umgeleitet werden, der sonst nach oben hin verloren ginge. Alle diese Hilfsmittel zusammen mit
elektronischer Verstärkung können eine ausreichende akustische Qualität von open-Air-veranstaltjungen
sicherstellen.

Lautstärke und Lautstärkenmessung


Manche Klänge sind kaum hörbar und andere wiederum so laut, dass sie schmerzen. Man redet über die
physikalische Messung von Lautstärke. Die menschliche Wahrnehmung der Lautstärke ist nicht damit
identisch, so dass wir den Ausdruck Lautheit für diese physiologische Wahrnehmung benutzen.
Bei der Beschreibung der Stärke von Schallwellen muss zwischen Amplitude, Intensität und Lautheit
unterschieden werden. Die ersten beiden sind physikalische Begriffe, der dritte ein psychologischer.
Intensität meint den Betrag des Energieflusses (Energiebetrag pro Flächeneinheit und Zeiteinheit, W/m2) und
ist proportional zum Quadrat der Amplitude.

Amplitude, Energie, Intensität


Was ist das geeignete Maß für die Lautstärke?
Ein Maß könnte uns die Amplitude der Schallwelle bieten. Man soll unterscheiden zwischen der
Auslenkungsamplitude (den größten Abstand, dem einen Luftteilchen von seinem Ruhepunkt aus nach beiden
Seiten erreicht) und der Schnelligkeitsamplitude (die größte Geschwindigkeit, die ein Luftteilchen während
seiner Auslenkung erfährt, auch als Schallschnelle bezeichnet). Alle beide sind jedoch nur mit
Schwierigkeiten direkt messbar, es ist viel leichter, die Druckamplitude zu messen.
Eine zweite Messmöglichkeit ist, direkt und primär mit der in einer Schallwelle enthaltenen Energie zu
arbeiten.
Die Regel sagt uns: Die Schwingungsenergie ist proportional zum Quadrat der Amplitude.

Die Tonstärke (Lautstärke) ist vor allem von der Amplitude der Schwingung, der Weite des Ausschlages
abhängig. Die Tonstärke wird in Phon oder Dezibel gemessen.
Jedem Intensitätsverhältnis entspricht ein Schallpegel-Unterschied in Dezibel. Jedes zusätzliche Dezibel
bedeutet die Multiplikation der Intensität mit dem Faktor 1,26 (gerundet 1, 3). So z.B. ein Schallpegel von
l1=0dB entspricht einer Intensität Io=10-12 W/m2.

Alle Töne, unabhängig von ihrer Frequenz, mit der gleichen Lautstärkepegel, werden als gleich laut
(isophon) empfunden. Man spricht über die Lautstärkepegel: es ist jener dB-Pegel, denn ein Sinussignal mit
einer Frequenz 1000 Hz haben sollen, damit wir ihn gleich laut empfinden wie das betrachtete Schallereignis.
Ein Geräusch, Klang mit demselben Phon-Pegel ist für uns immer gleich laut. Dabei kann aber Schalldruck je
nach Eigenschaften des Schalls unterschiedliche sein.
Bei einem Sinuston von 1kHz sind also der Lautstärkepegel in Phon und der Schalldruckpegel in dB
gleich groß.

19
Akustik 1 – kurze Fassung WS

Auf der senkrechten Achse ist der Schalldruckpegel eingetragen, auf die horizontalen – Frequenz. man verwendet die
logarithmische Scala, alle Vielfachen vom 10 sind im gleichen Abständen aufgetragen. Man erkennt, dass die Frequenzwerte sich
immer in Richtung des nächsten Vielfachen häufen. Die rote Kurve nennt man Isophone, was Kurven gleicher Lautstärke bedeutet.
Sie zeichnen die Kombination von Schaldruck und Frequenz nach, bei denen wir immer die gleiche Lautstärkeempfindung haben.
So z.B. 90DB bei etwas 30 Hz ist für uns genauso laut, wie 50dB bei etwas 200 Hz und 40dB bei ca 5 kHz.

Der Nachteil auf der Weise definierte Lautstärke ist, dass wir nicht genau sagen können, wie laut oder
leise etwas ist. Sie sagt nur: etwas ist so laut, wie ein Signal mit diesen oder jener Eigenschaften. Doppelt so
viele Phon heißt nicht, dass es doppelt so laut ist.

Man hat einen weiteren Begriff eingeführt: die Lautheit.


Die Lautheit gibt an, wie laut ein Schall subjektiv gehört wird. Die Lautheit "verdoppelt" sich, wenn der
Schall als "doppelt so laut" empfunden wird, man vergleicht somit zwei Schallereignisse. Lautheit ist ein
psychoakustischer Begriff, der beschreibt, wie Menschen die empfundene Lautstärke von Schall beurteilen.
Diese psychoakustischen Ergebnisse lassen sich mit physikalischen und medizinischen Gegebenheiten in
Beziehung setzen.
Maßeinheit für die Lautheit ist 1 Sone: es entspricht einem Lautstärkepegel von 40 Phon, d.h. ein
beliebiger Schall, der genauso laut wahrgenommen wird, wie ein Sinuston mit einem Schalldruckpegel von
40 dB bei einer Frequenz von 1 kHz.
Dann 2 Sone entsprechen einem doppelt so lau empfundenen Signal. Vieles hängt von der Frequenz des
Tones ab. Bei einem Sinuston der Frequenz 1 kHz führt eine Erhöhung der Lautstärke um 10 Phon zu einer
Verdoppelung der Lauheit, aber nur bei mittleren und hohen Lautstärken ab 40 Phon. Bei den niedrigeren

20
Akustik 1 – kurze Fassung WS

Lautstärken führt eine geringere Lautstärke-Erhöhung (weniger als 10 dB) zum Gefühl der Verdopplung der
Lautheit.

Zwei Schallquellen gleichen Schalldruckpegels (zum Beispiel von 60 Dezibel) klingen aber nicht doppelt
so laut wie eine allein. Vielmehr beträgt der Gesamtschalldruckpegel 20 log (2 • 103) = 60 dB + 20 log 2 = 60
dB + 6 dB = 66 dB.
Der Schalldruckpegel wächst also nur um 6 Dezibel und nicht um 10, was doppelter Lautstärke
entspräche. Die Schallintensität, die dem Quadrat des Schalldrucks proportional ist, wächst bei doppelter
Lautstärke sogar nur um 3 Dezibel — sie ist der Schallenergie und Schall-Leistung proportional.

Der Zusammenhang zwischen Lautstärke und Lautheit ist nicht linear. Bei geringen Lautstärken nimmt
das Lautheitsempfinden schneller zu als bei höheren. Oberhalb von 40 Phon entspricht einer Zunahme der
Lautstärke von 10 Phon die Verdoppelung der Lautheit.

Z.B. Eine Violine allein erzeuge eine Lautstärke von 60 Phon, was 4 Sone entspricht (40 Phon = 1 Sone,
alle 10 Phon Erhöhung – doppelt so viele Sone d.h. 2 Sone = 50 dB, 4 Sone = 60 dB).
Um die Lautheit auf 8 Sone zu verdoppeln, muß die Lautstärke um 10 Phon (d.h. von 60 auf 70 Phon)
erhöht werden.
Dies leisten 10 Violinen, denn 60 Phon + (10 log10 10) Phon = 60 Phon + 10 Phon = 70 Phon.
100 Violinen würden 16 Sone und 1000 Violinen ganze 32S erzeugen.

Jetzt wird wohl klar, weswegen ein Symphonieorchester 16 erste, 14 zweite Violinen, 12 Bratschen, 10
Violoncelli und 8 Kontrabässe beschäftigt, wenn es in voller Besetzung aufspielt.

21
Akustik 1 – kurze Fassung WS

Die vom Menschen wahrgenommene Lautstärke hängt von dem Schalldruckpegel, Frequenzspektrum und
Zeitverhalten des Schalls ab.
Wieso wir eine Lautstärke so oder anders wahrnehmen ist von der Art und Weise der Schallverarbeitung
im Innenohr abhängig. Dort werden die Schallschwingungen in Nervenimpulse umgewandelt. Je nach Stärke
der Erregung der Nervenzellen wird ein Geräusch lauter oder leiser beurteilt. Das heißt, trotz gleichen Pegels
(Schalldruck) empfindet das menschliche Gehör Töne unterschiedlicher Tonhöhe (Frequenz) nicht als gleich
laut.
Ein Sinuston von 50 Hz wird bei einem Schalldruckpegel von 50 dB SPL genauso laut wahrgenommen,
wie ein 4 kHz-Ton mit 12 dB SPL. Bei etwa 4 kHz liegt die größte Empfindlichkeit des menschlichen
Gehörs.

Bei der Wiedergabe von Geräuschen über Lautsprecher oder Kopfhörer soll ein plausibler ausgeglichener
Höreindruck vermittelt werden. Wegen der nahezu freien Wahl des Wiedergabepegels entsteht dabei leicht
ein unangenehmer Eindruck, wenn durch die Änderung gegenüber dem Originalpegel eine veränderte
Klangfärbung entsteht oder sogar wegen der pegelabhängigen Verdeckung einzelne Klangkomponenten
verschwinden.
Um sowohl bei laut als auch bei leise eingestelltem Verstärker eine dem Originalgeräusch entsprechende Wiedergabe aller
Frequenzen zu ermöglichen, werden viele Verstärker mit unterschiedlichen Schaltungen ausgerüstet, die eine gehörrichtige
Lautstärkeentzerrung vollbringen sollen. Dabei soll der Frequenzgang des dargebotenen Geräusches an den Wiedergabepegel
angepasst werden. Durch Drücken einer Taste mit der Bezeichnung loudness oder contour wird diese Funktion eingeschaltet. Diese
Funktion liefert aber nur einen eingeschränkten Nutzen, da die Anpassung zumeist zu einfach ausgelegt ist und die Anwendbarkeit
der Kurven gleicher Lautstärke (Isophonen) auf komplexe Signale zumindest umstritten ist. Zudem fehlt eine Anpassung an die
jeweilige Geräuschart und den Hörort.
Die Annahme, dass Höhen und Tiefen gleichermaßen angehoben werden müssen, ist nicht richtig. Die Isophonen laufen bei
Frequenzen höher als 1 kHz so gut wie alle parallel, daher wäre bei leiser Wiedergabe nur der Pegel der tiefen Frequenzen
anzuheben.
Die psychoakustischen "Kurven gleicher Lautstärkepegel" sind in ISO-Recommendation R226 (R454) und DIN 45630 Bl.2
(DIN1318) festgelegt.

***
Schallpegel und die Dezibel-Skala
Selbst die lautesten Klänge und Geräusche überschreiten kaum eine Intensität von 1 W/m2, trotzdem kann
deren Energie um eine Billion Mal größer sein als die der leisesten noch hörbaren Klänge.
Es ist zum Standard geworden, die Schallpegel-Skala zu benutzen, deren Einheit das Dezibel (dB) ist, man
führt die Schallmessungen mit Pegelmessgeräten durch, die Ablesewerte in dB liefern.
Ein Dezibel bedeutet: ein Zehntel von einem Bel, das Bel ist definiert als das Verhältnis von 10:1
zwischen zwei Intensitäten. Dies sollte man sich gut einprägen: ein Bel ist nicht der Betrag des Schalls, es ist
ein Verhältnis zwischen zwei Schallereignissen.
Beispiel: wenn der Klang Y - 10 mal so viel Energie hat wie der Klang X, dann sagen wir, der Pegel von
Y ist 1 Bel oder 10 dB höher. Iy/Ix=10

Wenn wir nun eine Folge von Klängen nehmen, von denen jeder 10-mal mehr Energie hat als der
vorhergehende, sehen wir, dass der letzte Schallpegel um n-Bel oder 10n dB größer als der erste sein muss.
Die Intensivitätsverhältnisse werden immer multipliziert, die Schallpegelwerte (dB) dagegen immer addiert.

22
Akustik 1 – kurze Fassung WS

Bild: Schallpegel für unterschiedliche Schallquellen

Das Abstands- oder Entfernungsgesetz.


Je mehr wir uns von einer ortsfesten Schallquelle entfernen, desto leiser wird der hörbare Schallpegel
werden. In einem geschlossenen Raum wird die Antwort wahrscheinlich kompliziert sein, in einem sehr
halligen Raum können die Echos tatsächlich so stark sein, dass der Schallpegel überall fast gleich ist. Aber
wenn wir die Schallquelle in die Mitte einer großen, flachen Wiese positionieren, haben wir eine Situation, in
der Schall sich gleichförmig in alle Richtungen ausbreitet und nicht zurückgeworfen wird, und in diesem Fall
können wir das Gesetz von der Erhaltung der Energie anwenden.

Zusammengesetzte Schallpegel und Interferenz


Jede Schallquelle erzeugt fortlaufend Energie: man kann einfach die Einzelintensitäten der beiden
Schallquellen addieren und erhält die Gesamtintensität des zusammengesetzten oder überlagerten
Schallpegels.
Was geschieht bei 10 sorgfältig gestimmten Geigen, dessen Spieler genau die gleiche Note spielen? Es ist
naheliegend, aber falsch, anzunehmen, dass wir die Amplituden addieren könnten und einen Gesamtklang
mit der 10fachen Amplitude und somit mit 100fachen Intensität erhielten, als wenn eine Geige alleine spielte.
In Wirklichkeit können jedoch die 10 Geiger niemals exakt die gleiche Frequenz erzeugen, egal wie sehr sie
sich auch anstrengen. Jedes Paar von leicht abweichenden Frequenzen erzeugt eine langsame Schwebung; die
Interferenz ist abwechselnd konstruktiv (Überlapperung der Amplituden) und destruktiv (Gegenseitigen
Auslöschen der Wellen). 10 Geigen zusammen produzieren daher viele unterschiedliche Schwebungsraten
gleichzeitig, manche schneller und manche langsamer, denn es ist sogar für einen einzelnen Spieler schon
unmöglich, die Frequenz exakt konstant zu halten.

Grundlegende Bestandteile der Musik


Musik hat bestimmten Strukturen und unser Gehirn befähigt uns, solche Strukturen und Muster als etwas
den einzelnen Klängen Übergeordnetes wahrzunehmen und sie wiedererkennen.

Die zeitliche Organisation von Musikereignissen.


Auch in der Musik muss man die ähnlichen Grenzen der Bewegung und der Wahrnehmung beachten.
Wenn man mit dem ganzen Arm schlägt, kann man kaum viel mehr als einen Trommelschlag pro Sekunde
spielen. Wenn man eine Passage auf dem Klavier spielt kann man mit dem Finger maximal 3-4 Noten pro
Sekunde ausführen.
23
Akustik 1 – kurze Fassung WS

Eine weiteren Frage ist: was ist dann die natürliche Zeiteinheit für einen Zuhörer? Man kann behaupten, es
ist eine Sekunde. Wir können zwei Passagen mit 20 Tönen pro Sekunde wahrnehmen, aber wir können dabei
nicht Ton für Ton verfolgen, sondern wir erfassen eine größere Einheit von einigen Tongruppen pro
Sekunde. Schnelle Passagen haben meistens den Charakter von Füllwerk und Verzierung.

Tempo bezieht sich auf den Puls der Musik, und ist oft der Entscheidung des Interpreten anheimgestellt.
Ein Metronom wir dazu benutzt, hörbare Klicks oder Lichtimpulse mit beliebigen Raten zu erzeugen und
damit das gleichmäßiges Urtempo vorzugeben.

Mit dem Metrum wird angegeben, wie die zugrunde liegenden Zeiteinheiten eines Stückes in Gruppen
jeweils zwischen zwei senkrechten Strichen der Partitur organisiert sind, diese Gruppen bezeichnen wir als
Takte.

Durch den Rhythmus werden Muster aus betonten und unbetonten Schlägen bzw. Taktzeiten gebildet.
Solche rhythmischen Muster kommen in einem Stück in unterschiedlichen variierten Kombinationen vor. Sie
bestimmen in erster Linie, welche Stimmung durch die Musik vermittelt wird.
Rhythmus und Metrum werden oft verwechselt, weil beide zeitliche Strukturen bezeichnen; Metrum ist
jedoch das übergeordnete Zeitmaß, in welches verschiedene Rhythmen sich einfügen können.
Kein Musiker spielt mit absoluter Gleichmäßigkeit.

Die rhythmischen Muster in der klassischen europäischen Musik und der Populärmusik sind eher relativ
einfach und geradlinig. Die benutzten spezielle Rhythmus-Gruppen, wie Hemiolen, Synkopen, Triolen sind
durch Metrum begrenzt. Die Musik mancher nicht-westlicher Kulturen, z.B. in Afrika, hat weitaus
komplexere rhythmische Muster entwickelt, wobei verschiedene Instrumente ineinander verflochten sind.

Melodie und Harmonie


Jeder Zeitschlag in einem rhythmischen Muster stellt eine neue Wahl-Situation dar für das, was dann
kommt: ein neuer Klang oder eine Pause, eine Gruppe den Tönen usw.
Melodie ist eine zeitliche Folge verschiedener Tonhöhen, die als kontinuierliche Linie wahrgenommen
wird, eine horizontale wellenartige Struktur, zeitlich und rhythmisch organisiert.
Harmonie ist die Kombination verschiedener Tonhöhen zur gleichen Zeit und gibt der Musik eine
vertikale Struktur. Während die Harmonie eine zusätzliche Eigenschaft der Musik darstellt, ist Melodie fast
immer vorhanden. Einfache Vokalmelodien überschreiten selten den Bereich einer Oktave.

Skalen (Tonleitern) und Intervalle


Welche von den möglichen Tonhöhen benutzt man, wenn eine Melodie komponiert wird?
Wenn der eben merkbare Unterschied bei der Frequenz- Wahrnehmung nur gerade 1 Hz beträgt, dann
stehen uns ja allein in der eingestrichenen Oktave (von 262 bis 523 Hz) mehrere Hundert unterscheidbare
Tonhöhen zur Verfügung. In zahlreichen Kulturen machen Musiker auch Gebrauch von diesen Mikrotönen.
Mit unseren Instrumenten haben wir uns dagegen auf lediglich 12 ausgewählte Tonhöhen pro Oktave
eingeschränkt: jede Abweichung von diesen wird als Fehler oder falsche Stimmung betrachtet. Solch eine
Gruppe ausgewählter Ton Höhenschritte nennen wir Skala oder Tonleiter.
Europäische klassische Musik beschränkt sich auf die chromatische Skala, die aus den genannten 12
Tonschritten besteht. Der Schritt von einer Taste zur nächsten, wie bekannt, wird dabei als Halbton oder
Semiton bezeichnet. Die standardisierten Orchesterinstrumente werden so gestimmt, dass sie zumindest
ungefähr die Töne einer gleichtemperierten Skala erzeugen.
Den wahrgenommenen Abstand zweier Tonhöhen nennen wir als Intervall: harmonisch oder melodisch.

24
Akustik 1 – kurze Fassung WS

Die Teiltonreihe (harmonische Reihe)


Man kann ein Experiment machen: es ist eine Gruppe elektronischer Oszillatoren da, die leicht auf
Sinuswellen beliebiger Frequenz eingestellt werden können. Es geht um einen Spezialfall, wo alle
Frequenzen einfache Vielfache einer einzigen Ausgangsfrequenz sind.
Einen solche Gruppe wird als Teiltonreihe (oder Partialtonreihe oder harmonische Reihe) bezeichnet.

Partialtöne (auch Naturtöne genannt) sind Obertöne, die z. B. von Blasinstrumenten durch Überblasen des Eigentons erzeugt
werden. Es handelt sich also um die Töne, die auf einem Blasinstrument ohne Betätigung eines Ventils oder Ähnliches gespielt
werden können. Die Frequenz der Partialtöne ergeben sich aus den ganzzahligen Vielfachen der Grundtonfrequenz.

Bsp.: Der erste Partialton (=Grundton) sei c. Das erste ganzzahlige Vielfache ist die doppelte Frequenz (2:1). Es ergibt sich also als
zweiter Partialton die Oktave c1. Die Frequenz des dritten Partialtons steht im Verhältnis 3:1 zur Frequenz des Grundtons. Dies
ergibt die Quinte über der Oktave, also den Ton g1. Als weitere Partialtöne folgen c2 (4:1, zweite Oktave), e2 (5:1), g2 (6:1), b2 (7:1),
c3 (8:1, dritte Oktave) usw.

Die Obertonreihe: Die rote Kurve zeigt den logarithmischen Charakter. Die Zahlen in der unteren Reihe geben die Abweichung
des jeweiligen Partialtones von der „gleichstufigen Stimmung“ in Cent-Maßeinheit an.

Beispielsweise die Folge. f = 110Hz, f2 = 220Hz, f3 = 330Hz usw., bis zu fn = n110Hz. Alle diese
Frequenzen haben den gleichen Abstand von jeweils 110 Hz zur vorhergehenden.

Beispiel: Obertöne einer Seite

Bereits vor dem Experiment wissen wir schon, dass diese Abstände nicht gleichen Abständen in der
Tonhöhe entsprechen. Man erkennt, dass Verhältnisse f2:f1 usw. jeweils eine Oktave ansprechen.
Die anderen Töne in dieser Reihe sind jedoch sowohl mathematisch als auch gehörbezogen von
besonderer Art. Zunächst scheint es, als ob die meisten von denen in unsere normale Tonleiter passen
würden. Zweitens zeigt ein Vergleich der oben genannten Frequenzen, dass viele, aber nicht alle
Oszillatortöne sehr nahe bei den Frequenzen der gleichschwebenden Temperatur liegen, nah genug, um sie
zulässigerweise mit den gleichen Notennamen bezeichnete zu dürfen: f3 = 330Hz ≈ 329,6 Hz= e1.
Eine Teiltonreihe kann auf jeder beliebigen Frequenz erreicht werden, die dann als ihr Grundton (1.
Partialton) bezeichnet wird. Die weiteren Töne der Reihe werden als zweiter, dritter usw. Partialton

25
Akustik 1 – kurze Fassung WS

bezeichnet. Einige Partialtöne passen einfach nicht in unseren üblichen musikalischen Rahmen, sie fallen
sozusagen "zwischen den Tasten" des Klaviers hindurch. Trotzdem gehören diese Töne zu der Teiltonreihe
und sind akustisch zu beachten. Sie fehlen in der chromatischen Skala und in der traditionellen westlichen
Musikkultur.
Auch wenn der dritte und fünfte Teilton musikalisch noch in einer Tonleiter eingeordnet werden können,
entsprechen sie doch nicht genau den Noten der gleichschwebend temperierten Skala. Die Antwort auf die
Frage "welche Frequenz" die richtige für ein oder ein anderes Intervall ist, ist abhängig davon, für welchen
Zweck das Intervall bestimmt sein soll, welche Anforderungen es erfüllen soll. Glücklicherweise ignorieren
unsere Ohren meistens einen relativ weiten Wertebereich für dieses Frequenzverhältnis.
Dieses Experiment gibt uns auch einen Hinweis auf einen sogar noch wichtigeren Aspekt der Teiltonreihe.
Wenn man den gleichzeitigen Klang aller Oszillatoren hört, klingen diese so gut zusammen, dass man
glauben kann, einen einzigen Ton zu hören.

Strukturen in der Musik

Melodien und Tonarten


Eine Melodie stellt alleine, auch ohne Harmonie, bereits einen großen Beitrag zur Entwicklung
musikalischer Form und Organisation dar. Tempo und Rhythmus einer Melodie stabilisieren einen
gefühlsmäßigen Eindruck, sie unterteilen mit Phrasen und Abschnitten ein Stück, vermitteln Info über
Anfang, Mitte und Ende. Ebenso wichtig ist die Wahl einer Skala für die melodiebildenden Noten und die
den einzelnen Noten zugewiesenen Rollen. Oft bilden letztere eine verstärkte Harmonie, auch wenn eine
solche nicht tatsächlich erklingt.
In der Skala haben wir einen Basston, den wir Tonika nennen, und deswegen bezeichnen wir diese Art der
Skalenbenutzung auch als Tonart oder Tongeschlecht. Für europäischen Musikkultur sind Dur und Moll
Tongeschlechtern dominierend.
Eine weitere wichtige Rolle ist die der Dominante, die als zweites Zentrum dient. Das Intervall zwischen
Dominante und Tonika war in den verschiedenen Kirchentonarten des Mittelalters nicht das gleiche. Für
diese Tonarten ist die akustische Beziehung zwischen der Dominante und der Tonika sehr eng - das
konsonantestes Intervall nach Oktave ist die Quint - und sie klingen daher, als ob sie ihre Funktion
gegenseitig in einer Art und Weise, die mit der Einführung der Harmonie noch viel deutlicher wird.
Eine weitere Rolle spielt der Leitton, z.B. VII Stufe, die zur Tonika aufgelöst sein soll. Dies ist eine so
kraftvolle Methode zur Verstärkung der Tonika-Funktion, dass in der harmonischen und melodischen Moll
Tonarten dieser VII Ton um einen Halbton erhöht wird, um so ebenfalls stärker die Leitton-Funktion
auszuüben. Zusätzlich wird der Leitton oft etwas zu hoch gesungen oder gespielt, so dass er noch weniger als
100 cent unter dem Zielton liegt.
Mit dem Begriff der Atonalität bezeichnet man die absichtliche Vermeidung jeglichen Eindrucks eines
tonalen Zentrums, indem alle Noten der Skala gleichwertig behandelt werden. Atonalität kann nicht mit den
sieben Noten der diatonischen Skala realisiert werden, da deren ungleiche Abstände unvermeidlicherweise
verschiedene Wertigkeit hervorbringen; die 12 Noten der chromatischen Skala haben jedoch keine solche
innere Struktur und können daher benutzt werden, um atonal zu komponieren.

Akkorde und harmonische Fortschreitung


Die elementaren Bestandteile der Harmonie werden durch Akkorde gebildet. Man soll einen Akkord nicht
einfach als eine Ansammlung von Tönen vorstellen, sondern als Kombination der Intervalle. Genau wie die
musikalische Rolle eines einfachen Zwei-Tön-Intervalls von dessen charakteristischem Klang abhängt
(bestimmt durch das Frequenzverhältnis), insbesondere vom Grad der Konsonanz oder Dissonanz, so gilt
dies auch für Akkorde.
Dies zeigt aber, dass die Auflistung der Intervalle in einem Akkord nicht ausreicht, denn Dur- und Moll-
Dreiklänge enthalten genau die gleichen Intervalle, klingen aber trotzdem deutlich verschieden.
Die Frequenzverhältnisse der Intervalle kommen auch in der harmonischen Reihe vor, die geben unserem
Muster-Erkennungs-Gehirn eine Möglichkeit, die Teiltöne alle Intervalltöne in einem gemeinsamen Muster

26
Akustik 1 – kurze Fassung WS

zu vereinen. Für unser Gehirn gibt es einen hierhin impliziten Grundton von 100 Hz, obwohl diese
Frequenz tatsächlich gar nicht einzuhalten ist. Können wir entsprechende implizierte Grundtöne für Akkorde
mit 3 oder mehr Tönen finden?

Probieren wir es zunächst an einem einfachen Dur - Dreiklang aus. Bei richtiger Stimmung weisen dessen
Töne das Frequenzverhältnis 4 : 5 : 6 auf. Dies allein reicht schon aus, damit unser Gehirn das Muster einer
harmonischen Reihe erkennt. Und das umso leichter, je komplexer die zugehörigen Wellenformen der
Einzeltöne sind. Die Frequenzen 400, 800, 1200 Hz vom ersten Ton, 500. 1000. 15000 Hz von dem zweiten,
600, 1200, 1800 vom dritten ergeben eine übereinstimmende Reihe der Frequenzen: 400, 500, 600, 800,
1200, 1500...HZ, die sehr stark auf einen fehlenden, also implizierten Grundton mit 100 Hz hinweist, Wir
schließen daraus, dass die 3 Töne dahingehend kooperieren, dass sie einen gemeinsamen implizierten
Grundton ergeben, den wir als die Wurzel des 3-klangs bezeichnen, die eine wichtige Rolle in der
harmonische Analyse klassischer Musik spielt.

Beispiel: einen Moll-Klang in reiner Stimmung: wenn die untere Terz ein 5:4 Verhältnis, die obere ein
solches von 4:5 hat, sind die kleinsten Verhältniszahlen, die dies zusammen ausdrücken 10:12:15. Wenn wir
die 3-Klangstöne auf 1000, 1200, 1500 Hz legen, ergibt sich die Liste der übereinstimmenden
Teiltonfrequenzen zu 100, 1200, 1500, 2000, 2400 usw. Hz. Die größte Zahl ist 100, so dass wir wiederum
sagen können, es liege ein implizierter Grundton bei 100 Hz vor.

Das menschliche Ohr und seine Funktionsweise

Man kann unser Ohrsystem in 2 Großen Unterteilen teilen: die sog. periphere Ohrsystem und Höhere
Organe.
Man kann weitere Vergleiche mit den technischen Geräten durchführen, so ähneln unsere Außenohren
einer Antenne mit Mikrophonen, die einer Schwingung aufnimmt, filtriert, verstärkt und leitet weiter ins Ohr.
Dort befindet sich ein Wandler, der diese akustische Schwingung in einer elektro-mechanische umwandelt.
Weiter besitzen wir diverse Filter, Vorverstärker, und wir sind im Stande eine spektrale Analyse
durchzuführen. Nach weiteren Veränderungen wird die Schwingung in einem Nervenimpuls umgewandelt
und zu den höhern Organen geleitet, die man mit einem Prozessor vergleichen kann: hier wird eine
Dechiffrierung stattfindet, man erkennt die Frequenzen, die Amplituden usw.

Die peripheren Systeme wird als Ohrsystem genannt. Unsere Ohren sind ein Instrument, dessen
bewegliche Teile außerordentlich klein sind. Die Teile sind unsichtbar und vor Beschädigung geschützt in
Vertiefungen des Schläfenbeinknochens untergebracht. Die Aufgabe des Ohres besteht darin, die
eintreffenden Luftdruckschwankungen in elektrische Nervenimpulse umzuwandeln, die dann durch das
Gehirn weiterverarbeitet werden.

27
Akustik 1 – kurze Fassung WS

Das Außenohr besteht aus den Ohrmuscheln (Pinna) und dem Gehörgang (Meatus), es endet am
Trommelfell. Der Innenteil der Ohrmuschel mit ca. 3 cm Durchmesser bewirkt einen Trichtereffekt für
kurzwellige Schallwellen in Richtung Trommelfell. Der Gehörgang hat ca. 1 cm Durchmesser und etwa 2, 5
cm bis 3 cm Länge: er wirkt als Verlängerung, um das empfindliche Trommelfell ins Innere des Kopfes zu
verlagern, wo es besser gegen Staub und scharfe Gegenstände geschützt ist. Das Trommelfell ist eine dünne
Scheibe aus faserigem Gewebe, die entsprechend den Schalldruckschwingungen im Gehörgang hin- und
herschwingt.

Das Mittelohr ist die geschlossene Kammer unmittelbar hinter dem Trommelfell. Sie ist mit der
Mundhöhle durch die eustachische Röhre verbunden, durch die der Druckausgleich erfolgt, um auf beiden
Seiten des Trommelfells gleichen Luftdruck herzustellen.

Die Verbindung zwischen Mittel- und Innenohr ist auf zwei kleine, mit Membranen verschlossene
Öffnungen, die als das ovale und das runde Fenster bezeichnet werden, beschränkt, sie schließen die als
Perilymphe bezeichnete Flüssigkeit des Innenohrs ein.
Das Mittelohr besteht im Wesentlichen aus den 3 Gehörknöchelchen, die als Hammer (Malleus), Amboss
(Incus) und Steigbügel (Stapes) bezeichnet werden. Sie wirken als Hebelsystem, welches die mechanischen
Schwingungen des Trommelfells auf das Innenohr umsetzt. Der Griff des Hammers ist am Trommelfell
befestigt, der Fuß des Steigbügels am ovalen Fenster. Bei gemäßigten Schwingungen bewegt sich der
Hammer ungefähr 1,3-mal stärker als der Steigbügel.

28
Akustik 1 – kurze Fassung WS

Das Mittelohr enthält zwei kleine Muskeln: den Hammermuskel (Tensor tympani) und Steigbügelmuskel
(Stapedius). Der Hammermuskel ist am Hammer befestigt und erhöht die Spannung des Trommelfells. Der
Steigbügelmuskel zieht den Steigbügel seitwärts und vermindert dadurch die Beweglichkeit der 3
Knöchelchen. Beide Muskeln können die Schallübertragung durch das Mittelohr reduzieren und das Innerohr
vor einer Beschädigung bewahren.
Das Innenohr ist ein Gewirr von Gängen im Felsenbein, die auch die Bogengänge des
Vestibularapparates beinhalten, der dem Gleichgewichtsinn dient. Die Schnecke (Cochlea) ist ein sich
verjüngendes Rohr, das schneckenförmig rund 3-mal aufgewickelt ist. In der Schnecke findet sich eine
komplexe Struktur. Sie teilt die Schnecke in zwei mit Perilymphen gefüllte Gänge. Zwischen ihnen liegt ein
weiterer Kanal der Schneckenkanal, der mit einer zähen Flüssigkeit, der Endolymphe, gefüllt ist. Die obere
Begrenzung des Schneckenkanals ist die Vestibularmembran.
Die Basilarmembran bestimmt durch ihre Schwingungen, was wir hören!
Das Cortiche Organ sitzt auf dem inneren Teil dieser Membran, es enthält mehr als 20.000 sog.
Haarzellen. Durch die Bewegung unterschiedlicher Teile der Basilarmembran werden verschiedene
Haarzellengruppen angeregt und beginnen, Signale in die angrenzenden Zellen der Gehörnerven zu senden.

Aufbau des Innenohrs

Kein einziger der Hörnervenstränge geht direkt vom Innenohr bis in das Gehirn, vielmehr werden die
Signale mehrfach gemischt, bevor sie in den auditorischen Cortex (primäre Hörrinde) gelangen, wo die
Signale bewusst interpretiert werden. Unsere Hörwahrnehmung hängt ebensoviel von diesen Prozessen im
Gehirn wie von der Physiologie des Innenohres ab. Das Wissen, wie das Gehirn diese Informationen
bearbeitet ist noch nicht so groß.

Grenzen der Hör- und Unterscheidungsfähigkeit


Menschliche Ohren reagieren auf Geräusche und Klänge nur innerhalb bestimmter Grenzen der Lautstärke
und des Frequenzbereichs. Am empfindlichsten sind wir für Schallwellen mit Frequenzen zwischen 2-5 kHz.
Ein Schallpegel von 0 dB (Intensität 10= 10 -12 W/m2) wird oft als leicht zu merkender Schallwert für die
leiseste von uns noch hörbare Lautstärke genannt. Ein Durchschnittswert für junge Menschen bei guter
Gesundheit liegt bei etwa 17 - 18 kHz. Tiefere Frequenzen als 30 Hz sind nur mit Mühe wahrnehmbar. Unter
geeigneten Bedingungen (große Intensität, die Isolation usw.) kann es durchaus möglich sein, Sinuswellen
bis zu 20 Hz und sogar 15 Hz hinab zu hören.
Wie groß muss nun unter den Klängen, die wir hören können, der Unterschied zwischen zwei von ihnen
sein, damit wir sie als verschiedene Klänge wahrnehmen? Die Frage gilt auch für andere
Sinneswahrnehmungen. Alle diese Fragen werden durch Psychophysik beantwortet, der Bestimmung des

29
Akustik 1 – kurze Fassung WS

eben merkbaren Unterschieds (JND - Just Noticeable Difference2), auch als Abstandsempfindlichkeit
bezeichnet. Uns interessiert die JND sowohl bei der Lautstärke (Schallpegel), als auch bei der Frequenz
(Tonhöhe) von Sinuswellen.

Eigenschaften von Dauertönen


Die Dauer eines Klanges ist ein wesentliches Merkmal eines musikalischen Ereignisses.
Um ein gleichbleibenden Klang vollständig physikalisch zu beschreiben, brauchen wir Angaben:
Amplitude (oder gleichwert Intensität), Schwingungsfrequenz und Wellenform.
Um unserer psychologischen Wahrnehmung dieses Klanges zu beschreiben, benutzen wir folgenden
Angaben: Lautstärke, Tonhöhe, auch Klangfarbe (Klangqualität, Timbre).

Die Definition für Klangfarbe beinhaltet, dass sie sich wesentlich von den anderen beiden Kategorien
unterscheidet: Lautstärke und Tonhöhe sind einfach eindimensionale, kontinuierliche Größen, während
Klangfarbe komplex ist.

Lautstärke und Intensität Wahrnehmung


Größere Luftdruckschwankungen verursachen in der Übertragungskette größere Schwingungs-
Amplituden zuerst des Trommelfells, dann der Mittelohrknöchelchen, des ovalen Fensters, der Perilymphe
und schließlich der Basilarmembran. Heftigere Bewegung der Basilarmembran bedeutet stärkere Reizung der
Haarzellen und damit mehr zum Gehirn geschickte Nervenimpulse.
Die Nervenzellen schicken nicht etwa schwächere oder stärkere Impulse an das Gehirn je nach Stärke der
empfangenen Reizung, sie sind vielmehr An-Aus-Schalter, sie beenden einen Impuls oder nicht. Die Impulse
haben die gleiche Stärke. Die Wahrnehmung der Lautstärke im Gehirn ist eine Interpretation des Gehirns für
die durchschnittlich ankommende Zahl von Impulsen auf dem auditorischen Nervenkanal.
Es gibt eine Skala für die Wahrnehmung von Lautstärke, mit der viele Leute übereinstimmen können, sie
bleibt aber trotzdem von Individuum zum Individuum unterschiedlich. Wir geben die Lauheit mit der Sone-
Maßeinheit.

Tonhöhe und Frequenz


Manche Klänge haben eine klare und eindeutige Tonhöhe, andere sind schwer zu beurteilen.
Wir behaupten: unsere Ohren ordnen jeder periodischen Wellenform (die sich unverändert wiederholt)
fast exakt die gleiche Tonhöhenwahrnehmung zu wie einer Sinuswelle mit der gleichen Frequenz.
Es gibt grundlegende Unterschiede zwischen dem, was wir über die Beziehung Lautheit-Intensität gesagt
haben, und der Beziehung Tonhöhe-Frequenz.
Lautheit ist eine Angelegenheit von stark oder schwach, mehr oder weniger, einschließlich des Wertes
Null.
Tonhöhe dagegen ist dort oder hier, hoch oder tief, links oder rechts, und die Vorstellung einer Null-
Tonhöhe ist sinnlos.
In technischer Terminologie wird dieser Unterschied dadurch ausgedrückt, dass Lautstärke auf einer sog.
prophetischen Skala gemessen wird, Tonhöhe dagegen auf einer mathematischen Skala.
Für unsere Zwecke ist das Urteil gut geschulter Musiker mit scharfen Ohren wichtig. Die natürliche
Einheit für dieses Urteil ist ohne Frage die Oktave. Jede Oktave wird als gleiche Veränderungseinheit durch
die gesamten Tonhöhen Bereich betrachtet, der überhaupt einigermaßen vernünftig und daher musikalisch
sinnvoll beurteilt werden kann. Innerhalb der Oktave dienen weitere musikalische Intervalle als
unveränderliche Einheiten der Tonhöhenunterscheidung.

Tonhöhe und Lautstärke


Man soll die Abhängigkeit der Tonhöhenwahrnehmung von der Intensität oder der Wellenform sowie die
der Lautheit von der Frequenz untersuchen.

2
Die differentielle Wahrnehmbarkeitsschwelle (auch JND von engl. Just Noticeable Difference "eben noch bemerkbarer Unterschied")
bezeichnet in der Psychophysik einen eben noch sinnlich wahrnehmbaren Reizunterschied.

30
Akustik 1 – kurze Fassung WS

1. große Änderungen der Intensität können eine Veränderung der Tonhöhenwahrnehmung um maximal
etwa einen Halbton bewirken, auch wenn die Frequenz unverändert bleibt. Niedrige Töne haben die Tendenz,
etwas tiefer und hohe Töne etwas höher wahrgenommen zu werden, wenn sie mit großer Lautstärke
erklingen. Mittlere Töne werden kaum beeinflusst.
Dieser Effekt gilt vor allem für Sinuswellen oder andere einfache Wellenformen. Die komplexen
Wellenformen, die in der Musik vorherrschen, werden in ihrer Tonhöhe unabhängig von der Lautstärke
wahrgenommen.

2. Man hat beobachtet, dass Klänge mit gleicher Intensität, aber verschiedener Frequenz sehr
unterschiedliche Lautheitswahrnehmungen bewirken. Man sucht den Weg um darzustellen, wie die
Lautheitswahrnehmung sowohl von der Intensität als auch der Frequenz abhängt.

Wir bestimmen die Lautstärke in 2 Schritten:


1) wir lesen aus dem Fletcher-Munson-Diagramm die Lautstärke an der Kennlinie ab, die sich für eine
bestimmte Frequenz und Intensität ergibt, und danach
2) gehen wir von diesem Lautstärkepegel in Phon zu dem entsprechenden Lautheits-Wert in sone.

Die Hörschwelle (auch Reizschwelle) ist derjenige Schalldruck bzw. Schalldruckpegel, bei dem unser
Gehör Töne oder Geräusche gerade noch wahrnimmt. Die Hörschwelle lässt sich recht genau durch
subjektiven „Ja-Nein“-Aussage, üblicherweise für beidohriges Hören einer Frontalschallquelle, feststellen.
Diese Größen sind stark von Frequenzen abhängig.
Der kleinste Schalldruck, der in diesem Bereich gerade noch wahrnehmbar ist, beträgt 20 µPa. Dieser
Wert wurde als Referenz für den absoluten Schalldruckpegel bei 2 kHz festgelegt.
Diese Kurve begrenzt die untere Hörfläche. Die obere Begrenzung der Hörfläche wird Schmerzschwelle
genannt. Davor gibt es ein größeres Gebiet das Unbehaglichkeitsschwelle genannt wird.

Wird das Hörvermögen beeinträchtigt, dann ist das immer am Verlauf der individuellen Hörschwelle erkennbar. Die Messung
der Hörschwelle wird mit reinen Sinustönen vorgenommen und zwar durch ein "Ton-Audiogramm", das man üblicherweise beim
Ohrenarzt bekommen kann. Dort wird der Hörtest meistens über Kopfhörer vorgenommen. Solch ein Diagramm ist für die
Diagnostik eines Hörschadens von großer Bedeutung. Aus dem Frequenzgang des Hörverlusts, das ist der Schallpegelabstand
zwischen gemessener Hörschwelle und einer "normalen" Hörschwelle mit mehreren Frequenzen, kann genauer auf die Art des
Hörschadens geschlossen werden.
Bei zunehmendem Alter ist durch die Hörschwellenkurve gut die normale Alters-Schwerhörigkeit bei höheren Frequenzen
festzustellen.

Unser Gehör kann nicht alle Schwingungen (Frequenzen) wahrzunehmen: diejenige kleinerer als 16 Hz
liegen außerhalb des hörbaren Bereichs, sie liegen unterhalb der Hörschwelle.
Zur Hörschwelle gehört also der Schalldruckpegel und die Frequenz. Für hohe Frequenzen hängt diese
Grenze vom Alter (und Gesundheitszustands des Gehörs) ab und reicht bei jungen Menschen bis etwa
19000Hz.

Das Audiogramm beschreibt das subjektive Hörvermögen eines Menschen. Es ist das wichtigste
Diagnosewerkzeug der Audiologie und ist eine Technik der Audiometrie. Mit einem Audiogramm können
Aussagen über die Symptome und manchmal auch über die Ursachen von Störungen des Hörvermögens
getroffen werden. Abweichungen von der Norm im Audiogramm lassen auf eine Erkrankung des Ohres
schließen.
Ein Audiogramm wird unter Mithilfe der zu untersuchenden Person erstellt. Ein Untersucher - heute auch ein Computer - spielt
bestimmte Töne in genau festgelegter Lautstärke über Lautsprecher ab. Die zu untersuchende Person teilt dem Untersucher mit,
wenn sie den Ton hört. Dies kann z.B. durch Drücken eines Knopfes geschehen. Die Töne werden sowohl in ihrer Höhe, als auch
in ihrer Lautstärke variiert. So entsteht eine Art gerasterte Landkarte, in der jeder Punkt eine Tonhöhe-Lautstärke-Kombination
beschreibt, die vom Untersuchten entweder gehört, oder nicht gehört werden kann. Immer lässt sich die Karte in zwei
zusammenhängende Gebiete einteilen. Die Grenzlinie bezeichnet man als Hörschwelle.

31
Akustik 1 – kurze Fassung WS

Unterschiedliche Arten der Tonhöhenwahrnehmung


Wir haben 3 verschiedene Arten von Tonhöhenwahrnehmung zu unterscheiden.
• Die komplexeste ist die des absoluten Gehörs. Es ist Fähigkeit die Tonhöhe eines einzelnen Tons
zu identifizieren oder sie singend nach Vorgabe des bloßen Notennamens exakt zu treffen, ohne
einen Referenzton zu haben. Diese Fähigkeit ist nur bei einem kleinen Teil der Bevölkerung
anzutreffen. Möglicherweise ist sie angeboren, sie wird aber verloren, wenn sie nicht geübt wird,
mit Sicherheit spielt es eine große Rolle, dass sie bereits in sehr früherem Alter trainiert wird.
• Die nächste Art ist der Unterschied des Abstandes zwischen zwei Tonhöhen, also der
Intervallgröße. Auch diese Fähigkeit des relativen Hörens ist bei vielen Menschen schlecht
entwickelt, aber trainierte Musiker können es.
• Es ist einfachste Art der komparativen oder vergleichenden Tonhöhenwahrnehmung. Der Hörer
beurteilt lediglich, ob 2 Töne gleich hoch sind oder welcher von zwei Tönen höher ist, ohne jedoch
festzustellen, um wie viel höher.

Es ist eigentlich erstaunlich, dass wir zwei Tonhöhen selbst dann gut vergleichen können, wenn einer
davon eine reine Sinuswelle ist, der andere dagegen von einem akustischen Instrument stammt und
zahlreiche stark vertretene Teiltöne in seinem Spektrum aufweist. Trotzdem kann das Ohr länger anhaltende
Instrumentalklänge problemlos mit Sinuswellen vergleichen, wobei die Grundfrequenz des Naturklangs als
Bezugspunkt erkannt wird.

Mechanismen der Tonhöhenwahrnehmung


Verschiedene Theorietypen der Wahrnehmungstheorie: Telefontheorie, Ortstheorie, Periodizität- und
Mustererkennungstheorie.
1). Die sog. Telefontheorie der Hörwahrnehmung (Rutherford 1886) ist eine natürliche Analogie, die
entstand nachdem Graham Bell das Telephon erfunden hatte. In ihrer extremsten Form sagt die Theorie aus,
dass das Ohr sozusagen wie ein Mikrofon funktioniere und Schallwellen in entsprechende elektrische Signale
umwandle. Das Ohr würde demnach keinerlei analysierende Funktion weitergegeben.

2). Die Ortstheorie wurde von Helmholz (1863) vorgeschlagen und von Békésy getestet und
weiterentwickelt. Sie bezieht ihren Namen von der Vorstellung, dass jede Tonhöhe der Erregung eines
bestimmten Ortes in der Basilarmembran entspricht. Die Einfachheit und Klarheit dieser Theorie erklärt ihre
Popularität: verschiedene Frequenzen erregen immer vorzugsweise verschiedene Stellen der Basilarmembran
und damit auch verschiedene Nervenenden.
Die ursprüngliche Theorie Heimholz´s baute auf seiner Resonanztheorie auf. Wenn ein und dasselbe
Erregersignal auf verschiedene Schwingkreise die stärkste Amplitude zeigt, lässt sich die Frequenz des
Erregers feststellen. Die Härchen der Basilarmembran sich voneinander hinsichtlich ihrer Länge und
Steifigkeit zu unterscheiden, so dass in der nähe des Ovalen Fenster leichter auf hohe Frequenzen und weiter
davon weg zunehmend leichter auf tieferen Frequenzen reagieren bzw. in Schwingung geraten. Man muss
also annehmen, dass das Gehirn seine Tonhöhenwahrnehmung einfach daraus bezieht, welche Nervenenden
am stärksten angeregt werden. Zugunsten der Ortstheorie sprechen Messungen, die an menschlichen
Gehörgängen etwa eine Stunde nach dem Tode gemacht wurden und eine Art Messkarte der
Membranresonanz ergeben. Diese Theorie stimmt gut mit dem Ohm´schen Widerstandsgesetz überein.
Verschieden Teiltöne eines Klangs regen verschiedene Stellen der Membran bevorzugt an. Nur deren relative
Resonanzstärke spielt dann eine Rolle, nicht jedoch die Phase.

3). Die konkurrierende Periodizitätstheorie wurde in einer langen Folge von psycho-physischen
Experimenten von holländischen Wissenschaftlern entwickelt, beginnend etwa um 1940 mit J.F. Schouten.
Diese Theorie geht davon aus, dass die von der Schnecke ans Gehirn gesendeten Nervenimpulse bereits mehr
als nur die Information über die relative Stärke der harmonischen Teiltöne enthalten. Vielmehr wird auch ein
Teil der Information über die originale Wellenform übermittelt. Die einfachste Methode diese Information zu
übermitteln, besteht darin, dass jede Nervenzelle vorzugsweise nur während einer Teilschwingung der

32
Akustik 1 – kurze Fassung WS

Basilarmembran feuert. Dies funktioniert jedoch nur bei den tieferen Frequenzen bis zu ungefähr 1 kHz
hinauf gut. Voraussetzung ist, dass das Gehirn irgendwie in der Lage ist, die Zeitspanne zwischen den
auseinanderfolgenden Bündeln von Nervenimpulsen (das heißt die Schwingungsperiode der eingetroffenen
Schallwelle) ziemlich genau zu messen.
Ein besonderer Vorzug der Periodizitäts- Theorie ist, dass sie die Wahrnehmung einer Tonhöhe trotz
fehlenden Grundtons durch das Vorhandensein eines Residualtons erklären kann. Anstatt eines Problems
wird nun ein Vorteil aus der Art, weil sich die Erregungskurven der Basilarmembran stark anregen. Die
Kombination mehrerer hoher Teiltöne ergibt dabei eine resultierende Wellenform mit hervortretenden
Amplitudenspitzen, deren Zeitabstand genau der Periodenlänge des Grundtons dieser harmonischen Reihe
entspricht, so dass eine periodenmessende Schaltung des Gehirns die gleiche Botschaft erhalten wird, als
wenn tatsächlich ein Grundton vorhanden wäre, und daher auch dessen Tonhöhe als vorhanden meldet.
Die größten Stärken der Periodizitätstheorie liegen in ihrer Fähigkeit, Tonhöhenwahrnehmungen selbst bei
ungewöhnlichen Klängen zu erklären, wie sie in traditioneller Musik nie vorkommen. Solche Klänge
bestehen aus einer Reihe von Teiltönen, die elektronisch verschoben werden, so dass sie zwar noch den
gleichen Abstand zueinander haben, aber nicht mehr vollständige Vielfache des Grundtons sind.
Man nimmt zB den 9, 10 und 11. Teilton eines Grundtons von 200 Hz und verschiebt diese ein wenig zu
1830, 2030 und 2230 Hz oder auch mehr zu 1860, 2060, 2260 Hz. Die wahrgenommene Tonhöhe verschiebt
sich dann ebenfalls nach oben in einer Weise, für die Ortstheorie keine Erklärung hat. Es bleiben auch
Zweideutigkeiten zu erklären, bei denen die Zuordnung des Testsignals zwischen 2 verschiedenen Tonhöhen
hin – und herschwankt. Die detaillierte Wellenform dieser nichtharmonischen Reihe wiederholt sich nicht
genau, weist aber eine Hüllkurve auf, deren Form sich wiederholt Die Wiederholfrequenz dieser Hüllkurve
bleibt aber unverändert bei 200 Hz, so dass sie offensichtlich nicht die Grundlage der
Tonhöhenwahrnehmung sein kann. Die experimentellen Daten werden dabei so gewonnen, dass wir die
Zeitspanne von einer Spitze der detaillierten Wellenform zur nächsten Spitze über der Senke in der Hüllkurve
messen.
Die Periodizitätstheorie führt auch zu der Annahme, dass Tonhöhen und Klangfarbenwahrnehmung von
komplexen Klängen sehr von den relativen Phasen der einzelnen Teiltöne abhängen, damit ließe sich dann
aber die Gültigkeit des Ohm´schen Gesetzes nicht erklären.

4). Die moderne Theorie der Tonhöhenwahrnehmung


Man hat eine kombinierte Theorie entwickelt, die als Mustererkennungs-Theorie bezeichnet wird.
Mehrere und bedeutende Varianten davon wurden unabhängig voneinander etwa um 1973 von Wightman,
Goldstein und Terhardt entwickelt. Alle betonen die weitere Verarbeitung im Gehirn gegenüber derjenigen
im Ohr.
Die Ohren übermitteln demnach in erster Linie Information über das Klangspektrum, und die
Identifizierung von Periodizität durch das Ohr wird auf eine geringere Rolle reduziert, gleichwohl nicht
völlig ausgeschlossen. Die Wissenschaftler sind heute überzeugt, dass es das Gehirn ist, welches versucht, in
den von den Ohren übermittelten Signalen Anzeichen von Ordnung – d.h. Muster - zu erkennen. Wenn es
etwas entdeckt, das Ähnlichkeit mit einer harmonischen Reihe hat, ordnet es diesem Muster eine Tonhöhe
mit der entsprechenden Grundfrequenz zu.
Am stärksten für Mustererkennungsprozesse im Zentralhirn spricht vielleicht die Tatsache, dass von
beiden Ohren kommende Informationen für die endgültige Beurteilung kombiniert werden. Verschiedene
Experimente mit dichotischen Signalen (dabei werden verschiedene Schallinformationen für jedes Ohr,
mittels Kopfhörer übertragen) haben dies gezeigt, wobei die von Houtsma und Goldstein (1972) besonders
elegant und musikalisch ausgekräftigt sind. Angenommen, Frequenzen mit 1200 und 1600 Hz werden dem
rechten Ohr, eine mit 1400 Hz dem linken zugeführt. Wenn die Tonhöhenwahrnehmung durch jedes Ohr
getrennt erfolgt, müsste man erwarten, zwei verschiedene Tonhöhen zu hören, und zwar 400 Hz rechts und
14000 Hz links. Die Versuchspersonen hörten jedoch nur eine Tonhöhe für den kombinierten Klang, obwohl
diese dichotische Tonhöhe ausgesprochen schwach und schwierig zu hören ist.
Das Gehirn versucht mit allen Möglichkeiten, geordnete Muster auch dann zu entdecken, wenn solche im
originalen Schallreiz gar nicht vorhanden sind.

33
Akustik 1 – kurze Fassung WS

Die Theorie der Mustersuche und Mustererkennung passt ausgezeichnet zu unserer


Tonhöhenwahrnehmung bei Klavierklängen, Glocken oder Pauken. Das Klangspektrum des Klaviers ist leicht
unharmonisch, aber das Gehirn ignoriert einfach die kleinen Abweichungen. Glocken und Pauken haben aber
ganz unregelmäßige Spektren, die sich beträchtlich von harmonischen Reihen unterscheiden. Solange jedoch
das Gehirn auch nur ein paar Komponenten findet, die wenigstens ungeführt zu einer harmonischen Reihe
passen könnten, klammert es sich sozusagen daran fest und ignoriert den Rest, um so eine bestimmte Tonhöhe
melden zu können.

Goldsteins Theorie eines „Optimierungsprozessors“ im Gehirn hat sich auch durchgesetzt bei der
Erklärung dafür, dass wir einen Klang als schmutzig oder rein empfinden. Das heißt, wie stark wir
empfinden, ob ein Klang eine bestimmte Tonhöhe oder nur Rauschen enthält. Das Gehirn tut dies aufgrund
der Übereinstimmung zwischen dem tatsächlich gemeldeten Klangspektrum und dem Spektrum der
harmonischen Reihe für die wahrgenommene Tonhöhe nach speziellen mathematischen Kriterien.
Man kann sich fragen, warum denn das Gehirn harmonische Reihen erkennen will. Die optische
Mustererkennung dient ganz eindeutig Überlebenszwecken; und obwohl dies nicht so offensichtlich ist,
könnte dies auch für die Schallwahrnehmung zutreffen. Terhard behauptet dazu, dass das zentrale
Nervensystem „durch handeln lernt“: jedes mal, wenn wir einen Dauerton mit einem harmonischen Spektrum
hören, wird das für das Gehirn leichter, diesen Klang wiederzuerkennen, falls er wieder erklingt. Wir lernen
früh, dass Sprachklänge sehr wichtig sind. Wenn das stimmt, bedeutet diese Theorie, dass ausgedehntes
Hören von Musik in früher Kindheit zur Ausbildung einer größeren Fähigkeit führt, harmonische Reihen zu
identifizieren und damit einhergehend eine schärfere Tonhöhen- und Intervallgrößenbestimmung vornehmen
zu können.

Frequenzgruppen (kritische Frequenzbandbreite)


Viele psychoakustische Experimente zeigen einen Unterschied der Wahrnehmung, der davon abhängt, ob
die Frequenzen zweier Testsignale nahe zusammen oder weit auseinander liegen. Sind sie zusammen, regen
sie mehr oder weniger die gleiche Region der Basilarmembran an; sind sie weit auseinander simulieren sie
zwei getrennte Regionen, d.h. es gibt geringe oder gar keine Überlappung in den beiden Reaktionskurven.

Der Frequenzbereich, für den sich die Reaktionskurven der Basilarmembran effektiv überlappen, wird als
Frequenzgruppe oder kritische Frequenzbandbreite bezeichnet.

Mit Frequenzgruppen (Plural), engl. critical bands, bezeichnet man beim menschlichen Gehör
Frequenzbereiche, die gemeinsam ausgewertet werden.
Eine Auswertung in Frequenzgruppen erfolgt z.B. bei der Bestimmung der Lautstärke, des Klangs oder
der Richtung des Schalls. Eine Ausnahme ist die Auswertung der Tonhöhe: hier ist die Frequenzauflösung
wesentlich größer.
Das menschliche Gehör teilt die´hörbaren Frequenzen in etwa 24 Frequenzgruppen ein. Eine
Frequenzgruppe umfasst hierbei bei Frequenzen unterhalb von 500 Hz einen Frequenzbereich von etwa 100
Hz bei Frequenzen oberhalb von 500 Hz den Frequenzbereich einer kleinen Terz. Dieses ist ein
Frequenzverhältnis von 1,19.

34
Akustik 1 – kurze Fassung WS

Zusammenhang zwischen Basilarmembranort, Frequenzgruppe, Tonheit in mel und Frequenz

Die Bildung der Frequenzgruppen basiert auf der Umsetzung von Schall in Nervenimpulse im Innenohr.
Die unterschiedlichen Frequenzen des Schalls werden von der Basilarmembran im Innenohr zu
Auslenkungsmaxima an unterschiedlichen räumlichen Positionen umgesetzt und erregen die hier
befindlichen Nervenzellen. Jede dieser Nervenzellen ist für eine unterschiedliche Tonhöhenempfindung
verantwortlich.

Kombinationstöne
Im Jahre 1714 beobachtete der berühmte Geiger Tartini, dass er beim kräftigen Spielen eines Doppelgriffs
mit zwei Noten gleichzeitig zuweilen noch eine dritte Note hören konnte. Dieser Differenzton DT hat die
Frequenz: fdt= fh-ft, wobei fh = Frequenz des hohen Tons und ft = die Frequenz des tiefen anregenden
Tons.
Das sind Erscheinungen aus der sog. Nichtlinearität. Eine nichtlineare Verzerrung sollte sowohl einen
Differenzton als auch einen Summenton (Fst= Fh+Ft) mit vergleichbarer Amplitude ergeben. Der
Summenton ist schwierig zu hören, da er sich im Oktavenbereich oberhalb von Fh (hohen Tons) befindet und
dadurch die beiden Ausgangstöne stark maskiert werden. Der Differenzton ist dann schwierig zu hören, wenn
er zwischen ft un fh liegt, gut wahrnehmbar ist er, wenn er unterhalb von ft liegt.
Überlagert man zwei Schwingungen unterschiedlicher Frequenz, man eine amplitudenmodulierte
Schwingung, wobei die Modulationsfrequenz der Frequenz des Differenztons entspricht.
Das Gehör ist in der Lage, die Hüllkurve eines Signals auszuwerten. Das Ergebnis dieser Auswertung
wäre dann eine Schwingung mit der Frequenz des Differenztons.
Insbesondere bei Frequenzen oberhalb von 1600 Hz kann das menschliche Gehör die genaue Zeitfunktion
der Signale nicht mehr erfassen. Hier kann als Information über den zeitlichen Verlauf der Schallsignale nur
noch die Hüllkurve ausgewertet werden. Und diese Auswertung ergibt eine Schwingung mit der Frequenz
des Differenztons.
In der Vergangenheit wurde gelegentlich vermutet, dass dieses Phänomen etwas mit unserer Fähigkeit zu
tun haben könnte, einen fehlenden Grundton wahrzunehmen. Junge Forschungen haben gezeigt, dass hier
noch vieles im Dunkeln liegt, was diese Kombinationstöne betrifft.

Lautheit und Maskierung


Regel: was man als Lautheit hört, ist ausschließlich von der in diesem Bandbereich empfangenen Energie
abängig. Zwei ausreichend gut getrennte Bandbreiten liefern jeweils einen unabhängigen Beitrag zur Gesamt
-Lautheit.

35
Akustik 1 – kurze Fassung WS

Das heißt: Innerhalb einer Frequenzgruppe verhält sich die Intensität additiv, aber außerhalb dieser verhält
sich die wahrgenommene Lautheit additiv.

In engem Zusammenhang mit der Wahrnehmung der Lautheitsunterschiede steht das Phänomen der
Maskierung: wir hören zwei Töne, z.B., einen sehr lauten mit einer bestimmten Frequenz, und wann einen
zweiten schwachen Klang mit anderen Frequenz, was passiert dabei?
Man hört den schwächeren Ton umso leichter, je mehr seine Frequenz, von der des stärkeren Ton sich
unterscheidet, und je mehr die beiden Frequenzen nahe liegen, desto stärke wird den zweiten Ton verdeckt,
d.h. maskiert. Der Maskierungseffekt ist eine alltägliche Erscheinung. Ein Flüstern, das in einem ruhigen
Raum deutlich verstehbar wäre, ist in einer lauten Menge völlig unhörbar; ein Autoradio wird beim schnellen
fahren lauter aufgedreht, um die Fahrtgeräusche zu übertönen, als bei der Pause oder langsamen Fahrt. In der
alltäglichen Praxis kann es einem klangschwachen Solisten nur allzu leicht geschehen, dass er durch eine zu
laute Begleitung verdeckt wird. Gute Komponisten wissen jedoch, dass sie die Stimme des Solisten dadurch
gut hörbar machen, dass sie sich entweder bezüglich der Tonhöhe oder der Klangfarbe deutlich vom
begleitenden Ensemble unterscheiden und so Frequenzgruppen des Hörers anregt, die noch nicht durch von
letzteren erzeugten Klängen „belegt“ sind.

Klangfarbe
Tatsächlich zeigen verschiedene Experimente, dass die Teiltöne bis zum sechsten oder siebten jeweils
einen unabhängigen Beitrag zur Klangfarbe liefern, während die Beiträge höherer Teiltöne miteinander
verschmelzen.
Die Zahl der voneinander unabhängigen Informationen, welche die Klangfarbe bestimmen, 6 oder 7 plus
ein paar mehr für die zusätzlichen Frequenzgruppen, die durch mehrere Teiltöne angeregt werden, beträgt
insgesamt vielleicht 10 bis 15.
Man stellt sich oft die Frage, ob das Gehirn überhaupt so viel Detailinformationen benutzt? Vielleicht
achtet es ja nur auf bestimmte Kombinationen der Anregung von Frequenzgruppen und nicht auf die jeder
einzelnen unabhängigen von den anderen?
Es gibt tatsächlich experimentelle Hinweise darauf, dass Erkennen von Vokalen und Klangfarben nur von
3 oder 4 unabhängigen Parametern abhängig ist. Es wäre also zumindest theoretisch möglich, dass wir eines
Tages mit 4 Angaben eine Klangfarbe beschreiben könnten, wobei jede Angabe eine Nummer ist, die für eine
Position entlang der Verbindungslinie zwischen zwei Extrempunkten steht. So könnte z.B. ein Klang
beschrieben werden durch die Zahl 7 auf einer Skala von 0 für „hohl“ bis 10 für „voll“, die Zahl 4 auf einer
zweiten Skala zwischen den Extremen „dumpf“ und „scharf“ usw., wobei dann 4 solcher Zahlenangaben
ausreichend genau fast jede mögliche Klangfarbe beschreiben würden.

Intervalle und Stimmungssysteme


Intervallwahrnehmung
Wie messen wir unsere Wahrnehmung des Abstandes zweier Töne entlang der Tonhöhenachse oder der
Intervalle zwischen ihnen?
Wenn die Frequenz eines Tones sich immer mehr von der eines anderen entfernt, klingt seine Tonhöhe
nicht einfach immer unterschiedlicher zu letzterem. Man hat sogar den Eindruck, dass er wieder zu Anfang
klingt, wenn der Abstand einer Oktave erreicht ist. Wenn der Ton sich durch die nächste Oktave bewegt,
klingt er so ähnlich zur ersten Oktave, dass wir die gleichen Tonbezeichnungen benutzen.
Für viele musikalische Zwecke gilt eine Oktaven-Gleichwertigkeit, d.h. es spielt keine oder kaum eine
Rolle, wenn wir eine Note durch ihren Namensvetter aus einer anderen Oktave ersetzten.

Wir sagen, dass die Tonhöhe 2 Aspekte aufweist:


1. Tonigkeit oder Tonfarbe, Toncharakter, die aussagt, wo die Note in Relation zu den anderen innerhalb
der Oktave steht
2. Tonhöhenklasse bezieht sich auf eine gleiche Eigenschaften, wenn wir nur eine begrenzte Skala bilden,
z.B. alle Noten mit der Bezeichnung „c“ einer Tonhöhenklasse.

36
Akustik 1 – kurze Fassung WS

Daraus ergibt sich die Frage, ob es möglich ist, das Chroma zu verändern, während die Tonhöhenlage
gleich bleibt.
Eine faszinierende Demonstration dafür wurde 1964 von R. Shepard gegeben. Er erzeugte mit Hilfe eines
Computers Klänge, die viele Mitglieder einer Tonhöhenklasse gleichzeitig enthielten (mit Teiltönen Nummer
1, 2, 4, 8, 16) bei tiefen Grundfrequenzen. Immer derjenige Teilton, der in die Mitte des hörbaren Bereichs zu
liegen kam, erhielt die stärkste Amplitude. Eine kontinuierliche Folge solcher Shepards-Töne kreist ewig auf
der Chroma-Spirale und vermittelt die akustische Illusion einer ständig steigenden Tonhöhe, ohne dass
jemals die Grenze des Hörbereichs erreicht würde.

Das ist das Phänomen der kategorialen Wahrnehmung.


Nehmen wir ein Experiment an, in dem wir nicht nur gewöhnliche benachbarte musikalische Intervalle
(zwei nacheinander folgende Töne: Terzen, Quart) erzeugen können. Werden all diese Intervalle in zufälliger
Reihenfolge hörbar gemacht, so werden die meisten Testhörer jedes von ihnen als eines der drei Standard-
Intervalle einordnen; d.h. wir werden alle kleinen und großen Intervalle „zurechthören“ und die verschieden
großen Abweichungen dazwischen praktisch ignorieren.
Für harmonische Intervalle (zwei Töne gleichzeitig), die aus nicht-sinusoidalen Klängen bestehen, gelten
jedoch einen speziellen Anspruch verleihen, so etwas wie natürliche Kategorie zu sein.

Die Größe eines zusammengesetzten Intervalls können wir nun durch die Multiplikation der einzelnen
Intervall-Frequenzverhältnisse definieren.
Man benötigt eine praktischere Meßeinheit (kleiner als eine Oktave) um die Größe unserer Intervalle
präzise zu beschreiben. Man hat dafür eine internationale Maßeinheit Cent eingeführt.

Die Cent-Skala hat zwei sie definierende Eigenschaften:


1. Das Frequenzverhältnis 2:1 soll exakt der Zahl von 1200 Cents entsprechen, d.h. eine reine Oktave st
1200 Cent gleich, so dass ein Cent genau einem 100-stel eines wohltemperierten Halbtons entspricht.
2. an die Stelle der Multiplikation von Frequenzverhältnissen tritt immer die Addition der entsprechenden
Cent-Zahlen. Die Beziehung zwischen Frequenzverhältnissen und Cent derjenigen zwischen
Schallintensitätspegel und Dezibel analog ist.

Wir haben als Wahl immer zwischen 2 Möglichkeiten, die Größe eines zusammengesetzten Intervalls zu
berechnen:
1. Multiplikation (x) der Frequenzverhältnisse oder
2. Addition (+) der Cent-Beträge.
3. Wenn ein Intervall nach unten gegeben ist anstatt aufwärts, wird eine Subtraktion (-) verwendet.

Es bleibt eine bemerkenswerte Eigenschaft unseres Gehörs bei der Intervallwahrnehmung, dass wir
überhaupt zwei Tonhöhe wahrnehmen und nicht nur einen. Unser Gehör sammelt Hinweise von Formanten-
bereichen, Einschwingungsvorgängen, Tonhöhenfortschreitungen und vollbringt das erstaunliche
Meisterstück, die Fourier-Komponenten in zwei oder mehr Reihen auszusortieren, um dann jeder Reihe einen
Grundton zuzuweisen.

Hier liegt eine gute akustische Begründung für einige traditionelle Regeln der Instrumentation und des
Kontrapunkts. Um 2 Melodielinien unterscheidbar zu halten, soll man sie mit zwei tembral unterschiedlich
oder Einschwungverhalten Instrumenten spielen. Noch leichter ist, wenn die Linien immer öffter in
Gegenbewegung geführt werden. Glatte und ähnliche Klangfarben (besonders auf elektronischen Orgeln)
oder Parallelbewegungen (Oktave, Quinte) lassen leicht die Stimmen miteinander verschmelzen, und sie sind
nicht mehr oder sehr schwierig einzeln erkennbar.

37
Akustik 1 – kurze Fassung WS

Intervalle und die harmonische Reihe


Eine der ältesten Überlieferungen der Musiktheorie ist die des griechischen Philosophen und
Mathematikers Pythagoras (ca. 500 v. Chr.). Es gibt keine erhaltenen eigenen Schriften vom Pythagoras, man
hat späteren Berichte, dass er herausgefand, dass die zwei Abschnitte einer unterteilten Seite auf einem
Monochord unisono klingen, wenn die Abschnitte gleichlang sind, im Oktavabstand bei einem Verhältnis der
Saitenlänge von 2:1 und im Quintenabstand bei einem Verhältnis von 3:2.
Teilweise auf der Grundlage dieser Beobachtung, teils auch weil Pythagoras Haupt eines mystischen
Zahlenkult war, lernten seine Nachfolger das, was heutzutage als pythagoräische Musiklehre bezeichnet
wird. Sie behaupten, dass eine besondere Beziehung zwischen den in kleinen Zahlen ausdrückbaren
Längenverhältnissen der Saitenabschnitte und bestimmten Intervallen bestehe, die als Grundlage aller Musik
diene, je kleiner die Zahlen, desto konsonanter und wichtiger das Intervall.

Wenn man Frequenzverhältnisse mit kleinen Zahlen hervorhebt, meint man die gleichen Intervalle, wie sie
in der harmonischen Reihe auftreten.
Physikalisch gesehen bilden die Spektren komplexer Dauertöne harmonische Reihen. Die Überlappung
oder Übereinstimmung solcher Reihen ist besonders dann auffällig, wenn deren Grundtöne ein Verhältnis
kleiner Zahlen aufweisen und daher die Vermutung heranlegen: Nur die Vermutung, sie könnten irgendwie
so klingen, als wenn sie zusammenpassen oder -gehören würden.
Physiologisch gesehen kann es sein, dass die Einprägung harmonischer Reihen in unserem Muster-
Erkennungs-Prozessor das Gehirn dazu verleitet, eifrig nach ähnlichen Mustern zu suchen, selbst bei 2 Tönen,
deren Formanten oder Einschwingungsvorgänge sie als getrennte Einheiten identifizieren.
Psychologisch gesehen wäre dies nicht überraschend, denn es ist nur einer von vielen Hinweisen auf die
Bevorzugung des Vertrauen, Einfachen, des Ordentlichen und Reibungslosen durch den Menschen. Das Wort
„reibungslos“ ist ein wichtiger Hinweis. Denn hörbare Schwebungen geben uns ein bequemes Kriterium an
die Hand, wann wir ein reines pythagoräisches Intervall vor uns haben.

Ein Instrument oder eine Saite kann mit einem anderen auf ein erwünschtes Konsonanten Intervall
gestimmt werden, indem man die Schwebungen zum Verschwinden bringt. Dies ist außerordentlich leicht für
Primen, relativ leicht für Oktaven, etwas schwieriger schon für Quinten und für die anderen Intervalle ist
beträchtliche Mühe erforderlich. Die Konstruktion dieser Prozedur und die praktische Basis zur Stimmung
unserer Tonleitern wollen wir nun untersuchen.

Musikalische Skalen (Tonleitern und Modi)


Die Bauweise unserer Blas- und Tasteninstrumente zusammen mit den Beschränkungen unserer
traditionellen Notenschriften haben jedoch eine Begrenzung auf einige wenige Tonhöhen und die
entsprechenden Intervalle mit sich gebracht, alle andere Tonhöhen und Intervalle sind sozusagen „offiziell
nicht anerkannt“.
Wir bezeichnen diese Gruppe von Tonhöhen als Skala, Modi oder Tonleitern. Eine Skala oder Tonleiter
ist einfach eine Folge von Tonhöhen, eine Liste möglicher Töne, während ein Tonart auch die Struktur ihrer
Benutzung miteinschließt, die Tonart legt für ihre einzelnen Stufen verschiedene musikalische Funktionen
fest, die Skala nicht.
Man kann eine beliebige Zahl verschiedener Tonhöhen zusammenstellen, sei es per Zufall oder nach
irgendeinem Schema, und das Ergebnis als Skala bezeichnen.
Viele von solchen Skalen klingen für unsere Ohren exotisch. Teilweise beruht dies darauf, dass wir
Dauertöne bzw. relativ lang klingende Töne benutzen.
Man kann mehrere unterschiedlichen Scala durch gewisse Beschränkungen zusammenstellen.

1. Es soll das Oktav-Intervall vorhanden sein und zwar exakt auf 2:1 gestimmt und
2. die Tonabstände in der Skala gleichgroß sein sollen.
3. Dann soll noch festgelegt werden, wieviel Tonschritte in einer Oktave möglich sein sollen: für N
Schritte bezeichnen wir die Skala als N-tönige gleichtemperierte Skala.

38
Akustik 1 – kurze Fassung WS

Für den Abstand der Einzelschritte brauchen wir nur noch 1200 Cent durch die Zahl N zu teilen:
N=12 ergibt sich jeder schritt zu 100 Cent und somit die uns wohltemperierte Stimmung der
chromatischen Skala.
Für N=6 erhalten wir die Ganztonskala, die z.B. Claude Debussy in vielen Stücken benutzt hat.

Am wichtigsten für die westliche Musik sind die diatonischen Skalen, welche aus einer Folge von
Ganztönen (G) und Halbtönen (H) pro Oktave bestehen. Oft bezeichnet man unsere Dur-Skala als diatonisch.
Die diatonische Skala kann auf verschiedene Weise hergeleitet werden. Am leichtesten, ist sie als Teilmenge
der chromatischen Skala herzuleiten.

Die Unmöglichkeit einer vollkommenen Stimmung.


Es gibt grundsätzlich ein mathematisches Problem bei der Stimmung von Tönen einer diatonischen Skala.

1. Beispiel: wir beginnen mit einem mittleren C und versuchen weitere Noten hinzuzufügen. Da wir öfter C-Dur Dreiklänge
spielen werden, fordern wir zunächst dass e´ genau 386 Cent über c´ sein soll (als ein exaktes 5:4 Verhältnis). Um auch gut
klingende E-Dur-Dreiklänge spielen zu können, muss gis´ wiederum genau 386 Cent über e´ gestimmt werden. usw. Was
tun? Ein Sänger oder Posaunist kann ohne Probleme das eine oder das andere hervorbringen, auch andere Bläser können
die Tonhöhe ausreichend beeinflussen. Die Tasteninstrumente haben nach dem Stimmen ein für allemal festgelegte
Tonhöhen, und keinerlei Möglichkeit, diese während des Spiels zu ändern. Heutzutage lernen Klavierschüler, die gleiche
schwarze Taste anzuschlagen, egal ob gis oder as in der Noten steht, obwohl man rechnen kann, dass gis und as nicht die
gleiche Frequenz haben dürfen. Dies war dadurch herausgekommen, dass 3 große Terzen aufeinander keine reine Oktave
ergeben, sondern um 41 Cent „zu kurz“ sind. Das gleiche in Frequenzverhältnissen ausgedrückt: 5/4·5/4·5/4=125/64,
obwohl eine Oktave ja 128/64 ergeben sollte, der Unterschied von 41 Cent entspricht dem Verhältnis von 128:125.

1) Man kann Tastaturen mit mehr als 12 Tasten pro Oktave bauen, so dass wir mehr als 12 Tonklassen benutzen können.
Viele alte Orgeln und Kleinflügel haben geteilte schwarze Tasten, so dass man entweder Gis oder As mit zwei
zugehörigen Pfeifen oder Seiten spielen kann.
2) Man kann die einer Tonart stimmen und vermeiden, eine andere zu spielen. Das war Praxis im Barock.
3) Wir könnten Gis stimmen, trotzdem Stücke in As spielen und dabei bewusst wahrnehmen, dass durch die erhebliche
Verstimmung bei unserem Zuhörer regelrechte Pein verursacht wird.
4) Man kann auf unseren perfekt gestimmten Terzen verzichten und sie etwas größer als 386 Cent stimmen.
Wenn wir Gis und As gleichsetzen erzeugen wir einen Großterzen-Zirkel. Bestehen wir auf der Regel, dass Oktave in 2:1 und
Quinten in 5:4 gestimmt sein müssen, dann ergibt sich unausweichlich ein 41 Cent Fehler irgendwo in diesem Zirkel. Ähnlich geht
es im Terzen -Zirkel und Quinten-Zirkel. Es ist unmöglich, 12-tönige Skalen so zu stimmen, dass alle Konsonanten Intervalle rein
sind.

Stimmung und Temperatur


Im Lauf der Zeit haben die Theoretiker Dutzende von Stimmungssystemen für Tasteninstrumente
untersucht und entwickelt.

Die erste Betrachtungsweise oder Ausgangstheorie ist die auf dem Quintenzirkel aufgebaute Pythagoreische
Stimmung.

Die pythagoreische Stimmung wird durch den Aufbau von lauter reinen Quinten (2:3) gebildet.
12 aufeinandergesetzte, reine Quinten im Verhältnis 2:3 umfassen den Tonraum von 7 Oktaven und ergeben
alle Töne der chromatischen Tonleiter.

39
Akustik 1 – kurze Fassung WS

Der letzte Ton His müsste eigentlich identisch mit dem Ton C sein, wenn man aber diese Reihe berechnet,
ergibt sich eine Differenz zw. dem His und dem C. Diese Differenz nennt man "pythagorisches Komma".
Dabei sind die meisten der reinen Quinten mit exakten 702 Cent gestimmt und die Stimmung der Terzen
wird demgegenüber vernachlässigt. In ihrer reinen Form erzielt die Pythagoreische Stimmung 11 perfekte
Quinten, wobei dann das vollständige diatonische Komma in der zwölften verbleibenden Quinte
ausgeglichen werden muss.

Die zweite Betrachtungsweise wird als 14-Komma-mitteltönige Stimmung bezeichnet und berührt auf
dem Zirkel der großen Terzen. Maximal 8 große Terzen können hier schwebungsfrei mit 386 Cent gestimmt
werden, wogegen die Stimmung der Quinten vernachlässigt wird. Trotz dem Nachteil trugen die zahlreichen
perfekten Terzen dieser Stimmung oder Temperatur dazu bei, die Verbreitung dreiklangsbasierter Musik
während der Renaissance zu fördern.
Die dritte Betrachtungsweise wird als reine Stimmung bezeichnet. Hier wird versucht, sowohl einige
Terzen als auch einige Quinten rein zu stimmen.

Die reine Stimmung leitet sich aus der Obertonreihe ab. Schwierigkeiten ergaben sich jedoch aus den
verschiedenen Frequenzverhältnissen des Ganztones (8:9 c - d und 9:10 d - e, siehe Obertonreihe). Solange
man nur in einer Tonart musizierte, störte dieses Missverhältnis nicht. Doch die zunehmenden
Tonartenwechsel und die Einbeziehung von Tonarten mit immer mehr Vorzeichen gaben den Anstoß zu einer
Lösung, welche diese Differenzen beseitigte.

Als Preis für so erhaltene 6 perfekte Dreiklänge, muss man annehmen, dass alle andere Dreiklänge Terzen
aufweisen, die genauso schlecht klingen wie in pythagoreischer Stimmung, und noch dazu, dass eine extrem
misstönende Quinte ausgerechnet mitten unter den wichtigsten Dreiklängen sitzt.
Oft zeigt man in Lehrbüchern ein Schema für diatonische Tonleitern. Diese Schemata sind aber in erster
Linie mathematische Übungen. Für die tatsächliche Aufführungspraxis sind sie vollständig unbrauchbar.
In der vierten Betrachtungsweise wir nun versucht einen Kompromiss zu finden, indem absichtlich einige
oder alle Intervalle jeweils zu präzisen Anteilen verstimmt, „temperiert“ werden. Diese Schemata werden
daher als Temperierungen oder Temperatur bezeichnet.
Nach 1700 hat sich die temperierte Stimmung durchgesetzt, bei der die Oktave in exakt 12 gleich große
Halbtonschritte aufgeteilt wird. In dieser gleichschwebenden Stimmung ist kein Intervall außer der Oktave
wirklich rein, doch die Differenzen sind so gering, dass man die Abweichung nicht merkt.
J.S. Bach nützte die Vorteile dieser neuen Stimmung und schrieb sein "Wohltemperiertes Klavier", eine
Sammlung von Präludien und Fugen in allen Dur- und Molltonarten.

40
Akustik 1 – kurze Fassung WS

Es ist möglich die unterschiedlichen Methoden miteinander zu kombinieren, indem z.B. zunächst eine
phytagoräische Stimmung erzeugt wird und anschließend drei Noten temperiert, die anderen 9 unverändert
belassen werden.

Die Zahl der verschiedenen Möglichkeiten, in der bei einer temperierten Stimmung die Abweichungen
den einzelnen Intervallen zugeteilt werden können, ist praktisch unbegrenzt. Es gibt eine Gruppe von
besonders wichtigen regulären Temperaturen, in der jeweils möglichst viele Intervalle auf den gleichen
Abstand gestimmt werden (z.B. 11 von 12 Quinten, 8 von 12 großen Terzen usw.), gleichgültig, wie groß
dieser Abstand sein möge. Diese temperierten Stimmungen werden üblicherweise danach benannt, wie stark
die Quinten zur kleineren Seite hin temperiert werden.
J.S. Bach schrieb seine berühmten Preludien und Fugen („Das wohltemperierte Klavier“) für die
Temperatur, die auf dem 1/6 Komma-Schema beruhen. Was er wohl mit seinen Stücken durch alle Tonarten
zu zeigen versuchte, war die musikalische Nutzung einer „guten“ Temperatur, die keineswegs
notwendigerweise eine gleichschwebende Temperatur meinte.
Der weitverbreitete Akzeptant der gleichschwebenden Temperatur im 19. Jh. bedeutet die absichtliche
Aufgabe eines nützlichen musikalischen Materials.

Stimmungen - Vergleich
Hier noch einmal die verschiedenen Stimmungen zum Vergleich:

Zusammenfassung:
Jede musikalische Intervallgröße entspricht einem Frequenzverhältnis, das als entsprechende zahl von
Cents gleichwertig bezeichnet werden kann. Die Bezeichnung in Cents ist insofern besonders bequem, da die
Cent-Skala additiv gehandhabt wird. Solange wir nicht aufgefordert sind, eine Stimmung sorgfältig zu
beurteilen, haben wir die Tendenz, Intervalle zurechtzuhören, d.h. in Kategorien einzuordnen. Die
Kategorien, nach denen wir die Intervalle zurechthören, werden von musikalischem Training und der
gewohnten Tradition geprägt; in unserer wesentlichen Kultur entsprechen sie den Intervallen der 12-tönigen
chromatischen Skala.
Für die Musik mit lang ausgehaltenen Akkorden und komplexen Klangspektren gilt, dass Intervalle, deren
Frequenzverhältnis kleinzahligen Brüchen entspricht, beträchtlich klarer klingen als solche mit großzahligen
Brüchen der Frequenzverhältnisse und daher für jede Stimmung besonders wichtig sind.
Für unsere Ohren ergibt sich der wichtigste Anhaltspunkt zur Beurteilung durch die Schwebungen, bzw.
die Klangrauheit, die zwischen solchen Obertönen der zwei Grundtöne des Intervalls entstehen, die nur
annähernd, aber nicht genau die gleiche Frequenz haben.
Reine Quinten, zu kleinerem Teil auch große und kleine Terzen, spielen eine besondere Rolle in der
Struktur der 7-tönigen diatonischen Skala und ihrer chromatischen Erweiterung auf 12 Töne. Es ist
mathematisch unmöglich, in einer solchen Skala alle Intervalle gleichzeitig perfekt rein zu stimmen. Die
unvermeidlichen Abweichungen werden in zahlreichen Varianten und unterschiedlichen Stimmungssystemen
und Temperaturen durch Kompromisse geregelt. Die gleichschwebende Temperatur ist dabei nur eine von
vielen Möglichkeiten, und für viele Musikstile und Musikstücke keineswegs die beste.

41
Akustik 1 – kurze Fassung WS

Die menschliche Stimme


Die oberen Luftwege (Rachen, Mund- und Nasenraum) bezeichnet man als Ansatzrohr oder auch
Vokaltrakt. In Vokaltrakt verändert sich den primären Kehlkopfklang, der in dem Kehlkopf entsteht. Bei
vielen Männern ist der Kehlkopf deutlich als „Adamsapfel“ zu erkennen. Er besteht aus Knorpel und ist hohl
(es strömt hindurch die Atemluft). In dem Kehlkopf befinden sich zwei Stimmlippen aus Muskel und
Gewebeschichten, sie sind gespannt und können durch Muskeln, Knorpel und Gelenke eingestellt werden.
Sie verschließen die Luftröhre bis auf einen kleinen Spalt, welchen man als Stimmritze (Glottis) genannt.

Die Stimmlippen sind beim normalen Atmen entspannt und die Stimmritze ist breit, somit die Luft
ungehindert ein- und ausströmen kann. Um stimmhafte Töne zu erzeugen, werden die Stimmlippen
angespannt. Die Stimmritze verengt sich bis auf einen feinen Spalt. Wenn nun Luft aus der Lunge kommt
werden die Stimmbänder in Schwingungen versetzt ähnlich einer Seite. Die in dem Ansatzrohr befindliche
Luft schwingt mit. Und so entsteht ein Klang (Stimmklang).
Je entspannter die Stimmlippen sind, desto so tiefer ist der Grundton des Klanges - je angespannter sie
sind desto höher wird er.
Die Tonhöhe hängt von der Länge und der Dicke der Stimmbänder ab. Je länger sie sind, desto tiefer ist
die Stimme. Männer haben längere Stimmlippen als Frauen, weil der Kehlkopf grösser ist. Kinder haben stets
hohe Stimmen, da die Stimmlippen kürzer sind. Währenddessen des Stimmbruches werden bei Jungen und
Mädchen die Stimmlippen dicker und länger, mancher hat die Stimme währenddessen dieser Zeit gar nicht
mehr unter Kontrolle, klingt heiser oder gar stimmlos.
Die Stimmlippen sind neben dem Anblasdruck für Tonhöhe und Tonstärke verantwortlich; sie liefern den
Grundton. Hierbei erzeugen sie ein undifferenziertes obertonreiches Schwingungsgemisch. Es klingt wie ein
schnarrendes Geräusch.
Die Laute, die wir zur sprachlichen Verständigung brauchen, entstehen in dem Ansatzrohr. Mund- und
Rachenhöhle, die Zunge, die Lippen und die Zähne wirken dabei zusammen.
Zum Beispiel ist bei den Vokalen A, E, I, O und U die Stellung der Stimmlippen fast stets gleich. Die
unterschiedlichen Klangfarben werden durch die Veränderung der Mund- und Rachenhöhle erzeugt. Bei M
und N bleibt die Mundhöhle geschlossen und die Luft strömt durch die Nase aus.

42
Akustik 1 – kurze Fassung WS

1. Mechanik der Stimmerzeugung


Genau wie alle Blasinstrumente verfügt die menschliche Stimme über:
1) ein Luftreservoir mit der Möglichkeit, einen Überdruck darin aufrechtzuerhalten
2) einen Auslasskanal mit einer Verengung, an der der Luftstrom unterbrochen oder verändert
werden kann
3) einen Resonanzraum, durch den bestimmte Frequenzen der entstehenden Schallwellen verstärkt
werden.

Das Luftreservoir besteht aus den Lungen mit einem Volumen von ca. 3-4 Litern, wobei etwa ein halber
Liter Luft bei jedem Atemzug aus und einströmt. Beim Einatmen wird die Lunge quer von den
Zwischenrippenmuskeln und längs von den Zwerchfellmuskeln gedehnt. Das Entspannen der Muskeln und
die Kontraktion der Bauchmuskulatur führt zum Ausatmen. Die Lungen eines Erwachsenen können bis zu 6
Liter Luft aufnehmen, selbst nach tieferem Ausatmen behalten sie bis zu 2 Liter Luft. Die Differenz von 3 bis
5 Liter stellt also die maximale Luftmenge dar, die für eine ununterbrochen gesungene Phrase zur Verfügung
steht.
Die Luftröhre (Trachea) führt von den Lungen hinauf zum sog. Vokaltrakt, welcher aus Kehle, Mund und
Nase besteht.
Am oberen Ende der Luftröhre befindet auch ein hohles Gebilde aus Knorpeln, der sog. Kehlkopf
(Larynx), der als Schaltstelle zur Speiseröhre und zum Vokaltrakt dient.
Der Kehldeckel (Epiglottis) ist ein klappenartiges Ventil auf dem Kehlkopf, das beim Schlucken
herunterfällt, um das versehentliche Eindringen von Speise in die Luftröhre zu verhindern.
Die Luftströmung kann durch die Stimmbänder unterbrochen werden, das ist ein Paar weicher
Gewebewüsteln an den Innenwänden des Kehlkopfes, deren Form und Steifigkeit durch verschiedene kleine
Muskeln verändert werden kann.
Die Öffnung zwischen ihnen wird als Stimmritze (Glottis) bezeichnet, sie ist V-förmig, da die
Stimmbänder vorne miteinander verbunden und hinten getrennt an den Stellknorpeln sind. Die Stimmritze ist
etwa 2 cm lang und 1 cm breit.

Die Stimmlippen schließen sich beim Schlucken, während des normalen Atmens sind sie offen. Für die
Phonation schließen sie sich ganz oder fast, so dass die Lungen einen Luftdruck von mind. 50-400 mm
Wassersäule oder mehr auf sie ausüben. Dieser Druck bringt die Stimmbänder zum Öffnen und zum
schubweise Einlassen von Luft in den Vokaltrakt. Die Stimmbänder schwingen dabei mit einer Frequenz, die
von der Spannung ihrer Muskeln kontrolliert wird. Bei normaler Sprache reichen die Frequenzen von 70 bis
200 Hz für eine Männerstimme und von 140-400 Hz für eine Frauenstimme. Der Unterschied wird durch die
längeren und schwereren Stimmbänder des erwachsenen Mannes verursacht. Diese Frequenzbereiche können
beim Singen um eine Oktave oder mehr nach oben erweitert werden.
Unmittelbar über dem Kehlkopf schließt sich die Rachenhöhle an, die sich nach außen durch den Mund
öffnet, wobei Zunge, Zähne und Lippen zusätzliche Möglichkeiten bieten, den Luftstrom zu behindern oder
zu blockieren. Je nach Position des weichen Gaumensegels ist die Kehle zur Nasenhöhle hin offen oder
geschlossen. Größe und Form des Vokaltrakts sind daher äußerst veränderlich, wobei die Zunge mit ihrer
Varianten (variablen) Position und Form die größte Rolle spielt, so dass sehr unterschiedliche Klänge erzeugt
werden können.

Spracherzeugung
Man bezeichnet jedes unterscheidbare Element der Sprache als Phonemen. In der Sprachwissenschaft sind
die Phoneme in Konsonanten (Übergangsgeräusche) und Vokale (gleichbleibende Klänge) aufgeteilt. Man
unterscheidet 5 Gruppen von Phonemen: Plosivlaute (Verschlusslaute), Reibelaute, andere Konsonanten,
reine Vokale und Diphthonge (Doppelvokale).
Die Verschlusslaute (Plosivlauten) entstehen durch plötzliches Durchlassen eines einzigen Luftschubes
nach vorherigen vollständigen Schließen des Vokaltraktes. Das geschieht an verschiedenen Stellen.
Akustisch gesehen, ist der Plosivlaut ein einfacher plötzlicher Impuls von hohem Druck, gefolgt von einer

43
Akustik 1 – kurze Fassung WS

kurzen gedämpften Schwingung, überlagert vom Atmungsgeräusch der Luft, die durch die Öffnung streicht,
bis der Überdruck ausgeglichen ist. Diese nichtgleichmäßigen und nicht periodischen Schallwellen weisen
ein kontinuierliches Frequenzspektrum auf, haben also keine bestimmbare Tonhöhe.
Jeder stimmlose Plosivlaut hat ein stimmhaftes Pendant: p-b, t-d und k-g. Bei diesen beginnen die
Stimmbänder eine gleichmäßige Schwingung mit einer Art Vokalklang sofort nach dem anfänglichen
Luftschub, statt eine größere Lücke zu lassen. Der Übergangscharakter der Plosivlaute bedeutet, dass sie
wenig Schallenergie transportiert, weswegen sie beim professionellen Singen übertrieben werden müssen,
um wahrgenommen zu werden.

Die Reibelaute (Fricativa) gibt es ebenfalls paarweise stimmlos/stimmhaft: f/v, ch/ch, sch, th, s, z. Alle
diese Laute unterscheiden sich dadurch, dass sie beliebig lange ausgehalten werden können. Trotzdem haben
die stimmlosen Versionen keine erkennbare Tonhöhe, sie sind gleichmäßig. Ihre Wellenformen sind auch
nichtperiodisch, die Spektren beinhalten ein kontinuierliches Frequenzband. Der rauschhafte oder zischende
Klangteil der Reibelaute entspricht der Turbulenz in einem Luftstrom, der durch eine kleine Öffnung mit zu
großer Geschwindigkeit gepresst wird. Diese Stelle kann an verschiedenen Punkten auf dem Weg des
Vokaltrakts geformt werden. Diese Artikulationspunkte sind die Lippen und Zähne, Zunge und Gaumen. Die
unterschiedlichen Formen des Vokaltraktes bewirken, dass unterschiedliche Frequenzbereiche verstärkt
werden. Die positive Rückkopplung (Resonanz) ist nicht stark genug, um den Luftstrom zu periodischen
anstelle zufallsverteilter Schwingungen zu zwingen.

Unter den „Anderen Konsonanten“ fasst man einige Phoneme zusammen, in denen Übergänge stattfinden,
die sich nicht grundsätzlich von den bisher geschilderten unterscheiden. Dies sind: Gleitlaute J, Gaumenlaute
L und r, Nasallaute m, n, nh, welche einen Übergang von Konsonant zu Vokal beinhalten.

Beim Beginn eines s Nasallauts schwingen die Stimmbänder bereits, nur die Nase ist offen, aber das lässt
bereits einen gleichmäßigen stimmhaften Laut zu, das Summgeräusch. Dieser kann unbegrenzt lange
ausgehalten werden, bevor der Konsonant artikuliert wird; er weist eine bestimmte Tonhöhe und eine
Teiltonreihe auf. Das Konsonanten Ende der Nasallaute entsteht durch das Öffnen der Mundpassage als
Vorbereitung für das folgende Phonem. Die Nasallaute unterscheiden sich voneinander nur durch die Stelle,
wo der Endkonsonant artikuliert wird die Lippen beim m, Zunge bei n.

Die Vokale sind gleichmäßige, stimmhafte Klänge mit bestimmter Tonhöhe und periodischer Wellenform.
Ihre Spektren sind harmonische Reihen. Wenn ein Luftstrom zwischen zwei fast geschlossenen
Stimmbändern hindurchströmt, gibt es eine kritische Geschwindigkeit, aber deren Überschreiten die
Strömung nicht mehr gleichmäßig sein kann. Strömungs-dynamische Instabilitäten bringen die Stimmbänder
zum Hin- und Herschwingen, so dass die Strömung nur noch stoßweise erfolgen kann. Man kann die Stimme
als ein weiteres Rohrblattinstrument klassifizieren. Ein wichtiger Unterschied besteht in der Beziehung
zwischen Rohrblatt und Resonator (Schallröhre). Bei allen Blech- und Holzblasinstrumenten ist die
Rückwirkung der Röhre stark genug, um die Frequenz des Rohrblatts ausreichend zu beeinflussen, weswegen
Bohrung und Form der Schallstürze großen Einfluss auf die erklingende Tonhöhe haben. Der Vokaltrakt
unterscheidet sich hier, weil seine Wände weich und nachgiebig sind und so einen großen Teil der
Schwingungsenergie absorbieren.

Alle Resonanzen im Vokaltrakt sind relativ schwach. Die Rückkopplung durch den Vokaltrakt ist viel zu
schwach, um einen nennenswerten Einfluss auf die Stimmbänder auszuüben. Obwohl auch die Stimmbänder
aus weichem Gewebe bestehen, müssen sie in akustischer Hinsicht wie harte Rohrblätter betrachtet werden,
deren Schwingungsfrequenz und -wellenform fast vollständig durch ihre eigene Spannung, Masse und ihren
Abstand bestimmt werden, bei einem geringfügigen Einfluss durch den Druck der Lungen.
Die Tonhöhe der Stimme wird also durch muskuläre Kontrolle in der Kehle bestimmt, gleichgültig, um
welchen Vokal es sich handelt; sauber intonierte Tonleitern singen zu können, erfordert daher ein mentales

44
Akustik 1 – kurze Fassung WS

und physisches Training dieser Muskeln. Die Klangfarbe der Vokale wird durch eine weitere unabhängige
Gruppe von Muskeln bestimmt, die die jeweilige Form des Vokaltrakts kontrollieren.

Die Doppelvokale sind schnelle Übergänge, die mit einem Vokal beginnen und mit einem anderen enden,
weil die Zunge ihre Form ändert. Doppelvokale (ai, eu, oi) sind ein gefährliches Minenfeld für Sänger, weil
sie das Problem aufwerten, wie lange der Übergangspunkt hinausgezögert werden kann. Ein zu langes
Verweilen am falschen Punkt kann den Sinn des Wortes entstellen.

Formanten
Als Formant (von lateinisch formare = formen) bezeichnet man in der Akustik oder Phonetik die
Konzentration von akustischer Energie in einem bestimmten Frequenzbereich. Formanten nennt man bei
Musikinstrumenten oder der menschlichen Stimme Frequenzbereiche, bei denen die Lautstärke angehoben
ist, also Maxima im Spektrum.
Aufgrund der Resonanzeigenschaften eines Instruments (oder des Artikulationsraums) werden bestimmte
Frequenzbereiche im Verhältnis zu anderen Frequenzbereichen verstärkt. Die Formanten sind diejenigen
Frequenzbereiche, bei denen die relative Verstärkung am höchsten ist. Die Lage der Formanten im
Frequenzbereich ist unabhängig von der erzeugten Tonhöhe. Nur Formanten, die oberhalb der Grundfrequenz
eines Tons liegen, haben Auswirkungen auf die Klangfarbe des Tons.
Für die Musiker sind vor allem die Vokale interessant, da sie es sind, auf denen der jeweilige Dauerwert
einer Note ausgehalten wird.
Die Erzeugung verschiedener Vokale durch Zungenbeugungen muss also auf verschiedenen
Filterfunktionen beruhen, die auf ein- und denselben von den Stimmbändern hervorgebrachten Grundklang
einwirken.

Wie klingen die in den Vokaltrakt eintretenden Schallwellen?


In unveränderter Form würde man einen „pfurzenden“ Klang wahrnehmen, ähnlich dem der vor den
Lippen eines Trompeters (ohne Kontakt zum Mundstück) erzeugt wird. Es handelt sich um eine Folge von
Luftstößen, deren genaue Eigenschaften davon abhängen, wie kraftvoll die Luft durch die Kehle gedrückt
wird.

Wie beeinflusst der Vokaltrakt das Frequenzspektrum? Alle Komponenten des Spektrums im
abgestrahlten Klang bleiben und es gibt vielmehr eine gemäßigte Verstärkung der Frequenzen, die in den
benachbarten Regionen um eine Resonanz liegen. Jeder solchen Frequenzbereich, innerhalb dessen die
Amplituden der Spektralfrequenzen verstärkt werden wird als Formant bezeichnet.

Nehmen wir an, dass ein Sänger eine Oktave höher singt, immer mit der gleichen zylindrischen Form des
Vokaltrakts. Dann erhält das Klangspektrum des Kehlkopfapparates alle vielfachen von 200 Hz, aber die
Formanten oder Formantenbereiche bleiben unverändert. Das Ohr erkennt irgendwie die Lage dieser
Formanten-Bereiche fast unabhängig davon, welche Einzelfrequenzen diese Bereiche bilden, so dass Klänge
(Bild 14.8) als weitgehend identische Vokalfarbe wahrgenommen werden.

Wissenschaftler Strong und Plitnik geben Berechnungen für 2 Fälle von aneinander anschließenden
zylindrischen Röhrenstücken mit unterschiedlichen Durchmessern an. Diese können eine grobe Annäherung
an die Form des Vokaltrakts für die Vokale „iiiii“ (Zunge oben oder vorne) und offenes „ooo“ (Zunge unten
und hinten) (Bild 14.10) darstellen. Weitere Beispiele von Spektren, deren Formantbereiche und die
dazugehörigen Wellenformen sind in Bild 14.11 dargestellt.

Die Frequenzlage der ersten Formanten wird besonders durch die Öffnungsweise des Unterkiefers
beeinflusst, die des zweiten durch die Form des Zungenhauptkörpers und die des dritten durch die
Zungenspitze. Wir könnten nun damit fortfahren, die Formantdarstellungen für eine lange Liste von
verschiedenen Vokalen oder eine Tabelle der Frequenzbereiche für die jeweiligen Formanten aufzustellen.

45
Akustik 1 – kurze Fassung WS

Wenn man eine Darstellung wählt, bei der die horizontale Achse die Frequenz des ersten Formantbereiches
und die vertikale die des zweiten angibt, stellt jeder Punkt in dieser Darstellung ein einmaliges Formantpaar
dar.
Im Idealfall würde jeder Vokal einem solchen Punkt entsprechen, aber in der Praxis besteht eine große
Bandbreite nicht nur von einer Person zur anderen, sondern auch für die gleiche Person zu verschiedenen
Zeiten. Man findet eine ganze Region von Formantpaaren, innerhalb derer die gleiche Vokalinformation
erkannt wird. Die Bereiche überlappen sich zum Teil, so dass zuweilen der gleiche Klang mehrdeutig
wahrgenommen werden kann. Normalerweise ergibt nur einer der beiden möglichen Klanginterpretationen
einen Sinn, und wir pflegen automatisch diesen anzunehmen, ohne uns der Mehrdeutigkeit bewusst zu
werden. Diese Flexibilität ist in der Musik sehr nützlich: da einige Vokale schrill klingen, wenn sie länger
ausgehalten werden, lernen Sänger diese Vokale zu modifizieren, indem Sie ein kurzes „e“ mehr wie ein „ä“
singen, ohne dadurch an Verständlichkeit zu verlieren.
Männer, Frauen, Kinder haben einen unterschiedlich großen Vokaltrakt, sie sind in der Lage, alle genau
die gleichen Vokalformanten zu produzieren. Ein wichtiges Hilfsmittel für die Analyse rasch aufeinander
folgender Phonemen ist heutzutage das Sprach-Spektogramm. Man kann die Änderungen in den Formanten,
die durch die Bewegungen des Vokaltrakts bewirkt sind, analysieren.
Zwei Faktoren vermindern manchmal die Unterscheidbarkeit von Vokalen beträchtlich: Lautstärke und
Stimmlage. Vermutlich bringt ein weicher Ausgangsklang einen so geringen Anteil an hohen Frequenzen ein,
dass die höheren Formanten kaum ausgeprägt sein werden. Man kann leicht durch einfaches Singen
nachprüfen, dass schwach gesungene Vokale über wenig spezifische Klangfarbe verfügen, während laut
gesungene sehr deutlich unterschiedlich klingen.
Ein weiteres Problem entsteht beim Singen in hohen Lagen. Höhere Grundfrequenzen spreizen die
harmonische Reihe so weit aus, dass unter Umständen ein gegebener Formantbereich keinerlei Resonanz-
Unterstützung mehr im Vokalapparat findet. Das heißt, dass gute Sopranistinnen vor allem in der hohen Lage
der Formantbereiche verschieben können, um so ausreichend starke niedrigere Teiltöne für die Erzeugung
eines musikalischen klangvollen Tons zu heben, auch wenn sie dabei bewusst eine unkorrekte Vokalfärbung
in Kauf nehmen.

Harmonische, also Oberwellen, Partialtöne, Teiltöne oder Obertöne, und Rauschanteile, die in den
Bereich eines Formanten fallen, werden gegenüber der Grundfrequenz und gegenüber anderen Obertönen
verstärkt. Stimmen und Instrumente besitzen oft mehrere Formantregionen, die nicht direkt aneinander
anschließen.
Die Klangfarbe oder das Timbre eines Musikinstruments oder einer Stimme wird von der Lage und
Ausprägung der Formanten beeinflusst. Durch sie lassen sich Stimmen und auch Musikinstrumente
voneinander unterscheiden – etwa die Stimmen zweier Frauen oder eine Geige von einer anderen.
Hervorgerufen werden Formanten durch Resonanzen, die zur Verstärkung oder Abschwächung
bestimmter Frequenzbereiche führen. Deren Lage und Charakter hängt ab:
• bei mechanischen Musikinstrumenten von der Bauform und den verwendeten Materialien,
insbesondere von der Gestaltung des Klangkörpers
• bei der menschlichen Stimme von der Form des Vokaltrakts, so wie er zum Artikulieren eines
bestimmten Lauts durch Muskelbewegungen eingestellt wird.
• bei elektronischen Musikinstrumenten durch Bandpässe und Bandsperren

46
Akustik 1 – kurze Fassung WS

Sprache

Spektrogramm [i, u]: F1, F2

Bei der menschlichen Sprache charakterisiert die Lage von Formanten die Bedeutung bestimmter Laute.
Anhand der ersten beiden Formanten im Vokaldreieck [1] beziehungsweise im Vokaltrapez lassen sich alle
Vokale eines Lautsystems voneinander unterscheiden. Sicherlich unterscheiden sich die Vokal-Formantlagen
von Mensch zu Mensch, besonders zwischen Männern, Frauen und Kindern. Hier folgt eine anschauliche
Tabelle der gemittelten Formantlagen aus dem genannten Vokaldreieck:

Vokal-Formantlagen
Voka
Formant f1 Formant f2
l
U 320 Hz 800 Hz
O 500 Hz 1000 Hz
å 700 Hz 1150 Hz
A 1000 Hz 1400 Hz
ö 500 Hz 1500 Hz
ü 700 Hz 1650 Hz
ä 700 Hz 1800 Hz
E 500 Hz 2300 Hz
I 320 Hz 3200 Hz

Vokal-Formantbereich
Vo
Haupt-Formantbereich
kal
U 200 bis 400 Hz
O 400 bis 600 Hz
A 800 bis 1200 Hz
400 bis 600 und 2200 bis 2600
E
Hz
200 bis 400 und 3000 bis 3500
I
Hz

Die ersten beiden Formanten f1 und f2 sind für die Verständlichkeit der Vokale wichtig. Ihre Lage
charakterisiert den gesprochenen Vokal. Um sich verstehen zu können, müssen diese Formanten bei jedem
Sprecher in etwa gleich sein.
Der dritte und der vierte Formant f3 und f4 sind nicht mehr wesentlich. Diese charakterisieren eher die
Anatomie des Sprechers und dessen Artikulations-Eigenarten und variieren je nach Sprecher. Darüber hinaus
wird der Charakter einer Stimme noch durch die Grundfrequenz (100 bis 250 Hz), die Bandbreite, das

47
Akustik 1 – kurze Fassung WS

Spektrum, Artikulationseigenarten bestimmt. Die Sprachgrundfrequenz liegt beim Mann bei ca. 130 Hz und
bei der Frau bei ca. 240 Hz.
Was die Singstimme betrifft, so sind bestimmte Vokale ab einer gewissen Tonhöhe nicht mehr singbar,
weil dann die Grundfrequenz in den Bereich der ersten Formanten kommt, und somit der Klangeindruck
dieser Formanten verschwindet.
Die Analyse von Formanten spielt, neben anderen charakteristischen Aspekten einer Stimme, auch eine bedeutende Rolle bei
der Sprechererkennung in der Kriminalistik.

Spezielle Probleme der Sängerstimme


Die Art und Weise, in der unser Stimmapparat gesungene Töne produziert, kann je nach Tonhöhe sehr
unterschiedlich sein. Ein großer Teil der sängerischen Ausbildung besteht darin, die Beherrschung und
Ausnutzung der Übergänge zwischen „Brust- und Kopfstimme“ zu erlernen.
Ganz offensichtlich hört man so etwas beim Wechsel männlicher Sänger von der „normalen“ Stimme zur
Falsettstimme bei hohen Noten. In der Falsettlage sind die Vokalfalten langgezogen und dünner, werden
dadurch effektiv steifer und können deswegen mit höheren Frequenzen als sonst vibrieren. Die Stimmritze
(Glottis) bleibt beim Falsettsingen immer etwas offen, weshalb die Wellenform relativ gleichmäßig und
damit die Klangfarbe ziemlich rein und rund bleibt. Die andauernde Öffnung der Glottis trägt aber auch dazu
bei, dass der Luftvorrat des Sängers im Falsett schneller als sonst erschöpft ist.

Gesangslehrer gebrauchen manchmal Wörter wie Resonanz und Tragfähigkeit (oder Stimmkraft) in einer
Weise, die für einen Akustiker schwer nachzuvollziehen ist.

Es ist vollkommen richtig, von der sorgfältigen Kontrolle des Kiefers, der Zunge und des Gaumens als
Mittel zur Erzeugung besserer Stimmwualität infolge von Resonanzen zu sprechen.
Von Resonanz im Brustkorb soll man nur im psychologischen Sinn reden.
Auch kann die Rede über die Tragfähigkeit der Stimme psychologisch (in der Vorstellung des Sängers mit
der Muskelkontrolle) assoziiert sein, die zu einem lauteren und gleichmäßigeren Klang im Vokaltrakt oder
einer größeren Mundöffnung führt.
Die Schallintensität wird jedoch immer mit der Entfernung nach dem gleichen Gesetz abnehmen, und die
Gerechtheit der Schallabstrahlung wird vollständig durch Beugung bestimmt. Da sich hörbare Wellenlänge
zwischen 15 m bis 0,5 m (d.h. Frequenzen bis ca. 700 Hz) fast gleichmäßig in alle Richtungen ausbreiten,
stellt der Kopf als Hindernis also keine Beeinträchtigung dar. Bei höheren Frequenzen schallt der Strahl
weitgehend nach vorne ab und kaum nach hinten, nur bei sehr hohen Frequenzen (etwa 6 kHz) könnte ein
Sänger wirklich erwarten, einen Ton in eine bestimmte Richtung zu „projektieren“, indem er eine sehr große
Mundöffnung benutzt. Solche Frequenzen können aber wiederum nur höhere Teiltöne sein.

Der Wissenschaftler Sundberg hat eine interessante Erklärung dafür gegeben, wieso ein Sänger
(Operntenor) durchaus gut zu hören vermag, auch wenn er von einem Orchester begleitet wird. Obwohl die
gesamte Schallabstrahlung des Sängers natürlich weit hinter der des Orchesters zurückbleibt, kann der Sänger
sich Gehör verschaffen, indem er seine akustische Energie vor allem auf einen Frequenzbereich konzentriert,
in welchem der Orchesterklang nicht so stark ist: das Ergebnis könnte von den Hörern als eine gute
„tragfähige“ Stimme interpretiert werden.

Das Vibrato - Frequenzmodulation - ist eine Stimmeigenschaft, die zuweilen bewusst gepflegt wird. Man
kann auch ein tremolo (Amplitudenmodulation mit kurzen Zeitabständen) mit der Stimme erzeugen.
Das Vibrato ist in der Musik die periodisch wiederkehrende, geringfügige Veränderung der Frequenz
eines gehaltenen Tons. Im Gegensatz zu einem nicht vibrierenden Ton wird ein Ton mit angemessenem
Vibrato als lebendig wahrgenommen. Daher findet das Vibrato vor allem in der klassischen Musik breite
Verwendung.

48
Akustik 1 – kurze Fassung WS

In der Stimme entsteht das Vibrato unwillkürlich, ohne gelernt oder gelehrt zu werden. Auf Saiten- und
einigen Blasinstrumenten wird es durch bestimmte Spieltechniken erzeugt.

Wie groß soll das Vibrato sein? In der Regel werden Frequenzen zwischen 5-7 Hz am überzeugendsten
beurteilt weniger als 3 und mehr als 10 Hz Modulationsfrequenz erfordern ein besonderes Training. Als
musikalisch sinnvoll hat sich ein Wert von ca. 2 % Frequenzabweichung erwiesen, weniger als 1 % wird
kaum noch wahrgenommen, mehr wirkt unschön. Das Vibrato verleiht dem Ton eine gewisse Wärme,
darüber hinaus kann es auch die Aufmerksamkeit auf eine Solostimme lenken, wo es oft und bevorzugt
eingesetzt wird. Ein guter akustischer Grund könnte auch darin liegen, dass viele kleine Vibrato-Beiträge in
einem Ensemble zu einer Verstärkung des Chorus-Effektes führen.

49

Das könnte Ihnen auch gefallen