Sie sind auf Seite 1von 10

ENTROPIE UND DISSONANZ

tim eisenhardt

Das Referat, das dieser Verschriftlichung vorangegangen


ist, bestand zu einem wesentlichen Teil aus einer heuristischen Annherung an den Begriff der Entropie, da dieser
verstanden sein musste, um die Ergebnisse von Hinrichsen [4] zu interpretieren. Um nun die Verbindung zur
Neurowissenschaft noch strker herauszustellen, ist das
Thema der vorliegenden Arbeit stark erweitert worden; es
wurde klar, dass der Begriff der Dissonanz im Zentrum
eines groen Themenkomplexes steht, welcher Teile der
Physik (insbesondere Psychoakustik), Informationstheorie und natrlich der Neurowissenschaften berhrt. Auch
eine Verknpfung zur Musik ist inhrent stets gegeben
hier muss aber die Grenze gezogen werden: Es soll im
Folgenden um einen vorbewussten, sensorischen Begriff von
Dissonanz gehen. ber die Konsequenzen fr die Entwicklung neuer Musiken und das Verstndnis des traditionellen
westlichen Tonsystems hat William Sethares ein sehr interessantes Buch geschrieben. [10]
Dieser (gemeinfreie) Text ist eine Verschriftlichung zu einem
Referat, das im Seminar Musik und Neurokognition bei Frau
Dr. habil. Christiane Neuhaus (WS 2013) gehalten wurde.

tim.eisenhardt1@uni-oldenburg.de
Matrikel-Nr.: 6246867

einleitung

Das menschliche Hirn weist eine herausragende Fhigkeit auf, komplexe Klangeindrcke zu analysieren und einzelne Gerusche zu
isolieren. In der Tat scheint es die wichtigste Funktion des Hrens zu
sein, Klangquellen zu identifizieren und zu lokalisieren Sprache und
Musik sind dagegen eher Randerscheinungen. [13]
Dem Hirn stehen fr diese Aufgabe im Wesentlichen zweierlei Hinweise zur Verfgung: Temporale und spektrale. Ein temporaler Hinweis
wre zum Beispiel, dass zwei Teilklnge genau zur selben Zeit anfangen und enden; dies fhrt zu dem Eindruck, es handle sich um
eine einzelne Klangquelle. Ebenso werden auf der spektralen Seite
Frequenzen gruppiert (und als ein Klang wahrgenommen), die etwa
ganzzahlige Vielfache voneinander sind. Viele Klnge, die fr Menschen und Tiere wichtig sind, haben nmlich solche harmonischen
oder quasi-harmonischen Obertne. Diese Klnge als eigenstndig
identifizieren und die wichtige Information (Zeit und geschtzter Ort)
von der unwichtigen (klangliche Details, also Timbre) trennen zu knnen, bedeutet einen erheblichen Vorteil im alltglichen Kampf ums
berleben. [6]
Es hat also einfache evolutionre Grnde, dass Menschen harmonische Klnge von anharmonischen unterscheiden knnen. Konsonanz
und Dissonanz sind in diesem Sinne Begriffe, die aus der Notwendigkeit erwachsen, komplexe Klangsituationen schnell einzuordnen.
Unklar bleibt, warum manche Klnge, die vom einfachen harmonischen Fall besonders stark abweichen, von Menschen jedes kulturellen
Hintergrundes bereinstimmend als besonders unangenehm empfunden werden. Um genauer zu verstehen, was Dissonanz ist, wre
es praktisch, ein einfaches Modell zu haben, mit dem vorausgesagt
werden kann, wie dissonant ein Klang typischerweise auf einen Menschen wirken wird. Hier hat es in den letzten Jahren einige interessante
Entwicklungen gegeben, die im Folgenden vorgestellt werden sollen.
2

welche klnge sind dissonant, welche konsonant?

Ein weit verbreiteter Irrglaube ist seit Galilei, dass das Hirn bestimmte
Kombinationen von Tnen bevorzugt und als konsonant einstuft,
deren Frequenzen in einem einfachen, ganzzahligen Verhltnis zu
einander stehen. Diese Kombinationen stellen die wichtigsten musikalischen Intervalle dar, auf welchen wiederum das westliche Tonsystem
mit seinen zwlf quidistanten Stufen basiert. Nach dieser Denkweise
wre das Frequenzverhltnis der reinen Quinte, 3:2, besonders angenehm, whrend allerdings das nur wenig verstimmte Intervall 301:200
eine mathematische Folter fr das Hirn darstellen wrde.
Dass das nur die halbe Wahrheit ist, zeigt Abb. 1. Es wuren jeweils
zwei pure Sinustne verschiedener Frequenz kombiniert. Das Ergebnis
spiegelt in keinster Weise das wider, was man aus musikalischer Sicht
erwarten wrde: Insgesamt ist die Kurve sehr glatt, Spitzen bei den
wichtigen musikalischen Intervallen fehlen. Das Unisono wird als
sehr konsonant empfunden, nur leicht voneinander abweichende Tne
sind am dissonantesten. Etwa ab der kleinen Terz ist alles mehr oder

Abbildung 1: Konsonanzempfinden bei Superposition reiner Sinustne. Entnommen aus Roederer, nach Plomp & Levelt,
1965

weniger konsonant; so wurde z.B. ein Tritonus in dieser Konstellation


konsonanter empfunden als eine reine Quinte.
Diese Verteilung ist in der Praxis aber von eher geringer Bedeutung, denn alle Klnge, die die Welt bereithlt, haben Obertne, die
in den meisten Fllen ungefhr ganzzahlige Vielfache einer Grundfrequenz sind. Kombiniert man zwei solche komplexe Tne, wobei
dann alle Harmonischen miteinander interagieren, wie es in Abb. 1
dargestellt ist, erkennt man deutlich die prominente Rolle der reinen
musikalischen Intervalle (siehe Abb. 2).
Der Fall, dass die Harmonischen genau ganzzahlige Vielfache der
Grundfrequenz sind, gilt nur fr perfekt lineare Oszillatoren, also z.B.
ideale Saiten oder ideale Luftsulen. Reale Saiten haben einen gewissen Grad an Steifheit, sind also eigentlich Stbe; reale Blasinstrumente
haben Austrittsffnungen, in denen der Druck abfllt. Beides fhrt zu
anharmonischen Effekten im Obertonspektrum, die allerdings nicht
unbedingt strend wirken. Ganz im Gegenteil: Ein synthethischer Klavierton wurde von Testpersonen als natrlicher und wrmer bewertet,
wenn die Obertne leicht anharmonisch verstimmt waren. [5]
Da der Grad der Dissonanz wesentlich von der Position und Amplitude der Obertne abhngt (wie wir im Vergleich von Abb. 1 und 2
sehen konnten), beeinflusst diese Anharmonizitt auch die Lage der
Intervalle grter Konsonanz. Darum mssen die Oktaven bei einem
Klavier gespreizt werden eine mathematisch reine Frequenzverdopplung wrde unangenehm klingen, weil die (wegen der Saitensteifheit
etwas zu hohen) Obertne dicht nebeneinander lgen und dadurch
Schwebungen erzeugten. [4, 10, 9]
Viele Perkussionsinstrumente wie z.B. Glocken, Gongs, Trommelfelle, auch Klanghlzer oder -steine von Marimbas etc., haben ein vllig
anders geartetes Obertonspektrum. Das hat physikalische Grnde: Die
Schwingungsmoden einer Metallplatte sind nicht einfache Vielfache
voneinander, wie es bei einer Saite der Fall ist. Diese Intrumente im
normalen diatonischen Tonsystem zu verwenden, ist daher immer

Abbildung 2: Berechnete Konsonanz fr zwei komplexe Tne (je sechs


Harmonische). Der untere Ton ist bei 250 Hz fixiert, der
obere variiert entsprechend der x-Skala. Nach Plomp &
Levelt, entnommen aus [10, S. 94].
mit gewissen Einschrnkungen verbunden. Ist die Ausklingzeit kurz
genug, fllt der Defekt i.A. nicht weiter auf. Eine Marimba hat Resonatoren, um die angenehmen Frequenzen hervorzuheben. Glockenspiele
klingen tatschlich einfach sehr matschig, obwohl Glockengieer
sich grte Mhe geben, die unteren Moden an die diatonische Skala
anzupassen. 1 [10]
Eine Mglichkeit, konstruktiv mit den Eigenarten dieser Klnge
umzugehen, ist, die Skala entsprechend anzupassen, sodass die prominenten konsonanten Intervalle dem Timbre der Instrumente gerecht
werden. Bei einem temperierten Klavier wird mit der Oktavspreizung
im Prinzip genau das gemacht, allerdings sind die Korrekturen sehr
klein. Bemerkenswert ist in dieser Hinsicht die sog. Gamelan-Musik,
welche traditionell auf Java und Bali praktiziert wird und Intervalle enthlt, die der abendlndischen Musik gnzlich unbekannt sind.
Mehr zu diesem Thema, insbesondere auch aufschlussreiche Tonbeispiele, bietet das Buch von Sethares [10].
3

was passiert im hirn?

Die Vermessung des menschlichen Hrvermgens ist noch nicht abgeschlossen. Insbesondere betrifft dies die Sortierung des Spektrums in
Frequenzen, die zum selben Klangerzeuger gehren (spektrale Segregation), whrend die zeitliche Auflsung schnell aufeinanderfolgender
Reize vergleichsweise gut erforscht ist. [9] Im Folgenden wird uns
vor allem die spektrale Segregation interessieren, denn dort liegt die
Ursache fr das Empfinden von Konsonanz und Dissonanz.

1 Bis

vor kurzem hie das meistens: kleine Terz, Quinte, Oktave usw., mittlerweile
sind auch Durterzen mglich.

Abbildung 3: Orte im Hirn, an denen Audiosignale verarbeitet werden. From bottom to top: outer and middle ear, cochlea, and
auditory nerve (AN); cochlear nucleus (CN) and superior
olivary complex (SOC) in the brainstem; inferior colliculus
(IC) in the midbrain; medial geniculate body in the thalamus;
primary and secondary auditory cortex (AC). Aus [11]
Das auditorische System von Sugetieren ist ein Hochhaus, siehe
Abb. 3. Es bleibt eine Herausforderung, zu erklren, inwiefern die
Zustnde an den verschiedenen Ebenen mit dem letztendlichen Hreindruck zusammenhngen (oder nicht). Erschwerend kommt hinzu,
dass zwischen den Bereichen beidseitige Verbindungen existieren, d.h.
das Gehrte beeinflusst, worauf im Folgenden die Aufmerksamkeit
gelenkt wird. Auch Hirnareale auerhalb des auditorischen Systems
knnten auf diese Weise eine Rolle spielen.
Ein insbesondere durch die Arbeiten von Zatorre et alii [17, 18,
15, 16] sowie Sinex et alii [13, 14, 12] gesicherter Fakt ist, dass im
Primren Auditorischen Cortex (AC) eine Arbeitsteilung zwischen
linker und rechter Hirnhlfte stattfindet: Bei 97% aller Menschen ist
der linke Primre AC auf eine hohe Zeitauflsung spezialisiert und
damit essentiell fr das Sprachverstndnis; der rechte Primre AC ist
dafr genauer im Erkennen kleiner Frequenzunterschiede.
Unser Fokus liegt also auf dem rechten AC. Spektrale Segregation
und Identifizierung von Klangquellen geschieht vorbewusst (obwohl
auch abstraktere Hirnareale einen Einfluss auf die Arbeitsweise des
auditorischen Systems haben knnen, s.o.), ebenso ist der erste Eindruck von Konsonanz oder Dissonanz nicht bewusst steuerbar. [3] An
dieser Stelle mssen wir uns abgrenzen von abstrakteren Konzepten
von Dissonanz, z.B. von Melodien oder Akkordfolgen, die schon eine

auditorische Erinnerung voraussetzen.2 Es geht im Folgenden stets


um unmittelbare, sensorische Dissonanz eines einzelnen Klangs wie
eine przise Definition dessen lauten knnte, ist eine der Fragen, die
sich dabei stellt.
4

kann man dissonanz messen?

4.1

Entropie in Physik und Informatik

Der Begriff der Entropie wurde ursprnglich im Rahmen der Thermodynamik geprgt. Neue technische Errungenschaften, die schlielich
zur industriellen Revolution fhren sollten, erforderten eine quantitative Auseinandersetzung mit Prozessen, in denen Energie umgewandelt
wird. Entropie ist in diesem Kontext eines der sog. thermodynamischen
Potentiale mit der prominenten Eigenschaft, stets grer zu werden
(bei irreversiblen Prozessen) oder gleichzubleiben (bei reversiblen
Prozessen).
Die Verbindung zur Informationstheorie wurde erst sehr viel spter
herausgestellt. Heute kennt man nicht nur das statistische Fundament
der Thermodynamik, man wei auch, dass zum Schreiben einer Information (z.B ein Bit in einem Computer) eine gewisse Mindestenergie
notwendig ist. Aufgrund dieses Zusammenhangs knnen tatschlich
die aus der Informatik bekannten Bits in energetische Einheiten umgerechnet werden:
1Bit = (ln 2) k B
(k B = 1, 4 1023 J/K ist die Boltzmann-Konstante.) Darauf genauer
einzugehen, wrden den Rahmen dieser Arbeit sprengen, darum
sei der Begriff an dieser Stelle nur heuristisch eingefhrt: Entropie
ist ein Ma fr Unordnung, hohe Entropie heit viel Information,
geringe Bestimmtheit, und bedeutet in Verbindung mit dem Begriff
der Tonalitt (s.u.) einen komplexen, atonalen Klangeindruck.
4.2

Harmonische Entropie

Das menschliche Ohr tendiert, wie schon erwhnt, dazu, die gehrten
Frequenzen in eine harmonische Serie einzuordnen, auch wenn die
Fundamentale dieser Serie nicht vorhanden oder maskiert ist. Die
Leichtigkeit, mit der diese Einordnung geschehen kann, heit Tonalitt,
ihr Inverses ist nach Erlich die Harmonische Entropie. [10, S. 90ff]
Die harmonische Entropie eines komplexen Klanges kann paarweise
fr je zwei harmonische Tne berechnet werden. Um zu entscheiden,
ob diese beiden Tne (quasi-)harmonisch zu einer gemeinsamen Fundamentalen gehren, kann man jedem Teilterm der Farey-Reihe Fn ,
die alle Quotienten natrlicher Zahlen in immer dichter werdender Reihung enthlt, eine Wahrscheinlichkeitsverteilung zugewiesen werden.
Man hat also zu einem gegebenen Intervall i eine Wahrscheinlichkeit
p j (i ), ob i als j-tes Intervall der Fn interpretiert wird. Je nher diese
Frequenzen beieinander liegen, desto hher ist diese Wahrscheinlich-

2 Vgl.

dazu die Arbeiten von Blood et alii [1]

Abbildung 4: Harmonische Entropie fr Dreiklnge mit variablem oberen (diagonal nach rechts aufgetragen) und
unteren (vertikal aufgetragen) Intervall im Bereich
von 2 bis 5 Halbtnen. Nach Paul Erlich, Quelle:
http://commons.wikimedia.org/wiki/File:Triadic_harmonic_entropy.png

keit. Die Harmonische Entropie des Intervalls i wird dann wie folgt
definiert:
HE(e) = p j (i ) log( p j (i ))
j

Wenn i nahe an einem einfach Vielfachen der Reihe liegt, wird die
Summe einen groen Term enthalten und viele verschwindend kleine,
die Harmonische Entropie wre in diesem Fall also niedrig.
Die Strke dieses Konzepts demonstriert Abb. 4: Fr ein gegebenes
Timbre, in diesem Fall herkmmliche ganzzahlige Moden, kann man
zu jeder Dreierkombination solcher Tne die dazugehrige Tonalitt
vorhersagen. Es ergeben sich klar erkennbare Peaks bei den Kombinationen, die auch in der abendlndischen Musik eine Rolle spielen, z.B.
bei 4:5:6 (Dur-Dreiklang).
4.3

Entropie als Fehlerfunktion fr Klavierstimmungen

Klaviere werden in einem aufwendigen Prozess mit einer wohltemperierten Stimmung versehen. Diese Stimmung stellt einen Kompromiss dar,
um einerseits alle Tne und Intervalle mglichst gleich zu behandeln
und andererseits die Unzulnglichkeiten des Instruments der dem
Tonsystem inhrente Fehler, das sog. Komma, und die Inharmonizitt
der Saiten so gut es geht auszugleichen. Eine wohltemperierte Stimmung kann bislang nur von professionellen Klavierstimmern erreicht
werden und weist dann eine (reproduzierbare!) Unregelmigkeit auf,
die sich von Instrument zu Instrument leicht unterscheidet.
Einen vielversprechenden Ansatz, die Natur dieser Stimmung, welche ja ein klanglich optimaler Kompromiss fr das menschliche Hirn
ist, analytisch zu erklren, fand unlngst Haye Hinrichsen. [4] Er

Abbildung 5: Typisches Resultat des entropiebasierten Stimmverfahrens nach Hinrichsen (rote Kurve) im Vergleich zu
einer professionellen Stimmung nach Gehr (schwarze
Kurve). Entnommen aus [4]
benutzte Aufnahmen von allen Tnen eines (verstimmten) Klaviers
und implementierte einen Algorithmus, der die Tne virtuell umstimmte, bis die Shannon-Entropie des Obertonspektrums minimal
war. Dieser Zustand minimaler Entropie war berraschend nah an
der temperierten Stimmung, die ein Klavierstimmer fr eben dieses
Klavier fand (siehe Abb. 5).
Die Shannon-Entropie eines Spektrums ist wie folgt definiert:

H = p( f ) ln p( f )d f
Dabei ist p der Schalldruck. Da die Berechnung mit tatschlichen
Messwerten auf einem Computer stattfand, wurde eine diskretisierte
Form verwendet, die damit eine beachtliche hnlichkeit zu Erlichs
Harmonischer Entropie aufweist.3 Die Prmisse, dass ganzzahlige
Vielfache eine mit steigender Komlexitt abnehmende Rolle spielen
sollen, die sich in der Summierung ber die Terme der Farey-Reihe
niedergeschlagen hatte, wird bei Hinrichsen durch die natrlicherweise abnehmenden Amplituden der Oberschwingungen einer realen Klaviersaite ersetzt. Qualitativ werden beide Herangehensweisen
sicherlich zu hnlichen Ergebnissen gelangen, sodass es durchaus
interessant zu wissen wre, ob man auch die jeweils andere Formel
fr die hier aufgefhrten Anwendungsbeispiele verwenden knnte.
Der Erfolg dieser Methode, die ohne Bercksichtigung psychoakustischer Besonderheiten nur die Shannon-Entropie als Fehlerfunktion
zur Beurteilung einer Klavierstimmung verwendet, bietet interessante
Perspektiven auf dem Weg zu einem tieferen Verstndnis des menschlichen Hrens, speziell auch der Wahrnehmung von Musik. Sollte das
3 Es

sei allerdings noch einmal darauf hingewiesen, dass der Buchstabe p bei Erlich
fr eine Wahrscheinlichkeit steht, bei Hinrichsen jedoch fr den Schalldruck.

Empfinden von Konsonanz und Dissonanz auf derart einfachen Prinzipien fuen? Die Prominenz ganzzahliger Schwingungsverhltnisse hat
letztendlich rein physikalische Grnde, die, wie z.B. bei der GamelanMusik, auch fehlen knnen. Wer der elegantesten Theorie den Vorzug
gewren will, sollte Hinrichsens Idee weiterverfolgen, denn sie fhrt
mit minimalen Annahmen (und bislang ohne psychoakustische Korrekturen) zu beachtlichen Ergebnissen.
Davon abgesehen werden in der Folge vielleicht auch Klavierstimmer langfristig ihre Arbeitsweise verndern. Professionelle Stimmgerte knnen bislang nur die korrekte Oktavspreizung berechnen, die
eigentliche Temperierung der Mitteloktave erfolgt einfach quidistant.
Die Ergebnisse der Methode von Hinrichsen liegen nher an dem, was
auch ein Klavierstimmer als optimal empfinden wrde.

literatur
[1]

Blood, Anne J. ; Zatorre, Robert J. ; Bermudez, Patrick ; Evans,


Alan C.: Emotional responses to pleasant and unpleasant music
correlate with activity in paralimbic brain regions. In: Nature
neuroscience 2 (1999), Nr. 4, S. 382387

[2]

Carlyon, Robert P.: How the brain separates sounds. In: TRENDS
in Cognitive Science 8 (2004), Oktober, Nr. 10, S. 465471

[3]

Grube, Manon ; Von Cramon, D Y. ; Rbsamen, Rudolf: Inharmonicity detection. In: Experimental brain research 153 (2003), Nr.
4, S. 637642

[4]

Hinrichsen, Haye: Entropy-based tuning of musical instruments.


In: Revista Brasileira de Ensino de Fsica 34 (2012), Nr. 2, S. 18

[5]

Jrvelinen, Hanna ; Vlimki, Vesa ; Karjalainen, Matti:


Audibility of the timbral effects of inharmonicity in stringed
instrument tones. In: Acoustics Research Letters Online 2 (2001), Nr.
3, S. 7984

[6]

Micheyl, Christophe ; Oxenham, Andrew J.: Pitch, harmonicity


and concurrent sound segregation: Psychoacoustical and neurophysiological findings. In: Hearing research 266 (2010), Nr. 1, S.
3651

[7]

Moore, Brian C. ; Glasberg, Brian R. ; Peters, Robert W.: Thresholds for hearing mistuned partials as separate tones in harmonic
complexes. In: The Journal of the Acoustical Society of America 80
(1986), Nr. 2, S. 479483

[8]

Roberts, Brian ; Brunstrom, Jeffrey M.: Perceptual segregation


and pitch shifts of mistuned components in harmonic complexes and in regular inharmonic complexes. In: The Journal of the
Acoustical Society of America 104 (1998), Nr. 4, S. 23262338

[9]

Roederer, Juan G.: The Physics and Psychophysics of Music: An


Introduction. (2008)

[10] Sethares, William A.: Tuning, timbre, spectrum, scale. Bd. 2. Springer, 2005
[11] Shamma, Shihab A. ; Micheyl, Christophe: Behind the scenes of
auditory perception. In: Current opinion in neurobiology 20 (2010),
Nr. 3, S. 361366
[12] Sinex, Donal G.: Spectral processing and sound source determination. In: International review of neurobiology 70 (2005), S. 371
[13] Sinex, Donal G. ; Guzik, Heidi ; Li, Hongzhe ; Henderson Sabes,
Jennifer: Responses of auditory nerve fibers to harmonic and
mistuned complex tones. In: Hearing research 182 (2003), Nr. 1, S.
130139
[14] Sinex, Donal G. ; Li, Hongzhe ; Velenovsky, David S.: Prevalence
of stereotypical responses to mistuned complex tones in the
inferior colliculus. In: Journal of neurophysiology 94 (2005), Nr. 5, S.
3523
[15] Zatorre, Robert J. ; Belin, Pascal: Spectral and temporal processing in human auditory cortex. In: Cerebral Cortex 11 (2001), Nr.
10, S. 946953
[16] Zatorre, Robert J. ; Belin, Pascal ; Penhune, Virginia B.: Structure and function of auditory cortex: music and speech. In: Trends
in cognitive sciences 6 (2002), Nr. 1, S. 3746
[17] Zatorre, Robert J. ; Evans, Alan C. ; Meyer, Ernst: Neural
mechanisms underlying melodic perception and memory for
pitch. In: The Journal of Neuroscience 14 (1994), Nr. 4, S. 19081919
[18] Zatorre, Robert J. ; Halpern, Andrea R. ; Perry, David W. ;
Meyer, Ernst ; Evans, Alan C.: Hearing in the minds ear: A PET
investigation of musical imagery and perception. In: Journal of
Cognitive Neuroscience 8 (1996), Nr. 1, S. 2946

erklrung
Hiermit erklre ich, dass ich die vorliegende Hausarbeit selbstndig
und nur unter Verwendung der angegebenen Quellen und Hilfsmittel
angefertigt habe.
Oldenburg, den 1.5.2014

10