Beruflich Dokumente
Kultur Dokumente
tim eisenhardt
tim.eisenhardt1@uni-oldenburg.de
Matrikel-Nr.: 6246867
einleitung
Das menschliche Hirn weist eine herausragende Fhigkeit auf, komplexe Klangeindrcke zu analysieren und einzelne Gerusche zu
isolieren. In der Tat scheint es die wichtigste Funktion des Hrens zu
sein, Klangquellen zu identifizieren und zu lokalisieren Sprache und
Musik sind dagegen eher Randerscheinungen. [13]
Dem Hirn stehen fr diese Aufgabe im Wesentlichen zweierlei Hinweise zur Verfgung: Temporale und spektrale. Ein temporaler Hinweis
wre zum Beispiel, dass zwei Teilklnge genau zur selben Zeit anfangen und enden; dies fhrt zu dem Eindruck, es handle sich um
eine einzelne Klangquelle. Ebenso werden auf der spektralen Seite
Frequenzen gruppiert (und als ein Klang wahrgenommen), die etwa
ganzzahlige Vielfache voneinander sind. Viele Klnge, die fr Menschen und Tiere wichtig sind, haben nmlich solche harmonischen
oder quasi-harmonischen Obertne. Diese Klnge als eigenstndig
identifizieren und die wichtige Information (Zeit und geschtzter Ort)
von der unwichtigen (klangliche Details, also Timbre) trennen zu knnen, bedeutet einen erheblichen Vorteil im alltglichen Kampf ums
berleben. [6]
Es hat also einfache evolutionre Grnde, dass Menschen harmonische Klnge von anharmonischen unterscheiden knnen. Konsonanz
und Dissonanz sind in diesem Sinne Begriffe, die aus der Notwendigkeit erwachsen, komplexe Klangsituationen schnell einzuordnen.
Unklar bleibt, warum manche Klnge, die vom einfachen harmonischen Fall besonders stark abweichen, von Menschen jedes kulturellen
Hintergrundes bereinstimmend als besonders unangenehm empfunden werden. Um genauer zu verstehen, was Dissonanz ist, wre
es praktisch, ein einfaches Modell zu haben, mit dem vorausgesagt
werden kann, wie dissonant ein Klang typischerweise auf einen Menschen wirken wird. Hier hat es in den letzten Jahren einige interessante
Entwicklungen gegeben, die im Folgenden vorgestellt werden sollen.
2
Ein weit verbreiteter Irrglaube ist seit Galilei, dass das Hirn bestimmte
Kombinationen von Tnen bevorzugt und als konsonant einstuft,
deren Frequenzen in einem einfachen, ganzzahligen Verhltnis zu
einander stehen. Diese Kombinationen stellen die wichtigsten musikalischen Intervalle dar, auf welchen wiederum das westliche Tonsystem
mit seinen zwlf quidistanten Stufen basiert. Nach dieser Denkweise
wre das Frequenzverhltnis der reinen Quinte, 3:2, besonders angenehm, whrend allerdings das nur wenig verstimmte Intervall 301:200
eine mathematische Folter fr das Hirn darstellen wrde.
Dass das nur die halbe Wahrheit ist, zeigt Abb. 1. Es wuren jeweils
zwei pure Sinustne verschiedener Frequenz kombiniert. Das Ergebnis
spiegelt in keinster Weise das wider, was man aus musikalischer Sicht
erwarten wrde: Insgesamt ist die Kurve sehr glatt, Spitzen bei den
wichtigen musikalischen Intervallen fehlen. Das Unisono wird als
sehr konsonant empfunden, nur leicht voneinander abweichende Tne
sind am dissonantesten. Etwa ab der kleinen Terz ist alles mehr oder
Abbildung 1: Konsonanzempfinden bei Superposition reiner Sinustne. Entnommen aus Roederer, nach Plomp & Levelt,
1965
Die Vermessung des menschlichen Hrvermgens ist noch nicht abgeschlossen. Insbesondere betrifft dies die Sortierung des Spektrums in
Frequenzen, die zum selben Klangerzeuger gehren (spektrale Segregation), whrend die zeitliche Auflsung schnell aufeinanderfolgender
Reize vergleichsweise gut erforscht ist. [9] Im Folgenden wird uns
vor allem die spektrale Segregation interessieren, denn dort liegt die
Ursache fr das Empfinden von Konsonanz und Dissonanz.
1 Bis
vor kurzem hie das meistens: kleine Terz, Quinte, Oktave usw., mittlerweile
sind auch Durterzen mglich.
Abbildung 3: Orte im Hirn, an denen Audiosignale verarbeitet werden. From bottom to top: outer and middle ear, cochlea, and
auditory nerve (AN); cochlear nucleus (CN) and superior
olivary complex (SOC) in the brainstem; inferior colliculus
(IC) in the midbrain; medial geniculate body in the thalamus;
primary and secondary auditory cortex (AC). Aus [11]
Das auditorische System von Sugetieren ist ein Hochhaus, siehe
Abb. 3. Es bleibt eine Herausforderung, zu erklren, inwiefern die
Zustnde an den verschiedenen Ebenen mit dem letztendlichen Hreindruck zusammenhngen (oder nicht). Erschwerend kommt hinzu,
dass zwischen den Bereichen beidseitige Verbindungen existieren, d.h.
das Gehrte beeinflusst, worauf im Folgenden die Aufmerksamkeit
gelenkt wird. Auch Hirnareale auerhalb des auditorischen Systems
knnten auf diese Weise eine Rolle spielen.
Ein insbesondere durch die Arbeiten von Zatorre et alii [17, 18,
15, 16] sowie Sinex et alii [13, 14, 12] gesicherter Fakt ist, dass im
Primren Auditorischen Cortex (AC) eine Arbeitsteilung zwischen
linker und rechter Hirnhlfte stattfindet: Bei 97% aller Menschen ist
der linke Primre AC auf eine hohe Zeitauflsung spezialisiert und
damit essentiell fr das Sprachverstndnis; der rechte Primre AC ist
dafr genauer im Erkennen kleiner Frequenzunterschiede.
Unser Fokus liegt also auf dem rechten AC. Spektrale Segregation
und Identifizierung von Klangquellen geschieht vorbewusst (obwohl
auch abstraktere Hirnareale einen Einfluss auf die Arbeitsweise des
auditorischen Systems haben knnen, s.o.), ebenso ist der erste Eindruck von Konsonanz oder Dissonanz nicht bewusst steuerbar. [3] An
dieser Stelle mssen wir uns abgrenzen von abstrakteren Konzepten
von Dissonanz, z.B. von Melodien oder Akkordfolgen, die schon eine
4.1
Der Begriff der Entropie wurde ursprnglich im Rahmen der Thermodynamik geprgt. Neue technische Errungenschaften, die schlielich
zur industriellen Revolution fhren sollten, erforderten eine quantitative Auseinandersetzung mit Prozessen, in denen Energie umgewandelt
wird. Entropie ist in diesem Kontext eines der sog. thermodynamischen
Potentiale mit der prominenten Eigenschaft, stets grer zu werden
(bei irreversiblen Prozessen) oder gleichzubleiben (bei reversiblen
Prozessen).
Die Verbindung zur Informationstheorie wurde erst sehr viel spter
herausgestellt. Heute kennt man nicht nur das statistische Fundament
der Thermodynamik, man wei auch, dass zum Schreiben einer Information (z.B ein Bit in einem Computer) eine gewisse Mindestenergie
notwendig ist. Aufgrund dieses Zusammenhangs knnen tatschlich
die aus der Informatik bekannten Bits in energetische Einheiten umgerechnet werden:
1Bit = (ln 2) k B
(k B = 1, 4 1023 J/K ist die Boltzmann-Konstante.) Darauf genauer
einzugehen, wrden den Rahmen dieser Arbeit sprengen, darum
sei der Begriff an dieser Stelle nur heuristisch eingefhrt: Entropie
ist ein Ma fr Unordnung, hohe Entropie heit viel Information,
geringe Bestimmtheit, und bedeutet in Verbindung mit dem Begriff
der Tonalitt (s.u.) einen komplexen, atonalen Klangeindruck.
4.2
Harmonische Entropie
Das menschliche Ohr tendiert, wie schon erwhnt, dazu, die gehrten
Frequenzen in eine harmonische Serie einzuordnen, auch wenn die
Fundamentale dieser Serie nicht vorhanden oder maskiert ist. Die
Leichtigkeit, mit der diese Einordnung geschehen kann, heit Tonalitt,
ihr Inverses ist nach Erlich die Harmonische Entropie. [10, S. 90ff]
Die harmonische Entropie eines komplexen Klanges kann paarweise
fr je zwei harmonische Tne berechnet werden. Um zu entscheiden,
ob diese beiden Tne (quasi-)harmonisch zu einer gemeinsamen Fundamentalen gehren, kann man jedem Teilterm der Farey-Reihe Fn ,
die alle Quotienten natrlicher Zahlen in immer dichter werdender Reihung enthlt, eine Wahrscheinlichkeitsverteilung zugewiesen werden.
Man hat also zu einem gegebenen Intervall i eine Wahrscheinlichkeit
p j (i ), ob i als j-tes Intervall der Fn interpretiert wird. Je nher diese
Frequenzen beieinander liegen, desto hher ist diese Wahrscheinlich-
2 Vgl.
Abbildung 4: Harmonische Entropie fr Dreiklnge mit variablem oberen (diagonal nach rechts aufgetragen) und
unteren (vertikal aufgetragen) Intervall im Bereich
von 2 bis 5 Halbtnen. Nach Paul Erlich, Quelle:
http://commons.wikimedia.org/wiki/File:Triadic_harmonic_entropy.png
keit. Die Harmonische Entropie des Intervalls i wird dann wie folgt
definiert:
HE(e) = p j (i ) log( p j (i ))
j
Wenn i nahe an einem einfach Vielfachen der Reihe liegt, wird die
Summe einen groen Term enthalten und viele verschwindend kleine,
die Harmonische Entropie wre in diesem Fall also niedrig.
Die Strke dieses Konzepts demonstriert Abb. 4: Fr ein gegebenes
Timbre, in diesem Fall herkmmliche ganzzahlige Moden, kann man
zu jeder Dreierkombination solcher Tne die dazugehrige Tonalitt
vorhersagen. Es ergeben sich klar erkennbare Peaks bei den Kombinationen, die auch in der abendlndischen Musik eine Rolle spielen, z.B.
bei 4:5:6 (Dur-Dreiklang).
4.3
Klaviere werden in einem aufwendigen Prozess mit einer wohltemperierten Stimmung versehen. Diese Stimmung stellt einen Kompromiss dar,
um einerseits alle Tne und Intervalle mglichst gleich zu behandeln
und andererseits die Unzulnglichkeiten des Instruments der dem
Tonsystem inhrente Fehler, das sog. Komma, und die Inharmonizitt
der Saiten so gut es geht auszugleichen. Eine wohltemperierte Stimmung kann bislang nur von professionellen Klavierstimmern erreicht
werden und weist dann eine (reproduzierbare!) Unregelmigkeit auf,
die sich von Instrument zu Instrument leicht unterscheidet.
Einen vielversprechenden Ansatz, die Natur dieser Stimmung, welche ja ein klanglich optimaler Kompromiss fr das menschliche Hirn
ist, analytisch zu erklren, fand unlngst Haye Hinrichsen. [4] Er
Abbildung 5: Typisches Resultat des entropiebasierten Stimmverfahrens nach Hinrichsen (rote Kurve) im Vergleich zu
einer professionellen Stimmung nach Gehr (schwarze
Kurve). Entnommen aus [4]
benutzte Aufnahmen von allen Tnen eines (verstimmten) Klaviers
und implementierte einen Algorithmus, der die Tne virtuell umstimmte, bis die Shannon-Entropie des Obertonspektrums minimal
war. Dieser Zustand minimaler Entropie war berraschend nah an
der temperierten Stimmung, die ein Klavierstimmer fr eben dieses
Klavier fand (siehe Abb. 5).
Die Shannon-Entropie eines Spektrums ist wie folgt definiert:
H = p( f ) ln p( f )d f
Dabei ist p der Schalldruck. Da die Berechnung mit tatschlichen
Messwerten auf einem Computer stattfand, wurde eine diskretisierte
Form verwendet, die damit eine beachtliche hnlichkeit zu Erlichs
Harmonischer Entropie aufweist.3 Die Prmisse, dass ganzzahlige
Vielfache eine mit steigender Komlexitt abnehmende Rolle spielen
sollen, die sich in der Summierung ber die Terme der Farey-Reihe
niedergeschlagen hatte, wird bei Hinrichsen durch die natrlicherweise abnehmenden Amplituden der Oberschwingungen einer realen Klaviersaite ersetzt. Qualitativ werden beide Herangehensweisen
sicherlich zu hnlichen Ergebnissen gelangen, sodass es durchaus
interessant zu wissen wre, ob man auch die jeweils andere Formel
fr die hier aufgefhrten Anwendungsbeispiele verwenden knnte.
Der Erfolg dieser Methode, die ohne Bercksichtigung psychoakustischer Besonderheiten nur die Shannon-Entropie als Fehlerfunktion
zur Beurteilung einer Klavierstimmung verwendet, bietet interessante
Perspektiven auf dem Weg zu einem tieferen Verstndnis des menschlichen Hrens, speziell auch der Wahrnehmung von Musik. Sollte das
3 Es
sei allerdings noch einmal darauf hingewiesen, dass der Buchstabe p bei Erlich
fr eine Wahrscheinlichkeit steht, bei Hinrichsen jedoch fr den Schalldruck.
Empfinden von Konsonanz und Dissonanz auf derart einfachen Prinzipien fuen? Die Prominenz ganzzahliger Schwingungsverhltnisse hat
letztendlich rein physikalische Grnde, die, wie z.B. bei der GamelanMusik, auch fehlen knnen. Wer der elegantesten Theorie den Vorzug
gewren will, sollte Hinrichsens Idee weiterverfolgen, denn sie fhrt
mit minimalen Annahmen (und bislang ohne psychoakustische Korrekturen) zu beachtlichen Ergebnissen.
Davon abgesehen werden in der Folge vielleicht auch Klavierstimmer langfristig ihre Arbeitsweise verndern. Professionelle Stimmgerte knnen bislang nur die korrekte Oktavspreizung berechnen, die
eigentliche Temperierung der Mitteloktave erfolgt einfach quidistant.
Die Ergebnisse der Methode von Hinrichsen liegen nher an dem, was
auch ein Klavierstimmer als optimal empfinden wrde.
literatur
[1]
[2]
Carlyon, Robert P.: How the brain separates sounds. In: TRENDS
in Cognitive Science 8 (2004), Oktober, Nr. 10, S. 465471
[3]
Grube, Manon ; Von Cramon, D Y. ; Rbsamen, Rudolf: Inharmonicity detection. In: Experimental brain research 153 (2003), Nr.
4, S. 637642
[4]
[5]
[6]
[7]
Moore, Brian C. ; Glasberg, Brian R. ; Peters, Robert W.: Thresholds for hearing mistuned partials as separate tones in harmonic
complexes. In: The Journal of the Acoustical Society of America 80
(1986), Nr. 2, S. 479483
[8]
[9]
[10] Sethares, William A.: Tuning, timbre, spectrum, scale. Bd. 2. Springer, 2005
[11] Shamma, Shihab A. ; Micheyl, Christophe: Behind the scenes of
auditory perception. In: Current opinion in neurobiology 20 (2010),
Nr. 3, S. 361366
[12] Sinex, Donal G.: Spectral processing and sound source determination. In: International review of neurobiology 70 (2005), S. 371
[13] Sinex, Donal G. ; Guzik, Heidi ; Li, Hongzhe ; Henderson Sabes,
Jennifer: Responses of auditory nerve fibers to harmonic and
mistuned complex tones. In: Hearing research 182 (2003), Nr. 1, S.
130139
[14] Sinex, Donal G. ; Li, Hongzhe ; Velenovsky, David S.: Prevalence
of stereotypical responses to mistuned complex tones in the
inferior colliculus. In: Journal of neurophysiology 94 (2005), Nr. 5, S.
3523
[15] Zatorre, Robert J. ; Belin, Pascal: Spectral and temporal processing in human auditory cortex. In: Cerebral Cortex 11 (2001), Nr.
10, S. 946953
[16] Zatorre, Robert J. ; Belin, Pascal ; Penhune, Virginia B.: Structure and function of auditory cortex: music and speech. In: Trends
in cognitive sciences 6 (2002), Nr. 1, S. 3746
[17] Zatorre, Robert J. ; Evans, Alan C. ; Meyer, Ernst: Neural
mechanisms underlying melodic perception and memory for
pitch. In: The Journal of Neuroscience 14 (1994), Nr. 4, S. 19081919
[18] Zatorre, Robert J. ; Halpern, Andrea R. ; Perry, David W. ;
Meyer, Ernst ; Evans, Alan C.: Hearing in the minds ear: A PET
investigation of musical imagery and perception. In: Journal of
Cognitive Neuroscience 8 (1996), Nr. 1, S. 2946
erklrung
Hiermit erklre ich, dass ich die vorliegende Hausarbeit selbstndig
und nur unter Verwendung der angegebenen Quellen und Hilfsmittel
angefertigt habe.
Oldenburg, den 1.5.2014
10