Beruflich Dokumente
Kultur Dokumente
20
SPEZIAL Biologie Medizin Hirnforschung
SPEZIAL Biologie Medizin Hirnforschung
Sprache
Eine einzigartige Fähigkeit
24524
8,90 € (D) · € 9,70 (A) · � 8,90 (L) · sFr. 17,40
Anthropologie: Die letzte ihrer Gattung • Die dunkle Seite der Persönlichkeit • Gewohnheit: Warum ich esse, was mir
Werkzeuggebrauch: Die ersten Steinwerk- Gesichtserkennung: Super-Talente suchen nicht guttut • Fasten: Mehr Köpfchen
zeuge • Kognition: Schlaue Köpfe • Täter • Psychologie im Gerichtssaal • Sind dank Verzicht • Adipositas: Wenn Über-
Genetik: Per DNA-Verlust zum Menschen? Sexualtäter therapierbar? • Prävention: gewicht auf der Seele lastet • Besser
• Moral: Die Geburt des »Wir« • Krieg: Gefährder identifizieren • Brandstiftung: essen: Diät der falschen Erinnerungen •
Warum wir kämpfen • € 8,90 Flammen der Frustration • € 8,90 Magersucht: Das Hungern besiegen •
€ 8,90
Alle
Sonderhefte
auch im
PDF-Format
Paartherapie: Es ist nie zu früh, um Wie universell sind Naturgesetze? • Flynn-Effekt: Warum der Intelligenz-
an einer Beziehung zu arbeiten • Hypothesen: Gute Theorien, schlechte quotient nicht weiter steigt • Woran
Stadtleben: Verloren im Großstadt- Theorien • Quantenmechanik: Meta- erkennt man intelligente Babys? •
dschungel • Körperbild: Das rich- physik mit physikalischen Mitteln • »Mozart-Effekt«: Klüger durch Musi-
tige Gewicht • Persönlichkeit: Neo-Geozentrismus: Hängt das zieren? • Hochbegabung: Missver-
Was wir an uns ändern würden • Universum von uns ab? • Konstrukti- standenes Talent • Stereotype: Die
Depression: Beharrlichkeit tut gut • vismus : Gemachte Welt • € 5,90; Geniefalle • € 5,90
€ 5,90
Hier bestellen:
service@spektrum.de | Tel.: 06221 9126-743
www.spektrum.de/shop
ü
EDITORIAL
EINE TYPISCH
MENSCHLICHE
FÄHIGKEIT
Von Andreas Jahn, Redakteur dieses Hefts
jahn@spektrum.de
»Ein Affe kann zwar sagen: ›Vorsicht, Schlange!‹ – er kann
aber nicht sagen: ›Hör mal, hier ist gar keine Schlange!‹«
So treffend beschrieb der Philosoph Kurt Bayertz in einer
Podiumsdiskussion die mitunter überschätzten Sprachfähig-
keiten von Tieren (siehe S. 32). In der Tat scheint das gespro- DAS KÖNNTE SIE AUCH INTERESSIEREN:
chene Wort etwas typisch Menschliches zu sein. Woher Homo
sapiens diese Fähigkeit hat, gehört aber immer noch zu den
großen Rätseln der Evolutionsbiologie.
Sicher ist, dass die menschliche Sprache nicht vom Himmel
fiel, sondern auf Vorläufern in der Tierwelt aufbaut. Wie das
geschah, darüber streiten sich die Gelehrten. Der US-amerika-
nische Linguist Noam Chomsky revolutionierte ab den 1960er
Jahren das Feld mit seiner Idee einer Universalgrammatik. Dem-
nach besitzt der Mensch eine angeborene Grammatikschablone,
die das Kleinkind nach und nach mit seinem Mutteridiom füllt.
Aber ist das wirklich so? Inzwischen mehren sich die Zweifel
an diesem so bestechend einfach wirkenden Modell. Zu den
Kritikern zählen der Entwicklungspsychologe Paul Ibbotson und PEOPLEIMAGES / GETTY IMAGES / ISTOCK
HOLZKOPF: ANDREY KUZMIN / STOCK.ADOBE.COM; HINTERGRUND UND BEARBEITUNG: SPEKTRUM DER WISSENSCHAFT
EVOLUTION
6 NEUROBIOLOGIE
ENDE DER EXKLUSIVITÄT
Laut neurobiologischen Erkenntnissen scheint die
Sprache kein so einzigartiges Merkmal des
Menschen zu sein, wie Forscher lange dachten.
Von Ina Bornkessel-Schlesewsky und Matthias Schlesewsky
14 LINGUISTIK
EIN NEUES BILD DER SPRACHE
Die Hypothese von einer angeborenen Universal
grammatik erweist sich als überholt.
Von Paul Ibbotson und Michael Tomasello
20 PSYCHOLOGIE
6
WIE DIE SPRACHE DAS DENKEN FORMT NEUROBIOLOGIE
ENDE DER EXKLUSIVITÄT
Linguistische Strukturen prägen Art und Weise, wie
wir die Welt wahrnehmen – in ungeahntem Ausmaß!
Von Lera Boroditsky
32 ETHIK
DER FEINE UNTERSCHIED
ZWISCHEN MENSCH UND TIER
Über das typisch Menschliche diskutieren die Prima
tologin Julia Fischer, der Philosoph Kurt Bayertz sowie
die Entwicklungspsychologin Patricia Kanngießer.
PHYSIOLOGIE 24
38 NEUROPLASTIZITÄT NEOLITHISIERUNG
SPRACHE SUCHT NEUES ZUHAUSE! DAS RÄTSEL DER GROSSEN SPRACHFAMILIEN
Bei frühkindlichen Hirnverletzungen können die
Sprachzentren im Kopf von der linken in die rechte
Hemisphäre wandern. ALAMY / RUSSIAN LOOK LTD. / GLOBAL LOOK PRESS
Von Anna Lorenzen
44 INFOGRAFIK
NEUROBIOLOGIE DES GESPRÄCHS
Wenn wir uns unterhalten, arbeitet das Gehirn auf
Hochtouren.
Von Anna von Hopffgarten
46 STIMMPHYSIOLOGIE
LEISTUNGSSPORT GESANG
So präzise kontrollieren Berufssängerinnen
46
und -sänger ihre Stimmlippenschwingungen und STIMMPHYSIOLOGIE
Resonanzräume. LEISTUNGSSPORT GESANG
Von Bernhard Richter und Matthias Echternach
MEDIZIN
54 APHASIE
DIE FRAU, DIE SCHLIESSLICH SCHWIEG
Eine besondere Störung machte es Frau W. von Jahr zu
Jahr schwerer, sich mit anderen Menschen zu unterhal
ten. Was passierte in ihrem Gehirn?
Von Laurent Cohen
58 ALEXIE
DER MANN, DER NICHT MEHR LESEN KONNTE
Plötzlich verloren geschriebene Wörter für Oscar C. jeg-
lichen Sinn.
Von Laurent Cohen
62 SPRACHPRODUKTION
ÜBER NACHT WEISE
Nach einem Schlaganfall hält der Besitzer eines Pariser
Bistros philosophische Vorträge im Krankenzimmer. Hat
eine Hirnschädigung die Tore zur Weisheit geöffnet?
Von Patrick Verstichel
TECHNIK
58 66 INFORMATIK
SPRACHBEGABTE MASCHINEN
ALEXIE Eine künstliche Intelligenz namens BERT übertrifft bei
DER MANN, DER NICHT MEHR LESEN KONNTE Lesetests sogar Menschen. Was steckt hinter dieser
Erfolgsgeschichte aus dem KI-Labor?
Von John Pavlus
72 SPRACHSYNTHESE
DIE PERFEKTE KÜNSTLICHE STIMME
Eine Maschinenstimme kann die eines Menschen
täuschend echt imitieren.
Von Nicolas Obin und Axel Röbel
3 EDITORIAL
61 IMPRESSUM
81 SPRINGERS EINWÜRFE
AUTOMATISCHE VORURTEILE
KI reproduziert sprachlich verankerte Stereotypen.
82 VORSCHAU
spektrum.de/artikel/1257675
1 Lange gingen Linguisten davon aus, dass die menschli einer menschenähnlichen Sprachfähigkeit in der Lage sind.
che Sprache sogar unseren nächsten Verwandten im Schließlich können sie nicht zwischen Wortarten unter
Tierreich vorenthalten bleibe, da ihr ein evolutionärer scheiden, die entweder Objekte oder Handlungen bezeich
Sprung zu Grunde läge. nen. Aus der Perspektive eines klassischen Sinologen oder
eines Experten für austronesische Sprachen erscheint
Wort für Huhn (ayam) und dem Wort für essen oder fressen normalerweise was mit wem tut, entscheidet in dieser
(makan) zusammen. Neben den für uns intuitiv plausiblen Sprache, ob es sich bei einem Handlungsteilnehmer um
Bedeutungen »Das Huhn frisst« oder »Jemand isst das einen Menschen, ein nichtmenschliches Lebewesen oder
Huhn« kann der Satz laut Gil aber auch »Jemand isst dort, ein unbelebtes Objekt handelt. Im Deutschen hingegen liegt
wo sich das Huhn befindet« meinen. Diese letzte Interpreta diese Funktion fest in der Hand von grammatischen Eigen
tion zeigt eine frappierende Ähnlichkeit zu Petittos Charak schaften wie Kasus oder Wortstellung (»Der Lehrer tötet
terisierung von Nim Chimpskys Vokabular. das Wildschwein« versus »Das Wildschwein tötet den
Nun möchte man aus derartigen sprachübergreifenden Lehrer«). Dass also in einigen Sprachen der Welt ein seman
Beobachtungen sicher nicht schließen, dass es sich beim tisches Merkmal wie Belebtheit als Teil der Grammatik
klassischen Chinesisch oder der auf der Insel Riau gespro wirkt – indem es etwa festlegt, welcher der Handlungsteil
chenen Variante des Indonesischen nicht um menschliche nehmer die Handlung verursacht –, stellt die offenbar klare
Sprachen handelt. Vielmehr deuten sie darauf hin, dass Aufteilung zwischen Form und Sinn als Grundeigenschaft
die Grenze zwischen Sprache und tierischer Kommunika der menschlichen Sprache in Frage. Und damit auch eine
tion viel unschärfer sein könnte, als wir es uns mit unserer Basis für ihre Sichtweise als einzigartig im Tierreich.
westeuropäischen Sprachtradition meist vorstellen. Schauen wir einmal genauer an, wie das menschliche
Gehirn Sprache hervorbringt. Die klassische, im 19. Jahr
Keine Chance für das arme Wildschwein hundert durch Wissenschaftler wie Pierre Paul Broca
Das Problem der Trans- oder Präkategorialität ist dabei (1824–1880) und Carl Wernicke (1848–1905) begründete
lediglich ein Beispiel unter vielen für die Schwierigkeiten, Neurolinguistik unterschied zwischen einem Zentrum für
die sich aus einer »eurozentrischen« Betrachtung der Sprachproduktion (dem Broca-Areal im hinteren, unteren
menschlichen Sprachfähigkeit ergeben. So erscheint es für Teil des linken Stirnlappens) und einem für Sprachwahrneh
einen deutschen Muttersprachler durchaus schlüssig, einen mung (dem Wernicke-Areal im mittleren bis hinteren,
fundamentalen Unterschied zwischen Form (Syntax, Gram oberen Teil des Schläfenlappens). Diese Vorstellung (»Spre
matik) und Bedeutung (Semantik) anzunehmen: Intuitiv kön chen und verstehen«, oben) erwies sich über viele Jahr
nen wir inhaltlich unsinnige Sätze wie »Der Roman liebt den zehnte als sehr einflussreich und kommt auch noch in
Archivar« problemlos von formal fehlerhaften Äußerungen modernen Lehrbüchern vor. Dabei gilt sie heute als empi
wie »Der Bibliothekar besucht der Archivar« trennen. risch widerlegt. Mittlerweile geht man davon aus, dass sich
Das lässt sich aber nicht ohne Weiteres von allen Spra die Informationsverarbeitung im Gehirn nicht in Zentren
chen sagen. So wird beispielsweise in der in Papua-Neugui lokalisieren lässt, sondern über Netzwerke von miteinander
nea gesprochenen Sprache Fore eine aus »Wildschwein«, interagierenden Hirnregionen läuft. Als überholt betrachten
»töten« und »Lehrer« bestehende Dreiwortsequenz stets Forscher ebenfalls die Vorstellung, einzelne Regionen
so interpretiert, dass der Lehrer das Wildschwein tötet. könnten mit sehr spezifischen, etwa ausschließlich sprach
Diese Interpretation ist unabhängig von der Reihenfolge, in bezogenen Funktionen in Verbindung gebracht werden.
der die einzelnen Satzbestandteile auftreten (Lehrer-Wild Dennoch hat eine der grundlegenden Ideen, die Carl
schwein-töten, Wildschwein-Lehrer-töten, und so fort). Wer Wernicke bereits im 19. Jahrhundert vertrat, bis heute
Bestand: Die Informationsverarbeitung im Gehirn basiert mittels Interaktion von Sensorik und Motorik entsteht und
auf einem neuronalen »Zyklus« zwischen der Sensorik (dem dass dabei die eingehende sensorische Information über
Input, den die Sinnesorgane an das Gehirn weitergeben) zwei Pfade geleitet wird?
und der Motorik, also der Verhaltenssteuerung. Die Bedeu Hier lohnt es sich eine Idee aufzugreifen, die zuerst der
tung dieses Zyklus hat der britische Neurowissenschaftler Neurowissenschaftler Josef Rauschecker von der George
Daniel Wolpert von der University of Cambridge 2003 sehr town University in Washington D. C. vor etwas über 15 Jah
einprägsam illustriert. Ihm zufolge können wir nur mit der ren vorschlug. Basierend auf seinen Arbeiten zur Verarbei
Außenwelt interagieren, indem wir uns bewegen. Dies tung von Lautsignalen bei Rhesusaffen kam Rauschecker
gilt – evolutionär betrachtet – ebenso für die Jagd auf die zu zwei wichtigen Erkenntnissen.
nächste Mahlzeit wie für das Winken nach dem Kellner,
um im Restaurant eine Mahlzeit zu bestellen. Was und Wo auf getrennten Pfaden
Unter Neurobiologen ist es mittlerweile unstrittig, dass Zum einen sind die beiden neuronalen Pfade, die der audi
die Informationsübertragung im Gehirn zwischen sensori torischen Verarbeitung im Gehirn zu Grunde liegen (siehe
schem Input und das Verhalten steuerndem Output in der »Linguistische Autobahnen«, oben), mit unterschiedlichen
Regel über mindestens zwei unterschiedliche Pfade läuft. Funktionen verbunden. Der so genannte ventrale Pfad
Diese kann man sich wie Autobahnen vorstellen, die be identifiziert lautliche Informationen. Er unterscheidet damit
stimmte Orte miteinander verbinden. Was bedeutet es aber beispielsweise zwischen verschiedenen Rufen der eigenen
nun genau, dass die menschliche Sprache neurobiologisch Spezies – etwa einen Signalruf, der eine bedrohliche Situa
sechsjähriger Kinder. Nichtmenschliche Primaten besitzen tigte Beispiel des Pirahã (siehe »Rekursion – der Kampf um
damit bereits die nötige Ausstattung, um Sequenzen zu die Verschachtelung«, S. 11) ist mit einer solchen Sichtweise
verarbeiten, die Sätzen in einer zentralen Eigenschaft dann viel weniger überraschend, da eine quantitative
gleichen: der Abhängigkeit zwischen nicht benachbarten Erklärung ein Kontinuum an Sprachkomplexität statt einen
Informationseinheiten (zum Beispiel »Peter rief Maria aus evolutionären Sprung bedeutet.
dem Auto an«). In den nächsten Jahren müssen Linguisten neue Theo
Wie bei der Verarbeitung von auditorischen Objekten im rien über dieses Kontinuum entwickeln und testen. Dabei
ventralen Pfad können wir also auch beim dorsalen Pfad müssen wir wohl lieb gewordene Vorstellungen über her
von einer grundlegenden Gemeinsamkeit zwischen Men gebrachte sprachwissenschaftliche Klassifikationen aufge
schen und nichtmenschlichen Primaten ausgehen. Anders ben. Durch weitere Vergleiche zwischen unterschiedlichen
gesagt: Die neuronalen Baupläne der menschlichen Spra Sprachen dürften wir mehr über die Funktionsweise unse
che gleichen denen des auditorischen Systems bei anderen res Gehirns lernen und damit vielleicht in der Lage sein, die
Primaten. Demnach gibt es keine Notwendigkeit, von Lücke im Kontinuum zu schließen, die momentan noch
einem biologisch basierten Alleinstellungsmerkmal der zwischen uns Menschen und unseren nächsten Verwand
menschlichen Sprachfähigkeit auszugehen. ten klafft. Zumindest erscheint dieser Weg als wesentlich
Allerdings drängt sich dann sofort die Frage auf, weshalb fruchtbarer, als weiter zu versuchen, die Theorien der
Affen sogar nach intensivem mehrjährigen Training nicht in sprachwissenschaftlichen Revolution des 20. Jahrhunderts
der Lage sind, eine Gebärdensprache mit einer annähernd auf unser Gehirn zu übertragen.
ähnlichen Komplexität wie jene der menschlichen zu erler
nen. Unsere Antwort darauf lautet: Menschen verarbeiten QUELLEN
nicht qualitativ anders, sondern quantitativ – sie machen Berwick, R. C. et al.: Evolution, brain, and the nature of lan
einfach viel mehr des Gleichen. guage. Trends in Cognitive Sciences 17, 2013
Ein Beispiel mag das verdeutlichen. Beauftragt man
Bornkessel-Schlesewsky, I., Schlesewsky, M.: Reconciling
etwa mehrere Leute mit einem Einkauf, werden diese sich time, space and function: a new dorsal-ventral stream model of
unterschiedlich viele Posten auf der Einkaufsliste merken sentence comprehension. Brain and Language 125, 2013
können. Nun würde man nicht vermuten, dass jemand, der
Patterson, K. et al.: Where do you know what you know? The
zwölf Punkte behalten kann, sich qualitativ anders erinnert representation of semantic knowledge in the human brain.
als einer, dem nur vier in Erinnerung bleiben. Wahrschein Nature Reviews Neuroscience 8, 2007
lich verfügt der erste Einkäufer lediglich über eine größere
Petitto, L.-A.: How the brain begets language. In: McGilvray, J.
Gedächtniskapazität. In Analogie dazu sprechen die aktuel (Hg.): The Cambridge Companion to Chomsky, Cambridge
len wissenschaftlichen Ergebnisse dafür, dass der Unter University Press, 2005, S. 84 – 101
schied zwischen der menschlichen Sprache und tierischen
Rauschecker, J. P., Scott, S. K.: Maps and streams in the
Kommunikationsarten nur auf derartige Kapazitätsunter auditory cortex: nonhuman primates illuminate human speech
schiede zurückgeht. Das unter Linguisten berühmt-berüch processing. Nature Neuroscience 12, 2009
spektrum.de/artikel/1432738
Verbirgt sich im menschlichen Gehirn tatsächlich eine Die erste Version von Chomskys Theorie, die er Mitte
vorprogrammierte mentale Schablone zum Erlernen des 20. Jahrhunderts formulierte, passte gut zu zwei
von Grammatik? Mit dieser Idee prägte der amerika damals aufkommenden Trends des westlichen Denkens.
nische Linguist Noam Chomsky vom Massachusetts Zum einen behauptete Chomsky, die Alltagssprache
Institute of Technology in Cambridge fast ein halbes verhalte sich wie die mathematischen Algorithmen der
Jahrhundert lang die gesamte Sprachwissenschaft. Nun Informatik. Er suchte nach der grundlegenden Sprach
aber verwerfen viele Kognitionswissenschaftler und Lin struktur, als wäre sie ein Computerprogramm, und formu
guisten Chomskys Theorie der Universalgrammatik, denn lierte eine Reihe von Verarbeitungsschritten, aus denen
neue Untersuchungen der verschiedensten Sprachen »wohlgeformte« Sätzen hervorgehen. Sein damals revolu
sowie der Art und Weise, wie Kleinkinder in Gemeinschaft tionärer Ansatz besagte: Ein computerähnliches Pro
kommunizieren, schüren starke Zweifel an Chomskys gramm kann Sätze hervorbringen, die den Menschen als
Behauptungen. grammatisch korrekt erscheinen – und dieses Programm
Vielmehr setzt sich eine radikal neue Sichtweise durch, erklärt angeblich, wie Menschen tatsächlich Sätze bilden.
der zufolge das Erlernen der Muttersprache kein angebore So ein Sprachmodell gefiel jenen zahlreichen Forschern,
nes Grammatikmodul voraussetzt. Offenbar nutzen Klein die im Computer ein Paradigma für alles und jedes sahen.
kinder mehrere verschiedene Denkweisen, die gar nicht Außerdem behauptete Chomsky, seine vom Computer
sprachspezifisch sein müssen – etwa die Fähigkeit, die Welt inspirierte Theorie sei biologisch fundiert. In der zweiten
in Kategorien (wie Mensch oder Sache) einzuteilen oder Hälfte des 20. Jahrhunderts wurde immer deutlicher, dass
Beziehungen zwischen Dingen zu begreifen. Hinzu kommt die menschliche Evolutionsgeschichte viele Aspekte unse-
IMAGE SOURCE / GETTY IMAGES / ISTOCK; BEARBEITUNG: SPEKTRUM DER WISSENSCHAFT
die einzigartige Gabe, intuitiv zu erfassen, was uns andere rer einzigartigen Psychologie erklärt; Chomskys Theorie
mitteilen möchten; erst so kann Sprache entstehen. Somit stand damit in Einklang. Er präsentierte seine Universal
reicht Chomskys Theorie längst nicht aus, um den grammatik als angeborene Komponente des menschlichen
menschlichen Spracherwerb zu erklären. Geistes – als die biologische Grundlage der mehr als 6000
Diese Schlussfolgerung wirkt sich nicht bloß auf die Sprachen auf der Welt. Da die mächtigsten und oft zu
Linguistik aus, sondern auf ganz unterschiedliche Be gleich schönsten wissenschaftlichen Theorien eine unter
reiche, in denen Sprache eine zentrale Rolle spielt, von der oberflächlicher Vielfalt verborgene Einheit enthüllen, ver-
Poesie bis zur künstlichen Intelligenz. Da außerdem Men lieh dieses Versprechen Chomskys Ansatz großen Charme.
schen Sprache auf eine Weise gebrauchen, wie es kein Doch unter dem Eindruck neuer Erkenntnisse stirbt die
Tier vermag, dürften wir auch die menschliche Natur ein Universalgrammatik seit Jahren einen langsamen Tod.
wenig besser begreifen, wenn wir das Wesen der Sprache Sie verabschiedet sich allerdings nur schleppend, denn
verstehen. wie der Physiker Max Planck einst bemerkte: »Eine neue
der Idee der Universalgrammatik Akteur hat: den, der niest. Wird es jedoch in eine ditransi
tive Konstruktion gezwungen, die sowohl ein direktes als
auch ein indirektes Objekt haben kann, könnte ein Satz
Kinder von Anfang an dieselben algebraischen Grammatik lauten: »Sie niest ihm die Serviette.« Dabei wird »niesen«
regeln für alle Sprachen besitzen und erst herausfinden als ein Akt des Übertragens konstruiert. Sie veranlasst
müssen, wie eine spezielle Sprache, ob Englisch oder Sua- die Serviette, zu ihm zu gelangen. Wie das Beispiel zeigt,
heli, mit diesem Schema zusammenhängt. Linguisten prägt die grammatische Struktur die Bedeutung des
sprechen vom Verbindungsproblem (linking problem). Satzes ebenso stark wie die Wörter. Das steht in deut
Einen der seltenen Versuche, dieses im Rahmen der Uni lichem Widerspruch zu Chomskys Idee, es gebe völlig
versalgrammatik systematisch zu lösen, unternahm der bedeutungsfreie Ebenen der Grammatik.
Psychologe Steven Pinker von der Harvard University an- Die Idee gebrauchsbasierter Mehrzweckmodule erklärt
hand von Satzsubjekten. Pinkers Darstellung stimmte je- den Spracherwerb, ohne dazu zwei Hilfskonstruktionen
doch nicht mit Studien kindlicher Entwicklung überein und der Universalgrammatik zu benötigen: erstens algebrai
ließ sich auch nicht auf andere grammatische Kategorien sche Regeln für die Kombination von Symbolen – eine so
übertragen. Das für jede Anwendung der Universalgram genannte Kerngrammatik, die im Gehirn fest verdrahtet
matik auf den Spracherwerb zentrale Verbindungsproblem ist – und zweitens ein Lexikon von Ausnahmen, das alle
wurde nie gelöst, ja nicht einmal ernsthaft angegangen. übrigen Eigenheiten natürlicher Sprachen umfasst.
All das führt unweigerlich zu der Schlussfolgerung, Das Problem bei diesem Ansatz ist, dass einige gram
dass die Idee einer Universalgrammatik schlicht falsch ist. matische Konstruktionen zum Teil auf Regeln beruhen und
Bücher«, aber nicht: »Sie verschenkte der Bibliothek einige Bybee, J.: Language, usage and cognition. Cambridge University
Bücher.« Wie neue Forschungen zeigen, gibt es verschie Press, 2010
dene Mechanismen, mit denen Kinder solche unpas Goldberg, A.: Constructions at work: the nature of generalization in
senden Analogien eingrenzen. Zum Beispiel meiden sie language. Oxford University Press, 2006
solche, die überhaupt keinen Sinn ergeben. So würden Tomasello, M.: Constructing a language: a usage-based theory of
Kinder niemals versucht sein zu sagen: »Sie aß der Biblio language acquisition. Harvard University Press, 2003
thek einige Bücher.« Hören sie außerdem sehr oft »Sie
verschenkte einige Bücher an die Bibliothek«, dann hemmt LITERATURTIPP
dies den Impuls zu sagen: »Sie verschenkte der Bibliothek Stix, G.: Gute Zusammenarbeit. Spektrum der Wissenschaft 5/2015,
einige Bücher.« S. 52–59
Solche Eingrenzungsmechanismen reduzieren die mög- Michael Tomasellos Erforschung des Denkvermögens von Klein-
lichen Analogien, die ein Kind bilden könnte, während es kindern und Schimpansen
spektrum.de/artikel/1142708
rung bereits stattfand oder noch bevorsteht. Auf Russisch versity of California in San Diego nachgewiesen, dass
enthüllt das Verb mein Geschlecht. Wenn ich Mandarin Menschen, die Sprachen mit absoluten Richtungen ver
verwende, muss ich wissen, ob Onkel Wanja ein Bruder der wenden, auffallend gut in unbekannten Gegenden oder
Mutter oder des Vaters ist und ob er blutsverwandt oder Gebäuden zurechtkommen. Sie orientieren sich besser als
angeheiratet ist, denn für jeden dieser Fälle gibt es einen Personen, die dort zu Hause sind, aber nicht solche Spra
speziellen Ausdruck. Tatsächlich besagt die chinesische chen sprechen – ja sogar besser, als die Forscher dies für
Es dürfte beim Erwachsenen beschrieben absichtliche Ereignisse aktiv – etwa »Er zer
stach den Ballon« –, und alle erinnerten sich im Mittel
kaum Denkvorgänge geben, gleich gut daran, wer diese Taten begangen hatte. Das
zeigte ebenfalls, dass keine der Gruppen ein grundsätzlich
bei denen die Sprache keine schlechteres Gedächtnis aufwies. Doch wenn es um unab
Paul Heggarty arbeitet als Prähistoriker in der Abteilung für Sprach- und
Kulturevolution des Max-Planck-Instituts für Menschheitsgeschichte in Jena.
spektrum.de/artikel/1298019
»Die Sprache ist voller unangenehmer Geräusche vom in den 1950er Jahren, Klicklaute seien Elemente aller ur-
häufigen Knacken mit den Zähnen und dem ständigen sprünglichen Kommunikation gewesen, beispielsweise auf
Krächzen im Hals; und sie ist extrem arm, nicht weni- Grund einer Eignung zur Kommunikation in der Wildnis.
ger an Wörtern als an Lauten; sie verstehen sich eher durch Aber auch Klicklaute unterliegen der Veränderung, können
Gesten als durch Sprechen.« (Martin Hinrich Carl Lichten- im Lauf der Zeit verloren gehen oder als neue Elemente in
stein, Anfang 19. Jahrhundert) eine Sprache einfließen. Zudem zeigen linguistische Analy-
Mögen auch solche Eindrücke und Vorurteile längst sen, dass die heute noch gebräuchlichen Klicksprachen in
Geschichte sein, kaum eine Sprache erscheint uns so Struktur, Vokabular und Grammatik zu sehr differieren, um
seltsam wie ein Vertreter der nur in Afrika gebräuchlichen zu einer einheitlichen Sprachfamilie zu gehören. Zudem
Klicksprachen. Ihre Bezeichnung haben sie von den schnal- sind die verschiedenen Sprechergruppen keineswegs
zenden Lauten, die wie Konsonanten verwendet werden. genetisch identisch und folgen im Übrigen verschiedenen
Um Wörter dieser Sprachen in unser Schriftsystem umzu- Lebensweisen: Die San sind Jäger und Sammler, die Khoe
setzen, mussten Linguisten ungewöhnliche phonetische hingegen Viehhirten.
Zeichen verwenden und manche dazu erfinden (siehe »Die
Klicksprachen in Afrika«, S. 29). Expansion auf Kosten der Klicksprachen
Die meisten Sprecher leben in der Namib-Wüste, im Mit der allmählichen Verbreitung der Landwirtschaft im
Kalahari-Becken und in den Gebieten um das Kap der Guten äußersten Süden Afrikas während der letzten zwei Jahrtau-
Hoffnung. Den europäischen Kolonialisten galten sie als sende durch Bantu-Völker wurden die Khoe-San-Gruppen
primitive »Buschmänner« und »Hottentotten«. Heute nennt in unfruchtbarere Gebiete verdrängt. Im Zuge dieser neo-
man diese indigenen Gruppen San beziehungsweise Khoe. lithischen Revolution expandierte die Bantu-Sprachfamilie
Auch äußerlich unterscheiden sie sich von den meisten also auf Kosten der Klicksprachen, auch wenn ein paar
anderen indigenen Bewohnern Afrikas. Erbgutvergleiche wenige Mitglieder Klicklaute in ihr Repertoire aufgenom-
haben gezeigt, dass sie genetisch von anderen Menschen- men haben, etwa das Zulu und Xhosa.
gruppen abweichen. Experten schätzen, dass die Vorfahren Ein vergleichbarer Vorgang soll, laut einer umstrittenen
der heutigen Khoe-San spätestens vor 30 000 Jahren, These, weltweit stattgefunden haben: Neolithisierung
möglicherweise sogar schon vor 100 000 Jahren eine eige- förderte die Sprachausbreitung. Auf diese Weise ließe sich
ne Entwicklung einschlugen. erklären, warum zwei Drittel der Menschen weltweit ent-
Weil sie ihnen daher als letzte Vertreter einer steinzeit weder einen Vertreter der indoeuropäischen oder der sino-
lichen Lebensart galten, folgerten manche Anthropologen tibetischen Sprachfamilie sprechen, und die drei Familien
Niger-Kongo (wozu die Bantu-Sprachen gehören), Afro- Einst waren die »San«-Jägervölker im südlichen Afrika weit
Asiatisch und Austronesisch den Löwenanteil des restlichen verbreitet. Heute ist ihre Lebensweise (sowie ihre Klickspra-
Drittels für sich verbuchen. Die gut 150 bis 200 restlichen chen) nur noch bei sehr wenigen Gruppen gebräuchlich.
Sprachlinien – entweder kleine Sprachfamilien oder »isolier-
te« Sprachen, die also keine klare Verwandtschaft zu irgend-
einer anderen zeigen – müssen sich mit dem restlichen
15 Prozent zufriedengeben und werden oft nur von hunder-
ten oder gar nur einigen Dutzend Menschen gesprochen.
Die größte Sprachfamilie weltweit ist das Indoeuro- AUF EINEN BLICK
päische, nahezu jeder Zweite spricht eines ihrer Mitglieder. EVOLUTION DANK REVOLUTION?
Diese gehen auf eine gemeinsame »Proto-Indoeuro-
päische« Ursprache zurück, die sich gen Osten bis zum
Golf von Bengalen und in westlicher Richtung bis zur euro- 1 Die meisten Menschen sprechen eine Sprache, die zu
einer von fünf großen Sprachfamilien gehört. Diese
stammen aus der Alten Welt.
päischen Atlantikküste ausbreitete. Auf ihrem Weg durch
Europa verdrängte die neue Familie fast alle bis dahin
gebräuchlichen Sprachlinien.
Doch wo das Proto-Indoeuropäisch seinen Ursprung 2 Der Archäologe Colin Renfrew sieht die neolithische
Revolution als Hauptursache: Die Entwicklung der
Landwirtschaft ließ die Bevölkerungsdichte steigen,
hatte, wird schon lange diskutiert. Seit den 1970er Jahren
was eine Expansion in zuvor nur von Jägern und
verlegt die gängigste Hypothese ihn in die Steppen der
Sammlern bewohnte Gebiete auslöste. So verbreitete
heutigen Ukraine und den Beginn der Expansion vor etwa sich auch die von den Einwanderern gesprochene
6000 Jahre. Als Ursache gelte: die Domestikation des Sprache.
Pferdes, die Entwicklung des Rades und das Aufkommen
3
der pastoralen Lebensweise, das heißt der Tierhaltung auf Um der historischen Wirklichkeit gerecht zu werden,
Naturweiden. muss man aber auch die jeweiligen Rahmenbedingun-
Der britische Archäologe Colin Renfrew von der Univer- gen und Ausprägungen der Landwirtschaft sowie
sity of Cambridge aber postulierte 1987, die enorme Verbrei- andere Technologien wie die Seefahrt oder Eisenverar-
tung des Indoeuropäischen müsse eine andere Ursache beitung einbeziehen.
gehabt haben: die neolithische Revolution. In diesem Fall
hätte sie vor mehr als 9000 Jahren begonnen, ausgehend
Indoeuropäisch
Die fünf größten
Sprachfamilien der
um 1500,
ALTEN WELT
ien
? davor auch
Indoeuropäisch
um 1500,
? Sinotibetisch
davor auch
? ? ?
davon Sinitisch
Sinotibetisch
davon Sinitisch
Austronesisch
Austronesisch
Afroasiatisch
Die fünf größten
Sprachfamilien der
Afroasiatisch
Niger-Kongo
ALTEN WELT davon Bantu
Indoeuropäisch
Niger-Kongo
um 1500, davon Bantu
re Sprachfamilien
? davor auch
ÜDAMERIKAS Sinotibetisch
rib ? davon Sinitisch
awak Austronesisch
pí Afroasiatisch
Niger-Kongo
davon Bantu
echua Expansion einer Sprachfamilie
? durch Landwirtschaftsverbreitung
ANGOLA
r
e
t i sc
h
n
B SAMBIA
MALAWI
an zea
A
t l
O a
SIMBABWE MOSAMBIK
Klicksprachenfamilien
n
Kx‘a
Kho
ekh
Tuu
oe
d
SWASILAND is
SWASILAND O
Genetische Gruppe Zu ze ch
lu an er
Khoisan
SÜDAFRIKA
Nichtkhoisan
LESOTHO
sa
Lebensweise Xho Bantu-Sprecher sind Land-
Jäger und Sammler wirte, Klicksprachen kenn-
zeichnen Jäger und Sammler?
Hirten Die Wirklichkeit ist komplexer;
die Neolithisierung allein kann
heutige Landesgrenze die Sprachverteilung nicht erkären.
Auch das Austronesische passt nicht ganz ins Bild. Denn Lebensweise integrieren. So verhältnismäßig gering der
am Anfang stand nicht der große Exodus. Vielmehr verlie- Beitrag der indigenen Bevölkerung zum Genpool auch sein
ßen wohl nur wenige hundert bis wenige tausend Sprecher mochte, er wuchs zwangsläufig, je weiter sich die Wellen-
vor gut 4000 Jahren Taiwan. Sie erreichten die gut 250 Kilo- front von ihrem Ausgangsort entfernte. Genetische Studien
meter entfernten nördlichen Philippinen, von wo aus sich aus den 1990er Jahren entdeckten ein solches Muster von
die Inselwelt Südostasiens und des Pazifiks leicht von Anatolien aus quer durch Europa, was zu einer Verbreitung
Eiland zu Eiland erschließen ließ. Da die Auswanderer die indoeuropäischer Sprachen durch der Neolithisierung
Landwirtschaft mitbrachten, wuchs die Bevölkerung – und passen würde. Inzwischen verfügen Genetiker über weit
erneut suchten Mutige eine neue Heimat. bessere Techniken; sie können sogar aus von Archäologen
Aber warum war ausgerechnet diese austronesische entdeckten menschlichen Überresten »alte DNA« gewinnen
Sprachlinie so erfolgreich? Insbesondere im benachbarten und mit den Erbanlagen heutiger Menschen vergleichen.
China und in Indien lebten die Menschen ebenfalls von der Bisherige Studien liefern noch kein definitives Bild für oder
Landwirtschaft, und doch trugen nicht sie ihre Sprachen in gegen das Modell, doch sollte es in den nächsten Jahren
die Welt hinaus. Vielmehr ermöglichte wohl das Knowhow möglich sein, genauere Aussagen zu treffen.
in Sachen Seefahrt den Austronesiern, neue Inseln zu Vollends komplex wird die These, bedenkt man: Land-
besiedeln. Auf ihren Auslegerbooten wagten sie sich Hun- wirtschaft ist nicht gleich Landwirtschaft, sondern immer
derte von Kilometern aufs offene Meer hinaus, Samen und ein Gesamtpaket mit vielen Komponenten wie Feldfrüchten,
Nutztiere an Bord. Wohl waren die meisten der Inseln Tieren und Technologien. Diese müssen nicht alle von
schon von Wildbeutern bewohnt, doch die Gruppen ver- gleicher Herkunft sein. Im insularen Südostasien kam
mischten sich, wie nicht allein genetische, sondern auch manches aus Taiwan, anderes aus Indochina oder Neu-
linguistische Analysen zeigen: So wie manche Bantu-Grup- guinea. Zudem schnüren die Menschen nicht immer das
pen Klicklaute übernahmen, lassen sich auch in einigen gleiche Paket. Im Amazonasgebiet bringen nur die Über
austronesischen Sprachen Relikte längst verschwundener flutungen der großen Ströme Nährstoffe in die kargen
Sprachen nachweisen. Böden ein, weshalb Bauern die Ufer besiedeln und den
Urwald den Wildbeutern überlassen. Manche Linguisten
Genetische Spuren der sehen darin einen Grund dafür, weshalb Sprachfamilien wie
ursprünglichen Bevölkerung Arawak, Tupí und Carib wie auf einem Flickenteppich in
Renfrews Modell postuliert dementsprechend keine Vertrei- Amazonien verstreut sind.
bung indigener Gruppen, was einen vollständigen geneti- Einem simplen Prozess nach dem Muster »Neolithisie-
schen Austausch implizieren würde. Es beruht vielmehr auf rung bewirkt Sprachübernahme« hat es also nur selten
der Vorstellung einer Bevölkerungswelle, bei der die Neuan- gegeben. Oft kam die Landwirtschaft in einer Region nicht
kömmlinge die Zahl der Einheimischen bei Weitem über- plötzlich auf, sondern im Zuge eines langen Übergangs von
treffen. An der Wellenfront – also zwischen den vergleichs- einer Lebensweise in eine andere. Im kalten Nordeuropa
weise dicht besiedelten bäuerlichen und den von Wild- etwa blieb das Meer eine wichtige Nahrungsquelle. Wohl
beutern bewohnten Gebieten – konnten Letztere die neue aus diesem Grund finden sich genetische Spuren einer
Kultur und Sprache übernehmen und sich in die neue präneolithischen Urbevölkerung im Genpool Nordwesteuro-
AB AUSGABE 04.20:
DREITEILIGE SERIE
DIE PEST
AB 29. 8. 2020
IM HANDEL
UNSPALSH / NATHAN ANDERSON (https://unsplash.com/photos/7bzvXyuT3aQ)
Spektrum GESCHICHTE berichtet über die großen und kleinen Episoden der
Vergangenheit und zeigt, wie Archäologen und Historiker die ungelösten
Rätsel der Menschheitsgeschichte entschlüsseln.
Spektrum.de/aktion/geschichte
service@spektrum.de – Tel. 06221 9126-743
ü
ETHIK
DER FEINE UNTERSCHIED
ZWISCHEN
MENSCH UND TIER
Was macht den Menschen aus? Darüber diskutieren die Primatologin
Julia Fischer, der Philosoph Kurt Bayertz und die Entwicklungspsycho-
login Patricia Kanngießer.
spektrum.de/artikel/1457415
Frau Professor Fischer, Sie haben jahrelang Berberaffen zwischen Mensch und Tier und nehmen die Unterschiede
und Paviane in freier Wildbahn beobachtet. Wie viel wieder stärker in den Blick. Und das finde ich ebenfalls sehr
Affe steckt in uns Menschen? spannend.
Julia Fischer: Das kann man prozentual nicht beantworten,
denn es kommt darauf an, was man sich anschaut. Bei Herr Professor Bayertz, laut Beobachtungen von Verhal-
bestimmten Zelltypen gibt es große Ähnlichkeiten zwischen tensforschern benutzen Hühner unterschiedliche Laute
Menschen und Affen. Wenn Sie aber geistige Fähigkeiten etwa für die Anwesenheit von Futter oder Raubfeinden.
wie etwa Sprache betrachten, finden Sie große Unterschie Kann man eine solch differenzierte Kommunikation
de. In den letzten Jahrzehnten haben wir Wissenschaftler schon als Sprache bezeichnen?
verstärkt nach den Ähnlichkeiten gesucht. Und wenn wir Kurt Bayertz: Nein. Man muss sich klarmachen, was eine
dann etwas Passendes entdeckten, wurde das weiterver menschliche Sprache ausmacht. Es geht nicht nur darum,
folgt – gefundene Unterschiede jedoch nicht. Hier liegt ein dass man auf einen äußeren Reiz mit einem Laut oder einer
generelles Problem in der Wissenschaft vor: Was passt, Geste reagiert. Sprache ist etwas völlig anderes; sie ermög
wird publiziert, der Rest kommt in die Schublade. Wenn licht uns, eine vergleichsweise distanzierte Haltung gegen
herauskommt, der Affe oder die Krähe kann etwas, was über unserer Umwelt einzunehmen. Ein Affe kann zwar
zuvor dem Menschen vorbehalten schien, kommt das mit sagen: »Vorsicht, Jaguar!« Oder: »Vorsicht, Schlange!« Er
großem Bohei in die Medien, und alle finden das toll.
Schwieriger wird es, wenn die Affen oder Krähen etwas
nicht können. Das will eigentlich niemand so genau wissen
und wird erst gar nicht veröffentlicht.
»Wenn herauskommt, der Affe oder
Sehen Sie diese Schieflage auch bei der Erforschung die Krähe kann etwas, was zuvor
von Sprachfähigkeit?
Fischer: Ja. Hier gab es einen großen Hype in den 1980er dem Menschen vorbehalten schien,
Jahren. Da wurden Gegrunze und Schreie als Wörter
bezeichnet. Das hat aber mit Sprache nichts zu tun, denn
kommt das mit großem Bohei in die
es erfüllt nicht die elementarsten Kriterien, die wir an
Sprachfähigkeit anlegen, wie etwa Lernen. Inzwischen
Medien, und alle finden das toll«
schauen wir etwas skeptischer auf die Gemeinsamkeiten Julia Fischer
kann jedoch nicht sagen: »Hör mal, hier ist keine Schlange!« Hühner verwenden immer für Luftfeinde den einen Ruf und
Verneinungen lassen sich mit tierischen Alarmrufen nicht für Bodenfeinde einen anderen. Das sehen wir bei Affen
ausdrücken, weil ein auslösender Reiz fehlt. Hier liegt der ebenfalls. Bei Grünen Meerkatzen in unterschiedlichen
fundamentale Unterschied: Im einen Fall wird man durch Regionen Afrikas haben wir beobachtet, dass sie alle diesel
einen externen Reiz angeregt, eine bestimmte Äußerung zu ben Alarmrufe benutzen. Dagegen werden in den Gebieten,
machen; im anderen kann man einen bestimmten Umwelt in denen wir forschen, im Umkreis von nur 50 Kilometern
zustand kommentieren. Und man kann über abwesende zig verschiedene Sprachen gesprochen. Das sind wirklich
Dinge sprechen, etwa über die Vergangenheit oder die ganz andere Dimensionen.
Zukunft.
Fischer: Hühner haben vielleicht unterschiedliche Alarm Frau Doktor Kanngießer, Schimpansen konnten Gebär-
rufe für verschiedene Raubfeinde. Aber das ist ein angebo densprache erlernen: Inwieweit unterscheidet sich das
renes Verhalten, das sich evolutionär entwickelt hat. Alle von menschlicher Sprache?
Kurt Bayertz
(Jahrgang 1948) studierte Philosophie, Germanistik
und Sozialwissenschaften an den Universitäten
Frankfurt am Main und Düsseldorf.
Nach seiner Promotion 1977 war er wissenschaftlicher
Mitarbeiter an den Universitäten Bremen und Bielefeld
und habilitierte 1988. Anschließend leitete er die Ab-
teilung Technikfolgenabschätzung am Institut für System-
und Technologieanalysen in Bad Oeynhausen und wurde
1992 an die Universität Ulm berufen. Seit 1993 ist er
Professor für praktische Philosophie an der Universität
Münster. Ethik und philosophische Anthropologie zählen
zu seinen Arbeitsschwerpunkten.
MIT FRDL. GEN. VON KURT BAYERTZ
MIRKO KRENZEL FÜR DIE VOLKSWAGEN STIFTUNG; MIT FRDL. GEN. VON PATRICIA KANNGIESSER
Patricia Kanngießer
(Jahrgang 1981) studierte Biochemie, Philosophie und
Neurowissenschaften in Frankfurt am Main, Magdeburg
sowie Toronto und arbeitete anschließend am Wolfgang-
Köhler-Primatenforschungszentrum in Leipzig.
Nach Gastforschungsaufenthalten in den USA und Japan
promovierte sie 2012 in experimenteller Psychologie an
der University of Bristol. Anschließend wechselte sie zum
Max-Planck-Institut für evolutionäre Anthropologie und
verglich menschliche Kulturen in Afrika und Südamerika.
Seit 2016 leitet sie eine Nachwuchsgruppe zur kultur-
vergleichenden Entwicklungspsychologie an der Freien
Universität Berlin.
Gib mir Banane! Kratz mich!« Das ist das ganze Komplexi und auf Selektionsdruck zurückgeführt werden kann. Irgendwann
tätslevel. Es handelt sich also eindeutig um eine funktionale sind vielleicht unsere Vorfahren ein ganz kleines bisschen schlau
Kommunikation, die Sie bei Schimpansen auch darüber er geworden als ihre Kumpels von nebenan. Und das hat eine
erreichen, indem Sie einfach auf eine Banane zeigen. Da Dynamik in Gang gesetzt, die auch die Sprache hervorgebracht
gibt es keine komplexe Struktur, kein Sichunterhalten um hat. Eine vollständige biologische Erklärung gibt es dann viel
des Informationsaustausches willen. leicht gar nicht, da viel Zufall im Spiel war.
Bayertz: Man muss fragen: Wozu wird Sprache eigentlich Fischer: Ich glaube schon, dass es hier durchaus biologische
eingesetzt? Ein wesentlicher Antrieb für Tiere, mit Men Unterschiede zwischen Mensch und Tier gibt. Michael Tomasello
schen zu kommunizieren, scheint zu sein, eine Belohnung vom Max-Planck-Institut für evolutionäre Anthropologie in Leipzig
zu bekommen. Es wird also immer strategisch kommuni hat sehr gut herausgearbeitet, wie früh in Kindern angelegt ist,
ziert. Kinder machen das natürlich genauso, wenn sie auf etwas zu zeigen, sich über die Welt zu verständigen, zu
Schokolade wollen; da spielt die strategische Rede eben beobachten, ob der andere auch da hinguckt, wo man selbst
falls eine Rolle. Aber sie sprechen auch, um sich zu unter hingeguckt hat. Menschen haben angeborenerweise eine andere
halten, ohne dass sie einen unmittelbaren Vorteil daraus Disposition als Affen, sich in die Gesellschaft einzufügen.
deln. Und Kultur ist das Werkzeug, die Leidensfähigkeit als ein mögliches Kriterium, wie ich ein
Tier zu behandeln habe, zu berücksichtigen und nicht nur
das ihm das ermöglichte« die Intelligenz.
»Wenn man über die Ähnlichkeiten haben Tiere eine Würde. Das ist durch einen Volksent
scheid in die Schweizer Verfassung gekommen. Dort darf
zwischen Mensch und Tier genug man beispielsweise einen Kanarienvogel nicht allein halten.
Die Schweiz muss ein sehr glückliches Land sein, wenn
herausgefunden hat, werden sie solche Probleme in ihrer Verfassung regelt. Man kann
auch die Unterschiede wieder natürlich der Überzeugung sein, dass Tiere eine Würde
besitzen; wenn man sich aber vergegenwärtigt, was der Be
interessanter« griff Menschenwürde im deutschen Recht bedeutet, dann
können Tiere keine Würde in diesem Sinn haben. Das heißt
Kurt Bayertz nicht, dass Tiere irgendwelche beliebigen Gegenstände
sind. Man kann ja auch Wesen, die keine Würde haben,
ordentlich behandeln.
Bayertz: Man kann sich hierbei auch die Frage stellen: Ge- Bitte in einem Satz zusammengefasst: Was macht uns
hören wir heute noch derselben Art an wie die Menschen Menschen aus?
von vor 1000 Jahren? Biologisch sicherlich. Der französi Fischer: Dass wir uns diese Frage stellen.
sche Paläoanthropologe André Leroi-Gourhan hat einmal
gesagt: Wenn ein Biologe, der von einem anderen Stern Die Podiumsdiskussion »Der feine Unterschied: Was macht uns
kommt, einen mittelalterlichen Handwerker mit einem Menschen aus?« fand im Rahmen des Herrenhäuser Forums
modernen Arbeiter an einer vollautomatischen Maschine Mensch–Natur–Technik der VolkswagenStiftung in Kooperation
mit »Spektrum der Wissenschaft« am 11. Februar 2016 im
vergleicht, würde er sie verschiedenen Arten zuordnen, Schloss Herrenhausen in Hannover statt. Moderiert wurde das
weil das Verhalten so unterschiedlich ist. Die Einteilungen, Gespräch von »Spektrum«-Redakteur Andreas Jahn.
mit denen wir uns die Welt zurechtlegen, sind nur mehr
oder weniger willkürliche Ordnungskriterien. Es kommt
jeweils auf den Standpunkt an: Was ist mir wichtig, wenn
ich eine Unterscheidung einführe? Betrachten wir nur das LITER ATURTIPPS
Verhalten, sind wir sicherlich ganz anders als unsere Vor
Bayertz, K.: Der aufrechte Gang. Eine Geschichte des anthropo
fahren vor einigen tausend Jahren; betrachten wir unsere logischen Denkens. C.H.Beck, 2014
genetische Ausstattung, hat sich nicht viel geändert.
Kanngießer: Man kann Gründe dafür oder dagegen finden, Kurt Bayertz’ Opus magnum analysiert die alte Frage nach der
Sonderstellung des Menschen.
nichtmenschliche Primaten in die Gattung Homo einzu
gliedern. Vielleicht sollten wir ihnen sogar noch Menschen Fischer, J.: Affengesellschaft. Suhrkamp, 2012
rechte zusprechen, aber dann müssen wir überlegen, Julia Fischer zeigt Gemeinsamkeiten und Unterschiede
welche normativen Implikationen das hat. Denn dann zwischen Mensch und Affe.
spektrum.de/artikel/1671450
SPRACHE SUCHT
NEUES ZUHAUSE!
Bei Hirnschädigungen im frühen Kindesalter können
die Sprachzentren von der linken in die rechte
Hemisphäre hinüberwandern. Ein erstaunliches
Beispiel für die Flexibilität des Gehirns.
Broca-Zentrum
YOUSUN KOH
Wernicke-Zentrum
kommen und somit gut gegen Hickok, G., Poeppel, D.: Dorsal and ventral streams:
A framework for understanding aspects of the functional
Ausfälle gewappnet
anatomy of language. Cognition 92, 2004
5 Der Frontallap-
pen hilft dabei, die
Bedeutung der
Wörter zu entschlüs-
seln, indem
er sie mit
Erinnerungen
verknüpft.
2 Die
Amyg-
dala
(unter-
halb der
Hirnrinde
gelegen)
registriert den
emotionalen
Unterton und
leitet eine entspre-
chende Gefühls-
reaktion ein.
ZUHÖREN
Beim Zuhören werden verschiedene Hirnbereiche aktiv, die die Bedeutung der Wörter und
ihren emotionalen Kontext entschlüsseln. Wie neueste Studien zeigen, verarbeiten diese
Regionen die Informationen nahezu zeitgleich, und zwar schon etwa 100 bis 200 Millisekun-
den nachdem ein Wort ausgesprochen wurde. Spezialisierte Sprachzentren liegen bei den
meisten Rechtshändern in der linken Hirnhälfte, sind hier aber zur einfacheren grafischen
Darstellung rechtsseitig eingezeichnet.
QUELLEN
SPRECHEN Carter, R.: The brain book. Dorling
Schon rund eine Viertelsekunde, bevor ein Wort die Kindersley Limited, 2009
Lippen des Sprechers verlässt, bereitet sich das Gehirn Pulvermüller, F. et al.: Understanding
vor. Nacheinander werden verschiedene Areale aktiv, in an instant: Neurophysiological
die es dem Sprecher ermöglichen, die betreffenden evidence for mechanistic language
Wörter zu artikulieren. Bei den meisten Rechtshändern circuits in the brain. Brain
liegen auch diese Sprachzentren in der linken Hirnhälfte. Lang. 110, 2009
spektrum.de/artikel/1224869
Ob ausdrucksstarke Arie oder grooviger A-cappella-Rap – was Berufssänger wie die Mezzosopranistin
Elina Garanca (links) oder die Mitglieder der Band Wise Guys scheinbar mühelos darbieten, erfordert die
Schulung aller Komponenten des stimmbildenden Systems.
weicher Gaumen
Vokaltrakt
Kehldeckel
Die Hauptaufgabe der Grundkomponenten des
(Epiglottis)
Vokaltrakts ist nicht die Kommunikation,
Lippen
Rachen sondern der Schutz unseres Lebens: Drohen
Partikel oder Tröpfchen in die Luftröhre zu
Zunge
gelangen, verschließen der Kehldeckel und die
Kehlkopf Stimmlippen ihnen den Weg. Im Lauf der
(Larynx)
Evolution hat sich dieses System weiterent
PATRICIA C. WYNNE / SCIENTIFIC AMERICAN SEPTEMBER 1999
Zungenbein
Membrana
Taschenfalte thyrohyoidea
Schildknorpel
Stimmlippe
Schildknorpel
Glottis
Luftröhre Luftröhre
den notwendigen Referenzwert, bei dem der Mund geöff- Näherung lässt sich der Vokaltrakt mit einer auf der Glottis-
net, der Stimmspalt hingegen weitgehend verschlossen ist, seite verschlossenen Röhre von durchschnittlich 17,5 Zenti-
was für den gleichen Druck in Mund und Maske sorgt. meter Länge vergleichen (siehe Grafik S. 52). Die sich darin
Je größer der Luftdruck ist, desto lauter wird der Ton. durch Reflexionen ausbildende stehende Welle hat dann
Für eine gewöhnliche Unterhaltung reichen Drücke von eine viermal so große Wellenlänge mit einer ersten Forman-
etwa fünf bis sieben Millibar aus. Bei lautem Gesang wie tenfrequenz (siehe Glossar links) von 500 Hertz. Durch
auf der Bühne misst man Werte bis zu 30 Millibar. Im solche Resonanzen entstehen beispielsweise Vokale wie /a/
Opernfach Heldentenor hat unsere Freiburger Arbeitsgrup- und /e/ oder der so genannte Schwa-Laut / /, im Deutschen
pe schon 45 Millibar ermittelt, bei Musicalsängern sogar ein unbetonter Vokal wie das »ü« in »Mücke«. Fünf Reso-
knapp 65 Millibar. Zum Vergleich: Trompeter erreichen über nanzbereiche sind besonders wichtig: Die ersten beiden
150 Millibar Luftdruck. dieser Formanten bilden die Vokale, die anderen drei prä-
Dank ihrer Elastizität geben die Stimmlippen schließlich gen durch die Obertöne den Klangcharakter und verleihen
nach und öffnen kurzzeitig einen Glottis genannten Spalt. der Stimme Durchsetzungskraft. Man kann den Vokaltrakt
Diese Eigenschaft lässt sie auch wieder zurückfedern und also als Filter beschreiben. Im Bereich der Formanten
den Spalt schließen; zudem entsteht ein Unterdruck durch werden Teiltöne des an den Stimmlippen produzierten
die schnelle Strömung in der Engstelle (Bernoulli-Effekt). Klangs verstärkt, während Teiltöne zwischen den Forman-
Dieses Auf und Zu wiederholt sich periodisch und in ra- ten durch fehlende Resonanz abgeschwächt werden (siehe
scher Folge. Die schwingenden Stimmlippen erzeugen Grafik S. 52).
Töne beziehungsweise Klänge also nicht wie eine Gitarren- Übrigens lässt sich diese Funktion leicht im Experiment
saite, sondern indem sie den Luftstrom in Pulse von weni- nachvollziehen. Dazu benötigt man nur einen Entenlocker
gen Millisekunden Dauer unterteilen. aus einem Jagdfachgeschäft und einen passenden Kunst-
stoffschlauch. Die Tröte erzeugt einen Klang, der dem unse-
Grund- und Obertöne rer Stimmlippen physikalisch sehr ähnlich ist. Wird der
Dadurch werden Schallwellen in das Instrument »Stimm Schlauch aufgesteckt und auf die Länge von knapp 18 Zen-
apparat« geschickt, das den Kehlkopfeingang, Rachen timetern eingekürzt, verändert sich das Quäken zu vollerem
und Mundraum umfasst. Es bildet sich ein Klang, der aus Klang, der durch Eindrücken des »Stimmrohrs« verändert
einer Grundfrequenz und ganzzahligen Vielfachen davon werden kann.
besteht, den Obertönen. Jeder Teilton dieses akustischen Ein großer Teil der Stimmlippen ist übrigens sowohl an
Spektrums hat seine eigene Lautstärke, und die des lau ihren Seiten als auch in ihrem hinteren Bereich an der Ton-
testen bestimmt die des Gesamttons. erzeugung kaum beteiligt. Tatsächlich schwingt bei Frauen
Verschiedene Muskeln und insbesondere die Zunge ver- nur etwa ein Zentimeter, bei Männern sind es gut 1,8 Zen
ändern die Gestalt des Schallwegs und schwächen be timeter. Auf Grund dieser größeren Länge und höheren
ziehungsweise verstärken dadurch die Obertöne. In erster Masse klingt die männliche Sprechstimme tiefer; sie liegt
WILLIAM HOGARTH: FARINELLI, CUZZONI UND SENESINO IN HÄNDELS FLAVIO, UM 1728 / PUBLIC DOMAIN
Bewunderte Kastraten
Häufig werden Countertenöre für die Aufführung alter
Musik eingesetzt, um den ursprünglichen Charakter
eines Stücks im Sinn einer historisch informierten Auf-
führungspraxis wiederzugeben. Sie nehmen dann den
Platz von Sängern ein, die bis heute ein Nimbus von
Tragik und Kunstfertigkeit umgibt: den Kastraten. Im
18. Jahrhundert wurden in Italien pro Jahr vermutlich
etwa 4000 Jungen vor Erreichen der Pubertät kastriert,
um den Stimmbruch zu verhindern. Zuverlässige Anga-
ben darüber, wie viele Kinder an der Operation oder
deren Folgen verstarben, gibt es nicht, da die Kastration
verboten war. Häufig waren es Kinder aus ärmlichen
Verhältnissen, denen – sofern sie ansprechende Stimmen Ihr ungewöhnlicher Körperbau machte Kastraten zum Ziel
hatten und den Eingriff bei guter Gesundheit überlebten– von Karikaturisten (links: Farinelli, rechts: Senesino).
eine lukrative Anstellung winkte.
Warum der Kastrat so hoch im Kurs stand, kann ein
Physiologe erklären: Mangels Testosteron wuchsen die kann. Somit konnten Kastraten vermutlich sehr laut
Stimmlippen nicht zur vollen männlichen Länge, blieben singen und obendrein einen Ton lange halten. Zudem
bei etwa einem Zentimeter Länge und erzeugten weiter- war ihr Vokaltrakt länger als bei Knaben oder Frauen, wie
hin Frequenzen im Bereich von Alt oder Sopran. Gleich- man aus anatomischen Studien des 19. Jahrhunderts
zeitig erreichten die Extremitäten, der Brustkorb und die weiß. Ihre Formantenfrequenzen sorgten also trotz hoher
Lungen hormonell bedingt erhebliche Länge und Größe, Tonlage vermutlich für eine dunkle, maskuline Gesangs-
was man auf zeitgenössischen Karikaturen erkennen stimme.
Der allgemeine Begriff Register stammt aus dem Orgel- Passaggio bezeichneten Übergang zwischen Modalstimme
bau und fasst Töne gleicher Klangfarbe zusammen. So gibt und Falsett stufenlos zu bewältigen, lässt sich ebenfalls mit
es bei der Kirchenorgel Pfeifen, deren Bauweise flötenarti- diesem Modell erklären: Training könnte sie in die Lage
ge Klänge ermöglicht, während andere eher an Streich versetzen, die entsprechende Muskelspannung sehr fein
instrumente erinnern. Auf den Gesang übertragen unter- abzustimmen, was unsere eigenen Untersuchungen an
scheiden Sänger und Gesangslehrer traditionell diverse professionellen Tenören bestätigen. Wissenschaftler wie
Register, denn bei Singstimmen verändert sich insbeson Ingo Titze vom National Center of Voice and Speech in Salt
dere mit ansteigender Frequenz der Klangcharakter. Lake City kommen aber auf Grund von Modellversuchen
In einer mittleren Lage beschreibt das Register »Brust- und physikalischen Simulationen zu dem Schluss, dass die
stimme«, häufig auch Modalregister genannt, einen vollen Unterschiede zwischen Registern weit komplexer sind: Die
Klang. Hinter der Bezeichnung steht subjektives Empfinden: vom Sänger eingestellten Resonanzen würden demnach
Vibrationen werden vor allem im Brustraum wahrgenom- auch zurückkoppeln und die Schwingungen der Stimmlip-
men. Demgegenüber galt früher das Falsett mit Frequenzen pen oder den von ihnen produzierten Luftimpuls verändern.
von 250 bis etwa 800 Hertz als eine Stimme, an deren
Klangformung vor allem Nase und Nasennebenhöhlen Präzise Gesangstechnik: Jodeln
beteiligt seien – dort spüren die Sänger den Ton. Häufig Das Passaggio untrainierter Sänger erfolgt unkoordiniert,
wird die » falsche« Stimme – der Name leitet sich vom und die Stimme kippt regelrecht in das neue Register, bis
italienischen »falso« her – daher auch als Kopfstimme sie sich dort stabilisiert. Zur Kunstform erhebt diesen sonst
bezeichnet; die N omenklatur ist hier aber nicht einheitlich. unerwünschten Effekt eine nicht nur im Alpenraum prak
Die kleinen Resonanzräume der Nase schienen den im tizierte Gesangstechnik: das Jodeln. Wer kein Freund der
Vergleich zur Bruststimme dünnen Klang zu erklären. Heute Volksmusik ist, mag es kurios finden, dürfte aber über-
wissen wir jedoch, dass selbst im Falsett der gesamte rascht sein zu erfahren, dass ein durch Jodler verziertes
Vokaltrakt bei der Klangformung beteiligt ist und der Haupt- Lied hohe Ansprüche an den Sänger stellt. Denn die deut-
unterschied zwischen Modalregister und Falsett von den lich hörbaren Übergänge zwischen den beiden Registern
Stimmlippenschwingungen herrührt. erfolgen extrem schnell. Unsere eigenen Spektralanalysen
Viele Forscher halten eine erhöhte Längsspannung bei professionellen Jodlern aus der Schweiz zeigen, dass
des am äußeren Kehlkopf angreifenden Musculus cricothy- die Tonhöhen dabei hinsichtlich Intonation und Stabilität
roideus für den Hauptmechanismus, der dem Falsett zu sogar präziser als bei klassisch trainierten Stimmen ange-
Grunde liegt. Dieser Zug versteift die Stimmlippen, verrin- steuert werden. Zudem spielt offenbar die genaue Formung
gert somit den schwingenden Anteil und reduziert damit des Vokaltrakts eine wichtige Rolle. In besonderem Maß
auch die schwingende Masse. Das Ergebnis wären tatsäch- betrifft dies die Zunge, deren Gestalt wesentlich darüber
lich eine höhere Frequenz und ein an Obertönen ärmeres entscheidet, wie groß die Resonanzräume im Mund und
Spektrum. Dass es professionellen Sängern gelingt, den als Rachen sind. Laut Untersuchungen mit Kernspintomogra-
Stimmquellspektrum,
welches an den Stimm-
Vokal
lippen gebildet wird
/ /
Amplitude
Vokal
/a/
0 Hertz Frequenz 5 Kilohertz
Vokal
/i/
Die Schwingungen der Stimm
lippen erzeugen periodisch
abwechselnde Bereiche hohen
und niedrigen Luftdrucks im
40
Vokaltrakt. Schon in einer Clusterung
von F3 – F5 auf
Dezibel
spektrum.de/artikel/1628792
Die 51 Jahre alte Apothekerin konsultierte mich wegen me sprach. Außerdem artikulierte sie die Laute, die so
Problemen mit ihrer Aussprache, die sich in den ver- genannten Phoneme, so undeutlich, dass sie für mich
gangenen zwei Jahren verschlechtert hätte. Sie arbei- manchmal schwer zu unterscheiden waren: Das sch ähnel-
tete noch in der Apotheke, zog es inzwischen allerdings vor, te eher einem s, und das t bewegte sich irgendwo zwischen
im Hinterzimmer zu bleiben, statt die Kunden zu beraten. t und d. Auch gerieten die Reihenfolge und Auswahl der
Davon abgesehen war Frau W.* bei bester Gesundheit. Phoneme bisweilen durcheinander. Auf meine Bitte hin, das
Während unserer Unterhaltung fiel mir tatsächlich auf, Wort »chasseur« (französisch für Jäger, Aussprache in etwa
dass die Französin langsam und mit sehr monotoner Stim- »Schassör«) auszusprechen, sagte sie Saschör, vertauschte
demnach s- und sch-Laut. Statt »mardi« (Dienstag) sagte
sie »mawerdi«, integrierte also die Silbe we, die darin gar
nichts zu suchen hatte. Dagegen konnte sie die Wörter
AUF EINEN BLICK ganz richtig schreiben. Als ich ihr ein Bild zeigte und sie
darum bat, dieses schriftlich zu beschreiben, fielen mir zwei
WENN DIE WORTE FEHLEN Sätze auf: »Waschbecken ist voll« und »Mann steht auf
Stuhl« – hier ließ sie die Artikel (der, die, das) weg. Anderer-
1 Probleme beim Sprechen treten nicht nur als Folge
eines Schlaganfalls auf, sondern können auch
auf schleichenden Abbauprozessen in der Hirnrinde
seits hatte Frau W. keine erkennbaren Probleme zu verste-
hen, was ich ihr erklärte.
beruhen. In den folgenden Jahren verstärkten sich ihre S chwie-
rigkeiten. Schließlich musste sie vorzeitig in Rente gehen,
2 Je nachdem, welche Hirnregion davon betroffen ist, und drei Jahre nach unserem ersten Treffen sprach sie fast
äußern sich die primären progressiven Aphasien in völlig unverständlich. Woran aber litt sie? Grob gesagt unter
unterschiedlichen Problemen mit der Artikulation, dem einem Sprachproblem, einer Aphasie. Dieser Ausdruck ist
Satzbau sowie der Wortfindung und -bedeutung. an die altgriechische V okabel »aphasía« angelehnt, was so
viel wie »Sprachlosigkeit« bedeutet. Der medizinische
Schläfenlappen
semantische Aphasie
Neben Wortfindungsstörungen bestehen
fenen typischerweise eine Schädigung findet. So entdeck- Patienten in drei Kategorien einzuteilen. Bei jeder von ihnen
ten sie wichtige Sprachregionen wie das Broca- und das ist eine bestimmte Kortexregion vom Abbau betroffen
Wernicke-Areal. (siehe »Die Varianten der Sprachlosigkeit«, oben).
Die häufigste Ursache für eine Aphasie ist ein Schlagan- Frau W. litt an einer nicht flüssigen PPA. Zu sprechen ist
fall. Dann tritt das Problem allerdings urplötzlich auf – ganz für Patienten wie sie offensichtlich anstrengend. Sie bilden
anders als bei Frau W., deren Schwierigkeiten sich eher kurze Sätze, haben Schwierigkeiten, Wörter zu finden oder
schleichend verstärkten. Hier handelte es sich um eine Phoneme richtig zu artikulieren. Mit der Zeit entwickeln sie
neurodegenerative Erkrankung, genauer gesagt um eine Probleme mit der Grammatik und äußern sich irgendwann
primäre progrediente Aphasie, kurz: PPA. Das bedeutet, nur noch in einfachen S ätzen oder gar im Telegrammstil.
dass die Störung auf Grund eines Gewebeabbaus fort- Zudem fällt es ihnen zunehmend schwer, komplexe Satz-
schreitend (progredient) ist, aber über etliche Jahre das strukturen zu verstehen. Bei diesen Menschen ist der
vorherrschende (primäre) und oft auch einzige Symptom untere linke Stirnlappen einschließlich des berühmten
bleibt. Insofern unterscheiden sich PPAs von Aphasien im Broca-Areals in Mitleidenschaft gezogen. Letzteres ist nach
Rahmen der Alzheimerdemenz, die sich in der ersten Krank- Paul Broca (1824–1880) benannt, einem französischen Arzt,
heitsphase üblicherweise vor allem in Gedächtnisausfällen der die Bedeutung dieser Hirnregion für die Sprache bereits
manifestiert. in den 1860er Jahren erkannte. Tatsächlich ist es 150 Jahre
später immer noch sehr schwierig, die genaue Rolle des
Ein junges Forschungsgebiet Areals anzugeben. Brocas minuziöse mikroskopische
Insgesamt handelt es sich bei den primären progredienten Analyse zeigte, dass es mehr als ein Dutzend voneinander
Aphasien um ein noch relativ junges Forschungsgebiet. Die abgrenzbare Bereiche umfasst, die alle mit diversen ent-
frühesten Fälle wurden zwar schon Ende des 19. Jahrhun- fernten Hirnregionen verbunden sind. Dies erklärt die
derts beschrieben, aber erst in den 1980er Jahren unter- Vielfalt seiner Funktionen bei Artikulation, Wortwahl und
suchten Mediziner diese spezielle Erkrankung genauer. Vor Satzbau. Im Lauf der Jahre breitet sich bei der nicht flüssi-
einigen Jahren begann man sich darauf zu einigen, die gen PPA der Verfall über die Broca-Region hinaus aus.
»Wie alt …? Sie meinen … Fällen auftretenden Depressionen werden ebenfalls behan-
delt. Manchmal können Patienten an therapeutischen
Was bedeutet ›alt‹?« Studien teilnehmen. In diesem Rahmen haben bereits
verschiedene Forschergruppen, darunter 2016 ein Team um
Marc Teichmann vom Hôpital de la Pitié-Salpêtrière, die
Mit der Zeit aber kann sich die Schädigung ins Zentrum Wirkung einer transkraniellen Stimulationstechnik namens
des linken Schläfenlappens und schließlich nach rechts aus- tDCS getestet. Dabei wird ein geringer elektrischer Strom
breiten. Dann löst sich die Bedeutung der Wörter selbst auf, am Schädel über den betroffenen Hirnregionen angelegt.
wie dieser Dialog zeigt: »Können Sie mir sagen, wie alt Sie Die Methode ist durchaus viel versprechend. Einfach und
sind?« »Wie alt …? Sie meinen … Was bedeutet ›alt‹?« »Was schmerzlos anzuwenden, führte sie in etlichen Untersu-
können Sie auf diesem Bild sehen?« (Es war ein Hund zu chungen zu messbaren Verbesserungen, etwa was Aus-
erkennen.) »Ein Tier.« »Wissen Sie, welche Art von Tier das sprache, Wortfindung und -verständnis betraf. In einer 2018
ist?« »Es ist ein Tier, das … nein.« »Und auf diesem Bild?« veröffentlichten Studie von Medizinern des Johns Hopkins
(eine Taube) »Ein Tier.« »Können Sie mir sagen, wie sich Hospital in Baltimore ließen sich sogar noch zwei Monate
dieses Tier fortbewegt?« »Nein … läuft es?« »Und das hier?« nach der Behandlung Erfolge nachweisen.
(ein Frosch) »Ein Dings … ich weiß nicht.«
Die Patienten bilden immer allgemeinere Kategorien. QUELLEN
Zuerst werden alle Vierbeiner etwa zu Hunden und alle
Montembeault, M. et al.: Clinical, anatomical, and pathological
Vogelarten zu Vögeln, dann verschwinden die Grenzen features in the three variants of primary progressive aphasia: a
noch mehr, und alle Tiere fallen in eine einzige Gruppe (»Es review. Frontiers in Neurology 9, 2018
ist ein Tier«). Und auch diese vermischt sich schließlich mit Teichmann, M. et al.: Direct current stimulation over the
den unbelebten Objekten zu einem chaotischen Mix aus anterior temporal areas boosts semantic processing in primary
Dingen und Sachen. progressive aphasia. Annals of Neurology 80, 2016
Bei der dritten Aphasie-Variante überwiegt der Substanz- Tsapkini, K. et al.: Electrical brain stimulation in different
abbau in der linken Hirnhälfte in einem Bereich, der teils variants of primary progressive aphasia: a randomized clinical
im Schläfen- und teils im Scheitellappen liegt. Sie wird als trial. Alzheimer’s & Dementia (New York, N. Y.) 4, 2018
spektrum.de/artikel/1576146
1 Vor mehr als 140 Jahren erleidet ein Mann einen Schlaganfall, in dessen Folge er nicht mehr lesen
kann – obwohl er noch hervorragend sieht.
2 Sein Arzt Jules Joseph Déjerine erkennt in der Störung eine »reine Alexie«. Er publiziert eine detaillierte
Beschreibung der Krankheitssymptome und postuliert mögliche Ursachen.
3 Der Fallbericht stößt Hunderte von weiteren Studien an. Sie decken nach und nach auf, wie das
menschliche Gehirn visuelle Informationen verarbeitet.
BEARBEITUNG: CERVEAU&PSYCHO
verdächtigte »geknickte Windung« (Stern)
ist also nicht die zentrale Ursache für das
Leiden. Ihre Bedeutung für das Lesen liegt
weiterhin im Dunkeln.
Information nicht in die geknickte Windung gelangte, in der sucht. Heute wissen wir einiges mehr über den visuellen
nach Déjerines Vorstellung die Erinnerung an die Form der Kortex und die Gehirnprozesse des Sehens, als es Déjerine
Buchstaben gespeichert war. Da aber das Wissen erhalten am Ende des 19. Jahrhunderts tat. Zusammengefasst pas-
geblieben war, könne Oscar weiterhin schreiben oder mit- siert Folgendes: Die Netzhaut registriert visuelle Reize und
tels Ertasten lesen. Sein letztlich tödlicher zweiter Schlag- leitet sie an die Sehrinde weiter. Dabei wird die Information
anfall von 1892 zerstörte zusätzlich die geknickte Windung. sortiert und an dutzende Regionen im hinteren Teil des
Das, so schrieb Déjerine, vernichtete nun auch Oscars Gehirns geschickt. Jeder dieser Bereiche vermittelt einen
Erinnerung an die Form und Bedeutung der Buchstaben. speziellen Aspekt des Sehens. Farbe, Umrisse, Positionie-
In den 125 Jahren, die vergangen sind, seit Déjerine rung und Bewegung von O bjekten analysiert das Gehirn
seine Beobachtungen veröffentlicht hat, haben hunderte getrennt voneinander und fügt dann alle Informationen zu
wissenschaftliche Studien die Alexie noch genauer unter- einem Gesamtbild zusammen. Einige Regionen sind darauf
die Kommunikation zwischen der Sehrinde Bezugspreise: Einzelheft »Spezial«: € 8,90 / sFr. 17,40 / Österreich € 9,70 / Luxem-
burg € 8,90,– zzgl. Versandkosten. Im Abonnement € 30,80 für 4 Hefte, für Studen-
und einem bestimmten Teil des Scheitellap- ten gegen S
tudiennachweis € 25,60. Bei Versand ins Ausland werden die Mehr
pens verhindert. Aus diesem Grund sei Oscar kosten berechnet. Alle Preise verstehen sich inkl. Umsatzsteuer. Zahlung sofort
nach Rechnungserhalt. Postbank Stuttgart, IBAN DE52600100700022706708,
plötzlich unfähig gewesen, Wörter zu lesen.
BIC PBNKDEFF
Anzeigen: E-Mail: anzeigen@spektrum.de, Tel. 06221 9126-600
Druckunterlagen an: Natalie Schäfer,
E-Mail: schaefer@spektrum.de
Anzeigenpreise: Gültig ist die Preisliste Nr. 41 vom 1. 1. 2020
spezialisiert, Objekte zu erkennen, die gewissen Kategorien Gesamtherstellung: L. N. Schaffrath Druckmedien GmbH & Co. KG, Marktweg
42–50, 47608 Geldern
angehören. So gibt es je ein Areal für Gesichter, Bauten
Sämtliche Nutzungsrechte an dem vorliegenden Werk liegen bei der Spektrum der
oder Körperteile sowie eines für Buchstaben. Diese Gebiete Wissenschaft Verlagsgesellschaft mbH. Jegliche Nutzung des Werks, insbeson
bilden eine Art Mosaik an der Unterseite von Hinterhaupts- dere die Vervielfältigung, Verbreitung, öffentliche Wiedergabe oder öffentliche
Zugänglichmachung, ist ohne die vorherige schriftliche Einwilligung des Verlags
und Schläfenlappen und befinden sich bei jedem Menschen
unzulässig. Jegliche unautorisierte Nutzung des Werks berechtigt den Verlag zum
an den gleichen Stellen. Schadensersatz gegen den oder die jeweiligen Nutzer. Bei jeder autorisierten (oder
gesetzlich gestatteten) Nutzung des Werks ist die folgende Quellenangabe an
branchenüblicher Stelle vorzunehmen: © 2020 (Autor), Spektrum der Wissenschaft
Korrigierte Interpretation Verlagsgesellschaft mbH, Heidelberg. Jegliche Nutzung ohne die Quellenangabe in
Werden Teile dieses Mosaiks geschädigt, treten unter Um- der vorstehenden Form berechtigt die Spektrum der Wissenschaft Verlagsgesell-
ständen verschiedene Sehstörungen auf. Sie reichen von schaft mbH zum Schadensersatz gegen den oder die jeweiligen Nutzer.
Dehaene, S., Cohen, L.: The unique role of the visual word form SCIENTIFIC AMERICAN
area in reading. Trends in Cognitive Sciences 15, 2011 1 New York Plaza, Suite 4500, New York, NY 10004-1562,
Editor in Chief: Laura Helmuth, President: Dean Sanderson,
Resümiert moderne Erkenntnisse zum »visuellen Wortformareal« Executive Vice President: Michael Florek
spektrum.de/artikel/1667082
Er stand da, inmitten seiner Gäste, als er plötzlich –
bums – zusammenbrach und zu Boden fiel.« Gesten-
reich schildert die Inhaberin eines kleinen Bistros im
Randbezirk von Paris den Feuerwehrleuten das Unglück,
das ihrem Ehemann Maxime zugestoßen ist. Die Einsatz-
kräfte bringen den Patienten in die Notaufnahme des
nächsten Krankenhauses. Bei seiner Ankunft dort ist er wie
weggetreten. Fragen, die man ihm stellt, kann er nicht
beantworten, und auf Stimulation reagiert er mit heftigen,
hastigen und drohenden Bewegungen.
In den kommenden Tagen wird seine Unruhe immer
stärker, während er nach und nach das Bewusstsein
wiedererlangt: Verwirrt redet er unzusammenhängendes
Zeug, versucht, aus dem Krankenhaus zu fliehen, zerstört
mutwillig Gegenstände und richtet Drohgebärden gegen
das Personal. Medizinische Tests sind nur schwer mit
ihm durchzuführen, da er sich nicht besonders kooperativ
verhält. Bei Menschen mit einer sub-
Nach drei Tagen ist Maxime schließlich wieder gänzlich kortikalen Aphasie sind jene
wach – und zur Verwunderung aller plötzlich ein völlig Systeme im Gehirn geschädigt,
anderer Mensch. Als die Krankenschwestern nach ihm die Wörter und Sätze vor dem
sehen, finden sie ihn sitzend auf seinem Bett auf der Inten- Aussprechen auf ihre Richtigkeit
sivstation vor, während er vor seinen Zimmergenossen prüfen. Das lässt die Betroffenen
kurze, esoterisch und philosophisch anmutende Reden hält. bisweilen poetisch klingen.
SQUAREDPIXELS / GETTY IMAGES / ISTOCK (SYMBOLBILD MIT FOTOMODELL)
ü
Spektrum SPEZIAL Biologie Medizin Hirnforschung 3.20
63
Die heitere Sicherheit, mit der er seine Thesen vorträgt, und
sein weises Auftreten verleihen ihm im Krankenzimmer eine
starke Präsenz. So legt sich etwa bei der Frage »Was ist Aphasie
Gott?« ein kleines Lächeln auf seine Lippen, das durch die
leichte Lähmung seines Gesichts noch ein wenig prägnan- Unter einer Aphasie verstehen Mediziner eine erwor-
ter wirkt. »Gott ist in freien Menschen!«, antwortet er und bene Sprachstörung, die infolge einer Hirnschädigung
bringt damit seine Zuhörer zum Nachdenken. Dabei war auftritt. Die Ursache dafür kann zum Beispiel ein
Maxime seiner Frau zufolge früher oft aufbrausend und Schlaganfall sein, aber auch ein Schädel-Hirn-Trauma
mochte weder Literatur noch Philosophie, Religion oder oder ein Tumor.
Mystizismus!
Da sich ihr Patient nun nicht mehr gegen eine ausführli-
che Untersuchung sträubt, nutzen die Ärzte die Gelegen-
heit, um die Ursache für sein seltsames Verhalten zu er- Hund in den Sinn, gefolgt von einer Kuh, bald wird die
gründen. Sie nehmen Maximes Gehirn mittels Magnetreso- Aufzählung jedoch immer zusammenhangsloser: »das
nanztomografie unter die Lupe und stoßen auf einen Infarkt Schwein, die Wurst, der Innenhof eines Bauernhofs, der
im vorderen linken Thalamus: Die Arterie, die diesen Be- Wald, der Weg …« An dieser Stelle weiß er schließlich nicht
reich des Gehirns versorgt, ist verstopft, wodurch zahlrei- mehr weiter und kann sich nicht mehr erinnern, was die
che Nervenzellen zu Grunde gegangen sind. ursprüngliche Aufgabe war.
In Maximes Fall ist eine kleine Schädigung im Gehirn für
Ausgeschmücktes Märchen die Sprachstörung verantwortlich, die seinen Aussagen
Um Maximes intellektuellen Fähigkeiten auf den Zahn zu einen albernen, gleichzeitig jedoch auch hochgestochenen
fühlen, führen die Ärzte eine Reihe von Tests mit ihm und beinahe poetischen Ton verleiht. Forscher beschrieben
durch – mit ernüchternden Ergebnissen. So stellen sie etwa dieses ungewöhnliche Krankheitsbild in den 1970er Jahren
fest, dass der Patient, vor die Aufgabe gestellt, Bilder zu zunächst als »dissidente Aphasie«, um es von den klassi-
benennen, einfach neue Wörter erfindet: Den Mond be- schen Aphasien abzugrenzen, die durch Schädigungen im
zeichnet er als »Neptunus«, ein Känguru als »Hüpffresser«, Broca- oder Wernicke-Areal entstehen (siehe »Aphasie«,
eine Leiter als »Hochaufsteller«. Auch seine Sätze schmückt oben). Diese beiden Hirnregionen hatten Wissenschaftler
Maxime mit solch merkwürdigen Begriffen aus. bereits früh als Sprachzentren im Gehirn identifiziert. Später
Die Ärzte bemerken, dass er beim Sprechen schnell den nutzten Mediziner auch den Begriff der »thalamischen
Faden verliert. Als sie ihn bitten, das Märchen von Rotkäpp- Aphasie«. Da ähnliche Probleme jedoch ebenfalls nach
chen zu erzählen, beginnt er ohne zu zögern, doch als die Läsionen in anderen tiefer liegenden Gebieten wie etwa
Protagonistin zum ersten Mal auf den Wolf trifft, treten dem Striatum entstehen können, das sich aus Nucleus
plötzlich die drei kleinen Schweinchen auf. Bald darauf hat caudatus und dem Putamen zusammensetzt, spricht man
Maxime vergessen, welche Geschichte er eigentlich erzäh- heute eher von einer »subkortikalen Aphasie«.
len sollte. Im Rahmen eines anderen Tests muss er so viele Die Störung verdeutlicht, wie viele verschiedene Hirnre-
Wörter wie möglich nennen, die zur gleichen Kategorie, gionen tatsächlich an der Sprachproduktion beteiligt sind.
etwa »Tiere«, gehören. Dabei kommt ihm als Erstes ein Thalamus, Nucleus caudatus und Putamen sind im hinteren
Teil des Gehirns mit dem Wernicke-Zentrum verbunden und
im vorderen Bereich mit dem Broca-Areal sowie jenen
motorischen Regionen, die das Aussprechen von Wörtern
koordinieren. Darüber hinaus leiten sie zahlreiche Informati-
AUF EINEN BLICK onen an Areale im Stirnlappen weiter.
VOM CAFÉBESITZER ZUM PHILOSOPHEN Normalerweise prüfen die subkortikalen Hirnbereiche
schon vor dem Aussprechen mehrere Aspekte einer Aus
Nucleus caudatus
Putamen
Thalamus
Wernicke-Zentrum
präfrontaler Kortex
Broca-Zentrum
Thalamus, Nucleus caudatus und Putamen sind sowohl definieren und diese vor der Lautproduktion noch einmal
mit dem Broca- und dem Wernicke-Zentrum im Gehirn zu überprüfen. Der Thalamus leitet Informationen an das
verbunden als auch mit dem präfrontalen Kortex. Wis- Wernicke-Areal weiter, welches den Sinn von Wörtern
senschaftler schreiben diesem Netzwerk gleich mehrere und Aussagen kontrolliert und dann grünes Licht gibt.
Funktionen zu: Es ist daran beteiligt, beim Sprechen die Daraufhin »autorisiert« der Thalamus die Lautprodukti-
richtigen Wörter auszuwählen, den Ablauf einer Rede zu on, für die unter anderem das Broca-Areal zuständig ist.
rem unser prospektives Gedächtnis beteiligt, das uns dabei dann wird dieser auch in künftigen Sätzen immer wieder
hilft, das gesetzte Ziel im Auge zu behalten, aber auch das dieselbe Struktur verwenden: »Man findet Brot beim Bä-
Kurzzeitgedächtnis, welches das eben Gesagte für eine cker«, »Man findet Wolken im Himmel«, »Man findet Werk-
bestimmte Zeit speichert. stätten bei Mechanikern«, »Man findet Fußgänger in Autos«.
Das zeigt, wie komplex der Sprechakt für unser Gehirn Dieses Phänomen bezeichnet man als Perseveration.
eigentlich ist, nicht zuletzt, weil all diese Kontrollinstanzen
zusätzlich noch äußere Faktoren in ihre Arbeit mit einbezie- Poesie dank Kontrollverlust
hen müssen. So können sich Themen und Ziele zum Bei- Eine eingeschränkte sprachliche Kontrolle hat aber auch
spiel ändern und eine strategische Neuausrichtung unserer Vorteile. Von den Kontrollmechanismen der linken Hemi-
Aussagen nötig machen, etwa wenn unser Gesprächspart- sphäre befreit, gewinnt die Sprachverarbeitung in der
ner eine spezielle Anmerkung macht oder die Unterhaltung rechten Hirnhälfte zunehmend an Bedeutung, die unter
plötzlich in eine andere Richtung lenkt. anderem einen großen Beitrag zur Entstehung von Meta-
Sind Thalamus, Nucleus caudatus, Putamen oder die phern, Humor und bildhaften Ausdrücken leistet. Maxime
Nervenfasern, welche die Bereiche miteinander verbinden, hat dadurch eine einfallsreiche und metaphorische Art zu
geschädigt, funktioniert der Prozess nicht mehr richtig, sprechen entwickelt, die ihm zugleich eine esoterische,
obwohl jene Areale, die man im engeren Sinn als Sprach- bisweilen sogar poetische Aura verleiht. Am Ende ist seine
zentren bezeichnet, nach wie vor intakt sind. Der Verlust Philosophie jedoch – auch wenn sie sich Aphorismen
der Kontrollsysteme erklärt auch, warum sich in Maximes bedient, die vielleicht an Nietzsche erinnern mögen – nicht
Aussagen immer wieder falsche Wörter einschleichen, mit der großer Denker vergleichbar.
er das Ziel seiner Reden aus den Augen verliert und seine
Argumentation am Ende weder einem roten Faden folgt
QUELLEN
noch den Erwartungen seiner Gesprächspartner entspricht.
Gleichzeitig ist oft die Flexibilität beim Sprechen einge- Crosson, B.: Subcortical mechanisms in language: Lexical-
semantic mechanisms and thalamus. Brain and Cognition 40, 1999
schränkt: Bittet man einen Patienten, einen Satz mit zwei
vorgegebenen Wörtern zu bilden, etwa »Brot« und »Bäcker«, Verstichel, P.: Aphasie thalamique. Revue Neurologique 159, 2003
spektrum.de/artikel/1698588
Als Sam Bowman, Computerlinguist an der New York oder falsch ist, wobei der vorhergehende Satz das nötige
University, im Herbst 2017 die mageren Ergebnisse Hintergrundwissen liefert. Wenn Sie aus dem Satz »Prä
seiner eigenen Disziplin analysierte, trieb ihn vor allem sident Trump landete im Irak für einen sechstägigen Staats-
eine Erkenntnis um: Nicht nur waren die Rechner weit besuch« folgern können, dass der Satz »Präsident Trump
davon entfernt, einen geschriebenen Text annähernd so zu ist auf Auslandsbesuch« wahr ist, haben Sie soeben be
verstehen wie ein Mensch; was fehlte, war außerdem ein standen!
brauchbarer Test für ihre Fähigkeiten. Eine Methode, mit
der man unterschiedliche Ansätze vergleichen könnte – Abgeschlagener Durchschnittsmensch
eine Benchmark, wie der Fachmann sagt. Kurz darauf hatte Die Maschinen versagten reihenweise. Sogar nach allen
Bowman einen solchen Test entwickelt. Regeln der Kunst gebaute künstliche neuronale Netze
Im April 2018 veröffentlichte er gemeinsam mit Kolle- kamen mit 69 von 100 Punkten nicht über eine Vier plus in
gen von der University of Washington und DeepMind, Schulnoten hinaus. Das überraschte weder Bowman noch
Googles eigener KI-Forschungsfirma, einen Fachartikel, in seine Koautoren. Zwar hatten neuronale Netzwerke – lern-
dem sie neun Aufgaben vorstellten. Anhand dieser sollte fähige Programme, deren Funktionsweise sich vage an der
sich zeigen, ob ein Computer in der Lage ist, den Inhalt des Gehirns orientiert – schon bewiesen, dass sie für einige
eines Textes zu verstehen. GLUE (General Language Under- Aspekte der maschinellen Sprachverarbeitung durchaus
standing Evaluation, zu Deutsch etwa: B eurteilung des taugen. Doch das Maximum galt als erreicht. Die Netze, so
allgemeinen Sprachverständnisses) war so gestaltet, dass glaubten Experten damals, könnten einfach nichts Wesent-
er »ziemlich genau all das abfragte, was nach Meinung der liches über Sprache und Bedeutung lernen. Eine Annahme,
Forschergemeinde den Computer vor spannende Heraus die die schlechten GLUE-Ergebnisse noch einmal deutlich
forderungen stellt«, erklärt Bowman. Für Menschen seien unterstrichen.
die Aufgaben allesamt »gut machbar«. Beispielsweise Doch die Einschätzung sollte nicht lange Bestand haben.
verlangt eine Unteraufgabe anzugeben, ob ein Satz wahr Schon im Oktober 2018 stellte Google eine Methode vor,
die unter dem Namen BERT bekannt wurde, kurz für Bidi- Eine künstliche Intelligenz namens BERT revolutionierte die
rectional Encoder Representations from Transformers. Sein maschinelle Sprachverarbeitung. Um den Inhalt von Texten zu
GLUE-Score: 80,5. Gerade einmal sechs Monate existierte analysieren, muss sie gewaltige Datenmengen durcharbeiten.
der Test, da hatten sich die Maschinen auf eine Zwei minus
verbessert.
Die Fachwelt war baff, erzählt Bowman. »BERT kam
bei vielen Tasks auf Punktzahlen, bei denen wir dachten:
Besser geht das eigentlich gar nicht.« Mit einem Mal wurde AUF EINEN BLICK
es relevant zu wissen, wie gut eigentlich Menschen bei ECHTES VERSTÄNDNIS?
diesem Test abschneiden. Im Februar 2019 ergänzten
Bowman und ein Doktorand den GLUE-Test um die ent-
sprechenden Vergleichswerte. Und wieder dauerte es nur 1 Künstliche-Intelligenz-Forscher haben ein Programm
entwickelt, das Sätze lesen und Fragen dazu beant-
worten kann – und das anscheinend deutlich besser
wenige Monate, bis ein System, diesmal von Microsoft,
die Grenze überwand. Inzwischen ist der Durchschnitts- als der Mensch.
mensch abgeschlagen: Bei Redaktionsschluss rangierte er
mit Platz elf nicht einmal mehr unter den Top Ten der von
zahlreichen BERT-Systemen und ihren Varianten bevöl-
2 Dieses System mit dem Namen BERT setzt auf die
Technik neuronaler Netze und bündelt mehrere Durch-
brüche zu einem mächtigen Werkzeug.
kerten Bestenliste.
Aber lernen diese Systeme wirklich, unsere Sprache zu
verstehen? Oder werden sie einfach besser darin, unsere
Tests zu meistern – und sei es durch Tricks? Alternative
3 Doch Wissenschaftler sind skeptisch: Ist BERT wirklich
so gut, wie es scheint? Oder steckt hinter seinem
Erfolg vielleicht nur ein f auler Zauber?
Evaluationsverfahren zeichnen ein ganz anderes Bild von
den sprachverarbeitenden Computern, das viel eher an den
Das System braucht gehaltvolle Feintuning nutzt das System einfach sein bereits erworbe-
nes Sprachwissen, um die neue Aufgabe zu erledigen.
Regelbücher, die neben dem Wie das geht, machten seinerzeit die Forscher von
OpenAI vor. Im Juni 2018 ließen sie ihr Netz namens GPT
Vokabular auch Satzbau und einen ganzen Monat lang an fast einer Milliarde Wörtern
aus 11 038 digitalisierten Büchern lernen und dabei ein
Kontext berücksichtigen Sprachmodell entwickeln. Beim GLUE-Test ergatterte es mit
damals noch beachtlichen 72,8 Punkten direkt den Spitzen-
platz im Ranking.
Die Antwort der Computerlinguisten kam in Form eines Das war die Zeit, als Experten wie Sam Bowman noch
Vorgangs, den man als Pretraining bezeichnet. Damit dachten, dass jeder weitere Fortschritt lange auf sich
brachten sie ihre neuronalen Netze dazu, ihre eigenen warten lassen würde.
Regelbücher zu improvisieren. Und dann kam BERT.
Lange Zeit orientierten sich die Wissenschaftler dabei Aber was ist BERT eigentlich? Zunächst einmal ist es kein
am Aufbau eines Wörterbuchs. Bei einem einflussreichen fertiges neuronales Netz, das aus dem Stand heraus besser
Pretraining-Verfahren, dem so genannten »word embed- Sätze analysiert als ein Mensch. Stattdessen handelt es sich
ding«, lässt man ein neuronales Netz die Wörter einer um ein sehr detailliertes Rezept für das Vortraining eines
großen Textmenge so in Zahlenwerte umwandeln, dass neuronalen Netzes. Genau wie ein Bäcker einer präzisen An-
ähnliche Zahlenwerte auch für ähnliche inhaltliche Konzep- leitung folgt, um einen Tortenboden vorzubacken, den ein
ü
SPRACHSYNTHESE
DIE PERFEKTE
KÜNSTLICHE STIMME
Inzwischen kann eine Maschinenstimme die eines Menschen
täuschend echt imitieren.
spektrum.de/artikel/1485133
➤ Lungen und Luftröhre produzieren den Luftstrom, ➤ Der Resonanzkörper aus Kehlkopf, Rachenhöhle,
der die Stimmlippen in Schwingung versetzt. Nasenhöhle und Mundhöhle moduliert
Diese bestimmen die Frequenz der erzeugten Töne. die Amplituden der verschiedenen Obertöne.
Kehldeckel
(Epiglottis)
Stellknorpel
(Cartilagines arytenoideae) Nasenhöhle
VORNE HINTEN
Gaumenplatte
Musculus cricoarytenoideus
posterior Mundhöhle
(öffnet die Stimmritze)
Ringknorpel
(Cartilago cricoidea)
Rachen
Musculus cricoarytenoideus
lateralis
SPEKTRUM DER WISSENSCHAFT / EMDE-GRAFIK
Stimmlippen
1
klingenden künstlichen Stimmen ausgestattet, ausdrucks- it dem Computer lassen sich Tonaufnahmen
M
stark und personalisierbar, fähig, jeden beliebigen Text zu sprachlicher Äußerungen in kleine Einheiten zerlegen
sprechen. und zu neuen Äußerungen zusammensetzen.
Künftig wird es möglich sein, Menschen, die ihre eige-
ne Stimme verloren haben, einen Ersatz zu verschaffen
(siehe »Auf der Suche nach der verlorenen Sprache«, 2 abei können die Autoren die Klangfarbe der Stimme
D
so verändern, dass zum Beispiel aus einer Männer-
eine Frauenstimme wird.
S. 80), Simultanübersetzungen mit der eigenen Stimme
sprechen zu lassen (siehe »Der Dolmetscher in der Wes-
tentasche«, S. 79), die Stimme zu wechseln wie die Frisur
und im Alltag mit Robotern zu reden, deren Stimmen von
3 ie neuesten Verfahren arbeiten mit abstrakten Mo-
D
dellen der Sprache. Mit ihrer Hilfe kann man künst
liche Stimmen erschaffen, die von natürlichen kaum
menschlichen nicht zu unterscheiden sind. noch zu unterscheiden sind.
Wie entsteht die menschliche Stimme? Die Quelle des
Schalls sind die Stimmlippen im Kehlkopf, umgangs-
Stimmenverwandlung
Mit den hier beschriebenen Techniken lässt sich die Stimme eines Menschen in die einer berühmten Per-
sönlichkeit, eines jüngeren oder älteren Menschen verwandeln – oder auch in die eines Monsters. Im
folgenden Beispiel wird die Stimme von Alice in die von Bernard umgesetzt. In den Sprechblasen stehen die
senkrechten Balken für die Sprachmelodie, die Hintergrundfarbe für die Klangfarbe der Stimme.
Bernards Stimme wird über Eine Software analysiert den von Bernard Alle Phoneme werden mit
mehrere Stunden beim Sprechen von gesprochenen Text, identifiziert die Pho dem zugehörigen Klangfilter ab-
Texten aufgenommen. neme und ermittelt für jedes einzelne den gespeichert.
Klangfilter, der die Klangfarbe bestimmt.
SPEKTRUM DER WISSENSCHAFT / EMDE-GRAFIK, NACH: POUR LA SCIENCE DEZEMBER 2016
Alice spricht den Text, der später mit der In Alices Aufnahme werden sämtliche Der neu erzeugte Text erklingt
Stimme von Bernard ertönen soll. Da- Phoneme identifiziert und analysiert. mit der von Alice intonierten Sprach-
bei muss Alice Bernards Sprachmelodie Bei der folgenden Rekonstruktion wird melodie, aber mit der Klangfarbe
nachahmen. Eine perfekte Imitation der die Sprachmelodie beibehalten, jedoch von Bernard.
Klangfarbe ist grundsätzlich nicht möglich. der Klangfilter jedes Phonems durch
den von Bernard ersetzt.
Sprachsynthese
Systeme, die geschriebenen Text in gesprochenen verwandeln,
gibt es schon länger; aber bisher wirkten die synthetischen
Stimmen mechanisch und unnatürlich. Dank aktueller Fortschritte
klingen sie heute natürlich und ausdrucksstark.
Alices Stimme wird über mehrere Stunden Ein Algorithmus unterteilt den gespro Je umfangreicher die Datenbank,
aufgenommen, während sie chenen Text in Phoneme, Silben und desto natürlicher und ausdrucksvoller
vorgegebene Texte spricht. Wörter und analysiert die Sprachmelodie kann die neu geschaffene
und die Klangfarbe. Stimme klingen.
Der schriftliche Text (hier der Beginn einer Unter mehreren Versionen einer Sprach Ein Algorithmus glättet die Übergänge
Fabel von Jean de la Fontaine) wird einheit in Alices Stimmdatenbank wird zwischen den Einheiten und verwischt
analysiert und in eine Abfolge von Sprach diejenige ausgewählt, deren Klangfarbe und damit die Unzulänglichkeiten der
einheiten wie Phoneme, Silben und Sprachmelodie am besten zum Kontext synthetischen Stimme.
Wörter unterteilt. des entsprechenden Satzes passen.
gemachten oder dem Nachmacher? der Europäischen Union sowie ganz allgemein
das Internet eine reichhaltige Quelle. Entspre-
chend sind die Regeln weniger starr als im Lehr-
bildet man nicht Mittelwerte aus Phonemen, sondern aus buch, sondern folgen dem tatsächlichen Sprach-
den genannten Parametern. Und für die Parameter einer gebrauch.
echten Stimme braucht man nicht mehr mehrere Stunden Auch das Transkriptions- und das Sprachsyn-
an Tonaufnahmen; es genügen ein paar Minuten. thesemodul haben ihre Fähigkeiten an Beispielen,
Auf diesem Weg ist es bereits heute möglich, die Stim- insbesondere Audiobüchern, erlernt. Darüber
me einer Person, die ihre Sprechfähigkeit verloren hat, auf hinaus lernt das Transkriptionsmodul während der
Basis von wenigen Minuten Tonmaterial zu rekonstruieren Arbeit: Binnen weniger Sekunden passt es sich
(siehe »Auf der Suche nach der verlorenen Sprache«, dem eigenwilligen Akzent des Gesprächspartners
S. 80) oder einen Text, den ein Mensch in seiner Mutter- und dem Umgebungslärm an. Und das Sprach-
sprache spricht, quasi simultan mit derselben Stimme, synthesemodul hört seinem Benutzer zu und
aber in einer anderen Sprache wiederzugeben (siehe »Der spricht mit dessen Stimme in der fremden Spra-
Dolmetscher in der Westentasche«, rechts). che. Wir werden also künftig Japanisch – oder
So eindrucksvoll diese Fortschritte auch sein mögen, jede andere Sprache – sprechen, ohne sie je
noch sind die synthetischen Stimmen nicht perfekt, und gelernt zu haben.
für eine gute Qualität muss in jedem Einzelfall ein Mensch Pierre Lanchantin
in den Prozess eingreifen. Doch die Revolution im Bereich Machine Intelligence Laboratory,
der künstlichen Intelligenz, die enorme Lernfähigkeit University of Cambridge
»tiefer« neuronaler Netze (»Spektrum« September 2014,
S. 62) und die massiven Datenmengen, die zur Verfügung
stehen, dürften eine weitere Welle von Fortschritten mit da sonst die geringen verbleibenden Unterschiede Irrita
sich bringen. Wir hoffen, dass es in den nächsten Jahr- tionen oder sogar Abscheu erregen würden. Dasselbe
zehnten gelingt, synthetische Stimmen zu erzeugen, die Problem könnte uns nicht nur mit dem Anblick, sondern
von natürlichen nicht mehr zu unterscheiden sind, jede auch mit den sprachlichen Äußerungen der Roboter
beliebige Sprache sprechen und auf die jeweilige Person bevorstehen.
angepasst werden können.
Diese Fortschritte sind nicht unproblematisch. Sie wer-
fen grundlegende Fragen zur Rolle künstlicher Stimmen
und humanisierter Maschinen in unserer Gesellschaft auf. QUELLEN
Wem gehört eigentlich die synthetisch hergestellte Mullennix, J. W., Stern, S. E. (Hg.): Computer synthesized speech
Stimme, die nach dem Bilde einer echten erschaffen ist? technologies: Tools for aiding impairment. IGI Publishing, 2010
Dem Nachgeahmten? Dem Nutznießer? Den Forschern
Obin, N.: MeLos: Analysis and modeling of speech prosody
und Ingenieuren, die das technisch realisiert haben? Wie and speaking style. Dissertation, Ircam-UPMC, 2011
lässt sich die nachgemachte Stimme von der echten https://halshs.archives-ouvertes.fr/tel-00694687v2/document
unterscheiden? Wie kann ich sicher sein, dass es mein
Van den Oord, A. et al.: WaveNet: A generative model for raw
Freund ist, der mit mir telefoniert, wenn seine Stimme audio. Proceedings of Interspeech, 2016
gefälscht sein kann? https://deepmind.com/blog/wavenet-generative-model-raw-audio
Der japanische Robotikforscher Masahiro Mori hat Tokuda, K. et al.: Speech synthesis based on hidden Markov
schon 1970 in seinem Werk »The Uncanny Valley« davor models. IEEE Transactions on Audio, Speech, and Language
gewarnt, einen Roboter allzu menschenähnlich zu machen, Processing 101, 2013
spektrum.de/artikel/1461021
A
pple hat Siri, Microsoft kommt mit Cortana, wird besonders bereitwillig dem Begriffsfeld »Helfer«,
und bei Amazon versteht Alexa fast jeden »Pfleger«, »Assistent« zugewiesen, während »männlich«
Wunsch, den ein sprechender Plastikzylinder zu schnell mit »Leiter«, »Chef«, »Anführer« assoziiert wird.
erfüllen vermag: Die Auffassungsgabe dieser Hingegen zögern die meisten Probanden auffällig, bei
»intelligenten persönlichen Assistenten« ist wirklich ausländisch klingenden Eigennamen oder exotischen
verblüffend. Hinter der Suggestion, dass ich mich mit Ethnien an »angenehm« und »freundlich« zu denken.
einem Ding unterhalte wie mit einem grenzenlos Caliskan und Bryson entwickelten nun einen Algo
diensteifrigen Menschen, stecken Jahrzehnte millio rithmus namens WEAT (Word-Embedding Association
nenschwerer Entwicklungsarbeit für künstliche Intelli Test). Er spürt in einem aus dem Internet entnomme
genz (KI) und maschinelles Lernen. nen Fundus von 2,2 Millionen englischen Worten mit
Die automatisierte Sprachkompetenz der fort KI-Methoden statistische Begriffszusammenhänge
schrittlichsten KI-Programme lässt sich aber nicht bloß auf. Dabei treten dieselben Stereotype zu Tage wie im
nutzen, um Kunden zu befriedigen, sondern auch, um IAT; beispielsweise korreliert der rassisch gemeinte
Forschern sozialpsychologische Erkenntnisse über Begriff »weiß« deutlich stärker mit »angenehm« als der
Mensch und Maschine zu verschaffen. Die Computer Begriff »schwarz«.
wissenschaftlerinnen Aylin Caliskan von der Princeton
D
University in New Jersey (USA) und Joanna J. Bryson er IAT-Schöpfer Greenwald begrüßt den WEAT
von der University of Bath in England sind der Frage als willkommene Erweiterung seines Assozia
nachgegangen, inwieweit eine lernfähige Sprachsoft tionstests. Man könnte damit ohne große Perso
ware automatisch die unter Menschen verbreiteten nentests historische Veränderungen verfolgen
vorgefassten Meinungen reproduziert (Science 356, und etwa den mutmaßlichen Trend belegen, dass die
S. 183–186, 2017). Vorurteile gegen Schwule und Lesben vielerorts mit
der Zeit abnehmen (Science 356, S. 133 –134, 2017).
Aus alldem folgt aber auch: Die künstliche Kommu
Künstliche Kommunikation läuft nikation – ob mit dem Internet oder zwischen Mensch
und Maschine – läuft nicht »politisch korrekter« ab als
nicht »politisch korrekter« der sonstige Sprachverkehr. Die Unterhaltung mit
VORSCHAU
DIE GROSSEN ETHISCHEN FRAGEN THEMEN SIND UNTER ANDEREM:
Forschung und Wissenschaft dienen allein dem Wohl der Mensch-
heit – so lautet das Kredo der modernen Naturwissenschaft und MARIONETTEN
Medizin. Doch stimmt das überhaupt? Auch Wissenschaftler sind
DER INDUSTRIE
fehlbare Menschen. Manchmal erliegen sie den Verlockungen
aus Industrie und Wirtschaft – und manchmal wird der Vorwurf Forscher, die von Pharmaunterneh-
laut, ihr Forscherdrang schade mehr, als er nutze. men bezahlt werden, kommen in ihren
Studien oft zu anderen Ergebnissen
als unabhängige Wissenschaftler. Wie
lässt sich die Einflussnahme in der
Biomedizin eindämmen? Zunächst gilt
es, Interessenkonflikte rückhaltlos
offenzulegen.
GRÜNE
GENTECHNIK
Seit Jahrzehnten verändern Genetiker
das Erbgut von Pflanzen mit mole-
kularbiologischen Verfahren, um etwa
herbizidresistente, trockentolerante
oder ertragreichere Kulturgewächse
zu schaffen. Die Nachfrage danach
steigt – doch in Deutschland bleibt die
Grüne Gentechnik umstritten.
MENSCHENRECHTE
FÜR TIERE?
Haben Tiere ein Recht auf Freiheit und
Unversehrtheit? Nein – die aktuellen
Tierschutzgesetze genügen und
müssen nur konsequent angewandt
werden, sagen die einen. Andere
halten dagegen: Tierrechte sollten
D-KEINE / GETTY IMAGES / ISTOCK (SYMBOLBILD MIT FOTOMODELL); BEARBEITUNG: SPEKTRUM DER WISSENSCHAFT
NEWSLETTER
Möchten Sie über Themen und Autoren
jedes neuen Hefts informiert sein?
Wir halten Sie gern auf dem Laufenden:
per E-Mail – und natürlich kostenlos.
Registrierung unter:
spektrum.de/newsletter
Jetzt abonnieren!
WAHLWEISE
als Print-,
Digital- oder
Kombiabo
ü
THEMEN AUF DEN PUNKT GEBRACHT
Ob A wie Astronomie oder Z wie Zellbiologie: Unsere Spektrum KOMPAKT-Digitalpublikationen stellen Ihnen alle
wichtigen Fakten zu ausgesuchten Themen als PDF-Download zur Verfügung – schnell, verständlich und informativ!
Ausgewählte Spektrum KOMPAKT gibt es auch im Printformat!
€ 4,99
je digitale
Ausgabe
UNSPLASH / SAMUEL ZELLER (HTTPS://UNSPLASH.COM/PHOTOS/WATWFK3WSWM) /
CC0 (HTTPS://CREATIVECOMMONS.ORG/PUBLICDOMAIN/ZERO/1.0/LEGALCODE