Sie sind auf Seite 1von 278

Wolfgang Schwarz

Problemlösen in
der Mathematik
Ein heuristischer Werkzeugkasten
Problemlösen in der Mathematik
Wolfgang Schwarz

Problemlösen
in der Mathematik
Ein heuristischer Werkzeugkasten
Wolfgang Schwarz
Fakultät 4 / Mathematik
Bergische Universität Wuppertal
Wuppertal, Deutschland

ISBN 978-3-662-56761-6 ISBN 978-3-662-56762-3 (eBook)


https://doi.org/10.1007/978-3-662-56762-3

Die Deutsche Nationalbibliothek verzeichnet diese Publikation in der Deutschen Nationalbibliografie;


detaillierte bibliografische Daten sind im Internet über http://dnb.d-nb.de abrufbar.

Springer Spektrum
© Springer-Verlag GmbH Deutschland, ein Teil von Springer Nature 2018
Das Werk einschließlich aller seiner Teile ist urheberrechtlich geschützt. Jede Verwertung, die nicht
ausdrücklich vom Urheberrechtsgesetz zugelassen ist, bedarf der vorherigen Zustimmung des Verlags.
Das gilt insbesondere für Vervielfältigungen, Bearbeitungen, Übersetzungen, Mikroverfilmungen und
die Einspeicherung und Verarbeitung in elektronischen Systemen.
Die Wiedergabe von Gebrauchsnamen, Handelsnamen, Warenbezeichnungen usw. in diesem Werk be-
rechtigt auch ohne besondere Kennzeichnung nicht zu der Annahme, dass solche Namen im Sinne der
Warenzeichen- und Markenschutz-Gesetzgebung als frei zu betrachten wären und daher von jedermann
benutzt werden dürften.
Der Verlag, die Autoren und die Herausgeber gehen davon aus, dass die Angaben und Informationen in
diesem Werk zum Zeitpunkt der Veröffentlichung vollständig und korrekt sind. Weder der Verlag noch
die Autoren oder die Herausgeber übernehmen, ausdrücklich oder implizit, Gewähr für den Inhalt des
Werkes, etwaige Fehler oder Äußerungen. Der Verlag bleibt im Hinblick auf geografische Zuordnungen
und Gebietsbezeichnungen in veröffentlichten Karten und Institutionsadressen neutral.

Verantwortlich im Verlag: Andreas Rüdinger

Gedruckt auf säurefreiem und chlorfrei gebleichtem Papier

Springer Spektrum ist ein Imprint der eingetragenen Gesellschaft Springer-Verlag GmbH, DE und ist
ein Teil von Springer Nature.
Die Anschrift der Gesellschaft ist: Heidelberger Platz 3, 14197 Berlin, Germany
Vorwort

Das griechische Verb heuriskein (deutsch: finden, entdecken) liefert den Wortstamm
für die Bezeichnung einer Wissenschaft, die der Mathematikdidaktiker H EINRICH
W INTER als die Kunde „vom Gewinnen, Finden, Entdecken, Entwickeln neuen
Wissens und vom methodischen Lösen von Problemen (. . . )“ charakterisiert hat:
die Heuristik.
Heuristik ist keineswegs auf die Gewinnung neuer Erkenntnisse in der Mathe-
matik beschränkt; dennoch zeigt das Werk großer Mathematiker von der Antike
bis zur Neuzeit1 , dass die Heuristik gerade in der Mathematik schon immer eine
zentrale Rolle eingenommen hat. Heuristik ist ein wesentlicher Bestandteil mathe-
matischer Erkenntnisprozesse, ob es nun darum geht, potenzielle mathematische
Zusammenhänge zu entdecken oder Begründungen für vermutete Zusammenhänge
zu finden.
In der Mathematikdidaktik besteht Konsens darüber, dass Lernende in Schule
und Hochschule in der aktiven Auseinandersetzung mit Problemlöse- und Problem-
findungsprozessen die Mathematik nicht als „Fertigprodukt“, sondern als kreativen
Prozess erfahren sollen; folglich müssen sie über gesichertes strategisches Wissen
– ein Instrumentarium heuristischer Strategien – verfügen, das sie in Problemlöse-
prozessen flexibel und methodenkompetent einsetzen können.
Dies macht deutlich, dass insbesondere zukünftige Lehrerinnen und Lehrer des
Fachs Mathematik in ihrer universitären Ausbildung heuristische Kompetenzen er-
werben müssen: nicht nur, um durch systematischen Rückgriff auf Heurismen und
die Reflexion heuristischer Strategien beim problemgesteuerten Aufbau fachmathe-
matischen Wissens nachhaltig zu lernen (dies ist für alle Studierenden mathemati-
scher Fachrichtungen von Bedeutung), sondern auch, um später ihre Schülerinnen
und Schüler beim Erwerb heuristischer Kompetenzen adäquat unterstützen zu kön-
nen.
Fraglich ist aber, ob sich allein durch wiederholte Anwendung bestimmter Me-
thoden beim Lösen von Übungsaufgaben, wie sie traditionell wöchentlich zu den
einzelnen Fachvorlesungen gestellt werden, im Bereich des Problemlösens län-

1
Exemplarisch seien A RCHIMEDES , D ESCARTES , L EIBNIZ , B OLZANO genannt.

V
VI Vorwort

gerfristig eine elaborierte Methodenkompetenz herausbilden kann. Für den erfolg-


reichen Einsatz strategischen Wissens im Bereich des Problemlösens ist letztlich
metakognitives Wissen über Heurismen unabdingbar; ausschließlich Metastrategi-
en („Kontrollstrategien“) ermöglichen das Management der heuristischen Struktur,
indem sie Hinweise darauf geben, wann welche Strategie Erfolg versprechend ein-
zusetzen sein könnte.
Angesichts der Tatsache, dass die strukturierte Darstellung einer Thematik deren
Reflexion auf der Metaebene enorm erleichtert, muss eine fachmethodische Syste-
matik heuristischer Strategien, die nach strukturellen oder prozessualen Aspekten
kategorisiert sind, vermittelt werden. Entsprechende Ansätze mit Fokus auf dem
schulischen Bereich wurden zum Beispiel von R EGINA B RUDER und C HRISTINA
C OLLET (2011) vorgestellt; ganz aktuell ist eine sekundarschulorientierte Katego-
risierung von Heurismen, die meine Doktorandinnen K ATHARINA K RICHEL und
DANIELA S TILLER im Rahmen ihrer Dissertationsprojekte (2017) erarbeitet haben.
Das vorliegende Buch richtet sich jedoch gezielt an universitäre Lerner und Leh-
rende, sowohl hinsichtlich der fachsprachlichen Präzision, als auch im Hinblick auf
die Auswahl der konkretisierenden Kontexte.
Vorgenommen wird hier eine dreigliedrige Umstrukturierung des viergliedrigen
konzeptionellen Rahmens von Heurismenklassen nach A LFRED S CHREIBER, der
ebenfalls primär universitär ausgerichtet ist. An mehr als 70 Beispielen aus der
Diskreten Mathematik, der Arithmetik, der Zahlentheorie, der Stochastik, der Geo-
metrie, der Linearen Algebra, der Reellen Analysis und der Komplexen Analysis,
der Kombinatorik und der Mathematikgeschichte wird im vorliegenden Buch ei-
ne umfangreiche Auswahl heuristischer Vorgehensweisen erläutert, die strukturell
systematisiert und nach Möglichkeit prozessual den verschiedenen Phasen des Pro-
blemlöseprozesses nach P ÓLYA zugeordnet werden.
Die Beispiele entstammen (solange nicht im Einzelfall explizit anders vermerkt)
meiner eigenen mathematischen Arbeit2 und wurden mit verschiedenen Zielsetzun-
gen entwickelt:
Alle erfüllen die Funktion der Illustration der einzelnen Heurismen und ihrer
fachsystematischen Einordnung, einige können in universitären Lehrveranstaltun-
gen zur Heuristik des Problemlösens als Fundgrube zum Methodentraining die-
nen oder bieten Ansatzpunkte für eigene mathematische Forschungstätigkeiten in
Projektseminaren, einzelne Beispiele geben interessante Einblicke in mathematik-
geschichtliche Zusammenhänge, und manchen können erste Hinweise entnommen
werden, in welcher Weise man als Lehrender des Fachs Mathematik eine heuristi-
sche Rekonstruktion diverser Gebiete der einführenden Hochschullehre in Angriff
nehmen könnte, um die heuristische Methodenkompetenz der Studierenden me-
takognitiv herauszubilden und so ihre mathematische Problemlösekompetenz zu
fördern.
Vor diesem Hintergrund wird verständlich, dass die in den Beispielen behandel-
ten mathematischen Inhalte eine große Bandbreite unterschiedlicher Anforderungs-

2
Es handelt sich größtenteils um Überarbeitungen von Inhalten meiner Habilitationsschrift aus
dem Jahr 2004.
Vorwort VII

niveaus abbilden. Außerdem muss festgestellt werden, dass in den meisten Fällen
Mischformen heuristischer Strategien bei der Bearbeitung mathematischer Proble-
me eingesetzt werden; darüber hinaus weisen manche Heurismen so mannigfaltige
Verflechtungen mit anderen heuristischen Strategien auf, dass man sie durchaus
auch anders als im Folgenden beschrieben hätte eingruppieren können.
Noch eine Anmerkung zum Layout: Im Text finden sich vereinzelt Hinweise auf
Farbgebungen einzelner Abbildungsteile, die sich im Schwarz-Weiß-Druck nicht
weiter verfolgen lassen. Prinzipiell liegen aber alle Abbildungen farbig vor, so dass
man beim Download des Buchs als eBook davon profitieren kann, wenn diese Hin-
weise beibehalten werden.

Wuppertal, Deutschland Wolfgang Schwarz


Dezember 2017
Inhaltsverzeichnis

1 Heurismen der Variation . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1


1.1 Variation der Darstellung (Interpretation) . . . . . . . . . . . . . . . . 3
1.1.1 Systemwechsel zwischen Umgangssprache und formaler
Sprache mit ikonischen Elementen . . . . . . . . . . . . . . . 4
1.1.2 Systemwechsel zwischen Geometrie und Algebra . . . . . . 9
1.1.3 Systemwechsel zwischen verschiedenen mathematischen
Disziplinen und Linearer Algebra . . . . . . . . . . . . . . . . 21
1.1.4 Quintessenz für Problemlöser . . . . . . . . . . . . . . . . . . 31
1.2 Variation der Problemstellung . . . . . . . . . . . . . . . . . . . . . . . 33
1.2.1 Umformulierung und Analogiebildung . . . . . . . . . . . . . 33
1.2.2 Variation der Wahrnehmung durch Reorganisation . . . . . 38
1.2.3 Invarianzprinzip und Symmetrieprinzip . . . . . . . . . . . . 45
1.2.4 Generalisierung, Spezialisierung, Extremalprinzip . . . . . . 83
1.2.5 Sonderformen in der enumerativen Kombinatorik . . . . . . 109
1.2.6 Quintessenz für Problemlöser . . . . . . . . . . . . . . . . . . 143
2 Heurismen der Induktion . . . . . . . . . . . . . . . . . . . . . . . . . . . . 149
2.1 Heurismen der unvollendeten Induktion . . . . . . . . . . . . . . . . . 151
2.1.1 Systematisches Probieren und Suche nach Mustern . . . . . 151
2.1.2 Vorwärtsarbeiten . . . . . . . . . . . . . . . . . . . . . . . . . . 166
2.1.3 Lokale und globale Approximation . . . . . . . . . . . . . . . 174
2.1.4 Quintessenz für Problemlöser . . . . . . . . . . . . . . . . . . 195
2.2 Vollendete Induktion . . . . . . . . . . . . . . . . . . . . . . . . . . . . 197
3 Heurismen der Reduktion . . . . . . . . . . . . . . . . . . . . . . . . . . . 207
3.1 La Descente Infinie – der unendliche Abstieg . . . . . . . . . . . . . 208
3.2 Rückwärtsarbeiten und Pappos-Prinzip . . . . . . . . . . . . . . . . . 219
3.3 Modularisierung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 236
3.4 Quintessenz für Problemlöser . . . . . . . . . . . . . . . . . . . . . . . 258
Personenverzeichnis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 263
Sachverzeichnis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 265
IX
Beispielverzeichnis

Beispiel 1.1 Königsberger-Brücken-Problem; E ULER . . . . . . . . . . . . . . . 4


Beispiel 1.2 Fährmann-Problem; mathematische Folklore . . . . . . . . . . . . 6
Beispiel 1.3 Who-is-who der Haustiere . . . . . . . . . . . . . . . . . . . . . . . . 6
Beispiel 1.4 Sechs-Stäbe-Problem . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
Beispiel 1.5 Vergleich von Mittelwerten . . . . . . . . . . . . . . . . . . . . . . . 9
Beispiel 1.6 Optimierungsproblem . . . . . . . . . . . . . . . . . . . . . . . . . . 14
Beispiel 1.7 Pythagoras vektoriell . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
Beispiel 1.8 Regressionsgerade . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
Beispiel 1.9 Glücksrad-Design . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
Beispiel 1.10 Politik und Gewissen . . . . . . . . . . . . . . . . . . . . . . . . . . 27
Beispiel 1.11 Aufzugbekanntschaften . . . . . . . . . . . . . . . . . . . . . . . . . 35
Beispiel 1.12 Neun-Punkte-Problem; W ERTHEIMER . . . . . . . . . . . . . . . 44
Beispiel 1.13 Saft im Sekt / Sekt im Saft . . . . . . . . . . . . . . . . . . . . . . . 47
Beispiel 1.14 Weißwein-Rotwein-Problem; Folklore . . . . . . . . . . . . . . . 47
Beispiel 1.15 Wärmeaustausch . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
Beispiel 1.16 Im Bann des geometrischen Mittels . . . . . . . . . . . . . . . . . 49
Beispiel 1.17 Das Partygast-Problem; Folklore . . . . . . . . . . . . . . . . . . . 51
Beispiel 1.18 Der Schüsselkreis . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
Beispiel 1.19 Was bin ich? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54
Beispiel 1.20 Schwerpunkt im Dreieck . . . . . . . . . . . . . . . . . . . . . . . . 60
Beispiel 1.21 Dem Dreieck einbeschriebenes Quadrat . . . . . . . . . . . . . . . 61
Beispiel 1.22 Sanierung der Landesfinanzen . . . . . . . . . . . . . . . . . . . . . 63
Beispiel 1.23 Parallelogramm-Sektoren . . . . . . . . . . . . . . . . . . . . . . . 67
Beispiel 1.24 Zahlenzauber . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69
Beispiel 1.25 Geometrische Reihe und Verteilen von Größen . . . . . . . . . . 71
Beispiel 1.26 Münzspiel 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73
Beispiel 1.27 Münzspiel 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73
Beispiel 1.28 Brückenspiel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74
Beispiel 1.29 Hex . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76
Beispiel 1.30 Oktaederhalbierung . . . . . . . . . . . . . . . . . . . . . . . . . . . 83
Beispiel 1.31 Konvergenzintervalle von Taylorreihen . . . . . . . . . . . . . . . 84

XI
XII Beispielverzeichnis

Beispiel 1.32 Darf es etwas mehr sein? . . . . . . . . . . . . . . . . . . . . . . . . 86


Beispiel 1.33 Pythagoras griechisch-klassisch . . . . . . . . . . . . . . . . . . . . 92
Beispiel 1.34 Gleichseitiges Dreieck mit Hindernissen . . . . . . . . . . . . . . 95
Beispiel 1.35 E UKLIDs Parallelogramm . . . . . . . . . . . . . . . . . . . . . . . 97
Beispiel 1.36 Grand-Slam-Tennis . . . . . . . . . . . . . . . . . . . . . . . . . . . 98
Beispiel 1.37 S YLVESTER-Problem . . . . . . . . . . . . . . . . . . . . . . . . . . 101
Beispiel 1.38 Der Satz von S TEINER und L EHMUS . . . . . . . . . . . . . . . . 105
Beispiel 1.39 Poker . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 114
Beispiel 1.40 Eulersche '-Funktion . . . . . . . . . . . . . . . . . . . . . . . . . . 122
Beispiel 1.41 Le probleme des rencontres; M ONTMORT . . . . . . . . . . . . . 124
Beispiel 1.42 Surjektionen einer m-Menge auf eine r-Menge . . . . . . . . . . 126
Beispiel 1.43 Domino-Steine . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 129
Beispiel 1.44 Mittlere Teileranzahl der ersten n natürlichen Zahlen . . . . . . 130
Beispiel 1.45 Summenformeln für m-te Potenzen . . . . . . . . . . . . . . . . . 132
Beispiel 1.46 Menschen im Hotel . . . . . . . . . . . . . . . . . . . . . . . . . . . 137
Beispiel 1.47 Fünf Punkte müssen’s sein . . . . . . . . . . . . . . . . . . . . . . . 138
Beispiel 1.48 Teiler gibt es immer wieder . . . . . . . . . . . . . . . . . . . . . . 139
Beispiel 1.49 Neues von der Märchenzahl . . . . . . . . . . . . . . . . . . . . . . 139
Beispiel 1.50 Punkte im Einheitsquadrat . . . . . . . . . . . . . . . . . . . . . . . 140
Beispiel 1.51 Monotonie im „Happy Ending“ . . . . . . . . . . . . . . . . . . . . 141
Beispiel 1.52 Polynomiale Merkwürdigkeiten . . . . . . . . . . . . . . . . . . . . 143
Beispiel 2.1 Loreley-Muster . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 155
Beispiel 2.2 Lotto-Designs I – Hill Climbing . . . . . . . . . . . . . . . . . . . . 170
Beispiel 2.3 Stetige Verzinsung – B ERNOULLIs Traum vom Reichtum . . . . 176
Beispiel 2.4 Quadratur der Parabel nach A RCHIMEDES . . . . . . . . . . . . . . 181
Beispiel 2.5 Das „momentane“ Verschwinden stetiger Funktionen . . . . . . . 186
Beispiel 2.6 C AUCHYscher Integralsatz für Rechtecke nach G OURSAT . . . . 190
Beispiel 2.7 Vollparadoxe Induktion – PIN-Codes . . . . . . . . . . . . . . . . . 201
Beispiel 2.8 Binomialkoeffizienten einmal anders . . . . . . . . . . . . . . . . . 203
Beispiel 3.1 Infiniter Abstieg: Inkommensurabilität im p Pentagon . . . . . . . . 209
Beispiel 3.2 Descente Infinie und die Irrationalität von n . . . . . . . . . . . 213
Beispiel 3.3 Descente Infinie und die P ELLsche Gleichung . . . . . . . . . . . 213
Beispiel 3.4 Descente Infinie und pythagoräische Dreiecke . . . . . . . . . . . 217
Beispiel 3.5 Umfüllversuche . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 219
Beispiel 3.6 Sehnenvierecke – PAPPOS-Prinzip . . . . . . . . . . . . . . . . . . . 225
Beispiel 3.7 Lotto-Designs II – Rückwärtsarbeiten . . . . . . . . . . . . . . . . . 227
Beispiel 3.8 S TEINER und L EHMUS II – Analysis-Synthesis-Prozedur . . . . 230
Beispiel 3.9 Divide and Conquer – Aus eins mach’ zwölf . . . . . . . . . . . . 237
Beispiel 3.10 Ziffernspiele . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 239
Beispiel 3.11 Lotto-Designs III – Modularisierung . . . . . . . . . . . . . . . . . 246
Heurismen der Variation
1

Inhaltsverzeichnis
1.1 Variation der Darstellung (Interpretation) . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.2 Variation der Problemstellung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33

Gegeben sei eine nicht-offene Problemstellung, d. h., es liegt eine Situation vor, in
der ein Ausgangszustand und ein Zielzustand beschrieben sind. Eine Lösung des
Problems besteht dann darin, ein Instrumentarium von Transformationen bereit zu
stellen, mit deren Hilfe der Ausgangszustand in den Zielzustand überführt werden
kann, und diese Wandlung damit durchzuführen.
Diese Sicht der Dinge ist einfach, aber für unsere Zwecke präzise genug. In der
Literatur wird zur Abgrenzung von „Problemen“ gegen „Aufgaben“ oft noch hin-
terfragt, ob der Person des Problemlösers ein System von Transformationen, die den
Ausgangszustand in den Zielzustand überführen, prinzipiell bekannt ist oder ob der
Einsatz strategischen Wissens zur Lösung des Problems erforderlich ist: im ersten
Fall ist die Rede von „Aufgaben“, im zweiten Fall spricht man von „Problemen“.
Ein passendes Begriffssystem zur präziseren Beschreibung des Phänomens lie-
fert die Kognitionspsychologie, in der Denkprozesse als Informationsverarbeitungs-
prozesse interpretiert werden. Die kognitive (also auf Denken und Erkennen ge-
richtete) Struktur eines menschlichen Individuums wird von D IETRICH D ÖRNER
als zweigeteilt, in eine epistemische und eine heuristische Struktur, angenommen.
Die epistemische Struktur trägt vereinfacht gesehen den Aufbau eines semantischen
Netzes, dessen Knoten im einfachsten Fall den Objekten eines Realbereichs und
dessen Kanten Beziehungen zwischen diesen Objekten entsprechen. Das semanti-
sche Wissensnetz über einen Realbereich ist individuell unterschiedlich groß, und
es ist zeitlichen Veränderungen durch Lernen und Vergessen unterworfen. Was die
allzu anschauliche Vorstellung von einem Netz übersteigt, ist die Tatsache, dass es
Begriffshierarchien und Stufen der Abstraktion gibt. Gerade für das Mathematik-
lernen ist es typisch, dass das, was auf einer früheren Lernstufe als Beziehungen
zwischen Dingen memoriert wurde, später selbst zu Dingen wird, zwischen denen
dann erneut Beziehungen gesucht werden.

© Springer-Verlag GmbH Deutschland, ein Teil von Springer Nature 2018 1


W. Schwarz, Problemlösen in der Mathematik, https://doi.org/10.1007/978-3-662-56762-3_1
2 1 Heurismen der Variation

Über der epistemischen ist als Metastruktur die heuristische Struktur angeordnet.
Deren Aktivität bezieht sich nicht direkt auf einen außersubjektiven Realbereich,
sondern darauf, wie vom Subjekt das Wissen über einen Realbereich im weites-
ten Sinne organisiert, konkret: gewonnen, umgeformt, intersubjektiv verknüpft,
angewandt, bewertet, . . . werden kann. Die heuristische Struktur besitzt die Fähig-
keit, Knoten des Wissensnetzes neu mit anderen zu verbinden oder gar neue Teile
einzufügen; ihr wesentlicher Inhalt sind Heurismen (heuristische Strategien), also
Handlungsprogramme, deren Aktivierung in Problemlöseprozessen weiter helfen
kann. Mit ihnen kann man zwar keine Lösung erzwingen (dann läge eine Routi-
neaufgabe vor), jedoch einen weiterführenden Einfall, eine erhellende Entdeckung
wahrscheinlicher machen. Der Einsatz von Heurismen kann bei der Überwindung
der Barriere1 helfen, der sich der Problemlöser im Versuch, den Ausgangszustand
in den Zielzustand zu überführen, gegenüber sieht; Problem und Problemlösung
werden dann von der Art der Barriere beeinflusst.
Angesichts der Tatsache, dass es grundsätzlich ohnehin unmöglich ist, zwischen
Aufgaben und Problemen zu unterscheiden, ohne über exakte Kenntnisse der Werk-
zeuge zu verfügen, die dem Problemlöser individuell zur Verfügung stehen (sub-
jektiver Problemcharakter), möchte ich der Einfachheit halber in der Tradition des
Altmeisters G EORG P ÓLYA (1887–1985) beide Begriffe synonym verwenden; so
ist es auch im englischsprachigen Raum („problem“) üblich.
Offensichtlich sollte jeder Problemlöseprozess mit der Analyse von Ausgangszu-
stand und Zielzustand beginnen; dies entspricht der ersten Phase und der Vorberei-
tung der zweiten Phase in P ÓLYAs berühmter Phasierung des Problemlöseprozes-
ses:

Problemlösephasen nach Pólya

I. Verstehen der Aufgabe


II. Ausdenken eines Plans
III. Ausführen des Plans
IV. Rückschau

Empirische Studien lassen vermuten, dass es Studienanfängern in den seltens-


ten Fällen gelingt, die einer Problemstellung unterliegenden „deep structures“ zu
erkennen. Ihre Problemwahrnehmung orientiert sich häufig an „surface structu-
res“, welche keine entscheidenden Hinweise für den Lösungsprozess liefern. Diese
„oberflächliche“, mangels mathematischer Erfahrung aber nachvollziehbare Pro-
blemwahrnehmung benachteiligt Novizen gegenüber Experten in ihrem Problem-
löseverhalten und kann nur sehr langfristig abgebaut werden.
Eine naheliegende heuristische Strategie zur Verbesserung der Problemwahrneh-
mung (und damit zur effizienteren Analyse von Ausgangszustand und Endzustand)

1
Dieser Begriff wurde von D ÖRNER eingeführt.
1.1 Variation der Darstellung (Interpretation) 3

ist offenbar die, das Problem in möglichst vielen verschiedenen Repräsentations-


systemen darzustellen – dies ist der Heurismus der Variation der Darstellung (In-
terpretation).

1.1 Variation der Darstellung (Interpretation)

Im 20. Jahrhundert gewannen Richtungen der Psychologie, welche den Wert von
Veranschaulichung für das menschliche Denken betonten, Einfluss auf die Didaktik;
zu nennen wären hier in erster Linie die Gestaltpsychologie M AX W ERTHEIMERs
und deren Weiterentwicklung durch J EROME S. B RUNER.
Auf B RUNER geht die Unterscheidung dreier Repräsentationsmodi zurück, was
heute in der Mathematikdidaktik als das E–I–S-Schema bekannt ist:

Repräsentationsmodi nach Bruner (E–I–S-Schema)

 Enaktive Form der Darstellung (Darstellung durch eine Handlung)


 Ikonische Form der Darstellung (Darstellung durch bildliche Mittel)
 Symbolische Form der Darstellung (Darstellung durch Sprache und Zei-
chen)

Grundschulkinder lernen im mathematischen Anfangsunterricht einfache Additi-


onssätze des Kleinen Eins-plus-Eins sowohl handelnd (z. B. beim Legen von Re-
chenplättchen) als auch bildhaft (z. B. durch ikonische Darstellungen von Vereini-
gungsmengenbildung) als auch symbolisch (z. B. durch Notation in der formalen
Sprache der Mathematik) kennen; dies kann als Hinweis auf heuristische Techni-
ken im Sinne der Variation der Darstellung verstanden werden, die darin bestehen,
die Beschreibung eines (in der Regel symbolisch) gegebenen Problems in einem
anderen Repräsentationsmodus zu realisieren, wie zum Beispiel

 Anfertigen einer Zeichnung,


 Konstruktion eines physischen Modells oder
 mechanische Veranschaulichung.

Im Anfertigen einer Zeichnung muss aber nicht unbedingt eine Repräsentation auf
ikonischer Ebene liegen: In der Mathematik kann es sich dabei auch um eine sym-
bolische Form der Darstellung handeln, was damit zu tun hat, dass in den einzelnen
mathematischen Teilgebieten mehrere formale Sprachen nebeneinander existieren,
wenn man unter „formaler Sprache“ die Bildung von Reihen von Zeichen nach
wohlbestimmten syntaktischen und semantischen Regeln versteht.
Innermathematisch liegt die Kraft der Variation der Darstellung im Wechsel
verschiedener symbolischer Darstellungsformen („Transformationsprinzip“), wo-
bei manche symbolischen Darstellungen in der Mathematik (Geometrie, Graphen-
4 1 Heurismen der Variation

theorie) zusätzlich ikonischen Charakter haben, was sie für Klärungen von Problem-
situationen besonders leistungsfähig macht. Dies soll nun an einigen Beispielen
demonstriert werden.

1.1.1 Systemwechsel zwischen Umgangssprache und formaler


Sprache mit ikonischen Elementen

Das wesentliche Element der Formulierung eines verbal gegebenen Problems in der
formalen Sprache eines Teilgebiets der Mathematik („Mathematisierung“) besteht
im damit verbundenen Prozess der Abstraktion: Durch das „Absehen von unwe-
sentlichen Dingen“ wird die Problemsituation überschaubarer und damit leichter zu
lösen. Wir beginnen mit einem Klassiker aus dem 18. Jahrhundert, der interessante
Konsequenzen für die Entwicklung der Mathematik hatte.

Beispiel 1.1 (Königsberger-Brücken-Problem; E ULER)


Abb. 1.1 zeigt einen Stadtplan von Königsberg zu Beginn des 18. Jahrhunderts.
Die beiden Arme des Flusses Pregel, über den insgesamt sieben Brücken2 führen,
umfließen eine Insel (den „Kneiphof“). Ist es möglich, einen Rundgang durch das
damalige Königsberg zu machen und dabei jede Brücke genau einmal zu benutzen?

Abb. 1.1 Königsberg um 1730

2
Im Gegenuhrzeigersinn sind dies von links unten die Grüne Brücke, die Köttel-Brücke, die Hohe
Brücke, die Honig-Brücke, die Holz-Brücke, die Schmiede-Brücke und die Krämer-Brücke.
1.1 Variation der Darstellung (Interpretation) 5

L EONHARD E ULER (1707–1783) löste dieses Problem im Jahre 1736; seine


Arbeit wurde 1741 in den Commentarii der Petersburger Akademie der Wissen-
schaften publiziert und begründete einen modernen Zweig der Mathematik, die
Graphentheorie.
Die Reduzierung des Stadtplans auf das für die gestellte Frage Wesentliche ent-
hält in der Sprache der Graphentheorie nur noch Ecken und Kanten, nämlich die
Stadtgebiete Süden (S), Insel (I), Norden (N) und Osten (O) von Königsberg als
Ecken und jede der sieben Brücken zwischen je zwei Stadtgebieten als Kante, die
die betreffenden Ecken miteinander verbindet.

Abb. 1.2 Abstraktion: Graph zum Brückenproblem

In der Sprache der Graphentheorie besteht das Problem darin zu entscheiden, ob


der zusammenhängende Graph in Abb. 1.2 unikursal ist. Für denjenigen, der über
entsprechendes deklaratives Wissen aus dem Bereich der Graphentheorie verfügt,
ist das Problem allein durch die Übersetzung in einen anderen Gegenstandsbereich
bereits gelöst:
Der abgebildete Graph ist nicht unikursal, weil die Anzahl seiner Ecken ungera-
der Ordnung weder 0 noch 2 ist. Also gibt es keinen Rundgang der gesuchten Art
durch Königsberg.3
Ohne hinreichendes Wissen über die Existenz von Euler-Wegen durch zusam-
menhängende Graphen ist das Problem noch nicht gelöst, aber die erste Phase des
P ÓLYAschen Problemlöseprozesses (Vertrautwerden mit der Aufgabe und Erarbei-
ten eines besseren Verständnisses) ist abgeschlossen. 

Nicht immer legt die verbale Formulierung eines Problems so suggestiv des-
sen Interpretation als graphentheoretisches Problem nahe (eine Brücke, die zwei
Stadtgebiete verbindet, als Verbindungskante zweier Ecken (Stadtgebiete)), wie das
folgende Beispiel zeigt.

3
Bei Bedarf findet der interessierte Leser Erläuterungen des graphentheoretischen Hintergrunds
in „Elemente der Geometrie“ (Scheid / Schwarz), welches in 5. Auflage ebenfalls bei Springer-
Spektrum erschienen ist.
6 1 Heurismen der Variation

Beispiel 1.2 (Fährmann-Problem; mathematische Folklore)


Ein Fährmann F soll einen Wolf W , eine Ziege Z und einen Kohlkopf K vom
linken Ufer eines Flusses auf das rechte bringen. Wie oft muss er dazu mit dem
Boot mindestens übersetzen, wenn er jeweils nur ein Objekt befördern kann und
dabei weder Z mit K noch W mit Z allein lassen kann?
Damit nicht K von Z oder Z von W gefressen werden, sind am linken Flussufer
nur folgende Zustände möglich:

F W ZKI F W ZI F WKI F ZKI F ZI WKI WI ZI KI ;:

Diese zehn Zustände sind die Ecken des zusammenhängenden Graphen in Abb.
1.3; zwei dieser Ecken sind durch eine Kante verbunden, wenn die zugehörigen
Zustände durch Einsatz des Bootes ineinander überführt werden können.
In der Sprache der Graphentheorie besteht das Problem darin festzustellen, wie
viele Kanten der kürzeste Kantenzug enthält, der die Ecken F W ZK und ; mitein-
ander verbindet.

K FZK
FWZK WK FWK Z FZ ∅
W FWZ

Abb. 1.3 Graph zum Fährmann-Problem

Die Aufgabe ist durch einfaches Abzählen zu lösen (es sind 7). Wieder ist allein
durch die Repräsentation des Problems in einem Graphen die Aufgabenstellung so
klar formuliert, dass die Lösung offensichtlich wird. 

Graphen treten natürlich nicht nur als Inzidenzstrukturen auf, sondern auch als
Graphen von Relationen. Knobelaufgaben vom Typ „red ghost, yellow ghost, green
ghost“, wie sie z. B. im interaktiven Multimedia-Projekt Mathe-Prisma der Fakultät
4 / Mathematik der Bergischen Universität Wuppertal angeboten werden, verlangen
abstrakt nichts anderes als die Festlegung einer Zuordnung, sei es durch ihren Gra-
phen oder ihre Wertetabelle. Beides simultan lässt sich durch Tabellendarstellungen
erledigen, ein sehr effektives heuristisches Hilfsmittel.

Beispiel 1.3 (Who-is-who der Haustiere)


Eine Familie lebt mit ihren Haustieren Strolch, Tiger, Carlo und Maxi unter einem
Dach, in friedlicher Gemeinschaft von Mensch, Hund, Katze, Hamster und Papa-
gei. Maxi ist kleiner als Tiger, der seinerseits größer ist als der Hund. Carlo ist älter
als der Hamster, der sich mit dem Papagei besser versteht als mit Maxi. Erstaunli-
cherweise haben der Hamster und der Papagei keine Angst vor Tiger. Man finde die
Namen der einzelnen Tiere heraus.
Gesucht sind hier der Graph oder die Wertetabelle der bijektiven Abbildung f
zwischen der Menge A D fHund; Katze; Hamster; Papageig der Haustiere und der
Menge B D fStrolch; Tiger; Carlo; Maxig ihrer Namen. Der Graph von f ist eine
1.1 Variation der Darstellung (Interpretation) 7

vierelementige Teilmenge von A  B, deren Elemente durch die Felder einer Ta-
belle, in der die Elemente von A als Zeilenkoordinaten und die Elemente von B als
Spaltenkoordinaten fungieren, repräsentiert werden können (Abb. 1.4).

Abb. 1.4 A  B in Tabellen- Strolch Tiger Maxi Carlo


form
Katze
Hund
Papagei
Hamster

Nun kann man die im Aufgabentext enthaltenen Informationen übersichtlich da-


durch darstellen, dass man in ein textlich erfasstes Feld der Tabelle ein „“ einträgt,
wenn das zugehörige Element von A  B nicht zum Graphen von f gehört, und
anderenfalls in dem Feld ein „C“ vermerkt (Schritt 1).
Unter der Voraussetzung, dass die Tiere als psychisch gesund angesehen wer-
den können (keine Angst vor sich selbst haben usw.), führen die Informationen im
Aufgabentext zu den folgenden Eintragungen (Abb. 1.5).

Abb. 1.5 Graph von f , Strolch Tiger Maxi Carlo


Schritt 1
Katze
Hund
Papagei
Hamster

(Achtung: Der Text enthält nicht die Information f .Hund/ ¤ Maxi!)


Auch ohne Kenntnis der Tatsache, dass in jeder Zeile und in jeder Spalte der
Tabelle genau ein „C“ auftreten muss, weil f W A ! B eine bijektive Abbildung
ist, lässt sich die Tabelle leicht vervollständigen (Schritt 2):

Abb. 1.6 Graph von f , Strolch Tiger Maxi Carlo


Schritt 2
Katze
Hund
Papagei
Hamster

Damit wären der Hamster Strolch, die Katze Tiger, der Hund Maxi und der Pa-
pagei Carlo erkannt (Abb. 1.6). 

Die vorgestellten Beispiele haben gezeigt, dass Darstellungen durch Tabellen


und Graphen verbal formulierte Probleme durch Abstraktion deutlicher machen,
manchmal sogar deren Lösungen offen legen. Es ist allerdings generell darauf zu
8 1 Heurismen der Variation

achten, dass bei der Übertragung einer Problemsituation in einen anderen Gegen-
standsbereich keine Übersetzungsfehler auftreten! Wie leicht das passieren kann,
zeigt folgendes Beispiel.

Beispiel 1.4 (Sechs-Stäbe-Problem)


Ist es möglich, die abgebildeten Stäbe so zusammenzulegen, dass jeder Stab mit
jedem seiner Enden die Stabenden von genau zwei anderen Stäben berührt?

Wieder liegt es nahe, die Stäbe als physikalisches Modell der Kanten eines Gra-
phen zu verstehen, in dessen Ecken jeweils genau drei Stabenden zusammentreffen.
Der gesuchte Graph hat sechs Kanten, die mit jeweils zwei Ecken inzidieren. Wenn
andererseits jede Ecke des gesuchten Graphen die Ordnung 3 hat, muss es sich um
insgesamt vier Ecken handeln, damit zusammen 12 D 2  6 Inzidenzen gezählt
werden können. Man könnte also versucht sein, die ursprüngliche Fragestellung im
Kontext der Graphentheorie in der Form

„Gibt es einen Graphen mit vier Ecken der Ordnung 3 und sechs Kanten?“

zu formulieren und den vollständigen Graphen auf vier Ecken als Lösung des Pro-
blems anzusehen.
Dass damit das ursprüngliche Problem in Wahrheit noch nicht gelöst ist, sieht
man, wenn man versucht, mit den Stäben ein ebenes Modell des vollständigen Gra-
phen auf vier Ecken zu legen – diese Versuche müssen scheitern! Der Grund dafür
liegt darin, dass Graphen als Inzidenzstrukturen topologische Objekte sind und des-
halb geometrische und erst recht metrische Informationen einer Problemstellung
bei der Übertragung des Problems in einen graphentheoretischen Kontext verloren
werden. Die Stäbe im Sechs-Stäbe-Problem enthalten aber solche Informationen:
Es handelt sich um Modelle von Strecken (geometrische Information), die zudem
noch gleich lang sind (metrische Information). Wenn man also graphentheoretische
Elemente zur Beschreibung des Sechs-Stäbe-Problems benutzen will, dann können
diese nur einen klärenden Beitrag leisten, aber keine vollständige Beschreibung des
Problems liefern!
Eine der Problemdatenlage angemessene Formulierung der Aufgabe wäre aber:

„Gibt es ein geometrisches Objekt mit sechs gleich langen Kanten, welches to-
pologisch zum vollständigen Graphen auf vier Ecken äquivalent ist?“

Diese Umformulierung lässt bei Vorliegen bereichsspezifischen Wissens über Pla-


tonische Körper erkennen, dass zur Lösung des Problems ein Kantenmodell eines
Tetraeders hergestellt werden muss – das Tetraedernetz ist topologisch der vollstän-
dige Graph auf vier Ecken (Abb. 1.7).
1.1 Variation der Darstellung (Interpretation) 9

Abb. 1.7 Tetraeder und Tetraedernetz 

Um die ikonische Stärke des Begriffssystems der Graphentheorie in der ersten


Phase eines Problemlöseprozesses häufiger nutzen zu können, greift man zweck-
mäßigerweise auch auf einen modifizierten Graphenbegriff, nämlich den Begriff
des gerichteten Graphen zurück, der sich dadurch auszeichnet, dass seine Kanten
eine Durchlaufrichtung erhalten. Solchen gerichteten Graphen begegnet man etwa
in der Gestalt von Rechenbäumen, Teilerdiagrammen oder Wahrscheinlichkeitsbäu-
men (Beispiel 1.10).

1.1.2 Systemwechsel zwischen Geometrie und Algebra

Auch innermathematisch kann man vom ikonischen Charakter des Gegenstandsbe-


reichs der Geometrie profitieren, wenn man mathematische Problemstellungen im
Begriffssystem der Geometrie repräsentiert und geometrische Methoden zu ihrer
Lösung verwendet. Dieser Ansatz hat eine lange Tradition; schon in der klassisch-
griechischen Mathematik (ca. 450–300 v. Chr.) nutzte man die Logik des A RISTO -
TELES (384–322 v. Chr.) und die axiomatische Begründung der Geometrie durch
E UKLID (etwa 340–270 v. Chr.) für geometrische Beweise zahlentheoretischer Aus-
sagen, welche vielfach schon früher in Mesopotamien oder Ägypten empirisch
gewonnen worden waren. Algebraisches Denken bildete für die griechischen Ma-
thematiker einen integralen Bestandteil der Mathematik; die geometrischen und die
arithmetischen Ansätze algebraischen Denkens gehen bis auf die Schule des P Y-
THAGORAS (ca. 570–496 v. Chr.) zurück. Das folgende Beispiel illustriert den Stil
des geometriegebundenen algebraischen Denkens („Geometrische Algebra“) in der
griechischen Klassik.

Beispiel 1.5 (Vergleich von Mittelwerten)


Man finde eine Begründung für die Ungleichung

H.a; b/ < G.a; b/ < A.a; b/

zwischen dem arithmetischen Mittel A.a; b/, dem geometrischen Mittel G.a; b/
und dem harmonischen Mittel H.a; b/ zweier verschiedener positiver Zahlen a; b 2
R.
10 1 Heurismen der Variation

Die drei angesprochenen Mittelwertbildungen sind verschiedenen Sachzusam-


menhängen des täglichen Lebens angepasst (z. B. mittleres Gewicht (arithmetisches
Mittel), mittlerer Zinsfaktor (geometrisches Mittel), mittlere Geschwindigkeit (har-
monisches Mittel)) und bekanntlich für a; b > 0 folgendermaßen definiert:

aCb p 2
A.a; b/ WD I G.a; b/ WD ab I H.a; b/ WD :
2 1
a C 1
b

Die Übertragung dieser algebraischen Objekte in den Gegenstandsbereich der Geo-


metrie muss offenbar bei den geometrischen Größenbereichen (Streckenlängen,
Flächeninhalte, Volumina, Winkelmaße) landen, in denen die zum Vergleich der
Objekte benötigte Kleiner-Relation zur Verfügung steht.
Naheliegend ist es, den Größenbereich der Streckenlängen als Repräsentanten-
bereich für die vorgegebenen a; b > 0 ; a ¤ b auszuwählen.

Abb. 1.8 Repräsentation


von a; b und A.a; b/ durch
Streckenlängen

Ist dann AB die aus den Teilstrecken AF und FB zusammengesetzte Strecke


mit
jAF j D a ; jFBj D b ; jABj D a C b ;
so wird AB durch ihren Mittelpunkt M in zwei Teilstrecken AM und MB der
jeweiligen Länge A.a; b/ aufgeteilt (Abb. 1.8).
Die algebraische Größe a  b lässt sich im geometrischen Größenbereich der
Flächeninhalte durch ein Rechteckp R mit den Seitenlängen a und b repräsentie-
ren. Dann entspricht G.a; b/ D ab der Seitenlänge eines Quadrats, welches zu
R flächeninhaltsgleich ist; Abb. 1.9 zeigt ein solches Quadrat mit der Seitenlänge
jF C j D G.a; b/.

Abb. 1.9 Repräsentation


von ab bzw. G.a; b/ durch
Flächeninhalte bzw. Stre-
ckenlängen
1.1 Variation der Darstellung (Interpretation) 11

Was ist nun erreicht? Mit dem Heurismus der Variation der Darstellung wurde
die geforderte Begründung einer Ungleichung auf den visuell zugänglichen Ver-
gleich bestimmter Streckenlängen zurückgeführt. Allerdings ist nur eine Repräsen-
tantenstrecke der beteiligten Mittelwerte evident (nämlich die von A.a; b/); die
Konstruktion der beiden anderen Repräsentantenstrecken erfordert entweder de-
klaratives und prozedurales Wissen im Kontext der Satzgruppe des P YTHAGORAS
(dann wäre die vollständige Präsentation des Problems im Gegenstandsbereich der
Geometrie geschafft) oder aber bereits jetzt den Einsatz strategischen Wissens, nur
um eine geometrische Repräsentation des Problems zu finden.
Dies macht deutlich, dass bei komplexeren Problemstellungen die vollständi-
ge Interpretation des Problems in einer anderen Sprache ein dynamischer Prozess
ist, der nicht notwendig (wie bei den im vorigen Abschnitt behandelten einfachen
Beispielen) vor der zweiten P ÓLYAschen Phase des Problemlöseprozesses abge-
schlossen sein muss!
Zur abschließenden Lösung des Problems des Mittelwertvergleichs im Begriffs-
system der Geometrie kann die Satzgruppe des P YTHAGORAS verhelfen. Abb. 1.10
enthält alle notwendigen Informationen für eine Argumentation mit dem Höhensatz
und dem Kathetensatz.

Abb. 1.10 A.a; b/ D jM C j,


G.a; b/ D jF C j, H.a; b/ D
jH C j

Wie oben begründet gilt jM C j D A.a; b/, weiter ist nach dem Höhensatz
jF C j2 D a  b, also jF C j D G.a; b/. Der algebraische Zusammenhang

A.a; b/  H.a; b/ D G.a; b/2 bzw. jM C j  H.a; b/ D jF C j2

findet sich im rechtwinkligen Dreieck FM C in Form des Kathetensatzes


jF C j2 D jM C j  jH C j wieder, woraus sich sofort H.a; b/ D jH C j ergibt. Der
direkte visuelle Vergleich der jeweiligen Repräsentantenstrecken der verschiedenen
Mittelwerte liefert unmittelbar die Begründung der Ungleichung.4 

Eine neue Ära des Systemwechsels zwischen Geometrie und Algebra wurde zu
Beginn des 17. Jahrhunderts eingeleitet, als P IERRE DE F ERMAT (1605–1661)
und R ENÉ D ESCARTES (1596–1650) der synthetischen Geometrie klassisch-

4
Derjenige, der an dieser Stelle den „variablen Horizont der Evidenz“, wie es der niederländische
Mathematikdidaktiker F REUDENTHAL auszudrücken pflegte, noch nicht erreicht zu haben glaubt,
kann zur Not mit dem aus dem Satz von Pythagoras zu folgernden Argument, dass in jedem recht-
winkligen Dreieck die Hypotenuse die längste Dreiecksseite ist, endgültig überzeugt werden.
12 1 Heurismen der Variation

griechischer Tradition die Koordinatengeometrie an die Seite stellten und damit


den Weg für den Einzug rechnerischer Methoden in die Geometrie ebneten.
Als Instrument der Übersetzung zwischen der Sprache der Algebra und der Spra-
che der Geometrie fungiert in der Koordinatengeometrie ein Koordinatensystem,
welches die umkehrbar-eindeutige Beschreibung von Punkten der Ebene (! ebene
Geometrie) bzw. des Raumes (! räumliche Geometrie) durch Tupel bzw. Tripel
reeller Zahlen erlaubt. In der Regel verwendet man ein kartesisches Koordinaten-
system, bei dem die Achsen zueinander rechtwinklig sind und gleich lange Einheits-
strecken haben; die Bezeichnung „kartesisch“ erinnert an D ESCARTES, latinisiert
C ARTESIUS. Die Liste geometrischer Begriffe und Verfahren und ihrer Entspre-
chungen in der Koordinatengeometrie ist lang und soll hier nicht vollständig vorge-
stellt werden; exemplarisch seien genannt:

 Geraden in der Ebene (Ebenen im Raum) lassen sich als Lösungsmengen linea-
rer Gleichungen mit zwei Variablen (mit drei Variablen) beschreiben,
 Halbebenen bzw. Halbräume ergeben sich als Lösungsmengen linearer Unglei-
chungen,
 Lagebeziehungen zwischen Geraden und/oder Ebenen lassen sich an der Lö-
sungsmenge linearer Gleichungssysteme ablesen,
 Berechnungen fehlender Stücke in Polygonen werden mit Mitteln der Trigono-
metrie, insbesondere Sinussatz und Kosinussatz möglich,
 Affine Abbildungen der Ebene (n D 2) und des Raumes (n D 3) können durch
Abbildungsvorschriften

fW Rn ! Rn
.x1 ; : : : ; xn / 7! f .x1 ; : : : ; xn /

algebraisch beschrieben werden,


 Kegelschnitte lassen sich als Kurven 2. Ordnung, Ellipsoide, Paraboloide und
Hyperboloide als Flächen 2. Ordnung darstellen (Kreise und Kugeln als Spezi-
alfälle eingeschlossen),
 Tangenten und Polaren zu Kegelschnittskurven ergeben sich als Lösungsmengen
linearer Gleichungen, die durch Einsetzen der Daten von Berührpunkten und
Polen in die Gleichungen zweiter Ordnung entstehen, welche die Kegelschnitte
definieren.

Der Dualismus von Geometrie und Algebra ist eine Ausprägung einer universel-
len Methode des Problemlösens, welche D ESCARTES zu entwickeln beabsichtigte.
Die von D ESCARTES in seinen unvollendet gebliebenen „Regeln zur Anleitung des
Geistes“ ursprünglich verfolgte Idee („Descartessches Schema“) lässt sich5 grob
folgendermaßen zusammenfassen:

5
So P ÒLYA 1966 im ersten Band seines Buches „Vom Lösen mathematischer Aufgaben“.
1.1 Variation der Darstellung (Interpretation) 13

Descartessches Schema

1. Man reduziere jede Art von Problem auf ein mathematisches Problem.
2. Man reduziere jede Art von mathematischem Problem auf ein algebrai-
sches Problem.
3. Man reduziere jedes algebraische Problem auf die Lösung einer einzigen
Gleichung.

D ESCARTES selbst muss bemerkt haben, dass seine Idee in vielen Fällen nicht
zu realisieren war; möglicherweise hat er deshalb seine „Regeln zur Anleitung des
Geistes“ nicht vollendet und nur Teile davon in sein späteres Werk „Discours de la
méthode“ übernommen.
Dennoch lässt sich aus P ÒLYAs Kommentaren zu den unbeendeten Regeln von
D ESCARTES ein Heurismus gewinnen, der für die Mathematik und zahlreiche An-
wendungen von großer Bedeutung ist und den A LFRED S CHREIBER folgenderma-
ßen beschreibt6 :

 Reduziere die Aufgabe auf die Bestimmung unbekannter Größen.


 Beschreibe die Beziehungen, die der Bedingung entsprechend zwischen den Un-
bekannten und den Daten bestehen müssen.
 Trenne von der Bedingung einen Teil ab, demzufolge man diesselbe Größe auf
zwei verschiedene Arten ausdrücken kann (was eine Gleichung ergibt oder – bei
Fortsetzung dieses Verfahrens – ein Gleichungssystem).

Die Herauslösung von Problemen aus ihrer verbalen Fassung und ihre Darstel-
lung im Begriffssystem der Algebra stellt heuristisches Handeln dar; jedesmal,
wenn ein Problem durch das „Aufstellen von Gleichungen“ gelöst wird, befolgt der
Problemlöser also das D ESCARTESsche Schema. Diese Zuordnung birgt die Gefahr,
D ESCARTES’ Ansinnen unangemessen einseitig zu verstehen: D ESCARTES selbst
hat in seiner „Géométrie“ Wege aufgezeigt, wie man algebraische Gleichungen
geometrisch lösen kann. So studierte er zum Beispiel zur Lösung einer algebrai-
schen Gleichung vom Grad 5 oder 6 die Schnittpunkte eines Kreises mit einer Kurve
vom Typ
axy D abc C acx  bx 2  x 3 ;
die später Cartesische Parabel genannt wurde. Im Zentrum der D ESCARTESschen
Überlegungen stand eine Einheit von geometrischen und algebraischen Arbeitswei-
sen.
Diese Einheit ist in bemerkenswerter Weise auch in modernen Problemstellun-
gen realisiert, die im Kontext der linearen Optimierung angesiedelt sind. Hier geht
es darum, absolute Extrema linearer Funktionen Z („Zielfunktionen“) in n Varia-
blen unter Beachtung gewisser Nebenbedingungen zu bestimmen, die sich ihrerseits

6
Alfred Schreiber: Lehrveranstaltungs-Materialien zur Heuristik (2002).
14 1 Heurismen der Variation

als System von linearen Ungleichungen formulieren lassen. Die Lösungsmengen


solcher linearer Ungleichungssysteme sind Durchschnitte D von Halbräumen im
Rn , und die absoluten Extremwerte von ZjD liegen auf dem Rand von D, sodass
Methoden der Analysis zur Extremwertbestimmung nicht infrage kommen. In den
Fällen n D 2 und n D 3 kann man aber im Dialog zwischen Algebra und Geome-
trie graphische Methoden zur Lösung linearer Optimierungsprobleme entwickeln,
wie das folgende Beispiel für n D 2 demonstriert.

Beispiel 1.6 (Optimierungsproblem)


Ein mittelständischer Elektrobetrieb stellt zwei Typen von Alarmanlagen her,
verkauft Typ A mit einem Gewinn von 50 EUR pro Stück und verdient jeweils
150 EUR beim Verkauf einer Anlage vom Typ B. Der Absatz der gesamten Pro-
duktion ist langfristig gesichert. Wöchentlich können höchstens 140 Alarmanlagen
hergestellt werden; die Wochenproduktion von Geräten des Typs A ist auf ma-
ximal 100 Stück beschränkt, von Anlage B können höchstens 70 Einheiten pro
Woche fertiggestellt werden. Außerdem kann ein Zulieferer von einem speziellen
Bauteil, welches bei Anlage A genau einmal und bei Anlage B genau zweimal
eingebaut werden muss, jede Woche höchstens 180 Stück zur Verfügung stellen.
Wie muss unter diesen Bedingungen die wöchentliche Produktion gestaltet werden,
um maximalen Gewinn zu erzielen?
Nach Einführung der Variablen x1 (x1  0) bzw. x2 (x2  0) für die Anzahl
der wöchentlich produzierten Alarmanlagen vom Typ A bzw. vom Typ B kann das
Problem in der Sprache der Algebra folgendermaßen formuliert werden:

Optimierungsproblem
Man bestimme in der Lösungsmenge L des Ungleichungssystems

.1/ x1  0 .2/ x2  0
.3/ x1  100 .4/ x2  70
.5/ x1 C x2  140 .6/ x1 C 2x2  180

ein Tupel .a; b/ 2 D WD L \ Z2 derart, dass die lineare Funktion Z mit


Z.x1 ; x2 / WD 50x1 C 150x2 auf D ein absolutes Maximum in .a; b/ annimmt.
In der Sprache der Koordinatengeometrie stellt sich das Problem folgenderma-
ßen dar:
Jede der Ungleichungen (1) bis (6) definiert im Koordinatensystem eine abge-
schlossene Halbebene, insbesondere beschreiben die Nicht-Negativitätsbedingun-
gen (1) und (2) den abgeschlossenen 1. Quadranten des Koordinatensystems (als
Durchschnitt der abgeschlossenen Halbebene x1  0 mit der abgeschlossenen
Halbebene x2  0).
Abb. 1.11 zeigt die Trägergeraden der einzelnen durch (3) bis (6) definierten
Halbebenen, die durch Pfeile markiert sind. Der Durchschnitt aller durch (1 bis (6)
beschriebenen Halbebenen ist die Lösungsmenge L des Ungleichungssystems, das
sogenannte Planungsvieleck der Optimierungsaufgabe.
1.1 Variation der Darstellung (Interpretation) 15

Abb. 1.11 Trägergeraden und Planungsvieleck

Die Niveaulinien Z.x1 ; x2 / D t .t 2 R/ definieren eine Schar paralleler Geraden


g t .t 2 R/. Dann ist das Maximum m der Zielfunktion Z auf L das größte aller t,
für die g t noch mindestens einen Punkt mit dem Planungsvieleck gemeinsam hat.
Man erkennt gm als diejenige Gerade der Parallelenschar, die durch den Schnitt-
punkt S D .40; 70/ der Trägergeraden zu (6) und zu (4) verläuft. Da S ganzzahlige
Koordinaten hat, ist mit .a; b/ D .40; 70/ auch ein Punkt in D gefunden, wo ZjD
ein absolutes Maximum annimmt; der maximale Wert ist m D Z.40; 70/ D 12 500
(Abb. 1.12).

Abb. 1.12 Lösung des Opti-


mierungsproblems

Wären die Koordinaten von S nicht ganzzahlig gewesen, so hätte man ein Z2 -
Gitter in das Koordinatensystem legen können und m als das größte aller t, für die
g t noch mindestens einen Punkt auf dem im Planungsvieleck gelegenen Teil des
Z2 -Gitters hat, bestimmen können. 

Im 18. Jahrhundert verlor die synthetische Geometrie in der geometrisch-


algebraischen Symbiose zunehmend an Einfluss. Die tradierte Denkweise, welche
die euklidische Geometrie als Quelle der Exaktheit betrachtete und deshalb geome-
trische Objekte und Verfahren in den Vordergrund rückte, wurde beiseite gedrängt
und vom Vertrauen in die „Allgemeinheit der Algebra“ abgelöst. Im zweiten Teil
seiner 1748 veröffentlichten „Introductio in analysin infinitorum“ diskutierte und
16 1 Heurismen der Variation

klassifizierte L EONHARD E ULER Kurven und Flächen durch die Analyse ihrer
Gleichungen, mit denen sie im Koordinatensystem beschrieben werden konnten,
wobei er sowohl in kartesischen als auch in schiefwinkligen Koordinatensyste-
men arbeitete und auch die linearen Transformationsgleichungen des Übergangs
zwischen diesen Koordinatensystemen angab. Bis zum Ende des 18. Jahrhunderts
setzte sich dann unter dem Einfluss von J OSEPH L OUIS L AGRANGE (1736–1813),
G ASPARD M ONGE (1746–1818) und S YLVESTRE F. L ACROIX (1765–1843) der
Begriff „Analytische Geometrie“ für diese Art der Auseinandersetzung mit geome-
trischen Figuren durch.
Die Vernetzung von Teilen der analytischen Geometrie mit Teilen anderer mathe-
matischer Disziplinen hat sich in mehreren Fällen verselbständigt und zur Entste-
hung neuer mathematischer Teilgebiete geführt. Im frühen 19. Jahrhundert begrün-
dete C ARL F RIEDRICH G AUSS (1777–1855) die Differentialgeometrie als Synthese
aus analytischer Geometrie und Differentialrechnung7 , und im späten 19. Jahrhun-
dert entstand unter maßgeblicher Beteiligung von M AX N OETHER (1844–1921)
aus der Theorie der algebraischen Kurven und Flächen die algebraische Geometrie.
Die Topologie hat ebenfalls (koordinaten-)geometrische Wurzeln: Ursprünglich
untersuchte man solche Eigenschaften von Punktmengen („geometrischen Figu-
ren“) im dreidimensionalen Anschauungsraum, die unter topologischen Abbildun-
gen („Homöomorphismen“)8 erhalten blieben. Unter diesem Gesichtspunkt könnte
man auch die Graphentheorie als Teil der Topologie verstehen: Graphen als Inzi-
denzstrukturen werden durch ihre Inzidenzmatrizen charakterisiert, und diese sind
topologische Invarianten.
Eine junge geometrische Forschungsrichtung, die ihre Blütezeit in den 80er/90er
Jahren des 20. Jahrhunderts erlebt hat, ist die fraktale Geometrie, welche diejenigen
Phänomene studiert, die sich bei Iterationen von Ähnlichkeitsabbildungen ergeben;
die Entstehung dieser mathematischen Disziplin war erst im Zeitalter des Compu-
ters und leistungsfähiger Computer-Grafik-Programme möglich.
Einer der fruchtbarsten Prozesse im Dialog zwischen Algebra und Geometrie seit
Beginn des 19. Jahrhunderts, der einen Wiederaufschwung der Geometrie einleite-
te, war die Genese des Vektorraumbegriffs, an deren Ende die Festschreibung des
allgemeinen Vektorraumbegriffs über einem beliebigen Körper stand (B OURBAKI
1947).
Damit wurden im Rahmen der modernen Strukturalgebra zwei unterschiedliche
Traditionen vereint, die sich im 19. Jahrhundert aus zwei verschiedenen Quellen zur
„Vektorrechnung“ entwickelt hatten:

 Aus dem Quaternionenkalkül des W ILLIAM ROWAN H AMILTON (1805–1865)


wurde in der Physik der dreidimensionale Vektorkalkül zur Beschreibung der von
JAMES C LERK M AXWELL (1831–1879) fundierten Elektrodynamik herausge-
löst.

7
C ARL F RIEDRICH G AUSS (1777–1855): „Disquisitiones circa superficies curvas“.
8
Bijektive Abbildungen, die stetig sind und deren Umkehrabbildungen ebenfalls stetig sind.
1.1 Variation der Darstellung (Interpretation) 17

 Die Ausdehnungslehre des H ERMANN G. G RASSMANN (1809–1877) führ-


te 1888 zu einer ersten axiomatisierten Theorie reeller Vektorräume durch
G IUSEPPE P EANO (1858–1932).

Durch die Einbettung der analytischen Geometrie des 18. /19. Jahrhunderts in die
Theorie der euklidischen Vektorräume9 wird es jetzt möglich, alle Punktmengen der
Ebene bzw. des Raumes mithilfe von Vektorraumoperationen in den euklidischen
Vektorräumen R2 bzw. R3 zu beschreiben. Dies hat insbesondere folgende Vorteile:

 Der Vektorkalkül bereichert die analytische Geometrie um koordinatenfreie Me-


thoden.10
 Die algebraischen Eigenschaften eines Skalarprodukts11 liefern sehr effizien-
te Methoden zur Beschreibung und Bestimmung metrischer Größen (Längen,
Winkel).

Wieder ist die Liste geometrischer Begriffe und Verfahren und ihrer Entsprechun-
gen in der vektoriellen analytischen Geometrie zu lang, um sie hier vollständig
aufschreiben zu können. Exemplarisch seien genannt:

 Geraden und Ebenen im Raum lassen sich in Parameterform beschreiben,


 Geraden in der Ebene und Ebenen im Raum lassen sich in Normalenform ange-
ben,
 Parallelität von Geraden / von Ebenen lässt sich an der Kollinearität / der Kom-
planarität ihrer Richtungsvektoren feststellen,
 Orthogonalität zweier Vektoren lässt sich durch das Verschwinden ihres Skalar-
produkts charakterisieren,
 Abstände zwischen einander nicht schneidenen linearen Untermannigfaltigkei-
ten (im Raum: Punkte, Geraden, Ebenen) lassen sich als Längen geeigneter
Projektionsvektoren beschreiben, wobei das Instrument der Längenmessung (eu-
klidische Norm) durch das Skalarprodukt induziert wird
rD !
  E
!
v  WD ! !

  v; v :

 Winkel zwischen einander schneidenden linearen Mannigfaltigkeiten werden als


Winkel zwischen Richtungsvektoren / Normalenvektoren bestimmt, wobei zur
Berechnung von Winkeln zwischen vom Nullvektor verschiedenen Vektoren

!
9
Man identifiziere einen Punkt P im Koordinatensystem mit dem Ortsvektor ! 
p D OP , dessen
Standardkomponenten die Koordinaten des Punktes P im R (n D 2; n D 3) sind.
n
10
Zur begrifflichen Abgrenzung der modernen analytischen Geometrie gegen die analytische
Geometrie des 18. /19. Jahrhunderts spricht man auch von „Analytischer Geometrie in vektori-
eller Darstellung“.
11
Skalarprodukte auf reellen Vektorräumen sind positiv-definite, symmetrische Bilinearformen.
18 1 Heurismen der Variation

!

u ;!
v wieder das Skalarprodukt verwendet wird

0 D E 1
!
u ;!

v
@^.!

u ;!
v / D arccos     A :
!
  !
uv 

Das folgende Beispiel illustriert den Systemwechsel zwischen der synthetischen


euklidischen Geometrie und der algebraischen Sprache der euklidischen Vektor-
raumtheorie in Gestalt koordinatenfreier Vektorrechnung an einem vertrauten Zu-
sammenhang der Dreieckslehre.

Beispiel 1.7 (Pythagoras vektoriell)


Ist ABC ein Dreieck mit rechtem Winkel bei C und den Standardbezeichnungen
für Höhe und Seitenlängen, ferner F der Höhenfußpunkt auf der Hypotenuse mit
Hypotenusenabschnitten der Längen p und q, dann besagen die Sätze der Satzgrup-
pe des Pythagoras formelmäßig:

 c 2 D a2 C b 2 (S. d. Pythagoras)
 h2 D p  q (Höhensatz)
 b 2 D p  c I a2 D q  c (Kathetensatz)

Man beweise diese Aussagen vektoriell.

Wir definieren die Vektoren


!
 ! ! !  !  !  ! !
 !
a WD BC ; b WD CA ; !
c WD AB ; !
p WD AF ; !
q WD FB und h WD CF :

Dann entsprechen die in den Sätzen der Satzgruppe des Pythagoras genannten Län-
gen den Normen der Vektoren gleichen Namens, es ist also
  !    !     
           
a D !
a  ; b D  b  ; c D !
c  ; h D  h  ; p D !
p und q D !
q :

Setzt man zur Berechnung dieser Normen die Eigenschaften des Skalarprodukts
geschickt ein, so ergeben sich daraus unmittelbar die Aussagen der Satzgruppe des
Pythagoras.
1.1 Variation der Darstellung (Interpretation) 19

!

Es ist !
c D .! a C b /, also gilt
 2 D E
 
c 2 D ! c D ! c ; !
c
D  E D  E
D .! a C !

b /; .! a C ! a C !
b / D .1/2  .!
 ! !
b /; .a C b /
D E D!   E D! ! E D! !E
D ! 
a ;!
a C b ;! a C  a; b C b; b
D E D !  E D!  ! E
D ! 
a ;!
a C2 ! a; b C b; b :

!

Da die Vektoren ! 
a und b zueinander orthogonal sind, verschwindet das Skalar-
!

produkt h!

a ; b i, und man erhält
D E D! !E  
 2 !
 2

c2 D !  a C b ; b D !
a ;!
 a  C  b  D a2 C b 2 ;

wie im Satz des Pythagoras behauptet.


!

Zum Nachweis des Höhensatzes beachte man die Beziehungen !

a D h C!

q
!
 !
 ! 
und b D h  p . Dann ergibt sich
D !  E D!  E
!
a ; b D h C!
0D !
 q ; h ! p
D!
 ! E D!  E D  E D !
! E
p C !
D h ; h  h ;! q; h  !
 q ;
p :

!
 
! !
 
Aufgrund der Orthogonalität der Vektoren h und ! p sowie h und ! q ist h h ; !
pi D
!
 !
 !
 !
h q ; h i D 0; außerdem schließen die Vektoren p und q einen Winkel von 0ı
miteinander ein, sodass
D E D E        
! p D !
q ;!
  q D !
p ;!   !  !
 !    !
! 
 p    q   cos ^. p ; q / D  p    q 

gilt. Daraus erhält man mit


!  D!  E D ! E    
 2  !   ! 
h2 D  h  D h ; h D ! q ;
p D !
p   
qDpq

die Aussage des Höhensatzes.


Zum Nachweis der Aussage b 2 D p  c des Kathetensatzes beachte man die
!
 c D !
 !
Beziehungen b D ! a  ! h  p . Dann ergibt sich
!  D! E
 2  !
b2 D  b  D b ; b
D!
  ! E D !  E D!  E
D b ; ! a  c D  ! a ; b  b ;!
 c
D!
  E
D  b ;! c ;
20 1 Heurismen der Variation

!
 !

weil die Orthogonalität der Vektoren !
a und b die Gleichung h! 
a ; b i D 0 impli-
ziert. Aber
  E D!
D!  E
!
 b ;! c D  p  h ;! c
D E D! E
D !  c  
p ;! h ;!
c
D E
D ! p ;!
c  0
D E
D ! p ;!
c
   
  ! 
D ! p   c   cos ^.!
p ;!
 c /
   
  ! 
D ! p   c  ;

sodass man insgesamt b 2 D k!



p k  k!
c k D p  c erhält.
Die zweite Aussage a2 D q  c des Kathetensatzes ergibt sich durch analoge
!
  !
 
Argumentation für !

a D  b ! c D h ! q. 

Die algebraische Struktur eines Vektorraums mit Skalarprodukt ist ein abstrak-
tes Konstrukt, dessen Objekte und Operationen nichts mit unserer Anschauung in
der kartesischen Geometrie zu tun haben müssen – man denke etwa an den Vek-
torraum C Œa; b der auf einem kompakten Intervall Œa; b  R stetigen Funktionen
f W Œa; b ! R mit dem Skalarprodukt

Zb
hf; gi WD f .x/  g.x/ dx :
a

Angesichts der Universalität des Konzepts ist es daher nicht verwunderlich, dass im
ersten Drittel des 20. Jahrhunderts die Vektorraumterminologie und die damit ver-
bundenen Aspekte der Linearen Algebra auch in andere Teilgebiete der Mathematik
als grundlegendes Werkzeug eingeführt wurden.
Ganz besonders bedeutend war dies zunächst in der damals neuen Funktional-
analysis mit den Protagonisten DAVID H ILBERT (1862–1943), F RIGYES R IESZ
(1880–1956) und S TEPHAN BANACH (1893–1945)); H ERMANN W EYL (1885–
1955) integrierte die Vektorraumterminologie in G AUSS’ Differentialgeometrie.
Die Auswahl an mathematischen Gegenstandsbereichen, welche Parallel-Reprä-
sentationen im Begriffssystem der Linearen Algebra zulassen, ist seither konti-
nuierlich gewachsen. Bisweilen sind diese Darstellungen analytisch-geometrisch
interpretierbar (in Verallgemeinerung ihrer Entsprechungen im Fall der Zwei- oder
Dreidimensionalität) und können deshalb einem vertieften Verständnis einer Pro-
blemstellung dienlich sein. Damit werden wir uns im folgenden Abschnitt näher
beschäftigen.
1.1 Variation der Darstellung (Interpretation) 21

1.1.3 Systemwechsel zwischen verschiedenen mathematischen


Disziplinen und Linearer Algebra

Da sich dieses Buch unter anderem an Studierende mit dem Berufsziel Lehramt
an Gymnasien richtet, scheint es sinnvoll, Beispiele für das Wechselspiel zwischen
Linearer Algebra und anderen Teilgebieten der Mathematik aus denjenigen Berei-
chen auszuwählen, die für zukünftige Mathematiklehrer in der Oberstufe besonders
interessant sind, also aus der Analysis und der Statistik/Stochastik.
Vielfach kann das Problem der Extremwertbestimmung von genügend oft diffe-
renzierbaren Funktionen mehrerer Variablen (mit und ohne Nebenbedingungen) als
eine einfache Abstandsbestimmung zwischen linearen Untermannigfaltigkeiten12
im Rn interpretiert werden, was den aufwändigen Kalkül der Differenzialrechnung
mehrerer Veränderlicher überflüssig macht.

Beispiel 1.8 (Regressionsgerade)


Gegeben sei eine „Punktwolke“ .x1 ; y1 / ; : : : ; .xn ; yn /, zum Beispiel durch die Wer-
te xi WD X.gi / ; yi WD Y.gi / statistischer Erhebungen X und Y zweier quantitati-
ver Merkmale auf der Menge G WD fg1 ; : : : ; gn g von Merkmalsträgern.
Gesucht ist eine Gerade g, welche sich der Punktwolke im Sinne des Prinzips
der kleinsten Quadrate (C. F. G AUSS) optimal13 anpasst.
(Man bezeichnet diese eindeutig bestimmte Gerade g als die Regressionsgerade
von Y bezüglich X (Abb. 1.13).)

Abb. 1.13 Regressionsgera-


de: Minimalität der Summe
der quadratischen vertikalen
Abstände

In den Fällen n D 2 oder xi D xj für alle i; j D 1; : : : ; n liegen alle Punkte


der Punktwolke auf einer eindeutig bestimmten Geraden. Anderenfalls sei zunächst
hW y D mx C b die Gleichung einer Geraden mit den Parametern m (Steigung) und
b (Achsenabschnitt). Die Summe der quadratischen vertikalen Abstände der Punkte

12
Hierbei werden auch Punkte als (0-dimensionale) lineare Untermannigfaltigkeiten aufgefasst.
13
Die Summe der quadratischen vertikalen Abstände aller Punkte der Punktwolke zu g soll mini-
mal werden.
22 1 Heurismen der Variation

.x1 ; y1 /; : : : ; .xn ; yn / von h ist dann gegeben durch

X
n
f .m; b/ WD .yi  mxi  b/2 :
i D1

Gesucht ist ein absolutes Minimum der Funktion

fW R2 ! R
Pn
.m; b/ 7! i D1 .yi  mxi  b/ ;
2

welches wegen limjbj!1 f .m; b/ D limjmj!1 f .m; b/ D 1 unter den lokalen


Minima von f zu finden sein muss. Wird dann f minimal an der Stelle .˛; ˇ/ 2 R2 ,
so ist gW y D ˛x C ˇ die Gleichung der gesuchten Regressionsgeraden.
Die Kandidaten für lokale Extrema differenzierbarer Funktionen findet man be-
kanntlich unter den Nullstellen ihres Gradienten:
2 X n 3
6 2 .yi  ˛x i  ˇ/x i D 07
6 i D1 7
6
grad f .˛; ˇ/ D .0; 0/ , 6 7
X n 7
4 5
2 .yi  ˛xi  ˇ/ D 0
i D1
Pn P
Nach Einführung von x WD n1 i D1 xi und y WD n1 niD1 yi als arithmetische Mit-
tel der Daten x1 ; : : : ; xn bzw. y1 ; : : : yn lässt sich das Gleichungssystem äquivalent
umformen in 2 X 3
n X n

6 ˛ x 2
i C ˇ  nx D x y
i i7
4 i D1 i D1 5 . /
˛x C ˇ D y
Da für mindestens ein Paar .i; j / ; i ¤ j auch xi ¤ xj und damit ebenso xi  x ¤
xj  x gilt, ist
X n
0< .xi  x/2
i D1
X n X
n X
n
D xi2  2x xi C x2
i D1 i D1 i D1
X
n
D xi2  nx 2 ;
i D1

sodass das Gleichungssystem . / wegen der von 0 verschiedenen Determinante sei-


ner Koeffizientenmatrix eindeutig lösbar ist. Als einzigen Kandidaten für ein lokales
(und dann auch gleichzeitig absolutes, s. o.) Minimum von f ermittelt man
1 Pn
xi yi  xy
.˛; ˇ/ 2 R mit ˛ WD 1 Pi D1
2 n
n und ˇ WD y  ˛x :
i D1 xi  x
2 2
n
1.1 Variation der Darstellung (Interpretation) 23

Die Hessesche Matrix14


@2 f @2 f
! Pn !
.˛; ˇ/ .˛; ˇ/ 2
2 i D1 xi 2nx
Hess f .˛; ˇ/ D @m@m @b@m
D
@2 f @2 f 2nx 2n
@m@b
.˛; ˇ/ @b@b
.˛; ˇ/

von f ist nach dem Hurwitz-Kriterium15 positiv definit, denn ihre Determinante ist
positiv (Berechnung vgl. Determinante der Koeffizientenmatrix von . /), und es gilt
P n
i D1 xi > 0 (wegen xi ¤ xj für mindestens ein Paar .xi ; xj /). Daher ist .˛; ˇ/ die
2

Minimalstelle von f , und gW y D ˛x C ˇ ist die Gleichung der Regressionsgeraden


von Y bezüglich X.
Wenn man in der gymnasialen Oberstufe die Regressionsgerade mit den Mit-
teln der Analysis behandeln möchte, muss man zunächst dafür sorgen, dass die
Problematik in den Kontext der Extremwertbestimmung für Funktionen einer Ver-
änderlichen16 übertragen wird. Dies kann dadurch geschehen, dass man von der
gesuchten Geraden zusätzlich verlangt, dass sie durch den „Schwerpunkt“ S D
.x; y/ der Punktwolke verläuft, wie es für die oben bestimmte Gerade ja richtig ist.
Die Repräsentation der Aufgabenstellung im Begriffssystem der Linearen Al-
gebra macht solche Einschränkungen aber überflüssig, wie es mein von mir hoch
geschätzter Lehrer H ARALD S CHEID 1992 aufgezeigt17 hat:
Definiert man nämlich die Vektoren
0 1 0 1 0 1
x1 y1 1
!
 B C B C z WD B :: C
x WD @ ::: A ; ! 
y WD @ ::: A und ! @ : A
xn yn 1
im
Pneuklidischen Vektorraum Rn, so beschreibt der zu minimierende Term f .m; b/ D
!
 !
 !

i D1 .yi  mxi  b/ das Quadrat der Länge des Vektors y  m x  b z . Diese
2

wird offenbar genau dann für .m; b/ D .˛; ˇ/ minimal, wenn u WD ˛ x C ˇ!


! !
 z die
!
 !
 !

orthogonale Projektion von y auf den von x und z erzeugten zweidimensionalen
Untervektorraum von Rn ist (Abb. 1.14)!
Abb. 1.14 Orthogonale Pro-
jektion von !

y auf die von !

x
!

und z erzeugte Ebene

14
Benannt nach OTTO H ESSE (1811–1874).
15
Benannt nach A DOLF H URWITZ (1859–1919).
16
Nicht notwendig mit Mitteln der Differenzialrechnung! Hier würde sogar die Scheitelpunktsbe-
stimmung einer Parabel genügen.
17
H. Scheid: Wahrscheinlichkeitsrechung. Mathematische Texte, Bd. 6. BI-Wissenschaftsverlag,
Mannheim.
24 1 Heurismen der Variation

Die Bestimmungsgleichungen . / für ˛ und ˇ erhält man dann aus den Ortho-
gonalitätsbedingungen
D E D E
!
y  ˛!

x  ˇ!
z ; !

x D 0 und !
y  ˛!

x  ˇ!
z ; !
z D 0 :

Die Ermittlung der Parameter ˛ und ˇ der Regressionsgeraden geschieht jetzt wie
oben, wobei der Nachweis der Minimumseigenschaft nicht mehr erforderlich ist.


Auch verschiedene Streuungsmaße und den linearen Korrelationskoeffizienten


von Y bezüglich X kann man durch Verallgemeinerung bekannter Begriffe aus der
ebenen/räumlichen Geometrie auf den n-dimensionalen euklidischen Vektorraum
Rn im Begriffssystem der Linearen Algebra repräsentieren, wobei es allerdings
vorteilhaft ist, Längen und Winkel mit einem leicht modifizierten Skalarprodukt
zu messen.
Auf diese Weise wird das Prinzip der Beziehungshaltigkeit nicht nur in außer-
mathematischer, sondern auch in innermathematischer Hinsicht erfüllt: Die Ver-
netzung des Regressions- und des Korrelationskalküls mit dem Begriffssystem der
Linearen Algebra bietet vertiefte Einsichten in verschiedene mathematische Dis-
ziplinen und bereichert die Lineare Algebra durch die geometrische Veranschauli-
chung algebraischer und analytischer Zusammenhänge in gleichem Maße, wie die
Analytische Geometrie von der Algebraisierung geometrischer Sachverhalte profi-
tieren kann.
Das folgende Beispiel aus dem Bereich der elementaren Wahrscheinlichkeits-
rechnung zeigt, dass man auch Extremwertprobleme mit Nebenbedingungen im
Kontext der Linearen Algebra elegant lösen kann, wenn die Nebenbedingungen
lineare Untermannigfaltigkeiten im Rn beschreiben.

Beispiel 1.9 (Glücksrad-Design)


Ein Glücksrad ist in n Sektoren x1 ; : : : ; xn so einzuteilen, dass die Wahrscheinlich-
keit dafür, dass bei zweimaligem Drehen des Glücksrades der Zeiger zweimal im
gleichen Sektor stehen bleibt, minimal wird.

Es bezeichne pi die Wahrscheinlichkeit dafür, dass das Glücksrad im Sektor xi


stehen bleibt (1  i  n); dann entspricht pi jeweils dem Anteil der Fläche des
Sektors xi an
Pder gesamten Kreisfläche („geometrische Wahrscheinlichkeit“), und
es gilt 1 D niD1 pi DW g.p1 ; : : : ; pn / C 1. Die Wahrscheinlichkeit dafür, dass bei
zweimaliger unabhängiger Wiederholung des Zufallsversuchs „Drehen des Glücks-
1.1 Variation der Darstellung (Interpretation) 25

rades“ zweimal derselbe Ausfall auftritt, ist die Wahrscheinlichkeit des Ereignisses

X
n
A D f.x1 ; x1 /; : : : ; .xn ; xn /g mit P .A/ D pi2 DW f .p1 ; : : : ; pn / :
i D1

In der Sprache der Analysis stellt sich das Problem folgendermaßen dar:

Man bestimme diejenige Stelle .p1e ; : : : ; pne / 2 Rn , an der die Funktion

fW Rn ! R
Pn
.p1 ; : : : ; pn / 7! 2
i D1 pi

unter der Nebenbedingung g D 0 ihr absolutes Minimum annimmt.

Die Lösung dieses Problems ist Routine, aber lästig. Zunächst ermittelt man mit-
hilfe des Satzes über die Lagrange-Multiplikatoren die Kandidaten .a1 ; : : : ; an / für
Extrema von f unter der Nebenbedingung g D 0 als Lösungen des Gleichungssys-
tems 2 3
@f @g
.a1 ; : : : ; an / D   .a1 ; : : : ; an /
6 @p1 @p1 7
6 7
6 @f @g 7
6 .a1 ; : : : ; an / D   .a1 ; : : : ; an / 7
6 7
6 @p2 @p2 7
6 7
6 :: :: 7
6 : D : 7
6 7
6 7
6 @f @g 7
6 .a1 ; : : : ; an / D   .a1 ; : : : ; an /7
4 @pn @pn 5
g.a1 ; : : : ; an / D 0 :
Im konkret vorliegenden Fall ergibt sich das Gleichungssystem
2 3
2a1 D 
6 2a2 D  7
6 7
6 7
6 :: :: 7
6 :D: 7
6 7
6 7
6 2an D  7
6 7
6Xn 7
4 5
ai  1 D 0
i D1

mit der einzigen Lösung  D 2


n
; a1 D a2 D    D an D n1 . Damit ist
 
1 1
.p1e ; : : : ; pne / WD ;:::;
n n
26 1 Heurismen der Variation

der einzige Kandidat für das gesuchte Extremum, und für jede Wahl von p1 ; : : : ; pn
mit
1 X n
pi WD C ˛i .1  i  n/ und pi D 1
n i D1

ergibt sich
X
n
f .p1 ; : : : ; pn / D pi2
i D1
X n
1 2X
n X n
D 2
C ˛i C ˛i2
i D1
n n i D1 i D1
„ ƒ‚ … „ƒ‚…
D0 0
X
n
1
 D f .p1e ; : : : ; pne / ;
i D1
n2

so dass es sich bei .p1e ; : : : ; pne / WD . n1 ; : : : ; n1 / tatsächlich um das gesuchte Mini-


mum von f unter der Nebenbedingung g D 0 handelt.
Will man also das Glücksrad so konfigurieren, dass die Wahrscheinlichkeit für
zwei identische Ergebnisse bei zweimaligem Drehen minimal wird, so muss man
alle Sektoren x1 ; : : : ; xn flächeninhaltsgleich wählen; dann gilt p1 D    D pn D n1 .
Die Interpretation der Problemstellung im Begriffssystem der Linearen Algebra
legt eine wesentlich elegantere Lösung nahe:
Die Gleichung

g.p1 ; : : : ; pn / D 0 bzw. p1 C p2 C    C pn  1 D 0

definiert eine Hyperebene H im Rn . Gesucht ist in dieser Hyperebene derjeni-


ge Punkt A D .a1 ; : : : ; an / 2 H , für dessen Ortsvektor !

a das Längenquadrat
!
 2 P n
k a k D i D1 ai minimal wird. Offenbar ist A der Fußpunkt des Lotes von O auf
2

H . Liest man an der Hesseschen Normalenform


1 1 1 1
HW p p1 C p p2 C    C p pn  p D 0
n n n n
der Hyperebenengleichung für H den Vektor
 1 t
!
 1
n0 D p ; : : : ; p
n n
als von O nach H orientierten Einheits-Normalenvektor zu H ab, so erhält man

!
 1 
a Dp ! n0
n

und damit A D . n1 ; : : : ; n1 /, womit das Problem gelöst wäre. 


1.1 Variation der Darstellung (Interpretation) 27

Ein wesentliches Methodenkonzept der Linearen Algebra wurde bisher in den


Beispielen nicht berücksichtigt, nämlich der Matrizenkalkül in Verbindung mit der
Eigenwerttheorie. Damit lassen sich manche stochastischen Prozesse sehr effizient
beschreiben, wie am folgenden Beispiel einer homogenen Markow-Kette18 gezeigt
wird.

Beispiel 1.10 (Politik und Gewissen)


Ein Parlamentarier der Regierungskoalition fühlt sich im Hinblick auf sein Ab-
stimmungsverhalten bei einer demnächst bevorstehenden Parlamentsentscheidung
über eine Gesetzesvorlage sowohl der Parteidisziplin als auch seinem Gewissen
verpflichtet: Die Parteiraison fordert von ihm, für das Gesetz zu stimmen (A), sein
Gewissen verlangt seine Abstimmung gegen das Gesetz (B). Wäre die Abstimmung
heute, würde der Abgeordnete mit der nahe bei 1 gelegenen Wahrscheinlichkeit u
die Entscheidung B treffen und sich nur mit der geringen Wahrscheinlichkeit 1  u
im Sinne der Partei für A entscheiden.
In den n Tagen bis zur Abstimmung gibt es täglich Versuche der Regierungsfrak-
tionen, mögliche Abweichler aus den eigenen Reihen umzustimmen (deklarierte
Fraktionszwänge, Rücktrittsdrohungen von Amtsinhabern usw.). Ebenso versucht
die Opposition, Unentschlossene des Regierungslagers auf ihre Seite zu ziehen, um
der Gesetzesvorlage keine Mehrheit zu verschaffen.
Unser Parlamentarier ist eine gefestigte Persönlichkeit, der seine Ansichten auch
unter permanenter massiver Beeinflussung von Tag zu Tag nur mit der sehr kleinen
Wahrscheinlichkeit p ändert: Hätte er sich am Tag k für A (für B) ausgesprochen,
würde er sich am Tag k C 1 mit der Wahrscheinlichkeit 1  p wieder für A (wie-
der für B) entscheiden, wobei eine Stimmenthaltung für ihn definitiv nie in Frage
kommt.
Mit welcher Wahrscheinlichkeit stimmt er in n Tagen für das Gesetz? Wie ent-
wickelt sich sein Abstimmungsverhalten langfristig?
Die Meinungsbildung des Parlamentariers vom Tag 0 (heute) bis zum Tag n nach
heute lässt sich als Zufallsexperiment mit dem Stichprobenraum

˝ WD f.z0 ; : : : ; zn / j zi 2 fA; Bg für alle i D 0; : : : ; ng

deuten, wobei sich grundsätzlich die Wahrscheinlichkeit P .z0 ; : : : ; zn / für jeden


Ausfall ! D .z0 ; : : : ; zn / 2 ˝ mit der Pfadregel berechnen ließe; Abb. 1.15 zeigt
ein Baumdiagramm für den Fall n D 2.

Abb. 1.15 Baumdiagramm


zum Abstimmungsverhalten
bis zum Tag 2

18
Benannt nach A NDREI M ARKOW (1856–1922).
28 1 Heurismen der Variation

Gefragt wird zunächst nach der Wahrscheinlichkeit des Ereignisses En WD


f.z0 ; : : : ; zn / 2 ˝ j zn D Ag. Für n D 2 kann man P .E2 / am Baumdiagramm
ablesen:
P .E2 / D P .AAA/ C P .ABA/ C P .BAA/ C P .BBA/
D .1  u/.1  p/2 C .1  u/p 2 C up.1  p/ C u.1  p/p
D .2p 2  2p C 1/.1  u/ C .2p  2p 2 /u :

Die Wahrscheinlichkeit des zu En komplementären Ereignisses En D f.z0 ; : : : ; zn / 2


˝ j zn D Bg wird dann offenbar für n D 2 durch
P .E2 / D 1  P .E2 / D .2p  2p 2 /.1  u/ C .2p 2  2p C 1/u
festgelegt.
Mit wachsendem n wird das Baumdiagramm aber schnell unübersichtlich, da
jeweils 2nC1 Pfade einzuzeichnen und auszuwerten sind; außerdem erweist es sich
als schwierig, P .En / allgemein in Abhängigkeit von n anzugeben und damit zu
untersuchen, ob limn!1 P .En / existiert und den Grenzwert gegebenenfalls zu be-
stimmen.
Wesentlich eleganter ist es, das Abstimmungsverhalten des Parlamentariers als
stochastischen Prozess zu interpretieren: Dazu sei für jedes k 2 f0; : : : ; ng die Zu-
fallsvariable Xk W ˝ ! f1; 2g definiert durch
(
1; falls zk D A I
Xk .z0 ; : : : ; zn / WD
2; falls zk D B :

Die Wahrscheinlichkeitsverteilung einer jeden Zufallsvariablen Xk des stochasti-


schen Prozesses .Xk /k2f0;:::;ng wird dann durch den Vektor
!

qk WD .P .Xk D 1/; P .Xk D 2//t
festgelegt; speziell für k D 0 erhält man
!

q0 D .P .X0 D 1/; P .X0 / D 2/t D .P .z0 D A/; P .z0 / D B/t D .1  u; u/t :
Man bezeichnet ! 
q0 als die Anfangsverteilung des stochastischen Prozesses. Gesucht
!

ist zunächst q D .P .E /; P .E //t – an der ersten Komponente dieses Vektors
n n n
lässt sich die Wahrscheinlichkeit dafür ablesen, dass der Parlamentarier nach n
Tagen für das Gesetz stimmt. Offenbar hängt für 1  k  n die Wahrscheinlich-
keitsverteilung von Xk ausschließlich von der Wahrscheinlichkeitsverteilung der
Zufallsvariablen Xk1 ab, denn es ist
P .Xk D 1/ D P .Xk D 1=Xk1 D 1/  P .Xk1 D 1/
C P .Xk D 1=Xk1 D 2/  P .Xk1 D 2/
D .1  p/  P .Xk1 D 1/ C p  P .Xk1 D 2/
1.1 Variation der Darstellung (Interpretation) 29

und

P .Xk D 2/ D P .Xk D 2=Xk1 D 1/  P .Xk1 D 1/


C P .Xk D 2=Xk1 D 2/  P .Xk1 D 2/
D p  P .Xk1 D 1/ C .1  p/  P .Xk1 D 2/ ;

wobei P .G=H / die bedingte Wahrscheinlichkeit von G unter der Bedingung H be-
zeichne. Stochastische Prozesse dieser Art nennt man Markow-Ketten; der oben
beschriebene Übergang von q ! nach !

qk wird üblicherweise in Matrix-Vektor-
k1
Schreibweise notiert, also in der Form
!
!
 1p p ! :
! DW M  q
qk D qk1 k1
p 1p

Die stochastische Matrix19 M D .mij /2i;j D1 wird als die Übergangsmatrix der
Markow-Kette bezeichnet; stets gibt mij D P .Xk D i=Xk1 D j / die bedingte
Wahrscheinlichkeit dafür an, dass Xk den Wert i annimmt, wenn Xk1 den Wert j
hatte.
In unserem Beispiel sind die Einträge der Übergangsmatrix unabhängig von k,
man spricht dann von einer homogenen Markow-Kette.
Zur Bestimmung von ! 
qn muss man also nur M n  ! 
q0 berechnen, was bekanntlich
leicht ist, wenn M diagonalisierbar ist, denn dann bereitet die Berechnung von
M n keine Schwierigkeiten. Unsere Matrix M ist aber symmetrisch, folglich ist sie
diagonalisierbar!
Zum Zwecke der Diagonalisierung von M bestimmt man zuerst die Eigenwerte
1 D 1 und 2 D 1  2p von M als Nullstellen des charakteristischen Polynoms
f ./ D .1  p  /2  p 2 von M . Als Eigenvektoren zu den Eigenwerten 1 ; 2
ergeben sich z. B. e1 WD .1; 1/t und e2 WD .1; 1/t .
Wählt man als Transformationsmatrix B diejenige reguläre Matrix, deren Spal-
tenvektoren e1 und e2 sind, so folgt
0 1
! 1 1 !
1 1 B 2 1 0
BD 1
D@ 2 C ; B 1  M  B D
1 A
; B ;
1 1 1 0 1  2p

2 2

19
Einen Vektor mit ausschließlich nicht-negativen Komponenten, die sich zu 1 addieren, nennt
man einen stochastischen Vektor; unter einer stochastischen Matrix versteht man eine Matrix,
deren Spaltenvektoren sämtlich stochastisch sind.
30 1 Heurismen der Variation

womit M diagonalisiert wäre. Nun ist


! !n
1 0 1
M D B
n
B
0 1  2p
0 1
! ! 1 1
1 1 1 0 B 2
D  @ 2 C
1 1 0 .1  2p/n 1 1 A

2 2
0 1
1 1 1 1
C .1  2p/n  .1  2p/n
B 2 2 2 2 C
D@ A;
1 1 1 1
 .1  2p/n C .1  2p/n
2 2 2 2

sodass man daraus !



qn zu
0 1
1 1
C .1  2p/n  u.1  2p/n
!
 B C
qn D M n  !

q0 D @ 2 2 A
1 1
 .1  2p/n C u.1  2p/n
2 2
bestimmen kann.
Wegen j12pj < 1 existiert q! !

1 WD limn!1 qn D . 2 ; 2 / ; diese Grenzverteilung
1 1 t

ist der eindeutig bestimmte stochastische Eigenvektor von M zum Eigenwert 1 und
damit eine stationäre Verteilung der Markow-Kette.
Je länger der Parlamentarier also den Manipulationsversuchen seiner Fraktion
oder der Opposition ausgesetzt ist, desto größer ist die Wahrscheinlichkeit, dass er
mit der inneren Einstellung eines „entschiedenen sowohl als auch“ in der Tradition
W ILLY B RANDTs20 zur Abstimmung schreitet. 

Das oben behandelte Beispiel einer Markow-Kette beschreibt eine Situation,


in der alle Spaltenvektoren der n-ten Potenzen M n der Übergangsmatrix M für
n ! 1 gegen denselben stochastischen Vektor  q!
1 konvergieren, der eine statio-
näre Verteilung der Markow-Kette angibt. Markow-Ketten mit dieser Eigenschaft
bezeichnet man als ergodisch. Eine hinreichende Bedingung für die Ergodizität ei-
ner Markow-Kette liefert der Ergodensatz, nach dem eine Markow-Kette ergodisch
ist, wenn für ein k 2 N alle Einträge der k-ten Potenz M k der Übergangsmatrix
M des Markow-Prozesses positiv sind. In dieser Situation ist 
q!
1 der eindeutig be-
stimmte stochastische Eigenvektor zum Eigenwert 1 von M . Hätte man diesen Satz
in der Sektion deklarativen Wissens seiner epistemischen Struktur gespeichert, wä-
re das Problem der Voraussage des Langfristverhaltens der Markow-Kette sofort
gelöst gewesen, denn im Beipiel oben erfüllt M D M 1 die Voraussetzungen des
Ergodensatzes.

20
Diese Formulierung wählte seinerzeit W ILLY B RANDT , als er die Haltung seiner Partei zur
Atomenergie kommentieren sollte.
1.1 Variation der Darstellung (Interpretation) 31

Eine andere Kategorie von homogenen Markow-Prozessen sind die sogenann-


ten absorbierenden Markow-Ketten, welche mindestens einen Zustand enthalten,
aus dem es kein Entrinnen gibt; diese absorbierenden Zustände werden von der
Übergangsmatrix M durch diejenigen i gekennzeichnet, für die mi i D 1 gilt.
Oftmals können Glücksspiele als absorbierende Markow-Ketten interpretiert wer-
den, wobei die absorbierenden Zustände durch „Gewinn“ oder „Verlust“ gegeben
sind. Eine sehr schöne Darstellung des Würfelspiels „Craps“ als mehrstufiges Zu-
fallsexperiment und als absorbierende Markow-Kette findet man im interaktiven
Multimedia-Projekt Mathe-Prisma der Fakultät 4 / Mathematik der Bergischen Uni-
versität Wuppertal.
Es sollte deutlich geworden sein, dass der mathematische Hintergrund von
Markow-Ketten im Begriffssystem der Linearen Algebra durchaus nicht auf ele-
mentarmathematischem Niveau angesiedelt ist. Gleichwohl hat sich in den letzten
Jahren die Untersuchung solcher stochastischen Prozesse als fester Bestandteil der
Aufgaben des Zentralabiturs Mathematik NRW etabliert, was die Frage aufwirft,
ob mit den zu dieser Thematik gestellten Abituraufgaben tatsächlich mathemati-
sches Verständnis oder Modellierungskompetenz der Probanden geprüft werden
kann, oder ob es sich eher darum handelt festzustellen, inwiefern bestimmte
Handlungsroutinen algorithmisch sicher beherrscht werden. Vieles spricht für
die letztgenannte Alternative, so etwa, dass im zeitlichen Vergleich die Sachkon-
texte der Abituraufgaben zum Thema „Übergangsmatrizen“ untereinander völlig
austauschbar wären. Derzeit (2017) scheint denkbar, dass der Matrizenkalkül zur
Behandlung von Markow-Ketten im Zentralabitur Mathematik NRW keine Zukunft
hat.

1.1.4 Quintessenz für Problemlöser

Die in Abschn. 1.1 angestellten Überlegungen machen zwei Dinge deutlich:

1. Vieles spricht dafür, Phase I („Verstehen der Aufgabe“) in P ÓLYAs Phasensche-


ma des Problemlöseprozesses zu untergliedern: Ein tieferes Verständnis eines
identifizierten Problems wird durch die Wahl einer geeigneten Darstellung des
Problems erreicht.
2. Wenn man die erste Phase eines Problemlöseprozesses in der Form
I. Verstehen der Aufgabe:
a) Identifikation des Problems
b) Auffinden einer geeigneten Darstellung des Problems
beschreibt, dann sollte man auch Phase IV („Rückschau“) untergliedern und
explizit die
 Kontrolle der Lösung durch Rückübersetzung in den ursprünglichen Pro-
blemkontext
als Gliederungspunkt der Rückschau-Phase nennen. Wie wichtig dieses Kon-
trollinstrument ist, macht die Diskussion des Sechs-Stäbe-Problems (Bsp. 1.4)
deutlich.
32 1 Heurismen der Variation

Als erste Verfeinerung des P ÒLYAschen Phasenmodells des Problemlöseprozesses


könnte man folgende Darstellung wählen:

Problemlösephasen nach Pólya (Erste Verfeinerung)

I. Verstehen der Aufgabe


a) Identifikation des Problems
b) Auffinden einer geeigneten Darstellung des Problems
II. Ausdenken eines Plans
III. Ausführen des Plans
IV. Rückschau
a) Kontrolle der Lösung durch Rückübersetzung in den ursprünglichen
Problemkontext

Die Identifikation eines Problems wird manchmal explizit durch eine konkrete
Fragestellung angeregt, kann aber auch der Person des Problemlösers überlassen
bleiben, wenn es sich um offene Problemstellungen handelt.21 Die Phasen Ia) und
Ib) bedingen sich gegenseitig, denn ein wesentlicher Punkt der Problemidentifika-
tion ist die Analyse der mathematischen Natur der Problemdaten, und diese dient
gleichzeitig als Kontrollstrategie für das Auffinden einer geeigneten Darstellung des
Problems.

 Geht es um Zuordnungen? Dann lege man die Graphen der Zuordnungen oder
deren Wertetabelle fest, vorzugsweise in einer Tabelle.
 Sind Größenvergleiche anzustellen? Dann kommen nur Repräsentationen inner-
halb der Größenbereiche mathematischer Disziplinen in Frage. Im Bereich der
Geometrie sind dies: Längen, Flächeninhalte, Rauminhalte, Winkelgrößen.
 Werden Zustandsänderungen beschrieben, ohne dass die einzelnen Zustände me-
trische oder geometrische Informationen enthalten? Dann liegt die Verwendung
von Graphen nahe.
 Kann man das Problem im Begriffssystem der Algebra durch Gleichungen oder
Ungleichungen beschreiben? Dann versuche man vom Wechselspiel zwischen
Algebra und Analytischer Geometrie zu profitieren.
 Handelt es sich um Extremwertbestimmungen? Dann kann man bisweilen die
Maschinerie der Analysis durch geometrische Interpretationen im Begriffssys-
tem der Linearen Algebra ersetzen. Davon profitiert man manchmal auch bei der
Beschreibung stochastischer Prozesse.

Im Allgemeinen ist nicht zu erwarten, dass eine geeignete Repräsentation eines


Problems einschrittig zu erreichen wäre. Möglicherweise lassen sich zunächst nur

21
In einem Unterricht, der sich an der Philosophie des entdeckenden Lernens orientiert, werden
häufig offene Aufgabenstellungen in geeigneten Kontexten behandelt.
1.2 Variation der Problemstellung 33

einzelne Teile des Problems interpretieren (z. B. a, b als Streckenlängen, a  b als


Flächenmaß eines Rechtecks wie in Bsp. 1.5, und erst im Verlauf der Phase II des
P ÓLYAschen Problemlöseprozesses entsteht ein vollständiges Bild.
Mit Heurismen der Variation, die der Phase II zuzuordnen sind, werden wir uns
jetzt näher beschäftigen.

1.2 Variation der Problemstellung

Wenn nun ein Problem identifiziert und eine geeignete Darstellung des Problems
(zumindest in Teilen) gefunden ist, damit aber noch kein Lösungsweg erkennbar
wird, dann kann man sich innerhalb des gewählten Repräsentationssystems ver-
schiedener heuristischer Techniken bedienen, die durch Variation unterschiedlicher
Aspekte der Aufgabenstellung (des Allgemeinheitsgrades, der Problemdaten, der
Anordnung der Daten, des Anspruchs an die Exaktheit der Lösung usw.) mögli-
cherweise einen Plan zur Lösung des Problems reifen lassen. Wie bereits früher
erwähnt, werden Heurismen bei Problemlöseprozessen selten in Reinform verwen-
det; die meisten Strategien der Variation sind aber Mischformen aus den Idealtypen,
die im Folgenden an charakteristischen Beispielen vorgestellt werden.

1.2.1 Umformulierung und Analogiebildung

Sichtet man die Instruktionsfragen, die G EORG P ÓLYA in seiner „Schule des Den-
kens“ auflistet, um dem Leser die Inhalte der einzelnen Stufen seines Phasensche-
mas des Problemlöseprozesses zu verdeutlichen, so fällt auf, dass eine Familie von
Fragen der Phase II darauf abzielt, die Lösungsfindung durch deutliches Herausar-
beiten der Bezüge des Problems zu früher erworbenem Wissen zu erleichtern:

 Hast Du die Aufgabe schon früher gesehen? Oder hast Du dieselbe Aufgabe in
einer wenig verschiedenen Form gesehen?
 Kennst Du eine verwandte Aufgabe? Kennst Du einen Lehrsatz, der förderlich
sein könnte?
 Kannst Du die Aufgabe anders ausdrücken? Kannst Du sie auf noch verschiede-
ne Weise ausdrücken?

Das zwischen den Zeilen dieser Fragen angeregte strategische Handeln besteht
offenbar darin, durch Umformulierung und Analogisierung einer Problemstellung
strukturelle Gemeinsamkeiten mit bereits gelösten Problemen gezielt aufzusuchen;
in diesem Zusammenhang spricht man bisweilen von strukturellem Transfer.
Durch verschiedenartige äquivalente Formulierungen22 eines mathematischen
Sachverhalts kann beziehungsreiches Wissen aufgebaut werden, welches günstige
Bedingungen für divergentes Denken im Sinne W ITTMANNs schafft. Dazu seien

22
Auch innerhalb eines Repräsentationssystems, d. h. ohne Variation der Darstellung!
34 1 Heurismen der Variation

als Beispiel sieben Formulierungen des T HALES-Satzes23 angegeben, die man in


einem Standardwerk der Mathematikdidaktik24 finden kann.

 Die Menge der Punkte, von denen aus eine gegebene Strecke unter einem rechten
Winkel erscheint, ist der Kreis, der diese Strecke zum Durchmesser hat.
 Die Spitzen aller rechtwinkligen Dreiecke über einer gegebenen Hypotenuse c
liegen auf dem Kreis mit c als Durchmesser.
 Der Umkreis eines rechtwinkligen Dreiecks hat seinen Mittelpunkt in der Mitte
der Hypotenuse.
 Die Scheitel der rechten Winkel aller rechtwinkligen Dreiecke mit der gleichen
Hypotenuse AB haben vom Mittelpunkt der Strecke AB die gleiche Entfernung,
nämlich die Hälfte von AB.
Variation: In jedem rechtwinkligen Dreieck ist die Seitenhalbierende [der Hypo-
tenuse]25 gleich groß wie die halbe Hypotenuse.
 In einem Sehnenviereck, dessen eine Diagonale durch den Kreismittelpunkt
geht, sind die dieser Diagonalen gegenüberliegenden Winkel beide je gleich 90ı .
 Zu einem Peripheriewinkel von 90ı gehört als Mittelpunktswinkel immer ein
gestreckter Winkel, also ein Kreisdurchmesser.
 Der zu einem Bogen von 180ı gehörige Umfangswinkel beträgt 90ı .

Aus der Sicht des Problemlösers interessant ist dabei die Tatsache, dass die Umfor-
mulierung einer Problemstellung durch die Erhöhung der Anzahl angesprochener
Bereichsbezüge die Wahrscheinlichkeit dafür erhöht, dass Anknüpfungspunkte mit
dem Wissensinhalt der epistemischen Struktur des Problemlösers gefunden werden
und so Ideen für einen Lösungsplan entwickelt werden können.
Die Analogiebildung beim Problemlösen bezeichnet die meist anspruchsvolle
heuristische Tätigkeit, ein in einem System S1 gegebenes Problem in ein für die
Person des Problemlösers überschaubareres System S2 zu übertragen, Lösungside-
en für das nach S2 transferierte Problem zu entwickeln, diese Ideen nach S1 zu
reimportieren und für die Lösung des ursprünglichen Problems nutzbar zu machen.
Diese vage Formulierung macht deutlich, wie universell der Heurismus der Analo-
gisierung eingesetzt werden kann, und zwar nicht nur beim Problemlösen, sondern
auch beim Ausbau mathematischer Theorien.
Die Kehrseite der Universalität des Prinzips ist, dass im konkreten Fall der Ver-
wendung der Strategie der Analogisierung beim Problemlösen in der Regel nicht
klar ist, welches überschaubarere System S2 und welche Analogisierungstransfor-
mation T W S1 ! S2 für die Lösung des Ausgangsproblems P hilfreich sein könn-
te. Ein naheliegendes Kriterium für die Auswahl von S2 und T W S1 ! S2 wäre in
der Zielsetzung zu sehen, die Informationsverluste beim Rücktransfer einzelner Lö-
sungskonzepte für T .P / in die ursprüngliche Problemsituation P zu minimieren.

23
Benannt nach T HALES VON M ILET (ca. 650–560 v. Chr.), einem der „Sieben Weisen“ Griechen-
lands, der sich mit P YTHAGORAS den Ruhm des Begründers der frühgriechischen Mathematik
teilt.
24
C LAUS , H. J.: Einführung in die Didaktik der Mathematik, 2. Auflage. Darmstadt 1995.
25
Ergänzt durch den Verfasser.
1.2 Variation der Problemstellung 35

Auch dies ist wieder ein sehr allgemeiner Hinweis, der in konkreten Situationen
nur bedingt hilfreich ist; meist bedarf es eben der Beachtung weiterer heuristischer
Prinzipien, um geeignete Analogiebildungen finden zu können. So könnte man et-
wa das Vorgehen, bei Aufgabenstellungen der diskreten Mathematik Beziehungen
zwischen den beteiligten Objekten festzustellen und das Problem auf Systeme mi-
nimaler Zahl von Objekten herunterzutransformieren, für die diese Beziehungen
noch sinnvoll aufrechterhalten werden können, als Analogiebildung unter Beach-
tung des Extremalprinzips deuten. Der inhaltliche Schwerpunkt von Analogiebil-
dungen unter Beachtung diverser heuristischer Strategien liegt bei den verwendeten
Heurismen selbst, die an anderer Stelle in dieser Arbeit diskutiert werden.
Sicherheitshalber sei noch einmal explizit festgestellt, dass die hier verwendete
Deutung des Begriffs der Analogisierung weniger restriktiv gefasst ist als in Tei-
len insbesondere der englischsprachigen Literatur: Bisweilen ist die Terminologie
„analogous problem“ im Sinne dessen zu verstehen, was in der hier vorgestellten
Systematik als ein „äquivalentes Problem“ zu verstehen wäre, erzielt durch Umfor-
mulierung in einem fest gewählten Repräsentationssystem oder durch Darstellung
des Problems in einem anderen Gegenstandsbereich (Variation der Darstellung).
Zur Erläuterung soll ein Beispiel dienen, welches in P OUNDSTONEs „Labyrinths of
Reason“ zu finden ist.26

Beispiel 1.11 (Aufzugbekanntschaften)


In einem Aufzug befinden sich sechs Personen. Man finde eine Begründung dafür,
dass mindestens drei Personen einander völlig unbekannt sind oder dass mindestens
drei Personen gefunden werden können, die sich paarweise untereinander kennen.
In diesem Problem geht es offenbar um Zuordnungen: Einer jeden Person im
Aufzug sind die ihr bekannten Mitfahrer zuzuordnen, was sich im Repräsenta-
tionssystem der Graphentheorie dadurch erledigen lässt, dass man die Personen
P1 ; : : : ; P6 im Aufzug als Ecken eines Graphen interpretiert und zwischen zwei
Ecken eine Verbindungskante einzeichnet, wenn die zugehörigen Personen einan-
der kennen. Dabei entsteht ein Subgraph von K6 , dem vollständigen Graphen auf
sechs Ecken (Abb. 1.16).

Abb. 1.16 Repräsentation


der Bekanntschaftrelation
durch einen Graphen

Der zu diesem Teilgraphen komplementäre Subgraph von K6 (gestrichelt ge-


zeichnet) weist genau dann eine Kante zwischen zwei Ecken auf, wenn sich die

26
Freie und sinnklärende Übersetzung durch den Verfasser: Im Original ist die Rede von „eit-
her . . . or“, allerdings ist damit im mathematischen Englisch häufig auch ohne den Zusatz „(or
both)“ das nicht ausschließende „oder“ gemeint, was hier angebracht wäre, da offenbar beide Be-
dingungen simultan erfüllbar sind.
36 1 Heurismen der Variation

zugehörigen Personen nicht kennen. Subgraph und komplementärer Subgraph ge-


meinsam definieren eine Partition des vollständigen Graphen auf sechs Ecken in
zwei Subgraphen (Abb. 1.17).

Abb. 1.17 Partition von K6


durch Subgraph und komple-
mentären Subgraph

Drei Personen sind einander völlig fremd, wenn zwischen je zwei der zugehöri-
gen drei Ecken eine Kante gestrichelt eingezeichnet ist; drei Personen kennen sich
paarweise untereinander, wenn zwischen je zwei der drei zugehörigen Ecken eine
Kante ungestrichelt eingezeichnet ist. In der Sprache der Graphentheorie ließe sich
das ursprüngliche Problem daher folgendermaßen formulieren:

Man finde eine Begründung dafür, dass in jeder Partition des vollständigen Gra-
phen auf sechs Ecken in genau zwei Subgraphen mindestens einer der beiden
Teilgraphen seinerseits den vollständigen Graphen auf drei Ecken (K3 ) als Sub-
graphen enthält.

Die Lösung dieses graphentheoretischen Problems ließe sich Zug um Zug in ei-
ne Lösung des ursprünglichen Problems zurückübersetzen – beide Probleme sind
äquivalent.
Eine Analogisierung käme ins Spiel, wenn man ein ähnliches, aber einfache-
res graphentheoretisches Problem formulierte, um aus dessen Lösung Ideen für
die Lösung des zum ursprünglichen Problem äquivalenten graphentheoretischen
Problems zu entwickeln. Naheliegende Analogiebildungen (mit Absicht vorsich-
tigerweise fragend formuliert!) wären:

(1) Ist es richtig, dass in jeder Partition des vollständigen Graphen auf vier Ecken
in genau zwei Subgraphen mindestens einer der beiden Teilgraphen seinerseits
den vollständigen Graphen auf zwei Ecken als Subgraphen enthält?
(2) Ist es richtig, dass in jeder Partition des vollständigen Graphen auf vier Ecken
in genau zwei Subgraphen mindestens einer der beiden Teilgraphen seinerseits
den vollständigen Graphen auf drei Ecken als Subgraphen enthält?

Die erste Analogiebildung erhält zwar den Quotienten 2 D 6 W 3 D 4 W 2 aus den


Eckenzahlen von Graphen und Subgraphen, ist aber nicht besonders produktiv, weil
der vollständige Graph auf zwei Ecken Teilgraph eines jeden Graphen ist, der nicht
ausschließlich isolierte Ecken aufweist; wenn sich nun zwei Graphen komplemen-
tär zum vollständigen Graphen auf vier Ecken ergänzen, hat mindestens einer davon
nicht ausschließlich isolierte Ecken und enthält deshalb den vollständigen Graphen
auf zwei Ecken als Subgraphen. Die unter (1) gestellte Frage ist also positiv zu be-
antworten, aber daraus erhält man keine Impulse für die Lösung des ursprünglichen
Problems – der Informationsverlust bei dieser Transformation ist zu groß.
1.2 Variation der Problemstellung 37

Anders ist die Situation bei der Analogiebildung (2): Partitioniert man den voll-
ständigen Graphen auf vier Ecken derart, dass keiner von zwei komplementären
Subgraphen G1 ; G2 eine Ecke der Ordnung 3 hat, so enthält weder G1 noch G2 den
vollständigen Graphen auf drei Ecken als Subgraphen (Abb. 1.18).

Abb. 1.18 Partition in Sub-


graphen mit Eckenordnungen
kleiner als 3

Enthält aber einer der beiden komplementären Teilgraphen G1 ; G2 (O. B. d. A.


G1 ) eine Ecke der Ordnung 3 wie etwa P4 in Abb. 1.19, so ist diese Ecke mit drei
anderen Ecken verbunden (im abgebildeten Fall mit P1 ; P2 ; P3 ).
Sobald auch nur eine der Verbindungskanten dieser drei Ecken im vollständigen
Graphen auf vier Ecken zu G1 gehört, enthält offenbar G1 den vollständigen Gra-
phen auf drei Ecken als Subgraph; anderenfalls gehören alle Verbindungskanten
dieser drei Ecken im vollständigen Graphen auf vier Ecken zu G2 , womit dann der
vollständige Graph auf drei Ecken ein Teilgraph von G2 wäre, wie Abb. 1.19 zeigt.

Abb. 1.19 K3 als Teilgraph


bei einer Eckenordnung grö-
ßer oder gleich 3

Obwohl die Frage (2) negativ beantwortet werden muss, gewinnt man aus der
Analogisierung (2) die entscheidende Idee für die Lösung des ursprünglichen gra-
phentheoretischen Problems:
Wenn man zeigen kann, dass in jeder Zerlegung des vollständigen Graphen auf
sechs Ecken in zwei Subgraphen G1 ; G2 mindestens einer dieser Subgraphen eine
Ecke der Ordnung n  3 enthält, dann ergibt sich wörtlich wie oben, dass G1 oder
G2 (oder beide) den vollständigen Graphen auf drei Ecken als Teilgraphen enthalten
müssen. Nun hat aber jede Ecke E im vollständigen Graphen auf sechs Ecken die
Ordnung 5 D 0 C 5 D 1 C 4 D 2 C 3; in jeder Partition G1 ; G2 ist also E eine Ecke
mindestens der Ordnung 3 von G1 oder G2 . Damit ist das Problem gelöst. 

Das in diesem Beispiel verwendete Denkmuster zur Analogisierung könnte man


als Analogiebildung durch Restriktion bezeichnen. Zur Vereinfachung der Problem-
situation beschränkt man sich auf kleinere Teile des vollständigen Graphen auf
sechs Ecken (nämlich den vollständigen Graphen auf vier Ecken) und prüft dafür
die postulierten (vollständiger Graph auf drei Ecken als Subgraph) oder verwandte
(vollständiger Graph auf zwei Ecken als Subgraph) Zusammenhänge.
Dieses Denkmuster der Analogiebildung wird keinesfalls nur in Problemsitua-
tionen der diskreten Mathematik verwendet: Ganz allgemein können Projektionen
38 1 Heurismen der Variation

T W Rn 7! Rk mit k < n als Restriktionen interpretiert werden, beispielsweise


bei der Schaffung von Analogien zwischen Phänomenen der räumlichen und der
ebenen Geometrie. Der Begriff „Restriktion“ tritt originär bei der Einschränkung
von Funktionen auf Teile ihres Definitionsbereichs auf; auch diesen Zusammen-
hang könnte man im weitesten Sinne als Analogiebildung deuten.

1.2.2 Variation der Wahrnehmung durch Reorganisation

Die Reorganisation einer Problemstellung umfasst alle Maßnahmen, die zu einem


Gestaltwechsel des Problems führen; a priori scheint nicht klar, inwiefern damit
eine heuristische Handlung beschrieben werden könnte, denn oft zeigt sich in der
Reorganisation der Daten die Problemlösung selbst. So stellte A LFRED S CHREI -
BER einst sinngemäß fest, dass die Aufforderung, ein Problem zu reorganisieren,
eigentlich nur als Wiederholung der Aufforderung verstanden werden könnte, das
Problem zu lösen.
Es lohnt sich also, die Abläufe bei der Reorganistion einer Problemstellung ein-
mal näher zu betrachten.
Das Paradebeispiel für Problemlösen durch Reorganisation ist die vielzitierte
Gauß-Aufgabe, welche die Berechnung der Summe der ersten n natürlichen Zahlen
zum Gegenstand hat. G AUSS wird nachgesagt27 , er habe dies als jüngster Schüler
seiner Rechenklasse im Alter von neun Jahren für den Fall n D 100 innerhalb kür-
zester Zeit erledigt und seine Schiefertafel mit dem richtigen Ergebnis 5050 und
dem Kommentar „Ligget se!“ (Braunschweiger Dialekt: „Da liegt sie!“) auf den
Tisch geworfen, lange bevor seine älteren Mitschüler ihre Ergebnisse hätten prä-
sentieren können.
G AUSS soll erkannt haben, dass nach geschicktem Umsortieren der Summanden
nur noch eine einfache Multiplikationsaufgabe zu bewältigen war, die er im Kopf
lösen konnte:

1 C 2 C 3 C    C 49 C 50 C 51 C 52 C    C 98 C 99 C 100
D .1 C 100/ C .2 C 99/ C .3 C 98/ C    C .49 C 52/ C .50 C 51/
D 101  50 D 5050 :

Aus der Perspektive der Wahrnehmungspsychologie lässt sich diese spezielle Vorge-
hensweise der Reorganisation der Problemdaten als Ausprägung einer allgemeinen
heuristischen Strategie auffassen, die folgendermaßen strukturiert ist:

27
Einer der engsten Freunde des älteren Gauß, S ARTORIUS VON WALTERSHAUSEN, überlieferte
diese Anekdote in der Gedenkschrift „Gauß zum Gedächtnis“, Leipzig 1856.
1.2 Variation der Problemstellung 39

Variation der Problemwahrnehmung

 Man mache sich die mentalen Verarbeitungsprozesse bewusst, die beim


Zusammenfügen einzelner Sinneseindrücke zu einer wahrgenommenen
Entität durchlaufen werden.
 Man transferiere diese Organisationsmechanismen auf die vorliegende
Problemsituation, um die Gesetzmäßigkeiten seiner persönlichen Wahr-
nehmung des Problems zu begreifen.
 Man variiere seine Wahrnehmung des Problems durch bewusste Unter-
drückung dieser Mechanismen mit einer passenden Umstrukturierung der
Problemsituation.

Eine zielgerichtete Reorganisation der Problemdaten zur Variation der Problem-


wahrnehmung erfordert offenbar Einblicke in die wesentlichen Elemente der Wahr-
nehmungsorganisation; diese sollen im Folgenden kurz erläutert werden.
Eine der Grundlagen der Wahrnehmungspsychologie ist das 1886 erschienene
Buch „Die Analyse der Empfindung“ des österreichischen Physikers, Psychologen
und Philosophen E RNST M ACH (1838–1916). M ACHs zentrales Ergebnis war die
Erkenntnis, dass bei der visuellen Wahrnehmung eines Gegenstandes die Form als
Ganzes über die weiteren Unterscheidungsmerkmale dominiert. Die Grundgedan-
ken M ACHs wurden in den Folgejahren von C HRISTIAN VON E HRENFELS wei-
terentwickelt, bevor ab 1912 die Psychologen M AX W ERTHEIMER, W OLFGANG
KÖHLER und K URT KOFFKA die Ansätze von E HRENFELS zu einer umfassenden
psychologischen Ganzheitslehre ausbauten: der Gestalttheorie.
Grundlegend für diese Theorie war die Annahme, der Wahrnehmungsprozess
könne durch Zerlegung in immer kleinere Teilprozesse nicht vollständig verstanden
werden, zum Ausdruck gebracht durch die Maxime: Eine Gestalt ist mehr als die
Summe der Einzelteile.28 Eine Gestalt ist das Ergebnis der mentalen Zusammen-
fassung und Ordnung von Informationen, die von Millionen von Rezeptoren auf
der Netzhaut gesammelt werden, also das Resultat einer Organisation der Wahr-
nehmung. Die Experimente der Gestalttheoretiker lassen sich so deuten, dass der
Prozess der Organisation der Wahrnehmung derart angelegt ist, dass sich als Per-
zept29 die einfachste Interpretation ergibt, die sich mit den Sinnesreizen und den
Vorerfahrungen vereinbaren lässt („Prägnanzgesetz“).

28
Diese Sicht der Dinge ist auch unter dem Namen „E HRENFELSkriterium der Übersummativität“
bekannt.
29
Als Perzept bezeichnet man das erfahrene Ergebnis des gesamten Wahrnehmungsprozesses, al-
so weder den physikalischen Gegenstand noch sein Abbild in einem Rezeptorensystem, sondern
die Auswertung der sensorischen Informationen und ihre Einordnung in das bereits vorhandene
Wissen.
40 1 Heurismen der Variation

Die Relevanz der Vorerfahrungen für die Ergebnisse der Wahrnehmungsorgani-


sation ist dabei strittig: Die Gestalttheoretiker waren davon überzeugt, dass jedes
Perzept das Ergebnis angeborener Wahrnehmungstendenzen darstellt, aus lernpsy-
chologischer Sicht spielen aber Lernerfahrungen die entscheidende Rolle.30
Das Objekt in Abb. 1.20 dürfte von den meisten als eine von rechts nach links
ansteigende Treppe wahrgenommen werden, bei der die grau eingefärbte Fläche im
Vordergrund der Abbildung liegt und als graue Seitenwand gesehen werden kann.

Abb. 1.20 Treppe mit grauer


Seitenwand

Interpretierte man aber die grau eingefärbte Fläche als Hintergrund der Abbil-
dung, so wäre das Perzept eine auf dem Kopf stehende Treppe mit weißer Seiten-
wand. Zur Hervorhebung dieser unterschiedlichen Interpretationen wird in Abb.
1.21 der jeweilige Hintergrund von den Konturen des Objekts gelöst und eine text-
liche visuelle Hilfe hinzugefügt.

Abb. 1.21 Treppe bei Vertauschung von Vordergrund und Hintergrund

Nachdem also in einem ersten Schritt der Wahrnehmungsorganisation eine Be-


reichsstrukturierung erfolgt ist (eine Festlegung von Grenzen zwischen Regionen
unterschiedlicher Farbqualität oder Textur; oben: heller Bereich – dunkler Bereich),
werden im zweiten Schritt der Wahrnehmungsorganisation die Zonen ähnlicher
Farbqualität oder Textur in Figur und Grund unterteilt – dies wird als das Gesetz
der Figur-Grund-Gliederung bezeichnet.

30
Für beide Auffassungen gibt es experimentelle Bestätigungen, wahrscheinlich muss beides be-
rücksichtigt werden.
1.2 Variation der Problemstellung 41

Die Grenzen zwischen Figur und Grund werden dabei als Konturen interpretiert,
die zur jeweiligen Figur gehören und ihren Umriss markieren.
Dem Gesetz der Figur-Grund-Gliederung sind von den Gestalttheoretikern
weitere Gestaltgesetze untergeordnet worden, in denen Bedingungen beschrieben
werden, die die Zuordnung gewisser Teile des Sehfeldes zu Figur oder Grund
favorisieren. Wenn etwa im Sehfeld extrem symmetrische und weniger symmetri-
sche oder asymmetrische Objekte erscheinen, besteht die Tendenz, die Ebenen der
Figur-Grund-Organisation in Abhängigkeit vom Ausprägungsgrad der Symmetrie
der Objekte anzuordnen und das symmetrischste Bildelement als Figur, die asym-
metrischsten Bildelemente als Grund sowie die weniger symmetrischen Objekte
als nachgeordnete Figuren wahrzunehmen („Symmetriegesetz“).
Dieser Effekt tritt sogar dann auf, wenn es die wahrgenommene Figur eigent-
lich gar nicht gibt. In Abb. 1.22 sieht man ein weißes Dreieck, welches Teile eines
schwarzen Dreiecks und dreier schwarzer Kreise verdeckt, obwohl die Bildvorlage
tatsächlich nur drei Winkel und drei Kreissektoren enthält.
Abb. 1.22 Illusionäre
Konturen: Gesetz der Ge-
schlossenheit

Das gesamte weiße Feld wird von unserem Wahrnehmungssystem in zwei Ebe-
nen geteilt: in der obersten Ebene das weiße Dreieck als Figur, in der untersten
Ebene der weiße Grund. Wo diese Teilung erfolgt, fügt das Wahrnehmungssystem
die Grenzen hinzu, und man nimmt eine illusionäre Kontur wahr. Der Organisati-
onsprozess, der dazu führt, unvollständige Figuren als vollständig wahrzunehmen,
wird als Gesetz der Geschlossenheit bezeichnet.
Die Gesetze der Gruppierung legen Kriterien fest, nach denen einzelne Teile ei-
ner Darstellung als zusammengehörig wahrgenommen werden. Von W ERTHEIMER
selbst wurden unter anderem das Gesetz der Nähe, das Gesetz der Ähnlichkeit, das
Gesetz der guten Kurve und das Gesetz des gemeinsamen Schicksals formuliert.
Das Gesetz der Ähnlichkeit besagt, dass einander ähnliche Objekte unter sonst
gleichen Bedingungen als zusammengehörig wahrgenommen werden. Dabei kann
sich „Ähnlichkeit“ auf unterschiedliche Aspekte wie Kontur, Textur, Farbton, Hel-
ligkeit, Größe oder Vergleichbares beziehen.
Das Gesetz der Nähe stellt fest, dass unter sonst gleichen Bedingungen dicht bei-
einander positionierte Objekte im Wahrnehmungsprozess zusammengruppiert wer-
den. Beides kann vor dem Hintergrund des Prägnanzgesetzes verstanden werden:
Die Bilder werden so wahrgenommen, dass die Gestalten vom visuellen System
schneller und einfacher kodiert werden können.
42 1 Heurismen der Variation

Bei der Betrachtung von Abb. 1.23 nimmt man wahrscheinlich links eine verti-
kale Anordnung von Kreisen und Quadraten wahr, die jeweils spaltenweise zusam-
mengruppiert werden – hier dominiert das Gesetz der Ähnlichkeit. Rechts sollte
ein horizontales Muster von Kreisen und Quadraten, die zeilenweise zusammen-
gruppiert werden, sichtbar sein – hier dominiert das Gesetz der Nähe.

Abb. 1.23 Gesetz der Ähnlichkeit und Gesetz der Nähe

Die Wahl der Objektabstände in Abb. 1.24 links lässt erwarten, dass die Prädo-
minanz einzelner Gruppierungsgesetze ungeklärt bleibt und sich das Perzept eines
horizontalen oder auch eines vertikalen Musters ergibt. Durch die Verringerung der
Ähnlichkeiten zwischen Kreisen und Quadraten über die Erhöhung des farblichen
Kontrastes lässt sich jedoch die Wahrscheinlichkeit dafür erhöhen, dass das Gesetz
der Ähnlichkeit an Bedeutung gewinnt und eher ein vertikales Muster wahrgenom-
men wird (Abb. 1.24, rechts).

Abb. 1.24 Bedeutungszuwachs des Gesetzes der Ähnlichkeit durch Kontrasterhöhung

Besteht die Ähnlichkeit von Objekten darin, dass sie sich mit derselben Ge-
schwindigkeit in die gleiche Richtung bewegen, so ist die Tendenz des Wahrneh-
mungssystems, dem Gesetz der Ähnlichkeit Vorrang vor anderen Gestaltgesetzen
einzuräumen und diese Objekte als zusammengehörig zu gruppieren, sehr stark.
Diese Übertragung des Gesetzes der Ähnlichkeit in die Kategorie bewegter Objek-
te wurde von W ERTHEIMER als Gesetz des gemeinsamen Schicksals bezeichnet.
Auch ohne die reale Existenz einer Bewegung tritt der Effekt in abgeschwächter
Form auf; visuelle Hinweise auf potenzielle Bewegungen oder angedeutete gleiche
Orientierungen genügen.
1.2 Variation der Problemstellung 43

Abb. 1.25 Gesetz der guten


Kurve

In Abb. 1.25 wären nach dem Gesetz der Nähe oder dem Gesetz des gemein-
samen Schicksals Gruppierungen der einzelnen Punkte zu verschiedenen Kurven
denkbar. Wahrscheinlich gruppiert man die Punkte aber zu Verbindungskurven von
A und C bzw. von B und D.
Die Tendenz unseres Wahrnehmungssystems, vorrangig Perzepte glatter Kurven
zu entwickeln, wurde von den Gestalttheoretikern als Gesetz der guten Kurve be-
zeichnet. Auch dieses Gesetz ließe sich auf der Grundlage des Prägnanzgesetzes
verstehen, dem, wie wir gesehen haben, in der Systematik der Gestaltgesetze eine
ähnliche übergeordnete Bedeutung zukommt wie dem Gesetz der Figur-Grund-
Gliederung.
Nun zurück zur Gauß-Aufgabe:
Welche Informationen über unsere wahrscheinliche Wahrnehmung der Aufgabe
1 C 2 C 3 C    C 49 C 50 C 51 C 52 C    C 98 C 99 C 100
lassen sich aus den Gestaltgesetzen gewinnen?
Das Gesetz der Nähe sorgt dafür, dass einander benachbarte Zahlen (wie z. B.
1 und 2) in dieser Darstellung eher zusammengruppiert werden als weit auseinan-
derliegende Zahlen (wie z. B. 1 und 100). Die konventionelle Leserichtung (von
links nach rechts) legt angesichts der Länge der Zeichenkette die Operatordeutung
der Addition nahe (zuerst 1, dann C2, dann C3, . . . ), was durch die Abschnitte
„C    C“ noch verstärkt wird. Die damit hervorgehobene links-rechts-Orientierung
führt über das Gesetz des gemeinsamen Schicksals zum Perzept einer von links nach
rechts orientierten Kette von Additionsoperatoren.
Zur Variation der Problemwahrnehmung müssen Umstrukturierungen vorge-
nommen werden, die dieses Perzept unwahrscheinlich machen; durchzuführen
sind also Reorganisationen der Problemdaten, welche die Rechenrichtung ändern.
Folgende Umstrukturierungen sind naheliegend:

 Rechenrichtung von rechts nach links:

1 C 2 C 3 C    C 49 C 50 C 51 C 52 C    C 98 C 99 C 100 ;
  
also Berechnung von
100 C 99 C 98 C    C 52 C 51 C 50 C 49 C    C 3 C 2 C 1 :
44 1 Heurismen der Variation

 Rechenrichtung von außen nach innen:

1 C 2 C 3 C    C 49 C 50 C 51 C 52 C    C 98 C 99 C 100 ;
! ! !   

also Berechnung von

.1 C 100/ C .2 C 99/ C .3 C 98/ C    C .49 C 52/ C .50 C 51/ :

 Rechenrichtung von innen nach außen:

1 C 2 C 3 C    C 49 C 50 C 51 C 52 C    C 98 C 99 C 100 ;
   ! ! !

also Berechnung von

.50 C 51/ C .49 C 52/ C .48 C 53/ C    C .2 C 99/ C .1 C 100/ :

Die erste Umstrukturierung liefert keine neuen Erkenntnisse, aber die zweite und
die dritte legen den Lösungsweg frei, den der neunjährige G AUSS gegangen sein
soll – mit Sicherheit ohne jegliches Wissen um gestalttheoretische Zusammenhän-
ge, ebenso sicher aber mit einer überragenden mathematischen Begabung, die ihn
die Symmetrien der Problemstellung hat erkennen lassen.
Heuristisches Handeln unter dem Gesichtspunkt des Symmetrieprinzips werden
wir in Abschn. 1.2.3 im Zusammenhang mit dem Invarianzprinzip thematisieren;
zuvor aber soll die heuristische Strategie der Variation der Problemwahrnehmung
noch an einem Klassiker unter den geometrischen Problemen demonstriert werden,
dem berühmten Neun-Punkte-Problem von W ERTHEIMER.

Beispiel 1.12 (Neun-Punkte-Problem; W ERTHEIMER)


Ist es möglich, die neun Punkte des rechts abgebildeten Punktmusters miteinander
durch einen Streckenzug zu verbinden, der nicht mehr als vier Strecken enthält?

Nach dem Gesetz der Figur-Grund-Gliederung wird man wahrscheinlich das


schwarze Punktmuster als Figur vor weißem Grund wahrnehmen.
Nach dem Gesetz der Ähnlichkeit ist anzunehmen, dass man keine horizontale
oder vertikale Gliederung der Figur, sondern ein quadratisches Punktfeld erkennt.
Die Grenzen zwischen Figur und Grund markieren den Umriss des Quadrates, der
als zur Figur gehörend wahrgenommen wird.
1.2 Variation der Problemstellung 45

Man wird deshalb wahrscheinlich versucht sein, einen Streckenzug mit vier Stre-
cken zu finden, der alle Punkte verbindet, aber die quadratische Kontur der Figur
nicht verlässt – ein solcher Streckenzug existiert allerdings nicht.

Abb. 1.26 Lösung des Neun-


Punkte-Problems

Die zielführende Umstrukturierung der Problemstellung besteht darin, die wahr-


genommenen Grenzen des Punktmusters aufzuweichen. In Abb. 1.26 wird die Lö-
sung des Umrisses vom Punktmuster durch die farbig unterlegte Fläche visualisiert,
in die die neun Punkte vor weißem Hintergrund eingebettet sind.
Damit wird der Blick frei für eine Lösung wie den eingezeichneten Weg von A
nach E längs des Kantenzuges (1) ! (2) ! (3) ! (4). 

1.2.3 Invarianzprinzip und Symmetrieprinzip

„If there is repetition, look for what does not change!“ – mit diesen Worten um-
schrieb einst A RTHUR E NGEL31 die unter dem Namen „Invarianzprinzip“ bekannte
heuristische Strategie, welche darin besteht, Invarianten gewisser Transformationen
oder Algorithmen zu studieren und daraus Informationen für die Lösbarkeit von
Problemen zu gewinnen; dabei sind grundsätzlich zwei Ausprägungen denkbar.
Einerseits kann es sein, dass die betreffenden Algorithmen oder Transformatio-
nen bereits im Problemkontext vorgegeben sind, wie beispielsweise in folgender
Situation:
Gegeben sind eine Menge Z von Zuständen und ein Algorithmus, der Z in sich
überführt. Das Problem besteht darin zu entscheiden, ob ein gewisser Anfangszu-
stand Za durch den Algorithmus in endlich vielen Schritten in den Endzustand
Ze überführt werden kann. Findet man nun eine unter dem Algorithmus invari-
ante Funktion f auf Z mit f .Za / ¤ f .Ze /, so muss die Frage offenbar verneint
werden – das Problem ist gelöst (vgl. Beispiel 1.18).

31
E NGEL , A.: Problem-solving strategies. Springer, New York (1998).
46 1 Heurismen der Variation

Andererseits kann es aber auch sein, dass im Problemkontext gewisse Relatio-


nen oder Eigenschaften vorgegeben sind und man einer Lösung des Problems da-
durch näher zu kommen versucht, dass man sich nach Transformationen umsieht,
die diese vorgegebenen Relationen oder Eigenschaften invariant lassen. Die An-
wendung solcher Transformationen auf die Problemdaten stellt eine Variation der
Problemstellung unter dem Gesichtspunkt des Invarianzprinzips dar, womit die in
dieser Arbeit vorgenommene Zuordnung des Invarianzprinzips zu den Heurismen
der Variation legitimiert wäre. Auch unter dem ersten Aspekt ist diese Subsumption
möglich, wenn man die Ausführung im Problemkontext vorgegebener Transforma-
tionen oder Algorithmen als probleminhärente Variation interpretiert.

Heuristisches Handeln gemäß Invarianzprinzip

(Inv 1) Gegeben: Transformation.


Suche: Invarianten dieser Transformation.
(Inv 2) Gegeben: Relation oder Eigenschaft.
Suche: Transformation, die diese Relation oder Eigenschaft als Invariante
hat.

Beide Ausprägungen heuristischen Handelns gemäß dem Invarianzprinzip lassen


sich in Kurzform wie oben darstellen; nun sollen (Inv 1) und (Inv 2) an einigen
Beispielen verdeutlicht werden, die insbesondere die Vielfalt denkbarer Invarianten
aufzeigen.
Der Version (Inv 1) begegnet man häufig bei Mischungsvorgängen: Werden n
Stoffe S1 ; : : : ; Sn , die einen Rohstoff R jeweils mit den Anteilen p1 ; : : : ; pn enthal-
ten, miteinander vermischt und enthält die Mischung jeweils mi Mengeneinheiten
des Stoffes Si .1  i  n/, so ist der Anteil p des Rohstoffs R in der fertigen
Mischung gegeben durch
m1 p1 C m2 p2 C    C mn pn
(MF) p D ;
m1 C m2 C    C mn
Pn
also das gewichtete arithmetische Mittel i D1 gi pi mit den Gewichtsfaktoren
gi WD m1 CCmn (1  i  n).
mi

Die Invariante, mit deren Hilfe man Formel (MF) herleiten kann, ist die unver-
änderte Gesamtzahl m der Mengeneinheiten des Rohstoffs R in S1 ; : : : ; Sn vor der
Mischung (m D m1 p1 C m2 p2 C    C mn pn ) oder nach der Mischung (m D
p  .m1 C    C mn / ) von jeweils mi Einheiten des Stoffs Si ; aus der Gleichung

m1 p1 C m2 p2 C    C mn pn D p  .m1 C    C mn /

ergibt sich sofort die Mischungsformel.


Mithilfe dieser Formel könnte man das folgende Problem eines Partyservice lö-
sen.
1.2 Variation der Problemstellung 47

Beispiel 1.13 (Saft im Sekt / Sekt im Saft)


Den Gästen einer Party soll als Begrüßungsgetränk Sekt mit Orangensaft in zwei
unterschiedlichen Zusammensetzungen serviert werden: Die Light-Version soll
einen Sektanteil von nur 16 , die andere Variante einen Sektanteil von 13 enthalten.
Der nervöse Gastgeber hat zwei Bowlengefäße mit je 10 ` Fassungsvermögen
jeweils zur Hälfte gefüllt. Ein Gefäß enthält Orangensaft pur, das andere enthält eine
Mischung aus Sekt und Orangensaft mit einem Sektanteil von 50 %. Wie kann man
einen 500 m`-Messbecher dazu verwenden, durch Umfüllen von Gefäß zu Gefäß in
jeder Bowlenschüssel eine der gewünschten Zusammensetzungen herzustellen?
Sofort ist klar, dass man durch Umfüllen von 2;5 ` Orangensaft in das Gefäß mit
dem Sekt-Orangensaft-Gemisch insgesamt 7;5 ` Mischgetränk mit einem Sektanteil
von 13 herstellen kann:
 
1 5  12 C m2  0 1 1 1 5
D ) m2 D 5   ) m2 D :
3 5 C m2 3 2 3 2

Ebenso findet man mit der Mischungsformel heraus, dass man durch Umfüllen von
2;5 ` des Getränks mit einem Sektanteil von 13 in die Schüssel mit reinem Orangen-
saft dort eine Mischung mit einem Sektanteil von 16 erhält:

1 m1  13 C 5
0 1 5 5
D 2
) m1 D ) m1 D :
6 m1 C 5
2
6 12 2

Man muss also nur 2;5 ` Saft in die Mischung und dann 2;5 ` der neuen Mischung in
den Saft schütten, um jeweils 5 ` Sekt-Orangensaft-Mischgetränk mit einem Sekt-
anteil von 16 bzw. einem Sektanteil von 13 herzustellen.
Man hätte das Invarianzprinzip aber auch ohne direkte Verwendung der Mi-
schungsformel zur Lösung dieses Problems benutzen können:
Solange sich in beiden Gefäßen gleich viel Flüssigkeit befindet und der Sekt-
anteil in der einen Schüssel ˛  12 mit 0  ˛  1 ist, muss der Sektanteil in der
anderen Schüssel .1  ˛/  12 sein – Sekt verschwindet nicht beim Umfüllen, die
Gesamtmenge an Sekt ist eine Invariante der Umverteilungstransformation.
Es genügt demnach, durch Auffüllen mit 2;5 ` Orangensaft den Sektanteil der
Mischung von 12 auf 13 D 23  12 zu verringern (˛ D 23 ) und dann durch Umfüllen von
2;5 ` der Mischung in das Gefäß mit dem Orangensaft dafür zu sorgen, dass beide
Bowlenschalen gleich viel Flüssigkeit enthalten – die Light-Version hat dann den
gewünschten Sekt-Anteil von 16 D .1  23 /  12 , und die Party ist gerettet. 

Der gleiche Gedankengang führt auf eine elegante Lösung des folgenden, in der
einen oder anderen Variante häufig zitierten Wein-Mischproblems.

Beispiel 1.14 (Weißwein-Rotwein-Problem; Folklore)


Zwei identische Gläser seien gleich hoch gefüllt, das eine mit Rotwein, das andere
mit Weißwein. Ein Löffel Weißwein wird zum Rotwein hinzugegeben und verrührt.
48 1 Heurismen der Variation

Danach wird ein Löffel der Mischung in den Weißwein zurückgegeben, so dass nun
beide Gläser wieder gleich voll sind. Befindet sich jetzt mehr Weißwein im Rotwein
als Rotwein im Weißwein?
Da am Ende des Austauschvorgangs in beiden Gläsern gleich viel Flüssigkeit ist,
müssen die ausgetauschten Mengen unabhängig von den durchgeführten Manipu-
lationen gleich sein; folglich sind auch die Anteile von Rotwein im Weißwein und
von Weißwein im Rotwein identisch.
Die Verwendung der Mischungsformel wäre unnötig kompliziert, würde aber
durch eine abgewandelte Formulierung des Problems, welche als Distraktoren zu-
sätzlich Quantifizierungen der Flüssigkeitsmengen vornimmt, die vorhanden sind
bzw. ausgetauscht werden, nahegelegt. 

Bisweilen benötigt man bei Mischungsproblemen auch anspruchsvollere Erhal-


tungssätze als den der beim Umschütten unveränderten Sektmenge, um geeignete
Invarianten zu finden. Erste Kandidaten solcher Erhaltungssätze sind diejenigen aus
der Physik, wie zum Beispiel der Energieerhaltungssatz, dessen Verwendung an
dem nun vorgestellten Beispiel32 demonstriert wird.

Beispiel 1.15 (Wärmeaustausch)


In einem Einfamilienhaus werden in einem Elektroboiler 180 ` Warmwasser mit
einer Temperatur von 60ı C bereit gehalten. Beim Verbrauch wird dieses dann mit
kaltem Wasser gemischt. Wie viele Liter 35ı C warmes Wasser stehen ungefähr zur
Verfügung, wenn die Temperatur des kalten Leitungswassers 15ı C beträgt?
Zwischen zwei Körpern verschiedener Temperatur, die miteinander in Berüh-
rung stehen, erfolgt ein Wärmeaustausch. Die Energie Q, die beim Wärmeaus-
tausch vom Körper höherer Temperatur zum Körper niederer Temperatur übergeht,
bezeichnet man in der Physik als Wärmemenge; diese wird bestimmt vom Tempe-
raturunterschied33 T beider Körper sowie von der Masse m und der spezifischen
Wärmekapazität34 c des abgebenden Körpers:
Q D c  m  T :
Nach dem Energieerhaltungssatz ist die Wärmeabgabe des Körpers höherer Tempe-
ratur gleich der Wärmeaufnahme des Körpers niederer Temperatur („Richmannsche
Regel der Thermodynamik“ ) – die Gesamtenergie des Zwei-Körper-Systems ist
invariant, wenn man etwaige Energieverluste durch Wärmeaustausch mit der Um-
gebung vernachlässigt.35
Bezeichnet man also mit mi , Ti und ci die Masse, die Temperatur und die spezi-
fische Wärmekapazität der Körper Ki (1  i  2) und mit Tm die Mischtemperatur,

32
Nach P ETER /W INKLMAIER in Mathematik Lehren, Bd. 115 (2002).
33
Deshalb spielt es keine Rolle, ob man die Temperaturen auf der Kelvin-Skala oder der Celsius-
Skala angibt.
34
Das Energiequantum, welches man 1 g einer bestimmten Substanz zuführen muss, um ihre Tem-
peratur um 1 K zu erhöhen.
35
Man beachte die vorsichtige Formulierung „. . . stehen ungefähr zur Verfügung, . . . “ in der Pro-
blemformulierung!
1.2 Variation der Problemstellung 49

so gilt

c1 m1 T1 C c2 m2 T2
c1 m1 .T1  Tm / D c2 m2 .Tm  T2 / bzw. Tm D :
c1 m1 C c2 m2
Sind n Körper am Wärmeaustausch beteiligt, so lässt sich die Formel zur Bestim-
mung der Mischtemperatur auf
Pn
ci mi Ti
Tm D Pi D1
n
i D1 ci mi

verallgemeinern. Wieder handelt es sich um die Mittelwertbildung eines gewichte-


ten arithmetischen Mittels, und für den Fall identischer spezifischer Wärmekapazi-
täten aller beteiligten Körper (c1 D c2 D    D cn DW c) entsteht eine zur oben
hergeleiteten Mischungsformel (MF) strukturgleiche Formel zur Bestimmung der
Mischtemperatur.
Damit berechnet man

35  .180 C m2 / D 180  60 C m2  15 ) 20m2 D 4500 ) m2 D 225 Œ` :

Ungefähr stehen also m1 C m2 D 180 ` C 225 ` D 405 ` Liter Wasser der Tempe-
ratur 35ı C zur Verfügung. 

So viel zur Verwendung des Invarianzprinzips bei Mischungsvorgängen. Im fol-


genden Beispiel wird das Invarianzprinzip im Sinne von (Inv 1) für die Konver-
genzuntersuchung einer rekursiv definierten Folge benutzt;36 zur Terminologie der
einzelnen Mittelwertbildungen sei auf Beispiel 1.5 verwiesen.

Beispiel 1.16 (Im Bann des geometrischen Mittels)


Sei .Pn /n2N eine Folge von Punkten Pn D .xn ; yn / in der Koordinatenebene. Diese
Punktfolge sei rekursiv definiert durch

P1 D .x1 ; y1 / WD .a; b/ mit a; b 2 R ; 0 < a < b

sowie

PnC1 D .xnC1 ; ynC1 / WD .H.xn ; yn / ; A.xn ; yn // für alle n2N;

wobei H das harmonische Mittel und A das arithmetische Mittel bezeichne. Man
prüfe, ob .Pn /n2N konvergiert und bestimme gegebenenfalls den Grenzwert.
Offenbar ist .Pn /n2N eine Punktfolge im 1. Quadranten des Koordinatensystems,
denn sämtliche Glieder der Koordinatenfolgen .xn /n2N und .yn /n2N sind positiv.
Nach Voraussetzung ist x1 < y1 , und aus xn < yn folgt (vgl. Beispiel 1.5)

xnC1 D H.xn ; yn / < A.xn ; yn / D ynC1 ;

36
Idee der Aufgabe nach E NGEL , A.: Problem-solving strategies. Springer, New York (1998).
50 1 Heurismen der Variation

so dass per Induktionsaxiom auf

xn < yn für alle n 2 N

geschlossen werden kann. Diese Relation zwischen den Folgengliedern xn ; yn ist


eine Invariante der Rekursionsvorschrift zur Bildung der Punktfolge .Pn /n2N , die
dazu benutzt werden kann, die strenge Monotonie der Folgen .xn /n2N und .yn /n2N
nachzuweisen.
Für alle n 2 N ist
xn C yn yn C yn
ynC1 D A.xn ; yn / D < D yn ;
2 2
also ist .yn /n2N streng monoton fallend. Ebenso folgt für alle n 2 N:

0 < xn < yn ) xn2 < xn yn ) xn .xn C yn / < 2xn yn ;

woraus sich
2xn yn
xn < D H.xn ; yn / D xnC1
xn C yn
ergibt; die Folge .xn /n2N ist damit streng monoton wachsend.
Insgesamt ist damit bisher klar, dass es sich bei der Folge .In /n2N D .Œxn; yn /n2N
um eine Folge abgeschlossener Intervalle mit I1
I2
  
In
InC1
: : :
handelt. Der quantitative Vergleich zwischen arithmetischem und harmonischem
Mittel ergibt, dass limn!1 .yn  xn / D 0 gilt, denn
xn C yn 2xn yn
ynC1  xnC1 D A.xn ; yn /  H.xn ; yn / D 
2 xn C yn
.xn C yn /2  4xn yn .yn  xn /2
D D
2.xn C yn / 2.yn C xn /
yn  xn yn  xn
D 
2 y C xn
„ n ƒ‚ …
<1
1
< .yn  xn / ;
2
also ist  n
1 ba n!1
ynC1  xnC1 <  .y1  x1 / D ! 0:
2 2n
Offenbar ist also .In /n2N sogar eine Intervallschachtelung, gegen deren Kern ˛ die
Folgen .xn /n2N und .yn /n2N jeweils konvergieren. Damit ist limn!1 Pn D .˛; ˛/ .
Die Frage, welches denn nun der Kern ˛ der Intervallschachtelung .In /n2N ist,
wird vermöge einer weiteren Invariante der Rekursionsvorschrift beantwortet:
Für alle n 2 N ist
2xn yn xn C yn
xnC1  ynC1 D  D xn  yn ;
xn C yn 2
1.2 Variation der Problemstellung 51

demnach handelt es sich bei der Produktfolge .xn yn /n2N um die konstante Folge
.xn yn /n2N D .ab/n2N . Wegen

ab D lim xn yn D lim xn  lim yn D ˛ 2


n!1 n!1 n!1

p
folgt sofort ˛ D ab D G.a; b/ – der Kern der Intervallschachtelung .In /n2N ist
das geometrische Mittel von a und b. 

Ein weiterer Typ von Invarianten, die in Beipielen zur Ausprägung (Inv 1) des
Invarianzprinzips vorgestellt werden sollen, sind Paritäten oder allgemeiner Rest-
klassen mod n. Wir beginnen mit dem Partygast-Problem.

Beispiel 1.17 (Das Partygast-Problem; Folklore)


Insgesamt n Personen bevölkern die Räumlichkeiten einer großen Party. Man nickt
sich freundlich zu, schüttelt sich zum Teil zur Begrüßung die Hand oder sieht auch
angestrengt aneinander vorbei. Man finde eine Begründung dafür, dass die Anzahl
der Personen, die ungerade oft die Hand geschüttelt haben, gerade ist.
Ein geeignetes Repräsentationssystem dieser Art von Problemen ist, wie bereits
an mehreren Beispielen verdeutlicht wurde, die Graphentheorie. Identifiziert man
die n Partygäste mit den Ecken P1 ; : : : ; Pn eines Graphen, in dem genau dann kij
Verbindungskanten zwischen Pi und Pj eingezeichnet sind, wenn Partygast i und
Partygast j einander bei kij Gelegenheiten die Hand geschüttelt haben (in der Regel
dürfte kij D 0 oder kij D 1 gelten, aber auch kij > 1 ist aus den unterschiedlichsten
Gründen denkbar), dann lautet die graphentheoretische Formulierung des Partygast-
Problems:

Man begründe, dass in jedem Graph auf n Ecken ohne Schlingen und isolierte
Kanten37 die Anzahl der Ecken ungerader Ordnung gerade ist.

Ein Standardbeweis dieses elementaren Satzes der Graphentheorie wird mithilfe


des Prinzips des doppelten Zählens geführt, welches wir in Abschn. 1.2.5 im Rah-
men der Diskussion verschiedener Abzählstrategien für endliche Mengen formal
beschreiben werden.
Die mit dem Prinzip des doppelten Zählens verbundene heuristische Vorgehens-
weise ist die folgende: Will man Informationen über eine endliche Anzahl a ge-
winnen, so zähle man eine geeignete Menge M , bei der a von Bedeutung ist, auf
zwei verschiedene Arten ab – die Elementezahl von M ist unabhängig von der Art
des Zählens, also eine Invariante der Variation des Zählmechanismus. Man kann
hoffen, daraus eine Bestimmungsgleichung für a zu erhalten.
Im vorliegenden Beispiel zähle man die Anzahl jI j der Inzidenzen Ecke/Kante
des Graphen auf zwei Arten:

37
Kanten der Ordnung 0 werden als isolierte Kanten, Kanten der Ordnung 1 als Schlingen (loops)
bezeichnet.
52 1 Heurismen der Variation

 Für jede Ecke E des Graphen bezeichne .E/ die Ordnung der Ecke, also die
P E inzidiert. Ist dann E die Menge aller Ecken des
Zahl der Kanten, mit denen
Graphen, so gilt jI j D E2 E .E/.
 In einem Graphen ohne Schlingen und isolierte Kanten hat jede Kante K die
Ordnung 2, inzidiert also mit genau zwei Ecken. Bezeichnet dann K die Menge
aller Kanten des Graphen, so gilt jI j D 2jK j.

Aus der Gleichung X


.E/ D 2jK j
E2 E

gewinnt man unmittelbar die Information, dass in der Summe links die Zahl der
ungeraden Summanden gerade sein muss.
Eine Parität als Invariante kommt dann ins Spiel, wenn man sich einen beliebi-
gen, fest vorgegebenen Graphen G auf n Ecken ohne Schlingen und isolierte Kanten
schrittweise aus dem trivialen Graphen auf n Ecken, der ausschließlich isolierte
Ecken enthält, aufgebaut denkt: In jedem Schritt wird eine neue, in G auftretende
Verbindungskante zweier Ecken hinzugefügt, bis man den trivialen Graphen auf n
Ecken zu G vervollständigt hat. Bei jedem Hinzufügen einer Verbindungskante sind
die in Abb. 1.27 veranschaulichten drei Fälle möglich.

Abb. 1.27 3 Fälle des Hinzufügens von Kanten

1. Fall: u  u
Werden zwei Ecken ungerader Ordnung miteinander verbunden, dann wird die bis-
herige Anzahl der Ecken ungerader Ordnung um 2 reduziert.

2. Fall: g  g
Werden zwei Ecken gerader Ordnung miteinander verbunden, dann wird die bishe-
rige Anzahl der Ecken ungerader Ordnung um 2 erhöht.

3. Fall: u  g
Wird eine Ecke ungerader Ordnung mit einer Ecke gerader Ordnung verbunden,
dann wird die bisherige Anzahl der Ecken ungerader Ordnung nicht verändert.

Die Anzahl der Ecken ungerader Ordnung ändert sich im gesamten Vervollständi-
gungsprozess also nur um ganzzahlige Vielfache von 2 – die Parität bleibt dabei
unverändert. Da im trivialen Graphen auf n Ecken die Anzahl der Ecken ungera-
1.2 Variation der Problemstellung 53

der Ordnung aber 0 und damit gerade ist, gilt dies auch für die Anzahl der Ecken
ungerader Ordnung in G. 

Das folgende Beispiel mit beliebigen Restklassen als Invarianten realisiert die
zu Beginn des Abschnitts exemplarisch genannte Situation für die Verwendung von
(Inv 1).

Beispiel 1.18 (Der Schüsselkreis)


Insgesamt 2n Schüsseln sind kreisförmig angeordnet und von 1 bis 2n nummeriert;
in jeder Schüssel befindet sich genau eine Münze. Die Umverteilung der Münzen ist
nach folgenden Regeln erlaubt: Wenn man eine Schüssel Sm findet, deren Nachbar-
schüsseln S` und Sr beide nicht leer sind, darf man S` und Sr jeweils eine Münze
entnehmen und in die mittlere Schüssel Sm legen.
Kann man die Geldstücke derart umverteilen, dass am Ende alle Münzen in einer
Schüssel liegen?
Für i D 1; : : : ; 2n bezeichne mi .Z/ die Anzahl der Münzen in Schüssel i im
Zustand Z. Im Anfangszustand Za gilt offensichtlich mi .Za / D 1 für alle i D
1; : : : ; 2n. Das Problem besteht darin zu entscheiden, ob es einen Endzustand Ze
mit mk .Ze / D 2n für ein k 2 f1; : : : ; 2ng und mi .Ze / D 0 für alle i ¤ k gibt.
Auf der Menge Z aller durch die Regeln erlaubten Zustände betrachte man die
Funktion " 2n #
X
f W Z ! R2n mit f .Z/ WD i  mi .Z/ ;
i D1 2n
wobei mit R2n die Menge aller Restklassen zum Modul 2n bezeichnet werde. Of-
fenbar ist " 2n #
X
f .Za / D i 1 D Œn  .2n C 1/2n D Œn2n ;
i D1 2n
und für jeden Endzustand Ze der angestrebten Art wäre

f .Ze / D Œk  2n2n D Œ02n :

Aber f ist eine Invariante jeder durch die Regeln erlaubten Umverteilung. Geht
nämlich Z 0 aus Z dadurch hervor, dass aus beiden Nachbarschüsseln der Schüssel
j jeweils eine Münze entnommen und in Schüssel j gelegt wird, so unterscheiden
sich f .Z 0 / und f .Z/ in den Summanden mit den Nummern .j  1/; j und .j C 1/,
alle anderen Summanden bleiben unverändert; genauer gilt

mj 1 .Z 0 / D mj 1 .Z/  1 I mj .Z 0 / D mj .Z/ C 2 I mj C1 .Z 0 / D mj C1.Z/  1 :

Daraus ergibt sich

f .Z 0 / D f .Z/  Œj  12n C Œ2j 2n  Œj C 12n D f .Z/ :

Deshalb ist der Wechsel von f .Za / D Œn2n zu f .Ze / D Œ02n unter Beachtung der
Regeln offenbar nicht möglich. 
54 1 Heurismen der Variation

Die vorgestellten Beispiele haben deutlich gemacht, dass es eine beachtliche


Vielfalt von Objekten gibt, die bei der Anwendung des Invarianzprinzips als In-
varianten in Betracht gezogen werden können; im Allgemeinen gibt es jedoch kein
systematisches Vorgehen zur Entdeckung geeigneter Invarianten.
Es gibt aber eine wichtige Ausnahme: Der Einsatz dynamischer Geometrie-
software (DGS) macht mutmaßliche Invarianten geometrischer Transformationen
sichtbar!
Eine zeitgemäße systematische Heuristik sollte demnach den Einsatz von (DGS)
als bedeutendes heuristisches Hilfsmittel bei der Verwendung des Invarianzprinzips
im Kontext geometrischer Problemstellungen einordnen. Die Einstufung des Com-
puters als Ideengeber verdeutlicht meine Position, dass es natürlich mathematischer
Begründungen dafür bedarf, dass es sich bei den per (DGS) entdeckten mutmaßli-
chen Invarianten tatsächlich um Invarianten handelt.
Bisweilen benutzt man in der Mathematik Invarianten zur Klassifikation von
Objekten, wie etwa bei der Klassifikation von Affinitäten der Ebene: Hier teilt man
affine Abbildungen nach ihren Fixelementen ein (Fixpunkte, Fixgeraden, Fixpunkt-
geraden, Fixrichtungen), und damit sind die natürlichen Kandidaten für Invarianten
im Kontext solcher Problemstellungen vorgegeben.

Beispiel 1.19 (Was bin ich?)


Eine affine Abbildung 'W R2 ! R2 der Ebene auf sich werde bezüglich der Stan-
dardbasis B D f. r1 r0
0 /; . 1 /g durch die Abbildungsvorschrift
! ! ! !
x1 7
3
 23 x1 2
'B W 7!  
x2  13 8
3
x2 4
beschrieben. Um welchen Typ einer affinen Abbildung handelt es sich?
Es seien !
7
3
 23
A WD
 13 8
3

und E WD . 1 0 / die Einheitsmatrix. Für !


01

x 2 R2 gilt
!
'B .!

x/D!

x , .A  E/!
 2
x D ;
4

und diese Gleichung ist wegen der Regularität der Matrix .A  E/ eindeutig lösbar.
Die eindeutig bestimmte Lösung !
x D . r3
3 / gibt den einzigen Fixpunkt F von ' an.
Wegen
! ! !! !
'
3 !

C x D'
3 !

CAx D
3
C A!x
B B
3 3 3

liefert jeder Eigenvektor von A eine Fixrichtung von 'B , und jede Gerade durch F
in Richtung eines Eigenvektors von A ist eine Fixgerade von '.
1.2 Variation der Problemstellung 55

Als Nullstellen des charakteristischen Polynoms det.A  E/ von A ergeben


sich die Eigenwerte 1 D 2 und 2 D 3; als Basen der zugehörigen Eigenräume
können die Eigenvektoren !v D . r2 / und !
1 1

v 2 D . r1
1 / gewählt werden.

Abb. 1.28 Euler-Affinität

An den Gleichungen A  ! v 1 D 2!


v 1 und A  !

v 2 D 3!v liest man ab, dass es
2
sich bei ' um eine Euler-Affinität handelt, bei der von F aus in Richtung !
38 
v 1 mit
!

dem Faktor 2 und in Richtung v 2 mit dem Faktor 3 gestreckt wird.
Die durch die Matrix A bezüglich B gegebene lineare Abbildung hat bezüglich
der Basis E WD f!
v 1; !
v g Diagonalgestalt, woraus sich
2
! ! !
C 1!

v 1 C 2!
v C 21!

v 1 C 32!

3 3
'E 2 D v2
3 3

ergibt. An dieser Beziehung lässt sich die Parallelentreue von ' ablesen; allgemein
ist die Parallelität von Geraden eine Invariante affiner Abbildungen. Die Kon-
struktion von Bildpunkten nicht auf den Fixgeraden gelegener Punkte (wie die
Konstruktion des Bildpunktes C 0 von C unter der Abbildung ') erfolgt damit wie
in Abb. 1.28 angedeutet. 

An der Schnittstelle des Übergangs von (Inv 1) zu (Inv 2) liegt die Theorie der
biholomorphen Abbildungen zwischen Gebieten G1 ; G2 C in der Kompaktifi-
zierung C D C [ fz1 g der komplexen Ebene C.
Es würde an dieser Stelle zu weit führen, den benötigten Begriffsapparat der
klassischen Funktionentheorie aufzubauen, um das produktive Zusammenspiel bei-
der Ausprägungen des Invarianzprinzips im Kontext des „conformal mapping“ zu
erläutern. Dennoch möchte ich eine Übersicht der Invarianten angeben, die auf dem
Weg zum Hauptresultat der Theorie der biholomorphen Abbildungen im Rahmen
einer Vorlesung zur Funktionentheorie einer Veränderlichen – dem Riemannschen

38
Darunter versteht man die Verkettung einer Parallelstreckung an einer Achse a in Richtung einer
Geraden b mit einer Parallelstreckung an der Achse b in Richtung der Geraden a bei beliebigen
Streckfaktoren, wobei a und b nicht parallel sind.
56 1 Heurismen der Variation

Abbildungssatz, bewiesen von B ERNHARD R IEMANN (1826–1866) im Jahre 1851


– von Bedeutung sind.
Damit gebe ich meiner Hoffnung Ausdruck, dass sich auch im Zeitalter der
Reform des deutschen Hochschulsystems im Rahmen des Bologna-Prozesses und
der damit verbundenen strukturellen, organisatorischen und nicht zuletzt inhaltli-
chen Veränderungen von Lehre und Studium wenigstens einzelne Studierende der
Mathematik die Gelegenheit nicht haben entgehen lassen, den Reichtum und die
Geschlossenheit der Funktionentheorie kennenzulernen, die C ARL L UDWIG S IE -
GEL (1896–1981) als ein „einmaliges Geschenk an die Mathematiker“ bezeichnet
hat.
1. In der reellen Analysis braucht die Ableitung einer differenzierbaren Funktion
nicht einmal stetig zu sein, wovon man sich an Beispielen der Art

fW R ! R ( 1
x 2 cos für x ¤ 0
x 7! f .x/ WD x2
0 für x D 0

überzeugen kann.39
Jede auf einer offenen Menge U C komplex differenzierbare40 Funktion ist
aber automatisch beliebig oft komplex differenzierbar auf U . Mit anderen Worten:

Komplexe Differenzierbarkeit ist eine analytische Invariante des Ableitungspro-


zesses.

Diese zentrale Erkenntnis liefert in Verbindung mit dem Cauchyschen Integral-


kalkül die Äquivalenz der Konzepte der komplex differenzierbaren Funktionen
(„Cauchysche Funktionentheorie“ nach AUGUSTIN L OUIS C AUCHY (1789–
1857)) und der holomorphen41 Funktionen („Weierstraßsche Funktionentheorie“
nach K ARL W EIERSTRASS (1815–1897)), die sich für den Erkenntnisgewinn im
Bereich der Funktionentheorie als ungeheurer produktiv erwiesen hat.
2. Im Allgemeinen sind Umkehrfunktionen bijektiver stetiger (differenzierbarer)
Funktionen nicht wieder stetig (differenzierbar), was Anlass zu den Begriffsbildun-
gen Homöomorphismus und Diffeomorphismus gibt.
In der Kategorie komplex differenzierbarer Funktionen ist das grundlegend an-
ders. Nach dem Satz von der offenen Abbildung ist das Bild f .U / einer offenen
Menge U C unter einer nicht-konstanten holomorphen Funktion f stets offen;
das bedeutet:

39
Diese Funktion ist auf R differenzierbar, aber f 0 ist an der Stelle x D 0 nicht stetig.
40
Die Funktion f W U ! C heißt in z0 2 U komplex differenzierbar, wenn es eine in z0 stetige
Funktion W U ! C mit f .z/ D f .z0 / C .z  z0 /.z/ für alle z 2 U gibt – man beachte die
formale Analogie zur Differenzierbarkeit von Funktionen f W I ! R, I  R!
41
Für einen Bereich U C nennt man f W U ! C holomorph in U , wenn f in jedem Punkt
z0 2 U eine Potenzreihenentwicklung mit positivem Konvergenzradius besitzt.
1.2 Variation der Problemstellung 57

Offenheit ist eine topologische Invariante unter der Abbildung mit nicht-
konstanten holomorphen Funktionen.

Ist ferner f W U ! C holomorph und injektiv, so ist auch f 1 W f .U / DW V ! U


holomorph, also f W U ! V biholomorph. Wir stellen fest:

Holomorphie ist eine analytische Invariante des Übergangs zur Umkehrfunktion.

3. Die Offenheit nicht-konstanter holomorpher Funktionen führt gemeinsam mit


der Invarianz des topologischen Zusammenhangs unter stetigen Abbildungen auf
den Satz von der Gebietstreue:
Ist G  C ein Gebiet und f W G ! C eine nicht-konstante holomorphe Funk-
tion auf G, so ist auch f .G/  C ein Gebiet. Mit anderen Worten:

Gebietstreue ist eine topologische Invariante unter der Abbildung mit nicht-
konstanten holomorphen Funktionen.

4. Sei G C ein Gebiet und f W G ! C eine stetig differenzierbare Abbil-


dung, welche folgende differenzialgeometrischen Invarianten hat:

 Glatte Wege  in G werden auf glatte Wege f ./ abgebildet;


 In jedem Punkt z0 2 G ist f winkeltreu und orientierungstreu.

Dann nennt man f eine lokal konforme Abbildung; sind G1 ; G2 Gebiete in C und
f W G1 ! G2 eine bijektive, lokal konforme Abbildung, dann nennt man f kon-
form.
Die durch differenzialgeometrische Invarianten charakterisierten konformen
Abbildungen zwischen Gebieten in C lassen sich analytisch beschreiben, denn es
gilt:
f W G1 ! G2 ist genau dann konform, wenn f biholomorph ist.
Umgekehrt sind damit weitere Invarianten (geometrischer Natur) biholomorpher
Abbildungen zwischen Gebieten in C gefunden, die für die explizite Konstruktion
einer biholomorphen Abbildung f W G1 ! G2 genutzt werden können, wenn ge-
sichert ist, dass eine solche existiert; in diesem Fall nennt man die Gebiete G1 und
G2 biholomorph äquivalent. Zusammengefasst:

Biholomorphe Äquivalenz von Gebieten in C wird durch differenzialgeometri-


sche Invarianten der zugehörigen Abbildungen wie Glattheitstreue von Wegen,
Winkeltreue und Orientierungstreue charakterisiert.

5. Holomorphie nahe z1 wird nun über lokale Karten von C so erklärt, dass sich
alle Sätze, die das Verhalten einer holomorphen Funktion in der Nähe eines Punk-
tes z0 2 C betreffen, auf Abbildungen übertragen lassen, die nahe z1 holomorph
sind (! Invarianzprinzip zur Begriffserweiterung). Insbesondere haben bijektive
holomorphe Abbildungen f W G1 ! G2 zwischen Gebieten G1 ; G2 in C wieder
58 1 Heurismen der Variation

holomorphe Umkehrabbildungen und werden deshalb biholomorph oder konform


genannt.
Für Gebiete G C nennt man jede konforme Abbildung f W G ! G einen
(holomorphen) Automorphismus von G. Die Automorphismen von G bilden be-
züglich der Komposition von Abbildungen eine Gruppe, die sogenannte Automor-
phismengruppe Aut G. Für G D C und G D C erhält man die Automorphismen-
gruppen
Aut C D fz 7! az C b j a; b 2 C ; a ¤ 0g
und  ˇ 
az C b ˇ
Aut C D z 7! ˇ a; b; c; d 2 C mit ad  bc ¤ 0 :
cz C d ˇ

Alle diese Biholomorphismen lassen sich aus Translationen z 7! z C b, Dreh-


streckungen z 7! az .a ¤ 0/ und Inversionen z 7! 1z zusammensetzen. Dies
ermöglicht den Schluss auf Invarianten, die für die Konstruktion konformer Abbil-
dungen mit speziellen Eigenschaften äußerst hilfreich sind.

Geometrische Invarianten der Abbildungen aus Aut C bzw. Aut C sind:

 Die Elemente von Aut C überführen Geraden in Geraden und Kreislinien in


Kreislinien.
 Die Elemente von Aut C überführen Geraden42 und Kreislinien in Geraden
oder Kreislinien.

6. Jedes von der identischen Abbildung verschiedene Element T von Aut C hat
höchstens zwei Fixpunkte, denn der Ansatz T .z/ D z führt auf eine lineare oder
eine quadratische Gleichung.
Daraus folgt aber, dass jedes T 2 Aut C durch drei Punkte z1 ; z2 ; z3 2 C und
deren Bilder eindeutig festgelegt ist. Ist nun
z  z1 z2  z1
T1 W z 7! DV.z; z1 ; z2 ; z3 / WD W
z  z3 z2  z3

diejenige Transformation, die z1 ; z2 ; z3 auf 0; 1; z1 abbildet (man nennt DV.z; z1 ;


z2 ; z3 / das Doppelverhältnis der vier Punkte z; z1 ; z2 ; z3 ), so ist die konforme Ab-
bildung von C auf sich, welche drei Punkte z1 ; z2 ; z3 auf drei Punkte w1 ; w2 ; w3
abbildet, offenbar durch

T21 ı T1 mit T2 W z 7! DV.z; w1 ; w2 ; w3 /

gegeben. Wir stellen fest:

Das Doppelverhältnis ist eine projektiv-geometrische Invariante der Automor-


phismen von C.

42
Jede Gerade enthalte dabei den Punkt z1 .
1.2 Variation der Problemstellung 59

7. Zur Verallgemeinerung des Begriffs einfach zusammenhängender Gebiete in


C auf einfach zusammenhängende Gebiete in C bedient man sich der Tatsache,
dass in C einfacher Zusammenhang eine Invariante biholomorpher Abbildungen
ist, indem man definiert:
G C ist einfach zusammenhängend, wenn G D C gilt oder wenn für ein
T 2 Aut C mit z1 … T .G/ gilt: T .G/ ist einfach zusammenhängend in C.
Hier wird erneut das Invarianzprinzip zur Begriffserweiterung eingesetzt.
Jetzt kann man endlich den Riemannschen Abbildungssatz beweisen:
Jedes einfach zusammenhängende Gebiet G  C, dessen Komplement bezüg-
lich C mindestens zwei Punkte enthält, lässt sich biholomorph auf die Einheits-
kreisscheibe D WD fz 2 C j jzj < 1g abbilden.
Damit sind solche Gebiete natürlich auch untereinander biholomorph äquivalent,
und man hat insgesamt nur drei Klassen biholomorph äquivalenter einfach zusam-
menhängender Gebiete, die von den „Normalgebieten“ C, C und D repräsentiert
werden.

 C ist zu keinem echten Teilgebiet G biholomorph äquivalent, denn Kompaktheit


ist eine Invariante stetiger Abbildungen, so dass für jeden Biholomorphismus
f W C ! G das Gebiet G D f .C/ kompakt sein müsste, was nur für G D C
erfüllt ist.
 Jede punktierte Sphäre G D C n fag ist biholomorph äquivalent zu C vermöge
einer jeden Abbildung T 2 Aut C mit T .a/ D z1 . Andererseits kann C zu
keinem beschränkten Gebiet G  C biholomorph äquivalent sein, insbesondere
also nicht zu D, weil nach dem Satz von Liouville43 jede beschränkte, auf C
holomorphe Funktion konstant sein muss.
 Alle anderen einfach zusammenhängenden Gebiete in C sind zu D und damit
untereinander biholomorph äquivalent.

Soweit der Exkurs in die klassische Funktionentheorie an der Schnittstelle zwi-


schen (Inv 1) und (Inv 2); im Folgenden werden wir uns näher mit (Inv 2) befassen.
Typische Problemkreise für die Verwendung von (Inv 2) sind in der Abbildungs-
geometrie angesiedelt, wenn es darum geht, abbildungsgeometrische Methoden
zum Beweis von Sätzen oder zur Konstruktion von Figuren zu verwenden. Zur
Illustration diskutieren wir einige Beispiele, in denen folgende Invarianten affiner
Abbildungen benutzt werden:

 Jede affine Abbildung ist geradentreu, parallelentreu, streckentreu und teilver-


hältnistreu.
 Die Ähnlichkeitsabbildungen sind zusätzlich winkeltreu und streckenverhältnis-
treu.
 Die Kongruenzabbildungen sind jene Ähnlichkeitsabbildungen, die zusätzlich
längentreu sind.

43
Benannt nach J OSEPH L IOUVILLE (1809–1882).
60 1 Heurismen der Variation

Einzelne Vertreter dieser Abbildungsgruppen haben weitere Invarianten, wie etwa


Verschiebungen und zentrische Streckungen als Dilatationen44 oder eigentliche Be-
wegungen als orientierungstreue Kongruenzabbildungen.

Beispiel 1.20 (Schwerpunkt im Dreieck)


Man begründe, dass sich in jedem Dreieck die Verbindungsstrecken der Ecken und
ihrer gegenüberliegenden Seitenmitten in einem Punkt S schneiden und sich je-
weils (von den Ecken aus gemessen) im Verhältnis 2 W 1 teilen. Man nennt S den
Schwerpunkt des Dreiecks.
(Denkt man sich das Dreieck homogen mit Masse belegt, dann ist S der physi-
kalische Massenschwerpunkt.)

Der zu begründende Sachverhalt über die geometrische Figur des Dreiecks um-
fasst begrifflich Punkte, Geraden, Strecken, Inzidenz und Teilverhältnis.
Im Sinne von (Inv 2) muss man nun nach Transformationen suchen, die Punkte
auf Punkte, Geraden auf Geraden, Strecken auf Strecken, Dreiecke auf Dreiecke
abbilden und Inzidenz und Teilverhältnis als Invarianten haben, in der Hoffnung,
durch Anwendung einer solchen Transformation die Problemstellung derart zu va-
riieren, dass man Hinweise auf eine Lösung des Problems finden kann.
Die allgemeinsten Transformationen der gesuchten Art sind affine Abbildungen
der euklidischen Ebene; je zwei Dreiecke lassen sich affin aufeinander abbilden,
genauer: durch höchstens drei aufeinanderfolgende Parallelstreckungen ineinander
überführen45 .
Folglich genügt es, den Satz über den Schwerpunkt im Dreieck für ein einziges
Dreieck zu beweisen, dann gilt er für alle! Man wähle sich dazu ein spezielles Drei-
eck mit besonders angenehmen Eigenschaften, nämlich ein gleichseitiges Dreieck;
diese Auswahl ist im Hinblick auf das sog. Extremalprinzip (Abschn. 1.2.4) nahe-
liegend.
Den Symmetrieeigenschaften des gleichseitigen Dreiecks kann man nun die
postulierten Zusammenhänge unmittelbar entnehmen (Abb. 1.29). So fallen etwa
die Seitenhalbierenden mit den Winkelhalbierenden w˛ ; wˇ ; w zusammen; der
Schnittpunkt S von w˛ und wˇ hat von AC den gleichen Abstand wie von AB

44
Inzidenzautomorphismen affiner Ebenen heißen Dilatationen, wenn Gerade und Bildgerade
stets parallel sind.
45
Dieser Sachverhalt kann als Pendant des Dreispiegelungssatzes in der Kategorie der affinen
Abbildungen verstanden werden, denn jede affine Abbildung ist durch ein Dreieck und dessen
Bilddreieck eindeutig bestimmt.
1.2 Variation der Problemstellung 61

und von AB den gleichen Abstand wie von BC , also auch von AC den gleichen
Abstand wie von BC , so dass S auch auf w liegt.

Abb. 1.29
Seitenhalbierenden-Satz im
gleichseitigen Dreieck

Die Winkelhalbierende w teilt im Dreieck Mb BC die Seite Mb B im Verhält-


nis der dem Winkel  anliegenden Seiten, also im Verhältnis 2 W 1. Aus Symme-
triegründen gilt dies entsprechend für die anderen Winkelhalbierenden (Seitenhal-
bierenden) im gleichseitigen Dreieck. Alternativ hätte man auch die Mittelparallele
Ma Mb im gleichseitigen Dreieck einzeichnen können, um an der dadurch entste-
henden Strahlensatzfigur das Teilverhältnis 2 W 1 abzulesen.
Damit gilt der Satz von den Seitenhalbierenden im gleichseitigen Dreieck, ent-
sprechend auch für jedes affine Bild eines gleichseitigen Dreiecks, de facto also für
jedes beliebige Dreieck. 

Wir kommen zu einem Beispiel, in dem die Invarianten von Ähnlichkeitsabbil-


dungen zur Lösung des Problems führen.

Beispiel 1.21 (Dem Dreieck einbeschriebenes Quadrat)


Man konstruiere zu einem vorgegebenen Dreieck ABC ein Quadrat PQRS, des-
sen Ecken P; Q; R; S folgendermaßen auf den Dreiecksseiten liegen:

P; Q 2 AB I R 2 BC I S 2 AC :

Die allgemeinsten Affinitäten, die stets Quadrate auf Quadrate abbilden, sind
Ähnlichkeitsabbildungen, denn diese sind sowohl winkeltreu als auch streckenver-
hältnistreu. Es genügt also, als Zwischenziel ein Quadrat herzustellen, welches sich
mit einer Ähnlichkeitsabbildung auf das gesuchte Quadrat PQRS abbilden lässt.
Das hier beschriebene Denkmuster ist typisch für geometrische Konstruktions-
aufgaben und wird uns bei der Behandlung der Heurismen der Reduktion (! Rück-
wärtsarbeiten, Pappos-Prinzip) noch näher beschäftigen.
62 1 Heurismen der Variation

Die Konstruktion eines Quadrats P 0 Q0 R0 S 0 , dessen Ecken P 0 ; Q0 auf AB liegen


und dessen Ecke S 0 auf AC liegt, ist problemlos möglich (Abb. 1.30, links); aller-
dings wäre es Glückssache, wenn dann auch R0 auf BC liegen würde – davon kann
man nicht ausgehen.

Abb. 1.30 Konstruktion eines Quadrats mit den verlangten Eigenschaften

Ist aber R der Schnittpunkt der Halbgeraden AR0C mit BC und Z D Z.AI k/
diejenige zentrische Streckung mit Streckzentrum A und Streckfaktor k, die R0 auf
R abbildet, so liegen die Bildpunkte P D Z.P 0 /; Q D Z.Q0 / auf AB und der
Bildpunkt S D Z.S 0 / auf AC , weil alle Geraden durch das Streckzentrum A Fix-
geraden der zentrischen Streckung Z.AI k/ sind.
Das Bild des Quadrats P 0 Q0 R0 S 0 unter der zentrischen Streckung Z.AI k/ ist
dann ein Quadrat PQRS mit den verlangten Eigenschaften (Abb. 1.30, rechts). 

Die hier behandelte Konstruktionsaufgabe wurde von H ANS -J ÜRGEN E L -


SCHENBROICH unter einem anderen Aspekt diskutiert46 , nämlich der Einbindung
der neuen Medien in allgemeine Methodenschulungen für angehende Lehrer.
Die Konstruktion des Quadrats P 0 Q0 R0 S 0 mit P 0 ; Q0 2 AB und S 0 2 AC bei
explizitem Verzicht auf die Bedingung R0 2 BC schafft einen Freiheitsgrad in
der Problemstellung, der für den Einsatz dynamischer Geometriesoftware (DGS)
nutzbar gemacht werden kann: Die Bahnkurve, die sich bei der Verfolgung des
freien Punktes R0 unter der Bewegung von P 0 längs AB ergibt, bis am Ende R auf
BC liegt, ist die Halbgerade AR0C ; insofern wird die Transformation (zentrische
Streckung an A), die für die Lösung des Konstruktionsproblems entscheidend ist,
von den visuellen Möglichkeiten der (DGS) auf dem Silbertablett präsentiert.
Die Strategie, eine Problemstellung durch Freigabe einer Bedingung für die visu-
ellen und dynamischen Möglichkeiten von (DGS) zu öffnen, wurde von E LSCHEN -
BROICH als Heurismus der Dynamisierung bezeichnet.
Nun aber zurück zu den klassischen Methoden. Um folgende Aufgabe lösen zu
können, müssen wir die Zahl der Invarianten durch Übergang zu einer weiteren
Untergruppe der Abbildungsgruppe der Affinitäten der Ebene – der Gruppe der
Kongruenzabbildungen – erhöhen. Der mathematische Hintergrund des Problems
wurde 1978 von K. B REINLINGER diskutiert47 ; der von mir dazu erfundene sach-
liche Hintergrund ist leider eine Fiktion.

46
Auf der 38. Jahrestagung der GDM in Augsburg (1. März bis 5. März 2004).
47
K. B REINLINGER : Ein Problempaket zur analytischen Geometrie. Der Mathematikunterricht
24, Heft 6 (1978). Friedrich-Verlag, Seelze.
1.2 Variation der Problemstellung 63

Beispiel 1.22 (Sanierung der Landesfinanzen)


Im Zeitalter knapper öffentlicher Kassen ist Einfallsreichtum gefragt, wenn es dar-
um geht, das Sparen nach dem „Rasenmähermodell“ möglichst lange aufzuschieben
und den einen oder anderen Bereich wenigstens mit den nötigsten finanziellen Mit-
teln auszustatten.
Der Leiter eines Ressorts, welches traditionell über hervorragende Beziehun-
gen zur Raubritterszene verfügt, berichtet 2005 in einer Kabinettssitzung von einer
Schatzkarte, die seinem Ministerium in die Hände gefallen sei. Sie weise den Weg
zu einem Vermögen in Gold und Juwelen, das an einem verwunschenen Ort in den
Hügeln des Bergischen Landes verborgen liege.
Im Sitzungssaal tritt gespannte Unruhe ein, während der Finanzminister zu sei-
ner Aktentasche greift, um an die Mitglieder der Kabinettsrunde eine aussagekräf-
tige Sitzungsvorlage zu verteilen; die Anspannung weicht ungehemmter Begeiste-
rung, als die Schatzkarte allen Sitzungsteilnehmern vorliegt.

Die Euphorie unter den Kabinettsmitgliedern über einen unerwarteten Geldre-


gen zur Sanierung der Landesfinanzen erhält jedoch einen Dämpfer, als der Fi-
nanzminister erklären muss, es gebe am angegebenen Ort zwar eine uralte Buche
und eine ebenso alte Eiche, aber leider keinerlei Hinweise auf einen Hexenturm,
und auch in den Schriften der Landesarchive sei die Existenz eines solchen Turms
nicht verzeichnet. Sogleich erheben sich Stimmen, die für eine unverzügliche Auf-
nahme umfangreicher Erdarbeiten im betroffenen Gebiet plädieren. Die Ministerin
64 1 Heurismen der Variation

für Umwelt und Naturschutz, Landwirtschaft und Verbraucherschutz erhebt massiv


Einspruch, weist auf die ökologische Bedenklichkeit und die fragwürdige Notwen-
digkeit einer solchen Aktion hin und lächelt dabei vielsagend . . .
Kann dies im Zusammenhang damit gedeutet werden, dass sie Diplom-Mathe-
matikerin ist und bei einem berühmten Lehrer Geometrie studiert hat?
Aus der Aufgabenstellung wird klar, dass die Lage des Schatzes eigentlich un-
abhängig von der Position des Hexenturms sein sollte – sonst könnte man ihn mit
geometrischen Mitteln wohl kaum finden. Bestätigt wird diese Vermutung durch
die Verwendung von (DGS) im Zugmodus:
Geht man von einer fertigen Konstruktion wie in der Schatzkarte mit fixierten
Punkten E (Position der Eiche) und B (Position der Buche) sowie einer zunächst
beliebigen Wahl des Punktes H (angenommene Position des Hexenturms) aus, so
bleibt die Lage des Schatzes invariant unter der Bewegung von H .
Zum mathematischen Nachweis dieser Tatsache steht ein Spektrum unterschied-
licher Methoden zur Verfügung, die jeweils ihren eigenen Charme haben:

 Man könnte ein Koordinatensystem mit Ursprung in E oder B einführen und


die einzelnen Transformationen in Koordinaten beschreiben. Dabei würde sich
sogar die Verwendung komplexer Zahlen anbieten, da sich Drehungen um ˙90ı
einfach durch komplexe Multiplikation mit ˙i beschreiben lassen.
 Koordinatenfrei könnte man mit dem Vektorkalkül operieren und dabei feststel-
len, dass die Verschiebung des Punktes H um einen Vektor !v eine Verschiebung
des einen Pflocks um C w und eine Verschiebung des anderen Pflocks um !
!
 
w
!
 !
 ı
bewirkt, wobei w aus v durch eine 90 -Drehung hervorgeht. Das zwischen
den Pflöcken gespannte Seil erfährt dann offenbar bei Verschiebung von H eine
Drehstreckung um seinen Mittelpunkt, die diesen als Drehzentrum und Streck-
zentrum und deshalb als Fixpunkt hat.

Der elementarmathematisch interessierte Leser sollte in der Lage sein, diese Be-
weispläne zu realisieren.
Ich selbst möchte jedoch an dieser Stelle – inspiriert von einem elementargeo-
metrischen Beweis, den mir H ARALD S CHEID skizziert hat – einen vektorfreien
abbildungsgeometrischen Beweis führen, der einen diskreten Hinweis auf einen na-
hen Verwandten des Invarianzprinzips, nämlich das Symmetrieprinzip, enthält.
Zu zeigen ist, dass für zwei beliebig gewählte Positionen H1 ; H2 des Hexen-
turms und die von dort aus gemäß der Vorschrift konstruierten Positionen P1 ; R1
bzw. P2 ; R2 der Pflöcke gilt: Der Mittelpunkt S1 der Strecke P1 R1 ist gleich dem
Mittelpunkt S2 der Strecke P2 R2 – dann bezeichnet S WD S1 D S2 die Position des
Schatzes.
Offenbar ist es aber nicht nötig, einen direkten Vergleich durchzuführen:
Man kann eine mögliche Position H des Hexenturms fest vorgeben und für die-
se Lage H die Positionen P; R der Pflöcke sowie den Mittelpunkt S der Strecke
PR ermitteln. Stellt sich jetzt heraus, dass S stets auch der Mittelpunkt der Stre-
cke P 0 R0 ist, wenn die Punkte P 0 ; R0 die Positionen der Pflöcke markieren, welche
gemäß der Vorschrift ausgehend von einer Position H 0 des Hexenturms konstru-
1.2 Variation der Problemstellung 65

iert wurden, dann ist insbesondere der Nachweis S1 D S2 für beliebige Wahl von
H1 ; H2 geführt, und zwar vermöge eines indirekten Vergleichs von S1 und S2 über
S:
S1 D S und S2 D S ) S1 D S2 :
Ein Kriterium für die Festlegung von H könnte es sein, H so zu wählen, dass die
Konstruktion der Punkte P; R; S möglichst einfach ist und dass man die Variation
der Konfiguration, die bei Übergang von H zu H 0 entsteht, möglichst gut verfolgen
kann. Diese Bedingungen sind zum Beispiel dann erfüllt, wenn man H als Mittel-
punkt der Strecke BE wählt, wie Abb. 1.31 zeigt.

Abb. 1.31 Spezielle Wahl


von H für den indirekten
Vergleich

Zunächst ergeben sich die Punkte P und R durch Ergänzung der Strecke BE
zu einem Rechteck BERP , dessen kürzere Seiten ER; BP die Längen jBP j D
jERj D 12 jBEj haben. Konstruiert man nun ausgehend von H 0 ¤ H vorschriftsge-
mäß die Punkte P 0 und R0 wie in Abb. 1.32, so lässt sich Folgendes erkennen:
Bezeichnet D1 die Drehung um E um 90ı im Gegenuhrzeigersinn und D2 die
gleich orientierte Vierteldrehung um B, so gilt einerseits
D1 .R/ D H ; D1 .R0 / D H 0 ; D1 .S/ D T
und andererseits
D2 .H / D P ; D2 .H 0 / D P 0 ; D2 .T / D S ;
woraus folgt:
D2 ı D1 .R/ D P ; D2 ı D1 .R0 / D P 0 ; D2 ı D1 .S/ D S :

Abb. 1.32 Konstruktion von


P 0 und R0 ausgehend von
H0 ¤ H
66 1 Heurismen der Variation

Die Verkettung D WD D2 ı D1 der beiden Drehungen ist demnach eine eigent-


liche Bewegung mit Fixpunkt S und kann folglich nur eine Drehung um S sein.
Wegen D.R/ D P ist der Drehwinkel von D ein gestreckter Winkel, so dass es
sich bei D um die Punktspiegelung an S handelt.

Abb. 1.33 Punktspiegel-


zentrum S als Mittelpunkt
der Verbindungsstrecke von
Punkt und Bildpunkt

Da P 0 der Bildpunkt von R0 unter der Punktspiegelung an S ist, muss S der


Mittelpunkt der Strecke P 0 R0 sein. Die Lage von S ist also unabhängig von der
Position von H (Abb. 1.33). 

In der hier vorgestellten Lösung des Konstruktionsproblems aus Beispiel 1.22


erfolgte die Wahl des Punktes H als Mittelpunkt der Strecke EB nicht willkürlich,
sondern auf der Grundlage der These, dass symmetrische Problemstrukturen beson-
ders einsichtige, besonders elegante, ja: besonders schöne Lösungen erlauben.
Der Gesichtspunkt der Ästhetik mathematischer Argumentationen ist einer der
Gründe, die dafür sprechen, die einer Problemstellung inhärenten Symmetrien her-
auszuarbeiten; ein eher pragmatischer Grund aus der Sicht des Problemlösers ist
die Beachtung einer von P ÓLYA im Zusammenhang mit dem Prinzip des nichtzu-
reichenden Grundes48 ausgesprochenen Erwartung, die sich sinngemäß folgender-
maßen wiedergeben lässt:
Wir erwarten, daß jede in den Daten und der Bedingung der Aufgabe auftretende Symmetrie
sich in der Lösung widerspiegelt, und zwar nicht nur in dem „Lösungsgegenstand“, sondern
auch in dem „Lösungsverfahren“.

Trifft dies zu, so kann man hoffen, durch Herausarbeiten der Symmetrien einer
Problemstellung Hinweise auf mögliche Lösungsansätze, die diese Symmetrien re-
flektieren, zu gewinnen. Dieses heuristische Prinzip ist unter dem Namen „Symme-
trieprinzip“ bekannt.

Heuristisches Handeln gemäß Symmetrieprinzip


Arbeite die Symmetrien einer Problemstellung heraus.
Möglicherweise erkennst du Hinweise auf Lösungsansätze für das Pro-
blem, die diese Symmetrien reflektieren.

48
Unter vorhandenen Möglichkeiten sollte keine bevorzugt werden, wenn es keinen zureichenden
Grund für eine Unterscheidung gibt.
1.2 Variation der Problemstellung 67

Das Wort „Symmetrie“ hat seinen Ursprung im Griechischen („summetria“),


abgeleitet aus „sun“ (gr.: mit, gemeinsam) und „metron“ (gr.: Maß), wurde ur-
sprünglich im Sinne von Kommensurabilität verwendet und gewann dann schnell
die allgemeinere Bedeutung einer Proportion, die in schönster Weise verschiede-
ne Elemente zu einem harmonischen Ganzen verbindet. Seither wurde Symmetrie
mit Harmonie, Schönheit und Einheit in Verbindung gesetzt, was ihre Rolle in
der Naturphilosophie der griechischen Klassik entscheidend mitbestimmte; so lehr-
te P LATO (427–347 v. Chr.) einen mystischen Zusammenhang zwischen den vier
„Elementen“ Feuer, Erde, Luft und Wasser und den heute nach ihm benannten Pla-
tonischen Körpern Tetraeder, Hexaeder (Würfel), Oktaeder und Ikosaeder, wobei er
dem Universum die Form des Dodekaeders zuordnete.
Aus moderner Sicht definiert man die Symmetrien geometrischer Objekte F mit-
hilfe von Invarianzen:

Eine Symmetrie oder eine Deckabbildung von F ist eine Kongruenzabbildung 


mit  .F / D F , insbesondere also eine Transformation, welche die Punktmenge
F (nicht notwendig punktweise!) invariant lässt.

Diese algebraische Beschreibung des Phänomens der Symmetrie erlaubt es, das
Konzept auf andere mathematische Objekte auszudehnen und ganz allgemein die
Symmetrie einer Struktur durch deren Invarianz unter gewissen Transformations-
gruppen zu erklären.
Dies legitimiert die Einordnung des Symmetrieprinzips unter den Verwandten
des Invarianzprinzips, weist aber gleichzeitig darauf hin, dass in Problemsituationen
generell zwischen offenkundigen und versteckten Symmetrien zu unterscheiden ist:
Ist die Transformationsgruppe, über die eine bestimmte Art von Symmetrie definiert
ist, eine der vertrauten Deckabbildungsgruppen der Geometrie, so handelt es sich
meist um eine offenkundige Symmetrie oder aber um eine versteckte Symmetrie,
die durch leichte Modifikationen der Problemstellung (Einzeichnen von Hilfsfigu-
ren etc.) herauszuarbeiten ist. Betrachten wir dazu ein Beispiel.

Beispiel 1.23 (Parallelogramm-Sektoren)


Das Innere eines Parallelogramms ABCD wird durch Einzeichnen der Diagonalen
AC und BD mit Schnittpunkt S in vier Dreiecke zerlegt. Man begründe, dass diese
Dreiecke paarweise flächeninhaltsgleich sind.

Die Flächeninhaltsgleichheit je zweier gleich gefärbter Dreiecke, welche nur den


Punkt S gemeinsam haben, ergibt sich sofort aus der Tatsache, dass sie durch die
68 1 Heurismen der Variation

Punktspiegelung an S ineinander überführt werden – diese Symmetrie der Figur ist


offenkundig.
Die Flächeninhaltsgleichheit zweier verschieden gefärbter Dreiecke, also etwa
die Gleichheit der Flächenmaße von SAB und CSB, ergibt sich sofort mit der
Flächeninhaltsformel für Dreiecke aus jSAj D jSC j und der Beobachtung, dass die
Höhe von B auf SA mit der Höhe von B auf SC übereinstimmt.
Man könnte aber alternativ versteckte Symmetrien der Problemstellung sichtbar
machen, etwa durch Einzeichnen der Mittelparallelen des Parallelogramms (Abb.
1.34):

Abb. 1.34 Herausarbei-


ten versteckter Symmetrien
durch Einzeichnen von Hilfs-
linien

Sind nämlich Ma ; Mb ; Mc und Md die Seitenmitten des Parallelogramms


ABCD, so zerlegen die Mittelparallelen das Parallelogramm in die vier kongru-
enten und deshalb flächeninhaltsgleichen Parallelogramme Ma BMb S, Mb CMc S,
Mc DMd S und Md AMa S. Nun definieren aber die Diagonalen des Parallelo-
gramms ABCD gleichzeitig Diagonalen der Teilparallelogramme und zerlegen
diese deshalb in flächeninhaltsgleiche Dreiecke. Jedes der in Abb. 1.34 einge-
zeichneten Dreiecke mit S, genau einem der Punkte A; B; C; D und genau einem
der Punkte Ma ; Mb ; Mc ; Md als Ecken hat demnach denselben Flächeninhalt; da
sich aber jedes der Dreiecke ABS; BCS; CDS und DAS aus genau zwei solcher
Dreiecke zusammensetzt, sind die Dreiecke sämtlich flächeninhaltsgleich. 

Auch in nicht-geometrischen Problemstellungen tauchen bisweilen offenkundi-


ge Symmetrien auf, die ohne Spezifikation irgendwelcher Transformationsgruppen
einfach daran festzumachen sind, dass eine strukturelle Gesamtheit untereinander
vertauschbare Teile hat. Auf Anhieb würde man die Summe
ab C bc C ca
als symmetrisch empfinden, zum Beispiel deshalb, weil jede der Variablen a; b; c
in genau zwei Summanden der Summe auftaucht oder weil je zwei der Variablen
a; b; c untereinander austauschbar sind, ohne dass sich die Summe dabei ändert. Al-
gebraisch ließe sich die hier vorliegende Symmetrie der Summe durch deren Inva-
rianz unter der symmetrischen Gruppe S3 beschreiben: Ist nämlich 'W fa; b; cg !
fa; b; cg eine beliebige Permutation aus S3 , so gilt
ab C bc C ca D '.a/'.b/ C '.b/'.c/ C '.c/'.a/ :
In vielen konkreten Fällen erweist sich die vereinfachende operationalisierte Fas-
sung des Symmetriebegriffs
1.2 Variation der Problemstellung 69

 Symmetrie besteht in der Vertauschbarkeit von Teilen ohne Veränderung des


Ganzen

als genügend präzise, um aus dem Studium der vertauschbaren Teile Nutzen für die
Problemlösung zu ziehen.

Beispiel 1.24 (Zahlenzauber)


Man erkläre das Phänomen

42242 C 53352 C 68862 D 24422 C 35532 C 86682


42352 C 53862 C 68242 D 35422 C 86532 C 24682
42862 C 53242 C 68352 D 86422 C 24532 C 35682
43852 C 58262 C 62342 D 85432 C 26582 C 34622
43342 C 58852 C 62262 D 34432 C 85582 C 26622
::: D :::

und finde weitere Beispiele dieser Art.


In jeder einzelnen Gleichung des Systems lassen sich jeweils drei Zahlenpaare
.n1 ; m1 /; .n2 ; m2 /; .n3 ; m3 / derart bilden, dass die Gleichung von der Form

n21 C n22 C n23 D m21 C m22 C m23

ist und die Zifferndarstellungen von ni ; mi im 100er-System durch Vertauschung


von Einerziffer und Hunderterziffer auseinander hervorgehen. In der dritten Glei-
chung etwa wären

n1 D 4286 D .42 86/100 ! .86 42/100 D 8642 D m1 ;


n2 D 5324 D .53 24/100 ! .24 53/100 D 2453 D m2 ;
n3 D 6835 D .68 35/100 ! .35 68/100 D 3568 D m3 :

Die Darstellung der 100er-Zahl k D .z1 z0 /100 in der Form k D z1  100 C z0 liefert

k 2 D 1002 z12 C 2  100  z1 z0 C z02 ;

sodass eine Gleichung des Systems genau dann erfüllt ist, wenn die Summe der
Quadrate der Hunderterziffern der Zifferndarstellungen von n1 ; n2 ; n3 im 100er-
System gleich der Summe der Quadrate ihrer Einerziffern ist. Die ersten drei Glei-
chungen des Systems sind damit äquivalent zu

422 C 532 C 682 D 242 C 352 C 862 ;

die letzten beiden Gleichungen des Systems sind äquivalent zu

432 C 582 C 622 D 342 C 852 C 262 :


70 1 Heurismen der Variation

Wieder lassen sich in jeder dieser beiden Gleichungen derart Zahlenpaare .k1 ; `1 /;
.k2 ; `2 /; .k3 ; `3 / bilden, dass die Gleichung von der Form k12 Ck22 Ck32 D `21 C`22 C`23
ist und die Zifferndarstellungen von ki ; `i – diesmal im dekadischen System – durch
Vertauschung von Einerziffer und Zehnerziffer auseinander hervorgehen. Wie oben
ergibt sich, dass das System

422 C 532 C 682 D 242 C 352 C 862


432 C 582 C 622 D 342 C 852 C 262

zur Gleichung
42 C 52 C 62 D 22 C 32 C 82
äquivalent ist, und diese ist erfüllt – es handelt sich um zwei verschiedene Darstel-
lungen der Zahl n D 77 als Summe dreier Quadratzahlen.
Weitere Beispiele der gesuchten Art erhält man aus diesen Darstellungen der
Zahl 77, indem man andere Paarbildungen vornimmt und nach dem symmetrischen
Bauplan Gleichungen daraus zusammensetzt (! Symmetrieprinzip in der Funktion
der Erzeugung neuen Wissens), wie etwa

482 C 532 C 622 D 842 C 352 C 262 ; 482 C 522 C 632 D 842 C 252 C 362 ; : : :

und

48842 C 53352 C 62262 D 84482 C 35532 C 26622


48352 C 53842 C 62262 D 35482 C 84532 C 26622
48252 C 52842 C 63362 D 25482 C 84522 C 36632
::: D :::

Der Phantasie sind dabei nur durch die Anzahl injektiver 3-Tupel aus einer 3-Menge
Grenzen gesetzt. 

Der Vorrat an solchen Beispielen ist (wenn man auch Darstellungen mit zwei
oder vier Summanden zulässt) unerschöpflich, denn nach dem Vier-Quadrate-Satz
von L AGRANGE lässt sich jede natürliche Zahl als Summe von höchstens vier Qua-
dratzahlen darstellen, und solche Darstellungen sind im Allgemeinen nicht eindeu-
tig, wenn es auch unendlich viele Ausnahmen gibt; zum Beispiel ist jede ungerade
Primzahl auf genau eine Art als Summe zweier Quadratzahlen darstellbar.
Unter Berücksichtigung der Reihenfolge der Summanden gibt es zur natürlichen
Zahl n D 2˛  u, u ungerade, ˛ 2 N0 genau
(
8 .u/ für ˛ D 0 ;
4 .n/ D
24 .u/ für ˛ > 0

viele Darstellungen als Summe von vier (nicht notwendig teilerfremden) Quadrat-
zahlen, wobei  die Teilersummenfunktion bezeichnet.
1.2 Variation der Problemstellung 71

Versteckten Symmetrien einer Problemstellung kommt man oft durch die Reprä-
sentation des Problems in anderen Systemen (! Variation der Darstellung) auf die
Spur, vorzugsweise durch Darstellungen im Gegenstandsbereich der Geometrie.

Beispiel 1.25 (Geometrische Reihe und Verteilen von Größen)


Man finde einen „Siehe-Beweis“ 49 für die Gültigkeit der Gleichung

X 1 1
1 1 1 1 1
D i
D C C C C:::
3 i D1
4 4 16 64 256

Ist x ¤ 1, so gilt für jedes n 2 N0 bekanntlich

X
n
1  x nC1
xi D ;
i D0
1x

wie man leicht aus

X
n X
n X
n1
1 xi  x  xi D 1 C .x i  x i /  x nC1
i D0 i D0 i D1

folgern kann. Für jedes x 2 R mit jxj < 1 gilt limn!1 x nC1 D 0; deshalb ist
1
X 1
xi D für alle x 2 R mit jxj < 1 ;
i D0
1x

bekannt als die Summenformel für die geometrische Reihe.


Speziell für x D 14 erhält man

1
X 4
xi D
i D0
3

bzw.
X 1
1 4 1
i
D 1D :
i D1
4 3 3

Eine „einsichtige“ Begründung dieser Formel, die mit einem intuitiven Grenz-
wertbegriff 50 auskommt, wird möglich, wenn man die Symmetrien der Reihe im
Kontext einer Situation des Verteilens von Größen herausarbeitet.

49
Hierbei handelt es sich um eine Form prämathematischen Beweisens, bei der konkrete Hand-
lungen durch ikonische Darstellungen vorgestellter Handlungen ersetzt werden.
50
Erschreckenderweise gibt es auch immer mehr Studierende mathematischer Fachrichtungen, die
nur über ein intuitives, bestenfalls inhaltliches, selten aber formales Verständnis des Grenzwertbe-
griffs verfügen.
72 1 Heurismen der Variation

Verteilt man 4 Viertel eines quadratischen Kuchens gerecht an 3 Personen, dann


hat am Ende offenbar jeder genau 1 Drittel des Kuchens bekommen. Man nehme
nun die Verteilung so vor, dass erst einmal jeder 1 Viertel des Kuchens erhält; dann
bleibt ein Viertel des Kuchens übrig. Dieses übrig gebliebene Viertel teile man er-
neut in 4 gleich große Teile auf, gebe dann wieder jedem eins dieser Teile, zerlege
das übrig gebliebene Viertel wieder in 4 gleich große Stücke, und so weiter (Abb.
1.35) . . .

Abb. 1.35 „Siehe-Beweis“ für die Summenformel

nC1
Die Verallgemeinerung dieser Darstellung auf das Verteilen von nC1 eines Ku-
chens an n Personen liefert einen „Siehe-Beweis“ für
1
X 1 1
D : 
i D1
.n C 1/i n

In der offensichtlichen Form des Prinzips des nichtzureichenden Grundes be-


gegnet uns das Symmetrieprinzip als Spielstrategie in diversen mathematischen
Spielen, die folgendermaßen strukturiert sind:

 Zwei Spieler A und B spielen gegeneinander und führen abwechselnd Spielzüge


aus, wobei A beginnt.
 Jeder Spielzug m überführt einen Zustand Zi in einen Zustand Zi C1 D
Zi C1 .Zi ; m/51 , wobei Wiederholungen von Zuständen verboten sind.52
 Die Spielzüge werden nicht durch Zufallsmechanismen beeinflusst, sondern er-
wachsen nur aus strategischen Überlegungen.
 Jeder Spieler hat permanent freien Einblick in die Züge seines Gegners.

51
Dies ermöglicht die Beschreibung des Spiels in Form eines gerichteten Graphen, in dem jeder
Spielzug als eine gerichtete Kante zwischen den als Ecken interpretierten Zuständen eingezeichnet
wird, die der Spielzug ineinander überführt.
52
Der das Spiel beschreibende gerichtete Graph enthält dann keine geschlossen-unikursalen ge-
richteten Subgraphen (circuits).
1.2 Variation der Problemstellung 73

 Das Spiel endet mit dem Sieg von Spieler S 2 fA; Bg, wenn S einen Zustand
erreicht, der dem anderen Spieler keinen durch die Spielregeln erlaubten Zug
mehr lässt.53 Eine solche Situation tritt zwangsläufig nach endlich vielen Zügen
ein.

Wenn im Verlauf eines solchen Spiels der Spieler S einen Zug ausführen kann, der
die Menge M aller verbleibenden Spielzustände derart in zweielementige Teilmen-
gen
n o [n
.i / .i /
Mi WD Z1 ; Z2 ; Mi \ Mj D ; ; M D Mi
i D1
zerlegt, dass für i D 1; : : : ; n jeder Zustand aus Mi mit einem legalen Zug in den
komplementären Zustand aus Mi überführt werden kann, dann gibt es offenbar eine
sichere Gewinnstrategie für S: Macht sein Gegner einen Zug, der einen Zustand aus
M
herbeiführt, so antworte S mit einem Zug, der den komplementären Zustand aus
M
erreicht. Auf diese Weise gewinnt S, weil seinem Gegner zuerst die erlaubten
Züge ausgehen.
Bei dieser „Paarbildungsstrategie“ gewinnt S, weil er nach dem Prinzip des
nichtzureichenden Grundes keinen der Züge wählt, die sich symmetrisch beantwor-
ten lassen. S strebt den einzigen ungepaarten Zustand an und stellt damit sicher,
dass sich die erzeugten Symmetrien in seinem Spielverhalten widerspiegeln kön-
nen.

Beispiel 1.26 (Münzspiel 1)


Zwei Spieler legen abwechselnd 1 Euro-Münzen auf einen rechteckigen Tisch, wo-
bei die Münzen einander nicht berühren dürfen. Wer die letzte Münze positionieren
kann, gewinnt das Spiel. Gibt es für einen der Spieler eine Gewinnstrategie?
Spieler A gewinnt, wenn er in seinem Eröffnungszug eine Münze in das Symme-
triezentrum Z der rechteckigen Spielfläche legt. Jeden folgenden Zug von B kann
A zu Z punktsymmetrisch beantworten, so dass in jedem Fall A die letzte Münze
auf dem Tisch platzieren kann. 

Beispiel 1.27 (Münzspiel 2)


Auf den einzelnen Ecken eines regelmäßigen n-Ecks befinde sich je eine Mün-
ze. Zwei Spieler nehmen abwechselnd wahlweise eine oder aber zwei benachbarte
Münzen aus der Anordnung weg. Wer die letzte Münze bekommt, hat gewonnen.
Gibt es für einen der Spieler eine Gewinnstrategie?
Für n  2 gewinnt Spieler A, weil er mit seinem ersten Zug alle Münzen weg-
nehmen kann.
In allen anderen Fällen hat B eine Gewinnstrategie:
Nachdem A den ersten Zug ausgeführt hat, verbleibt eine Kette von k Münzen,
k 2 fn  1; n  2g, die man fortlaufend im Uhrzeigersinn von M1 bis Mk durch-
nummerieren kann, wobei M1 die erste Münze rechts von der durch den Zug von

53
Bei Spielen, in denen es darauf ankommt, als erster einen Zustand aus einer Klasse von „Ge-
winnzuständen“ zu erreichen, lege man einfach definitorisch fest, dass nach dem Eintritt eines
Gewinnzustandes kein legaler Zug mehr existiert.
74 1 Heurismen der Variation

A entstandenen Lücke sei. Ist k ungerade, so nimmt Spieler B die Münze M


mit

WD kC1 2 aus dem Spiel; ist k gerade, so nimmt Spieler B die Münzen M und
MC1 mit  WD k2 weg.
In beiden Fällen verbleibt eine Anordnung aus zwei Ketten mit gleich vielen
Münzen, bei der wegen der Nachbarschaftsbedingung nur aus jeweils einer Kette
Münzen entnommen werden dürfen. Jeden folgenden Zug von A kann B mit einem
isomorphen Zug in der jeweils anderen Kette beantworten, so dass in jedem Fall B
die letzte Münze bekommt. 

Zur Vertiefung der Überlegungen hinsichtlich der Verwendung des Symmetrie-


prinzips in Strategiespielen möchte ich nun zwei kompliziertere Spiele besprechen.
Das erste wurde 1958 von dem Mathematiker DAVID G ALE entwickelt und ab
1960 unter dem Namen Bridg-it kommerziell vertrieben.
Das zweite Spiel hatte zwei Entdecker – jeder von ihnen einer der Riesen, auf
deren Schultern stehend der Tüchtige weiter blicken kann.
Vorrecht hat wohl das dänische Multitalent P IET H EIN (1905–1996), der seine
Spielidee „Polygon“ im Jahr 1942 den Studenten des Niels-Bohr-Instituts für Theo-
retische Physik in Kopenhagen vorstellte; Zweitentdecker ist der Nobelpreisträger
J OHN F ORBES NASH (1928–2015) („A beautiful mind“), der das Spiel laut Zeit-
zeugen unabhängig von H EIN im Jahr 1948 als Student der Princeton University
erfand.
An der Universität und am Princetoner Institute for Advanced Studies wurde das
Spiel begeistert aufgenommen und zu Ehren seines lokalen Erfinders mit „Nash“
oder „John“ bezeichnet.
Im Jahr 1952 schließlich gaben Parker Brothers Inc. („Monopoly“) eine Version
des Spiels unter dem Namen „Hex“ heraus.
In Erinnerung an mehrere unvergessliche, überaus beeindruckende Aufenthalte
in Princeton erlaube ich mir, den Spielern nicht die Traditionsfarben „Schwarz“ und
„Weiß“ für Zwei-Spieler-Strategiespiele, sondern mit „Schwarz“ und „Orange“ die
Farben der Princeton University zuzuordnen.

Beispiel 1.28 (Brückenspiel)


Spieler A (schwarz) und Spieler B (orange) verbinden auf dem unten links darge-
stellten Spielplan abwechselnd jeweils 2 benachbarte Punkte ihrer Farben horizon-
tal oder vertikal, wobei es nicht zum Schnitt zweier verschiedenfarbiger Strecken
kommen darf; Sieger ist derjenige, dem es zuerst gelingt, zwei gegenüberliegende
Seiten des Spielplans durch einen zusammenhängenden Streckenzug zu verbinden.
1.2 Variation der Problemstellung 75

Oben rechts ist zur Verdeutlichung eine von B gewonnene Partie des Brücken-
spiels illustriert.
Gibt es für einen der Spieler eine Gewinnstrategie?
Der kommerzielle Erfolg des Spiels „Bridg-it“ ist wohl damit zu erklären, dass
es einige Jahre gedauert hat, bis in der Kolumne von M ARTIN G ARDNER im Scien-
tific American die erste gefundene Gewinnstrategie veröffentlicht werden konnte.
Es handelt sich um die in Abb. 1.36 beschriebene Paarbildungsstrategie nach
O LIVER G ROSS: Spieler A eröffnet mit dem eingezeichneten Zug und beantwortet
jeden Spielzug von B, dessen eingezeichnete Strecke eine der gestrichelten Lini-
en an einem Ende berührt, durch Einzeichnen einer Strecke, die das andere Ende
derselben gestrichelten Linie trifft.

Abb. 1.36 Gewinnbringende


Paarbildungsstrategie beim
Bridg-it

Diese Paarbildungsstrategie garantiert den Sieg des Spielers A, wenn auch nicht
unbedingt in der minimal möglichen Anzahl von Zügen54 . 

Mir ist nicht bekannt, wie G ROSS diese Gewinnstrategie entdeckt hat, aber ei-
ne zielführende heuristische Strategie wäre die Analogiebildung durch Restriktion
(Abschn. 1.2.1) gewesen. Man entwickle einfach eine alternative, dimensionsredu-
zierte Form des Brückenspiels, indem man sich auf einen Spielplan mit jeweils 32
schwarzen und orangen Punkten beschränke. Für diese Variante lässt sich sofort er-
kennen, wie A das Spiel gewinnt (Abb. 1.37).

Abb. 1.37 Gewinnstrategie


für A im dimensionsreduzier-
ten Brückenspiel

54
G ROSS spricht in diesem Zusammenhang von einer „demokratischen Strategie“, welche das
Spiel gegen einen stumpfsinnigen Gegner stumpfsinnig und gegen einen raffinierten Gegner raffi-
niert gestalte.
76 1 Heurismen der Variation

Offenbar muss dass B auf Zug 1 (schwarz) von A mit Zug 1 (orange) antworten,
um das Spiel nicht sofort zu verlieren. Dies wiederum zwingt A zu Zug 2 (schwarz),
aber dieser Spielzug verhindert nicht nur die sofortige Niederlage von A, sondern
besiegelt sogleich die zukünftige Niederlage von Spieler B: Sowohl auf Spielzug
2a (orange) als auch auf Spielzug 2b (orange) kann A mit den gewinnbringenden
Zügen 3a (schwarz) bzw. 3b (schwarz) antworten.
Die Spielzüge, mit denen Spieler A im dimensionsreduzierten Brückenspiel die
Züge von B beantwortet, um das Spiel zu gewinnen, genügen der in Abb. 1.36
skizzierten Paarbildungssymmetrie, sodass man die G ROSSsche Gewinnstrategie
für das Original-Bridg-it durch Rücktransfer der Paarbildungsstrategie des „Mini-
Bridg-it“ in das Originalspiel hätte gewinnen können.
Die bei der Hinwendung zum Mini-Brückenspiel vorgenommene Analogiebil-
dung durch Restriktion geschieht unter der Maßgabe, den Spielplan auf die minima-
len Abmessungen zu verkleinern, für die noch strategische Überlegungen angestellt
werden können; noch kleinere Spielpläne liefern offenbar einzügige und deshalb
nicht zurücktransformierbare Gewinnstrategien.
Dies lässt sich als Analogiebildung unter Beachtung des Extremalprinzips deu-
ten, welches erfolgreich im Zusammenspiel mit vielen heuristischen Strategien ein-
gesetzt werden kann und besonders intensive Verflechtungen mit den Heurismen
aufweist, die in Abschn. 1.2.4 thematisiert werden.
Zuvor aber soll noch zum Abschluss dieses Abschnitts das oben bereits erwähnte
Spiel Hex diskutiert werden.

Beispiel 1.29 (Hex)


Ein .n  n/ Hex-Spielplan besteht aus einer Raute, die mit n2 vielen regelmäßigen
Sechsecken parkettiert ist; unten links ist ein Hex-Board für n D 8 abgebildet.
Je zwei einander gegenüberliegende Seiten des Spielbretts sind gleich eingefärbt
und markieren die Grundlinien des Spielers, der die jeweiligen Farben vertritt; die
Eckfelder auf den Schnittpunkten der Grundlinien gehören zu beiden Farben.

Spieler A (schwarz) und Spieler B (orange) belegen abwechselnd eines der noch
unbesetzten Sechsecke mit einem Spielstein ihrer Farbe, wobei ein einmal gesetzter
Stein nicht mehr bewegt werden darf. Sieger ist derjenige, dem es zuerst gelingt,
seine beiden Grundlinien durch einen zusammenhängende Kette von Spielsteinen
1.2 Variation der Problemstellung 77

seiner Farbe zu verbinden; oben rechts ist zur Verdeutlichung eine von B gewonne-
ne Partie von Hex illustriert.
Gibt es für einen der Spieler eine Gewinnstrategie?
Dieses Spiel weist gewisse strukturelle Ähnlichkeiten mit Bridg-it auf, ist aber
zumindest für große n deutlich komplizierter. Davon überzeugt man sich am besten
dadurch, dass man eine zu Hex topologisch äquivalente Spielform – nennen wir sie
„Punkthex“ – herstellt, in der es wie bei Bridg-it darum geht, benachbarte Punkte
miteinander zu verbinden.
Abb. 1.38 zeigt links einen .4  4/-Spielplan von Hex und rechts einen dazu to-
pologisch äquivalenten .4  4/-Spielplan von Punkthex, der dadurch entsteht, dass
eine Raute durch drei Reihen mit jeweils sechs gleichseitigen Dreiecken parkettiert
wird, deren Ecken dann den Sechsecksfeldern des .4  4/-Hexspielplans entspre-
chen.

Abb. 1.38 Topologisch äquivalente Spielpläne von Hex und Punkthex

Abb. 1.39 illustriert zwei identische Spielverläufe von Hex und Punkthex, in de-
nen A mit seinem vierten Zug gewinnt.

Abb. 1.39 Topologisch äquivalente Spielpläne von Hex und Punkthex

In der Version Punkthex wird ein direkter Vergleich des Spiels mit Bridg-it mög-
lich. Offenbar besteht ein Unterschied darin, dass jedes freie Feld von jedem Spieler
besetzt werden darf, während bei Bridg-it jeder Spieler nur Felder seiner eigenen
Farbe belegen kann. Außerdem besitzt Punkthex mehr Freiheitsgrade als Bridg-it:
Sofern nicht besetzte Felder dies verhindern, kann man sich bei Punkthex von den
Eckfeldern in zwei bzw. drei Richtungen (bei Bridg-it: in zwei), von den anderen
78 1 Heurismen der Variation

Randfeldern in vier Richtungen (bei Bridg-it: in drei) und von den Zentrumsfeldern
in sechs (bei Bridg-it: in vier) Richtungen bewegen. Je größer das Spielfeld ist,
desto stärker machen sich diese Unterschiede bemerkbar. Die von den Princetoner
Studenten damals bevorzugten Abmessungen eines Hex-Bretts lagen bei n D 14;
auf einem .14  14/-Spielplan gibt es eine solch astronomische Zahl von Spiel-
möglichkeiten55 , dass eine vollständige Analyse des Spiels wohl kaum zu leisten
ist.
Kehren wir nun aber zur hexagonalen Original-Version des Spiels zurück, deren
Gestalt – so hat es mir J OHN NASH persönlich bestätigt – sich nicht zuletzt des-
wegen durchgesetzt hat, weil in den historischen Gebäuden des Mathematischen
Instituts („Old Fine Hall“) einige Fußböden, genauer: die Fußböden der Toiletten
mit regelmäßigen Sechsecken parkettiert waren (und heute noch sind) und so den
Studenten mehr als genug Spielpläne in variablen Größen zur Verfügung standen.56
Die in der Problembeschreibung illustrierte Partie auf einem .8  8/-Brett war
bereits zu Gunsten von B entschieden, nachdem beide Spieler ihren vierten Zug
gemacht hatten und mit dem in Abb. 1.40, links dargestellten Spielzustand eine von
ca. 3;1  1011 Spielsituationen, die nach dem vierten Zug beider Spieler möglich
sind, erreicht war.

Abb. 1.40 Spielzustand nach 4 Zügen und optimaler 5. Zug von A

Jeden Zug von A, der in der rechten Spielhälfte von B ausgeführt wird, interpre-
tiere B als Versuch, die Anbindung von 3 (orange) an die rechte Grundlinie von B
zu verhindern und antworte mit einem Zug in der rechten Spielhälfte mit dem Ziel,
genau dies zu erreichen.
Jeden Zug von A, der in der linken Spielhälfte von B ausgeführt wird, fasse B
als Versuch auf, die Anbindung von 4 (orange) an die linke Grundlinie von B zu
blockieren und antworte mit einem Zug in der linken Spielhälfte, der genau diese
Anbindung zum Ziel hat; in spätestens drei in der linken Spielhälfte ausgeführten
Spielzügen ist das möglich.

55
Nach den ersten drei Zügen beider Spieler sind bereits mehr als 1012 verschiedene Spielzustände
möglich!
56
„An alternative slang name for the game was Bathroom . . . “ – J OHN F ORBES NASH am
10.02.2004.
1.2 Variation der Problemstellung 79

Der optimale Zug 5 von A in der linken Hälfte ist mit 5 (schwarz) in Abb. 1.40,
rechts eingetragen; alle anderen 5. Züge von A in der linken Hälfte würden zu einer
Anbindung von 4 (orange) an die linke Grundlinie in zwei Zügen führen:
Besetzt nämlich A in seinem fünften Zug die Felder X oder Y , so antwortet
B mit der Besetzung von Feld Z, alle anderen fünften Züge von A in der linken
Spielhälfte außer dem eingezeichneten Zug 5 (schwarz) beantwortet B mit der Be-
setzung des Feldes Y – dann erreicht B mit einem weiteren Zug die Anbindung von
4 (orange) an die linke Grundlinie.

Abb. 1.41 Passende Antwort


von B auf den optimalen Zug
von A

Auch der optimale 5. Zug hilft aber A nicht weiter, wenn B richtig spielt.
Beantwortet nämlich B Zug 5 (schwarz) mit Zug 5 (orange) wie in Abb. 1.41
eingezeichnet, dann erreicht B eine Position zur Anbindung von 4 (orange) an die
linke Grundlinie in zwei weiteren Zügen vermöge der grafisch angedeuteten Paar-
bildung. Besetzt A mit seinem sechsten Zug in der linken Spielhälfte keines der mit
den Pfeilen gepaarten Felder, so belegt B mit seinem sechsten Zug ein beliebiges
Feld zwischen 4 (orange) und 5 (orange), anderenfalls besetzt B das Feld, das ihm
von dem Paarbildungspfeil zugewiesen wird. Ein möglicher Spielverlauf zur An-
bindung von 4 (orange) an die linke Grundlinie ist in Abb. 1.42, links dargestellt.

Abb. 1.42 Grundlinienschluss von B (links) und Zwangszug von A (rechts)

Auch in der rechten Spielhälfte kann A nicht verhindern, dass B seine Grundlinie
erreicht.
A muss in seinem nächsten Zug Feld Z aus Abb. 1.42, rechts besetzen, da ande-
renfalls B dieses Feld einnimmt und 2 (orange) an seine rechte Grundlinie anbinden
kann, sofern nicht A sowohl seinen achten als auch seinen neunten Spielstein in
80 1 Heurismen der Variation

einer geeigneten Kombination in den rot umrandeten Sechsecken am rechten Spiel-


feldrand untergebracht hat, wobei X; Y offenbar nicht zu den geeigneten Kombi-
nationen gehört. In diesem Fall aber platziert B seinen neunten Stein gegenüber
von X oder Y , je nachdem, welches dieser Felder von A besetzt ist; sofern keines
dieser Felder besetzt ist, wähle B das Feld Y . Dann kann der Weg von A zur obe-
ren Grundlinie an der Reihe, welche 3 (orange) und 4 (orange) enthält, gestoppt
werden, und B schließt seine Kette.
Hat aber A mit seinem achten Zug zwangsläufig das Feld Z besetzt, kann B
durch einen passenden Spielzug erneut A unter Zugzwang bringen, indem er seinen
achten Spielstein wie in Abb. 1.43 platziert; nunmehr muss A in seinem neunten
Zug Feld V besetzen, da sonst B dieses Feld okkupiert und das Spiel gewinnt, weil
A nicht alle drei rot umrandeten Sechsecke mit nur zwei Zügen besetzen kann und
damit der Weg für B zur rechten Grundlinie frei ist.

Abb. 1.43 Zwangszug von A und Gewinn von B durch Paarbildungsstrategie

Nach dem passenden neunten Antwortzug von B wie in Abb. 1.43 kann A den
Sieg von B in höchstens drei weiteren Zügen nicht mehr verhindern, wenn B die
mit den roten Pfeilverbindungen gekennzeichnete Paarbildungsstrategie verfolgt.
Die Diskussion der in der Problembeschreibung skizzierten Partie macht deut-
lich, wie kompliziert Hex ist, wenn es auf großen Spielplänen gespielt wird. Für
kleine Spielfelder lassen sich allerdings leicht Gewinnstrategien für A angeben, wie
Abb. 1.44 zeigt. Sobald A mit seinem Eröffnungszug eines der rot gerahmten Sechs-
ecke belegt, gewinnt er das Spiel. Auch auf .5  5/-Spielplänen lässt sich zeigen,
dass A gewinnt, wenn er das Spiel mit der Besetzung des Symmetriezentrums des
Spielbretts eröffnet.

Abb. 1.44 Gewinnstrategien für A im dimensionsreduzierten Hex


1.2 Variation der Problemstellung 81

Mit wachsender Spielfeldgröße eröffnen sich jedoch Blockademöglichkeiten,


die es auf kleineren Feldern nicht gibt; das macht den Transfer der Gewinnstrategien
für dimensionsreduziertes Hex auf .14  14/-Hex unmöglich. Die Analogiebildung
durch Restriktion stellt hier kein zielführendes heuristisches Handeln dar, was a
priori – auch im Hinblick auf die Einsicht in eine Gewinnstrategie für Bridg-it –
nicht unbedingt zu erwarten gewesen wäre.
Für große n ist keine Entscheidungspartie bekannt, die einen konstruktiven Exis-
tenzbeweis einer Gewinnstrategie für A liefert; dennoch hat NASH für alle n 2 N
die Existenz einer Gewinnstrategie für A im Jahr 1949 nachgewiesen. Seine hoch-
gradig nicht-konstruktive Argumentation lässt sich wie folgt zusammenfassen.

 Für Spieler S 2 fA; Bg ist genau dann die Verbindung seiner beiden Grundlinien
mit einer zusammenhängenden Kette von Spielsteinen unmöglich, wenn eine
Kette seines Gegners existiert, mit der dieser seine beiden Grundlinien verbindet
und damit das Spielfeld für S in zwei Zusammenhangskomponenten zerlegt, von
denen jede nur eine der Grundlinien von S enthält.
Dieses einfache topologische Argument zeigt, dass das Spiel nicht mit einem
Unentschieden enden kann – spätestens wenn alle Felder des Spielplans belegt
sind, existiert genau eine Kette einer Farbe, die den Sieger des Spiels definiert.
 Weil das Spiel endlich ist, einer der Spieler das Spiel gewinnen muss und bei-
de Spieler abwechselnd ihre Züge mit vollständigem Einblick in die Züge ihres
Gegners ausführen, hat notwendig einer der Spieler eine Gewinnstrategie! Ge-
nau dann hat nämlich S 2 fA; Bg keine Gewinnstrategie, wenn sein Gegner S 0
jeden beliebigen Zug von S bei optimalem Spiel so beantworten kann, dass das
Spiel nicht mit einem Sieg von S endet – die Nicht-Existenz einer Gewinnstrate-
gie für S ist also äquivalent zur Existenz einer Strategie für S 0 , die dem Spieler S 0
zumindest ein Unentschieden garantiert. Da aber das Spiel nicht unentschieden
enden kann, ist die Nicht-Existenz einer Gewinnstrategie für S gleichbedeutend
mit der Existenz einer Gewinnstrategie für S 0 .
 Hätte B eine Gewinnstrategie, so könnte A diese Gewinnstrategie stehlen! Dazu
eröffnet A mit einem beliebigen Zug und folgt danach der Gewinnstrategie von
B. Ist er dabei irgendwann gezwungen, auf das Feld zu setzen, welches er mit
seinem Eröffnungszug besetzt hat, so führt er einen weiteren beliebigen Zug
aus und spielt mit der Strategie von B weiter. Jedesmal, wenn die Imitation der
Gewinnstrategie des Spielers B von Spieler A verlangt, einen Stein auf ein Feld
zu setzen, das er mit seinem zuletzt ausgeführten beliebigen Extrazug belegt
hat, führt A einen neuen arbiträren Zug aus. Auf diese Weise spielt A nach der
Gewinnstrategie von B mit einem zusätzlichen Stein auf dem Brett.
 Da ein zusätzlicher Stein immer ein Vorteil und niemals ein Nachteil ist, gewinnt
A, was die Annahme der Existenz einer Gewinnstrategie für B zum Widerspruch
führt. Also hat A eine Gewinnstrategie.

Dieser nicht-konstruktive Nachweis der Existenz einer Gewinnstrategie für A wur-


de von J OHN NASH im Rahmen spieltheoretischer Überlegungen angegeben. Seine
vertiefte Auseinandersetzung mit Fragestellungen der Spieltheorie wurde 1950 mit
der Verleihung des Doktortitels an der Princeton University gewürdigt. Die große
82 1 Heurismen der Variation

Bedeutung der in seiner Dissertation Non-cooperative Games vorgestellten Ergeb-


nisse für die Wirtschaftswissenschaften wurde erst sehr viel später verstanden; im
Jahr 1994 erhielt er für seine Erkenntnisse den Nobelpreis für Wirtschaftswissen-
schaften. 

In Kenntnis der Tatsache, dass bei Hex Spieler A bevorteilt ist57 , hat man sich um
diverse Änderungen der Spielbedingungen bemüht, die diesen Vorteil ausgleichen
sollten.
Ein naheliegender Vorschlag bestand darin, auf einem n  .n C 1/-Brett zu spie-
len und dem Spieler A die beiden Grundlinien zuzuweisen, die .n C 1/ Sechsecke
auseinander liegen, in der Hoffnung, dass sich der Startvorteil und der Vorteil des
kürzeren Weges ausgleichen könnten.
Im Mathematical Intelligencer 17 (1995) veröffentlichte aber J OHN W. M IL -
NOR, ein Freund und Studienkollege von J OHN NASH aus Princetoner Zeiten
und inzwischen ein mit den höchsten Auszeichnungen58 der Branche gewürdigter
Mathematiker, einen konstruktiven Beweis für die Existenz einer Gewinnstrategie
des Spielers B, der auf einer wunderschönen Schubspiegelungssymmetrie beruht
(Abb. 1.45).

Abb. 1.45 Schubspie-


gelungssymmetrie des
n  .n C 1/-Hexboards

Jeden Zug des Spielers A auf dem abgebildeten .7  8/-Board, der ein Feld mit
einem bestimmten Buchstaben belegt, beantwortet B durch Besetzung des zweiten
Feldes mit diesem Buchstaben. Die mit Großbuchstaben markierten Felder gehen
aus den mit Kleinbuchstaben markierten Feldern durch eine Schubspiegelung her-
vor, bei der zunächst um ein Sechseck parallel zur orangen Grundlinie verschoben
und dann eine Spiegelung an der Achse durch die Großbuchstabenreihe A; B; C; : : :
vorgenommen wird. Auf diese Weise entstehen kongruente Ketten der Spieler A
und B, wobei die Kette des Spielers B wegen der kürzeren zu überbrückenden Ent-
fernung zwischen den Grundlinien zuerst die Verbindung derselben erreicht.
Dieser Beweis dokumentiert nicht nur erneut die Verwendbarkeit des Symme-
trieprinzips bei Strategiespielen, sondern macht auch deutlich, wie sehr NASHs
Beweis aus dem Jahr 1949 auf der Symmetrie des .n  n/-Spielfelds beruhte.

57
Schließlich hat A eine Gewinnstrategie!
58
Fields-Medaille 1962; Wolf-Preis 1989; Abel-Preis 2011.
1.2 Variation der Problemstellung 83

1.2.4 Generalisierung, Spezialisierung, Extremalprinzip

Generalisierung (Verallgemeinerung) und Spezialisierung sind Heurismen, die mit


dem Ziel der Variation des Allgemeinheitsgrades einer Problemstellung vorgenom-
men werden.
Dabei mag es auf den ersten Blick paradox erscheinen, dass in der Verallge-
meinerung einer Problemstellung eine Methode zu sehen sein könnte, einer Lösung
des ursprünglichen Problems eher auf die Spur zu kommen, denn Generalisierung
bedeutet den Übergang zu einer Klasse von Problemen, die das Ausgangsproblem
umfasst. Meist erfolgt die Verallgemeinerung dadurch, dass man eine oder mehrere
einschränkende Bedingungen wegfallen lässt oder aber konstant vorgegebene Ele-
mente der Problemdaten durch variable Parameter ersetzt; geht es formal darum zu
beweisen, dass eine Aussage A wahr ist, so besteht die kanonische Verallgemeine-
rung in der Verifikation einer Aussage A0 , von der strukturell klar ist, dass sie A
impliziert.
Insofern liegt die Erwartung nahe, das allgemeinere Problem sei schwieriger zu
lösen als das Ausgangsproblem; dass dies nicht unbedingt zutreffend ist, liegt in
einigen Fällen auf der Hand:
Enthält nämlich die Problemformulierung Informationen, die für die Lösung des
Problems irrelevant sind, dann vollzieht man durch Weglassen dieser Distraktoren
formal eine Generalisierung des Problems; tatsächlich aber beschreibt man dadurch
ein äquivalentes Problem, welches leichter zu überschauen ist.
Die aus dieser offensichtlichen Konstellation zu extrapolierende Funktion der
Verallgemeinerung als Problemlösestrategie liegt in der Reduktion der Problem-
komplexität, die manchmal mittels Generalisierung erzielt werden kann. Zur Illus-
tration betrachten wir ein Beispiel nach P ÓLYA.

Beispiel 1.30 (Oktaederhalbierung)


Gegeben seien eine Gerade g und ein Oktaeder O mit g \ O D ;. Man bestimme
eine Ebene E, welche die Gerade g enthält und das Oktaeder in zwei volumenglei-
che Teilkörper zerlegt.
Für die Lösung dieses Problems ist einzig und allein der Umstand entscheidend,
dass das Polyeder ein Symmetriezentrum S besitzt; die Lage von g beeinflusst le-
diglich die eventuelle Eindeutigkeit einer Lösung.
Ist nämlich K ein Körper mit einem Symmetriezentrum S, so wird offenbar K
von jeder Ebene durch S halbiert. Die Lösung der allgemeineren Aufgabe

 Gegeben seien ein Körper K mit einem Symmetriezentrum S und eine Gerade
g. Man bestimme eine Ebene E, die g enthält und K in zwei volumengleiche
Teilkörper zerlegt.

ist jedoch trivial; für S 2 g löst offenbar jede Ebene E mit g  E das Problem, und
für S … g, liefert die durch die Bedingungen g  E, S 2 E eindeutig bestimmte
Ebene E eine Lösung des allgemeineren und daher auch des ursprünglichen Pro-
blems. 
84 1 Heurismen der Variation

In Beispiel 1.30 wurde durch die Generalisierung der Problemstellung die Kom-
plexität des Ausgangsproblems reduziert, da Informationen bezüglich der Lage von
g oder bezüglich des Aufbaus eines Oktaeders aus der Problemstellung ausgeblen-
det wurden. Die Reduktion der Problemkomplexität ist aber nicht das einzige Ziel,
welches sich mit dem Heurismus der Generalisierung verfolgen lässt, wie es P ÓLYA
einst formulierte:
Der umfassendere Plan kann mehr Aussicht auf Erfolg haben, vorausgesetzt, daß er nicht
auf bloßem Anspruch beruht, sondern auf irgendeinem Blick für die Dinge über das unmit-
telbar Sichtbare hinaus.

Plakativ umformuliert und interpretiert stellt P ÓLYA hier fest, dass sich die Land-
schaft aus der Perspektive des Adlers besser überblicken lässt als aus der Per-
spektive des Kriechtiers, sodass bisweilen der mit der Befreiung von Restriktionen
verbundene Ausflug in mathematisch höher gelegene Regionen neue Einblicke er-
laubt, welche die Lösung des ursprünglichen Problems erleichtern.
Hier ein Beispiel für dieses Denkmuster, das mich schon als Student fasziniert
hat, als es mein späterer Doktorvater K LAS D IEDERICH in einer Vorlesung zur
klassischen Funktionentheorie vorstellte.

Beispiel 1.31 (Konvergenzintervalle von Taylorreihen)


Gegeben seien die reell-analytische Funktion
f W R ! R
x 7! f .x/ WD 1
1Cx 2

und der Punkt x0 2 R. Man bestimme das Konvergenzintervall der Taylorreihe59


von f mit Entwicklungspunkt x0 .
Für x0 D 0 ist dies nicht weiter schwierig, wenn man die geometrische Reihe
und deren Konvergenzverhalten kennt: Für jxj < 1 gilt
X 1 X 1
1 1
D D .x 2 /i D .1/i x 2i ;
1Cx 2 1  .x /
2
i D0 i D0

und für jxj  1 ist diese Potenzreihe divergent, weil dann ihre Summandenfolge
keine Nullfolge bildet und damit ein notwendiges Kriterium für die Konvergenz
einer Reihe verletzt ist. Folglich ist  1; 1Œ das Konvergenzintervall der Taylorreihe
von f mit Entwicklungspunkt x0 D 0.
Die elegante Lösung für den Fall x0 D 0 beruht auf der sofort einsichtigen
Möglichkeit, die Potenzreihenentwicklung von f auf die geometrische Reihe zu-
rückzuführen. Für x0 ¤ 0 bietet sich diese Möglichkeit nicht, sodass man sich der
Mühe unterziehen müsste, die Koeffizienten ai der Taylorreihe
1
X
Tf Ix0 .x/ D ai  .x  x0 /i
i D0

59
Benannt nach B ROOK TAYLOR (1685–1731).
1.2 Variation der Problemstellung 85

von f mit Entwicklungspunkt x0 gemäß der Taylor-Formel durch

f .i / .x0 /
ai WD für i 2 N0

zu bestimmen und dann das Konvergenzverhalten der Potenzreihe zu untersuchen;
der Konvergenzradius R der Reihe ließe sich zur Not60 mit der Hadamard-
Formel61
 p 1
1 1
R D lim sup jai j
i
mit WD 1 und WD 0
i !1 0 1

ermitteln, womit das Konvergenzintervall x0  R; x0 C RŒ gefunden wäre.


Dieser Plan kann natürlich nur dann realisiert werden, wenn es gelingt, ein Bil-
dungsgesetz der Folge .ai /i 2N0 zu finden; schon allein dies ist im Fall x0 ¤ 0 mit
großen Schwierigkeiten verbunden.
Bis heute (2017) ist mir niemand begegnet, der mir eine Lösung des Problems
unter Verwendung der oben beschriebenen reellen Methoden hätte präsentieren
können.
Dabei ist es sogar ohne Berechnung der Taylorreihe Tf Ix0 .x/ leicht einzusehen,
dass für den Konvergenzradius R dieser Reihe
q
RD 1 C x02

gilt; man muss sich lediglich von einer unnötigen Restriktion befreien und komplexe
Methoden zur Lösung des Problems einsetzen.
Die Funktion f lässt sich zu einer meromorphen Funktion fO auf C fortsetzen,
welche in C n fi; ig holomorph ist. Die Potenzreihenentwicklung von fO um einen
beliebigen Punkt z0 2 C konvergiert auf jeder offenen Kreisscheibe .z0 I r/, die
in C n fi; ig liegt, normal gegen fO; damit gilt für den Konvergenzradius R der
Potenzreihe zunächst einmal R  minfjz0  ij; jz0 C ijg.
Die isolierten Singularitäten von fO in ˙i sind Polstellen und daher nicht hebbar,
sodass R > minfjz0  ij; jz0 C ijg nicht möglich ist; also muss R D minfjz0 
ij; jz0 C ijg gelten.
Wird nun speziell z0 WD x0 2 R als Entwicklungspunkt gewählt, so ist
q q
jx0  ij D jx0 C ij D 1 C x02 und daher R D 1 C x02 ;

wodurch der Konvergenzkreis .x0 ; R/ der Reihe festgelegt ist. Die Einschränkung
dieser Potenzreihe auf R ist die Taylorreihe Tf Ix0 .x/ von f mit Entwicklungspunkt

60
Meist hält die Analysis elegantere Methoden zur Bestimmung des Konvergenzradius einer Po-
tenzreihe bereit.
61
Benannt nach JACQUES -S ALOMON H ADAMARD (1865–1963).
86 1 Heurismen der Variation

x0 , und deren Konvergenzintervall ist der mengentheoretische Durchschnitt von R


mit .x0 ; R/, also das Intervall
q q

R \ .x0 ; R/ D x0  1 C x02 ; x0 C 1 C x02 : 

Wie man an diesem Beispiel sieht, zeigen reell-analytische Funktionen auf R


nicht ihr wahres Gesicht; jede solche Funktion ist die Einschränkung einer Funkti-
on, die in einer Umgebung der reellen Achse holomorph ist, auf den Bereich R. Erst
das Studium holomorpher Fortsetzungen (! Generalisierung: analytische Fort-
setzung auf größeren Definitionsbereich) lässt die tatsächlichen Zusammenhänge
erkennen und führt so zu allgemeineren Einsichten.
Eine andere Situation, in der die Befreiung von Restriktionen mittels Generali-
sierung ein vielversprechender Ansatz sein kann, ist das Umfeld von Induktionsbe-
weisen.
Verallgemeinert man hier die zu beweisende Aussage, so erkauft man sich damit
im Induktionsschritt eine stärkere Induktionsvoraussetzung, aus der sich eventuell
schärfere Folgerungen ziehen lassen. Ob (und wenn ja, welche) Verallgemeinerun-
gen möglich sind, könnte eventuell mit dem Heurismus des systematischen Probie-
rens herausgefunden werden – dazu mehr an anderer Stelle.
Nun aber ein Beispiel zur Illustration der geschilderten Funktion der Verallge-
meinerung bei Induktionsbeweisen, das ich schon vor sehr langer Zeit ausgearbeitet
habe und das mir später interessante Einsichten in heuristische Vorgehensweisen
vermitteln konnte.

Beispiel 1.32 (Darf es etwas mehr sein?)


Man zeige, dass für alle n 2 N gilt:
!
X
nC1
nC1
. / .1/k k n D 0 :
k
kD0

Versuchen wir zunächst einen Standard-Induktionsbeweis.

1. Induktions-Anfang: Für n D 1 gilt:


! !
X
nC1
nC1 X2
2
.1/ k D
k n
.1/k k D 1  0  2  1 C 1  2 D 0 :
k k
kD0 kD0

Damit ist die Gültigkeit der Formel . / für n D 1 gezeigt.

2. Induktions-Voraussetzung: Die Formel . / gelte für irgendeine natürliche


Zahl n D m  1, es sei also
!
X
m
m
.1/k k m1 D 0:
k
kD0
1.2 Variation der Problemstellung 87

Zu zeigen:
! !
X
m
m X
mC1
mC1
.1/k k m1 D 0 H) .1/k k m D 0 :
k k
kD0 kD0

Da die Induktionsvoraussetzung
PmC1 mC1 beim Beweis verwendet werden muss, gilt es,
k m
Umformungen von kD0 .1/ k durchzuführen, die eine Abspaltung des
P  m k
Terms m kD0 k .1/k m1
k ermöglichen. Unter Verwendung diverser Eigenschaf-
ten der Binomialkoeffizienten ergibt sich:
! !
X mC1
mC1 X mC1
mC1
.1/ k D .m C 1/ 
k m
.1/k k m1
k k
kD0 kD0
!
Xm
m
 .m C 1/  .1/k k m1 :
k
kD0

Laut Induktionsvoraussetzung ist der Subtrahend in dieser Differenz gleich 0. Über


den Minuenden wissen wir im Allgemeinen aber nichts, sodass der Induktionsbe-
weis in eine Sackgasse geraten ist – der Induktionsschritt kann nicht durchgeführt
werden!
Dennoch ist die Sache nicht aussichtslos:
Wenn Formel . / für alle n 2 N richtig sein soll, dann muss offenbar auch
!
X mC1
mC1
.1/k k m1 D 0
k
kD0

und damit eine zu . / analoge Formel für kleinere Exponenten von k gelten.
Probieren
PmC1wir systematisch,
mC1  indem wir etwa für m D 3 und p D 0; 1; 2; 3 die
k mp
Summe kD0 k
.1/ k berechnen:
!
X4
4
.1/k k 3p
k
kD0
8
ˆ
ˆ 1  03 C .4/  13 C 6  23 C .4/  33 C 1  43 D 0 für p D 0 I
ˆ
ˆ
< 1  02 C .4/  12 C 6  22 C .4/  32 C 1  42 D 0 für p D 1 I
D
ˆ
ˆ 1  0 C .4/  1 C 6  2 C .4/  3 C 1  4 D 0 für p D 2 I
1 1 1 1 1
ˆ

1  00 C .4/  10 C 6  20 C .4/  30 C 1  40 D 0 für p D 3 :

Der Fall p D m ist dabei natürlich schon allgemein bekannt, denn laut dem Bino-
mischen Lehrsatz gilt
! !
X mC1
mC1 X mC1
mC1
.1/k k 0 D .1/k 1mC1k D .1 C .1//mC1 D 0 :
k k
kD0 kD0
88 1 Heurismen der Variation

Diese Analyse der Situation legt nahe, einen Induktionsbeweis für folgende Gene-
ralisierung der Formel . / zu versuchen, die für p D 0 in . / übergeht:
Für alle n 2 N und für alle p 2 N0 mit 0  p  n gilt:
!
X
nC1
nC1
. / .1/k k np D 0 :
k
kD0

Hier muss man im Induktionsschritt .n  1/ ! n für .n C 1/ verschiedene Wer-


te von p argumentieren, wobei man mit dem maximal möglichen p beginnt (!
Binomischer Lehrsatz) und dann p sukzessive um 1 verkleinert; bei jedem die-
ser Verkleinerungsschritte kann die Induktionsvoraussetzung benutzt werden, jetzt
ist sie stark genug, weil sie ein Formelpaket für alle kleineren Exponenten k mp ,
1  p  m von k enthält!
Führen wir also einen Induktionsbeweis für . / durch.

1. Induktions-Anfang: Für n D 1 und p 2 f0; 1g gilt:


! !
X
nC1
nC1 X
2
2
k np
.1/ k D .1/k k 1p
k k
kD0 kD0
D 1  01p  2  11p C 1  21p
(
0  2 C 2 D 0 für p D 0 I
D
1  2 C 1 D 0 für p D 1 :

Damit ist die Gültigkeit der Formel . / für n D 1 und p D 0; p D 1 gezeigt.

2. Induktions-Voraussetzung: Die Formel . / gelte für irgendeine natürliche


Zahl n D m  1 und für alle p 2 N0 mit 0  p  m  1.

Zu zeigen: Dann gilt auch


!
X
mC1
mC1
.1/k k mp D 0 für alle p 2 N0 mit 0  p  m:
k
kD0

Im Fall p D m bleibt nichts zu tun (Binomischer Lehrsatz).


Sei also 0  p  m  1. Dann ist
!
X
mC1
mC1
.1/k k mp
k
kD0
!
X
m
mC1
D0C .1/k k mp C .1/mC1 .m C 1/mp
k
kD1
1.2 Variation der Problemstellung 89

!
X
m
m
D .m C 1/ .1/k k m1p C .1/mC1 .m C 1/mp1 .m C 1/
k1
kD1
" ! !#
Xm
mC1 m
D .m C 1/  .1/k k m1p
k k
kD1
C .m C 1/.1/mC1 .m C 1/m1p
! !
X mC1
mC1 Xm
m
D .m C 1/ .1/k k m1p  .m C 1/ .1/k k m1p
k k
kD1 kD1
! !
X mC1
mC1 Xm
m
D .m C 1/ .1/k k m1p  .m C 1/ .1/k k m1p
k k
kD0 kD0
!
X mC1
mC1
D .m C 1/ .1/k k m1p ;
k
kD0

P m
denn laut Induktionsvoraussetzung gilt m
kD0 k .1/ k
k m1p
D 0.
Für p D m  1 bleibt wieder nichts zu zeigen (Binomischer Lehrsatz); sei also
0  p  m  2. Wie oben erhält man dann
!
X
mC1
mC1
.1/k k m1p
k
kD0
! !
X mC1
mC1 X
m
m
D .m C 1/ k m2p
.1/ k  .m C 1/ .1/k k m2p ;
k k
kD0 kD0

und wieder verschwindet der Subtrahend laut Induktionsvoraussetzung, sodass für


p D m  2 die Behauptung gezeigt ist.
Nach insgesamt m Schritten der Verkleinerung von p bei jeweiliger Ausnutzung
der Induktionsvoraussetzung bleibt nur noch
!
X
mC1
mC1
.1/k k mmp D 0 für p D 0
k
kD0

zu zeigen; dies folgt erneut direkt aus dem Binomischen Lehrsatz. 

Der Vorteil bei der Entscheidung für das


P Beweisverfahren
nC1 der vollständigen In-
duktion zur Verifikation der Formel . / nC1kD0 k
.1/k n
k D 0 liegt darin, dass
man mit einem dem Beweisverfahren inhärenten Automatismus auf eine Verall-
gemeinerung geführt wird, deren Nachweis im Rahmen des Verfahrens erbracht
werden kann.
Das bedeutet aber nicht, dass es keine eleganteren Verallgemeinerungen gäbe,
die sich mit ganz anderen Methoden wesentlich geschickter beweisen ließen!
90 1 Heurismen der Variation

Diskutiert man das Problem mit einem Zahlentheoretiker, so fallen diesem unter
Garantie strukturelle Ähnlichkeiten von . / mit diversen Anzahlformeln für speziel-
le Abbildungen zwischen m-elementigen Mengen und r-elementigen Mengen auf.
H ARALD S CHEID machte mich auf die Tatsache aufmerksam, dass sich die Anzahl
zm .r/ der Surjektionen einer m-elementigen Menge auf eine r-elementige Menge
mithilfe der Formel !
Xr
r
zm .r/ D .1/k .r  k/m
k
kD0
   r 
berechnen lässt (siehe auch Beispiel 1.42). Die Symmetrie kr D rk der Binomi-
alkoeffizienten führt auf die Gleichung
!
X
r
r
zm .r/ D .1/k .r  k/m
r k
kD0
!
Xr
r
D .1/r .1/rk .r  k/m
r k
kD0
!
Xr
r
D .1/r
.1/k k m :
k
kD0

Da offenbar zm .r/ D 0 gilt, sobald m < r ist, folgt


!
X
r
r
.1/k k m D 0 für alle r; m 2 N0 mit m < r ;
k
kD0

insbesondere ergibt sich für r WD n C 1 die Verallgemeinerung . / der Formel . /


und für r WD n C 1, m WD n die Formel . / selbst.
Diese zahlentheoretische Argumentation setzt nicht voraus, dass der Problem-
löser über Einblicke in den Ring der zahlentheoretischen Funktionen verfügt. Man
kommt mit ganz einfachen Zählprinzipien der enumerativen Kombinatorik aus, die
sich aus dem Zusammenwirken verschiedener heuristischer Strategien innerhalb der
diskreten Mathematik ergeben; wir werden diese Zählprinzipien in Abschn. 1.2.5
thematisieren. P nC1
Noch geschickter ist es, die Summe S WD nC1 kD0 k
.1/k k n aus Formel . /
als Funktionswert S D f .0/ der Funktion

fW R ! R
P nC1
x 7! f .x/ WD nC1
kD0
k n kx
k .1/ k e

an der Stelle x D 0 zu interpretieren – diese Verallgemeinerung verlässt den Rah-


men der diskreten Mathematik, erfordert aber zur Bearbeitung nur Kenntnisse aus
der Erstsemester-Vorlesung zur Analysis.
1.2 Variation der Problemstellung 91

Ist nämlich gW R ! R die Funktion mit


!
X
nC1
nC1
g.x/ WD .1/k e kx ;
k
kD0

e D ke kx offenbar f D g .n/ und deshalb S D f .0/ D g .n/ .0/.


d kx
so gilt wegen dx
Entscheidend ist nun, dass man mithilfe des Binomischen Lehrsatzes die Darstel-
lung
!
X
nC1
nC1
g.x/ D .1/k e kx
k
kD0
!
X
nC1
nC1
D˙ .1/nC1k e x k
k
kD0
D ˙.e  1/nC1
x

der Funktion g gewinnen kann, an der man sofort sieht, dass sämtliche Ableitungen
von g an der Stelle x D 0 verschwinden, weil jede den Faktor .e x  1/ enthält.
Die Tatsache g .
/ .0/ D 0 für alle
beweist wieder die Verallgemeinerung . /
der Formel . /, die ihrerseits durch den Spezialfall g .n/ .0/ D 0 verifiziert wird.
Die hier realisierte Idee zu einem Beweis der Formel . / mit Mitteln der reellen
Analysis verdanke ich meinem Freund J EFF M C N EAL, mit dem ich in der inspirie-
renden Atmosphäre des Mathematischen Instituts der Princeton University etliche
Stunden intensiver Arbeit an Fragestellungen der komplexen Analysis, ebenso aber
auch ausgedehnte Phasen geistiger Entspannung durch die Beschäftigung mit „re-
creational mathematics“ habe verbringen dürfen.
Nach dem Studium der oben diskutierten Beispiele sollte das von P ÓLYA so
genannte „Paradoxon des Erfinders“, nach dem „eine Reihe von Fragen leichter zu
beantworten sein kann als gerade nur eine“, nicht länger paradox erscheinen, und
wir können ein weiteres Muster heuristischen Handelns herausstellen.

Heuristische Strategie der Generalisierung


Generalisierung (Verallgemeinerung) eines Problems ist eine der Strategien,
die zur Variation des Allgemeinheitsgrades einer Problemstellung eingesetzt
wird.
Ihr Nutzen kann in der Reduktion der Problemkomplexität liegen, ebenso
aber in der Befreiung des Problems von Restriktionen, die dem Problemlöser
möglicherweise neue Einblicke in die Problemsituation verschafft.

Dies hat allerdings unmittelbare Konsequenzen für den zur Generalisierung dua-
len Heurismus der Spezialisierung, der einfach darin besteht, zu einer neuen Pro-
92 1 Heurismen der Variation

blemstellung überzugehen, die die ursprüngliche Problemstellung als Verallgemei-


nerung besitzt:
Wenn es Situationen gibt, in denen die Verallgemeinerung einer Aufgabe den Zu-
gang zur Lösung erleichtert, dann kann man offenbar nicht immer erwarten, dass die
Spezialisierung einer Problemstellung zu neuen Erkenntnissen führen muss, welche
der Lösungsfindung förderlich sind.
Offensichtlich ist dies in den Situationen, wo die Informationsverluste durch
Spezialisierung zu groß sind, als dass man davon im Hinblick auf den Rücktransfer
ins ursprüngliche Problem profitieren könnte; man stelle sich etwa vor, man hätte
in Beispiel 1.32 beim Versuch, Formel . / zu beweisen, zunächst den Spezialfall
p D 0 betrachtet.
Dennoch schafft in der Mehrheit aller Fälle die Spezialisierung einer Problem-
stellung Perspektiven, aus denen nützliche Ansätze entwickelt werden können. Es
gibt sogar Situationen, in denen durch Spezialisierung einer Problemstellung ein
Übergang zu einem äquivalenten Problem geschafft wird.
Dass ein Spezialfall logisch äquivalent zum allgemeinen Fall sein kann, mag
manch einem als das zum Paradoxon des Erfinders duale Paradoxon erscheinen;
dieses Vorurteil soll nun mit einem Beipiel abgebaut werden, in dem das Zusam-
menspiel von Generalisierung und Spezialisierung besonders deutlich wird. Es han-
delt sich um einen auf E UKLID zurückgehenden Beweis des Satzes von Pythago-
ras.62

Beispiel 1.33 (Pythagoras griechisch-klassisch)


Der Flächeninhalt des rechtwinkligen Dreiecks ABC ist offensichtlich gleich der
Summe der Flächeninhalte der rechtwinkligen Dreiecke ACF und CBF . Wieso
beweist dieser Sachverhalt den Satz von Pythagoras?

Die Dreiecke ABC , ACF und CBF sind ähnlich, weil sie alle rechtwink-
lig sind und paarweise einen weiteren Winkel gemeinsam haben.
Sind nun ABC 0 ; ACF1 und CBF2 die Bilddreiecke von ABC ; ACF
und CBF unter den Punktspiegelungen an den Seitenmitten der Seiten AB ; AC
und CB, so sind auch ABC 0 , ACF1 und CBF2 ähnlich.

62
Diskutiert in P ÓLYA: Generalization, specialization, analogy. American Mathematical Monthly
55 (1948).
1.2 Variation der Problemstellung 93

Abb. 1.46 Flächeninhalts-


vergleich: Fc D Fa C Fb

Zusätzlich ist der Flächeninhalt Fc des Dreiecks ABC 0 über der Hypotenuse
c von ABC gleich der Summe der Flächeninhalte Fb ; Fa der Dreiecke ACF1
und CBF2 über den Katheten b und a von ABC , weil Kongruenzabbildungen
insbesondere flächeninhaltstreu sind (Abb. 1.46).
Werden nun beliebige ähnliche Figuren Ga , Gb und Gc über den Seiten63 a; b; c
des Dreiecks ABC gezeichnet und sind Ga ; Gb und Gc deren Flächeninhalte, so
gilt
Ga Gb Gc
D D ;
Fa Fb Fc
also auch
Fa Gc Fb Gc
Ga C Gb D C
Fc Fc
Fa C Fb
D Gc  ;
Fc

woraus wegen Fc D Fa C Fb schließlich Gc D Ga C Gb folgt.


Insbesondere ist dies dann richtig, wenn es sich bei Ga , Gb und Gc um Quadrate
über den Dreiecksseiten handelt – das ist die Behauptung des Satzes von Pythago-
ras. 

Die Beweisführung in Beispiel 1.33 beruht offenbar darauf, dass der eviden-
te Sachverhalt Fa C Fb D Fc eine äquivalente Verallgemeinerung Ga C Gb D
Gc („Verallgemeinerter Satz von Pythagoras“) besitzt, die ihrerseits den Satz von
Pythagoras als (äquivalenten) Spezialfall enthält; Abb. 1.47 verdeutlicht die Zusam-
menhänge.

63
„Über den Seiten . . . “ soll insbesondere bedeuten, dass diejenigen Ähnlichkeitsabbildungen, die
Gi auf Gj abbilden, jeweils auch i auf j abbilden (i; j 2 fa; b; cg).
94 1 Heurismen der Variation

Abb. 1.47 Gemeinsame Verallgemeinerung von Ausgangssituation und Satz des Pythagoras

Die zunächst noch versteckte Analogie zwischen der Ausgangsfigur in der Pro-
blembeschreibung und der Veranschaulichung des Satzes von Pythagoras in Abb.
1.47 wird offensichtlich nach zwei Schritten:

 Äquivalente Beschreibung der Ausgangssituation durch Abb. 1.47, links (! Va-


riation der Darstellung)
 Erkennen der Situation in Abb. 1.47, oben als eine gemeinsame Verallgemeine-
rung der beiden Situationen in Abb. 1.47, unten.

Das allgemeine Denkmuster, das hier den Schlüssel zur Lösung des Problems
enthält, ist die Suche nach gemeinsamen Verallgemeinerungen. Aus der zur Genera-
lisierung dualen Perspektive der Spezialisierung wird an diesem Beispiel deutlich,
dass manchmal Hoffnung besteht, dass sich die Lösungen mehrerer Spezialfälle
einer Problemstellung, die dann die Rolle einer gemeinsamen Verallgemeinerung
dieser Spezialfälle übernimmt, zu einer Lösung des allgemeineren Problems zusam-
mensetzen lassen, wenn man nicht sogar schon bei der Lösung eines Spezialfalls
1.2 Variation der Problemstellung 95

Einsichten gewinnt, die sich zu einer Lösung des Ausgangsproblems generalisieren


lassen.
Betrachten wir nun einige Beispiele zur Problemlösung durch das Studium von
Spezialfällen. Die im ersten Beispiel behandelte Konstruktionsaufgabe wurde unter
einem geringfügig anderen, aber sehr instruktiven Aspekt (! Extremalprinzip) von
N ICOLA H AAS64 diskutiert.

Beispiel 1.34 (Gleichseitiges Dreieck mit Hindernissen)


Vorgegeben seien die parallelen Geraden a; b; und c.
Man konstruiere ein gleichseitiges Dreieck ABC mit

A 2 a; B 2 b und C 2 c :

Will man bei dieser Konstruktionsaufgabe den Heurismus der Spezialisierung


zur Erkenntnisgewinnung verwenden, so kann man offenbar nicht bei der zu kon-
struierenden Figur ansetzen, denn das gleichseitige Dreieck ist unter allen Drei-
ecken das speziellste.
Variationsmöglichkeiten bieten aber die parallelen Geraden a; b; c; ein besonde-
rer Fall von Parallelität liegt bekanntlich vor, wenn Geraden identisch sind.
Da andererseits drei kollineare Punkte A; B; C nicht die Eckpunkte eines Drei-
ecks sein können, bieten sich als Spezialfälle diejenigen an, wo genau zwei der drei
gegebenen Geraden identisch sind. Abb. 1.48 veranschaulicht den Fall b D a.

Abb. 1.48 Lösung der


Konstruktionsaufgabe im
Spezialfall b D a

64
N. H AAS: Das Extremalprinzip als Element mathematischer Denk- und Problemlöseprozesse
– Untersuchungen zur deskriptiven, konstruktiven und systematischen Heuristik. Verlag Franzbe-
cker, Hildesheim (2000).
96 1 Heurismen der Variation

Man wähle A1 2 a, trage in A1 an a einen Winkel von 60ı an; der Schnittpunkt
von c mit dem freien Schenkel dieses Winkels sei C1 . Ist dann B1 der Schnittpunkt
von a mit dem freien Schenkel des in C1 an C1 A1 angetragenen 60ı -Winkels, so ist
A1 B1 C1 ein gleichschenkliges Dreieck mit zwei Basiswinkeln von 60ı , also ein
gleichseitiges Dreieck. Dieses Dreieck genügt den Anforderungen der Problemstel-
lung im Spezialfall b D a.
Die drei Winkel, die sich bei C1 zu einem gestreckten Winkel ergänzen, haben
laut Wechselwinkelsatz jeweils ein Winkelmaß von 60ı . Ist also A2 B2 C2 das Bild-
dreieck von A1 B1 C1 unter der 60ı -Drehung ı um A1 im Gegenuhrzeigersinn, so
gilt A2 D A1 , B2 D C1 und C2 2 c (Abb. 1.49); folglich löst das gleichseitige
Dreieck A2 B2 C2 den Spezialfall b D c des Konstruktionsproblems.

Abb. 1.49 Konstruktion der


Lösung im Fall b D c aus der
Lösung im Fall b D a

Am Zusammenspiel der beiden Spezialfälle lässt sich ablesen, wie die allgemei-
ne Konstruktionsaufgabe gelöst werden kann.
Ist generell AC die Bildstrecke einer Strecke AB bei einer 60ı -Drehung um A,
so ist ABC gleichseitig, denn AC und AB sind die Schenkel des gleichschenk-
ligen Dreiecks ABC mit Basiswinkeln von 12  .180ı  60ı / D 60ı ; dieser Sach-
verhalt wurde oben bei der Konstruktion des gleichseitigen Dreiecks A1 B1 C1
verwendet.

Abb. 1.50 Lösung der


Konstruktionsaufgabe (all-
gemeiner Fall)

Geht man nun vom speziellen Dreieck A1 B1 C1 aus, setzt A WD A1 und wählt
einen beliebigen Punkt B 2 B1 C1 , dann wird, wie in Abb. 1.49 dargestellt, die
Strecke B1 C1 bei einer 60ı -Drehung ı um A auf eine Bildstrecke B2 C2 abgebildet,
die auf der Geraden c liegt, insbesondere ist C WD ı.B/ 2 c und das Dreieck
ABC gleichseitig.
Insbesondere gilt dies, wenn B wie in Abb. 1.50 als der Schnittpunkt von b mit
B1 C1 gewählt wird; dann ist ABC gleichseitig und die Bedingungen A 2 a,
B 2 b und C 2 c sind erfüllt. 
1.2 Variation der Problemstellung 97

Beispiel 1.35 (E UKLIDs Parallelogramm)


Vorgegeben seien ein Dreieck ABC sowie ein spitzer Winkel ˛. Man konstruiere
ein Parallelogramm A1 B1 C1 D1 , welches bei A1 den Innenwinkel ˛ hat und zum
Dreieck ABC flächeninhaltsgleich ist.
Abb. 1.51 enthält alle Informationen, die zur Lösung des Problems erforderlich
sind; man kann zunächst einen Spezialfall lösen und dann den allgemeinen Fall auf
diesen Spezialfall zurückführen.

Abb. 1.51 Rückführung des allgemeinen Falls auf den Spezialfall

Ist nämlich ABC ein Dreieck mit dem Innenwinkel ˛ in A, dann kann man
zunächst ABC zu einem Parallelogramm ABDC mit dem Innenwinkel ˛ bei A
und dem doppeltem Flächeninhalt von ABC ergänzen (Abb. 1.51, links).
Zeichnet man nun die Mittelparallele C1 D1 des Parallelogramms mit C1 D1 jj AB
ein so ist für A1 WD A und B1 WD B das Parallelogramm A1 B1 D1 C1 eine Lösung
des Problems im betrachteten Spezialfall (Abb. 1.51, mitte).
Der allgemeine Fall kann nun auf den Spezialfall zurückgeführt werden (Abb.
1.51, rechts):
Ist im Dreieck ABC der Innenwinkel bei A von ˛ verschieden, so überführe
man es durch eine Scherung in ein flächeninhaltsgleiches65 Dreieck ABC 0 mit
dem Innenwinkel ˛ bei A. 

Es sollte deutlich geworden sein, dass die Spezialisierung einer Problemstellung


bisweilen neue Perspektiven schafft, aus denen Lösungsansätze entwickelt werden
können; es handelt sich also um ein weiteres Muster heuristischen Handelns.

Heuristische Strategie der Spezialisierung


Spezialisierung ist die zur Generalisierung duale Strategie zur Variation des
Allgemeinheitsgrades einer Problemstellung.
Man kann hoffen, dass sich Lösungen von Spezialfällen einer Problem-
stellung zu einer Lösung des allgemeinen Problems, welches dann als
gemeinsame Verallgemeinerung der Spezialfälle fungiert, zusammensetzen
lassen, oder dass sie zumindest Einsichten generieren, die sich zu einer Lö-
sung des allgemeinen Problems verallgemeinern lassen.

65
Auch ohne Kenntnis der Tatsache, dass Scherungen flächeninhaltstreue Abbildungen sind, kann
man die Flächeninhaltsgleichheit der Dreiecke ABC und ABC 0 daran erkennen, dass sie in
Grundseite und Höhe übereinstimmen (! Flächeninhaltsformel für Dreiecke).
98 1 Heurismen der Variation

Die Dualität der Strategien wird auch im folgenden Beispiel noch einmal deut-
lich, das aber primär den Blick auf ein anderes heuristisches Prinzip lenken soll.

Beispiel 1.36 (Grand-Slam-Tennis)


Für die Teilnahme an der Hauptrunde der Einzelwettbewerbe der vier weltgrößten
Tennisturniere („Grand-Slam-Turniere“)66 qualifizieren sich jeweils 128 Spieler;
der Sieger wird in sieben Spielrunden ermittelt, bei denen die Verlierer eines Spiels
aus dem Turnier ausscheiden und sich die Sieger für die nächste Runde qualifizie-
ren („K.-o.-System“). Wie viele Spiele müssen die Veranstalter eines Grand-Slam-
Turniers für jeden Einzelwettbewerb im Terminplan unterbringen?
Eine Standard-Rechnung zur Lösung der Aufgabe sieht so aus:
In der ersten Runde eines Einzelwettbewerbs finden 64 Spiele statt, in der zwei-
ten noch 32, in der dritten noch 16, . . . , bis im Finale noch ein Spiel ausgetragen
wird. Insgesamt werden also

X
6
1  27
kD 2i D D 27  1 D 127
i D0
12

Spiele im Rahmen eines Einzelwettbewerbs durchgeführt.


Alternativ könnte man darüber nachdenken, zunächst die Problemstellung zu
verallgemeinern („Wie viele Spiele finden bei n D 2j Teilnehmern statt?“) und
dann der verallgemeinerten Problemstellung mit der Betrachtung von Spezialfällen
auf den Grund zu gehen.

 Für j D 1 findet offenbar nur ein Spiel statt, es gibt einen Verlierer und einen
Gewinner (den Turniersieger).
 Für j D 2 finden zunächst zwei Halbfinals statt, deren Verlierer ausscheiden;
die beiden Sieger bestreiten das Endspiel, hier gibt es einen Verlierer und einen
Gewinner (den Turniersieger).
 Für j D : : :

Bisher nichts Neues? Darüber entscheidet die Perspektive!


Offenbar hat jedes durchgeführte Spiel des Turniers genau einen Verlierer, der
nach dem Spiel ausscheidet; die Gesamtzahl der im Turnier durchgeführten Spiele
ist also gleich der Anzahl der Spieler, die ein Spiel verloren haben.
Aber: Der einzige Spieler, der im Turnier kein Spiel verliert, ist der Turniersie-
ger; alle anderen Spieler verlieren genau ein Spiel.
Daraus folgt für die Anzahl k der Einzelspiele: k D n  1 D 2j  1. 

Die Konzentration auf den einzigen Spieler, der kein Spiel verloren hat, lässt sich
im Sinne einer Strategie deuten, die im weitesten Sinne darin besteht, bei Problem-

66
Es handelt sich um die Australian Open in Melbourne, die French Open in Paris, die All England
Championships in Wimbledon und die US Open in Flushing Meadows/New York.
1.2 Variation der Problemstellung 99

löseprozessen besonderes Augenmerk auf Extremalsituationen zu legen. A RTHUR


E NGEL fasste diese Strategie sehr restriktiv zusammen67 :

We are trying to prove the existence of an object with certain properties. The extremal pin-
ciple tells us to pick an object which maximizes or minimizes some function. The resulting
object is then shown to have the desired property by showing that a slight perturbation
(variation) would further increase or decrease the given function. If there are several opti-
mizing objects, then it is usually immaterial which one we use. In addition, the extremal
principle is mostly constructive, giving an algorithm for constructing the object.

Dies ist allerdings nur eine Facette dessen, was N ICOLA H AAS in ihrer sehr
tief gehenden und sehr systematischen Auseinandersetzung mit der Rolle „des Ex-
tremalen“ für menschliches Denken und Handeln allgemein, für die Entwicklung
mathematischer Denkweisen und Theorien und für heuristisches Handeln im Rah-
men von Problemlöseprozessen unter der Überschrift „Das Extremalprinzip als
heuristische Strategie“ in ihrem bereits erwähnten Buch behandelt hat.
Ich möchte hier eine kurze Zusammenschau ihrer zentralen Ergebnisse vorstel-
len, damit deutlich wird, wie sich das Extremalprinzip in unsere Systematik der
Heurismen der Variation einordnet.
Auf der Grundlage der an unzähligen Beipielen festzumachenden Korrespon-
denzhypothese, nach der Objekte, die hinsichtlich einer ausgewählten Eigenschaft
extremal sind, oft auch bezüglich anderer Merkmale besondere Kennzeichen auf-
weisen, formuliert N ICOLA H AAS drei Substrategien des Extremalprinzips, die
durch unterschiedliche Funktionen „des Extremalen“ in den einzelnen Problem-
strukturen gekennzeichnet sind:

(1) Das Extremalprinzip bei Existenzproblemen


(Identifikationsfunktion des Extremalen);
(2) Das Extremalprinzip bei Allverneinenden Aussagen
(Monsterfunktion des Extremalen);
(3) Das Extremalprinzip zur Reduktion der Problemkomplexität
(Determinationsfunktion des Extremalen).

Die Ausprägungen dieser Substrategien sowohl in unterschiedlichen Teilgebieten


der Mathematik als auch bei unterschiedlichen mathematischen Tätigkeiten (wie
Abschätzen, Abzählen, Konstruieren, Ordnen) führen dann auf weitere Sonderfor-
men des Extremalprinzips und zeigen dessen Verzahnung mit anderen Strategien
auf.
In Substrategie (1) führt die Korrespondenzhypothese zu der Vermutung, dass
Objekte mit extremalen Eigenschaften ideale Kandidaten für eine Spezies von
Merkmalsträgern sind, deren Existenz bewiesen werden soll.
Ist also zu zeigen, dass in einer Menge M ein Element x existiert, welches eine
Eigenschaft E hat, so könnte man versuchen, ein „Maß“ auf M zu definieren (im
Sinne einer Abbildung W M ! A in eine total-geordnete Menge A) und dann

67
E NGEL , A.: Problem-solving strategies. Springer, New York (1998).
100 1 Heurismen der Variation

ein Element m 2 M auszuwählen, welches bezüglich  extremal wird. Sofern


das gewählte Maß  mit der Eigenschaft E korrespondiert (und genau das ist das
Problem – wie findet man ein mit E korrespondierendes Maß?), kann man hoffen,
dass die Annahme, m hätte nicht die Eigenschaft E, durch den Extremalitätsverlust
von m bezüglich  zum Widerspruch geführt werden könnte.
Die oben zitierte Beschreibung des Extremalprinzips nach E NGEL erfasst exakt
diese Substrategie (1).
Substrategie (2) läuft darauf hinaus, die Korrespondenzvermutung mit der Me-
thode des indirekten Beweises zu kombinieren. Zum Nachweis, dass kein Element
einer Menge M die Eigenschaft E besitzt, nimmt man die Existenz eines x 2 M
mit Eigenschaft E an. Wenn die Korrespondenzhypothese zutrifft, dann weist x ir-
gendwelche Konstellationen auf, die bezüglich geeigneter Maße  extremal sind.
Man studiere solche Extremalitäten in der Hoffnung, dass das Extremale am ehesten
der Eigenschaft E widerspricht.
Auch in Substrategie (2) lebt das Extremalprinzip von der Entdeckung problem-
angepasster Totalordnungen, die durch geeignete Maße induziert werden.
In Substrategie (3) schließlich geht es darum, determinierende Elemente einer
vielschichtigen Problemsituation zu finden, also solche, auf die zu konzentrieren es
sich lohnt, wenn man Ansätze zur Lösung des Problems finden möchte. Laut Korre-
spondenzhypothese zeichnen sich solche determinierenden Elemente häufig durch
extremale Eigenschaften aus. So viel zur Erläuterung des Ansatzes von H AAS.
Wenn man den Begriff des „Extremalen“ nur genügend allgemein interpretiert,
dann lässt sich der Heurismus der Spezialisierung durchaus als die Suche nach den
eine Problemstellung determinierenden Elementen verstehen:
Man studiere Extremfälle nicht nur in der Bedeutung der Minimalisierung/der
Maximalisierung geeigneter Maße, sondern in der allgemeineren Auffassung von
Randfällen, benachbarten Fällen, Sonderfällen, entarteten Fällen, Ausnahmefällen,
Grenzfällen.
In Beispiel 1.34 etwa sind die determinierenden Elemente der Problemstellung
die Dreiecke A1 B1 C1 und A2 B2 C2 , welche sich aus den entarteten Fällen b D
a bzw. b D c ergeben.
In Beispiel 1.35 ist der Sonderfall eines Dreiecks ABC mit ^CAB D ˛ der
Schlüssel zur Lösung des Problems, und in Beispiel 1.36 verhilft der Randfall j D
1 mit dem benachbarten Fall j D 2 zu der Einsicht, dass es genau einen Spieler im
Feld gibt, der kein Spiel verloren hat.
Mir scheint diese eher unscharfe Festlegung der Extremaleigenschaften der die
Problemstellung determinierenden Elemente naheliegender zu sein als eine präzi-
se Beschreibung, die mit der Einführung eines Maßes verbunden ist: Die Dreiecke
A1 B1 C1 und A2 B2 C2 werden von H AAS als Dreiecke maximalen Flächenin-
halts vorgestellt, die sich unter den Vorgaben der Aufgabenstellung konstruieren
lassen – wer aber sollte auf die Idee kommen, dass das Flächenmaß in der Pro-
blemstellung eine Rolle spielen könnte? Der Sonderfall in Beispiel 1.35 ist der Fall
minimaler Winkelmaßdifferenz zwischen ˛ und ^CAB, der Turniersieger in Bei-
spiel 1.36 ist der Spieler mit der maximalen Zahl von Siegen bzw. mit der minimalen
Zahl von Niederlagen unter allen Teilnehmern des Turniers.
1.2 Variation der Problemstellung 101

Insofern könnte man heuristisches Handeln unter Beachtung des Extremalprin-


zips folgendermaßen zusammenfassen:

Heuristisches Handeln gemäß Extremalprinzip


Man kann hoffen, dass sich die determinierenden Elemente einer Problemsi-
tuation durch extremale Eigenschaften auszeichnen.
Insofern könnte es sich lohnen, Randfälle, benachbarte Fälle, Sonderfäl-
le, entartete Fälle, Ausnahmefälle und Grenzfälle einer Problemsituation zu
studieren (! Spezialisierung unter der Maßgabe des Extremalprinzips).
Geht es um den Nachweis, dass ein in irgendeinem Sinne extremales Ob-
jekt X eine Eigenschaft E besitzt, so könnte es zielführend sein zu zeigen,
dass X seine Extremalität verlieren würde, wenn X die Eigenschaft E nicht
hätte.
Geht es um den Nachweis, dass kein Objekt X eine bestimmte Eigenschaft
E hat, dann könnte man versuchen zu zeigen, dass irgendwelche Extre-
malitäten, durch die sich die Kandidaten auszeichnen, der Eigenschaft E
widersprechen würden.

Man erkennt, dass das Extremalprinzip als heuristisches Prinzip im engeren Sin-
ne des „Extremalen“ von Ordnungsstrukturen lebt, die erst dann ihre Wirksamkeit
für den Problemlöser entfalten können, wenn es ihm gelingt, diese Ordnungsstruk-
turen mit der Einführung geeigneter Maße zu entdecken oder gar erst zu induzieren
– darüber entscheidet die Ausgestaltung des mathematischen „Usepackage IKEA“
(Intuition, Kreativität, Erfahrung, Ausdauer) in der Person des Problemlösers.
Bei allgemeinerer Interpretation des „Extremalen“ in dem oben beschriebe-
nen Sinne lassen sich zwar bisweilen Erfahrungsdefizite überspielen, das ändert
aber nichts daran, dass erst das richtige Gespür für das problemangepasste Maß
Lösungen entstehen lässt, die aufgrund ihrer Eleganz und Kürze den Mathematik-
Ästheten zu beeindrucken in der Lage sind.
In diesem Zusammenhang möchte ich zwei Beispiele diskutieren, die zu den
„Klassikern“ zählen; es handelt sich um das Sylvester-Problem68 und den Satz von
Steiner und Lehmus69 .

Beispiel 1.37 (S YLVESTER-Problem)


Vorgegeben sei für n  3 die endliche Menge P WD fP1 ; : : : ; Pn g von Punkten
P1 ; : : : ; Pn in der Ebene mit der Eigenschaft, dass jede Verbindungsgerade zweier
Punkte aus P mindestens einen weiteren Punkt aus P enthält.
Man zeige, dass alle Punkte der Menge P auf einer Geraden liegen.

68
Benannt nach JAMES J OSEPH S YLVESTER (1814–1897).
69
Formuliert im Jahr 1840 von C HRISTIAN L UDOLF L EHMUS (1780–1863) und von JAKOB
S TEINER (1796–1865) im gleichen Jahr bewiesen.
102 1 Heurismen der Variation

Vier Jahre vor seinem Tod stellte J. J. S YLVESTER diese Aufgabe in den Mathe-
matical Questions and Solutions from the Educational Times70 . Den ersten Beweis
hat S YLVESTER nicht mehr erlebt, denn es vergingen vierzig Jahre, bis der unga-
rische Mathematiker T IBOR G ALLAI (G RÜNWALD ) im Jahr 1933 als erster das
Problem mit einer komplizierten Beweisführung lösen konnte.
Im Jahr 1948 gelang aber L EROY K ELLY ein Nachweis mit beeindruckend ein-
fachen Mitteln, der in die Sammlung „Proofs from THE BOOK“ aufgenommen
wurde. Die entscheidende Idee des Beweises beruht auf Substrategie (1) des Ex-
tremalprinzips. Ich halte es für sinnvoll, die in der Charakterisierung der Substra-
tegien des Extremalprinzips eingeführten Begrifflichkeiten auf die hier vorliegende
Problemsituation zu übertragen, um die zur Illustration notwendigen Bezüge her-
zustellen, zumal bei der Besprechung der Aufgabe in der einschlägigen Literatur
zum Problemlösen oft die finale Sorgfalt fehlt. Beginnen wir mit einer äquivalenten
Neuformulierung der Behauptung als Existenzaussage:

Gegeben sei für n  3 die endliche Menge P WD fP1 ; : : : ; Pn g von Punkten


P1 ; : : : ; Pn in der Ebene. Wenn P1 ; : : : ; Pn nicht kollinear sind, dann existiert
eine Gerade, die genau zwei Punkte aus P enthält.

Sei nun G die Menge aller Verbindungsgeraden von je zwei Punkten aus P . Dann
ist .P ; G ; 2/ eine endliche Inzidenzstruktur, die zu einer Inzidenzgeometrie wird,
wenn P1 ; : : : ; Pn nicht kollinear sind und deshalb auch das dritte Inzidenzaxiom
erfüllt ist.
Dadurch wird nun sichergestellt, dass die Menge

M WD f.A; g/ 2 P  G j A … gg

nicht leer ist; auf dieser nicht leeren, endlichen Menge definiert die Funktion

W M ! RC mit .A; g/ WD dist.A; g/

ein Maß, wobei mit dist.A; g/ der euklidische Abstand des Punktes A von der Ge-
raden g bezeichnet sei. Durch die Kleiner-Relation in R ist .M / geordnet, und als
endliche Menge positiver Zahlen hat .M / ein kleinstes Element d > 0.
Sei jetzt .Pi ; `/ 2 M mit .Pi ; `/ D d gewählt und sei F der Fußpunkt des
Lotes von Pi auf ` (Abb. 1.52, links). Dann hat ` die durch „Die Gerade enthält
genau zwei Punkte aus P “ definierte Eigenschaft E, denn sonst würde die Minima-
litätseigenschaft von .Pi ; `/ zerstört.

70
Heft 59 (1893), S. 98, Question No. 11851.
1.2 Variation der Problemstellung 103

Abb. 1.52 Minimalitätseigenschaft von .Pi ; `/: F … P

Um dies einzusehen, mache man sich zunächst klar, dass der Fall F 2 P nicht
eintreten kann (Abb. 1.52, rechts).
Wäre F DW Pk 2 P und Pj 2 P ein weiterer Punkt der Geraden `71 mit
` D gPk Pj , so hätte die Verbindungsgerade h D gPj Pi der Punkte Pi und Pj einen
geringeren Abstand d 0 von Pk D F als die Gerade ` von Pi , was sich elementargeo-
metrisch dadurch begründen lässt, dass d die Hypotenuse in einem rechtwinkligen
Dreieck ist, das d 0 als Kathete hat. Folglich ist F … P .
Wären nun mindestens drei Punkte der Menge P Elemente der Geraden `, etwa
Pj ; Pk und Pm , dann lägen wegen F … P mindestens zwei davon in der gleichen
Halbebene bezüglich der Trägergeraden gFPi (dies seien ohne Beschränkung der
Allgemeinheit die Punkte Pj und Pk ), und einer dieser beiden hätte eine geringere
Entfernung von F als der andere (O. B. d. A. gelte dist.F; Pk / < dist.F; Pj /). Dann
läge die in Abb. 1.53, links beschriebene Situation vor.

Abb. 1.53 Minimalitätseigenschaft von .Pi ; `/ W j` \ P j < 3

Ist jetzt h die Verbindungsgerade von Pi und Pj und bezeichnen d 0 WD dist.F; h/


bzw. d 00 WD dist.Pk ; h/ die Abstände der Punkte F und Pk von h wie in Abb.
1.53, rechts eingezeichnet, so folgt wie eben d > d 0 ; zusätzlich liest man aus dem
2. Strahlensatz ohne Berücksichtigung der exakten Streckenverhältnisse leicht die

71
Dieser existiert, weil jede Gerade einer Inzidenzgeometrie mindestens zwei Punkte enthält.
104 1 Heurismen der Variation

Ungleichung d 0 > d 00 ab. Insgesamt folgt daraus

.Pi ; `/ D dist.Pi ; `/ D d > d 00 D dist.Pk ; h/ D .Pk ; h/

im Widerspruch zur Minimalität von jM in .Pi ; `/. Also enthält die unter der Vor-
aussetzung der Nicht-Kollinearität von P1 ; : : : ; Pn konstruierte Gerade ` nur genau
zwei Punkte, womit das Sylvester-Problem gelöst wäre. 

Der weniger erfahrene Mathematiker wird sich vielleicht darüber wundern, wie
man auf die Idee kommen kann, das Abstandsmaß auf der oben eingeführten Men-
ge M in Betracht zu ziehen, wo doch M weder aus Punkten noch aus Geraden
(den die Problemstellung konstituierenden geometrischen Objekten), sondern aus
Paaren von Punkten und Geraden besteht.
Aus Expertensicht ist die Idee aber naheliegend, denn sobald in der Mathematik
von „Punkten“ (den Elementen einer Menge P ) und „Geraden“ (den Elementen
einer Menge G ) sowie von „Der Punkt P liegt auf der Geraden g“ (dadurch wird
eine Relation I zwischen P und G erklärt) die Rede ist, handelt es sich bei dem
Tripel .P ; G ; I / um eine Inzidenzstruktur mit I als Inzidenzrelation. Wenn in einer
solchen Inzidenzstruktur die Inzidenzaxiome

 Jede Gerade inzidiert mit mindestens zwei verschiedenen Punkten.


 Zu je zwei verschiedenen Punkten gibt es genau eine Gerade, welche mit diesen
inzidiert.
 Es gibt mindestens drei nicht kollineare Punkte.

erfüllt sind, dann liegt eine Struktur vor, die man eine Inzidenzgeometrie nennt.
Im Sylvester-Problem ist eine Inzidenzstruktur vorgegeben (eine endliche
Menge P von Punkten der euklidischen Ebene sowie die Menge G ihrer eu-
klidischen Verbindungsgeraden), für die gezeigt werden soll, dass sie – un-
ter der Voraussetzung, es handelt sich um eine Inzidenzgeometrie (! Nicht-
Kollinearitätsbedingung!) – eine Gerade enthält, die mit genau zwei Punkten
aus P inzidiert. Die Inzidenzrelation „2“ in .P ; G ; 2/ definiert eine Teilmenge R
von P  G , sodass es durchaus natürlich erscheint, im Hinblick auf die Verwen-
dung des Extremalprinzips eine Ordnung auf einer geeigneten Menge von Paaren
.A; g/ 2 P  G induzieren zu wollen. Welches Maß man hierzu zweckmäßigerweise
verwenden könnte, wird deutlich, wenn man die korrespondierenden Eigenschaften
der Extremalsituation

„Alle Punkte der Menge P liegen auf einer Geraden.“

untersucht.
In diesem extremen Fall gilt R D P  G ; liegt aber der Extremfall nicht vor, dann
ist das dritte Inzidenzaxiom erfüllt, und die Betrachtung der Menge M WD P  G nR
macht Sinn, denn diese Differenzmenge ist dann nicht länger leer.
Dass in M die Abstandsfunktion ein geeignetes Instrument ist, um eine Ordnung
auf M zu induzieren, ist wieder naheliegend.
1.2 Variation der Problemstellung 105

Beispiel 1.38 (Der Satz von S TEINER und L EHMUS)


Man beweise die folgende Umkehrung eines bekannten Satzes aus der elementaren
Dreieckslehre:
Sind in einem Dreieck ABC die inneren Winkelhalbierenden w˛ und wˇ der
Innenwinkel ˛ und ˇ gleich lang, dann ist das Dreieck ABC gleichschenklig mit
jCAj D jCBj und den gleich großen Basiswinkeln ˛ D ˇ.

So leicht die Umkehrung des Satzes von Steiner und Lehmus zu beweisen ist,
nach der in einem gleichschenkligen Dreieck die inneren Winkelhalbierenden der
Basiswinkel gleich lang sind, so knifflig ist der Beweis des Satzes selbst, wenn man
ihn mit Mitteln der synthetischen Geometrie führen will.
Bereits im Jahr 1840 wurde C. S TURM in einem Brief von C HRISTIAN L UDOLF
L EHMUS gebeten, den Satz mit rein geometrischen Mitteln zu beweisen. S TURM
gab die Herausforderung an verschiedene Mathematiker weiter, und der erste, der
sie meisterte, war JAKOB S TEINER, weshalb der Satz unter dem Namen „Satz von
Steiner und Lehmus“ bekannt wurde.
Mit großer Regelmäßigkeit wurden ab 1842 bis in die erste Hälfte des 20. Jahr-
hunderts ständig neue Abhandlungen über diesen Satz verfasst; die faszinieren-
de Geschichte dieses Problems und seiner zahlreichen Lösungen hat A RCHIBALD
H ENDERSON (1877–1963) aufgeschrieben72 .
Schon im Dezember 1937 hatte H ENDERSON, der sich nicht nur als Mathemati-
ker, sondern auch als Biograph von G EORGE B ERNARD S HAW betätigt hat, einen
Artikel mit dem Titel „An essay on the internal bisector problem to end all essays
on the internal bisector problem“ im Journal of the Elisha Mitchell Scientific So-
ciety veröffentlicht, in dem er zuerst nachwies, dass eine ganze Reihe der bis dahin
publizierten Beweise fehlerhaft waren, und daran anschließend selbst zehn korrekte,
aber sämtlich lange und umständliche Beweise angab.
Wohltuend kurz und unkompliziert hingegen ist ein Beweis nach H AROLD
S COTT M ACDONALD C OXETER (1907–2003), der Ähnlichkeiten mit einem Be-
weis von L EHMUS aus dem Jahr 1850 aufweist. In diesem Beweis wird eine

72
A. H ENDERSON: The Lehmus-Steiner-Terquem-Problem in Global Survey. Scripta Mathema-
tica 21 (1955).
106 1 Heurismen der Variation

verschärfte Kontraposition73 der Aussage des Satzes von Steiner und Lehmus ge-
zeigt, nämlich die, dass in einem Dreieck mit zwei verschiedenen Winkeln der
kleinere Winkel die längere innere Winkelhalbierende besitzt74 ; zentrales Hilfsmit-
tel bei dieser Beweisführung ist der Peripheriewinkelsatz der Kreisgeometrie.
Sehen wir uns C OXETERs Beweis einmal mit geschärftem Blick für das Extre-
malprinzip an. Abb. 1.54 zeigt ein Dreieck ABC mit zwei verschieden großen
Innenwinkeln ˛ D ^BAC , ˇ D ^CBA, ˛ > ˇ. Zu zeigen ist, dass in dieser
Situation jwˇ j > jw˛ j gilt, wenn w˛ D AD und wˇ D BE die inneren Winkelhal-
bierenden der Winkel ˛ und ˇ im Dreieck ABC bezeichnen.

Abb. 1.54 Verschärfte Kon-


traposition des Satzes von
Steiner und Lehmus

In der Randsituation ˛ D ˇ wären w˛ und wˇ gleich lang, denn dann wären die
Dreiecke ABD und ABE nach dem Kongruenzsatz (wsw) für Dreiecke kongruent.
Ein determinierendes Element dieser Randsituation ist die minimale absolute Län-
gendifferenz der Winkelhalbierenden, die nicht kleiner als 0 werden kann; allerdings
ist dieses Maß für die Problemstellung zu unspezifisch, da es um den Nachweis ei-
ner Aussage über das Vorzeichen von jwˇ j  jw˛ j geht – die Differenz jwˇ j  jw˛ j
soll für ˛ > ˇ positiv sein.
Laut Korrespondenzhypothese könnte es aber auch andere Besonderheiten der
extremalen Randsituation ˛ D ˇ geben, die mit dem Übergang zu ˛ > ˇ verloren
gehen. Eine davon ist die Eigenschaft, dass das Viereck ABDE im Fall ˛ D ˇ
einen Umkreis besitzt, für ˛ > ˇ jedoch nicht (Abb. 1.55).
Im gleichschenkligen Dreieck ABC (links) folgt wegen ˛ D ˇ, dass sich im
Viereck ABDE Paare einander gegenüberliegender Winkel zu 180ı ergänzen, wie
dies für ˛ und ^BDE angedeutet ist. Diese Bedingung ist notwendig und hinrei-
chend für die Existenz eines Umkreises des Vierecks ABDE.

73
Der Kontrapositionssatz besagt, dass die Aussage p ) q logisch äquivalent zur Aussage
.:q/ ) .:p/ ist, wobei mit .:w/ die Verneinung (Negation) der Aussage w bezeichnet wer-
de.
74
H. C OXETER : Introduction to Geometry. John Wiley & Sons, New York (1961).
1.2 Variation der Problemstellung 107

Abb. 1.55 Umkreis als determinierendes Element der Randsituation ˛ D ˇ

Läge im rechten Dreieck ABC aus Abb. 1.55 mit ˛ > ˇ der Schnittpunkt E
der Winkelhalbierenden wˇ mit der Dreiecksseite AC auf dem Umkreis des Drei-
ecks ABD, so wäre DE eine Sehne dieses Kreises, über der mit ^DBE D ˇ2
und ^DAE D ˛2 zwei verschieden große spitze Peripheriewinkel lägen, was laut
Peripheriewinkelsatz unmöglich ist.
Aber Vorsicht – noch sind wir nicht am Ziel!
Mit der graphischen Darstellung in Abb. 1.55, rechts wird suggeriert, dass der
Schnittpunkt P der Winkelhalbierendengeraden von ˇ mit dem Umkreis des Drei-
ecks ABD ein innerer Teilpunkt von BE ist und deshalb jBP j < jBEj gilt. Das
muss aber begründet werden, denn sonst könnte man Abb. 1.55 ebenso gut die Be-
ziehung jBEj > jADj entnehmen, die wir gerade erst beweisen wollen . . .
Die Begründung liefert erneut der Peripheriewinkelsatz (Abb. 1.56).

Abb. 1.56 P ist innerer


Teilpunkt von BE

Der Winkel ^DBP D ˇ2 ist ein Peripheriewinkel über dem gleichen von der
Sehne DP begrenzten Bogen wie der Winkel ^DAP , also ist auch ^DAP D ˇ2 .
Wegen ^DAE D ˛2 > ˇ2 D ^DAP folgt P 2 BE, P ist also innerer Teilpunkt
von BE.
108 1 Heurismen der Variation

Zum endgültigen Nachweis von jBEj > jADj genügt es deshalb, jBP j > jADj
zu zeigen, denn weil P ein Punkt der Strecke BE ist, gilt jBEj > jBP j.
Bei jBP j > jADj handelt es sich offenbar um eine Aussage über Längen von
Sehnen im Kreis, die verschieden großen spitzen Winkeln gegenüber liegen:
Die Sehne BP liegt dem Winkel ^PAB D ˛2 C ˇ2 , die Sehne AD dem Winkel
^ABD D ˇ gegenüber, und wegen ˛ > ˇ ist

1
90ı D .˛ C ˇ C /
2
1
> .˛ C ˇ/ D ^PAB
2
1
> .ˇ C ˇ/ D ^ABD :
2
Der aus der Dreieckslehre bekannte Sachverhalt, dass in jedem Dreieck mit
verschieden großen Winkeln dem größeren Winkel jeweils die längere Seite ge-
genüberliegt75 , hat aber folgendes Analogon in der Kreislehre:

 Liegen zwei Sehnen BP und AD eines Kreises zwei verschiedenen spitzen Pe-
ripheriewinkeln ' und ı gegenüber, so gehört zum kleineren Winkel die kürzere
Sehne.

Auch dieser Zusammenhang ergibt sich aus dem Peripheriewinkelsatz (Abb. 1.57):
Sind ' und ı diejenigen spitzen Peripheriewinkel, die über den jeweils kürzeren
der zu den Sehnen BP und AD gehörigen Kreisbögen b1 und b2 liegen, und gilt
etwa ' < ı, dann ist der zu ' gehörige Zentrumswinkel ^PMB über b1 (D 2')
auch kleiner als der zu ı gehörige Zentrumswinkel ^DMA über b2 (D 2ı).

Abb. 1.57 Die kürzere Sehne


liegt dem kleineren Winkel
gegenüber

Zum kleineren Zentrumswinkel gehört aber die kürzere Sehne, wie man nach
derjenigen Drehung des Dreiecks PMB um M , die P in A überführt, unschwer
erkennen kann.
Damit ist jBP j > jADj gezeigt, und der Satz von Steiner und Lehmus ist be-
wiesen. 

75
Dies ist eine Folgerung aus dem Satz vom gleichschenkligen Dreieck, nach dem in jedem Dreieck
ABC die Bedingungen jCAj D jCBj und ^CAB D ^CBA äquivalent sind.
1.2 Variation der Problemstellung 109

Die Verwendung von DGS (! Heurismus der Dynamisierung) visualisiert mü-


helos den durch die verschärfte Kontraposition des Satzes von Steiner und Leh-
mus gegebenen Sachzusammenhang, sodass man kaum der Versuchung widerste-
hen kann, einen direkten Beweis mit abbildungsgeometrischen Methoden führen zu
wollen, der die Existenz eines Umkreises des Vierecks ABDE oder die Parallelität
von AB und DE – beides sind determinierende Elemente der Randsituation ˛ D ˇ
– aus der Bedingung jADj D jBEj deduziert.
Dass man sich mit diesem Ansinnen auf dünnes Eis begibt, wird deutlich, wenn
man mit (DGS) die Bahnkurven verfolgt, auf der sich D und E bei Scherungen
des Dreiecks ABC an der Achse gAB bewegen – augenscheinlich handelt es sich
hier um elliptische Kurven, was nicht gerade eine gute Prognose für den Erfolg des
Lösungsplans stellt. Mehr zu den Problemen, mit denen man bei der Umsetzung
dieses Plans zu kämpfen hat, in Beispiel 3.8.

1.2.5 Sonderformen in der enumerativen Kombinatorik

Das Zusammenwirken der in den vorigen Abschnitten behandelten heuristischen


Strategien führt im Rahmen der diskreten Mathematik zu Sonderformen, die sich
verselbständigt haben.
Denkt man an Problemstellungen der enumerativen Kombinatorik, so geht es
dort abstrakt grundsätzlich darum, die Mächtigkeiten jM j irgendwelcher endlicher
Mengen M zu bestimmen, wobei die Elementezahl jM j eine Invariante des Wech-
sels zwischen verschiedenen Abzähltechniken ist. Jede spezielle Abzähltechnik ih-
rerseits geht einher mit einer passenden Umstrukturierung der abzuzählenden Men-
ge, sodass die fundamentalen Zählprinzipien der enumerativen Kombinatorik als
Resultate des Zusammenspiels von Invarianzprinzip und Variation der Wahrneh-
mung durch Restrukturierung unter eventuellem Einbezug weiterer heuristischer
Strategien angesehen werden können.
Es folgt eine kommentierte Übersicht der einzelnen Zählprinzipien.

(A) Elementare Zählstrategien

1. Summenregel Sei M D M1 [    [ Mk eine Partition der endlichen Menge M


in paarweise disjunkte Teilmengen M1 ; : : : ; Mk . Dann gilt

jM j D jM1 j C    C jMk j :

Diese Regel ist eine in Zählprozessen allgegenwärtige Selbstverständlichkeit: Man


erleichtert sich das Auszählen einer großen endlichen Menge M dadurch, dass man
ihre Elemente an verschiedene Blöcke M
, 1 
 k verteilt (in diesem Vertei-
lungsprozess besteht die Umstrukturierung von M !), deren einzelne Mächtigkeiten
leichter bestimmbar sind und am Ende aufsummiert werden.
Dieses Vorgehen reflektiert den Heurismus der Modularisierung, der in Abschn.
3.3 allgemein diskutiert wird.
110 1 Heurismen der Variation

Dabei geht es generell darum, ein vorgegebenes Problem in kleinere Teilproble-


me zu zerlegen, die Teilprobleme zu lösen und dann die Lösungen der Teilprobleme
zu einer Lösung des Ausgangsproblems zusammenzusetzen; es ist offensichtlich,
dass diese heuristische Vorgehensweise speziell für die Entwicklung von Zählstra-
tegien von fundamentaler Bedeutung ist.

2. Zählen durch Bijektion Sind M und A endliche Mengen und ist 'W A ! M
eine bijektive Abbildung, dann gilt jM j D jAj.
Jede Abzählung einer n-elementigen Menge (im Folgenden kurz: „n-Menge“)
B ist durch eine bijektive Abbildung W f1; : : : ; ng ! B gegeben, mit der die
Elemente von B durchnummeriert werden (für 1  i  n ist .i/ ist das i-te
Element der Menge B).
Ist also A eine endliche Menge, deren Elementezahl jAj DW n sich durch einen

Zählprozess W f1; : : : ; ng ! A leicht bestimmen lässt, so legt die durch in-
duzierte Anordnung von A vermöge der Bijektion ' ı W f1; : : : ; ng ! M eine
Strukturierung von M fest, welche auch die Bestimmung der Mächtigkeit jM j D n
von M ermöglicht.
Will man beispielsweise die Anzahl der Elemente der Potenzmenge M WD P .B/
einer k-Menge B D fb1 ; : : : ; bk g ermitteln, so genügt es, die Anzahl der Elemente
der Menge A WD f0; 1gk zu bestimmen, denn vermöge der Abbildung

'W M ! A (
1; falls bi 2 X
X 7! .t1 ; : : : ; tk / mit ti WD
0; falls bi … X

wird jeder Teilmenge X von B bijektiv genau ein k-Tupel '.X/ 2 f0; 1gk zugeord-
net.
Die Bestimmung von jAj ist aber einfach, wenn man das folgende, in der Kom-
binatorik als Produktregel bekannte Zählprinzip verwendet.

3. Produktregel Die Menge M enthalte k-Tupel von Elementen einer n-Menge


L76 , wobei für die Besetzung der i-ten Komponente unabhängig von zuvor ge-
troffenen Auswahlentscheidungen jeweils ni Wahlmöglichkeiten bestehen (i D
1; : : : ; k). Dann gilt jM j D n1  n2      nk .
Die Anwendung der Produktregel auf das oben diskutierte Beispiel liefert
jAj D 2k , denn für die Besetzung einer jeden der k Komponenten eines k-Tupels
.t1 ; : : : ; tk / 2 f0; 1gk stehen n1 D n2 D    D nk D 2 Auswahlmöglichkeiten
zur Verfügung. Demzufolge hat die Potenzmenge einer k-Menge genau 2k viele
Elemente.
Allgemeiner ergibt sich aus der Produktregel die Anzahlformel für k-fache kar-
tesische Produkte:

76
In der Kombinatorik spricht man in diesem Zusammenhang auch von k-Wörtern aus dem Al-
phabet L; in dieser Terminologie bezeichnet man dann die i -te Komponente eines k-Tupels als
den i -ten Buchstaben des k-Wortes.
1.2 Variation der Problemstellung 111

 Sind M1 ; : : : ; Mk endliche Mengen und ist M WD M1  M2      Mk , so gilt

jM j D jM1 j  jM2 j      jMk j :

Die vom Zählen nach der Produktregel reflektierte Umstrukturierung der Menge M
besteht in der gedanklichen Anordnung ihrer Elemente als Punktmuster innerhalb
eines k-dimensionalen Würfels.
Zu diesem Zweck bilde man L vermöge 'W L ! f0; : : : ; n  1g bijektiv
auf den Abschnitt f0; : : : ; n  1g von N0 ab und identifiziere Lk mittels WD
.'; : : : ; '/W Lk ! '.L/k mit den nk -vielen Punkten der Menge '.L/k , welche
aus den Punkten mit ganzzahligen Koordinaten im Würfel W WD Œ0; n  1k  Rk
besteht.
Die Auszählung der Punkte im Punktmuster .M / kann nun über das rekursive
Zählen erfolgen, welches als nächstes Zählprinzip vorgestellt wird.

4. Rekursives Zählen Zur Ermittlung der Mächtigkeit jM j einer endlichen Menge


M DW Mk genügt es offenbar, eine Folge endlicher Mengen .Mi /k1 i D1 mit leicht zu
bestimmendem jM1 j und eine Rekursionsvorschrift zu finden, die für jedes i 2
f1; : : : ; kg die Berechnung von jMi j aus den Daten jM1 j; : : : ; jMi 1 j ermöglicht.
Dann lässt sich jM j durch .k  1/-malige Verwendung der Rekursionsvorschrift
berechnen.
Im Beispiel oben setze man .M / DW Mk . Bezeichnet dann für 1  j  k  1
prj W Rk ! Rj  f0gkj die Projektion von Rk auf Rj und ist Mj WD prj .Mk /, so
gilt offenbar für alle j D 1; : : : ; k  1:

jMj C1 j D nj C1  jMj j ;

denn es ist
Mj C1 D f.a; b; 0; : : : ; 0/ 2 Rk j a 2 Mj ; b 2 La g;
wobei La  L zwar eine eventuell von a abhängige Teilmenge von L ist, aber
auf jeden Fall unabhängig von a stets genau nj C1 Elemente hat. Rekursiv errechnet
man nun

jMk j D nk  jMk1 j
D nk  nk1  jMk2 j D : : :
D nk  nk1      n1 :

Dem rekursiven Zählen liegt wieder deutlich der Heurismus der Modularisierung
zu Grunde – die Mächtigkeiten der Mengen M1 ; : : : ; Mk1 lassen sich über die
Rekursionsvorschrift derart zusammensetzen, dass man daraus die Elementezahl
von M D Mk bestimmen kann.
Mit diesen Zählprinzipien steht ein Instrumentarium zur Verfügung, welches die
Lösung der vier kombinatorischen Grundaufgaben ermöglicht und die epistemische
Struktur des Problemlösers mit den jeweiligen Anzahlformeln bereichert, was für
die Bewältigung von Zählaufgaben enorm hilfreich ist.
112 1 Heurismen der Variation

Es handelt sich darum, die k-Auswahlen aus einer n-Menge mit (1) oder ohne
(2) Berücksichtigung der Reihenfolge und mit (a) oder ohne (b) Wiederholungen zu
zählen.
Abb. 1.58 zeigt eine schematische Darstellung der vier Grundaufgaben der Kom-
binatorik mit den üblichen Bezeichnungen für die zu zählenden Objekte.

(a) erlaubt?
(1) beachtet
(beliebiges k-Tupel)
(k-Variation, k-Tupel)
(b) verbietet?
Auf wie viele Arten und Wiederholungen
kann man aus einer (injektives k-Tupel)
n-Menge k Elemente
auswählen, wenn man (a) erlaubt?
die Reihenfolge (2) nicht beachtet
(k-Kollektion)
(k-Kombination)
(b) verbietet?
und Wiederholungen
(k-Teilmenge)

Abb. 1.58 Die vier kombinatorischen Grundaufgaben

Wir werden nun die vorgestellten Zählprinzipien benutzen, um die den einzelnen
Grundaufgaben zugehörigen Anzahlformeln herzuleiten; das Ergebnis ist:

(1a) Die Anzahl aller k-Tupel aus einer n-Menge ist nk .


(1b) Die Anzahl aller injektiven k-Tupel aus einer n-Menge (k  n) ist .nk/Š

.
n
(2b) Die Anzahl k aller k-Teilmengen einer n-Menge (k  n) ist kŠ.nk/Š .
77 nŠ
 
(2a) Die Anzahl aller k-Kollektionen aus einer n-Menge ist nCk1
k .

Die Anzahlformeln (1a) und (1b) ergeben sich unmittelbar aus der Produktregel,
denn für alle i D 1; : : : ; k hat man zur Besetzung der i-ten Komponente eines k-
Tupels jeweils n Möglichkeiten zur Verfügung, wenn Wiederholungen erlaubt sind
() (1a)), und man hat jeweils .n  i C 1/ Möglichkeiten zur Verfügung, wenn
Wiederholungen verboten sind und deshalb die i  1 Elemente, mit denen man die
Komponenten 1 bis i  1 besetzt hat, nicht mehr wählbar sind () (1b)).
Mithilfe des Zählens durch Bijektion und der Summenregel lassen sich (2b) auf
(1b) und (2a) auf (2b) zurückführen.

77
n 
Dies ist eine Definition für die Binomialkoeffizienten k
.
1.2 Variation der Problemstellung 113

Zunächst sei M die Menge aller injektiven k-Tupel aus der n-Menge L. Dann
wird durch (
˛ und ˇ enthalten bis auf die
˛ ˇW ,
Reihenfolge die gleichen Elemente

eine Äquivalenzrelation in M erklärt, welche M in Äquivalenzklassen zerlegt, die


jeweils genau kŠ Elemente haben, wie man aus (1b) für den Fall n D k schlie-
ßen kann. Die Anzahl jM j der Elemente von M ist laut Summenregel gerade
„ C kŠ ƒ‚
kŠ C    C kŠ
…, wenn die Anzahl der Äquivalenzklassen mit a bezeichnet wird.
a Summanden
Da aber jM j aus (1b) bekannt ist, lässt sich diese Gleichung nach a auflösen, und
man erhält für die Anzahl der Klassen die Formel

jM j nŠ
aD D :
kŠ kŠ.n  k/Š

Andererseits bestimmt jede Äquivalenzklasse


  umkehrbar eindeutig eine k-Teilmen-
ge von L, sodass auch die Anzahl kn aller k-Teilmengen der n-Menge L durch a
gegeben ist (Zählen durch Bijektion).
Jede k-Kollektion aus der n-Menge L D f`1 ; : : : ; `n g bestimmt umkehrbar ein-
deutig ein n-Tupel .1 ; : : : ; n / 2 N0 n mit 1 C 2 C    C n D k, dessen i-te
Komponente i die Häufigkeit angibt, mit der das Element `i in der k-Kollektion
vorkommt.
Jedes n-Tupel .1 ; : : : ; n / 2 N0 n mit 1 C 2 C    C n D k wiederum
bestimmt umkehrbar eindeutig ein .n C k  1/-Tupel aus f0; 1g, in dem für i D
1; : : : ; n  1 nacheinander jeweils i Plätze mit 0 und ein Platz mit 1 belegt werden
und zum Schluss das .n C k  1/-Tupel mit n Nullen aufgefüllt wird:

.0; : : : ; 0; 1 ; 0; : : : ; 0; 1 ; : : : ; 0; : : : ; 0; 1 ; 0; : : : ; 0/
„ ƒ‚ … „ ƒ‚ … „ ƒ‚ … „ ƒ‚ …
1 2 n1 n

Also gibt es genau so viele k-Kollektionen aus der n-Menge L, wie es Möglich-
keiten gibt, aus den Platznummern f1; 2; : : : ; n C k  1g exakt k verschiedene
auszuwählen  und die zugehörigen Plätze mit 0 zu besetzen – dies sind nach (2b)
aber genau nCk1
k
viele, womit auch (2a) begründet wäre.
Die Hauptschwierigkeit der Anwendung der bisher vorgestellten Zählregeln in
Problemstellungen der enumerativen Kombinatorik besteht in der Regel nicht darin,
die auf das Problem passenden Anzahlformeln auszuwählen – normalerweise wird
deutlich, ob in abzuzählenden k-Auswahlen Wiederholungen erlaubt sind und ob
es auf die Reihenfolge ankommt. Oft bereitet es aber Probleme, den Zählprozess so
zu strukturieren, dass die Produktregel und die Summenregel anwendbar werden;
zur Verdeutlichung dieser Problematik behandeln wir Zählaufgaben im Kontext des
originär US-amerikanischen Glücksspiels „Poker“, das in den letzten Jahren (zu-
mindest in einigen Varianten) auch in Deutschland populär geworden ist.
114 1 Heurismen der Variation

Beispiel 1.39 (Poker)


Beim Poker handelt es sich um ein Kartenspiel, das mit einem Deck von 52 Spiel-
karten (die aufeinander folgenden Kartenwerte 2; 3; 4; 5; 6; 7; 8; 9; 10; Bube, Dame,
König, As, jeweils in den Farben Karo, Herz, Pik, Kreuz) gespielt wird. Es gibt ei-
ne unglaubliche Vielfalt von Varianten dieses Spiels, die sich zum Beispiel dahin
gehend unterscheiden, ob jeder Spieler nur seine eigenen Karten sehen kann oder
einen Teil seiner Karten offen für alle sichtbar vor sich liegen hat, wie viele Karten
zur Hand eines Spielers gehören, aus der dieser dann sein Pokerblatt (entsprechend
einer 5-Teilmenge der 52 Spielkarten) zusammenstellen kann, ob es „community
cards“ oder „wild cards“ gibt78 , ob man „replacements“ (den Austausch einiger
Karten gegen gleich viele neue Karten) erlaubt, ob das beste („high games“) oder
das schlechteste („low games“) Blatt gewinnt usw. Zu jeder einzelnen Variante ge-
hört dabei ein spezifisches Verfahren, nach dem man Geld darauf wetten kann, das
laufende Spiel zu gewinnen.

So unterschiedlich die einzelnen Variationen von Poker auch sind, in einer


Grundregel stimmen alle Spielformen (mit Ausnahme der „entarteten“ Pokerspiele
wie „Mexican Sweat“79 ) überein. Danach ist ein Pokerblatt genau dann bewertet,
wenn es mindestens eine der folgenden Bedingungen erfüllt:

 Das Blatt enthält mindestens zwei Karten gleichen Wertes (z. B. zwei oder mehr
Damen).
 Das Blatt enthält fünf Karten nur einer Farbe (fünf Herzkarten, fünf Pikkarten,
fünf Karokarten oder fünf Kreuzkarten).
 Das Blatt enthält fünf aufeinander folgende Kartenwerte (z. B. 8; 9; 10; Bube,
Dame), wobei das As nur als die niedrigste oder die höchste der fünf Karten
gewählt werden kann.
(Demnach sind As, 2; 3; 4; 5 und 10, Bube, Dame, König, As bewertet; Dame,
König, As, 2; 3 gelten nicht als fünf aufeinander folgende Kartenwerte und sind
daher nur dann bewertet, wenn alle Karten die gleiche Farbe haben).

Zählaufgabe: Wie viele bewertete Pokerblätter gibt es?


Wenn nicht vor dem Austeilen der Karten80 ein spezieller Kartenwert als „wild
card“ deklariert wird, lassen sich die bewerteten Blätter in acht verschiedene Blö-
cke partitionieren. Im Einzelnen sind dies:

78
Eine community card ist eine offen auf dem Tisch liegende Karte, die jeder Spieler als eine
Karte seiner Hand betrachten darf; eine wild card ist eine Jokerkarte, die jede beliebige der 52
Spielkarten repräsentieren kann.
79
Dabei erhält jeder Spieler 7 Karten, die er ungesehen verdeckt vor sich aufstapeln muss. Nach
einem simplen Verfahren, welches viele Gelegenheiten für Wetteinsätze bietet, werden alle Karten
nacheinander aufgedeckt. Der Spieler mit der höchsten einzelnen Karte gewinnt.
80
Sofern nicht durch vorgeordnete Spielregeln einer Pokerrunde anders geregelt, entscheidet je-
weils der durch Rotation wechselnde Kartengeber über die Variante von Poker, die als nächste
gespielt wird.
1.2 Variation der Problemstellung 115

(1) ONE PAIR (Z. B. zwei Damen und drei andere paarweise verschiede-
ne Karten ohne eine weitere Dame)
(2) TWO PAIRS (Z. B. zwei Achten, zwei Buben und eine von Acht und
Bube verschiedene Karte)
(3) THREE OF A KIND (Z. B. drei Siebenen und zwei von Sieben verschiedene
Karten unterschiedlicher Werte)
(4) STRAIGHT (Fünf aufeinander folgende Kartenwerte, aber nicht alle
von einer Farbe)
(5) FLUSH (Fünf Karten von nur einer Farbe, aber nicht in fünf auf-
einander folgenden Kartenwerten)
(6) FULL HOUSE (Ein Paar und ein Drilling, z. B. zwei Könige und drei
Zehnen)
(7) FOUR OF A KIND (Vier Karten gleichen Wertes, z. B. vier Asse, und eine
beliebige fünfte Karte)
(8) STRAIGHT FLUSH (Fünf aufeinander folgende Kartenwerte genau einer
Farbe)

(Der nicht aufgeführte ROYAL FLUSH ist ein Spezialfall von (8) mit den Karten-
werten 10, Bube, Dame, König, As. Die Pokerblattkategorie HIGH CARD soll hier
nicht zu den bewerteten Pokerblättern gezählt werden; hat kein Spieler ein bewer-
tetes Blatt, so gewinnt bei high games der Spieler mit der höchsten Karte.81 )
Ein Block (i) ist höher zu bewerten als ein Block (j), wenn es weniger Möglich-
keiten gibt, ein Pokerblatt aus Block (i) zusammenzustellen als es Möglichkeiten
gibt, ein Pokerblatt aus Block (j) zu konfigurieren; innerhalb eines jeden Blocks
entscheidet die Wertigkeit der Karten über die Reihenfolge der Blätter. Durch Aus-
zählen der einzelnen Blöcke werden wir nun feststellen, dass (1) bis (8) in dieser
Reihenfolge nach Wertigkeiten aufsteigend angeordnet sind.

Kategorie (1)
Man wähle zuerst
 einen aus dreizehn Kartenwerten, der doppelt vorkommen soll;
dies ist auf 13
1 D 13 Arten möglich. 
Anschließend wähle man zwei aus vier Karten dieses Werts aus, was auf 42 D 6
Arten geht. Aus den verbleibenden
  zwölf anderen Kartenwerten wähle man zu-
nächst drei aus – dafür gibt es 12
3 D 220 Möglichkeiten –, und dann wähle man
für jeden einzelnen dieser
 drei Werte jeweils eine aus vier Karten dieses Wertes aus,
wozu man jedesmal 41 D 4 Wahlmöglichkeiten hat.
Nach der Produktregel gibt es damit
13  6  220  43 D 1 098 240
Pokerblätter der Kategorie One Pair.
Man hätte auch anders zählen können: Genau dann hält man ein Pokerblatt der
Sorte One Pair, wenn man exakt vier verschiedene Kartenwerte auf der Hand hat

81
Haben zwei Spieler im direkten Vergleich denselben höchsten Kartenwert, entscheidet der
zweithöchste usw.
116 1 Heurismen der Variation

 
( 13 D 715 Möglichkeiten). Von diesen wähle man einen, der als Paar vorkommen
4  
soll ( 41 D 4 Möglichkeiten), dann zwei aus vier möglichen Karten dieses Wertes

( 4 D 6 Möglichkeiten) und jeweils eine aus vier Karten der übrigen drei Werte (je
42
1
D 4 Möglichkeiten). Auch diese Zählmethode führt mit der Produktregel auf

715  4  6  43 D 1 098 240

Pokerblätter der Kategorie One Pair.


Beide durchgerechneten Zählarten sind so strukturiert, dass die Produktregel
anwendbar wird, denn in jeder Phase des Zählprozesses ist die Anzahl der Mög-
lichkeiten unabhängig von den zuvor getroffenen Auswahlentscheidungen. Würde
man aber die Zusammenstellung des Pokerblatts zeitlich-sukzessiv betrachten, ginge
diese Unabhängigkeit verloren, und der sich verzweigende Zählprozess wäre nicht
mehr kontrollierbar:

 Die erste Karte kann beliebig gewählt werden (52 Möglichkeiten).


 Es gibt 3 Möglichkeiten, als zweite Karte eine solche auszuwählen, deren Kar-
tenwert mit dem Wert der ersten Karte übereinstimmt. In jedem dieser Fälle kann
man auf 48 Arten die dritte, auf 44 Arten die vierte und auf 40 Arten die fünfte
Karte auswählen, was schon mal auf 52  3  48  44  40 D 13 178 880 Möglichkei-
ten führt, von denen aber jeweils 5Š D 120 dieselben Pokerblätter repräsentieren,
weil es ja auf die Reihenfolge, in der man seine Karten erhält, nicht ankommt –
bleiben 109 824 verschiedene Blätter (gerade noch gerettet!).
 In den 48 Fällen, in denen man als zweite Karte eine solche auswählt, deren
Wert nicht mit dem Wert der ersten Karte übereinstimmt, gibt es 6 Fälle, in de-
nen der Wert der dritten Karte mit einem der Werte der beiden ersten Karten
übereinstimmt und die man auf 44  40 Arten komplettieren kann – halt! Welche
haben wir davon schon eben gezählt? Auf die Reihenfolge der Karten kommt
es ja nicht an! (Jetzt sollten wir aufgeben, denn auch die Summenregel ist nicht
mehr anwendbar . . . )

So viel zur erforderlichen Strukturierung des Zählprozesses; die Anzahl der Po-
kerblätter in den Kategorien (2) bis (8) werden wir jetzt nur noch situationsange-
passt zählen.

Kategorie (2)
Zur Zusammenstellung eines Pokerblatts
  der Kategorie Two Pairs wähle man drei
von dreizehn Kartenwerten aus ( 13 D 286 Möglichkeiten), entscheide sich für
3 
zwei dieser drei, welche als Paare vorkommen sollen ( 32 D 3 Möglichkeiten),

wähle bei diesen jeweils zwei aus vier Karten aus (je 42 D 6 Möglichkeiten) und

lege sich auf eine von vier Karten des dritten Wertes fest ( 41 D 4 Möglichkeiten.
Damit ist
286  3  62  4 D 123 552
die Anzahl der Pokerblätter der Kategorie Two Pairs.
1.2 Variation der Problemstellung 117

Kategorie (3)
Ein Pokerblatt der Sorte Three Of A Kind konfiguriert man durch Auswahl drei-
er Kartenwerte (286 Möglichkeiten), von denen einer dreifach vorkommen soll (3
Möglichkeiten) und dafür drei aus vier möglichen Karten zu wählen sind (4 Mög-
lichkeiten). Für die beiden anderen Werte wähle man jeweils eine von vier Karten
aus (jeweils 4 Möglichkeiten). Insgesamt gibt es demnach

286  3  4  42 D 54 912

Pokerblätter der Kategorie Three Of A Kind.

Kategorie (4)
Ein Straight ergibt sich, wenn man zunächst fünf aufeinander folgende Karten-
werte aussucht (10 Möglichkeiten, da als kleinste Karte einer 5er-Serie nur As,
2; 3; : : : ; 10 in Frage kommen, denn man darf nicht über das As hinaus zählen)
und dann für die einzelnen Karten jeweils eine von vier Farben wählt, wobei aber
nicht alle Karten die gleiche Farbe haben dürfen, weil sonst ein Pokerblatt vom Typ
Straight Flush entstünde (bleiben 45  4 D 1020 Möglichkeiten). Folglich gibt es

10  1020 D 10 200

Pokerblätter vom Typ Straight.

Kategorie (5)
Zur Zusammenstellung eines Flush wählt man eine von vier Farben (4 Möglich-  
keiten) und darin fünf nicht aufeinander folgende verschiedene Kartenwerte ( 13
5 
13
10 D 1277 Möglichkeiten, denn 10 aus den 5 -vielen 5-Auswahlen sind fortlau-
fend). Insgesamt gibt es also

4  1277 D 5108

Pokerblätter der Kategorie Flush.

Kategorie (6)
Ein Pokerblatt
  der Sorte Full House konfiguriert man durch Auswahl zweier Kar-
tenwerte ( 13
2 D 78 Möglichkeiten), von denen einer dreifach vorkommen soll (2
Möglichkeiten).
 Für diesen sind dann drei aus vier möglichen
  Karten zu wählen
( 43 D 4 Möglichkeiten), für den anderen zwei aus vier ( 42 D 6 Möglichkeiten).
Insgesamt gibt es demnach

78  2  4  6 D 3744

Pokerblätter der Kategorie Full House.


118 1 Heurismen der Variation

Kategorie (7)
Ein Pokerblatt des Typs Four Of A Kind erhält man, wenn man von einem Kar-
tenwert alle vier Karten auswählt (13 Möglichkeiten) und eine beliebige der noch
übrigen 48 Karten hinzufügt (48 Möglichkeiten). Folglich gibt es

13  48 D 624

Pokerblätter der Sorte Four Of A Kind.

Kategorie (8)
Es gibt (siehe oben) 10 Möglichkeiten, fünf aufeinander folgende Kartenwerte aus-
zusuchen, für jede davon kann eine von vier Farben gewählt werden. Also gibt es

10  4 D 40

Pokerblätter der Kategorie Straight Flush.


Zur Beantwortung der ursprünglich formulierten Frage, wie viele bewertete Po-
kerblätter existieren, verwendet man nun die Summenregel, um die gesuchte Anzahl
durch Addition der Pokerblattanzahlen in den einzelnen Blöcken zu ermitteln. Da-
nach gibt es insgesamt

1 098 240 C 123 552 C 54 912 C 10 200 C 5108 C 3744 C 624 C 40 D 1 296 420

bewertete Pokerblätter. 

Dieses Resultat hätte man natürlich auch einfacher ermitteln können, frei nach
dem Motto: „In order to know how many friends you have, it might be helpful to
count your enemies!“, welches auf das Prinzip des komplementären Zählens an-
spielt.

5. Komplementäres Zählen Zur Bestimmung der Elementezahl einer Teilmenge


M der endlichen Menge L kann es von Vorteil sein, die Mächtigkeit des Kom-
plements M c WD L n M von M bezüglich L auszuzählen – dann ergibt sich
jM j D jLj  jM c j.
Diese Regel ist nichts weiter als eine Lesart der Summenregel für zwei Mengen-
summanden, denn durch L D M [M c wird offenbar eine Partition von L definiert,
für die dann jLj D jM j C jM c j gilt.
Man ermittele also geschickterweise die Anzahl der bewerteten  Pokerblätter
 da-
durch, dass man von der Anzahl aller Pokerblätter (dies sind 52 5
D 2 598 960
viele) die Anzahl der unbewerteten Pokerblätter subtrahiert.
Zur Zusammenstellung eines unbewerteten Pokerblatts wählt  man zuerst fünf
unterschiedliche, nicht aufeinander folgende Kartenwerte ( 13 5
 10 D 1277 Mög-
lichkeiten), danach „färbt“ man die Karten, ohne stets die gleiche Farbe zu verwen-
den, was auf 45  4 D 1020 Arten möglich ist. Demnach gibt es 1277  1020 D
1.2 Variation der Problemstellung 119

1 302 540 unbewertete und somit 2 598 960  1 302 540 D 1 296 420 bewertete Po-
kerblätter.
Auffallend ist, dass die Anzahlen bewerteter und unbewerteter Pokerblätter an-
nähernd gleich sind; die Differenz liegt in der Größenordnung von 6000, sodass
man durch eine Abwandlung der Pokerregeln, welche die Anzahl bewerteter Poker-
blätter um etwa 3000 erhöht, auf einen nahezu perfekten Ausgleich hoffen kann.
Dazu bietet es sich an, die Anzahl der Straights um etwa 30 % zu erhöhen;
man könnte etwa erlauben, dass beim Straight über das As hinaus gezählt wer-
den darf, sodass auch fBube; Dame; König; As; 2g, fDame; König; As; 2; 3g und
fKönig; As; 2; 3; 4g als 5-Teilmengen aufeinander folgender Kartenwerte auftreten.
Auf diese Weise erhielte man als Anzahl S möglicher Straights:

S D 13  .45  4/ D 13 260 :

Nach dieser Regeländerung wäre die Anzahl B bewerteter Pokerblätter demnach

B D 1 296 420 C .13 260  10 200/ D 1 299 480;

und dies ist exakt die Hälfte aller möglichen Pokerblätter!


Ein angesichts der komplizierten Regeln, nach denen Pokerblätter bewertet wer-
den, derart wunderbares Anzahlverhältnis verlangt geradezu danach, die Pokerre-
geln entsprechend zu ändern. Ich muss aber zugeben, dass ich mit meinen diesbe-
züglichen Vorschlägen in den USA auf wenig Verständnis gestoßen bin, vergleich-
bar etwa mit der Reaktion von Fußballexperten auf die Anregung, die Abseitsregel
beim Fußball abzuschaffen.
Dies mag nicht zuletzt damit zusammenhängen, dass sich das Verhältnis zwi-
schen bewerteten und nicht bewerteten Pokerblättern ohnehin dramatisch verändert,
wenn man eine der populären Varianten mit wild cards spielt.
Würde man etwa den Kartenwert Zwei zur wild card erklären, dann wären
1 799 280 der 52 5 Pokerblätter bewertetet, was man leicht mit der Technik des
komplementären Zählens feststellen kann:
Unbewertet ist ein Pokerblatt in dieser Situation genau dann, wenn es aus fünf
nicht aufeinander folgenden verschiedenen Kartenwerten besteht, die nicht  alle
 die
gleiche Farbe haben und unter denen sich keine Zwei befindet82 . Es gibt 12 5
Mög-
lichkeiten, fünf verschiedene Kartenwerte aus f1; 3; 4; 5; 6; 7; 8; 9; 10; Bube; Dame;
König; Asg zu wählen, darunter befinden sich genau acht Auswahlen  aufeinander
folgender Werte (nicht über das As hinaus gezählt). Für jede dieser 12 5
 8 D 784
Zusammenstellungen fünf verschiedener, nicht aufeinander folgender Kartenwerte
stehen .45  4/ D 1020 mögliche Färbungen zur Verfügung, die zu einem unbewer-
teten Pokerblatt führen. Deshalb sind laut Produktregel genau 784  1020 D 799 680

82
Jedes Pokerblatt, das mindestens eine Zwei enthält, ist offenbar bewertet, denn die Zwei als wild
card kombiniert sich mit jeder weiteren Karte auf der Hand des Spielers mindestens zu einem
Pokerblatt der Kategorie One Pair.
120 1 Heurismen der Variation

Pokerblätter unbewertet, und man hat


!
52
 799 680 D 1 799 280
5

bewertete Pokerblätter für den Fall, dass mit dem Kartenwert Zwei als wild card
gespielt wird.
Darunter befindet sich auch eine neue Kategorie von bewertetem Pokerblatt,
nämlich FIVE OF A KIND; dies ist das am höchsten bewertete Pokerblatt dieser
Spielvariante, denn es gibt davon genau 672 Exemplare83 , während man 2552 Blät-
ter der Kategorie Straight Flush zusammensetzen kann (davon 32 ohne wild card,
544 mit genau einer wild card, 1320 mit genau zwei wild cards und 656 mit genau
drei wild cards)84 .
Offenbar wird hier ein Pokerblatt vom Typ „vier Zweien und eine weitere Kar-
te“ nicht zur Kategorie Straight Flush gezählt, obwohl man durch geeignete Wahl
von Repräsentanten für die vier wild cards einen Straight Flush erzeugen könnte.
Der Grund dafür ist, dass man zur Wahrung der paarweisen Elementefremdheit der
einzelnen Blöcke (! Anwendbarkeit der Summenregel!) jedes Blatt mit wild cards
nur einer Kategorie zuordnet, nämlich der höchsten85 durch geeignete Belegung
der wild cards erreichbaren Stufe.
Ist beim Auszählen von Mengenvereinigungen die paarweise Elementefremdheit
der einzelnen beteiligten Mengen nicht gegeben, so muss die Summenregel wie
folgt verfeinert werden, um eine passende Abzähltechnik zu gewinnen.

(B) Prinzip der Inklusion und Exklusion (Siebformel)


Sei zunächst M D M1 [ M2 die Vereinigungsmenge von zwei endlichen Mengen
M1 und M2 (! Spezialisierung). Dann kann man durch eine passende Umstruktu-
rierung von M eine Partition von M in drei paarweise elementefremde Teilmengen
erreichen; man setzt dazu

M D ŒM1 n .M1 \ M2 / [ ŒM2 n .M1 \ M2 / [ .M1 \ M2 /:

Nun kann man die Elementezahl von M nach der Summenregel bestimmen:

jM j D jM1 n .M1 \ M2 /j C jM2 n .M1 \ M2 /j C jM1 \ M2 j :

83
Davon überzeuge man sich am besten dadurch, dass man den Zählprozess nach der Anzahl der
verwendeten wild cards additiv zerlegt und die Summenregel verwendet.
84
Hier zähle man partitioniert nach der Anzahl der verwendeten wild cards und innerhalb eines
jeden dieser Blöcke in Abhängigkeit von dem niedrigsten von der wild card verschiedenen Karten-
wert. Beispiel:
   Für  Straight Flush mit exakt zwei wild cards und Acht als niedrigstem Kartenwert
gibt es 42  4 42 D 144 Möglichkeiten (zwei aus vier der Werte 9; 10; Bube; Dame, in vier Farben,
kombiniert mit zwei aus vier Zweien).
85
Zumindest dann, wenn man sich für ein möglichst gut bewertetes Blatt interessiert („high ga-
mes“).
1.2 Variation der Problemstellung 121


Wegen Mi D ŒMi n.M1 \M2 / [ .M1 \M2 / für i D 1; 2 bietet es sich aber an, zur
Berechnung von jM j die Summe jM1 j C jM2 j zu bilden und zu berücksichtigen,
dass in dieser Summe die Elemente von M1 \ M2 zweimal gezählt werden, sodass
sich
jM j D jM1 j C jM2 j  jM1 \ M2 j
ergibt.
Die oben vorgenommene Umstrukturierung von M und die dazu passende Ab-
zähltechnik lässt sich auf die Auszählung der Vereinigungsmenge von n endlichen
Mengen verallgemeinern (! Generalisierung).

Satz (Siebformel)
Es sei M D M1 [ M2 [    [ Mn die Mengenvereinigung der endlichen Mengen
M1 ; : : : ; Mn . Dann gilt
ˇ ˇ
X
n X ˇˇ \ ˇ
ˇ
jM j D .1/i C1 ˇ Mj ˇ ;
ˇ ˇ
i D1 J 2Pi .N / ˇj 2J ˇ

wobei N den Abschnitt N WD f1; 2; : : : ; ng der natürlichen Zahlen und Pi .N / die


Menge aller i-elementigen Teilmengen von N bezeichne (1  i  n). Die Sum-
mationsvorschrift „J 2 Pi .N /“ ist so zu verstehen, dass über alle i-Teilmengen J
von N summiert werden soll.
Meist beweist man die Siebformel mit vollständiger Induktion über n; viel ele-
ganter ist aber der nachfolgend Tangegebene Zählbeweis nach A. E NGEL.
Die Mengendurchschnitte j 2J Mj , deren Elementezahlen auf der rechten Sei-
te der Siebformel mit passenden Vorzeichen aufsummiert werden, sind sämtlich
Teilmengen von M . Deshalb wird ein Element a, welches zu keiner der Mengen
M1 ; : : : ; Mn gehört, auf der rechten Seite der Siebformel auch nicht gezählt.
Ist aber für k 2 N das Element a in exakt k der Mengen M1 ; : : : ; Mn enthalten,
so wird es bei der Summation
P T
 von .1/1C1 J 2P1 .N / j j 2J Mj j genau k-mal,
P T  
 von .1/2C1 J 2P2 .N / j j 2J Mj j genau  k2 -mal,
P T  
 von .1/3C1 J 2P3 .N / j j 2J Mj j genau k3 -mal,
 von : : : P T  
 von .1/kC1 J 2Pk .N / j j 2J Mj j genau .1/k  kk -mal
P T
gezählt, während es bei der Summation von .1/i C1 J 2Pi .N / j j 2J Mj j für i >
k nicht mehr gezählt wird, weil a in Durchschnitten von mehr als k der Mengen
M1 ; : : : ; Mn nicht enthalten ist. Insgesamt wird a bei der Summation auf der rechten
122 1 Heurismen der Variation

Seite der Siebformel mit der Häufigkeit


! !
X k
k X k
k
.1/i C1  D  .1/i  1ki
i D1
i i D1
i
!
X k
k
D1  .1/i  1ki
i D0
i
D 1  .1 C .1//k (Binomischer Lehrsatz)
D1

gezählt, womit die Gültigkeit der Siebformel bewiesen wäre. 

Die Leistungsfähigkeit des Zählprinzips der Inklusion und Exklusion soll nun an
einigen Beispielen aus der elementaren Zahlentheorie demonstriert werden.

Beispiel 1.40 (Eulersche '-Funktion)


Die zahlentheoretische Funktion

'W N ! N
m 7! '.m/ WD jfk 2 f1; : : : ; mg j ggT.k; m/ D 1gj ;

welche jeder natürlichen Zahl m die Anzahl der zu m teilerfremden Zahlen k mit
1  k  m zuordnet, trägt den Namen E ULERsche '-Funktion.
Diese Funktion spielt in der Zahlentheorie eine große Rolle; man denke etwa an
den Satz von Euler/Fermat86 und seine zahlreichen Konsequenzen.
Wie kann man die Werte '.m/ aus den Primfaktorzerlegungen der Zahlen m
bestimmen?
Offenbar gilt '.1/ D 1 und '.p/ D p  1, wenn p eine Primzahl ist. Auch
für Primzahlpotenzen p ˛ , ˛ 2 N lässt sich '.p ˛ / leicht durch Abzählen bestim-
men: Jede p-te der Zahlen 1; : : : ; p ˛ ist durch p teilbar, alle anderen sind zu p
teilerfremd. Daher gilt
 
1
'.p ˛ / D p ˛  p ˛1 D p ˛ 1  :
p

Unter Verwendung der Tatsache, dass ' multiplikativ87 ist, erhält man daraus sofort
das gewünschte Resultat. Hat m 2 N die kanonische Primfaktorzerlegung m D
p1˛1  p2˛2      pn˛n , so gilt
       
1 1 1 1
'.m/ D p1˛1 1       pn˛n 1  Dm 1   1 :
p1 pn p1 pn

86
Danach ist stets a'.m/ 1 mod m, wenn die Zahlen a und m teilerfremd sind. Für Primzahlen
m geht dieser Satz auf F ERMAT zurück, der allgemeine Fall wurde von E ULER bewiesen.
87
Eine von der Nullfunktion verschiedene zahlentheoretische Funktion f heißt multiplikativ,
wenn für teilerfremde a; b stets f .ab/ D f .a/f .b/ gilt.
1.2 Variation der Problemstellung 123

Der Nachweis der Multiplikativität von ' ist aber nach meinen persönlichen Erfah-
rungen bei den Studierenden nicht sehr beliebt, obwohl er lediglich auf einer ge-
eigneten Strukturierung des Abschnitts f1; : : : ; abg der natürlichen Zahlen beruht,
bei der die zwischen 1 und ab gelegenen Repräsentanten der einzelnen Restklassen
mod b spaltenweise nach Restklassen separiert in ein rechteckiges Zahlenschema
eingetragen werden.
Die Berechnung von '.m/ aus der Primfaktorzerlegung von m ist aber auch
über das komplementäre Zählen in Verbindung mit dem rekursiven Zählen und der
Siebformel möglich.
Sind nämlich p1 ; : : : ; pn die verschiedenen Primteiler von m und ist M WD
f1; 2; : : : ; mg, so ist ein Element k der Menge M genau dann nicht teilerfremd
zu m, wenn die Teilermenge Tk von k mindestens eine der Primzahlen p1 ; : : : ; pn
enthält. Für i D 1; : : : ; n bezeichne nun Mi WD fk 2 M j pi 2 Tk g die Menge aller
durch pi teilbaren Zahlen von M . Dann definiert die Mächtigkeit der Mengenver-
einigung M1 [    [ Mn die Anzahl der nicht zu m teilerfremden Zahlen von M ,
woraus sich
'.m/ D m  jM1 [    [ Mn j
ergibt. Zur Berechnung von jM1 [    [ Mn j mithilfe der Siebformel brauchen wir
Informationen über die Elementezahlen der Durchschnitte von jeweils i der Mengen
M1 ; : : : ; Mn (1  i  n). Ist aber J 2 Pi .N / eine i-elementige Teilmenge von
N D f1; : : : ; ng mit J D fj1 ; : : : ; ji g, so gilt
ˇ ˇ
ˇ ˇ
ˇ\ ˇ ˇ ˇ m
ˇ Mj ˇ D ˇMj \ Mj \    \ Mj ˇ D ;
ˇ ˇ  j2      pji
1 2 i
ˇj 2J ˇ pj1 p

was sich durch rekursives Zählen ermitteln lässt: Jede pj` -te der Zahlen aus M ,
die durch jede der Primzahlen p1 ; : : : ; pj`1 teilbar sind, ist auch durch pj` teilbar
.2  `  i/, also ist
ˇ ˇ ˇ ˇ
ˇMj \ Mj \    \ Mj ˇ D ˇMj \ Mj \    \ Mj ˇ  1 .2  `  i/ ;
1 2 ` 1 2 `1
pj`
und es gilt jMj1 j D m
pj1 . Also ist
'.m/ D m  jM1 [    [ Mn j
ˇ ˇ
ˇ ˇ
X
n X ˇ\ ˇ
Dm .1/i C1 ˇ Mj ˇ
ˇ ˇ
i D1 J 2Pi .N / ˇj 2J ˇ
X
n X m
DmC .1/i Q
i D1 j 2J pj
J 2Pi .N /
2 3
1 X 1 X 1
D m  41  C     C .1/n 5
p
1j1 n j1
p p
1j1 <j2 n j1 j2
p1 2 : : : pn
p
   
1 1
Dm 1  1  ;
p1 pn
124 1 Heurismen der Variation

wobei der Übergang von der vorletzten zur letzten Gleichung dieser Kette besser in
umgekehrter Richtung verstanden werden kann (Ausmultiplizieren der Klammern
nach dem Distributivgesetz). 

Beispiel 1.41 (Le probleme des rencontres; M ONTMORT)


Zu Beginn des 18. Jahrhunderts, als sich die in die Algebra eingebettete „Glücks-
spielrechnung“ zu einer eigenständigen Disziplin (der Wahrscheinlichkeitstheorie)
zu verselbständigen begann, verfasste P IERRE R ÉMOND DE M ONTMORT in Paris
ein Essay88 , in dem er sich unter anderem mit dérangements bei Lotterieziehungen
auseinandersetzte.
Dabei ging es um die Frage, wie oft bei geordneten Ziehungen von n nummerier-
ten Kugeln ohne Zurücklegen ein „rencontre“ erscheint, welches darin besteht, dass
eine Kugel mit der Nummer i beim i-ten Zug gezogen wird; unter einem dérange-
ment verstand M ONTMORT eine Ziehung, in der kein rencontre auftritt.
Für n 2 N sei nun Dn die Anzahl der dérangements beim Ziehen von n num-
merierten Kugeln ohne Zurücklegen; dann nennt man die Zahlenfolge .Dn /n2N die
Folge der Rencontre-Zahlen.
Wie kann man die Folge der Rencontre-Zahlen explizit oder rekursiv definieren?
Jede geordnete Ziehung ohne Zurücklegen aus n nummerierten Kugeln bestimmt
umkehrbar eindeutig eine Permutation
!
1 2 3 ::: n
D 2 Sn ;
 .1/  .2/  .3/ : : :  .n/

wobei  .i / jeweils die Nummer der Kugel angibt, welche beim i-ten Zug gezogen
wird (1  i  n). Eine solche Permutation  beschreibt offenbar genau dann ein
dérangement, wenn  .i / ¤ i für alle i 2 f1; : : : ; ng gilt, wenn also  fixpunktfrei
ist. Folglich ist für jedes n 2 N die n-te Rencontre-Zahl Dn durch die Anzahl der
fixpunktfreien Permutationen in Sn gegeben (Zählen durch Bijektion).
Sei jetzt Mi WD f 2 Sn j  .i / D ig die Menge aller Permutationen
S in Sn
mit dem Fixpunkt i (1  i  n). Dann ist Dn D jSn j  j niD1 Mi j, und zur
Berechnung des Subtrahenden mit der Siebformel benötigen wir Informationen
über die Elementezahlen der Durchschnitte von jeweils i der Mengen M1 ; : : : ; Mn
(1T i  n). Für jede feste i-Teilmenge J der Menge N WD f1; : : : ; ng gilt aber
j j 2J Mj j D .n  i/Š, denn jede Permutation  2 Sn mit den i Fixpunkten aus J
legt umkehrbar eindeutig eine Permutation der .n  i/-elementigen Menge N n J

88
Essai d’Analyse sur les Jeux de Hazard, Paris 1708.
1.2 Variation der Problemstellung 125

fest. Also gilt gemäß der Siebformel:


ˇ n ˇ
ˇ[ ˇ
ˇ ˇ
Dn D jSn j  ˇ Mi ˇ
ˇ ˇ
i D1
ˇ ˇ
ˇ ˇ
X
n X ˇ\ ˇ
D nŠ  .1/i C1 ˇ ˇ
ˇ Mj ˇ
i D1 ˇ
J 2Pi .N / j 2J ˇ
X
n X
D nŠ C .1/i .n  i/Š
i D1 J 2Pi .N /
! !
X
n
n n
D nŠ C .1/ i
.n  i/Š (wegen jPi .N /j D )
i D1
i i
X
n
.1/i
D nŠ :
i D0

Aus dieser expliziten Angabe der Rencontre-Zahlen lässt sich leicht eine rekursive
Definition der Folge .Dn /n2N herleiten: Es ist D1 D 0, und für n  2 gilt
!
X n
.1/i X
n1
.1/i .1/n
Dn D nŠ D n  .n  1/Š C D n  Dn1 C .1/n :
i D0
iŠ i D0
iŠ nŠ

Eine weitere rekursive Definition der Folge .Dn /n2N ist durch

D1 D 0 I D2 D 1 I DnC1 D n  .Dn C Dn1 / für n  2

gegeben; ein erster kombinatorischer Beweis dieser Formel gelang L EONHARD


E ULER. 

Der Anteil der fixpunktfreien unter allen Permutationen einer n-Menge ist dem-
Pn .1/i
nach jS Dn
nj
D i D0 i Š – diese Summenfolge konvergiert für n ! 1 gegen
exp.1/ D e , wobei e die E ULERsche Zahl ist.89 Für große n ergibt sich deshalb
1

jSn j näherungsweise zu e ' 37 %.


Dn 1

Wenn man also für n verschiedene politische Ausschüsse (die offenbar in genü-
gend großer Zahl vorhanden sind) n thematisch unterschiedliche Sitzungsvorlagen
erstellt, diese aber zufällig auf die einzelnen Sitzungszimmer verteilt, dann besteht
eine Wahrscheinlichkeit von annähernd 63 % dafür, dass zumindest in einer der Sit-
zungen nicht am Thema vorbei diskutiert wird . . .

P1 xi
89
Die Exponentialreihe iD0 iŠ ist für jedes x 2 R konvergent zum Grenzwert exp.x/.
126 1 Heurismen der Variation

Als letztes Beispiel zur Siebformel beweisen wir die Formel für die Anzahl zm .r/
der surjektiven Abbildungen einer m-Menge auf eine r-Menge, von der bei der
Behandlung des Beispiels 1.32 die Rede war.

Beispiel 1.42 (Surjektionen einer m-Menge auf eine r-Menge)


Man begründe, dass für die Anzahl zm .r/ der surjektiven Abbildungen einer m-
Menge auf eine r-Menge gilt:
!
X
r
r
zm .r/ D .1/k .r  k/m :
k
kD0

Seien A D fa1 ; : : : ; am g eine m-Menge, B D fb1 ; : : : ; br g eine r-Menge und M WD


ff W A ! Bg die Menge aller Abbildungen von A in B. Durch jedes m-Tupel
.y1 ; : : : ; ym / 2 B m wird umkehrbar eindeutig eine Abbildung f 2 M bestimmt,
und zwar die Abbildung

f W A ! B mit f .ak / D yk für alle k D 1; : : : ; m :

Laut der bewiesenen Anzahlformeln der kombinatorischen Grundaufgaben gibt es


genau r m viele m-Tupel aus der r-Menge B, so dass sich die Elementezahl der
Menge M zu jM j D r m ergibt (Zählen durch Bijektion).
Sei nun N WD f1; : : : ; rg, und für k 2 N beschreibe Mk WD ff 2 M j bk …
f .A/g die Menge derjenigen Abbildungen aus M , deren Bild das Element bk 2 B
nicht enthält. Dann definiert die Mengenvereinigung M1 [    [ Mr diejenigen Ab-
bildungen aus M , die mindestens eines der Elemente von B nicht treffen. Folglich
ist M1 [    [ Mr komplementär zur Menge der surjektiven Abbildungen von A in
B, und es gilt:

zm .r/ D r m  jM1 [    [ Mr j :

Zur Auszählung von jM1 [    [ Mr j mit der Siebformel werden Informationen


über die Elementezahlen der Durchschnitte von jeweils k der Mengen M1 ; : : : ; Mr
(1  k  T r) benötigt. Für jede festeSk-Teilmenge J 2 Pk .N / der Menge N ist
offenbar j 2J Mj D ff W A ! B n jS 2J fbj gg die Menge aller Abbildungen von
A in die .r  k/-elementige Menge B n j 2J fbj g, was auf die Formel
ˇ ˇ
ˇ ˇ
ˇ\ ˇ
ˇ Mj ˇ D .r  k/m
ˇ ˇ
ˇj 2J ˇ
 
führt. Die Anzahl der k-Teilmengen von N ergibt sich zu jPk .N /j D kr (vgl. An-
zahlformeln der Kombinatorik), und man erhält mithilfe des Prinzips der Inklusion
1.2 Variation der Problemstellung 127

und Exklusion

zm .r/ D r m  jM1 [    [ Mr j
ˇ ˇ
ˇ ˇ
X
r X ˇ\ ˇ
Dr 
m
.1/kC1 ˇ ˇ
ˇ Mj ˇ
kD1 ˇ
J 2Pk .N / j 2J ˇ
X
r X
D rm C .1/k .r  k/m
kD1 J 2Pk .N /
!
X
r
r
Dr Cm
.1/ 
k
 .r  k/m
k
kD1
!
X
r
r
D .1/k .r  k/m
k
kD0

als Anzahl der Surjektionen einer m-Menge auf eine r-Menge. 

Das Prinzip der Inklusion und Exklusion greift nicht nur bei der Bestimmung
von Anzahlen, sondern lässt sich auf die Bestimmung der Werte solcher Funktio-
nen P auf einem System endlicher Mengen verallgemeinern, die (wie speziell die
Anzahlfunktion) additiv sind, für die also
X
P .M / D P .fmg/ ; M endliche Menge
m2M

gilt. In dieser Gestalt wird es zum Beispiel in endlichen Wahrscheinlichkeitsräu-


men .˝; P .˝/; P / verwendet, wenn es darum geht, für E1 ; : : : ; En 2 P .˝/ die
Wahrscheinlichkeit P .E1 [    [ En / des Ereignisses E1 [    [ En zu berechnen
(„Additionssatz der Wahrscheinlichkeitsrechnung“).

(C) Prinzip des doppelten Zählens


Während die bisher vorgestellten Zählprinzipien in erster Linie dazu dienen, Ele-
mentezahlen endlicher Mengen zu ermitteln, steht bei dem nun diskutierten Prinzip
der enumerativen Kombinatorik eine andere Form des Erkenntnisgewinns im Vor-
dergrund. Es geht um das Prinzip des doppelten Zählens, welches schon bei der
Diskussion von Beispiel 1.17 zum Invarianzprinzip benutzt, aber bisher nicht for-
mal beschrieben wurde.

Prinzip des doppelten Zählens Es seien A und B endliche Mengen sowie I


A  B eine Relation zwischen A und B. Für jedes a 2 A bezeichne Ra WD fb 2
B j .a; b/ 2 I g die Faser von I über a, für jedes b 2 B bezeichne Sb WD fa 2
A j .a; b/ 2 I g die Faser über b der Umkehrrelation I 1 von I . Sind dann ra WD
128 1 Heurismen der Variation

jRa j und sb WD jSb j die Mächtigkeiten der Fasern, so gilt für die Elementezahl
von I : X X
ra D jI j D sb :
a2A b2B

Die vom Prinzip des doppelten Zählens reflektierte Strukturierung der Menge I
wird in Abb. 1.59 verdeutlicht.
Abb. 1.59 Inzidenztafel I b1 b2 b3 b4 b5

a1 × ×

a2 ×

a3 × ×

a4 × × ×

Als binäre Relation ist I eindeutig durch die zugehörige Inzidenztafel festgelegt.
Hier werden in einem Rechtecksschema die Elemente von A als Zeilenkoordinaten
und die Elemente von B als Spaltenkoordinaten eingetragen, dann notiert man eine
Markierung (beispielsweise ein ) im Feld mit den Koordinaten .ai ; bj /, falls ai
mit bj inzidiert, womit die Situation .ai ; bj / 2 I sprachlich umschrieben wird;
Abb. 1.59 zeigt exemplarisch die Inzidenztafel der Relation

I D f.a1 ; b2 /; .a1 ; b3 /; .a2 ; b3 /; .a3 ; b1 /; .a3 ; b2 /; .a4 ; b3 /; .a4 ; b4 /; .a4 ; b5 /g:

Offenbar stimmt jI j mit der Anzahl der Kreuzchen in der Inzidenztafel von I
überein, die man unter anderem sowohl zeilenweise als auch spaltenweise zählen
könnte, wobei jI j eine Invariante der Variation der Abzähltechnik ist. Nun finden
sich in der Zeile mit der Zeilenkoordinate ai aber jeweils genau rai Kreuzchen
(eines in jeder Spalte mit einer Spaltenkoordinate bj , welche zur Faser von I über ai
gehört), analog sind in der Spalte mit der Spaltenkoordinate bj genau sbj Kreuzchen
eingetragen. P
Zeilenweises Auszählen der Markierungen realisiert demnach P jI j D a2A ra ,
spaltenweises Auszählen der Markierungen
P realisiert jI j D b2B sb .
P
Im Allgemeinen sind nun a2A ra und b2B sb Funktionen von jAj und jBj,
sodass man von der Feststellung
X X
. / ra D jI j D sb
a2A b2B

in zweierlei Hinsicht profitieren kann:

 Bei Interpretation von . / als Bestimmungsgleichung für jAj oder jBj kann man
möglicherweise eine dieser Mächtigkeiten bestimmen, wenn man die andere
kennt (Beispiel 1.43).
1.2 Variation der Problemstellung 129

 Vorwiegend gewinnt man aber aus . / strukturelle Erkenntnisse über funktiona-


le Zusammenhänge der beteiligten Größen (Beispiel 1.44). Insbesondere erhält
man kombinatorische Summenformeln, wenn jAj und jBj bekannt sind.
Dabei ist zu betonen,
P dass derP Erkenntnisgewinn nicht auf Folgerungen aus dem di-
rekten Vergleich a2A ra D b2B sb beschränkt ist; bisweilen kann man nämlich
die Anzahl jI j aller P
Inzidenzen auch anders
P zählen und dann Informationen aus den
Gleichungen jI j D a2A ra bzw. jI j D b2B sb gewinnen (Beispiel 1.45).

Beispiel 1.43 (Domino-Steine)


Die rechteckigen Domino-Spielsteine sind aus jeweils zwei (nicht notwendig ver-
schiedenen) der abgebildeten quadratischen Mustersteine an den linken und rechten
Seitenkanten zusammengesetzt.

Dabei wird zwischen zwei Dominosteinen nicht unterschieden, wenn sie durch
eine eigentliche Bewegung ineinander überführt werden können.
Wie viele verschiedene Domino-Steine gibt es?
Zur Klärung der Vorschriften noch einmal ein Beispiel:
Abb. 1.60 Existieren-
de, nicht existierende und
miteinander identifizierte
Dominosteine

Der Dominostein A existiert – zwei quadratische Konstruktionselemente wur-


den korrekt an den Seitenkanten zusammengesetzt. Der Dominostein B existiert
nicht; hier wurden zwei quadratische Konstruktionselemente an den falschen Kan-
ten zusammengesetzt. Die Dominosteine C und D existieren, werden aber nicht
voneinander unterschieden, weil sie sich durch eine Verschiebung, gefolgt von ei-
ner Drehung ineinander überführen lassen.
Zur bequemen Ermittlung der Anzahl verschiedener Dominosteine könnte man
nun die passende Anzahlformel aus den kombinatorischen Grundaufgaben verwen-
den. Gefragt wird nach der Anzahl der 2-Kollektionen aus einer 7-Menge, denn
offenbar besteht jeder Dominostein aus zwei nach Vorschrift aneinandergesetzten
Quadraten der Augenzahlen 0 bis 6, wobei es legitim ist, zwei Quadrate gleicher
Augenzahl miteinander zu verkleben (! Wiederholungen erlaubt!) und wobei es
auf die Reihenfolge beim Verkleben nicht ankommt, weil entsprechende Steine wie
C und D in Abb. 1.60 miteinander identifiziert werden. Demnach gibt es
!
7C21 87
D D 28
2 2
verschiedene Dominosteine.
130 1 Heurismen der Variation

Mithilfe des Prinzips des doppelten Zählens könnte man die Aufgabe folgender-
maßen lösen:
Zwischen der Menge A aller Dominosteine und der Menge B D f0; 1; 2; : : : ; 6g
aller Augenzahlen erkläre man die Relation I durch

.a; b/ 2 I , Dominostein a 2 A trägt Augenzahl b 2 B :

Für genau jBj D 7 aller Dominosteine a 2 A gilt ra D 1; dabei handelt es sich


um diejenigen Steine, die auf beiden Seiten dieselben Augenzahlen tragen. Für alle
anderen Dominosteine a 2 A gilt aber ra D 2, sodass sich insgesamt
X
jI j D ra D 2jAj  jBj
a2A

Inzidenzen zählen lassen.


Umgekehrt erscheint jede feste Augenzahl b 2 B auf genau jBj D 7 Do-
minosteinen, denn es gibt 7 Möglichkeiten, die Augenzahl b mit einer weiteren
Augenzahl aus B auf einem Stein zu kombinieren. Folglich ist sb D jBj für alle
b 2 B und damit X
jI j D sb D jBj2 :
b2B

Aus 2jAj  jBj D jBj ergibt sich die Bestimmungsgleichung


2

1
jAj D jBj.jBj C 1/
2
für jAj, woraus sich jAj bestimmen lässt, wenn jBj bekannt ist. Für jBj D 7 erhält
man jAj D 28. 

Beispiel 1.44 (Mittlere Teileranzahl der ersten n natürlichen Zahlen)


Es bezeichne .n/ die Anzahl der positiven Teiler der natürlichen Zahl n. Diese
Anzahl schwankt sehr stark: Es gilt zum Beispiel .p/ D 2 für alle Primzahlen p,
und es ist .p k / D .k C 1/ für alle Primzahlen p und alle k 2 N 90 . Die mittlere
Teileranzahl der ersten n natürlichen Zahlen, also das arithmetische Mittel

1X
n
.1/ C .2/ C    C .n/
.n/ WD D .k/
n n
kD1

ist hingegen nur geringen Schwankungen unterworfen, denn es gilt für alle n 2 N:

.n/ D ln.n/ C ın mit jın j < 2 :

Man begründe die Gültigkeit dieser Abschätzung für .n/.

90
Die Teilermenge einer Primzahlpotenz p k ist durch Tpk D f1; p; p 2 ; : : : ; p k g gegeben.
1.2 Variation der Problemstellung 131

Für n 2 N sei An D Bn D f1; : : : ; ng und In die durch

.a; b/ 2 In , a j b

definierte Relation zwischen An und Bn . Die Inzidenztafel von In ist von der in Abb.
1.61 beschriebenen Form, wobei in der letzten Spalte insgesamt .n/ Kreuzchen
einzutragen wären, aber nur für zwei davon ohne konkrete Festlegung der Zahl n
feststeht, wo sie notiert werden müssen.

Abb. 1.61 Inzidenztafel I 1 2 3 4 5 6 7 8 ... n


der Teilbarkeitsrelation In
zwischen An und Bn
1 × × × × × × × × ... ×

2 × × × × ...

3 × × ...

4 × × ...

5 × ...

6 × ...

7 × ...

8 × ...
.. .. ..
. . .

n ×

Für a 2 An besteht die Faser von In über a aus allen Vielfachen von a zwischen
a und n, d. h. es ist Ra D Va \ Bn und ra D Œ na , wenn durch Œx die größte ganze
Zahl t mit t  x bezeichnet wird.
Zählt man die Inzidenzen zeilenweise, erhält man also
n h i
X n
jI j D :
k
kD1

Werden die Inzidenzen aber spaltenweise gezählt, so ergibt sich

X
n
jI j D .k/ ;
kD1

denn für b 2 Bn besteht die Faser von In1 über b aus allen positiven Teilern von b,
sodass Sb mit der Teilermenge Tb übereinstimmt und deshalb sb D .b/ gilt.
Hier führt das Prinzip des doppelten Zählens auf eine Näherungsformel für die
mittlere Teileranzahl .n/ der ersten n natürlichen Zahlen:
132 1 Heurismen der Variation

Wegen
n h i n ˇ h i
X X X n ˇˇ
n
n n ˇ n
D C n mit jn j  ˇ  ˇn1Dn
k k k k
kD1 kD1 kD1

erhält man

1X 1 X hni
n n
1
.n/ D .k/ D  jI j D
n n n k
kD1 kD1
ˇ ˇ
Xn
1 n ˇ n ˇ
D C mit ˇˇ ˇˇ  1 :
k n n
kD1

Die mittlere Teileranzahl .n/ der ersten n natürlichen


Pn 1Zahlen ist also näherungs-
weise durch die n-te harmonische Zahl hn WD kD1 k gegeben, wobei sich der
absolute Fehler dieser Näherung
P durch j .n/  hn j  1 abschätzen lässt.
Pn1 1
Interpretiert man nun nkD2 k1 als Riemannsche Untersumme und kD1 k als
Riemannsche Obersumme der auf dem Intervall Œ1; n stetigen Funktion

fW Œ1; n ! R
x 7! x1

bezüglich der Unterteilung Œ1; n D Œ1; 2 [ Œ2; 3 [    [ Œn  1; n; so folgt offenbar

X
n Z n
X
n1
1 1 1 1
hn  1 D < dx D ln.n/ < D hn  :
k x k n
kD2 1 kD1

Mithilfe der Dreiecksungleichung erhält man

j .n/  ln.n/j  j .n/  hn j C jhn  ln.n/j < 1 C 1 D 2

oder auch
.n/ D ln.n/ C ın mit jın j < 2 : 

Beispiel 1.45 (Summenformeln für m-te Potenzen)


Wie in Beispiel 1.42 werde für m; r 2 N die Anzahl der surjektiven Abbildungen
einer m-Menge auf eine r-Menge mit zm .r/ bezeichnet. Dann gilt für alle n 2 N:
!
X
n X
m
nC1
km D zm .r/ 
rD1
r C1
kD0
1.2 Variation der Problemstellung 133

Seien m; n 2 N gegeben. Für B WD f1; 2; : : : ; n C 1g und A WD B m sei I die durch

.a; b/ 2 I , kak1 < b

definierte Relation, wobei für a D .a1 ; : : : ; am / 2 A mit kak1 die Maximum-Norm


von a bezeichnet werde91 .
Für festes b D k C 1 2 B .0  k  n/ besteht die Faser Sb von I 1 über b
aus k m Elementen, denn für a D .a1 ; : : : ; am / 2 A ist .a; k C 1/ 2 I äquivalent zu
ai < k C 1 für alle i D 1; : : : ; m, was bedeutet, dass .a1 ; : : : ; am / ein m-Tupel aus
der Menge f1; : : : ; kg ist. Daraus folgt durch spaltenweises Auszählen

X X
n X
n
jI j D sb D skC1 D km :
b2B kD0 kD0

Zur Gewinnung einer Summenformel für die m-ten Potenzen muss man nun wie
üblich jI j auf eine andere Art zählen und die Invarianz der Mächtigkeit von I unter
dem Wechsel der Zähltechnik ausnutzen. Diesmal hilft es im Gegensatz zu den
bisher behandelten Beispielen aber nicht, zum Vergleich die Zahl der Inzidenzen
durch zeilenweises Auszählen der Inzidenztafel zu bestimmen!
Ist nämlich a D .a1 ; : : : ; am / 2 A, so gilt für die Faser Ra von I über a:

Ra D ; .) ra D 0/ im Fall kak1 D n C 1 ;
Ra D fn C 1g .) ra D 1/ im Fall kak1 D n ;
Ra D fn C 1; ng .) ra D 2/ im Fall kak1 D n  1 ;
Ra D fn C 1; n; n  1g .) ra D 3/ im Fall kak1 D n  2 ;
:: :: :: ::
: : : :
Ra D fn C 1; n; n  1; : : : ; 2g .) ra D n/ im Fall kak1 D 1 :

Nun ist für a 2 A die Bedingung kak1 D k .k D 1; : : : ; n/ aber gleichbedeutend


mit:

 k wird von mindestens einer der Komponenten a1 ; : : : ; am von a als Wert ange-
nommen.
 Keine der Komponenten von a ist mit einem der Werte k C 1; : : : ; n C 1 belegt.

Die Anzahl aller a 2 A mit kak1 D k für 1  k  n ist demnach k m  .k  1/m ,


denn es gibt k m m-Tupel aus f1; : : : ; kg, von denen aber .k  1/m viele den Wert k
nicht enthalten.

91
Es ist kak1 WD max.ja1 j; : : : ; jam j/ D max.a1 ; : : : ; am / für alle a D .a1 ; : : : ; am / 2 A.
134 1 Heurismen der Variation

Mit diesen Informationen lässt sich die Inzidenztafel von I zeilenweise auszäh-
len, und man erhält:
X
jI j D ra
a2A
X
n
D .k m  .k  1/m /  .n C 1  k/
kD1
X
n X
n
D k m .n C 1  k/  .k  1/m .n C 1  k/
kD1 kD1

X
n1 X
n1
D nm C k m .n C 1  k/  k m .n  k/
kD1 kD0

X
n1
D nm C k m .n C 1  k  .n  k//
kD1

X
n1 X
n
D nm C km D km :
kD1 kD0

Damit ist leider nichts gewonnen; dasselbe Resultat ergab sich beim spaltenweisen
Auszählen der Inzidenzen. Deshalb müssen die Inzidenzen auf eine andere Weise
gezählt werden, denn der Vergleich zwischen dem zeilenweisen und spaltenweisen
Auszählen der Inzidenztafel führt in diesem Beispiel nicht zum Ziel.
Zu diesem Zweck betrachten wir für 1  r  m die Mengen
˚ ˇ
Mr WD a D .a1 ; : : : ; am / 2 A ˇ jfa1 g [ fa2 g [    [ fam gj D r :
Jedes Mr enthält genau diejenigen m-Tupel aus A, deren Komponenten sich aus
exakt r verschiedenen Elementen der Menge B zusammensetzen. Folglich ist A D
M1 [    [ Mm eine Partition von A, so dass für jedes feste b 2 B

[
Sb D fa 2 A j .a; b/ 2 I g D fa 2 Mr j .a; b/ 2 I g
1rm

sowie
X
m
sb D jfa 2 Mr j .a; b/ 2 I gj
rD1

gilt. Für die Anzahl jI j der Inzidenzen ergibt sich daraus


!
X X
n X
n X
m
jI j D sb D skC1 D jfa 2 Mr j .a; k C 1/ 2 I gj
b2B kD0 kD0 rD1
!
Xm Xn
D jfa 2 Mr j .a; k C 1/ 2 I gj ;
rD1 kD0

und diese Art des Zählens führt auf die gewünschte Formel.
1.2 Variation der Problemstellung 135

Um dies einzusehen, wähle man ein festes r 2 f1; : : : ; mg und betrachte nach-
einander absteigend die Anzahlen der Inzidenzen von b D n C 1; b D n; : : : ; b D 1
mit Elementen von Mr :
 
 b D n C 1 inzidiert mit zm .r/  nr Elementen von Mr , denn:

Zunächst gibt es nr viele r-Teilmengen von B, in denen das Element nC1 nicht
vorkommt und aus denen sich deshalb die Werte der m-Tupel a 2 Mr , die mit
b D n C 1 inzidieren, zusammensetzen dürfen. Für jede r-Menge fx1 ; : : : ; xr g
existieren aber zm .r/ viele m-Tupel aus fx1 ; : : : ; xr g mit der Eigenschaft, dass
jedes xi in mindestens einer Komponente des m-Tupels als Wert auftritt, denn
jedes solche m-Tupel definiert umkehrbar eindeutig eine surjektive Abbildung
von f1; : : : ; mg auf fx1 ; : : : ; xr g.
 b D n inzidiert mit zm .r/  n1 Elementen von Mr , denn:
  r
Es gibt n1 r viele r-Teilmengen von B, in denen die Elemente n C 1 und n
nicht vorkommen und aus denen sich deshalb die Werte der m-Tupel a 2 Mr ,
die mit b D n inzidieren, zusammensetzen dürfen. Für jede dieser r-Teilmengen
fx1 ; : : : ; xr g existieren zm .r/ viele m-Tupel aus fx1 ; : : : ; xr g mit den verlangten
Eigenschaften (s. o.).
 ::: 
 b D r C 1 inzidiert mit zm .r/  rr Elementen von Mr , denn:
Die einzige r-Teilmenge von B, in denen die Elemente n C 1; n; n  1; : : : ; r C 1
nicht vorkommen und aus denen sich deshalb die Werte der m-Tupel a 2 Mr ,
die mit b D r C 1 inzidieren, zusammensetzen dürfen, ist f1; : : : ; rg. Es gibt
zm .r/ viele m-Tupel aus f1; : : : ; rg mit den verlangten Eigenschaften.
 Ist b  r, so gibt es keine Inzidenzen von b mit a 2 Mr , denn für alle a 2 Mr
gilt kak1  r  b.

Für festes r 2 f1; : : : ; mg gilt deshalb:


! !
X
n X
nr
r Cj nC1
jfa 2 Mr j .a; k C 1/ 2 I gj D zm .r/  D zm .r/  ;
j D0
r r C1
kD0

wobei die letzte Identität eine leicht zu beweisende Eigenschaft der Binomialkoef-
fizienten ist92 . Insgesamt erhalten wir
! !
Xm Xn Xm
nC1
jI j D jfa 2 Mr j .a; k C 1/ 2 I gj D zm .r/ 
rD1 rD1
r C1
kD0

und damit die gesuchte Summenformel für die m-ten Potenzen.

92
Für n  r ist nichts zu zeigen, für n > r kann man einen Beweis durch
 vollständige
  Induktion
über n führen, der im Induktionsschritt die bekannte Beziehung nC1rC1
C nC1
r
D nC2rC1
benutzt,
die den zeilenweisen Aufbau des Pascalschen Dreiecks ermöglicht. Im Anschluss an Beispiel 1.45
zählen wir jI j auf eine weitere Weise und geben damit einen anderen Beweis mithilfe des Prinzips
des doppelten Zählens.
136 1 Heurismen der Variation

Speziell für die Exponenten m D 1; m D 2; m D 3 ergeben sich mit zm .1/ D 1,


z2 .2/ D 2, z3 .2/ D z3 .3/ D 6 die bekannten Summenformeln
!
X n
nC1 n.n C 1/
kD D
2 2
kD0
! !
Xn
nC1 nC1 n.n C 1/.2n C 1/
k D
2
C2 D
2 3 6
kD0
! ! !  
Xn
nC1 nC1 nC1 n.n C 1/ 2
k D
3
C6 C6 D 
2 3 4 2
kD0

Auch die letztlich zielführende Abzählung der Inzidenzen in Beipiel 1.45 orien-
tierte sich an der Faserung der Inzidenztafel; wenn man sich davon löst, lassen sich
die Inzidenzen wesentlich unkomplizierter zählen.
Man erkläre dazu in der Menge I  A  B eine Äquivalenzrelation durch

.a; b/ .a0 ; b 0 / , b D b 0 und fa1 g [ fa2 g [   [ fam g D fa10 g [ fa20 g [   [ fam


0
g;

wobei ai , ai0 für 1  i  m durch a D .a1 ; : : : ; am / und a0 D .a10 ; : : : ; am


0
/ definiert
sind.
Jede Äquivalenzklasse Œ.a; b/ mit a 2 Mr .1  r  m/ bestimmt umkehrbar
eindeutig eine .r C 1/-Teilmenge von B D f1; : : : ; n C 1g, nämlich die Menge

.fa1 g [ fa2 g [    [ fam g/ [fbg:


„ ƒ‚ …
r Elemente

(Man beachte, dass wegen kak1 < b für .a; b/ 2 I offenbar b nicht Element der
Menge fa1g [ fa  2 g [    [ fam g ist.)  
Da es nC1 rC1
viele .r C 1/-Teilmengen von B gibt, existieren auch nC1 rC1
viele Äquivalenzklassen Œ.a; b/ mit a 2 Mr (Zählen durch Bijektion). Je-
de einzelne dieser Klassen enthält zm .r/ Elemente, denn jedes m-Tupel a0 D
.a10 ; : : : ; am
0
/ 2 Mr bestimmt umkehrbar eindeutig eine surjektive Abbildung der
m-Menge f1; : : : ; mg auf die r-Menge fa10 g [ fa20 g [    [ fam 0
g. Laut Produktregel
gibt es demnach !
X n Xm
nC1
k D jI j D
m
zm .r/ 
rD1
r C1
kD0

Inzidenzen.

(D) Schubfachprinzip
Auch beim nun vorgestellten Prinzip der enumerativen Kombinatorik steht nicht
das Zählen selbst, sondern der Erkenntnisgewinn durch Zählen im Vordergrund.
1.2 Variation der Problemstellung 137

Schubfachprinzip Gegeben seien eine n-Menge X, eine k-Menge Y sowie eine


Abbildung f W X ! Y von X in Y . Ist k < n, so existiert mindestens ein y 2 Y
mit jf 1 .y/j > 1.
Das Schubfachprinzip ist mit dem Namen G USTAV P ETER L EJEUNE -D IRI -
CHLET (1805–1859) verbunden, der als erster 1834 explizit auf die Bedeutung
dieses Prinzips hingewiesen und es auch bei seinen Beweisen zur Approximation
irrationaler Zahlen durch reduzierte Brüche verwendet hat. Man spricht daher oft
vom dirichletschen Schubfachprinzip; in der englischsprachigen Literatur ist es
seit 1956 unter dem Namen pigeon-hole principle („Taubenschlagprinzip“) be-
kannt, was auf den Einfluss von PAUL E RDÖS (1913–1996) und R ICHARD R ADO
(1906–1989) zurückzuführen ist; bisweilen ist auch vom box argument die Rede.
Formuliert man das Schubfachprinzip nicht in der formalen Sprache der Mathe-
matik, sondern gibt seine Bedeutung umgangssprachlich wieder, so wird deutlich,
welche Selbstverständlichkeit es beinhaltet:

Verteilt man n Gegenstände auf k Schubfächer und gilt dabei k < n, dann gibt
es am Ende wenigstens ein Fach, in dem sich mindestens zwei Gegenstände be-
finden.

In der formalen Beschreibung hingegen wird die Strukturierung des Zählprozesses


erkennbar, der S
dem Schubfachprinzip zugrunde liegt:P
Es ist X D y2Y f 1 .y/, also ist die Summe y2Y jf 1 .y/j der Elementezah-
len der einzelnen Urbilder f 1 .y/ nicht kleiner als jXj D n. Da diese Summe aber
nur k < n Summanden hat, muss mindestens ein Summand jf 1 .y/j größer als 1
sein.
DieSvom Schubfachprinzip reflektierte Strukturierung von X ist die Darstellung
X D y2Y f 1 .y/ von X als Mengenvereinigung aller Urbilder f 1 .y/, y 2 Y .
So einfach das Schubfachprinzip auch sein mag, als heuristische Strategie bei der
Bearbeitung von Problemstellungen der enumerativen Kombinatorik kommt ihm
eine große Bedeutung zu, wenn es darum geht, Existenzbeweise zu führen; E NGEL
und S EWERIN stellen sogar fest, es liege implizit sogar jedem Existenzproblem der
Kombinatorik zugrunde.
Existenzbeweise mit dem Schubfachprinzip sind niemals konstruktiv – welches
der Schubfächer am Ende mehr als einen Gegenstand enthält, bleibt ungeklärt. Au-
ßerdem kann es bisweilen schwierig sein, die „Gegenstände“ und die „Schubfächer“
in den Problemdaten zu identifizieren.

Beispiel 1.46 (Menschen im Hotel)


In den Räumlichkeiten eines großen Hotels geht es zu wie im Taubenschlag
(pigeon-hole) – ein ständiges Kommen und Gehen – aber dennoch befinden sich
zu jedem Zeitpunkt im Hotel mindestens zwei Personen mit derselben Zahl von
138 1 Heurismen der Variation

Bekannten unter den Personen, die sich momentan im Hotel aufhalten93 . Wie ist
das möglich?
Es sei X die Menge aller Personen, die sich zu einem beliebig, aber fest ge-
wählten Zeitpunkt im Hotel aufhalten, und es sei jXj DW n 2 N. Ferner bezeichne
f W X 7! f0; : : : ; n  1g diejenige Abbildung, welche jeder Person x 2 X die
Anzahl ihrer Bekannten unter den Menschen von X zuordnet; dann ist Y WD f .X/
eine k-Teilmenge von f0; : : : ; n  1g mit k < n, wie man folgendermaßen einsehen
kann:
Ist 0 2 f .X/, so gibt es eine Person x 2 X, die sonst niemanden kennt. Dann
folgt aber n  1 … f .X/, denn jemand, der n  1 Bekannte unter den n Personen
aus X hätte, müsste auch mit x bekannt sein. Ist umgekehrt n  1 2 f .X/, so gibt
es eine Person x 0 2 X, die mit allen anderen bekannt ist. Da jeder x 0 kennt, hat
niemand 0 Bekannte, also ist 0 … f .X/.
Damit ist f W X ! Y eine Abbildung von einer n-Menge in eine k-Menge
mit k < n, und nach dem Schubfachprinzip existiert mindestens ein y0 2 Y mit
jf 1 .y0 /j  2. Sind dann x1 ; x2 2 f 1 .y0 /, x1 ¤ x2 , so ist f .x1 / D f .x2 / D y0 ,
also haben x1 und x2 beide y0 viele Bekannte unter den Personen aus X. 

Beispiel 1.47 (Fünf Punkte müssen’s sein)


In der xy-Ebene seien fünf Punkte Pi D .xi ; yi / .1  i  5/ mit ganzzahligen Ko-
ordinaten gegeben. Dann gibt es unter den Mittelpunkten der Verbindungsstrecken
Pi Pj mindestens einen, der ebenfalls ganzzahlige Koordinaten besitzt.

Die Koordinaten des Mittelpunkts Mij der Verbindungsstrecke Pi Pj sind gege-


ben durch  
xi C xj yi C yj
Mij D I ;
2 2
daher sind sie genau dann ganzzahlig, wenn xi xj mod 2 und yi yj mod 2
gilt. Für die Paritäten gerade (g) und ungerade (u) des Koordinatenpaares .x; y/
eines Punktes P gibt es genau vier Kombinationsmöglichkeiten, nämlich
(g , g)I (g , u)I (u , g)I (u , u) :
Da aber die Anzahl der Punkte größer ist als vier, muss es mindestens zwei Punk-
te aus fP1 ; : : : ; P5 g geben, deren Koordinaten paarweise die gleiche Parität haben

93
Dabei sei vorausgesetzt, dass sich stets mindestens zwei Personen im Hotel aufhalten; ebenso,
dass die Relation „ist Bekannter von“ symmetrisch ist: Zwar kennt man den Promi an der Bar, aber
zu seinen Bekannten darf man ihn dann und nur dann zählen, wenn man auch ihm bekannt ist!
1.2 Variation der Problemstellung 139

(Schubfachprinzip). Der Mittelpunkt der Verbindungsstrecke dieser beiden Punkte


hat dann ganzzahlige Koordinaten. 

Beispiel 1.48 (Teiler gibt es immer wieder)


Man begründe, dass in jeder .n C 1/-Teilmenge von M WD f1; 2; : : : ; 2ng stets zwei
Zahlen a und b zu finden sind, für die a j b oder b j a gilt.
Sei X D fx1 ; : : : ; xnC1 g eine .n C 1/-Teilmenge von M . Jedes Element von X
lässt sich in seinen geraden und seinen ungeraden Anteil aufspalten, hat also eine
Darstellung der Form

xi D 2ki  ui mit ki 2 N0 ; ui ungerade :

Für jedes i D 1; : : : ; n C 1 ist der ungerade Anteil ui von xi wegen xi 2 M nicht


größer als 2n  1, so dass stets ui 2 f2k  1 j 1  k  ng gilt. Da X nun n C 1
Elemente hat, aber nur n verschiedene ungerade Anteile für die Elemente von X
infrage kommen, müssen mindestens zwei Elemente von X denselben ungeraden
Anteil u haben (Schubfachprinzip) – dies seien xi DW a und xj DW b. Dann gilt
a D 2ki  u und b D 2kj  u, also a j b im Fall ki  kj und b j a im Fall ki > kj .


Beispiel 1.49 (Neues von der Märchenzahl)


Gegeben sei eine beliebige Menge X  Z ganzer Zahlen mit jXj D 1001 Elemen-
ten94 . Dann gibt es Zahlen x1 ; x2 2 X derart, dass x12 x22 den Primteiler p D 1999
besitzt – oder ist das ein Märchen?
Für z 2 Z bezeichne Œz die Restklasse von z zum Modul 1999 und R die
Menge aller Restklassen mod 1999. Ist dann M0 WDSfŒ0g und für k D 1; : : : ; 999
jeweils Mk WD fŒk; Œ1999  kg, so definiert R D 0k999 Mk eine Partition der
Menge aller Restklassen, und man kann jedem x 2 X eindeutig diejenige Menge
Mk 2 Y WD fM0 ; M1 ; : : : ; M999 g zuordnen, welche Œx enthält.
Sei f W X ! Y die Funktion, die diese Zuordnung leistet; dann existiert we-
gen jY j D 1000 < 1001 D jXj mindestens ein Mk 2 Y mit jf 1 .Mk /j  2
(Schubfachprinzip).
Sind dann x1 ; x2 2 X mit Œx1 ; Œx2  2 Mk , so gilt Œx1 C x2  D Œ1999 D Œ0 für
Œx1  ¤ Œx2 , für Œx1  D Œx2  ist offenbar Œx1  x2  D Œ0.
In jedem Fall ist demnach Œ0 D Œx1 C x2   Œx1  x2  D Œx12  x22 , was bedeutet,
dass 0 der Divisionsrest bei Divison von x12  x22 durch 1999 ist. Also ist p D 1999
ein Teiler von x12  x22 . 

Es gibt Problemstellungen, in denen eine schärfere Fassung des Schubfachprin-


zips benötigt wird. Betrachten wir noch einmal die Strukturierung des Zählprozes-
ses, der dem Schubfachprinzip zugrunde liegt.

94
In Anspielung auf die orientalischen Märchen, mit denen S CHEHERAZADE ihren König 1001
Nächte hindurch unterhielt, ist die Zahl 1001 bei den Wuppertaler Studierenden des Grund-
schullehramts als „Märchenzahl“ eingeführt, deren Primfaktorzerlegung 1001 D 7  11  13 man
möglichst auswendig wissen sollte.
140 1 Heurismen der Variation

Sind X; Y mit jXj D n;


S jY j D k sowie f W X ! Y gegeben, so gewinnt man
aus der Darstellung X D y2Y f 1 .y/ die Information, dass für n > k mindestens
eine der Urbildmengen f 1 .y/ .y 2 Y ) mehr als ein Element haben muss.
Diese Abschätzung lässt sich aber präzisieren: Hätte keines der Urbilder mehr
als n1
k Elemente, so wäre

n1 n1
jXj  jY j  Dk D n  1 < n D jXj ;
k k

was offenbar nicht möglich ist. Da die kleinste ganze Zahl größer als n1
k aber durch
Œ n1
k  C 1 gegeben ist, lässt sich folgende schärfere Fassung des Schubfachprinzips
formulieren:

Schubfachprinzip (verschärfte Version) Gegeben seien eine n-Menge X, eine


k-Menge Y sowie eine Abbildung f W X ! Y von X in Y . Ist k < n, so existiert
mindestens ein y 2 Y mit jf 1 .y/j  Œ n1
k  C 1.
Umgangssprachlich für eine Situation der Lebenswirklichkeit formuliert:

(S1) Verteilt man n Gegenstände auf k Schubfächer und gilt dabei k < n, dann
gibt es am Ende wenigstens ein Fach, in dem sich mehr als n1k
Gegenstände
befinden.

Oder aus der dualen Perspektive:

(S2) Will man bei der Verteilung von n Gegenständen auf k Schubfächer sicher
sein, dass sich am Ende in wenigstens einem Fach mindestens m Gegenstände
befinden, dann braucht man n  .m  1/k C 1 Gegenstände.

Auch für die Verwendung der präziseren Version des Schubfachprinzips möchte ich
zwei Beispiele angeben.

Beispiel 1.50 (Punkte im Einheitsquadrat)


Im Inneren eines Quadrats Q der Seitenlänge 1 seien mindestens 51 Punkte willkür-
lich verteilt. Man begründe, dass es einen Kreis  mit Radius 17 gibt, der in seinem
Inneren mindestens drei dieser Punkte enthält.
Durch Einführung eines geeigneten kartesischen Koordinatensystems lässt sich
das Innere des Quadrats Q in der Form Qı D 0; 1Œ2 beschreiben. Man betrachte
nun die Partition

1 1 2 2 3 3 4 4
0; 1Œ D 0; [ ; [ ; [ ; [ ;1
5 5 5 5 5 5 5 5
DW I1 [ I2 [ I3 [ I4 [ I5
1.2 Variation der Problemstellung 141

des Intervalls 0; 1Œ und die davon induzierte Partition

[
5
Qı D I
 I DW Q


;D1

von Qı in insgesamt 25 Teilquadrate. Da 51 oder mehr Punkte auf 25 Teilquadra-


25 D 2,
te Q
 verteilt werden müssen, enthält mindestens eines davon mehr als 511
also wenigstens drei Punkte. Ist Q0 das besagte Teilquadrat und M sein Symmetrie-
zentrum, so enthält der Kreis  mit Mittelpunkt M und Radius 17 in seinem Inneren
das Quadrat Q0 , denn für alle Punkte P 2 Q0 gilt:
s
 2  2 r r r
1 1 2 1 1 1
jPM j  C D D < D :
10 10 100 50 49 7

Damit enthält  aber auch mindestens drei der 51 Punkte. 

Beispiel 1.51 (Monotonie im „Happy Ending“)


Jede endliche Zahlenfolge a1 ; a2 ; : : : ; ak 2 C1 der Länge k 2 C1 enthält eine monotone
Teilfolge der Länge k C 1.
Dieser Sachverhalt wird in einer gemeinsamen Publikation der Studienfreun-
de PAUL E RDÖS (1913–1996) und G YÖRGY S ZEKERES (1911–2005) zum Happy
Ending Problem begründet. E RDÖS gehörte zu den Pionieren der Verwendung sto-
chastischer Argumentationen in der Zahlentheorie und der Graphentheorie; er war
ein mathematischer Weltenbummler, der mehr als 1500 fachwissenschaftliche Arti-
kel mit Kollegen aus aller Welt veröffentlichte – mehr gemeinschaftliche Arbeiten
hat kein anderer Mathematiker je publiziert.95
Im Happy Ending Problem geht es um die Frage, wie vieler Punkte es in der
euklidischen Ebene zu vorgegebenem m 2 N, m  4 mindestens bedarf, bevor
gewährleistet ist, dass sich stets m kollineare Punkte oder die Ecken eines konvexen
m-Ecks darunter befinden – man erkennt eine Problemstellung, deren Lösung eine
weitere Verallgemeinerung des Schubfachprinzips in der verschärften Version (S2)
erfordert.
Die Bezeichnung „Happy Ending Problem“ ist eine Anspielung von E RDÖS auf
den Umstand, dass E SZTER K LEIN, die zu Beginn der 30er Jahre die Fragestellung
formuliert hatte, und G YÖRGY S ZEKEREZ kurze Zeit nach Veröffentlichung der
Lösung des Problems im Jahr 1937 heirateten. Die Eheleute Szekerez verbrachten

95
Die Koautorenschaft-Distanz zu E RDÖS wird augenzwinkernd mit der sog. „Erdös-Zahl“ ge-
messen: E RDÖS selbst hat die Erdös-Zahl 0, jeder seiner 504 Koautoren aus gemeinschaftlichen
Arbeiten hat die Erdös-Zahl 1. Hat jemand nicht mit E RDÖS zusammen publiziert, aber eine Ar-
beit mit einem seiner Koautoren geschrieben, bekommt er die Erdös-Zahl 2 usw. Mehr als 200 000
Mathematiker haben eine Erdös-Zahl kleiner oder gleich 5.
142 1 Heurismen der Variation

den Rest ihres langen Lebens gemeinsam, seit 1948 in Australien; beide starben
eines natürlichen Todes am 28.08.2005 im Abstand von 30 Minuten.
Die von E RDÖS und S ZEKEREZ bei ihrer Lösung des Problems verwendete
Verallgemeinerung des Schubfachprinzips ist der Satz von Ramsey96 , den man in-
klusive seiner Anwendung auf das Happy Ending Problem in der Literatur findet.97 ;
für den Nachweis der Existenz monotoner Teilfolgen der Länge k C 1 in beliebigen
Zahlenfolgen der Länge k 2 C 1 ist aber die verschärfte Version des Schubfachprin-
zips wie oben formuliert ausreichend.
Für 1  i  k 2 C 1 bezeichne `i die Länge (Elementezahl) der längsten beim
Folgenglied ai beginnenden monoton wachsenden Teilfolge von a1 ; : : : ; ak 2 C1 .
Existiert ein i 2 f1; : : : ; k 2 C 1g mit `i  k C 1, so haben wir eine monoton
wachsende und damit eine monotone Folge der erforderlichen Länge gefunden.
Ist jedoch `i  k für alle i D 1; : : : ; k 2 C 1, dann existiert laut Schubfachprinzip
(verschärfte Version) zur Abbildung

`W f1; : : : ; k 2 C 1g ! f1; : : : ; kg mit `.i/ WD `i

mindestens ein s 2 f1; : : : ; kg mit der Eigenschaft



2
ˇ 1 ˇ
ˇ` .s/ˇ  .k C 1/  1 C 1 D k C 1:
k

Für ein solches s 2 f1; : : : ; kg mit `1 .s/ D fj1 ; : : : ; jkC1 g und j1 < j2 <    <
jkC1 ist aj1 ; aj2 ; : : : ; ajkC1 eine Teilfolge der Länge k C 1 von a1 ; : : : ; ak 2 C1 ; die-
se Teilfolge ist aber monoton fallend, denn wäre für irgendein
2 f1; : : : ; kg die
Ungleichung aj
< aj
C1 erfüllt, dann ließe sich die bei aj
C1 beginnende monoton
wachsende Teilfolge der Länge s durch Voranstellen des Folgenglieds aj
< aj
C1
zu einer bei aj
beginnenden monoton wachsenden Teilfolge der Länge s C 1 er-
gänzen, was der Bedingung `.j
/ D s widerspräche.
Damit ist für den Fall, dass a1 ; : : : ; ak 2 C1 keine monoton wachsende Teilfolge
der Länge k C 1 besitzt, eine monoton fallende Teilfolge der Länge k C 1 ge-
funden; in jedem Fall existiert also eine monotone Teilfolge der Länge k C 1 von
a1 ; : : : ; ak 2 C1 . 

Am zuletzt behandelten Beispiel wird besonders deutlich, dass das Schubfach-


prinzip mit dem Extremalprinzip verwandt ist (vgl. Abschn. 1.2.4). N ICOLA H AAS
erkennt sogar die Möglichkeit, das Schubfachprinzip als eine spezielle Ausprä-
gung des Extremalprinzips aufzufassen, wenn man es als das Streben nach maxima-
ler Gleichverteilung interpretiert. Als zu dieser Deutung passende Formulierungen
schlägt sie vor:

Verteile die Objekte möglichst gleichmäßig – also mit maximaler Symmetrie – auf die vor-
handenen Schubfächer

96
Benannt nach dem Philosophen und Mathematiker F RANK P LUMPTON R AMSEY (1903–1930).
97
H ALDER / H EISE : Einführung in die Kombinatorik. Carl Hanser Verlag, München (1976).
1.2 Variation der Problemstellung 143

oder aber:

Versuche, maximal viele Elemente auf die Schubfächer aufzuteilen, ohne dass ein Schubfach
mehr als q viele Elemente enthält.

Zur Verdeutlichung dieser Position ein letztes Beispiel, in dem wir maximal viele
Gegenstände auf verschiedene Schubladen so verteilen, dass am Ende keine Schub-
lade mehr als einen Gegenstand enthält.

Beispiel 1.52 (Polynomiale Merkwürdigkeiten)


Sei f 2 ZŒx ein Polynom mit ganzzahligen Koeffizienten, sodass die Bildmenge
f .Z/ eine Primzahl p enthält. Dann hat f höchstens vier verschiedene ganzzahlige
Nullstellen.
Sei f 2 ZŒx mit f .x/ D a0 C a1 x C    C an x n , a0 ; : : : ; an 2 Z, und sei
N WD fx 2 Z j f .x/ D 0g die Menge aller ganzzahligen Nullstellen von f . Sei p
eine Primzahl in der Bildmenge f .Z/, und sei x0 2 Z mit f .x0 / D p.
Für je zwei verschiedene z; w 2 Z gilt .z  w/ j f .z/  f .w/, denn

f .z/  f .w/ D a1 .z  w/ C a2 .z 2  w 2 / C    C an .z n  w n /

und
j 1
X
.z  w / D .z  w/ 
j j
z j 1k w k für alle j 2 N :
kD0

Für jedes w 2 N ist deshalb x0  w ein Teiler von f .x0 /  f .w/ D p  0 D p. Da


p als Primzahl genau die ganzzahligen Teiler p; 1; 1 und p hat, kann N höchs-
tens vier verschiedene Elemente w1 ; : : : ; w4 enthalten und deshalb f höchstens vier
verschiedene ganzzahlige Nullstellen besitzen. 

1.2.6 Quintessenz für Problemlöser

In Abschn. 1.2 wird unter dem Primat der Variation eine Systematik von Heurismen
vorgestellt, die in erster Linie der Phase II („Ausdenken eines Plans“) in P ÓLYAs
Phasenschema des Problemlöseprozesses zuzuordnen sind, die aber auch Rückwir-
kungen auf Phase I („Verstehen der Aufgabe“) haben können, wenn die Prüfung
von Lösungsansätzen deutlich macht, dass das Verständnis der Problemsituation
noch nicht abgeschlossen ist.
Jede Lösungsplanung beginnt in natürlicher Weise mit der Untersuchung der
Frage, ob das vorliegende Problem irgendwelche Gemeinsamkeiten mit Aufgaben-
stellungen aufweist, deren Lösungen dem Problemlöser individuell vertraut sind.
Das gezielte Aufsuchen struktureller Gemeinsamkeiten mit bereits gelösten Proble-
men wird durch die heuristischen Tätigkeiten

 Äquivalentes Umformulieren
 Analogisieren
144 1 Heurismen der Variation

unterstützt, wobei in jedem einzelnen Fall zu prüfen ist, inwieweit der Transfer
eines Lösungsansatzes einer analogen Problemstellung auf das Originalproblem
möglich ist.
Ein Erfolg versprechendes Denkmuster bei der Analogiebildung ist die Ana-
logiebildung durch Restriktion, welche als Analogisierung unter Beachtung des
Extremalprinzips eingeordnet werden kann.
Jede Umformulierung eines Problems bewirkt (und wird wirksam durch) ei-
ne veränderte Problemwahrnehmung. Diese lässt sich aber auch dadurch errei-
chen, dass man sich die Gesetzmäßigkeiten seiner persönlichen Wahrnehmung eines
Problems bewusst macht – Hinweise auf die mentalen Verarbeitungsprozesse, die
beim Zusammenfügen einzelner Sinneseindrücke zu einer wahrgenommenen En-
tität durchlaufen werden, geben die wichtigsten Gesetze der Gestalttheorie – und
dann die Problemdaten zielgerichtet umstrukturiert. Dies charakterisiert die heuris-
tische Strategie der

 Variation der Wahrnehmung durch Reorganisation

Wenn es nicht bei der Umstrukturierung der Problemdaten bleibt, sondern Trans-
formationen der Daten vorgenommen werden, kommt ein Heurismus von immenser
Tragweite ins Spiel, nämlich das Invarianzprinzip. Dabei kann es sich um pro-
bleminhärente Transformationen handeln, die im Kontext der Aufgabenstellung
vorgegeben sind; in diesem Fall empfiehlt das Invarianzprinzip, Eigenschaften oder
Zusammenhänge zu suchen, die sich unter den gegebenen Transformationen nicht
ändern, die also Invarianten der gegebenen Transformationen sind. Es kann sich
aber auch um Transformationen handeln, die vom Problemlöser als tool eingesetzt
werden, weil sie im Problemkontext vorgegebene Relationen und Eigenschaften in-
variant lassen; die Suche nach solchen Transformationen ist ebenfalls heuristisches
Handeln im Sinne des Invarianzprinzips. Beide Ausprägungen des Invarianzprin-
zips:

 (Inv 1) Suche nach Invarianten vorgegebener Transformationen


 (Inv 2) Suche nach Transformationen, die vorgegebene Invarianten haben

spielen eine zentrale Rolle beim mathematischen Problemlösen; manche Themen-


kreise der Mathematik wie beispielsweise die Abbildungsgeometrie werden gerade-
zu davon beherrscht.
Ein naher Verwandter des Invarianzprinzips ist das Symmetrieprinzip, insofern
als Symmetrien einer Struktur durch deren Invarianz unter gewissen Transformati-
onsgruppen definiert werden können.
Heuristisches Handeln im Sinne des Symmetrieprinzips besteht im

 Herausarbeiten der Symmetrien einer Problemstellung mit dem Ziel, Lösungs-


ansätze zu finden, die diese Symmetrien reflektieren

Oft ist dabei die vereinfachende operationalisierte Fassung des Symmetriebegriffs


als Vertauschbarkeit von Teilen ohne Veränderung des Ganzen hinreichend präzise,
1.2 Variation der Problemstellung 145

um aus dem Studium der vertauschbaren Teile Nutzen für die Lösung des Problems
ziehen zu können; speziell bei geometrischen Problemstellungen bietet es sich aber
an, die vertrauten Deckabbildungsgruppen zur Charakterisierung der Symmetrien
zu verwenden.
Symmetrien in geometrischen Problemkontexten sind meist offenkundig oder
lassen sich durch marginale Modifikationen (Einzeichnen von Hilfsfiguren etc.)
leicht aufdecken. Versteckten Symmetrien in anderen mathematischen Gegenstands-
bereichen kann man eventuell durch eine Repräsentation der jeweiligen Problem-
stellung im Begriffssystem der Geometrie (! Variation der Darstellung) auf die
Spur kommen.
In Form des von P ÓLYA formulierten Prinzips des nichtzureichenden Grundes
tritt das Symmetrieprinzip im Zusammenhang mit mathematischen Strategiespielen
auf. Bisweilen ermöglicht es dort die explizite Konstruktion von Gewinnstrategi-
en, zumindest aber können unter gewissen Bedingungen an die Spielregeln nicht-
konstruktive Existenzbeweise für Gewinnstrategien geführt werden.
Zwei zueinander duale Heurismen, deren Zielrichtung es ist, aus der Variati-
on des Allgemeinheitsgrades einer Problemstellung Lösungsansätze zu entwickeln,
sind

 Generalisierung und Spezialisierung einer Problemstellung

Bei ihrer Verwendung treten zwei Phänomene auf, die leicht falsch eingeschätzt
werden:
(1) Die Verallgemeinerung einer Aufgabenstellung kann den Prozess der Lösungs-
findung vereinfachen, indem sie den Blick auf neue Einsichten freilegt, wenn
unnötige Restriktionen aus der Problemstellung eliminiert werden.
(2) Die Spezialisierung einer Problemstellung ist nicht notwendig mit so vielen
Informationsverlusten verbunden, dass ein Rücktransfer von Lösungsansätzen in
die ursprüngliche Aufgabenstellung unmöglich scheint; es gibt sogar Situationen, in
denen durch Spezialisierung der Übergang zu einer äquivalenten Problemstellung
geschafft wird.
Zumindest aber besteht stets die Hoffnung, dass sich die Lösungen mehrerer
Spezialfälle einer Problemstellung zu einer Lösung des ursprünglichen Problems
zusammensetzen lassen, welches dann die Rolle einer gemeinsamen Verallgemei-
nerung der Spezialfälle übernimmt.
Ein Aspekt, unter dem Spezialisierungen betrachtet werden können, ist die Be-
achtung des Extremalpinzips. Dieser Heurismus basiert auf der Korrespondenzhy-
pothese:

 Objekte, die hinsichtlich einer ausgewählten Eigenschaft extremal sind, weisen


oft auch bezüglich anderer Eigenschaften besondere Kennzeichen auf.

Entsprechend regt das Extremalprinzip an:

 Suche die determinierenden Elemente einer komplexen Problemsituation unter


denjenigen Objekten, die bezüglich geeigneter Maße extremal sind.
146 1 Heurismen der Variation

Mit einer hinreichend allgemeinen Interpretion des Begriffs des „Extremalen“ kann
man die Spezialisierung einer Problemstellung unter Beachtung des Extremalprin-
zips wie folgt deuten:

 Versuche die determinierenden Elemente einer Problemsituation unter Randfäl-


len, benachbarten Fällen, Sonderfällen, entarteten Fällen, Ausnahmefällen und
Grenzfällen ausfindig zu machen.

Neben der oben geschilderten Identifikationsfunktion und Determinationsfunktion


des Extremalen kommt dessen Monsterfunktion bei der Begründung allverneinen-
der Aussagen in Betracht:

 Zum Nachweis, dass kein Element einer Grundmenge G eine bestimmte Eigen-
schaft E hat, versuche man eine den Elementen von G zugehörige Extremalität
zu finden, die sich mit E nicht in Einklang bringen lässt.

Im Kontext der enumerativen Kombinatorik treten einige der vorgestellten Heu-


rismen der Variation in Sonderformen auf, die sich verselbständigt haben. Aus dem
Zusammenwirken von Invarianzprinzip und Umstrukturierung ergeben sich

 Elementare Zählstrategien (Summenregel, Produktregel, Zählen durch Bijekti-


on, Rekursives Zählen, Komplementäres Zählen)

Eine Verfeinerung der Summenregel führt auf das

 Prinzip der Inklusion und Exklusion (Siebformel)

Dieser Katalog von Zähltechniken lässt sich mit den daraus herzuleitenden Anzahl-
formeln für k-Auswahlen aus n-Mengen vervollständigen und stellt so das passende
Instrumentarium zur Lösung von Zählproblemen der enumerativen Kombinatorik
dar.
Weniger um das Zählen selbst als um den Erkenntnisgewinn durch Zählen geht
es bei den folgenden beiden Prinzipien:

 Prinzip des doppelten Zählens


 Schubfachprinzip (pigeon-hole principle).

Das erste führt zu strukturellen Erkenntnissen über funktionale Zusammenhänge


zwischen den am Zählprozess beteiligten Größen, das zweite liegt implizit fast allen
Existenzproblemen der Kombinatorik zu Grunde und liefert rein nicht-konstruktive
Existenzbeweise. In der Deutung des Strebens nach maximaler Gleichverteilung
kann das Schubfachprinzip als spezielle Ausprägung des Extremalprinzips verstan-
den werden.
1.2 Variation der Problemstellung 147

Unsere Überlegungen aus Abschn. 1.2 fließen in eine zweite Verfeinerung von
P ÒLYAs Phasenmodell des Problemlöseprozesses ein und führen zu folgender Dar-
stellung:

Problemlösephasen nach Pólya (Zweite Verfeinerung)

I. Verstehen der Aufgabe


a) Identifikation des Problems
b) Auffinden einer geeigneten Darstellung des Problems
II. Ausdenken eines Plans
a) Variation der Problemwahrnehmung (Reorganisation)
b) Variation der Problemstellung unter Beachtung des Invarianz-, des
Symmetrie- und des Extremalprinzips
III. Ausführen des Plans
IV. Rückschau
a) Kontrolle der Lösung durch Rückübersetzung in den ursprünglichen
Problemkontext

Dabei ist zu beachten, dass die Phasen einander wechselseitig beeinflussen und des-
halb im Sinne eines heuristischen Kreislaufs ggf. mehrfach zu durchlaufen sind.
Heurismen der Induktion
2

Inhaltsverzeichnis
2.1 Heurismen der unvollendeten Induktion . . . . . . . . . . . . . . . . . . . . . . . . . . . . 151
2.2 Vollendete Induktion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 197

Bei der in Kap. 1 vorgenommenen Behandlung von Heurismen des mathematischen


Problemlösens stand das „Problemlösen im engeren Sinne“ im Vordergrund. Unter
dem uniformisierenden Aspekt der Variation wurde eine Systematik von Problem-
lösestrategien vorgestellt, die im Einzelnen bei der Lösung konkret vorgegebener
Probleme eingesetzt und erläutert wurden.
Dies reflektiert die vorherrschende Wahrnehmung von mathematischer Betäti-
gung, nach der das Lösen von Problemen oder das Beweisen von Behauptungen im
Zentrum mathematischen Handelns steht. Gerade zu Beginn eines Mathematikstu-
diums besteht die Gefahr, dass die Studierenden – nicht zuletzt aufgrund zumeist
völlig konträrer Lernerfahrungen im Schulunterricht – der Versuchung erliegen, den
„wahren“ Charakter des Betreibens von Mathematik in der systematischen Dedukti-
on zu sehen. Die reale Natur mathematischer Erkenntnisprozesse ist aber wesentlich
vielschichtiger, wie es P ÓLYA treffend formuliert hat1 :

Die Mathematik wird als demonstrative Wissenschaft angesehen. Doch ist das nur einer
ihrer Aspekte. Die fertige Mathematik, in fertiger Form dargestellt, erscheint als rein de-
monstrativ. Sie besteht nur aus Beweisen. Aber die im Entstehen begriffene Mathematik
gleicht jeder anderen Art menschlichen Wissens, das im Entstehen ist. Man muß einen ma-
thematischen Satz erraten, ehe man ihn beweist; man muß die Idee eines Beweises erraten,
ehe man die Details ausführt. Man muß Beobachtungen kombinieren und Analogien ver-
folgen; man muß immer und immer wieder probieren. Das Resultat der schöpferischen
Tätigkeit des Mathematikers ist demonstratives Schließen, ist ein Beweis; aber entdeckt
wird der Beweis durch plausibles Schließen, durch Erraten. Wenn das Erlernen der Mathe-
matik einigermaßen ihre Erfindung widerspiegeln soll, so muß es einen Platz für Erraten,
für plausibles Schließen haben.

1
P ÓLYA , G: Mathematik und plausibles Schließen, Band 1. Birkhäuser, Basel (1962).

© Springer-Verlag GmbH Deutschland, ein Teil von Springer Nature 2018 149
W. Schwarz, Problemlösen in der Mathematik, https://doi.org/10.1007/978-3-662-56762-3_2
150 2 Heurismen der Induktion

P ÓLYA widmet seinen Untersuchungen zur Philosophie des plausiblen Schließens


zwei ganze Bücher, wobei sich der umfangreichere erste Band ausschließlich mit
einem Spezialfall plausiblen Schließens, dem induktiven Schließen beschäftigt.2
P ÓLYAs erfahrungswissenschaftliche Auffassung von induktivem Schließen (In-
duktion3 ) ist die eines heuristischen Denkmusters, bei dem vom besonderen Ein-
zelfall auf das Allgemeine, das Gesetzmäßige geschlossen wird. In den empirischen
Wissenschaften und den Naturwissenschaften liegt dieser Art der Erkenntnisgewin-
nung die Annahme zugrunde, dass etwas, was sich bei einer Vielzahl beobachteter
Ereignisse als wahr und bisher nie als unwahr erwiesen hat, sich bei allen gleichar-
tigen Ereignissen als wahr erweisen wird und es daher verdient, als allgemeingül-
tiges Gesetz formuliert zu werden – nicht so in der Mathematik! Vor allen anderen
Wissenschaften zeichnet sich die Mathematik dadurch aus, dass eine Erkenntnis –
unabhängig davon, auf wie vielen singulären Bestätigungen sie beruht – dann und
nur dann als Wahrheit akzeptiert wird, wenn sie nach rigoros ausgelegten Regeln
des logischen Folgerns aus bereits anerkannten Wahrheiten deduziert wird.4
Der strenge mathematische Beweis steht aber am Ende eines schöpferischen Pro-
zesses, der durch Elemente induktiven Schließens initiiert und in Gang gehalten
wird. Induktion ist von unschätzbarem heuristischen Wert für Erkenntnisgewinn in
der Mathematik, bei der Problemfindung und Begriffsbildung, bei der Problemlö-
sung und sogar bei der Beweisführung, wenn die Induktion beispielsweise in Gestalt
der vollständigen Induktion in eine Deduktionsform übergeht.
Auch wenn diese Auffassung der Induktion bisweilen philosophisch-logische
Grundlagen-Diskussionen provoziert, orientiert sich die Mathematikdidaktik am
oben beschriebenen Gebrauch des Wortes „Induktion“. Eine Auswahl der wich-
tigsten Denkmuster und Strategien, die im Hinblick auf dieses tradierte Begriffs-
verständnis der induktiven Methode zugerechnet werden können, sind in der hier
vorgestellten Systematik heuristischer Strategien als Heurismen der Induktion klas-
sifiziert. Ich habe dabei nicht den Anspruch, alle Aspekte der P ÓLYAschen Philo-
sophie des plausiblen und speziell des induktiven Schließens aufzugreifen – das
wäre im Rahmen einer Gesamtkonzeption, welche sich der Induktion nur partiell
zuwendet, unangemessen und dem Erkenntnisgewinn nicht förderlich.
Ich werde aber versuchen, die wesentlichen Gesichtspunkte des P ÓLYAschen
Ansatzes in eine mit aktuelleren Sichtweisen angereicherte, strukturierte Darstel-
lung der Thematik einzubringen.

2
Obgleich P ÓLYA mehrfach darauf hinweist, dass es sich beim „plausiblen Schließen“ nicht um
ein folgerichtiges Schließen im deduktiven Sinne handelt, scheint es Missverständnisse hinsicht-
lich des formallogischen Wertes seiner „Regeln des plausiblen Schließens“ zu geben.
3
inductio (lat.): das Hineinführen.
4
Vertritt man wie I MRE L AKATOS (1922–1974) den mathematikphilosophischen Standpunkt des
Quasi-Empirismus, der den Dogmatismus undefinierter Grundbegriffe ablehnt und den Axiomen
einer mathematischen Theorie allenfalls Erklärungskraft, niemals aber Beweiskraft für die aus
ihnen deduzierten Sätze zubilligt, dann existiert auch in der Mathematik nur Mutmaßlichkeit, je-
doch keine gesicherte Wahrheit. Positiv gesehen: Mathematische Forschung produziert relative
Wahrheiten, also Wahrheiten im Bezug auf ein Axiomensystem.
2.1 Heurismen der unvollendeten Induktion 151

2.1 Heurismen der unvollendeten Induktion

Wie oben bemerkt, gibt es Formen induktiven Schließens (wie etwa die vollstän-
dige Induktion), die aufgrund der Eigenschaften der mathematischen Strukturen, in
denen sie verwendet werden, demonstrativen Charakter haben; nennen wir sie (die
Heurismen der) vollendete(n) Induktion.
Ebenso gibt es Formen induktiven Schließens, die auf plausible, aber nicht for-
mallogisch begründbare Verallgemeinerungen singulärer Beobachtungen setzen,
um Problemfindungsprozesse und Problemlöseprozesse voranzubringen – solche
Denkmuster gehören zu den Heurismen der unvollendeten Induktion, von denen in
diesem Abschnitt die Rede sein soll.

2.1.1 Systematisches Probieren und Suche nach Mustern

Einer der Ausgangspunkte induktiven Schließens ist die Beobachtung. Welchen


schöpferischen Prozess könnten die folgenden Feststellungen eines chinesischen
Gelehrten aus dem ersten vorchristlichen Jahrtausend in Gang setzen?

2 j 22  2
3 j 23  2
4 − 24  2
5 j 25  2
6 − 26  2
7 j 27  2
8 − 28  2
9 − 29  2
10 − 210  2
11 j 211  2

Ziel muss offenbar sein, aus den hier präsentierten Zusammenhängen Muster ab-
zulesen oder (durch leichte Manipulationen an den Daten) Muster herzustellen (!
Variation; Symmetrieprinzip), die dann zur Formulierung einer Vermutung Anlass
geben, die es näher zu untersuchen gilt.
Mögliche Elemente der Situationsanalyse könnten folgende Fragen (und Ant-
worten) sein:

 Welches sind die Objekte, über die Informationen gegeben werden?


(Hier: die natürlichen Zahlen 2; 3; : : : ; 11 und 22  2; 23  2; : : : ; 211  2.)
 In welcher Art liegen diese Informationen vor?
(Hier: in Form von Zeichenketten einer formalen Sprache, visuell sortiert wahr-
nehmbar.)
152 2 Heurismen der Induktion

 Für welche(n) spezielle(n) Gegenstandsbereich(e) sind die zur Kommunikation


der Informationen verwendeten sprachlichen Elemente typisch?
(Hier: Teilbarkeitsrelation zwischen natürlichen Zahlen; elementare Zahlentheo-
rie.)
 Wird durch die sprachlichen Elemente oder die Präsentation der Informationen
eine Gruppierung der Daten angeregt?
(Hier: ja. Sowohl optisch als auch sprachlich („teilt“ vs. „teilt nicht“) wird der
Eindruck vermittelt, man möge die Gruppierungen 2; 3; 5; 7; 11 und 4; 6; 8; 9; 10
(mit den jeweils zugehörigen um 2 verminderten Zweierpotenzen) vornehmen.)
 Wenn ja, gibt es irgendwelche Objekte in den oben ermittelten Gegenstandsbe-
reichen, deren charakteristische Merkmale die vorliegende Gruppierung herbei-
führen würden?
(Hier: ja. Die Zahlen 2; 3; 5; 7; 11 sind prim, die Zahlen 4; 6; 8; 9; 10 sind zusam-
mengesetzt.)

Sind nun Merkmalsträger und Merkmale eines Gegenstandsbereichs gefunden,


durch die im vorliegenden Datenmaterial ein Muster von Analogien definiert wer-
den kann, so lässt sich die präzise Beschreibung der Muster als Beobachtung
formulieren. Im vorliegenden Fall ließe sich feststellen:

Beobachtung

(1) Jede Primzahl p zwischen 2 und 11 hat die Eigenschaft p j 2p  2.


(2) Jede zusammengesetzte Zahl z zwischen 2 und 11 hat die Eigenschaft
z − 2z  2.

Auf der Grundlage dieser gesicherten Feststellung beginnt ein Prozess der Ex-
ploration zur Beantwortung der Frage, ob es weitere Zahlen gibt, für die sich ana-
loge Eigenschaften konstatieren lassen. Als probates Mittel in dieser Phase des
Erkenntnisprozesses bietet sich das Systematische Probieren an.

 Es ist 213  2 D 8190 D 13  630, also gilt 13 j 213  2.


 Es ist 217  2 D 131 070 D 17  7710, also gilt 17 j 217  2.
 Es ist 219  2 D 524 286 D 19  27 594, also gilt 19 j 219  2.
 Es ist 223  2 D 8 388 606 D 23  364 722, also gilt 23 j 223  2.

Ebenso stellt man fest:

 Es ist 212  2 D 4094; weil aber 3 − 4094, gilt auch 12 − 212  2.


 Es ist 214  2 D 16 382; weil aber 7 − 16 382,5 gilt auch 14 − 214  2.

5
Es gilt 7 j n genau dann, wenn 7 j Q300 .n/, wobei Q30 .n/ die alternierende Quersumme dritter
Stufe von n in dezimaler Zifferndarstellung bezeichnet.
2.1 Heurismen der unvollendeten Induktion 153

 Es ist 215  2 D 32 766; weil aber 5 − 32 766, gilt auch 15 − 215  2.


 Es ist 216 2 D 65 534; weil aber 16 D 24 − 2 und 24 j 216 , gilt auch 16 − 216 2.

Es hat den Anschein, als ließen sich die Beobachtungen (1) und (2) auf weit mehr
natürliche Zahlen verallgemeinern als auf die Zahlen zwischen 2 und 11; gestützt
wird diese Annahme durch die Erfahrungen, welche wir mit dem Heurismus des
Systematischen Probierens sammeln konnten.
Durch Induktion, also die Ableitung von Schlussfolgerungen aus einzelnen vor-
gegebenen Fakten, könnte man sich nun zu folgender Vermutung veranlasst sehen:

Vermutung

(1) Jede Primzahl p hat die Eigenschaft p j 2p  2.


(2) Jede zusammengesetzte Zahl z hat die Eigenschaft z − 2z  2.

Mit der Äußerung dieser Vermutung befinden wir uns übrigens in guter Gesell-
schaft, denn auch G OTTFRIED W ILHELM L EIBNIZ (1646–1716) hielt den postu-
lierten Sachverhalt um 1680 für plausibel.
Seine Stützen der Thesen (1) und (2) waren dabei noch weitaus fundierter als un-
sere singulären Beobachtungen; natürlich kannte L EIBNIZ den von F ERMAT (1601–
1665) für Primzahlen bewiesenen Spezialfall des in Beispiel 1.40 besprochenen
Satzes von Euler/Fermat, wonach für jede ungerade Primzahl p insbesondere p j
2p1  1 folgt.
Für jede Primzahl p gilt deshalb p j 2  .2p1  1/ D 2p  2, d. h., Teil (1) der
Vermutung ist ein Satz, eine anerkannte Wahrheit der Zahlentheorie!
Gefunden haben wir diese Wahrheit, indem wir Analogien in den Daten als
Muster erkannt haben, in Verallgemeinerung unserer Beobachtungen eine Vermu-
tung formuliert haben, zur Untermauerung dieser Vermutung mittels Systemati-
schen Probierens zu einer Kette von Spezialisierungen unserer Vermutung überge-
gangen sind, welche weitere Einzelbeobachtungen lieferten, die mit der Vermutung
im Einklang standen, und schließlich die wissenschaftliche Absicherung unserer
Vermutung durch einen Beweis (Rückführung auf einen bewiesenen Satz) vorge-
nommen haben.
Verallgemeinerung, Spezialisierung und Analogie sind nicht nur im Umfeld heu-
ristischer Strategien der Variation zu finden, sondern in der hier beschriebenen
Weise die konstituierenden Denkmuster der Induktion, wie es bei P ÓLYA ausführ-
lich beschrieben wird.
Kommen wir nun zu Teil (2) der Vermutung. Ich wage zu behaupten, dass durch
Systematisches Probieren wohl kaum ein Gegenbeispiel gefunden werden könnte,
und dennoch: Teil (2) der Vermutung trifft nicht zu; auch L EIBNIZ lag falsch!
Betrachten wir die zusammengesetzte Zahl z D 341 D 11  31. Wegen 210
1 mod 11 und 210 1 mod 31 folgt
 34
210 1 mod 341 und 2341 2  210 2  1 2 mod 341 ;
154 2 Heurismen der Induktion

also gilt 2341  2 0 mod 341, gleichbedeutend mit 341 j 2341  2. Damit ist Teil
(2) der Vermutung falsifiziert.
Unterhalb von n D 2000 gibt es neben z D 341 allerdings nur noch sechs (!)
weitere zusammengesetzte Zahlen z mit der Eigenschaft z j 2z  2, nämlich die
Zahlen

561 D 3  11  17 ; 645 D 3  5  43 ; 1105 D 5  13  17 ;


1387 D 19  73 ; 1729 D 7  13  19 ; 1905 D 3  5  127 :

Die relativ wenigen6 zusammengesetzten natürlichen Zahlen z mit der Eigenschaft


z j 2z  2 (die alle Primzahlen gemäß (1) haben) bezeichnet man daher als Pseudo-
primzahlen.
Erkenntnistheoretisch ist der Schluss von endlich vielen Einzelbeobachtungen
auf eine unendliche Gesamtzahl von Erscheinungen, so plausibel er auch erscheinen
mag, dialektisch, also nicht zwingend wahr, nicht demonstrativ. Wie wertvoll für
den Prozess des Mathematik-Betreibens induktives Schließen dennoch ist, haben
wir bei der Diskussion der Pseudoprimzahlen gesehen; man kann es nicht treffender
formulieren als L EONHARD E ULER („Specimen de usu observationum in mathesi
pura“), wie man es in P ÓLYAs Büchern zum plausiblen Schließen nachlesen kann:

Es wird nicht wenig paradox erscheinen, in jenem Teil der mathematischen Wissenschaften,
den man gewöhnlich die reine Mathematik nennt, Beobachtungen große Bedeutung beizu-
legen, da der geläufigen Ansicht nach Beobachtungen auf physische Objekte beschränkt
sind, welche die Sinne beeindrucken. Da wir die Zahlen auf den reinen Intellekt beziehen
müssen, können wir kaum verstehen, wie Beobachtungen und Quasi-Experimente bei einer
Untersuchung der Natur der Zahlen von Nutzen sein können.
Doch sind tatsächlich, wie ich durch sehr gute Argumente dartun werde, die heute be-
kannten Eigenschaften der Zahlen größtenteils durch Beobachtung entdeckt worden, und
zwar lange bevor ihre Wahrheit durch strenge Beweise bestätigt wurde. Es gibt sogar viele
Zahleneigenschaften, die uns gut bekannt sind, die wir aber noch nicht beweisen können;
Beobachtungen allein haben zu ihrer Kenntnis geführt. Somit sehen wir, daß wir in der
Zahlentheorie, die noch sehr unvollkommen ist, unsere höchsten Hoffnungen auf Beobach-
tung setzen dürfen. Sie wird uns zu immer neuen Eigenschaften führen, die wir hinterher zu
beweisen suchen werden.
Die Art des Wissens, die nur von Beobachtungen gestützt wird und noch nicht bewiesen
ist, muß sorgfältig von der Wahrheit unterschieden werden; sie wird, wie wir gewöhnlich sa-
gen, durch Induktion gewonnen. Doch haben wir Fälle gesehen, in denen bloße Induktion zu
Irrtum geführt hat. Darum sollten wir große Sorgfalt darauf verwenden, nicht solche Zah-
leneigenschaften, die wir durch Beobachtung entdeckt haben, und die allein durch Indukti-
on gestützt werden, als wahr zu akzeptieren. In der Tat sollten wir eine solche Entdeckung
als Gelegenheit dazu benützen, die entdeckten Eigenschaften genauer zu untersuchen und
sie zu beweisen oder zu widerlegen; in beiden Fällen können wir etwas Nützliches lernen.

Durchlaufen wir den bei der Diskussion von Pseudoprimzahlen dargestellten kreati-
ven Prozess noch einmal bei der Behandlung einer offenen Problemstellung. Diese
spezielle Aufgabe habe ich aus einem überraschenden Sachzusammenhang entwi-
ckelt, der mir, um es mit den Worten E ULERs zu sagen, im Stadium „einer Art des

6
„Relativ“ wenige, denn es gibt unendlich viele Zahlen dieser Art!
2.1 Heurismen der unvollendeten Induktion 155

Wissens, welches nur von Beobachtungen gestützt und noch nicht bewiesen ist“,
vor einigen Jahren von J EFF M C N EAL bei einer unserer Princetoner Sitzungen zu
„recreational mathematics“ zugetragen wurde. Ich selbst habe später die „Ent-
deckung als Gelegenheit dazu benutzt, die entdeckten Eigenschaften genauer zu
untersuchen“ und möchte feststellen, dass dieses Beispiel in geradezu hervorragen-
der Weise dazu geeignet ist, die Rolle der Suche nach Mustern sowohl im Prozess
der Problemfindung als auch im Prozess der Problemlösung im engeren Sinne zu
verdeutlichen.

Beispiel 2.1 (Loreley-Muster)


„Ich weiß nicht, was soll es bedeuten . . . ?“

Abb. 2.1 Loreley-Muster

Unser Problemfindungsprozess beginnt mit der Suche nach Mustern in Abb. 2.1.
Vorstellbar ist7 , dass man durch sukzessiv verfeinerte Fragestellungen bei der Ana-
lyse der (ggf. zur Mustererzeugung leicht zu manipulierenden) Problemdaten zu
einigen Beobachtungen kommt; die erste Beobachtung könnte die folgende sein:

Beobachtung

(1) In ein rechteckiges Zahlenschema, dessen Spaltenkoordinaten mit den


Zahlen aus N0 (bis zur Zahl n D 24) fortlaufend nummeriert sind, sind
vereinzelt natürliche Zahlen eingetragen. Manche dieser natürlichen Zah-
len sind durch Einkreisen markiert, andere nicht.

7
Natürlich wären auch andere Beobachtungen denkbar – es handelt sich um eine offene Problem-
stellung.
156 2 Heurismen der Induktion

Diese einfache Anfangsbeobachtung wirft Fragen nach der präziseren Beschrei-


bung von Mustern auf:

(M 1) An welchen Positionen der Tabelle sind Zahlen eingetragen?


(M 2) Welche Zahlen sind markiert, welche sind nicht markiert?
(M 3) Lässt sich präziser angeben, welche natürlichen Zahlen in die Tabelle einge-
tragen sind?

Die Fragestellung (M 1) legt zunächst nahe, in der Tabelle auch Zeilenkoordina-


ten einzuführen, damit die angefragten Positionen eindeutig gekennzeichnet werden
können (Abb. 2.2).

Abb. 2.2 Loreley-Muster mit Zeilenkoordinaten

Diese marginale Variation der Daten ermöglicht – z. B. anhand der durch farb-
liche Codierung als zusammengehörig gekennzeichneten Zeilen und Spalten – die
Beantwortung der Fragen (M 1) bis (M 3) und damit präzisere Angaben zum vor-
liegenden Muster, die an den übrigen kompletten Zeilen verifiziert werden können
und die sich folgendermaßen als detailliertere Beobachtungen formulieren lassen:

Beobachtung

(2) In jeder n-ten Zeile der Tabelle (0  n  8) sind alle .n C 1/ Spalten


mit den Spaltenkoordinaten 2n  j  3n mit Zahlen belegt, die übrigen
Felder der Zeilen 0 bis 8 sind frei.
(3) Für alle Zahlen z in der n-ten Zeile (0  n  8) gilt: Genau dann ist z
markiert, wenn z zur Vielfachenmenge von n gehört.
(4) In jeder n-ten Zeile der Tabelle sind an
 den unter
  (2) beschriebenen
Positionen die Binomialkoeffizienten n0 ; : : : ; nn der n-ten Zeile des
PASCALschen Dreiecks8 eingetragen (0  n  8).
2.1 Heurismen der unvollendeten Induktion 157

Auch die unvollständigen Zeilen der Tabelle geben Fragmente des wahrgenom-
menen Musters korrekt wieder, sodass der induktive Schluss erlaubt scheint, man
möge sich das Muster zeilenweise auf beliebig viele Zeilen fortgesetzt denken.
Aber: Mit welchem Ziel? Welche informationstragende Gruppierung der teils
markierten, teils unmarkierten Zahlen ist bisher unentdeckt?
Der entscheidende Hinweis ergibt sich aus dem Symmetrieprinzip:
Zur Herstellung des Musters tragen wir zeilenweise die Binomialkoeffizienten
des PASCALschen Dreiecks in die Tabelle ein; dabei verschieben wir mit jeder
neuen Zeile den ersten Eintrag um zwei Spalten nach rechts. Dann markieren wir
zeilenweise die Elemente der Vielfachenmengen der einzelnen Zeilenkoordinaten
und stellen so Gruppierungen von markierten und unmarkierten Zahlen her.
Informationsträger sind aber nicht nur die Zeilen, sondern auch die Spalten einer
rechtecksförmigen Tabellenstruktur; diese haben wir bisher nicht berücksichtigt und
folglich die Symmetrien der Problemstellung nicht herausgearbeitet (Abb. 2.3).

Abb. 2.3 Loreley-Muster mit Kennzeichnung der Spaltenstruktur

Sofort fällt auf, dass es Spalten gibt, in denen ausschließlich markierte Zahlen
stehen, während in anderen Spalten unmarkierte oder sowohl markierte als auch un-
markierte Zahlen auftreten. Die Objekte im Gegenstandsbereich der Zahlentheorie,
deren charakteristische Merkmale die vertikale Gruppierung herbeiführen würden,
sind offensichtlich, und wir halten fest:

Beobachtung

(5) Die Spaltenkoordinaten p (0  p  24) aller Spalten mit ausschließlich


markierten Zahlen liefern alle Primzahlen p mit p  24.

8
Benannt nach B LAISE PASCAL (1623–1662).
158 2 Heurismen der Induktion

Auf der Grundlage der festgehaltenen Beobachtungen lässt sich eine Vermutung
formulieren, in deren Verifikation (oder vielleicht Falsifikation? Man denke an das
Phänomen der Pseudoprimzahlen!) eine Problemstellung zu sehen ist, welche die
Aufmerksamkeit des Mathematikers verdient.

Vermutung
Man lege eine Tabelle an und nummeriere die Zeilen und Spalten fortlaufend
mit Elementen aus N0 .
Nun trage man zeilenweise von links nach rechts die 0-te, die 1-te, : : : Zei-
le des PASCALschen Dreiecks in die Tabelle ein, wobei in jeder n-ten Zeile
der erste Binomialkoeffizient n0 in der 2n-ten Spalte notiert wird; anschlie-
ßend markiere man in jeder einzelnen Zeile diejenigen Zahlen, die Vielfache
der Zeilennummer sind.
Vermutlich gilt für alle j 2 N:

 Ist der Algorithmus für alle Zeilen mit den Zeilennummern 0; : : : ; j durch-
geführt, so ist p 2 f2; : : : ; 2j g genau dann eine Primzahl, wenn alle
Zahlen der Spalte p markiert sind.

Sollte die Vermutung richtig sein, beschreibt der oben angegebene Algorith-
mus ein skurriles (und bis dato niemandem meiner Gesprächspartner bekanntes!)
Primzahlsieb, das nach jeweils j Verfahrensschritten alle Primzahlen p  2j her-
ausfiltert. Zum Versuch der Verifikation der Vermutung bedienen wir uns erneut
der im Zusammenhang mit den Pseudoprimzahlen diskutierten und von P ÓLYA
angeregten („Die sorgfältige Beobachtung von Spezialfällen, die uns zu einem all-
gemeinen mathematischen Resultat führt, kann uns auch dessen Beweis an die Hand
geben.“) Heurismen der Induktion.
Zunächst fällt auf, dass im vorliegenden
  Zahlenmuster die Zahl 1 eine dominie-
rende Rolle spielt – wegen n0 D nn D 1 für alle n 2 N0 taucht die Zahl 1 in
jeder Zeile der Tabelle (mit Ausnahme der 0-ten Zeile, wo sie nur einmal auftritt)
zweimal auf.
Aber: Die Zahl 1 wird beim Abarbeiten des Algorithmus in der j -ten Zeile dann
und nur dann gestrichen, wenn sie zur Vielfachenmenge der Zeilenkoordinate j
gehört, und dies ist nur für j D 1 der Fall! In jeder Spalte
  mit der Spaltenkoordinate
2j; j 2 N; j > 1 steht also in der j -ten Zeile mit j0 D 1 eine unmarkierte Zahl,
und wir können als Tatsachen festhalten:

(T 1) In den Spalten mit den Spaltenkoordinaten z D 2j; j 2 N; j > 1, welche


die zusammengesetzten geraden natürlichen Zahlen kennzeichnen, tritt stets
eine unmarkierte Zahl auf.
(T 2) In der Spalte mit der Primzahl-Spaltenkoordinate p D 2 befinden sich aus-
schließlich markierte Einträge.
2.1 Heurismen der unvollendeten Induktion 159

Könnte man nun die Gültigkeit analoger Tatsachen für die ungeraden zusammen-
gesetzten natürlichen Zahlen und die ungeraden Primzahlen feststellen, so wäre
unsere Vermutung verifiziert.
Betrachten wir zunächst die Spalten mit zusammengesetzten ungeraden natür-
lichen Zahlen als Spaltenkoordinaten. Wenn in einer jeden solchen Spalte eine 1
eingetragen wäre, hätte man eine zu (T 1) analoge Feststellung in der Kategorie der
zusammengesetzten ungeraden natürlichen Zahlen gefunden – für alle in Abb. 2.3
erfassten Fälle ist das richtig.
Aber bereits in Spalte 25 ist keine 1 zu finden, wie es sich am rechten Rand der
Abb. 2.3 andeutet und wie man durch Systematisches Probieren herausfinden kann;
also müssen wir uns weiter mit den Spalten, deren Spaltenkoordinaten z zusam-
mengesetzte ungerade Zahlen sind, beschäftigen.
Offenbar ist z 2 N genau dann zusammengesetzt und ungerade, wenn es eine
ungerade Primzahl p ¤ z und ein j 2 N mit z D .2j C 1/  p gibt.9 An der
Darstellung

z D .2j C 1/p D 2.jp/ C p mit j 2 N ; p ungerade Primzahl ; p  jp


 
erkennt man, dass in Zeile jp der Spalte z der Binomialkoeffizient jp p
eingetragen
ist; dieser wird
 aber nicht markiert, was man folgendermaßen einsehen kann:
Wäre jp ein Element der Vielfachenmenge von .jp/, so gäbe es ein c 2 N mit
p
jp
c  .jp/ D p , also
!
.jp/ jp  1
c.jp/ D bzw. pc.p1/Š D .jp1/.jp2/  .jppC1/ ;
p p1

woran sich die Teilbarkeitsaussage

p j .jp  1/  .jp  2/      .jp  p C 1/

ablesen ließe. Folglich müsste p ein Primteiler mindestens einer der Faktoren .jp 
1/; .jp  2/ : :: ; .jp  p C 1/ sein; dies ist offensichtlich nicht der Fall und führt
die Annahme, jp p sei ein Vielfaches von .jp/, zum Widerspruch.
Damit ist ein Analogon zu (T 1) in der Kategorie der ungeraden zusammenge-
setzten natürlichen Zahlen gefunden, und wir notieren die Tatsache

(T 3) In den Spalten mit den Spaltenkoordinaten z D .2j C 1/p; j 2 N; p unge-


rade Primzahl, welche die
 zusammengesetzten ungeraden natürlichen Zahlen
kennzeichnen, tritt mit jp
p stets eine unmarkierte Zahl auf.

9
Man spalte mit p den kleinsten aller Primteiler von z ab; weil z zusammengesetzt ist, gilt p ¤ z.
Als Komplementärteiler von z bezüglich p ergibt sich dann eine von 1 verschiedene natürliche
Zahl, die ungerade sein muss, weil z ungerade ist.
160 2 Heurismen der Induktion

Zu untersuchen bleiben die Spalten mit ungeraden Primzahlen als Spaltenko-


ordinaten. Will man zeigen, dass alle Zahlen der entsprechenden Spalten markiert
sind, muss man zunächst präzisieren, welche Zahlen in diesen Spalten auftreten; sei
dazu zunächst u D 2j C 1 (j 2 N) eine beliebige ungerade Spaltenkoordinate.
Dann gilt:
 
 Der letzte Eintrag der u-ten Spalte ist der Binomialkoeffizient j1 in der j -ten
 
Zeile. Im Fall j  3 ist dies der einzige Eintrag der Spalte, und wegen j j j1
ist er markiert.
 Für j  4 steht in Spalte u in der .j 
/-ten Zeile (
D 1; : : : ; Œ j 1 )10 der
 j 
 j 1
3
Binomialkoeffizient 2
C1 ; für
> Œ 3  sind in den .j 
/-ten Zeilen der
Spalte u keine weiteren Einträge vorhanden.
 Für alle
 Œ j 1
3
 gilt 2
C 1  j 
. Dabei kann der Fall 2
C 1 D j 

nicht auftreten, wenn u D 2j C 1 eine Primzahl ist.


(Im Fall 2
C 1 D j 
ist u D 2j C 1 D 2.j 
/ C 2
C 1 D 3.j 
/, also
3 j u und u  2  4 C 1 D 9. Dann ist aber u keine Primzahl.)

Zum endgültigen Nachweis der Tatsache, dass für jede ungerade Primzahl p alle
Einträge in Spalte p der Tabelle markiert sind, bleibt also nur noch zu zeigen:

Ist p D 2j C 1 eine ungerade Primzahl mit j  4 und ist p D 2n C k eine der 


Œ j 1
3
 C 1 Darstellungen von p mit 1  k < n und k ungerade, dann gilt n j kn .

Dazu müssen wir uns davon überzeugen, dass unter den oben genannten Vorausset-
zungen jeder Primfaktor q, der in der Primfaktorzerlegung von n mit dem Expo-
 
nenten ˛ auftritt, mit einem Exponenten ˇ  ˛ in der Primfaktorzerlegung von kn
erscheint.
Der Exponent eq .mŠ/ eines Primfaktors q in der Primfaktorzerlegung von
mŠ; m 2 N kann mit der Formel von Legendre11 bestimmt werden. Es ist
1

X
m
eq .mŠ/ D ;
i D1
qi

wobei natürlich nur endlich viele der Summanden von 0 verschieden sind.12 Folg-
n
lich gilt für den Exponenten eq . k / des Primfaktors q in der Primfaktorzerlegung

10
Mit Œ j 1
3
 wird die größte ganze Zahl  j 1
3
bezeichnet; allgemein definiert Œx den ganzzahli-
gen Anteil von x.
11
Benannt nach A DRIEN -M ARIE L EGENDRE (1752–1833).
12
Wegen limi!1 q i D 1 ist 0 < qmi < 1 für i  i0 D i0 .q/ und deshalb Œ qmi  D 0 für fast alle
i 2 N.
2.1 Heurismen der unvollendeten Induktion 161

n 
des Binomialkoeffizienten k D nŠ
kŠ.nk/Š :
!! 1 



n X n nk k
. / eq D   i ;
k i D1
qi q i q

wobei auch hier wieder nur endlich viele Summanden ungleich 0 sind.
Jeder Summand nimmt dabei entweder den Wert 0 oder den Wert 1 an, was man
mithilfe der Division mit Rest erkennen kann. Sind nämlich

n  k D v1 .i/  q i C r1 .i/ mit v1 .i/; r1 .i/ 2 N0 ; 0  r1 .i/ < q i ;


k D v2 .i/  q i C r2 .i/ mit v2 .i/; r2 .i/ 2 N0 ; 0  r2 .i/ < q i ;

dann ist





nk k r1 .i/ C r2 .i/ n
i
C i
D v1 .i/ C v2 .i/  v1 .i/ C v2 .i/ C i
D i ;
q q q q
also



(
n nk k 1 für q i  r1 .i/ C r2 .i/ < 2q i I
  D
qi qi qi 0 für 0  r1 .i/ C r2 .i/ < q i :

Sei nun ˛ 2 N der Exponent, mit dem der Primfaktor q in der Primfaktorzerlegung
von n auftritt; dann gilt für alle i D 1; : : : ; ˛: q i j n.
Außerdem gilt für alle i D 1; : : : ; ˛: q i − .n  k/ und q i − k, weil sonst nach
den grundlegenden Teilbarkeitsregeln auch q i j 2n C k gelten müsste; dies ist aber
ausgeschlossen, weil p D 2n C k eine ungerade Primzahl mit p > n  q i ist.
Daher ist für alle i D 1; : : : ; ˛ einerseits q i > r1 .i/ > 0 und q i > r2 .i/ > 0,
aber wegen q i j n gilt gleichzeitig r1 .i/ C r2 .i/ 0 mod q i , sodass sich zwangs-
läufig

r1 .i/ C r2 .i/
r1 .i/ C r2 .i/ D q i bzw. D1
qi
ergibt. Folglich sind in der Summe . / die ersten ˛ Summanden jeweils gleich 1,
  dass der Primfaktor q in der Primfaktorzerlegung des Binomial-
und man erkennt,
koeffizienten nk mit einem Exponenten ˇ  ˛ auftritt.
Dies beweist die Behauptung hinsichtlich der Markierung der Elemente in den
Spalten mit ungeraden Primzahlen als Spaltenkoordinaten, und wir können als
Anaologon zu (T 2) in der Kategorie ungerader Primzahlen festhalten:

(T 4) In den Spalten mit ungeraden Primzahlen als Spaltenkoordinaten befinden


sich ausschließlich markierte Einträge.

Die Tatsachen (T 1) bis (T 4) zusammen belegen nun die Behauptung, dass der
vorgestellte Algorithmus ein Primzahlsiebverfahren darstellt. 
162 2 Heurismen der Induktion

Die bedeutende Rolle der Mustererkennung in Problemlöse- und Problemfin-


dungsprozessen sollte damit deutlich geworden sein, und wir fassen zusammen:

Suche nach Mustern


Die heuristische Handlung der Suche nach Mustern initiiert sowohl
Problemfindungs- als auch Problemlöseprozesse.
Kann man in vorgegebenen Daten Analogien erkennen, diese als Muster
beschreiben und präzise als Beobachtungen formulieren, dann lassen sich in
Verallgemeinerung der Beobachtungen Vermutungen äußern, die mit Syste-
matischem Probieren in einer Kette von Spezialisierungen ggf. erhärtet oder
auch falsifiziert werden können.
Durch das induktive Schließen werden plausible Verallgemeinerungen
von Einzelbeobachtungen eingebracht, deren nähere Untersuchung die
Problemfindungs- und Problemlöseprozesse voranbringen kann.

Das Systematische Probieren hingegen bedarf weiterer Diskussion, denn es ist


in den bisher behandelten Beispielen ausschließlich in der Funktion des Liefe-
ranten für Bestätigungen oder Falsifikationen einzelner Vermutungen über wahr-
genommene Muster aufgetreten. Ein wesentliches Potenzial des Heurismus des
Systematischen Probierens ist aber die Generierung von Vermutungen, und zwar
nicht nur in Problemkontexten der „niederen Klassenstufen“ (1), wie es in manchen
Darstellungen suggeriert wird, sondern auch in anspruchsvollen mathematischen
Zusammenhängen (2).
Ein typisches Beispiel für (1) ist die oft bemühte „Weidezaun-Aufgabe“, bei der
es darum geht, mit 100 m Draht eine rechteckige Weide maximaler Weidefläche ein-
zuzäunen. Zu der Vermutung, dass unter allen Rechtecken gleichen Umfangs das
Quadrat den maximalen Flächeninhalt hat, kommt man bereits in der Primarstu-
fe durch Systematisches Probieren, wenn man in einer Tabelle die Flächeninhalte
einzelner Rechtecke mit den Seitenlängen x und y (x; y 2 N; x C y D 50/
unter Variation von x und y festhält. In Klasse 8 hat man dann mit der 3. Bino-
mischen Formel das theoretische Rüstzeug zur Verfügung, sich von der Richtigkeit
der Vermutung auch im Fall nicht ganzzahliger Seitenlängen zu überzeugen. (We-
gen .25 C "/  .25  "/ D 252  "2 < 252 für jedes " > 0 liefert offenbar das
Quadrat mit der Seitenlänge 25 m das flächeninhaltsgrößte unter allen Rechtecken
mit dem Umfang 100 m.) Die Fachzeitschriften zur Didaktik der Mathematik sind
nie versiegende Quellen für weitere Beispiele zu (1).
Für (2) könnte man sich einfach auf E ULER berufen: In fast allen Aufgabenstel-
lungen kann mit „Quasi-Experimenten“ ein erster Zugang zum Problem gefunden
werden. Ich möchte aber konkret zwei Beispielcluster thematisieren, in denen das
Systematische Probieren zweifelsfrei der Heurismus der ersten Wahl ist.
Beginnen wir mit der Stochastik: In vielen Problemstellungen der Wahrschein-
lichkeitsrechnung und der beurteilenden Statistik bietet sich eine sorgfältig konzi-
2.1 Heurismen der unvollendeten Induktion 163

pierte Reihe von Simulationen eines Zufallsexperiments an, um anhand der beob-
achteten Ereignisse erste Einschätzungen der Situation vornehmen zu können – hier
handelt es sich um Systematisches Probieren in reinster Form!
Regelmäßig kann damit auch die Analyse von Paradoxien erleichtert werden, al-
so von Situationen, in denen man an das Falsche glaubt, weil es intuitiv naheliegt,
während die nur analytisch erfassbare Wahrheit verdrängt wird. Ein Klassiker ist
das Drei-Türen-Paradoxon, welches Ende der 60er Jahre im Anschluss an seine
Ausstrahlung in der von M ONTY H ALL moderierten US-Gameshow „Let’s make
a deal“ weltweites Aufsehen erregte und seitdem in den Vereinigten Staaten als
das M ONTY-H ALL-Problem bekannt ist. Dabei ging es darum, dass hinter einer
von drei Türen ein Gewinn (Auto) und hinter den anderen beiden Türen zwei Nie-
ten (Ziegen) verborgen waren; die Kandidatin durfte eine Tür auswählen, hinter
der sie das Auto vermutete. Daraufhin öffnete H ALL eine der beiden anderen Tü-
ren, hinter der sich eine Ziege befand,13 und bot der Kandidatin an, sie dürfe ihre
ursprünglich getroffene Entscheidung revidieren und eine andere Tür wählen. Es
war die richtige Entscheidung, das Angebot anzunehmen, denn damit erhöhte sich
die Gewinnwahrscheinlichkeit von 13 auf 23 , wie man unschwer feststellen kann,
wenn man mit dem Konzept der bedingten Wahrscheinlichkeit vertraut ist.14 Für
die Öffentlichkeit (auch für manche Mathematiker!) war das Phänomen jedoch der-
maßen „counter-intuitive“15 , dass in der folgenden Show eine Simulation durchge-
führt wurde, damit für die Schar der Entrüsteten die Wahrheit zumindest plausibel
wurde.
In Problemstellungen der Analysis steht Systematisches Probieren am Anfang
jeder nicht unmittelbar aus den Daten abzuleitenden Vermutung über das makrosko-
pische Verhalten von Funktionen, von Zahlenfolgen, von Funktionenfolgen oder das
mikroskopische Änderungsverhalten von Funktionen. Das Einzige, was sich daran
seit E ULERs „Quasi-Experimenten“ dramatisch geändert hat, sind die Werkzeuge
des Systematischen Probierens; heute steht als heuristisches Werkzeug der Com-
puter mit seinen visuellen und numerischen Möglichkeiten zur Verfügung, und es
entsteht „ein heuristischer Kreislauf zwischen dem Mensch und seinem Auftrag-
nehmer Maschine“, wie T IMO L EUDERS bemerkt.
Die zentralen heuristischen Funktionen des Systematischen Probierens in
Problemlöse- und Problemfindungsprozessen lassen sich aber unabhängig vom
potenziellen Einsatz jedweder maschinellen Hilfen konkret angeben.

13
Unabhängig von der Wahlentscheidung der Kandidatin existiert mindestens eine andere Tür mit
Ziege dahinter!
14
Auch ohne Kenntnis bedingter Wahrscheinlichkeiten ist dies einsichtig, wenn man bedenkt, dass
die Entscheidung, das Tauschangebot anzunehmen, genau dann falsch ist, wenn man ursprünglich
die richtige der drei Türen gewählt hatte – Letzteres geschah mit einer Wahrscheinlichkeit von 13 .
15
Intuitiv würde man vielleicht vermuten, dass es keine Rolle spielt, ob man das Tauschange-
bot annimmt oder nicht; hinter einer von zwei verbleibenden Türen ist der Preis, also stehen die
Chancen 50:50, dass es sich um die Tür handelt, die man ausgewählt hat!?
164 2 Heurismen der Induktion

Systematisches Probieren
Das Systematische Probieren ist ein wesentliches Element induktiven heuris-
tischen Handelns.
Seine zentrale heuristische Funktion besteht im Generieren von Vermu-
tungen über mathematische Zusammenhänge; solche Vermutungen können
durch fortgesetztes Systematisches Probieren erhärtet oder falsifiziert wer-
den.
Systematisches Probieren verankert die heuristischen Vorgehensweisen
der Spezialisierung, der Generalisierung und der Analogiebildung in den
Denkmustern der Induktion; das sorgfältige Studium einer systematischen
Kette von Spezialfällen kann den Blick für gemeinsame Generalisierungen
oder Analogien öffnen.

Die Überlegenheit des Computers in puncto Rechengeschwindigkeit macht es


nunmehr möglich, das Systematische Probieren als brute-force-Strategie bei der Be-
stimmung der Lösungsmengen von Aussageformen über endlichen Grundmengen
aus den Problemkontexten der niederen Klassenstufen herauszulösen und auch im
Fall endlicher Grundmengen mit relativ vielen Elementen die Lösungen dadurch zu
bestimmen, dass man einfach alle Elemente der Grundmenge testet. Das erfordert
nicht unbedingt viel Phantasie, bringt aber manchmal erwähnenswerte Resultate
hervor; so wurde im Jahr 2003 eine Jahrtausende alte geometrische Puzzle-Aufgabe
gelöst, nämlich die Fragestellung, auf wie viele verschiedene Arten man die Po-
lygone des Stomachion („Das, was Wut hervorruft“) des A RCHIMEDES zu einem
Quadrat zusammensetzen kann.

Abb. 2.4 Stomachion des


A RCHIMEDES
2.1 Heurismen der unvollendeten Induktion 165

A RCHIMEDES von Syrakus (ca. 287–212 v. Chr.) diskutierte in seiner gleich-


namigen mathematischen Schrift16 verschiedene Lösungsmöglichkeiten dieser
Legespiel-Aufgabe. Wie beim Tangram ist ein Quadrat durch Schnitte in mehre-
re Vielecke aufgeteilt; allerdings besteht das Stomachion jedoch nicht aus sieben
Stücken wie das Tangram, sondern aus vierzehn Polygonflächen, darunter unter an-
derem auch nicht rechtwinklige Dreicke und Vierecke sowie ein Fünfeck (Abb. 2.4).
Der amerikanische Puzzlehersteller B ILL C UTLER fand im November 2003
durch systematisches Probieren mit dem Computer heraus, dass es – wenn man
Lösungen, die durch Rotation oder Spiegelung auseinander hervorgehen, jeweils
miteinander identifiziert – genau 536 verschiedene Lösungen des Problems gibt.
Kraft des Computers wird in solchen Situationen aus dem heuristischen Ver-
fahren des Systematischen Probierens ein algorithmisches Verfahren, also ein Ver-
fahren, welches garantiert zu einer Lösung des Problems führt, wenn eine solche
existiert.
In der künstlichen Intelligenz wird Problemlösen auf der Grundlage der Pro-
blemraumhypothese von A LLEN N EWELL und H ERBERT A. S IMON als Infor-
mationsverarbeitungsprozess modelliert. Man versteht hier das Problemlösen als
eine zielgerichtete Suche in einem durch einen Graphen beschreibbaren Problem-
raum, dessen Ecken den möglichen Zuständen zwischen einem gegebenen Anfangs-
zustand (A) und einem angestrebten Zielzustand (Z) zugeordnet sind und dessen
Kanten mögliche Übergänge zwischen je zwei Zuständen durch Anwendung einer
Problemlöseoperation symbolisieren. Jeder Weg von (A) nach (Z) in diesem Gra-
phen korrespondiert mit einer Lösung des Problems.
Zum Glück für den Berufsstand der Algorithmenentwickler ist der Rechenauf-
wand bei den „blinden“ Suchverfahren, die mit Ausnahme der Verbindungsstruktur
des zu durchsuchenden Graphen keine weiteren problemspezifischen Informationen
verwenden, ungeheuer groß, wenn es darum geht, nicht nur eine Lösung, sondern
alle Lösungen oder zumindest eine in irgendeinem Sinne „optimale“ Lösung eines
Problems zu finden.
Wollte man beispielsweise beim Traveling Salesman Problem (TSP)17 eine
Rundreise durch n D 17 Städte distanzoptimiert planen, indem man einen Compu-
ter alle denkbaren Wege generieren und deren Längen bestimmen ließe, um daran
anschließend aus allen Möglichkeiten einen optimalen Weg herauszusuchen, so wä-
re man dem Phänomen der „kombinatorischen Aufwandsexplosion“ hoffnungslos
ausgeliefert:
Selbst wenn der Rechner pro Sekunde 100 000 verschiedene Wege durchrechnen
könnte, dauerte es mehr als 100 Jahre (!), um das (TSP) für n D 17 (mit 17Š >
3;5  1014 möglichen Wegen) komplett abzuarbeiten.

16
Wahrscheinlich ursprünglich Ostomachion; man muss davon ausgehen, dass der Titel bei der
Überlieferung verstümmelt wurde.
17
Beim TSP geht es darum, eine Rundreise durch n Städte so zu planen, dass ein bestimmter
Faktor (Reisezeit, Distanzen, . . . ) minimiert wird.
166 2 Heurismen der Induktion

Auch die künstliche Intelligenz muss daher auf intelligentere Algorithmen zu-
rückgreifen, wenn „große“ Problemräume zu durchsuchen sind. Um dem Dilemma
der rechenaufwandsbedingten Intraktabilität zu entgehen, wird der Suchraum nicht
komplett, sondern „heuristisch“ durchsucht, womit wir wieder beim Thema wä-
ren: Nun geben die Werte unterschiedlicher Evaluierungsfunktionen an jeder Stelle
des Graphen Hinweise darauf, in welcher Richtung die Suche am geschicktesten
fortzusetzen sein könnte.
Im Rahmen solcher heuristischen Algorithmen erfolgt erneut ein Rollenwechsel
des Systematischen Probierens: Jetzt handelt es sich um einen Heurismus, der al-
gorithmisch abgewickelt wird; die Systematik, nach der einzelne Pfade durchsucht
werden und andere unberücksichtigt bleiben, wird vom jeweils verwendeten Algo-
rithmus bestimmt.
Umfassendere Beschreibungen des Problemlösens durch (optimiertes) Suchen in
großen Problemraumgraphen findet man in Standardwerken über künstliche Intel-
ligenz.18

2.1.2 Vorwärtsarbeiten

Folgt man der oben beschriebenen Metapher des Problemlösens als Suche nach
einem Weg von einem Anfangszustand (A) zu einem Zielzustand (Z), dann fallen
einem sofort zwei konträre Möglichkeiten auf, die Suche anzulegen:
Man könnte versuchen, sich von (A) nach (Z) zu bewegen, oder man könnte
versuchen, von (Z) nach (A) zu kommen.
Übliche und semiotisch naheliegende Bezeichnungen für diese Vorgehenswei-
sen sind Vorwärtsarbeiten und Rückwärtsarbeiten, wobei das Vorwärtsarbeiten als
„datengetriebene“ Strategie zu den induktiven Methoden gezählt werden kann. Die
Lösungssuche beginnt bei den bekannten Daten der Problemstellung, von denen
man progressiv in das Ziel hineingeführt zu werden sucht.
Als heuristischen Kreislauf kann man die Methode des Vorwärtsarbeitens über
das Fragenpaar (Teilzielfrage, Hilfsmittelfrage) charakterisieren:

Vorwärtsarbeiten als heuristischer Kreislauf

(T) Zunächst versuche man, eine Antwort auf folgende Teilzielfrage zu


finden:
Was lässt sich aus den
8 9 8 9
ˆ
ˆ gegebenen Größen >
> ˆ
ˆ berechnen > >
< = < =
gegebenen Bedingungen ableiten
unmittelbar ‹
ˆ Bestimmungsstücken >
> ˆ konstruieren >>
:̂ ; :̂ ;
Voraussetzungen folgern

18
Etwa in RUSSEL /N ORVIG: Artificial Intelligence: A Modern Approach. Prentice Hall (2003).
2.1 Heurismen der unvollendeten Induktion 167

(H) Gelingt dies nicht, beantworte man zuerst die Frage nach geeigneten
Hilfsmitteln:
8 9
ˆ
ˆ In welchen Formeln kommen die gegebenen Größen vor >
>
ˆ
ˆ >
>
ˆ
ˆ Welche Theorien thematisieren ähnliche Bedingungen >
>
ˆ
ˆ >
>
< Welchen geometrischen Themenkreisen können die Bestim- =

ˆ
ˆ
mungsstücke zugeordnet werden >
>
ˆ
ˆ >
>
ˆ
ˆ Welche Sätze besitzen gleichartige Voraussetzungen >
>
ˆ >
>
:̂ :: ;
:

Ist die Hilfsmittelfrage beantwortet, gehe man mit diesen neuen Informa-
tionen zurück nach (T).

Die Idee zu einer solchen Darstellung ist H ELMUT KÖNIG nachempfunden;19


in analoger Form lässt sich das Rückwärtsarbeiten beschreiben, welches aber den
Heurismen der Reduktion zuzurechnen ist und deshalb in Kap. 3 thematisiert wird.
In der Terminologie der griechischen Mathematiker begegnet man dem Rück-
wärts- und dem Vorwärtsarbeiten in Gestalt von Analysis und Synthesis, wobei die
Synthese ihre Wirksamkeit vorwiegend im Zusammenspiel mit der Analyse entfal-
tet, wie es PAPPOS von Alexandria (um 300 n. Chr.) beschreibt:20

Die sogenannte Heuristik ist (. . . ) ein (. . . ) Lehrgebiet für den Gebrauch derjenigen, wel-
che, nachdem sie die allgemeinen Elemente schon durchgenommen haben, sich die Fertig-
keit aneignen wollen, mathematische Aufgaben zu lösen. Sie wurde (. . . ) behandelt (. . . )
von (. . . ) Euklid, Apollonius und von Aristäus dem Älteren. Sie geht vor mittels Analyse
und Synthese.
In der Analyse gehen wir aus vom Verlangten (. . . ) und nehmen (. . . ) das was zu tun
verlangt bereits als getan an. (. . . ) wir ziehen Folgerungen daraus (. . . ) bis wir einen Punkt
erreicht haben, den wir als Ausgangspunkt bei der Synthese verwenden können. (. . . ) Diese
Art der Behandlung nennen wir (. . . ) rückläufiges Schließen.
In der Synthese wird umgekehrt das bereits Bekannte oder als gültig Zugelassene, was
wir in der Analyse zuletzt angetroffen haben, als Ausgangspunkt benutzt.

Insofern scheint es nicht angemessen, Synthese und Vorwärtsarbeiten mitein-


ander zu identifizieren! Synthese spielt eher die Rolle einer vorwärts gerichteten
Ausführung eines Plans, den man in der Analyse regressiv entworfen hat.

19
KÖNIG , H: Einige für den Mathematikunterricht bedeutsame heuristische Vorgehensweisen.
MU 38, Heft 3 (1992).
20
Nachzulesen in einem Artikel von B ERND Z IMMERMANN aus G LATFELD , M.: Finden, Erfin-
den, Lernen: Zum Umgang mit Mathematik unter heuristischem Aspekt. Verlag P.Lang, Frankfurt
(1990).
168 2 Heurismen der Induktion

Will man etwa die Menge L aller Lösungen der linearen diophantischen Glei-
chung21
16x  12y D 20
bestimmen, so liest man leicht die spezielle Lösung .x0 ; y0 / D .2; 1/ ab und ermit-
telt daraus progressiv die Menge aller Lösungen zu

L D f.2 C 3t; 1 C 4t/ j t 2 Z g :

Allein aufgrund der vorherigen Analyse, dass sich zwei ganzzahlige Lösungstupel
der Gleichung nur um ganzzahlige Vielfache von .3; 4/ unterscheiden können (!
Ausgangspunkt (Z), nämlich Lösungen der Gleichung), führt die Ermittlung einer
speziellen Lösung (! Ausgangspunkt (A), nämlich die Gleichung) von (A) nach
(Z) hin – es handelt sich um eine Analysis-Synthesis-Prozedur.
Eine neuzeitliche Erscheinungsform von Analysis-Synthesis-Prozeduren könnte
man in der Mittel-Ziel-Analyse (means-end-analysis) sehen, die in der künstlichen
Intelligenz vielfach als die wichtigste Strategie angesehen wird, mit der in großen
Suchräumen selektive Suchen vorgenommen werden können.
Hierbei wird zunächst eine detaillierte Liste der Unterschiede zwischen An-
fangszustand (A) und Zielzustand (Z) erstellt, und anschließend führt man eine
Operation aus, welche die Disparitäten zwischen (A) und (Z) verringert. Dabei ist
es möglich, dass man zur Unterschiedsreduktion den Zustand (A) in einen Zustand
(A’) überführt, der (Z) ähnlicher ist als (A) (! Vorwärtsarbeiten); ebenso kann man
aber (Z) in einen Zustand (Z’) transformieren, welcher (A) ähnlicher ist als (Z) (!
Rückwärtsarbeiten).
Synthese ohne vorhergehende Analyse scheint schwierig, vergleichbar etwa dem
Vorhaben, aus einzelnen Bauteilen ein Modellflugzeug zusammenzusetzen, ohne
über einen Bauplan zu verfügen – diese Leistung kann allenfalls von erfahrenen
Modellbauern erbracht werden.
So überrascht es nicht, dass reines Vorwärtsarbeiten hauptsächlich von Exper-
ten eingesetzt wird, wenn sie die deep structures einer Problemstellung identifiziert
haben und ihr breiteres bereichsspezifisches Wissen einsetzen können, um von (A)
straight forward nach (Z) zu gelangen. Fehlt jedoch dieses Expertenwissen, gerät
der Problemlöseprozess beim Vorwärtsarbeiten leicht außer Kontrolle, wenn sich

21
Benannt nach dem hellenistischen Mathematiker D IOPHANT von Alexandria, der vermutlich
um 250 n. Chr. lebte und dessen „Arithmetica“ im 17. Jahrhundert P IERRE DE F ERMAT zu inter-
essanten zahlentheoretischen Studien anregte. Auf dem Rand seiner D IOPHANT -Ausgabe notierte
F ERMAT , dass er die Unlösbarkeit der Gleichung x n C y n D z n für n  3 im Bereich der natürli-
chen Zahlen beweisen könne, aber der Buchrand zu wenig Platz für diesen Beweis biete – der von
A NDREW W ILES 1995 in den Annals of Mathematics publizierte Beweis des Satzes von Fermat
füllte am Ende insgesamt 139 Buchseiten.
2.1 Heurismen der unvollendeten Induktion 169

der eingeschlagene Weg von (A) in Richtung auf (Z) zu sehr verzweigt und man
keinen Hinweis darauf hat, welchem Pfad man folgen soll; in diesem Zusammen-
hang stellte P ÓLYA fest:

Beim Vorwärtsarbeiten müssen wir (. . . ) darauf gefaßt sein, daß wir einen großen Teil der
Zeit mit unschlüssigem Schwanken zubringen angesichts verschiedener Aufgaben, die wir
in Angriff nehmen könnten, oder mit der Bearbeitung von Aufgaben, die uns, selbst wenn
gelöst, nichts helfen.

Eine auf den ersten Blick gute Idee, der Verzweigungsproblematik des „For-
ward Chaining“ Herr zu werden, ist eine unter dem Namen Hill Climbing bekannte
Variante des Vorwärtsarbeitens. Diese lässt sich am besten durch eine geringfügi-
ge Adaption der Reisemetapher des Problemlöseprozesses (Weg von (A) nach (Z)
finden) erklären.
Man stelle sich dazu vor, der Anfangszustand (A) eines Problems befinde sich
am Fuß eines Berges, auf dessen Gipfel der Zielzustand (Z) angesiedelt sei. Wenn
nun keine Aufstiegsroute vorgezeichnet ist, der man folgen kann, so könnte man
offenbar die Strategie verfolgen, seinen Weg so zu wählen, dass er ständig bergauf
verläuft; sobald man bemerkt, dass es bergab geht, drehe man um und korrigiere
seine Richtung.
Übertragen auf den Problemlöseprozess bedeutet dies, dass man ausschließlich
zu solchen Teilzielen voranzuschreiten versucht, die dem angestrebten Zielzustand
„näher“ sind. So weit, so gut: Die Qualität eines Computerschach-Programms lässt
sich unter anderem daran festmachen, dass völlig unsinnige Züge nicht in Erwägung
gezogen werden. Allerdings kann es manchmal von großem Nutzen sein, einen
Figurenverlust (! in vielen Fällen Vergrößerung der Distanz zum Ziel „Spielge-
winn“) in Kauf zu nehmen, aber dadurch seine Position entscheidend zu verbessern!
In der Metapher des Bergsteigens: Durch ein paar Schritte bergab lässt sich gege-
benenfalls ein besserer Weg zum Gipfel finden.

Abb. 2.5 Scheitern der Hill


Climbing-Strategie

In der Regel fällt es jedoch dem menschlichen Denken schwer, beim Problem-
lösen Maßnahmen in Betracht zu ziehen, die den Abstand zum Ziel vergrößern;
bisweilen ist dies aber zwingend notwendig, um das Ziel überhaupt erreichen zu
können. In der Situation aus Abb. 2.5 würde man mit der Hill Climbing-Strategie
auf dem Nebengipfel hängen bleiben.
Zur Illustration des Hill Climbing an einem konkreten Beispiel möchte ich einen
Gegenstandsbereich wählen, der im Folgenden noch öfter aufgegriffen wird, um
170 2 Heurismen der Induktion

einzelne heuristische Strategien gegeneinander abzugrenzen. Es handelt sich um das


Problemfeld der kombinatorischen Optimierung mit dem Themenkreis der Lotto-
Designs, den ich ursprünglich für das Mathematische Kaleidoskop der Bergischen
Universität Wuppertal aufbereitet habe.

Beispiel 2.2 (Lotto-Designs I – Hill Climbing)


Gegeben sei eine n-Menge A und ein System S D fS1 ; : : : ; Sk g von m-Teilmengen
Si A („m-Blöcke“) der Menge A. Dann nennt man S ein .m; t/-Lotto-Design der
Länge k zu A, wenn jede m-elementige Teilmenge von A mit mindestens einem der
m-Blöcke S1 ; : : : ; Sk des Systems S mindestens t Elemente .t  m/ gemeinsam
hat.
Offenbar ist  durch S WD Pm .A/ für jedes t  m ein .m; t/-Lotto-Design der
Länge k D mn zu A gegeben, wenn Pm .A/ die Menge aller m-Teilmengen von
A bezeichnet. Eine interessante Optimierungsaufgabe besteht darin, .m; t/-Lotto-
Designs möglichst kleiner Länge zu konstruieren, insbesondere dann, wenn die
Parameter den einzelnen Versionen des Zahlenlottos angepasst sind, die weltweit
gespielt werden.
Beim deutschen „6 aus 49“ entspricht jede Tippreihe einem 6-Block aus
f1; : : : ; 49g. Viele Systemspieler wählen eine n-Teilmenge A  f1; : : : ; 49g
von Systemzahlen, aus denen sie ihre Tippreihen zusammenstellen; man ist
daran interessiert, ein System mit möglichst wenig Tippreihen von 6-Blöcken
aus A zu konstruieren, welches eine Gewinngarantie für mindestens „t Richti-
ge“ unter der Bedingung bietet, dass die gezogenen Lottozahlen sämtlich aus
A sind. In der oben eingeführten Terminologie: Man interessiert sich für mini-
male .6; t/-Lotto-Designs zu vorgegebenen n-Mengen A von Systemzahlen aus
f1; : : : ; 49g.
Da sich je zwei n-Mengen bijektiv aufeinander abbilden lassen, ist klar, dass
die minimale Länge eines .6; t/-Lotto-Designs für festes t  6 nur von jAj, nicht
aber von A  f1; : : : ; 49g abhängt; der Einfachheit halber werde also stets An WD
f1; : : : ; ng betrachtet. Man versuche, mittels Hill Climbing ein minimales .6; 5/-
Lotto-Design zu A9 D f1; : : : ; 9g zu konstruieren.
Ausgehend vom Anfangszustand (A) – dem schlechtesten aller möglichen .6; 5/-
Lottodesigns zu A9 , welches aus allen 96 D 84 sechselementigen Teilmengen von
A9 besteht – verbessern wir schrittweise die Länge des Designs dadurch, dass wir
überflüssige Blöcke aus dem Design entfernen. Dabei ist ein 6-Block B genau dann
überflüssig, wenn es einen 6-Block Si des Lotto-Designs gibt, für den jSi \ Bj  5
gilt; wir beschreiben diese Situation kurz mit der Feststellung, B werde von Si
repräsentiert.
Abb. 2.6 zeigt zunächst den Anfangszustand (A), also das .6; 5/-Lotto-Design
zu A9 der Länge 84; hierbei sind die einzelnen Blöcke lexikographisch geordnet.
2.1 Heurismen der unvollendeten Induktion 171

Abb. 2.6 Ausgangs-Lottodesign mit Markierung der durch S1 repräsentierten Blöcke

Im ersten Schritt wird dieses Lotto-Design dadurch verbessert, dass wir einen
beliebigen Block des Systems herausgreifen – hier: S1 D f1; 2; 3; 4; 5; 6g, dunkel-
blau markiert – und dann alle Blöcke aus dem 84er-Design entfernen, die durch S1
repräsentiert werden. Die von S1 repräsentierten Blöcke des Systems sind in Abb.
2.6 hellblau markiert; durch S1 und die Gesamtheit aller bisher nicht eingefärbten
Blöcke ist nun ein verbessertes .6; 5/-Lotto-Design zu A9 gegeben, das nur noch
aus 66 Blöcken besteht.
Dieses .6; 5/-Lotto-Design der Länge 66 zu A9 kann nun dadurch weiter verbes-
sert werden, dass man einen Block S2 ¤ S1 aus dem 66er-Design herausgreift und
alle 6-Teilmengen aus dem 66er-Design entfernt, die von S2 repräsentiert werden.
Konnte die Selektion von S1 aus Symmetriegründen noch beliebig erfolgen,22 um

22
Jede 6-Teilmenge B von A9 repräsentiert genau 6  3 C 1 D 19 Mengen aus P6 .A9 /.
172 2 Heurismen der Induktion

nach Streichung der von S1 repräsentierten 6-Blöcke des 84er-Designs zu einem


66er-Design zu gelangen, ist die Auswahl von S2 (und analog die Auswahl aller
folgenden Blöcke bei Iteration des Verfahrens) für die Qualität des bei wiederholter
Ausführung des Streichalgorithmus am Ende erzielten .6; 5/-Lotto-Designs zu A9
entscheidend! Zwar führt jede Selektion in jedem Schritt zu einer Reduktion der
Länge des Designs – der Weg führt in der Metapher des Hill Climbing nach oben –
aber in der Regel wird man auf einem Nebengipfel landen, wenn man nicht weitere
Überlegungen in die Auswahl des nächsten Blocks einfließen lässt.
Eine unreflektierte Selektionsstrategie könnte darin bestehen, in jedem Schritt
den ersten bisher nicht markierten Block der Liste zu wählen. In Abb. 2.7 ist das
Auswahlverfahren der „Selektion des ersten Blocks“ in seinem ersten Schritt reali-
siert.

Abb. 2.7 Selektion des ersten Blocks – Schritt 1

Nach Wahl von S2 D f1; 2; 3; 4; 7; 8g (orange dunkel) und Markierung der von
S2 repräsentierten Blöcke des 66er-Designs (orange hell) verbleibt mit S1 ; S2 und
der Gesamtheit aller bisher nicht eingefärbten Blöcke ein .6; 5/-Lotto-Design der
Länge 52 zu A9 .
2.1 Heurismen der unvollendeten Induktion 173

Das Endprodukt der iterativen Selektion des ersten Blocks ist in Abb. 2.8 zu
sehen: Wir haben ein .6; 5/-Lotto-Design S D fS1 ; : : : ; S9 g der Länge k D 9 zu
A9 konstruiert, dessen einzelne Blöcke durch
S1 D f1; 2; 3; 4; 5; 6g S2 D f1; 2; 3; 4; 7; 8g S3 D f1; 2; 3; 5; 7; 9g
S4 D f1; 2; 3; 6; 8; 9g S5 D f1; 2; 4; 5; 8; 9g S6 D f1; 2; 4; 6; 7; 9g
S7 D f1; 2; 5; 6; 7; 8g S8 D f2; 3; 4; 6; 8; 9g S9 D f3; 4; 5; 6; 7; 8g
gegeben sind.

Abb. 2.8 Endzustand nach iterativer Selektion des ersten Blocks

Mit 9 unreflektiert ausgewählten Tippreihen könnte man also sicherstellen, dass


man mindestens einen Gewinn in der Klasse „5 Richtige“ erzielt, wenn die gezo-
genen Lottozahlen sämtlich zur 9-elementigen Systemzahlenmenge gehören.
Optimal ist diese Lösung jedoch nicht; man hat beim Hill Climbing einen Neben-
gipfel erreicht. Hätte man nämlich eine Greedy-Strategie23 bei der Blockselektion

23
Das englische „greedy“ bedeutet „gierig“. Greedy-Strategien bestehen darin, sich in jedem
einzelnen Schritt stets für diejenige Möglichkeit zu entscheiden, die adhoc den größten Fortschritt
verspricht.
174 2 Heurismen der Induktion

verfolgt und jeweils einen solchen Block ausgewählt, der maximal viele bisher
unrepräsentierte 6-Teilmengen repräsentiert, so wäre man leicht zu einem .6; 5/-
Lotto-Design der Länge k D 8 zu A9 gelangt, nämlich zu S D fS1 ; : : : ; S8 g mit

S1 D f1; 2; 3; 4; 5; 6g I S2 D f4; 5; 6; 7; 8; 9g I
S3 D f1; 2; 3; 7; 8; 9g I S4 D f2; 3; 5; 6; 8; 9g I
S5 D f1; 2; 4; 6; 7; 8g I S6 D f2; 3; 4; 5; 7; 9g I
S7 D f1; 3; 5; 6; 7; 9g I S8 D f1; 3; 4; 5; 8; 9g : 

Experten der KI stehen dem Hill Climbing kritisch gegenüber; RUSSEL und
N ORVIG beschreiben die Vorgehensweise plakativ mit: „Like climbing Everest in
thick fog with amnesia“. Das Hängenbleiben auf lokalen Maxima oder ebenen
Plateaus wird in der KI mit verfeinerten Suchalgorithmen wie dem Simulated An-
nealing („Simuliertes Ausglühen“) vermieden, bei dem man zeitweise auch Opera-
tionen erlaubt, die die Distanz zwischen (A) und (Z) vergrößern. Dabei werden die
Zeitpunkte, zu denen distanzvergrößernde Schritte erlaubt sind, zufällig ausgewählt.
Die Wahrscheinlichkeit für die Erlaubnis eines Abwärtsschrittes ist zu Beginn der
Suche relativ groß, wird aber im Lauf der Suche verringert, ebenso wie das erlaubte
Maß der Distanzvergrößerung.
Der humanoide Problemlöser sollte sich einfach der Tatsache bewusst sein, dass
die vom Extremalprinzip nahegelegte Anwendung derjenigen Operation, die die
Diskrepanz zwischen (A) und (Z) maximal verringert, nicht immer vorteilhaft ist.
Die Verzweigungsproblematik des Vorwärtsarbeitens ist aber nicht nur eine
Schwäche, sondern zugleich auch eine Chance des Vorgehens: Systematisches
Voranschreiten von (A) in verschiedene Richtungen erhöht die Anzahl angespro-
chener Bereichsbezüge, und der Problemlöser kann hoffen, Anknüpfungspunkte
mit dem bereichsspezifischen Wissen seiner epistemischen Struktur finden und
diese zu einem Lösungsplan vervollständigen zu können. Wie oben erwähnt, steigt
die Wahrscheinlichkeit dafür mit dem Grad des Expertentums in der Person des
Problemlösers.

2.1.3 Lokale und globale Approximation

Nach P ETER B ENDER und A LFRED S CHREIBER lassen sich „alle nur erdenklichen
Prozeduren der Annäherung“ mit dem Begriff der Exhaustion beschreiben, wenn
man Exhaustionsformen in die vier Typen

 Reelle Exhaustion von Ideen


 Reelle Exhaustion realer Objekte
 Ideelle Exhaustion von Ideen
 Ideelle Exhaustion realer Objekte

einteilt; den in der Mathematik verwendeten Verfahren der Approximation ent-


spricht in dieser Typisierung die ideelle Exhaustion von Ideen. Da wir uns in diesem
Buch auf Annäherungsprozesse zwischen mathematischen Objekten wie Zahlen,
2.1 Heurismen der unvollendeten Induktion 175

Figuren, Flächen und Funktionen beschränken, die sich komplett auf ideellem Ni-
veau abspielen, bietet es sich an, hier generell von Approximation zu sprechen und
den Begriff der Exhaustion für eine besondere Form der geometrischen Approxima-
tion zu reservieren.
In der Rolle der Annäherung von Zahlen begegnet uns die Approximation be-
reits beim überschlägigen Rechnen in der Grundschule. Im Rahmen des deutschen
Normalverfahrens der schriftlichen Division ist das überschlägige Dividieren der
wichtigste (und für die Grundschüler schwierigste) Verfahrensschritt, denn die da-
mit verbundene approximative Faktorisierung des jeweiligen Teildividenden lässt
ziffernweise den gesuchten Quotienten der Divisionsaufgabe entstehen. Weiterhin
ist das Überschlagsrechnen in der Arithmetik in der Funktion der Lösungskontrolle
zu sehen, und beim Sachrechnen wirkt es unreflektierten und voreiligen „Lösungen“
entgegen, indem es die Aufmerksamkeit auf Größenordnungen der verarbeiteten
Zahlen lenkt.
Als universelle Idee (Leitidee) finden wir den Gedanken der Approximation in
der Analysis wieder, zu deren wesentlichsten Aufgaben das Studium von Grenz-
prozessen gehört. Hier geht es darum, komplizierte mathematische Objekte (Funk-
tionen, Maße, Größen usw.) durch einfachere oder leichter zugängliche Objekte
anzunähern und die Näherungsfehler zu kontrollieren. Man hofft dabei, dass die
angenehmeren Eigenschaften der approximierenden Objekte an die approximierten
Objekte vererbt werden und dass parallel ablaufende infinitesimale Prozesse ver-
tauschbar sind.
Genau diese Hoffnung rückt die Idee der Approximation in den Bereich einer
wirklichen Heuristik – ob die Hoffnung erfüllt werden kann, hängt entscheidend
von der Qualität der Approximation ab, die sich in unterschiedlichen Konvergenz-
begriffen manifestiert; im Zusammenhang mit Funktionenfolgen muss z. B. zwi-
schen punktweiser Konvergenz, lokal-gleichmäßiger Konvergenz und gleichmäßi-
ger Konvergenz unterschieden werden, womit längst nicht alle Formen der Kon-
vergenz von Funktionenfolgen aufgezählt sind. Es ist also wesentlich, den Begriff
„Güte der Approximation“ als Fundament aller Approximationsmethoden heraus-
zuarbeiten. Zusammengefasst:

Heurismus der Approximation


Die Approximation schlecht zugänglicher oder komplizierter mathematischer
Objekte durch besser verstandene, einfachere und leichter zugängliche ma-
thematische Objekte kann als heuristische Handlung verstanden werden,
insofern als man die Hoffnung haben kann, dass sich diverse angenehme
Eigenschaften der approximierenden auf die approximierten Objekte über-
tragen.
Fester Bestandteil der Approximation sollte die Kontrolle der Annähe-
rungsprozesse sein, und zwar im Hinblick auf die Beurteilung der Qualität
der Approximation sowie die Prüfung der Frage, ob dabei die Reihenfol-
ge kombiniert verlaufender infinitesimaler Prozesse von Bedeutung ist oder
nicht.
176 2 Heurismen der Induktion

Die verschiedenen Aspekte der Approximation (lokale Approximation und glo-


bale Approximation) in der Analysis sollen nun an einigen Beispielen illustriert
werden; das erste Beispiel geht auf OTTO T OEPLITZ zurück, einen derjenigen
großen Mathematiker, die besonders leidenschaftliche Lehrer waren. Bereits in
den 1920er Jahren hielt T OEPLITZ an der Universität zu Kiel ein Mathematik-
Didaktik-Kolloquium für angehende Lehrer ab; er propagierte eine Lehrmethode,
die den Gang der Entdeckung mathematischer Phänomene zeitlich-sukzessiv nach-
vollziehen sollte. Heute ist dieser Ansatz als das Konzept des genetischen Lernens
bekannt; T OEPLITZ verwirklichte seine Vorstellungen in einem Buch über die Ent-
wicklung der Infinitesimalrechnung, dem das folgende Beispiel nachempfunden
ist.

Beispiel 2.3 (Stetige Verzinsung – B ERNOULLIs Traum vom Reichtum)


Da das schweizer Bankenwesen eine gewisse Tradition hat, ist es vielleicht nicht
überraschend, dass gerade ein schweizer Mathematiker sinngemäß die folgende
Frage stellte:
Kann man durch sukzessive Verkürzung des Zeitraums, nach dessen Verstrei-
chen einem Sparguthaben Zinsen zugeschlagen werden müssen, aufgrund des
Zinseszins-Effektes darauf hoffen, beliebig große Reichtümer zu erwerben?
Mit dieser Problematik beschäftigte sich 1690 der in Basel geborene und gestor-
bene JAKOB B ERNOULLI (1654–1705) in seinem Aufsatz „Quaeritur, si creditor
aliquis pecuniam suam foenori exponat, ea lege, ut singulis momentis pars propor-
tionalis usurae annuae sorti annumeretur; quantum ipsi finito anno debeatur?“
Machen wir uns zunächst klar, welcher Effekt hier gemeint ist. Üblicherweise
erfolgt die Zinsgutschrift für Sparguthaben jährlich am letzten Tag eines Kalender-
jahres. Ist p % der vereinbarte Jahreszinssatz, so wird aus einem Startkapital K0 ,
welches am 1. Januar eines Jahres auf einem Sparbuch lag, zum 1. Januar des Fol-
gejahres nach Zinsgutschrift ein Kapital
p
K1 .p/ D K0  1 C :
100
Würde man nun statt einer jährlichen Verzinsung mit p % eine halbjährliche Ver-
zinsung zu einem Zinssatz von p2 % vereinbaren, so hätte man am 1. Januar des
Folgejahres mehr Geld auf dem Konto, nämlich
p p
.2/ p
K1 D K0  1 C  1C
2 2  100 2  100
p 2
D K0  1 C
2  100
p
> K0  1 C 2  D K1 .p/ ;
2  100
wobei die unter dem Namen B ERNOULLI-Ungleichung24 bekannte Tatsache
.1 C x/n > 1 C nx für alle n 2 N und jedes x > 0
zur Abschätzung verwendet wurde.

24
Diese Ungleichung geht auf ein anderes Mitglied der schweizer Mathematiker-Dynastie, näm-
lich auf Jakobs jüngeren Bruder J OHANN B ERNOULLI (1667–1748) zurück.
2.1 Heurismen der unvollendeten Induktion 177

Ausschlaggebend für den höheren Kapitalzuwachs bei halbjährlicher Verzinsung


ist, dass im zweiten Halbjahr neben K0 zusätzlich die für K0 gutgeschriebenen
Halbjahreszinsen verzinst werden; daher ist der induktive Schluss vom betrachteten
.n/
Spezialfall auf den allgemeinen Fall plausibel, dass das Guthaben K1 . pn /, welches
bei n gleichmäßig über das Jahr verteilten Zinszahlungen mit einem Zinssatz von
p
n % am 1. Januar des Folgejahres besteht, mit n (streng) monoton wächst.
B ERNOULLI interessierte sich nun für die Frage, wie sich das Guthaben entwi-
ckeln würde, wenn die Zinsgutschriften „in den einzelnen Augenblicken“ (singulis
momentis) erfolgten – neuzeitlich formuliert: wie sich das Guthaben bei stetiger
Verzinsung vermehren würde. Wüchse dann das Guthaben über alle Grenzen?
Legen wir der Einfachheit halber einen Jahreszinssatz von p % D 100 % zu
Grunde, so ist  
1 n
.n/ p
K1 D K0  1 C ;
n n
und die Hoffnung auf unbeschränkte Geldvermehrung ist in dem Moment aufzu-
geben, wo erkannt wird, dass die Folge .sn /n2N mit sn WD .1 C n1 /n nach oben
beschränkt ist.
Hier erfolgt eine erste und relativ grobe Approximation: Wir können uns davon
überzeugen, dass alle Glieder der Folge .sn /n2N im Intervall Œ0; 3 liegen. Zu diesem
Zweck verwenden wir das Instrument der Abschätzung, welches über den Aspekt
der Güte einer Approximation untrennbar mit dem Approximationsgedanken ver-
knüpft ist und folglich eines der wichtigsten Werkzeuge in der Analysis darstellt.
Für n 2 N gilt
 
1 n
0 < sn D 1 C
n
!
Xn
n 1
D (Binomischer Lehrsatz)
k nk
kD0
X
n      
1 1 2 k1
D1C 1  1  1
kŠ n n n
kD1
X
n
1
1C

kD1

Xn1
1
1C (wegen kŠ  2k1 für alle k 2 N)
2k
kD0
 n
1  12
D1C (Summenformel für die geometrische Reihe)
1  12
1
 1C 1 D 3:
2
178 2 Heurismen der Induktion

Das (streng) monotone Wachstum der Folge .sn /n2N wurde oben bereits durch den
Zinseszinseffekt plausibel gemacht, es lässt sich aber leicht auch theoretisch absi-
chern, denn für n > 1 ist
 nC1 n  
sn 1 n n
D  n1 D 1  2
n

sn1 n n n1
 n1 
1 n
> 1n 2  (Bernoulli-Ungleichung)
n n1
D 1:
Da nun offenbar die Zahlen sn mit wachsendem n beständig größer werden, aber
nicht über den Wert 3 hinaus kommen können, ist es klar, dass der magischen Geld-
vermehrung durch Verkürzung der Zinszahlungszeiträume eine „Grenze“ gesetzt
ist, und es ist plausibel, dass man sich dieser „Grenze“ immer besser annähert,
wenn man sn für immer größere n berechnet.
Dies ist ein typisches Beispiel für die Bedeutung von Folgen und Grenzwer-
ten im Prozess der schrittweisen Annäherung an eine schwer zugängliche Größe.
Im Zeitalter B ERNOULLIs waren die Konzepte von Konvergenz und Grenzwert
einer Zahlenfolge noch wenig präzisiert; erst im 19. Jahrhundert begann die
exakte Grundlegung der Analysis mit der Präzisierung des Grenzwertbegriffs
durch AUGUSTIN -L OUIS C AUCHY (1789–1857) und durch K ARL W EIERSTRASS
(1815–1897). Die intuitiv einsichtige Vorstellung, dass eine monoton wachsende,
nach oben beschränkte Folge .an /n2N reeller Zahlen einen Grenzwert hat (und dass
dieser die kleinste obere Schranke (das Supremum) der Menge aller Folgenglieder
ist), ist derart plausibel, dass man sogar bereit sein könnte, diesen Umstand im
Rahmen einer axiomatischen Kennzeichnung der reellen Zahlen als Axiom auf-
zunehmen („Monotonieaxiom“), welches die Vollständigkeit und gleichzeitig die
Archimedizität von R beschreibt.25
Der Grenzwert der Folge .sn /n2N wird in Anlehnung an eine Abhandlung von
L EONHARD E ULER aus dem Jahr 1743 als die E ULERsche Zahl e bezeichnet.
Durch Systematisches Probieren (Berechnung von immer mehr Folgengliedern –
„Aufzählaspekt“ von Zahlenfolgen) kann man zu der Überzeugung kommen, dass
e  2;7180 eine Näherung von e mit drei gültigen Nachkommaziffern sein sollte,
weil sich bei sukzessiver Vergrößerung von n für n > 5000 in den Werten von sn
nur noch Veränderungen in der Größenordnung < 103 zu ergeben scheinen. Aber
Vorsicht! Ebenso hätte man in der Nähe von n D 1500 auf die Idee kommen kön-

25
In jedem angeordneten Körper .K; C; ; / sind das Supremumsaxiom („Jede nicht-leere, nach
oben beschränkte Teilmenge von K besitzt ein Supremum in K“) und das Monotonieaxiom („Jede
nach oben beschränkte, monoton wachsende Folge von Elementen aus K hat in K einen Grenz-
wert“) äquivalent. Beide beschreiben sowohl die Vollständigkeit von K als auch die Archimedizität
von K, welche sich getrennt durch das Intervallschachtelungsaxiom („Jede Intervallschachtelung
in K besitzt einen Kern in K“) und das Archimedische Axiom („Für alle a; b 2 K mit 0K < a < b
gibt es ein n 2 N mit na > b“) charakterisieren ließen. Umgekehrt kann man unter dem Postulat
der Axiomengruppe „Intervallschachtelungsaxiom und Archimedisches Axiom“ auf die Gültigkeit
von Monotonieaxiom und Supremumsaxiom schließen.
2.1 Heurismen der unvollendeten Induktion 179

nen, die Tausendstel-Ziffer 7 für eine gültige Ziffer zu halten, denn bei sukzessiver
Vergrößerung von n tat sich nicht mehr viel im Bereich der vierten Nachkomma-
stelle. Dennoch erreicht man nahe n D 5000 in sn die Tausendstel-Ziffer 8, und
woher soll man wissen, ob nicht vielleicht doch für hinreichend große n jeweils
sn > 2;719 gilt?
Erkenntnisse über die Güte der Approximation werden möglich, wenn man den
gesuchten Grenzwert von zwei Seiten approximiert, wenn man also eine Inter-
vallschachtelung durchführt. Neben der (streng) monoton wachsend gegen e kon-
vergenten Folge .sn /n2N betrachten wir zusätzlich die Folge .tn /n2N mit tn WD
.1 C n1 /  sn für alle n 2 N. Dann gilt:

(1) Für alle n 2 N ist  


1
tn D 1 C  sn > sn :
n
(2) Die Folge .tn /n2N ist (streng) monoton fallend, denn für n  2 ist
n
tn1 sn1
D n1
nC1

tn n
sn
 
nn n1 1 n
D  1 2
.n  1/.n C 1/ n n
  n
1 1
D 1 1C 2
nC1 n 1
 
1 n
> 1 1C 2 (Bernoulli-Ungleichung)
nC1 n 1
n 1 n
D1C 2  
n  1 n C 1 .n C 1/.n2  1/
1
D1C > 1:
.n C 1/.n2  1/
(3) Die Folge .tn  sn /n2N ist eine Nullfolge, denn
1 1 n!1
jtn  sn j D  sn <  3 ! 0:
n n
Damit definiert die Intervallfolge .Œsn ; tn /n2N eine Intervallschachtelung, de-
ren Kern der gemeinsame Grenzwert der Folgen .sn /n2N und .tn /n2N ist – nach
Definition handelt es sich um die E ULERsche Zahl e. Weil der Kern einer In-
tervallschachtelung in allen Intervallen der Schachtelung liegt, erhalten wir die
Fehlerabschätzung
3
je  sn j  jtn  sn j < ;
n
4
sodass sich s5000 von e um weniger als 6  10 unterscheidet. Damit steht fest, dass
e  2;7180 eine Approximation der E ULERschen Zahl mit drei gültigen Ziffern
nach dem Komma ist. 
180 2 Heurismen der Induktion

Die oben dokumentierte Annäherung an die E ULERsche Zahl wäre ein Bei-
spiel für lokale Approximation; es erfolgte eine Annäherung an einen einzigen
Punkt. Im Falle der Annäherung an kompliziertere, aus mehreren Elementen zu-
sammengesetzte mathematische Objekte muss man im Blick haben, dass diverse
lokale Approximationsprozesse gleichzeitig ablaufen müssen, was auch mit unter-
schiedlichen Geschwindigkeiten passieren darf. In dieser Situation spricht man von
globaler Approximation. Es scheint also passend, die Ausschöpfung krummlinig
begrenzter Flächen durch Polygonflächen, die auf E UDOXOS von Knidos (408–
355 v. Chr.) zurückgeht und den griechischen Mathematikern fortan als Substi-
tut für unsere Integralrechnung zur Verfügung stand, als einen Prozess der globa-
len Approximation anzusehen, auch wenn dieser mit der Zielsetzung erfolgt, ein
einziges Objekt, nämlich eine Zahl (ein Flächeninhaltsmaß oder eine Kurvenlän-
ge) anzunähern. Dieses für die Antike typische Verfahren geometrischer Appro-
ximation ist unter dem Namen „Exhaustionsmethode“ bekannt; die Bezeichnung
wurde im Jahre 1647 von G RÉGOIRE DE S AINT-V INCENT (1584–1667) einge-
führt.
In der Exhaustionsmethode kann sowohl eine der ältesten bekannten heuristi-
schen Strategien als auch eine der ersten präzisen Beweistechniken gesehen werden,
wobei die mathematisch strenge Verwendung der Methode mit dem Namen A R -
CHIMEDES von Syrakus (287–212 v. Chr.) assoziiert wird. In der Einleitung seines
Buches über die Quadratur der Parabel26 schreibt A RCHIMEDES, wie man bei H I -
SCHER und S CHEID27 nachlesen kann:

(. . . ) und zwar habe ich die Lösung des Problems zuerst durch Methoden der Mechanik
gefunden, alsdann durch Methoden der reinen Geometrie. Von den Forschern, die sich
früher mit Geometrie beschäftigten, versuchten einige zu zeigen, daß es möglich sei, ei-
ne geradlinig begrenzte Figur zu konstruieren, die einem gegebenen Kreise oder einem
gegebenen Kreiselement flächengleich ist. Alsdann versuchten sie das gleiche zu zeigen für
ein Ellipsensegment (. . . ) Daß aber je ein Mathematiker versucht hätte, die Fläche eines
Parabelsegments zu quadrieren, wie es mir gelungen ist, ist mir nicht bekannt. Ich zeige
nämlich, daß der Inhalt jedes Parabelsegments um ein Drittel größer ist als das Dreieck,
das mit ihm gleiche Grundlinie und Höhe hat. Dabei bediene ich mich folgenden Hilfssat-
zes zum Beweise: Es ist möglich, ein Vielfaches der Differenz zweier gegebener Größen zu
finden, das größer ist als eine beliebige gegebene Fläche. Die früheren Geometer haben
sich auch dieses Hilfssatzes bedient; denn daß der Inhalt der Kreisfläche dem Quadrat des
Radius proportional ist (. . . ) haben sie unter Benutzung dieses Hilfssatzes bewiesen.

Der von A RCHIMEDES erwähnte Hilfssatz ist nichts anderes als das Archime-
dische Axiom, welches allerdings schon im 4. Jahrhundert v. Chr. bei der axio-
matischen Grundlegung des „Größenbegriffs“ verwendet wurde, womit sich die
griechischen Mathematiker dieser Epoche in heutiger Terminologie den archime-
disch angeordneten Halbkörper der positiven reellen Zahlen als Arbeitsbereich ver-

26
In der Antike war man bemüht, krummlinig begrenzte Flächen mit Zirkel und Lineal in flächen-
inhaltsgleiche Quadrate zu verwandeln; daher hat sich damals für Flächeninhaltsbestimmungen
der Name „Quadratur“ durchgesetzt.
27
H ISCHER / S CHEID: Grundbegriffe der Analysis: Genese und Beispiele aus didaktischer Sicht.
Spektrum Akademischer Verlag, Heidelberg (1995).
2.1 Heurismen der unvollendeten Induktion 181

schafft haben. Auf welche Weise A RCHIMEDES unter Rückgriff auf dieses Axiom
bei seiner exakten Parabelquadratur ohne Grenzwertbegriff (!) auskommen konnte,
werden wir im folgenden Beispiel klären.

Beispiel 2.4 (Quadratur der Parabel nach A RCHIMEDES)


Wie aus obigem Zitat ersichtlich ist, hat A RCHIMEDES folgenden Satz bewiesen:
Der Flächeninhalt eines Parabelsegments verhält sich zum Flächeninhalt eines
Dreiecks mit gleicher Grundlinie und Höhe wie 4 W 3.
Wir diskutieren die wesentlichen Stationen seiner Argumentation und beginnen
mit der Bereitstellung der nötigen Begriffe und der Veranschaulichung des behaup-
teten Sachverhalts.
Eine Parabelsehne AB und der zugehörige Parabelbogen über AB bilden ein
Parabelsegment; im Zusammenhang mit AB spricht A RCHIMEDES von der Grund-
linie des Parabelsegments. Sind nun g und h Parallelen zur Parabelachse durch die
Punkte A und B, so halbiert die Mittelparallele von g und h die Parabelsehne AB
und schneidet die Parabel in einem Punkt C , in dem die Parabeltangente parallel zu
AB ist (Abb. 2.9).

Abb. 2.9 Parabelsegment


über AB mit Scheitel C

1.0

Man nennt C den Scheitel des Parabelsegments und seinen Normalabstand von
AB die Höhe des Parabelsegments; dieser Normalabstand von C zu AB ist gleich-
zeitig die Höhe des Dreiecks ABC .
In dieser Situation behaupteteA RCHIMEDES, den folgenden Flächeninhaltsver-
gleich anstellen zu können:
Ist A1 WD .ABC / der Flächeninhalt des Dreiecks ABC und ist S das
Flächenmaß des Parabelsegments über der Sehne AB, so gilt

4
SD A1 :
3
Zum Nachweis dieses Zusammenhangs zeichnete A RCHIMEDES in die beiden Pa-
rabelsegmente über den Parabelsehnen BC und AC nun erneut Dreiecke CBP
bzw. ACQ ein, deren Grundlinie und Höhe jeweils mit Grundlinie und Höhe der
zugehörigen Parabelsegmente übereinstimmten (Abb. 2.10).
182 2 Heurismen der Induktion

Abb. 2.10 Ausschöpfung


des Parabelsegments durch
Polygonflächen, 1. Schritt

1.0

Unter Rückgriff auf die damals bekannten geometrischen Eigenschaften von


Parabeln konnte A RCHIMEDES nun zeigen, dass für den gesamten Flächeninhalt
A2 WD .CBP / C .ACQ/ der neu hinzugekommenen Dreiecke
1
. / A2 D A1
4
gilt – dies ist der Schlüssel zum induktiven Schluss auf die Formel S D 43 A1 .
Man entnimmt zunächst der Zeichnung, dass das Maß S2 WD A1 C A2 der Po-
lygonfläche ABP CQ eine bessere Näherung von S ist als S1 WD A1 , denn die den
kürzeren Seiten des Dreiecks ABC aufgesetzten Dreiecke CBP und ACQ
vermindern den „Flächenüberschuss“ S  S1 des Parabelsegments gegenüber dem
Inhalt des ersten Näherungspolygons ABC .
Die Näherung kann jetzt schrittweise weiter dadurch verbessert werden, dass
man in die Parabelsegmente über den kürzeren Seiten der im .n  1/-ten Schritt
eingezeichneten Dreiecke wieder kleinere Dreiecke gleicher Grundlinie und Höhe
wie die zugehörigen Parabelsegmente einzeichnet (n-ter Schritt) und so sukzessive
das Parabelsegment durch immer besser angepasste Polygonflächen ausschöpft. Ist
An der Gesamtinhalt der im n-ten Schritt hinzugekommenen Dreiecksflächen, so
gilt wegen . / wieder An D 14 An1 , was sich rekursiv zu
 n1
1
An D A1 für alle n2N
4
umformen lässt.
Damit ergibt sich für den Flächeninhalt Sn des nach dem n-ten Schritt vorliegen-
den Näherungspolygons:
n1  k
X 1
Sn D A1 C A2 C    C An D A1  :
4
kD0

Aus heutiger Sicht wäre damit der Beweis der Formel erbracht, denn man könnte
über den Grenzwert der geometrischen Reihe argumentieren:
1  k
X 1 1 4
S D lim Sn D A1  D A1  D A1 :
n!1
kD0
4 1 1
4
3
2.1 Heurismen der unvollendeten Induktion 183

A RCHIMEDES stand allerdings kein Konzept zur Analyse des infiniten Prozesses
zur Verfügung; er gelangte durch das Studium endlicher geometrischer Reihen zu
der Vermutung S D 43 A1 , und zwar wie folgt:
Aus An D 14 An1 erhält man

1 4 4 1 1
An C An D An D  An1 D An1 ;
3 3 3 4 3
daher ist
1 1
. / Sn C An D Sn1 C An C An
3 3
1
D Sn1 C An1 D : : :
3
1 4
D S1 C A1 D A1 :
3 3

Die der Anschauung zu entnehmende Einsicht, dass die Folge .Sn /n2N den gesuch-
ten Flächeninhalt S des Parabelsegments beliebig gut approximiert, wobei sich die
beim n-ten Schritt neu hinzukommenden Flächeninhalte An dem Maß 0 nähern,
macht den Zusammenhang S D 43 A1 plausibel, beweist ihn aber noch nicht. Den
endgültigen Beweis seiner heuristisch-induktiv gewonnenen Flächenformel führ-
te A RCHIMEDES apagogisch (doppelte Exklusion), indem er die Annahmen (1)
S < 43 A1 und (2) S > 43 A1 unter Rückgriff auf das Archimedische Axiom zum
Widerspruch führte.

Annahme (1): S < 43 A1 .


Dann ist " WD 43 A1  S > 0, und nach dem Archimedischen Axiom existiert ein
n 2 N mit 4n1 " > n" > A1 . Für dieses n ist einerseits

4 1
A1  S D " > n1 A1 D An ;
3 4

andererseits gilt gemäß Formel . /

4 1
A1  Sn D An < An ;
3 3
sodass man insgesamt auf die Beziehung

4 4
A1  Sn < A1  S
3 3
geführt wird, welche Sn > S zur Folge hat – dies ist nach Konstruktion von Sn aber
unmöglich.
184 2 Heurismen der Induktion

Annahme (2): S > 43 A1 .


Dann ist " WD S  43 A1 > 0, und nach dem Archimedischen Axiom existiert
ein n 2 N mit 2n " > S. Man beachte nun, dass das Flächenmaß ˛ eines einem
Parabelsegment einbeschriebenen Dreiecks gleicher Grundlinie und gleicher Höhe
exakt die Hälfte des Flächeninhalts ˇ des dem Parabelsegment umbeschriebenen
Parallelogramms beträgt, welches von der Grundlinie und der dazu parallelen Pa-
rabeltangente sowie von den durch die Endpunkte der Parabelsehne verlaufenden
Parallelen zur Parabelachse begrenzt wird (Abb. 2.9). Da das Parallelogramm dem
Parabelsegment umbeschrieben ist, muss für den Flächeninhalt  des Parabelseg-
ments  < ˇ gelten, woraus

 ˇ 
< D˛ bzw.   ˛ <
2 2 2
folgt. Mit anderen Worten: Der nach dem .k  1/-ten Schritt vorliegende Flächen-
überschuss S  Sk1 wird im k-ten Schritt um mehr als die Hälfte reduziert, es ist
also  n1  n
1 1 1
S  Sn < .S  Sn1 / <    < .S  S1 / < S:
2 2 2
Nach Wahl von n ist 2n " > S bzw. . 12 /n  S < ", sodass sich insgesamt die
Ungleichung  n
1 4
S  Sn <  S < " D S  A1
2 3
ergibt. Dies ist nur für Sn > 43 A1 möglich, was aber im Widerspruch zu . / steht,
wonach Sn C 13 An D 43 A1 oder aber Sn D 43 A1  13 An < 43 A1 gilt.
Damit ist der Beweis der Flächeninhaltsformel für das Parabelsegment abge-
schlossen. 

Vielleicht noch eine Bemerkung zur Präzision des oben angegebenen Bewei-
ses. H ISCHER und S CHEID gehen davon aus, A RCHIMEDES habe die Existenz
eines n 2 N mit der Eigenschaft S  Sn < " der Anschauung entnommen. Der
Mathematikhistoriker H ANS -L UDWIG W USSING hielt es aber für denkbar, dass
A RCHIMEDES die folgende, in Buch X der Elemente des E UKLID notierte (und in
unserer Darstellung oben implizit hergeleitete) Folgerung aus dem Archimedischen
Axiom ohne weiteren Kommentar benutzt hat:

Nimmt man bei Vorliegen zweier ungleicher (gleichartiger) Größen von der größeren ein
Stück mehr als die Hälfte weg und vom Rest ein Stück größer als die Hälfte und wieder-
holt dies immer, dann muß einmal eine Größe übrig bleiben, die kleiner als die kleinere
Ausgangsgröße ist.

Vor diesem Hintergrund wäre die Stellungnahme von OTTO T OEPLITZ zur griechi-
schen Exhaustionsmethode, die er im Zusammenhang mit einem ähnlich geführten
Beweis des Satzes, dass sich die Flächenmaße zweier Kreise zueinander verhalten
wie die Quadrate der Kreisdurchmesser, abgegeben hat, besser nachvollziehbar:
2.1 Heurismen der unvollendeten Induktion 185

Damit ist der indirekte Beweis logisch lückenlos erbracht. Alles Mysterium, das dem un-
endlichen Prozeß sonst anhaftet, ist auf das Stetigkeitsaxiom28 geschoben, mit dem man
sich ein für allemal abzufinden hat, anstatt bei jedem Beweise erneut Anleihe bei dunklen
Evidenzen zu machen. Das ist der Sinn des griechischen Exhaustionsverfahrens.

In einem anderen Bereich der Analysis kommt es regelmäßig zu Prozessen so-


wohl lokaler als auch globaler Approximation, und zwar immer dann, wenn es um
die Annäherung von Funktionen geht. Hier gibt es eine große Vielfalt möglicher
Näherungsprozesse, von denen die populärsten nachfolgend aufgelistet werden;
hierbei bezeichne stets I  R ein offenes Intervall.

 Eine stetige Funktion f W I ! R kann in der Nähe eines jeden Punktes x0 2


I durch die konstante Funktion gW x 7! f .x0 / approximiert werden (lokale
Approximation).
Das bedeutet: Zu jedem x0 2 I gibt es eine Funktion rW I ! R mit
limx!x0 r.x/ D 0 D r.x0 / derart, dass für alle x 2 I gilt:
f .x/ D f .x0 / C r.x/ :
 Eine differenzierbare Funktion f W I ! R kann in der Nähe eines jeden Punktes
x0 2 I durch die affin-lineare Funktion gW I ! R mit g.x/ D f .x0 / C
f 0 .x0 /.x  x0 / approximiert werden (lokale Approximation).
Das bedeutet: Zu jedem x0 2 I gibt es eine in x0 stetige Funktion rW I ! R
mit r.x0 / D 0 derart, dass für alle x 2 I gilt:
f .x/ D f .x0 / C f 0 .x0 /.x  x0 / C r.x/.x  x0 / :
 Eine C k -Funktion f W I ! R kann in der Nähe eines jeden Punktes x0 2 I
durch ein Polynom vom Grad d  k approximiert werden (lokale Approximati-
on).
Das bedeutet: Zu jedem x0 2 I gibt es eine in x0 stetige Funktion rW I ! R
mit r.x0 / D 0 derart, dass für alle x 2 I gilt:

X
k
f .j / .x0 /
f .x/ D .x  x0 /j C r.x/.x  x0 /k :
j D0

 Ist Œa; b  R ein kompaktes Intervall, so lässt sich jede stetige Funktion
f W Œa; b ! R auf Œa; b gleichmäßig durch Treppenfunktionen approximieren
(globale Approximation).
Genauer gilt: Zu jedem " > 0 gibt es Treppenfunktionen 'W Œa; b ! R und
W Œa; b ! R mit
'.x/  f .x/  .x/ und j .x/  '.x/j < " für alle x 2 Œa; b ;
woraus insbesondere jf .x/'.x/j < " und jf .x/ .x/j < " für alle x 2 Œa; b
folgt.

28
Damit meint T OEPLITZ das Archimedische Axiom.
186 2 Heurismen der Induktion

 Ist Œa; b  R ein kompaktes Intervall, so lässt sich jede stetige Funktion
f W Œa; b ! R auf Œa; b gleichmäßig durch Polynome approximieren (globale
Approximation).
Das bedeutet: Zu jedem " > 0 gibt es ein Polynom P mit

jf .x/  P .x/j < " für alle x 2 Œa; b :

An der letzten dieser Aussagen, welche auch unter dem Namen „W EIERSTRASS-
scher Approximationssatz“ bekannt ist, möchte ich noch einmal verdeutlichen, was
ich in der Charakterisierung des Heurismus der Approximation mit der Kontrolle
der Güte einer Approximation gemeint habe.
Die approximierenden Objekte sind hier Polynome, also C 1 -Funktionen; das
approximierte Objekt ist hier eine beliebige stetige Funktion. Da es stetige Funk-
tionen gibt, die nicht differenzierbar sind, ist die Approximation einer Funktion im
Sinne der gleichmäßigen Konvergenz offenbar nicht gut genug, um die über die
Stetigkeit hinausgehende Regularität der approximierenden Objekte an das appro-
ximierte Objekt zu vererben. Im Gegensatz dazu wird aber die Stetigkeit im Falle
(lokal-) gleichmäßiger Konvergenz auf die Grenzfunktion übertragen.
Im folgenden Beispiel werden wir uns insbesondere mit der Frage der Vertausch-
barkeit infinitesimaler Prozesse im Rahmen von Approximationsvorgängen befas-
sen.

Beispiel 2.5 (Das „momentane“ Verschwinden stetiger Funktionen)


Ist Œa; b  R ein kompaktes Intervall und f W Œa; b ! R eine stetige Funktion,
Rb
so kann man aus a f .x/ dx D 0 im Allgemeinen nicht darauf schließen, dass
f .x/ D 0 für alle x 2 Œa; b wäre, wie das Beispiel f .x/ D x  aCb
2
zeigt.
Wenn aber für alle k 2 N0 das k-te Moment von f identisch verschwindet, d. h.
wenn
Zb
f .x/x k dx D 0 für alle k 2 N0
a

gilt, dann folgt f 0 auf Œa; b.


Zum Beweis dieser Tatsache mittels globaler Approximation von Funktionen
mache man sich zunächst klar, dass unter den oben genannten Voraussetzun-
gen aufgrund der Linearität des Integrals für jedes Polynom P das Integral
Rb
a f .x/P .x/ dx verschwindet, denn es ist

Zb X
n X
n Zb
f .x/ ak x dx D
k
ak f .x/x k dx D 0 :
a kD0 kD0 a

Insbesondere gilt dies für solche Polynome P , mit denen man nach dem W EIER -
STRASSschen Approximationssatz die stetige Funktion f auf dem Intervall Œa; b
gleichmäßig approximieren kann. Das von f  P approximierte Objekt ist f 
2.1 Heurismen der unvollendeten Induktion 187

Rb
f D f 2 ; ließe sich also die „angenehme Eigenschaft“ a f .x/P .x/ dx D 0
der approximierenden Objekte an das approximierte Objekt vererben, dann wäre
Rb 2
a f .x/ dx D 0.
Gäbe es jetzt in dieser Situation ein x0 2 Œa; b mit f .x0 / ¤ 0, so wäre
f 2 .x0 / DW c > 0, und wir könnten die stetige Funktion f 2 nahe x0 durch die
konstante Funktion gW x 7! c approximieren. Dann fände man zu " WD c2 ein
ı > 0 derart, dass für alle x 2 Œa; b \ Œx0  ı; x0 C ı DW Œ˛; ˇ die Ungleichung
jf 2 .x/  cj < " erfüllt wäre, so dass insbesondere f 2 .x/  c2 für alle x 2 Œ˛; ˇ
gelten müsste. Aufgrund der Monotonie des Integrals und der Intervalladditivität
des Integrals wäre dann aber

Zb Z˛ Zˇ Zb
f .x/ dx D
2
f .x/ dx C
2
f .x/ dx C
2
f 2 .x/ dx
a a ˛ ˇ

Z˛ Zˇ Zb
c
 0 dx C dx C 0 dx
2
a ˛ ˇ
c
  .ˇ  ˛/ > 0
2
Rb
im Widerspruch zu a f 2 .x/ dx D 0.
Folglich ist die Behauptung f 0 auf Œa; b in dem Moment bewiesen, wo
Rb 2
a f .x/ dx D 0 gezeigt ist. In der Hoffnung Rb
auf eine zielführende Einsicht be-
Rb
trachte man die Qualität der Annäherung von a f 2 .x/ dx durch a f .x/P .x/ dx,
quantifiziert durch die Differenz der Integrale. Offenbar gilt

Zb Zb Zb
f 2 .x/ dx  f .x/P .x/ dx D f .x/ .f .x/  P .x// dx ;
a a a

Rb Rb
und man erkennt, dass wegen a f .x/P .x/ dx D 0 der Wert von a f 2 .x/ dx
Rb
durch den Wert von a f .x/.f .x/  P .x// dx bestimmt wird – dieser kann aber
durch geeignete Wahl des die Funktion f approximierenden Polynoms P kontrol-
liert werden. Präziser:
Ist " > 0 beliebig vorgegeben und M WD maxfjf .x/j j x 2 Œa; bg29 , so wähle
man gemäß dem W EIERSTRASSschen Approximationssatz ein Polynom P derart,
dass
1
M  jf .x/  P .x/j <  " für alle x 2 Œa; b
.b  a/ C 1

29
Die stetige Funktion jf j nimmt auf dem Kompaktum Œa; b ihr Maximum an.
188 2 Heurismen der Induktion

gilt. Dann ist

Zb Zb
0 f .x/ dx D
2
f .x/ .f .x/  P .x// dx
a a
Zb
 jf .x/j jf .x/  P .x/j dx
a
Zb
 M jf .x/  P .x/j dx
a
1
< .b  a/  " < ":
.b  a/ C 1
Rb
Da 0  a f 2 .x/ dx < " für jedes beliebige " > 0 gilt, ist zwangsläufig
Rb 2
a f .x/ dx D 0, was den Beweis der Behauptung abschließt.
Implizit ist in obiger Argumentation auch der Schlüssel30 zur Erkenntnis ent-
halten, dass bei gleichmäßiger Konvergenz stetiger Funktionenfolgen die infinitesi-
malen Prozesse der Integration und des Übergangs zur Grenzfunktion miteinander
vertauscht werden können: Ist .hn /n2N eine Folge auf Œa; b stetiger Funktionen,
welche auf Œa; b gleichmäßig gegen die (dann zwangsläufig stetige) Grenzfunktion
h konvergiert, so gilt bekanntlich

Zb Zb Zb
h.x/ dx D lim hn .x/ dx D lim hn .x/ dx :
n!1 n!1
a a a

Rb
Mit diesem Wissen lässt sich der Nachweis von a f 2 .x/ dx D 0 leichter führen:
Ist .Pn /n2N eine Folge von Polynomen, welche auf Œa; b gleichmäßig gegen
die stetige Funktion f konvergiert, so konvergiert die Funktionenfolge .f  Pn /n2N
stetiger Funktionen auf Œa; b gleichmäßig gegen die stetige Funktion f 2 , und man
erhält
Zb Zb
f .x/ dx D lim
2
f .x/Pn .x/ dx D lim 0 D 0 ;
n!1 n!1
a a

was zu beweisen war. 

Wir beschließen den Abschnitt über Näherungsprozesse mit einem Beispiel für
Erkenntnisgewinn in der Analysis durch lokale Approximation von Funktionen,

30
Zielführend ist in den meisten Grenzbetrachtungen für Integralfolgen im Kontext gleichmäßiger
Rb Rb
Konvergenz eine Standard-Abschätzung vom Typ j a h.x/ dxj  a jh.x/j dx  .ba/khkŒa;b ,
wobei khkŒa;b WD supfjh.x/j j x 2 Œa; bg die Supremumsnorm von h auf Œa; b bezeichnet.
2.1 Heurismen der unvollendeten Induktion 189

das durch seine enorme Tragweite beeindruckt – das als C AUCHYscher Integral-
satz bekannte Theorem beherrscht mit seinen Konsequenzen die gesamte klassische
Funktionentheorie. Der Satz besagt:31
Sei U  C offen, f eine auf U komplex differenzierbare Funktion und sei

R WD fz D x C iy j a  x  b ; c  y  d g  U

ein in U enthaltenes kompaktes Rechteck. Dann gilt für jeden geschlossenen Inte-
grationsweg32  in U , welcher den Rand @R von R parametrisiert:33
Z Z
f .z/ dz DW f .z/ dz D 0 :
 @R

Bekannt war dieser Sachverhalt schon C ARL F RIEDRICH G AUSS, wie aus dem
berühmten Brief von G AUSS an F RIEDRICH W ILHELM B ESSEL (1784–1846) vom
18. Dezember 1811 hervorgeht; allerdings hat G AUSS seine Kenntnisse nicht vor
1831 veröffentlicht, sodass der Satz zu Recht C AUCHYs Namen trägt.
In den im 19. Jahrhundert geführten Beweisen des C AUCHYschen Integralsatzes
wurden ausschließlich reelle Methoden verwendet, wie etwa die folgende:
Ist f WD u C iv mit u D Re f und v D Im f sowie z D x C Riy mit x D Re z
und y D Im z () dz D dx C idy), so zerfällt das Randintegral @R f .z/ dz über
den positiv orientierten Rand @R von R in die Summanden
Z Z Z
f .z/ dz D .u.z/dx  v.z/dy/ C i .v.z/dx C u.z/dy/ :
@R @R @R

Wenn nun f 0 stetig ist, dann kann man die beiden reellen Integrale auf der rechten
Seite mit dem Satz von Stokes34 bzw. dem schon im ersten Viertel des 19. Jahrhun-
derts unter dem Namen Satz von Green35 bekannten Spezialfall weiter umformen,

31
Es gibt viele verschiedene Versionen des C AUCHYschen Integralsatzes, die sich mehr in ih-
rem topologischen als in ihrem analytischen Inhalt unterscheiden. Die hier zitierte Form ist als
C AUCHYscher Integralsatz für Rechtecke bekannt und entspricht den topologischen Bedingungen
in der Originalarbeit von C AUCHY aus dem Jahr 1825.
32
Ein geschlossener Integrationsweg in G ist durch eine stückweise stetig differenzierbare Funk-
tion  W Œa; b ! G mit .a/ D .b/ gegeben, wobei Œa; b  R ein kompaktes Intervall ist.
Die Bildmenge Sp  WD .Œa; b/  G wird als die Spur von  bezeichnet; tritt eine Teilmen-
ge M  C als Spur eines Integrationsweges  auf, so sagt man,  parametrisiere M . Es ist in
der Funktionentheorie üblich, einen Weg und seine Spur mit demselben Symbol zu kennzeichnen,
wenn Missverständnisse ausgeschlossen sind.
33
Ist  W Œa; b ! C ein Integrationsweg und f eine auf Sp  stetige Funktion, so
R Rb 0
ist  f .z/ dz WD a f ..t //   .t / dt („Wegintegral von f längs  “).
34
Benannt nach G EORGE G ABRIEL S TOKES (1819–1903).
35
Benannt nach G EORGE G REEN (1793–1841).
190 2 Heurismen der Induktion

und man erhält:


Z Z  
@v @u
.u dx  v dy/ D  C dx dy ;
@x @y
@R R
Z Z  
@u @v
.v dx C u dy/ D  dx dy :
@x @y
@R R

Die Integranden beider Flächenintegrale sind jeweils identisch null, weil f komplex
differenzierbar ist, denn dann36 erfüllen u D Re f und v D Im f die C AUCHY-
R IEMANNschen Differenzialgleichungen

@u @v @u @v
D und D :
@x @y @y @x
R
Also gilt auch @R f .z/ dz D 0.
In der Tat musste in allen frühen Beweisen des C AUCHYschen Integralsatzes
die Voraussetzung der Stetigkeit von f 0 explizit (oder stillschweigend) verwendet
werden. Wie ärgerlich die Notwendigkeit dieser Zusatzannahme beim Aufbau der
Funktionentheorie ist, wird deutlich, wenn man eine der Konsequenzen des Theo-
rems betrachtet:

 Jede in U komplex differenzierbare Funktion f (mit stetiger Ableitung f 0 ) ist


in U beliebig oft komplex differenzierbar! 37

Warum sollte für f die stetige komplexe Differenzierbarkeit gefordert werden müs-
sen, wo sich doch dann für f .k/ mit k  2 die Stetigkeit von f .k/ automatisch aus
der komplexen Differenzierbarkeit von f .k/ ergibt?
Es dauerte aber bis zum Ende des 19. Jahrhunderts, bevor E DOUARD G OUR -
SAT (1858–1936) der erste Beweis des C AUCHYschen Integralsatzes für Rechtecke
ohne Stetigkeitsforderungen an f 0 gelang. Unter dem Gesichtspunkt „lokale Ap-
proximation“ soll G OURSATs eleganter Beweis nun vorgestellt werden.

Beispiel 2.6 (C AUCHYscher Integralsatz für Rechtecke nach G OURSAT)


Sei U  C offen, f eine auf U komplex differenzierbare Funktion und R WD fz D
x C iy j a  x  b; c  y  d g  U ein in U enthaltenes kompaktes Rechteck.
Dann gilt bei Integration von f über den einmal durchlaufenen Rechtecksrand @R:
Z
f .z/ dz D 0 :
@R

36
Genauer gilt sogar: f ist komplex differenzierbar genau dann, wenn f reell differenzierbar ist
und die C AUCHY-R IEMANN schen Differenzialgleichungen für f erfüllt sind.
37
Dies ergibt sich mithilfe der C AUCHYschen Integralformel, welche ihrerseits aus dem
C AUCHYschen Integralsatz folgt.
2.1 Heurismen der unvollendeten Induktion 191

G OURSATs Beweis verzichtet völlig auf reelle Methoden der Analysis und cha-
rakterisiert die komplexe Differenzierbarkeit einer Funktion über eine formal der
rellen Situation entsprechende Linearisierungsbedingung:
Die Funktion f W U ! C ist genau dann komplex differenzierbar, wenn es zu
jedem z0 2 U eine in z0 stetige Funktion rW U ! C mit r.z0 / D 0 gibt, sodass
für alle z 2 U gilt:

f .z/ D f .z0 / C f 0 .z0 /.z  z0 / C r.z/.z  z0 / :

Affin-lineare Funktionen z 7! az C b besitzen mit z 7! a2 z 2 C bz C c offen-


bar Stammfunktionen; folglich sind Integrale über affin-lineare Funktionen
R längs
geschlossener Integrationswege gleich null. Zum Nachweis von @R f .z/ dz D 0
würde es demnach genügen, für ein geeignetes z0 2 U die Funktion f durch die
affin-lineare Funktion z R7! f .z0 / C f 0 .z0 /.z  z0 / zu approximieren und zu
zeigen, dass das Integral @R r.z/.z  z0 / dz über den Fehler r.z/.z  z0 / dieser
Näherung verschwindet.
Aussicht auf Erfolg hat ein solcher Plan nur dann, wenn es gelingt, die Klein-
heit von jr.z/.z  z0 /j in der Nähe von z0 in die Argumentation einzubeziehen –
es bedarf einer Strategie, die es ermöglicht, durch lokale Abschätzungen globale
Kontrolle auszuüben!
Man sucht also nach der zur Exhaustionsmethode dualen Strategie: Diesmal geht
es nicht darum, ein Objekt durch globale Approximation immer besser anzunähern
und so in Richtung auf die globale Situation zu arbeiten, sondern darum, sich aus-
gehend von der globalen Situation (Integration über @R) zu einer lokalen Situation
vorzuarbeiten, die man kontrollieren kann.
Das von G OURSAT zur „Lokalisierung“ der Problemstellung verwendete In-
strument ist die Methode der Bisektion, die man in der eindimensionalen reellen
Analysis in Gestalt der fortgesetzten Intervallhalbierung antrifft. Dort entwickelt
sie ihre Kraft im Zusammenhang mit der durch das Intervallschachtelungsaxiom
axiomatisch beschriebenen Vollständigkeit der reellen Zahlen, wenn es etwa um
den Hauptsatz über monotone Folgen38 , den Satz vom Supremum39 , den Satz von

38
Jede monoton wachsende (fallende) und nach oben (nach unten) beschränkte Folge reeller Zah-
len ist in R konvergent.
39
Jede nach oben beschränkte, nicht-leere Teilmenge von R besitzt in R ein Supremum.
192 2 Heurismen der Induktion

B OLZANO -W EIERSTRASS40 oder den Zwischenwertsatz41 geht; auch als ein auf
der Vollständigkeit von R beruhendes Nullstellenverfahren tritt die Bisektionsme-
thode unter der Bezeichnung „Intervallhalbierungsverfahren“ in Erscheinung.

Abb. 2.11 Bisektionsmetho-


de, 1. Schritt

Man zerlege das Rechteck R durch Einzeichnen seiner Symmetrieachsen (!


Symmetrieprinzip) in vier paarweise kongruente kleinere Rechtecke R.1/ ; R.2/ ; R.3/
und R.4/ . Werden die Ränder @R.i / dieser Teilrechtecke und der Rand @R von R
jeweils positiv orientiert, so gilt

4 Z
X Z
f .z/ dz D f .z/ dz ;
i D1
@R.i / @R

denn die Teilwege längs der Symmetrieachsen von R werden jeweils zweimal in
entgegengesetzten Richtungen durchlaufen, sodass sich die Integrationen längs die-
ser Teilwege neutralisieren (Abb. 2.11).
Ist nun R1 unter den Teilrechtecken R.i / so gewählt, dass das Randintegral über
@R1 maximalen Betrag hat (! Extremalprinzip), so folgt wegen
ˇ ˇ ˇ ˇ ˇ ˇ
ˇZ ˇ ˇ 4 Z ˇ 4 ˇ Z ˇ
ˇ ˇ ˇX ˇ X ˇ ˇ
ˇ f .z/ dz ˇ D ˇ f .z/ dz ˇ ˇ f .z/ dz ˇ;
ˇ ˇ ˇ ˇ ˇ ˇ
ˇ ˇ ˇ i D1 .i / ˇ i D1 ˇ .i / ˇ
@R @R @R

dass sich das Randintegral über @R1 durch


ˇ ˇ ˇ ˇ
ˇZ ˇ
ˇ ˇ 1 ˇˇ Z ˇ
ˇ
ˇ ˇ
ˇ f .z/ dz ˇ  ˇˇ f .z/ dz ˇˇ
ˇ ˇ 4ˇ ˇ
ˇ @R1 ˇ @R

40
Jede unendliche, beschränkte Teilmenge von R besitzt in R einen Häufungspunkt. Dieser Satz
ist nach B ERNHARD B OLZANO und K ARL W EIERSTRASS benannt.
41
Jede auf einem Intervall I  R stetige Funktion, welche die Werte ˛ und ˇ (˛ < ˇ) annimmt,
nimmt auch jeden Wert  2 Œ˛; ˇ zwischen ˛ und ˇ als Funktionswert an.
2.1 Heurismen der unvollendeten Induktion 193

abschätzen lässt. Außerdem gilt für die Länge L.@R1 / des Integrationsweges @R1
und den Durchmesser D.R1 / des Teilrechtecks R1 :
1 1
L.@R1 / D L.@R/ und D.R1 / D D.R/ ;
2 2
wenn L.@R/ bzw. D.R/ die Länge des Integrationsweges @R bzw. den Durchmesser
des Rechtecks R bezeichnen.
Auf R1 wende man nun eine analoge Bisektion an, dann erhält man ein Teil-
rechteck R2 von R1 mit
ˇ ˇ ˇ ˇ
ˇZ ˇ ˇ ˇ   ˇˇ Z ˇ
ˇ
ˇ ˇ 1ˇZ ˇ 2ˇ ˇ
ˇ ˇ ˇ ˇ 1 ˇ f .z/ dz ˇ
ˇ f .z/ dz ˇ  ˇ f .z/ dz ˇ  ˇ ˇ
ˇ ˇ 4ˇ ˇ 4 ˇ ˇ
ˇ @R2 ˇ ˇ @R1ˇ @R

und
 2  2
1 1 1 1
L.@R2 / D L.@R1 / D L.@R/ sowie D.R2 / D D.R1 / D D.R/ :
2 2 2 2
Wird der Bisektionsprozess in gleicher Weise fortgesetzt, so erhält man eine Folge
.Rn /n2N von Rechtecken mit folgenden Eigenschaften:

(1) Es ist R
R1
R2
R3
  
Rn
RnC1
: : :
(2) Für n 2 N gilt L.@R
R n / D . 2 / L.@R/
1 n
R und D.Rn / D . 2 / D.R/.
1 n

(3) Für n 2 N ist j @R f .z/ dzj  4 j @Rn f .z/ dzj.


n

T
Aus (1) und (2) folgt, dass es ein z0 2 C mit n2N Rn D fz0 g gibt.42
Dieser Punkt z0 ist der gesuchte Punkt in U , in dem die komplex differenzierbare
Funktion f durch ihre Linearisierung f .z0 / C f 0 .z0 /.z  z0 / so gut approximier-
bar ist, dass das Randintegral über den Fehlerterm
R r.z/.z z0 / kontrollierbar bleibt;
daraus erhält man eine Abschätzung für j @R f .z/ dzj, die den C AUCHYschen In-
tegralsatz beweist.
Sei dazu " > 0 beliebig vorgegeben. Weil r in z0 stetig ist, gibt es ein ı > 0
derart, dass für alle z 2 U mit jz  z0 j < ı gilt:
"
jr.z/  r.z0 /j D jr.z/j < :
L.@R/  D.R/

42
Wird aus jedem Rn ein Punkt zn gewählt, so hat die beschränkte Folge .zn /n2N in R1 nach dem
Satz von B OLZANO -W EIERSTRASS einen Häufungspunkt z0 , der zu R1 gehört, weil R1 kompakt
ist. Nach (1) ist aber für jedes  > 1 der Punkt z0 auch Häufungspunkt
T der Folge .zn /n in R
und liegt deshalb imT Kompaktum R . Mehr als einen Punkt kann n2N Rn wegen (2) aber nicht
enthalten, woraus n2N Rn D fz0 g folgt. Alternativ hätte man auch die Intervallschachtelungen
betrachten können, die durch die Projektionen der Rechtecksfolge .Rn /n2N auf die reelle bzw. die
imaginäre Achse für Re z0 bzw. für Im z0 gegeben sind.
194 2 Heurismen der Induktion

Gemäß (2) kann n 2 N so groß gewählt werden, dass D.Rn / D . 12 /n D.R/ < ı
erfüllt ist. Dann gilt wegen (3):
ˇ ˇ ˇ ˇ
ˇZ ˇ ˇZ ˇ
ˇ ˇ ˇ ˇ
ˇ
ˇ f .z/ dz ˇ  4n ˇ ˇ
ˇ ˇ f .z/ dz ˇ
ˇ ˇ ˇ ˇ
@R ˇ @Rn ˇ
ˇ ˇ
ˇZ Z ˇ
ˇ ˇ
nˇ 0 ˇ
D4 ˇ f .z0 / C f .z0 /.z  z0 / dz C r.z/.z  z0 / dz ˇ
ˇ ˇ
ˇ @Rn @Rn ˇ
ˇ ˇ
ˇZ ˇ
ˇ ˇ
ˇ ˇ
D 4n ˇ r.z/.z  z0 / dz ˇ
ˇ ˇ
ˇ @Rn ˇ
"
< 4n L.Rn /D.Rn / D ":
L.@R/  D.R/
R R
Da j @R f .z/ dzj < " für jedes " > 0 gilt, folgt @R f .z/ dz D 0, womit der Beweis
des C AUCHYschen Integralsatzes für Rechtecke erbracht wäre. 

Die Aussage des C AUCHYschen Integralsatzes für Rechtecke lässt sich wesent-
lich verschärfen; so gilt z. B.
Z
f .z/ dz D 0


für jede in einem einfach-zusammenhängenden Gebiet G 43 komplex differenzier-


bare Funktion f und jeden geschlossenen Integrationsweg  in G.
Eine Möglichkeit, solche Verschärfungen des Theorems aus dem von G OURSAT
behandelten Spezialfall herzuleiten, besteht in einem Prozess der globalen Appro-
ximation, mit dem man einen beliebigen geschlossenen Integrationsweg  durch
Rechteckswege hinreichend gut annähert, um die gleichmäßige Stetigkeit der Funk-
tion f auf dem Kompaktum, das durch die Mengenvereinigung von Sp  mit dem
von Sp  eingeschlossenen Bereich gegeben ist, ausnutzen zu können. G OURSAT
selbst hat mit dieser Methode gearbeitet; allerdings birgt ein solches Vorgehen nicht
zu unterschätzende technische Schwierigkeiten, sodass man heute andere Techni-
ken zur Verallgemeinerung des Integralsatzes für Rechtecke bevorzugt.

43
Einfach-zusammenhängende Gebiete G  C lassen sich auf viele unterschiedliche Weisen
charakterisieren. Eine sehr anschauliche Beschreibung ist: .C n G/ hat keine beschränkten Zu-
sammenhangskomponenten, G hat also keine „Löcher“.
2.1 Heurismen der unvollendeten Induktion 195

2.1.4 Quintessenz für Problemlöser

In Abschn. 2.1 werden heuristische Strategien diskutiert, die den Denkmustern der
Induktion zuzuordnen sind; diese begleiten den schöpferischen Prozess der „im Ent-
stehen begriffenen“ Mathematik bei der Problemfindung und der Problemlösung,
bei der Begriffsbildung und sogar bei der Beweisführung. Zur Abgrenzung gegen
Formen induktiven Schließens, welche demonstrativen Charakter haben (Vollstän-
dige Induktion), ist bei den hier vorgestellten Strategien die Rede von Heurismen
der unvollendeten Induktion.
Bereits im Mathematikunterricht der Primarstufe kann der

 Heurismus des Systematischen Probierens

eingesetzt werden, wenn es um die Bestimmung der Lösungsmengen von Aus-


sageformen über endlichen Grundmengen geht; im Zeitalter des Computers tritt
das Systematische Probieren auch in sehr komplexen endlichen Problemstellun-
gen als brute-force-Strategie bei der Suche nach Lösungen auf. Das wesentliche
heuristische Potenzial des Systematischen Probierens liegt jedoch einerseits in der
Generierung von Vermutungen, andererseits in der Falsifikation oder in der sin-
gulären Bestätigung derselben, wobei Letzteres mit zunehmender Häufigkeit die
Plausibilität einer Vermutung erhöht. In dieser Funktion ist das Systematische Pro-
bieren Bestandteil eines heuristischen Kreislaufs, der in der

 Beobachtung einzelner Analogien und Entdeckung von Mustern

und ihrer Verallgemeinerung zu generelleren Vermutungen besteht, die anschlie-


ßend verifiziert oder falsifiziert werden müssen.
In der metaphorischen Deutung des Problemlösens als die Suche nach einem Weg
von einem Anfangszustand (A) zu einem Zielzustand (Z) lässt sich die

 Strategie des Vorwärtsarbeitens

verständlich beschreiben: Beginnt die Lösungssuche bei (A) und versucht man sich
progressiv von den bekannten Daten der Problemstellung zum Zielzustand (Z) vor-
zuarbeiten, dann handelt es sich um das als „Vorwärtsarbeiten“ bezeichnete indukti-
ve Vorgehen. Dieses ist nicht unbedingt mit der Synthesis der klassisch-griechischen
Analysis-Synthesis-Prozeduren zu identifizieren, da dort die Synthese ihre Wirk-
samkeit vorwiegend im Zusammenspiel mit der Analyse entfaltet und eher die Rolle
einer vorwärts gerichteten Ausführung eines Plans spielt, der regressiv entworfen
wurde.
Reines Vorwärtsarbeiten erfordert Einsicht in die deep structures einer Problem-
stellung, damit man sich zielgerichtet von (A) nach (Z) bewegen kann, auch wenn
196 2 Heurismen der Induktion

sich die Pfade verzweigen; daher ist es erklärlich, dass reine Vorwärtsstrategien in
erster Linie von Experten eingesetzt werden.
Der Verzweigungsproblematik des Vorwärtsarbeitens versucht man bisweilen
dadurch Herr zu werden, dass man aus einer Gesamtheit von Lösungsschritten zu
verschiedenen Teilzielen stets solche Schritte auswählt, die den größten Fortschritt
versprechen. Diese Strategie lässt sich metaphorisch so deuten, dass man auf dem
Weg von (A) nach (Z), wobei sich (A) am Fuß und (Z) auf dem Gipfel eines Berges
befinden, ausschließlich und dabei möglichst steil bergauf vorangeht; das erklärt
den Namen

 Hill Climbing

dieses Denkmusters. In der künstlichen Intelligenz versucht man die offensichtli-


chen Schwächen des Hill Climbing (Orientierungslosigkeit auf Plateaus oder Hän-
genbleiben auf Nebengipfeln) mit verfeinerten Suchalgorithmen wie dem Simulated
Annealing zu bekämpfen.
Die

 Strategie der Approximation

durchläuft alle Anspruchsstufen mathematischer Tätigkeiten, beginnend mit dem


überschlägigen Rechnen in der Grundschule bis hin zur Analysis auf Hochschul-
niveau, wo der Approximationsgedanke den Leitideen des Fachgebiets zuzurechnen
ist. Grundsätzlich unterscheidet man zwischen lokaler und globaler Approximati-
on, wobei manchmal die Differenzierung unter dem Aspekt vorgenommen wird,
ob eine Annäherung an einen Punkt/eine Zahl oder aber an ein komplexeres Ob-
jekt erfolgt. Dass nach diesem Unterscheidungsmerkmal keine scharfen Grenzen
zu ziehen sind, wird deutlich am Beispiel der Exhaustionsmethode, einer Form der
geometrischen Approximation: Zwar werden hier komplexere Objekte – nämlich
krummlinig begrenzte Flächen – durch Polygonflächen angenähert, dies geschieht
aber mit dem Ziel, eine Zahl – nämlich eine Kurvenlänge oder ein Flächeninhalts-
maß – zu approximieren.
Die Möglichkeiten der lokalen Approximation von Funktionen (in offenen Um-
gebungen einzelner Punkte ihrer Definitionsbereiche) werden nicht zuletzt durch
die Regularität dieser Funktionen bestimmt; stetige Funktionen lassen sich lokal
durch konstante Funktionen, differenzierbare Funktionen lokal durch affin-lineare
Funktionen approximieren. Die globale Approximation stetiger Funktionen ist auf
kompakten Teilintervallen ihrer Definitionsbereiche möglich, und zwar sowohl
durch Polynome als auch durch Treppenfunktionen, wobei Letzteres für die Inte-
gralrechnung von Bedeutung ist.
Das heuristische Potenzial der Annäherung komplizierter Objekte durch einfa-
chere Objekte in der Analysis besteht in der Hoffnung, dass angenehme Eigen-
schaften der approximierenden Objekte an das approximierte Objekt vererbt wer-
den und dass der Annäherungsprozess mit weiteren, parallel ablaufenden infinite-
simalen Prozessen vertauscht werden kann. Über die Berechtigung dieser Hoff-
nung entscheidet die Qualität der Approximation, die sich in unterschiedlichen
2.2 Vollendete Induktion 197

Konvergenzbegriffen manifestiert und mit dem Instrument der Abschätzung gemes-


sen werden kann.
Sind die vorzunehmenden Abschätzungen präzise genug, kann man bisweilen
durch lokale Abschätzungen globale Kontrolle ausüben; auf dieser Erkenntnis ba-
siert die Bisektionsmethode, mit der originär globale Problemstellungen in lokale
Problemstellungen transformiert werden können. In der eindimensionalen reellen
Analysis begegnet uns die Bisektionsmethode in Gestalt der fortgesetzten Inter-
vallhalbierung, wo sie ihre Kraft im Zusammenhang mit der durch das Intervall-
schachtelungsaxiom charakterisierten Vollständigkeit der reellen Zahlen entfaltet.
Unsere Überlegungen aus Abschn. 2.1 fließen in eine dritte Verfeinerung von
P ÒLYAs Phasenmodell des Problemlöseprozesses ein und führen zu folgender Dar-
stellung:

Problemlösephasen nach Pólya (Dritte Verfeinerung)

I. Verstehen der Aufgabe


a) Identifikation des Problems
b) Auffinden einer geeigneten Darstellung des Problems
II. Ausdenken eines Plans
a) Variation der Problemwahrnehmung (Reorganisation)
b) Variation der Problemstellung unter Beachtung des Invarianz-, des
Symmetrie- und des Extremalprinzips
c) Generieren von Vermutungen durch induktive Prozeduren
III. Ausführen des Plans
a) Vorwärtsarbeiten
b) Kontrollierte Durchführung von Approximationsprozessen
IV. Rückschau
a) Kontrolle der Lösung durch Rückübersetzung in den ursprünglichen
Problemkontext

Nach wie vor gilt, dass die Phasen einander wechselseitig beeinflussen und des-
halb im Sinne eines heuristischen Kreislaufs ggf. mehrfach zu durchlaufen sind.

2.2 Vollendete Induktion

Im Zusammenhang mit Denkweisen des induktiven Schließens, die aufgrund der


Eigenschaften der Strukturen, in denen sie verwendet werden, demonstrativen Cha-
rakter haben, soll in unserer Systematik von vollendeter Induktion gesprochen wer-
den. Die Denkmuster der vollendeten Induktion selbst können nur bedingt als heu-
ristische Strategien verstanden werden; es handelt sich eher um Beweistechniken
im Umfeld der vollständigen Induktion. Für diesen Protagonisten der „mathema-
tischen Vervollständigung der Induktion“, der den modernen Mathematikern erst
198 2 Heurismen der Induktion

durch B LAISE PASCALs „Traité du triangle arithmétique“ zugänglich geworden


ist und dessen Bezeichnung auf AUGUSTUS DE M ORGAN (1806–1871) zurückgeht,
stellt G EORG P ÓLYA in seinen bereits erwähnten Werken zum plausiblen Schließen
fest:

Die vollständige Induktion ist ein Beweisverfahren, das häufig von Nutzen ist bei der Verifi-
zierung mathematischer Vermutungen, zu denen man durch irgendein induktives Verfahren
gelangt ist. Wollen wir uns daher Erfahrung in induktiver mathematischer Forschung an-
eignen, so ist es wünschenswert, die Technik der vollständigen Induktion einigermaßen zu
beherrschen.

An dieser Beschreibung wird deutlich, dass die vollständige Induktion zwar nur
schwer als autonome heuristische Strategie eingestuft werden kann, dass aber ein
Ineinandergreifen heuristischer (! unvollendete Induktion) und demonstrativer
Vorgehensweisen im Kontext der vollständigen Induktion realisierbar und dem ma-
thematischen Erkenntnisgewinn förderlich ist. Nicht zuletzt deshalb scheinen kriti-
sche Anmerkungen44 wie

Mit geringen Anforderungen an das Denkvermögen wird man unter Einhaltung formaler
Rechenregeln zielsicher auf die Lösung (. . . ) geführt . . . ,

die der vollständigen Induktion generell jedwede kreative Komponente in Abre-


de stellen, etwas voreilig und unangemessen. Solche Vorurteile sind wohl darauf
zurückzuführen, dass in einer Vielzahl von Situationen, in denen Induktionsbewei-
se geführt werden können, der Induktionsschlüssel45 durch den Problemcharakter
vorgegeben ist. So besteht etwa beim Induktionsbeweis von Summenformeln der In-
duktionsschlüssel fast immer darin, im Induktionsschritt n 7! nC1 den .nC1/-ten
Summanden abzuspalten und für die restliche Summe die Induktionsvoraussetzung
zu verwenden. Es gibt aber durchaus Beispiele, die eine gewisse Kreativität im
Umgang mit der vollständigen Induktion verlangen (vgl. Beispiel 1.32). Außerdem
besteht eine Art strategischen Handelns darin, die Struktur einer mathematischen
Problemstellung (Beweisaufgabe) daraufhin zu untersuchen, ob und wie sie einem
Induktionsbeweis zugänglich sein könnte (vgl. Beispiel 2.8). Insofern lässt sich der
Satz:

 Ist A.n/ eine Aussageform, bei der eine Peano-Algebra M einen zulässigen Ob-
jektbereich für die Variable n bildet, und ist eine Aussage vom Typ „Für alle
n 2 M gilt A.n/“ zu zeigen, dann könnte man einen Beweis mittels vollständi-
ger Induktion versuchen.

als Formulierung einer heuristischen Strategie verstehen, in die die Beweistechnik


eingebunden ist. Weitere Anklänge an heuristische Verfahren werden aufgedeckt,

44
M. G LATFELD in Überlegungen zum Induktionsbegriff – unter fachdidaktischer Hinsicht. Verlag
Peter Lang, Frankfurt (1987).
45
Eine Bezeichnung für die Handlung, mit der man die Induktionsvoraussetzung für die Durch-
führung des Induktionsschlusses nutzbar machen kann.
2.2 Vollendete Induktion 199

wenn man sich die Wirkungsbedingungen der vollständigen Induktion etwas ge-
nauer ansieht.
Aus philosophischer Perspektive ist die vollständige Induktion ein faszinierendes
Verfahren, beweist sie doch mit endlichen Mitteln unendlich viele Aussagen (im Fall
M D N: A.1/ gilt, A.2/ gilt, A.3/ gilt, A.4/ gilt, A.5/ gilt, . . . ).
Prinzipiell ist es nicht möglich, universelle Aussagen wie

„Alle Raben sind schwarz.“

aus einer endlichen Anzahl singulärer Bestätigungen („Dieser Rabe hier ist schwarz.“
„Jener Rabe dort ist ebenfalls schwarz.“ . . . ) zu deduzieren, und zwar unabhängig
davon, wie viele Verifikationen an Einzelfällen vorgenommen werden;46 lediglich
die Plausibilität der Allaussage wächst mit der Anzahl der Bestätigungen, die man
in Einzelfällen erhalten hat, ohne auf ein Gegenbeispiel zu stoßen.
Diese Einsicht hat zu einer Vielzahl unterschiedlicher Ansätze zur Rechtferti-
gung oder zur Ablehnung induktiver Schlüsse in den Wissenschaften geführt; in der
Mathematik aber scheint das „Induktionsproblem“ der Erkenntnistheorie im Zu-
sammenhang mit universellen Aussagen im Kontext der natürlichen Zahlen nicht
zu existieren.
Dies ist einzig und allein auf die induktive Struktur des Zahlenbereichs N, wie
sie durch dessen axiomatische Beschreibung nach R ICHARD D EDEKIND (1831–
1916) und nach G IUSEPPE P EANO (1852–1932) zum Ausdruck gebracht wird,
zurückzuführen:

Definition (Peano-Algebra)
Für eine Menge M , ein Objekt e und eine einstellige Funktion ' nennt man das
Tripel .M; e; '/ eine Peano-Algebra, wenn gilt:

(P 1) Es ist e 2 M (und damit insbesondere M ¤ ;).


(P 2) Die Funktion 'W M ! M bildet M in M ab.
(P 3) Das Element e liegt nicht im Bild '.M / der Menge M unter '.
(P 4) Die Funktion ' ist injektiv.
(P 5) Für jede Teilmenge T von M gilt: Ist e 2 T und '.T / T , dann ist T D M .

Man nennt (P 1), . . . , (P 5) das P EANOsche Axiomensystem und bezeichnet spe-


ziell (P 5) als das Induktionsaxiom. Wie H ISCHER und S CHEID feststellen, dienen
die P EANO-Axiome nicht dazu, die natürlichen Zahlen zu definieren, sondern die-
se „bereits vorhandenen Zahlen zu charakterisieren, d. h. in akzeptabler Form zu
beschreiben, um eine Beweisgrundlage zu bekommen.“
Mit M WD N, e WD 1 und der Nachfolgerfunktion ' WD
erkennt man .N; 1;
/
als eine P EANO-Algebra, in der vereinbarungsgemäß das Induktionsaxiom gilt.

46
Solange es weniger sind als die (endliche) Anzahl aller Raben, die die Erde je bevölkert haben
und noch bevölkern werden.
200 2 Heurismen der Induktion

Dieses Axiom verleiht dem Beweisverfahren der vollständigen Induktion die Fä-
higkeit, mit einem endlichen Argument unendlich viele Wahrheiten zu sichern; aus
(P 5) ergibt sich nämlich, dass Folgendes richtig ist:

Satz (Beweis durch vollständige Induktion)


Ist A.x/ eine Aussageform über der Grundmenge M und .M; e; '/ eine P EANO-
Algebra, so gilt:
!
^ ^
A.e/ ^ ŒA.x/ ) A.'.x// ) A.x/ :
x2M x2M

Bezeichnet man nämlich mit T WD fx 2 M j A.x/g die Lösungsmenge der


Aussageform A.x/ und weist nach, dass

 A.e/ gilt (Induktionsanfang)

und dass die Allaussage


V
 x2M ŒA.x/ ) A.'.x// (Induktionsschluss)

richtig ist, dann besitzt T die Eigenschaften e 2 T und '.T / T , sodass man mit
(P 5) auf T D M schließen kann und folglich A.x/ für alle x 2 M gilt.
Sowohl der Induktionsanfang als auch der Induktionsschluss sind endliche Ar-
gumente – beim Induktionsanfang ist dies offensichtlich, beim Induktionsschluss
nicht unmittelbar, weil es sich schließlich um eine Allaussage handelt. Trotzdem
genügt es offenbar, für ein beliebiges Element x 2 M zu zeigen, dass die Implika-
tion A.x/ ) A.'.x// wahr ist, denn dann gilt A.x/ ) A.'.x// für alle x 2 M .
Der Schluss von

(1) „A.e/ gilt“ und (2) „A.x/ ) A.'.x// für beliebiges x 2 M “

auf

„Für alle x 2 M gilt A.x/“

ist deshalb demonstrativ, weil es sich um einen induktiven Schluss nach vollständi-
ger Aufzählung handelt:
Die unendlich vielen Schritte, die eigentlich beim Induktionsschluss durchge-
führt werden müssen, sind formal alle gleich und können deshalb mit variablem x
alle gleichzeitig vollzogen werden.
Man muss sich allerdings sorgfältig davon überzeugen, dass die Argumente tat-
sächlich formal alle gleich sind, also für jedes x 2 M grundsätzlich gültig wären –
anderenfalls verliert die aufzählende Induktion ihre Vollständigkeit und damit ihren
demonstrativen Charakter. Sehen wir uns dazu ein typisches Beispiel an.
2.2 Vollendete Induktion 201

Beispiel 2.7 (Vollparadoxe Induktion – PIN-Codes)


Wir „beweisen“ mittels vollständiger Induktion, dass auf allen Bankkarten derselbe
PIN-Code zur Benutzung eines Geldautomaten eingetragen ist. Dazu formulieren
wir diese Aussage zunächst so, dass sie einem Induktionsbeweis zugänglich wird:
„Wählt man aus der Menge aller Bankkarten n Karten aus, so sind die PIN-
Codes dieser n Bankkarten identisch.“
Der erste Schritt eines Beweises durch Induktion über n ist der Induktionsanfang;
für n D 1 ist die Sachlage offenbar klar und unstrittig.
Für den Induktionsschritt seien nun n C 1 Bankkarten B1 ; : : : ; BnC1 gewählt.
Dann sind nach Induktionsvoraussetzung die PIN-Codes der Karten B1 ; : : : ; Bn
identisch, ebenso die PIN-Codes der Bankkarten B2 ; : : : ; Bn ; BnC1 , denn hier han-
delt es sich jeweils nur um n Karten. Folglich hat BnC1 denselben PIN-Code wie
Bn und damit auch denselben wie B1 ; : : : ; Bn .
Damit ist der Induktionsschritt vollzogen, und nach dem Induktionsprinzip ist die
Aussage bewiesen. Die überflüssigen PIN-Codes können also abgeschafft werden.
Der Fehler kann nur im Induktionsschluss stecken; das Paradoxon muss darauf
zurückzuführen sein, dass das formale Argument für den Schluss von n auf n C
1 eben nicht für jedes beliebige n 2 N Gültigkeit besitzt. In der Tat deckt eine
sorgfältige Analyse der Argumentationsstruktur den Fehler auf:
Findet man ein Element im Mengendurchschnitt fB1 ; : : : ; Bn g \ fB2 ; : : : ; Bn ;
BnC1 g, dann schreibt der PIN-Code dieses Elements die identischen PIN-Codes
aller Bankkarten in den einzelnen Blöcken, mithin also alle PIN-Codes der Karten
B1 ; : : : ; BnC1 vor. Aber:

Für n D 1 ist fB1 ; : : : ; Bn g \ fB2 ; : : : ; Bn ; BnC1 g D fB1 g \ fB2 g D ;Š

Das oben benutzte formale Argument gilt also nicht für jedes beliebige n 2 N, son-
dern nur für alle n 2 N mit n  2 – die aufzählende Induktion ist nicht vollständig,
sie hat keine Beweiskraft. 

Der Rahmen für den oben (falsch) durchgeführten Induktionsbeweis war die
P EANO-Algebra .N; 1;
/ mit der Nachfolgerfunktion
, in der Allaussagen der
Form

 „Für alle n 2 N gilt A.n/.“

durch Induktion nach n geführt werden können. Induktionsbeweise von Allaussa-


gen der Form

 „Für alle n 2 N0 gilt A.n/.“

beruhen auf der Gültigkeit von (P5) in der P EANO-Algebra .N0 ; 0;


/, und Indukti-
onsbeweise von Aussagen vom Typ

 „Für alle n 2 N mit n  n0 2 N gilt A.n/.“


202 2 Heurismen der Induktion

benutzen das Induktionsaxiom in der P EANO-Algebra .Nn0 ; n0 ;


/, wobei Nn0 die
Menge aller natürlichen Zahlen größer oder gleich n0 bezeichnet. Da alle P EANO-
Algebren zueinander isomorph sind47 , beschränken wir uns im Folgenden auf die
vertraute P EANO-Algebra .N; 1;
/.
Die induktive Struktur des Zahlenbereichs N lässt sich bekanntlich auch über
das Wohlordnungsaxiom (Prinzip vom kleinsten Element (PKE) ) charakterisieren,
welches besagt, dass jede nicht leere Teilmenge M von N ein kleinstes Element be-
sitzt; (P5) und (PKE) sind logisch äquivalent. Durch diesen Wechsel der Perspektive
werden heuristische Elemente der vollständigen Induktion aufgedeckt, die zuvor im
Automatismus des Beweisverfahrens verborgen waren.
Zur Verdeutlichung dieses Standpunkts mag die Beweisheuristik von Allaussa-
gen des Typs

 „Für alle n 2 N gilt A.n/.“

auf der Grundlage von (PKE) dienen, die in der Regel folgendermaßen strukturiert
ist:
Man nehme an, es gebe ein n0 2 N, für welches A.n0 / nicht gilt. Dann ist
M WD fn 2 N j :A.n/ ist wahrg nicht leer und besitzt nach (PKE) ein kleinstes
Element m. Man versuche, die Existenz dieses kleinsten Elements m von M zum
Widerspruch zu führen.
Die heuristische Strategie besteht offenbar darin, die Monsterfunktion des Ex-
tremalen in einem Widerspruchsbeweis zu nutzen; das prozessorientierte Indukti-
onsprinzip ist mit dem objektorientierten Extremalprinzip verwandt, das hier seine
Wirkung in einer Analysis-Synthesis-Prozedur entfaltet. Üblicherweise hat die da-
bei durchzuführende reductio ad absurdum folgende Struktur:

 Zuerst zeigt man, dass nicht m D 1 gelten kann.


(Dies entspricht dem Induktionsanfang beim Beweis durch vollständige Indukti-
on.)
 Wegen m  2 wird es möglich, A.m  1/ zu betrachten; A.m  1/ muss aber
wahr sein, weil m das kleinste Element von M ist. Kann man nun folgern, dass
dann auch A.m/ wahr sein muss, so hat man den gewünschten Widerspruch
erzielt.
(Der Rückgriff auf das Element m  1 mit der anschließend vollzogenen Folge-
rung für m entspricht dabei dem Induktionsschluss in einem Induktionsbeweis.)

Zur Illustration des oben beschriebenen Perspektivwechsels betrachten wir ein ein
letztes Beispiel.

Zu je zwei P EANO-Algebren .M; e; '/ und .N; f; / gibt es eine bijektive Abbildung ˛W M !
47

N mit ˛.e/ D f und ˛ ı ' ı ˛ 1 D .


2.2 Vollendete Induktion 203

Beispiel 2.8 (Binomialkoeffizienten einmal anders)


Man begründe

a) auf der Grundlage von (P 5); b) auf der Grundlage von (PKE),

dass ein Produkt von n aufeinander folgenden natürlichen Zahlen stets durch nŠ
teilbar ist.
Zu a): Der Versuch eines Beweises durch vollständige Induktion über n wird
vom Problemcharakter her in kanonischer Weise nahegelegt.
Der Induktionsanfang bereitet keine Probleme, weil 1Š D 1 Teiler einer jeden
natürlichen Zahl ist – hier ist nichts zu zeigen.
Nehmen wir also an, für irgendein beliebiges, aber festes n 2 N sei sicherge-
stellt, dass nŠ ein Teiler jedes Produktes von n aufeinander folgenden natürlichen
Zahlen ist (Induktionsvoraussetzung).
Zu zeigen ist, dass dann .n C 1/Š ein Teiler jedes Produktes von .n C 1/ aufein-
ander folgenden natürlichen Zahlen ist (Induktionsbehauptung).
Sei ein solches Produkt PnC1 von .n C 1/ aufeinander folgenden natürlichen
Zahlen vorgelegt; dann gibt es ein k 2 N0 derart, dass sich PnC1 in der Form

Y
nC1
PnC1 D .k C 1/  .k C 2/      .k C n/  .k C n C 1/ D .k C j /
j D1

darstellen lässt. Laut Induktionsvoraussetzung gilt


ˇ n ˇ nC1
ˇY ˇY
ˇ ˇ
nŠ ˇ .k C j / und nŠ ˇ .k C j / ;
ˇ ˇ
j D1 j D2

jedoch kann weder .n C 1/ j .k C 1/ noch .n C 1/ j .k C n C 1/ allgemein für


k 2 N0 erwartet werden.
(Aus jeder dieser Beziehungen würde sich die Induktionsbehauptung ergeben.)
Die „Einhaltung formaler Rechenregeln“ führt hier offenbar nicht „zielsicher
auf die Lösung“ – aber: Die Analyse der Problematik, weshalb sich der Induk-
tionsschluss nicht direkt vollziehen lässt, gibt Auskunft darüber, wie es gelingen
könnte, die Problemstellung einem Induktionsbeweis zugänglich zu machen. Dies
zeigt erneut, dass das Verfahren der vollständigen Induktion durchaus heuristisches
Potenzial besitzt, wenn man sich nicht darauf beschränkt, es ausschließlich in ba-
nalen Situationen einzusetzen.
Für beliebiges k 2 N0 gilt im Allgemeinen nicht .n C 1/ j .k C n C 1/, für
spezielle k 2 N0 dagegen schon, nämlich für alle Vertreter der Restklasse Œ0nC1
in N0 , insbesondere für k D 0, den kleinsten Vertreter dieser Restklasse in N0 (!
Extremalprinzip).
204 2 Heurismen der Induktion

Man könnte also versuchen, eine Verbindung zwischen beliebigem k 2 N0 und


k D 0 herzustellen; ein erster Schritt dazu wäre die additive Zerlegung des Faktors
.k C n C 1/ in .n C 1/ C k, dann ergibt sich nämlich für PnC1 :

PnC1 D .k C 1/  .k C 2/      .k C n/  .k C n C 1/
Yn
D .k C n C 1/ .k C j /
j D1

Y
n Y
n
Dk .k C j / C .n C 1/ .k C j /
j D1 j D1
Y
n Y
n
D .k C j / C .n C 1/ .k C j / :
j D0 j D1

Q
Laut Induktionsvoraussetzung ist nŠ ein Teiler von jnD1 .k C j /, also .n C 1/Š ein
Qn
Teiler von .n C 1/ j D1 .k C j /. Folglich gilt für k 2 N0 :

. / .n C 1/Š j .k C 1/  .k C 2/      .k C n C 1/
, .n C 1/Š j k  .k C 1/      .k C n/ ;

und das ist die Aussage, die wir jetzt mittels vollständiger Induktion bewiesen ha-
ben, wenn wir uns noch davon überzeugen, dass sie für n D 1 korrekt ist – das steht
aber außer Zweifel, weil das Produkt zweier aufeinander folgender ganzer Zahlen
stets gerade ist.
Strukturell bemerkenswert an diesem Perspektivwechsel ist, dass man durch In-
duktion über n einen Rekursionsschluss von .k C 1/ auf k gewinnen kann, den man
jetzt nur progressiv (durch Induktion über k) ausführen muss, um die Teilbarkeit
von PnC1 durch .n C 1/Š zu beweisen:
Für k D 0 und beliebiges n 2 N gilt offenbar

.n C 1/Š j k  .k C 1/      .k C n/ ;
„ ƒ‚ …
D0

womit der Induktionsanfang gesichert wäre.


Sofern für beliebiges k 2 N0 die Teilbarkeitsbeziehung

.n C 1/Š j k  .k C 1/      .k C n/

besteht, folgt aus . /, dass auch

.n C 1/Š j .k C 1/  .k C 2/      .k C n C 1/

gilt – damit ist der Induktionsschritt vollzogen!


Weil laut (P 5) damit .n C 1/Š j .k C 1/  .k C 2/      .k C n C 1/ für alle k 2 N0
gilt, folgt .n C 1/Š j PnC1 , und die in a) verlangte, auf (P 5) gestützte Begründung
2.2 Vollendete Induktion 205

der Tatsache, dass nŠ jedes Produkt von n aufeinander folgenden natürlichen Zahlen
teilt, ist gelungen.
Zu b) Wir führen nun den Beweis auf der Grundlage von (PKE) in Anlehnung
an die oben formulierte Beweisheuristik.
Angenommen, es gibt ein n 2 N, zu dem man ein Produkt von n aufeinander
folgenden natürlichen Zahlen finden kann, welches nicht durch nŠ teilbar ist. Laut
(PKE) gibt es dann eine kleinste natürliche Zahl m mit dieser Eigenschaft; offenbar
ist m > 1, weil jede Zahl durch 1Š D 1 teilbar ist.
Unter allen Produkten von m aufeinander folgenden natürlichen Zahlen, die
nicht durch mŠ teilbar sind, wähle man jetzt das kleinste Produkt Pm aus – dies
ist wieder nach (PKE) möglich.
Sei jetzt k 2 N0 so gewählt, dass

Pm D .k C 1/  .k C 2/      .k C m  1/  .k C m/

gilt. Dann zerlege man Pm additiv in zwei Summanden, nämlich

Pm D .k C 1/  .k C 2/      .k C m  1/  k
C .k C 1/  .k C 2/      .k C m  1/  m
D k  .k C 1/  .k C 2/      .k C m  1/
C .k C 1/  .k C 2/      .k C m  1/  m
DW Pm0 C Pm1  m :

Der erste Summand

Pm0 D k  .k C 1/  .k C 2/      .k C m  1/

ist ein Produkt von m aufeinander folgenden natürlichen Zahlen, und es gilt Pm0 <
Pm . Weil nun Pm das kleinste aller Produkte von m aufeinander folgenden natürli-
chen Zahlen ist, welches nicht durch mŠ teilbar ist, muss gelten:

mŠ j Pm0 (1)

Der erste Faktor

Pm1 D .k C 1/  .k C 2/      .k C m  1/

des zweiten Summanden ist ein Produkt von .m  1/ aufeinander folgenden natür-
lichen Zahlen, und wegen m > 1 ist .m  1/ 2 N. Aufgrund der Minimalität von
m unter allen natürlichen Zahlen n mit der Eigenschaft, dass man ein Produkt von
n aufeinander folgenden natürlichen Zahlen finden kann, welches nicht durch nŠ
teilbar ist, muss .m  1/Š j Pm1 und deshalb

mŠ j Pm1  m (2)
206 2 Heurismen der Induktion

gelten. Aus (1) und (2) ergibt sich aber mithilfe der Summenregel der Teilbarkeit48 ,
dass mŠ ein Teiler von Pm ist – dies steht im Widerspruch zur Wahl von m und
von Pm . Damit ist der Beweis der Aussage, dass jedes Produkt von n aufeinander
folgenden natürlichen Zahlen durch nŠ teilbar ist, auf der Grundlage von (PKE)
geführt. 

Zu klären bliebe noch die Frage, weshalb Beispiel 2.8 unter dem Titel „Binomi-
alkoeffizienten einmal anders“ geführt wird.
Offenbar gilt genau dann nŠ j .k C 1/      .k C n/, wenn

.k C 1/      .k C n/ kŠ  .k C 1/      .k C n/ .k C n/Š
D D
nŠ nŠ kŠ nŠ kŠ
eine natürliche Zahl ist. Der
 letzte
 Bruch jedoch ist nur eine andere Schreibweise für
den Binomialkoeffizienten kCn n , und kennt man dessen kombinatorische Bedeutung
als Anzahl der n-Teilmengen einer .k C n/-Menge,49 so ist nichts weiter zu zeigen.
Beispiel 2.8 dient nicht nur als weiterer Beleg dafür, dass ein Beweis mittels
vollständiger Induktion in der Regel nicht der eleganteste denkbare Beweis ist, son-
dern es verdeutlicht auch exemplarisch, dass es sich bei Induktion und Rekursion
um zwei Seiten derselben Medaille handelt.
Ist eine Zahlenfolge .an /n2N rekursiv definiert, so kann man beispielsweise

 jedes n-te Folgenglied aus dem (den) vorigen Folgenglied(ern) berechnen oder
auch
 ihre Eigenschaften induktiv dadurch beweisen, dass man den durch die Rekursi-
onsvorschrift beschriebenen Zusammenhang im Induktionsschritt verwendet.

Es handelt sich hierbei um die progressive Ausführung eines regressiv ange-


legten Plans: Man startet mit der Überlegung, wie man anC1 aus an (oder aus
an ; an1 ; : : : ;) berechnen könnte (regressiv orientiert), muss aber bei a1 beginnen,
um am Ende anC1 ausrechnen zu können (progressiv ausgeführt).
Generell kann man Strategien, die sowohl progressive als auch regressive Ele-
mente enthalten, zu den „Vorwärtsstrategien“ (Induktionsstrategien) oder zu den
„Rückwärtsstrategien“ (Reduktionsstrategien) zählen, je nachdem, welcher Ge-
sichtspunkt im Vordergrund steht. In Kap. 3 sollen nun diejenigen Heurismen
diskutiert werden, die eher regressiver Natur sind.

48
Aus t j a und t j b folgt stets t j .a C b/.
49
Vgl. dazu die Ausführungen zu den vier kombinatorischen Grundaufgaben in Abschn. 1.2.5.
Heurismen der Reduktion
3

Inhaltsverzeichnis
3.1 La Descente Infinie – der unendliche Abstieg . . . . . . . . . . . . . . . . . . . . . . . . . 208
3.2 Rückwärtsarbeiten und Pappos-Prinzip . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 219
3.3 Modularisierung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 236
3.4 Quintessenz für Problemlöser . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 258

Es wurde bereits angedeutet, dass man es bei den Heurismen der Reduktion mit
Strategien zu tun hat, die überwiegend regressiv orientiert sind. Dies hat zur Folge,
dass die betreffenden Strategien – im Gegensatz zu den Heurismen der Induktion –
kaum bei der Problemfindung, sondern vorwiegend beim Problemlösen im engeren
Sinne eingesetzt werden.
Nach A LFRED S CHREIBER handelt es sich bei den Heurismen der Reduktion
mehrheitlich um Verfahren mit logischem Charakter, mit denen man nach Voraus-
setzungen oder nach falschen Konsequenzen sucht; diese Charakterisierung rückt
sofort die Argumentation durch Widerspruch ins Blickfeld reduktiver Strategien,
zumal der namensgebende Begriff reductio (lat: Zurückführung) für die hier be-
trachtete Klasse von Heurismen ein Bestandteil der lateinischen Bezeichnung „re-
ductio ad absurdum“ dieses logischen Instruments ist.
Die vielfältigen semantischen Bezüge von „Reduktion“ verlangen aber eine ge-
wisse Vorsicht bei der Zuordnung, wie es beispielsweise im Zusammenhang mit
P ÓLYAs Charakterisierung des D ESCARTESschen Schemas (Abschn. 1.1.2) deut-
lich wird:
Obwohl mehrfach davon die Rede ist, man solle ein Problem des Sachzusam-
menhangs A auf ein Problem des Kontextes B reduzieren, steht bei der empfohlenen
Vorgehensweise eigentlich die Neurepräsentation des Problems in einem anderen
Begriffssystem im Vordergrund, womit in erster Linie der Heurismus der Variation
der Darstellung angesprochen wäre. Ebenso wenig sollte eine heuristische Strate-
gie nur deshalb den Heurismen der Reduktion zugeordnet werden, weil sie eine
Reduktion der Problemkomplexität bewirkt – viele Strategien der unterschiedlichs-
ten Merkmale erfüllen diese Funktion.

© Springer-Verlag GmbH Deutschland, ein Teil von Springer Nature 2018 207
W. Schwarz, Problemlösen in der Mathematik, https://doi.org/10.1007/978-3-662-56762-3_3
208 3 Heurismen der Reduktion

Wir beginnen unsere Systematik der Heurismen der Reduktion mit einem Denk-
muster, das von besonderem historischen Interesse ist. Es handelt sich um eine Ar-
gumentationsform, welche eine besondere Ausprägung des Extremalprinzips dar-
stellt, die konsequent mit der reductio ad absurdum kombiniert wird: die Methode
des „unendlichen Abstiegs“ (la descente infinie).

3.1 La Descente Infinie – der unendliche Abstieg


In A NDRÉ W EILs (1906–1998) Geschichte der Zahlentheorie kann man nachlesen,
dass P IERRE DE F ERMAT (1601–1665) die Methode des unendlichen Abstiegs in
seinem letzten Brief an C HRISTIAAN H UYGENS (1629–1695) aus dem Jahr 1659
als seine Erfindung vorgestellt und am Beispiel des Zwei-Quadrate-Satzes1 die zen-
trale Idee der Methode erläutert hat:
Et pour ce que les méthodes ordinaires, qui sont dans les Livres, étoient insuffisantes a
démontrer des propositions si difficiles, je trouvai enfin une route a fait singuliere pour y
parvenir. J’appelai cette maniere de démontrer la descente infinie ou indéfinie, etc. (. . . )
Si un nombre premier pris a discrétion, qui surpasse de l’unité un multiple de 4, n’est
point composé de deux quarrés, il y aura un nombre premier de même nature, moindre que
le donné, et ensuite un troisieme encore moindre, etc. en descendant a l’infini jusques a
ce que vous arriviez au nombre 5, qui est le moindre de tous ceux de cette nature, lequel
il s’ensuivroit n’être pas composé de deux quarrés, ce qu’il est pourtant. D’ou on doit
inférer, par la déduction a l’impossible, que tous ceux de cette nature sont par conséquent
composés de deux quarrés.

Auch wenn es F ERMATs Verdienst ist, die Methode der descente infinie präzise
beschrieben und ihre herausragende Rolle für die Weiterentwicklung der Zahlen-
theorie definiert zu haben – die Ursprünge des unendlichen Abstiegs lassen sich bis
in die frühgriechische Mathematik zurückverfolgen.
Der Altphilologe K URT VON F RITZ (1900–1995) vertritt die These, H IPPASOS
von Metapont (ca. 500–440 v. Chr.), einer der Schüler des P YTHAGORAS, habe bei
der Beschäftigung mit dem Pentagramm, dem Erkennungszeichen der Pythagoräer,
die Existenz der Inkommensurabilität entdeckt und damit nach P YTHAGORAS’ Tod
das Weltbild der Pythagoräer zum Einsturz gebracht.2 Dies hatte einen Grundlagen-
streit zur Folge, der eine Spaltung der P YTHAGORAS-Jünger in zwei Gruppierungen
versursachte: die Akusmatiker – die Vertreter der „reinen Lehre“, für die P YTHAGO -
RAS’ Wort Gesetz war – und die Mathematiker, die mit H IPPASOS von der Existenz
inkommensurabler Strecken überzeugt waren und sich um weitere Fortschritte ihrer
Wissenschaft bemühten.

1
Am Weihnachtstag 1640 verkündete F ERMAT in einem Brief an M ARIN M ERSENNE (1588–
1648) ohne Beweis, dass jede Primzahl p der Gestalt p D 4n C 1; n 2 N bis auf die Reihenfolge
der Summanden genau eine Darstellung als Summe zweier Quadratzahlen besitzt. Der erste doku-
mentierte Beweis dieses Satzes stammt von E ULER (1754), der seinen Beweis bezeichnenderweise
auf der Grundlage von F ERMAT s descente infinie führte. Eine sehr informative Diskussion des
Zwei-Quadrate-Satzes unter historischem, didaktischem und heuristischem Aspekt findet man in
einem Artikel von H EINRICH W INTER in Mathematische Semesterberichte 50 (2003).
2
K. VON F RITZ : Die Entdeckung der Inkommensurabilität durch Hippasos von Metapont. Annals
of Mathematics 46 (1945).
3.1 La Descente Infinie – der unendliche Abstieg 209

Die Legende berichtet, H IPPASOS sei von den Göttern für diesen Frevel mit
dem Tod durch Schiffsuntergang bestraft worden – die bloße Existenz einer solchen
Überlieferung kann als Beleg dafür angesehen werden, dass Forschungsfeindlich-
keit keine Erfindung der Neuzeit ist. Man sollte die Hoffnung nicht aufgeben, dass
irgendwann eine moderne Gesellschaft die historische Chance wahrnimmt, dieser
langen Tradition ein Ende zu setzen und die passenden gesellschaftspolitischen und
wirtschaftspolitischen Maßnahmen zu ergreifen.
Zwar scheint bis heute nicht einwandfrei geklärt, ob das Phänomen der Inkom-
mensurabilität tatsächlich am regelmäßigen Fünfeck entdeckt wurde3 und deshalb
H IPPASOS als Entdecker der Irrationalität angesehen werden kann, aber es scheint
gewiss, dass H IPPASOS’ impliziter Beweis der Irrationalität des Verhältnisses des
Goldenen Schnitts4 das erste bekannte Beispiel für die Verwendung der Methode
des unendlichen Abstiegs in der Mathematikgeschichte ist. Deshalb soll die Errun-
genschaft des H IPPASOS hier vorgestellt werden und zur Erläuterung der Methode
dienen.

Beispiel 3.1 (Infiniter Abstieg: Inkommensurabilität im Pentagon)


Obwohl die relative Dichte der negativen Konnotationen der in der Beispielüber-
schrift verwendeten Substantive den Verdacht entstehen lassen könnte, ist hier mit
„Pentagon“ nicht die Washingtoner Behörde gemeint.
Abgebildet ist ein Pentagramm, ein fünfzackiger Stern in der Funktion des Er-
kennungszeichens des von P YTHAGORAS im sechsten vorchristlichen Jahrhundert
gegründeten Geheimbundes der Pythagoräer; verbindet man je zwei benachbarte
Sternspitzen des Pentagramms, so entsteht ein regelmäßiges Fünfeck, welches die
Griechen Pentagon nannten (Abb. 3.1).

Abb. 3.1 Pentagramm und Pentagon

3
p
Die Irrationalität von 2 lässt sich an der Inkommensurabilität von Seite und Diagonale eines
Quadrats feststellen, womit zumindest ein weiterer Kandidat mit Entdeckungspotenzial genannt
wäre.
4
Die Diagonale d und die Seite s des regelmäßigen Fünfecks
p genügen der Verhältnisgleichung
d
s
D d ss
mit der positiven Lösung x D ds D 12 .1 C 5/, welche als Verhältnis des Golde-
nen Schnitts bezeichnet wird. Zur Zeit des H IPPASOS war der Goldene Schnitt aber noch nicht
bekannt; wie die Pythagoräer dennoch regelmäßige Fünfecke zeichnen konnten, kann man bei
H. M ESCHKOWSKI : Denkweisen großer Mathematiker. Ein Weg zur Geschichte der Mathematik.
Vieweg Verlag, Braunschweig (1967) nachlesen.
210 3 Heurismen der Reduktion

Nach Weltsicht der Pythagoräer vermochten die natürlichen Zahlen und ihre Ver-
hältnisse das Wesen aller Dinge zu beschreiben („Alles ist Zahl“). Insbesondere
stand damit fest, dass das Verhältnis zweier gleichartiger Größen a und b stets
durch das Verhältnis zweier natürlicher Zahlen m und n beschrieben werden konn-
te: Es musste zu a und b eine Einheitsgröße e mit a D me und b D ne, ein
gemeinsames Maß von a und b, geben – wenn das Verhältnis a W b zweier gleichar-
tiger Größen kein Verhältnis m W n von Zahlen wäre, was sollte es dann sein?
H IPPASOS wies aber nach, dass die Seite s und die Diagonale d im regelmäßi-
gen Fünfeck kein gemeinsames Maß besitzen. Wir beschreiben im Folgenden seine
Argumentation in heutiger Sprechweise.
Vorgegeben seien zwei „gleichartige Größen“ (bedeutet: Elemente desselben
Größenbereichs) a und b mit a > b. Genau dann ist e ein gemeinsames Maß von a
und b, wenn e auch ein gemeinsames Maß der Größen b und a  b ist, denn es gilt:

 a D me und b D ne, a > b ” b D ne und .a  b/ D .m  n/e.

Für die neuen Größen

a1 WD maxfb; a  bg ; b1 WD minfb; a  bg

ist offenbar a1 < a, b1  b und b1  a1 erfüllt. Ist nun a1 D b1 , so hat man


mit e WD a1 D b1 ein gemeinsames Maß von a1 und b1 und deshalb auch ein
gemeinsames Maß von a und b gefunden. Ist aber a1 > b1 , so gehe man zu den
neuen Größen

a2 WD maxfb1 ; a1  b1 g ; b2 WD minfb1 ; a1  b1 g

mit a2 < a1 , b2  b1 und b2  a2 über, vergleiche a2 mit b2 und so weiter. Wenn


man bei Iteration des Verfahrens ein k mit ak D bk findet, so definiert e WD ak D bk
ein gemeinsames Maß der Größen a und b. Wenn umgekehrt klar ist, dass a und
b ein gemeinsames Maß e mit a D me, b D ne haben, dann liefert das oben
beschriebene Vorgehen spätestens nach m Schritten das gemeinsame Maß e von a
und b, wenn nicht schon vorher ein größeres gemeinsames Maß ke von a und b
gefunden wird.
Der hier beschriebene Algorithmus war schon den Pythagoräern bekannt; man
bezeichnet ihn als das Verfahren der Wechselwegnahme, weil die iterierte Handlung
darin besteht, von der größeren zweier Größen die kleinere möglichst oft wegzuneh-
men, dann den verbleibenden Rest von der kleineren möglichst oft wegzunehmen
usw. Die Wechselwegnahme dient zur Bestimmung des größten gemeinsamen Ma-
ßes zweier Größen desselben Größenbereichs; verwendet man das Verfahren im
Größenbereich der natürlichen Zahlen, so spricht man von der Urform des E U -
KLIDischen Algorithmus, mit dem sich der größte gemeinsame Teiler zweier Zahlen
a; b 2 N berechnen lässt. Die moderne Version des E UKLIDischen Algorithmus
unterscheidet sich von der Urform lediglich dadurch, dass die eventuell auftreten-
de mehrfache Subtraktion desselben Subtrahenden per Division mit Rest in einem
Verfahrensschritt zusammengefasst wird.
3.1 La Descente Infinie – der unendliche Abstieg 211

Abb. 3.2 Aneinandergesetz-


te Pentagone mit s1 C s2 D d1
und d2 D s1

H IPPASOS erkannte nun (Abb. 3.2), dass es die Geometrie des Pentagons er-
laubt,5 einem regelmäßigen Fünfeck F1 mit der Diagonalen d1 und der Seite s1 ein
kleineres Pentagon F2 anzugliedern, dessen Diagonale d2 die Länge s1 und dessen
Seite s2 die Länge d1  s1 hat.
Damit wird die Fragestellung, ob Diagonale und Seite im regelmäßigen Fünf-
eck ein gemeinsames Maß besitzen, in den Einflussbereich der Wechselwegnahme
gerückt:

 Genau dann haben die Seite s1 und die Diagonale d1 im Pentagon F1 ein gemein-
sames Maß, wenn die Seite s2 D minfs1 ; d1  s1 g D d1  s1 und die Diagonale
d2 D maxfs1 ; d1  s1 g D s1 im Pentagon F2 ein gemeinsames Maß haben.

Der Prozess, einem regelmäßigen Fünfeck Fn mit Seite sn und Diagonale dn ein
regelmäßiges Fünfeck FnC1 mit Seite snC1 D dn  sn und Diagonale dnC1 D sn
anzugliedern, ist jedoch – zumindest gedanklich – ad infinitum fortsetzbar, denn in
jedem Pentagon ist die Diagonale länger als die Seite. Abb. 3.3 veranschaulicht die
Situation mit einer passenden Figurenfolge.

Abb. 3.3 Pentagonfolge


.Fn /n mit dnC1 D sn und
snC1 D dn  sn

5
Zuerst kann man sich durch elementargeometrische Überlegungen davon überzeugen, dass in
jeder Ecke eines Pentagons mit eingezeichnetem Diagonalenstern drei gleich große Winkel von
jeweils 36ı aneinanderstoßen; mithilfe des Satzes vom Stufenwinkel ergibt sich daraus, dass im
Pentagon jede Seite und die ihr nicht anliegende Diagonale parallel sind. Damit wird die in Abb.
3.2 gezeigte Angliederung möglich.
212 3 Heurismen der Reduktion

Wären nun d1 und s1 kommensurabel, so würde die Wechselwegnahme nach


endlich vielen Schritten mit der Ermittlung eines gemeinsames Maßes e D sk D dk
für d1 und s1 abbrechen. Da aber für alle n 2 N stets dn > sn gilt, muss die
Annahme der Existenz eines gemeinsamen Maßes für d1 und s1 falsch sein, und die
Erkenntnis ist gewonnen, dass Diagonale und Seite im regelmäßigen Fünfeck nicht
kommensurabel sein können. 

Aus der Diskussion von Beispiel 3.1 lässt sich eine allgemeine Beschreibung der
Vorgehensweise extrapolieren, die F ERMAT als La Descente Infinie im Zusammen-
hang mit dem Zwei-Quadrate-Satz exemplarisch erläutert hat.

Methode des unendlichen Abstiegs


Gegeben sei eine Problemstellung mit der Eigenart, dass jede streng monoton
fallende Folge von Lösungen des Problems endlich sein muss.
Man versuche, aus der Annahme der Existenz einer Lösung des Problems
eine unendliche Folge von immer kleineren Lösungen des Problems zu kon-
struieren oder aber einen unendlichen Prozess in Gang zu setzen, der eine
geeignete Größe von Schritt zu Schritt verkleinert, obwohl diese Größe nur
endlich viele kleinere Werte als den Startwert annehmen kann.
In beiden Fällen wird die Annahme der Existenz einer Lösung des Pro-
blems zum Widerspruch geführt und damit gezeigt, dass das Problem keine
Lösung besitzt.

Diese Beschreibung der Descente Infinie macht mehrere Dinge deutlich:

 Der unendliche Abstieg kennzeichnet ein Schema strategischen Handelns, kei-


nen Algorithmus. Die wesentliche Schwierigkeit der Methode besteht in der
konkreten Gestaltung des Abstiegs, also in dem schöpferischen Prozess, aus der
angenommenen Existenz eines Objekts mit bestimmten Eigenschaften ein klei-
neres Objekt dieser Art zu konstruieren.
Hierfür gibt es weder ein universelles Verfahren noch überhaupt eine Garantie
des Gelingens, weshalb die Einordnung der Methode des unendlichen Abstiegs
als Heurismus unzweifelhaft ist, auch wenn das Verfahren demonstrativen Cha-
rakter hat.
 Eine Problemstellung verspricht dann dem Verfahren der Descente Infinie zu-
gänglich zu sein, wenn dem Problemkontext eine wohlgeordnete Struktur zu-
grunde liegt; insbesondere ist dies für Probleme der Zahlentheorie der Fall, da
der Bereich der natürlichen Zahlen durch das Prinzip vom kleinsten Element
wohlgeordnet ist. Damit ist auch die Verwandtschaft der Methode des unendli-
chen Abstiegs mit dem Extremalprinzip erklärt.

Die Leistungsfähigkeit der Methode der Descente Infinie in Problemstellungen der


Zahlentheorie soll nun an einigen Beispielen demonstriert werden.
3.1 La Descente Infinie – der unendliche Abstieg 213

p
Beispiel 3.2 (Descente Infinie und die Irrationalität von n)
Es sei n 2 N keine Quadratzahl.
p Man begründe mit dem Verfahren des unendlichen
Abstiegs, dass dann n irrational ist. p
Angenommen,
p für eine Nicht-Quadratzahl n 2 N wäre n rational. Dann könn-
te man n in der Form
p a
nD mit a; b 2 N
b
als gewöhnlichen Bruch darstellen.
p Zur Ausgestaltung des Abstiegspkonstruieren
wir aus der Bruchdarstellung n D ab eine neue Bruchdarstellung n D ab11 mit
p
b1 < b und a1 < a. Die dazu verfügbare Information über n ist, dass n nicht
ganzzahlig ist, also gibt es ein t 2 N mit t < ab < t C 1. Daraus folgt

tb < a < tb C b bzw. 0 < a  tb < b ;


p
und man könnte versuchen, eine Bruchdarstellung von n mit dem Nenner b1 WD
a  tb < b zu finden (man bemerke, dass hier die kleinere Größe b so oft wie
möglich von der größeren Größe a weggenommen wird).
Aus a2 D nb 2 ergibt sich

a nb  ta a1
a.a  tb/ D nb 2  atb D b.nb  ta/ bzw. D DW
b a  tb b1

mit 0 < b1 D a  tb < b und a1 WD nb  ta < a (wegen 0 < b1 < b und ab D ab11 ).
p p
Demnach kannpman aus jeder Bruchdarstellung n D ab von n eine neue
Bruchdarstellung n D ab11 mit b1 < b und a1 < a konstruieren; die Annahme der
p
Existenz einer Bruchdarstellung von n pführt auf die Existenz einer unendlichen
Folge . bn /n2N von Bruchdarstellungen n D abnn mit an ; bn 2 N, wobei die Fol-
an

gen .an /n2N und .bn /n2N streng monoton fallend sind. Unendliche streng monoton
fallende Folgen natürlicher Zahlen kann es aber nach dem Prinzip vom kleinsten
Element nicht geben.p
Folglich besitzt n keine Bruchdarstellung, wenn n 2 N keine Quadratzahl ist.


Beispiel 3.3 (Descente Infinie und die P ELLsche Gleichung)


Für eine Nicht-Quadratzahl d 2 N nennt man die diophantische Gleichung

x 2  dy 2 D 1

die P ELLsche Gleichung zu d . Irrtümlich hat E ULER behauptet, J OHN P ELL (1610–
1685) habe als erster Gleichungen dieses Typs studiert; auf E ULERs Irrtum beruht
die Namensgebung. Tatsächlich aber hat bereits B RAHMAGUPTA (598–ca. 670)
denjenigen, die sich als Mathematiker profilieren wollten, das Studium der Glei-
chung x 2  92y 2 D 1 empfohlen.
214 3 Heurismen der Reduktion

Man bestimme alle Lösungen der P ELLschen Gleichung zu d D 3:

x 2  3y 2 D 1 :

Die Lösungstheorie der P ELLschen Gleichung ist vollständig bekannt. Es lässt


sich zeigen, dass eine sogenannte Grundlösung . ; / 2 N 2 der P ELLschen Glei-
chung zu d existiert, aus der man alle ganzzahligen Lösungen gewinnen kann:
Genau dann löst .x; y/ 2 Z2 die P ELLsche Gleichung zu d mit der Grundlösung
. ; /, wenn
n p p o
.x; y/ 2 .xn ; yn / j xn C yn d D ˙. C d /n ; n 2 Z

gilt. Ein allgemeines Verfahren zur Bestimmung p der Grundlösung beruht auf der
Periodizität der Kettenbruchentwicklung von d .
Auch ohne nennenswerte zahlentheoretische Kenntnisse lassen sich aber die Lö-
sungen der P ELLschen Gleichung zu kleinen Nicht-Quadratzahlen d 2 N mit
heuristischen Ansätzen bestimmen, wie wir jetzt für das Beispiel d D 3 zeigen
werden.
Zunächst ist klar, dass es genügt, sich auf Lösungen im Bereich der natürlichen
Zahlen zu konzentrieren, weil jede Lösung .x0 ; y0 / 2 N 2 die ganzzahligen Lösun-
gen
.x0 ; y0 / 2 Z2 ; .x0 ; y0 / 2 Z2 ; .x0 ; y0 / 2 Z2
induziert und sich umgekehrt jede ganzzahlige Lösung .x0 ; y0 / 2 Z2 in dieser Wei-
se aus der Lösung .jx0 j; jy0 j/ 2 N 2 ergibt.
Ist nun .x0 ; y0 / 2 N 2 eine Lösung der Gleichung x 2  3y 2 D 1 mit großen
Werten x0 ; y0 2 N, so gilt

x02 1
x02 D 1 C 3y02 und deshalb D 3C 2  3;
y02 y0

woraus x0 p
 3
y0
folgt. Man könnte also auf die Idee kommen, Lösungen der P ELLschen Gleichung
zu d D 3 im Bereich der natürlichen Zahlen unterpsolchen Paaren .x; y/ 2 N 2
zu suchen, die in Bruchschreibweise xy die Zahl 3 approximieren (! lokale
Pk
p sich offenbar die Näherungsbrüche . Qk /k2N0 der Ket-
Approximation); dazu eignen
tenbruchdarstellung von 3. Es ist

p p 1
3D1C 31 D1C ;
1
1C p
2C 31
3.1 La Descente Infinie – der unendliche Abstieg 215

p
also lässt sich 3 in der Form

p 1
3D1C
1
1C
1
2C
1
1C
1
2C
1
1C
2C:::

als periodischer Kettenbruch darstellen, was man üblicherweise in Ziffernschreib-


weise in der Form
p
3 D Œ1; 1; 2; 1; 2; 1; 2; : : :  DW Œ1; 1; 2

notiert. Wir berechnen die ersten Glieder der Folge der Näherungsbrüche von
Œ1; 1; 2:

1 1 2
Œ1 D1 I D Œ1; 1 D1C D I
1 1 1
1 5 1 7
Œ1; 1; 2 D1C D I Œ1; 1; 2; 1 D1C D I
1 3 1 4
1C 1C
2 1
2C
1
19 26
Œ1; 1; 2; 1; 2 D : : : D I Œ1; 1; 2; 1; 2; 1 D : : : D :
11 15
Durch Systematisches Probieren stellt man fest, dass durch die Zahlenpaare

.x1 ; y1 / WD .2; 1/ I .x2 ; y2 / WD .7; 4/ I .x3 ; y3 / WD .26; 15/

tatsächlich Lösungen der P ELLschen Gleichung zu d D 3 gegeben sind, während


die Paare .1; 1/, .5; 3/ und .19; 11/ keine Lösungen der Gleichung liefern.
Dies gibt Anlass zu der Vermutung, dass eventuell weitere Glieder der Folge
..xk ; yk //k2N WD ..P2k1 ; Q2k1 //k2N , welche man für k 2 N in der Form
! !
2 3 xk
.x1 ; y1 / WD .2; 1/ I .xkC1 ; ykC1 / WD
t
 DW f .xk ; yk /
1 2 yk

rekursiv definieren kann, Lösungen sein könnten.


216 3 Heurismen der Reduktion

Von der Richtigkeit dieser Vermutung überzeugt man sich durch vollständige
Induktion über k:
Der Induktionsanfang ist erledigt, weil .x1 ; y1 / D .2; 1/ schon als Lösung er-
kannt wurde.
Im Induktionsschluss benutzen wir die rekursive Definition der Folge. Ist
.xk ; yk / eine Lösung, so gilt xk2  3yk2 D 1. Daraus folgt für .xkC1 ; ykC1 / D
.2xk C 3yk ; xk C 2yk /:
2
xkC1  3ykC1
2
D .2xk C 3yk /2  3.xk C 2yk /2
D 4xk2 C 12xk yk C 9yk2  3xk2  12xk yk  12yk2
D xk2  3yk2
D 1;

also ist auch .xkC1 ; ykC1 / eine Lösung, falls .xk ; yk / eine Lösung ist.
Damit ist gezeigt, dass alle Glieder der oben definierten Folge ..xk ; yk //k2N
Lösungen der P ELLschen Gleichung zu d D 3 sind. Der Nachweis, dass es kei-
ne weiteren Lösungen im Bereich der natürlichen Zahlen gibt, kann nun mit der
Methode des unendlichen Abstiegs geführt werden.
Dazu nehmen wir an, es gebe eine Lösung .u1 ; v1 / 2 N 2 der P ELLschen Glei-
chung x 2 3y 2 D 1, die nicht zur Menge M WD f.xk ; yk / j k 2 Ng gehört. Mithilfe
der inversen Abbildung f 1 zu f , die durch
! !
 1 t 2 3 u
f .u; v/ WD 
1 2 v

gegeben ist, konstruieren wir aus .u1 ; v1 / mit

.u2 ; v2 / WD f 1 .u1 ; v1 /

eine „kleinere“ Lösung (im Sinne von u2 < u1 , v2 < v1 ) der P ELLschen Gleichung
zu d D 3; von der Lösungseigenschaft kann man sich wie oben durch Nachrechnen
überzeugen, die „Verkleinerungseigenschaft“ von f 1 folgt aus der offensichtli-
chen „Vergrößerungseigenschaft“ von f .
Genau dann ist dabei .u2 ; v2 / 2 N 2 , wenn gilt:

.1/ u2 D 2u1  3v1 > 0 und .2/ v2 D u1 C 2v1 > 0

Davon überzeugen wir uns durch einen Widerspruchsbeweis:

 Wäre 2u1  3v1 , so folgte 4u21  9v12 und damit u21 C 3.u21  3v12 / D u21 C 3  0
– Widerspruch!
 Wäre u1  2v1 , so folgte u21  4v12 und damit 1 D u21  3v12  v12 , zwingend
also v1 D 1 und .u1 ; v1 / D .2; 1/ 2 M – Widerspruch!
3.1 La Descente Infinie – der unendliche Abstieg 217

Damit sind die Bedingungen (1) und (2) erfüllt, und es gilt .u2 ; v2 / 2 N 2 . Wäre
.u2 ; v2 / 2 M , so wäre auch .u1 ; v1 / D f .u2 ; v2 / 2 M – Widerspruch! Also ist
.u2 ; v2 / 2 .N 2 n M /.
Aus der Annahme der Existenz einer Lösung .u1 ; v1 / 2 .N 2 nM / der P ELLschen
Gleichung zu d D 3 lässt sich also durch

.ukC1 ; vkC1 / WD f 1 .uk ; vk / .k 2 N/

eine unendliche Folge ..uk ; vk //k2N von Lösungen in N 2 n M konstruieren, wobei


die Folgen .uk /k2N und .vk /k2N streng monoton fallend sind – dies widerspricht
der Wohlordnung von N.
Damit ist gezeigt, dass M die Menge aller Lösungen von x 2  3y 2 D 1 im
Bereich der natürlichen Zahlen ist. 

Als letztes Beispiel zum Verfahren der Descente Infinie betrachten wir einen
Klassiker, nämlich Fermats Lösung des Problems 26 aus Buch VI der Arithmetica
des D IOPHANT. F ERMAT hat dieses Problem mit der Methode des unendlichen
Abstiegs gelöst und daran seine Methode ausführlich erläutert.

Beispiel 3.4 (Descente Infinie und pythagoräische Dreiecke)


Unter einem pythagoräischen Dreieck versteht man ein rechtwinkliges Dreieck mit
ganzzahligen Seitenlängen, also zum Beispiel ein rechtwinkliges Dreieck ABC mit
der Hypotenuse c D 5 cm und den Katheten a D 3 cm und b D 4 cm.
Man begründe, dass es kein pythagoräisches Dreieck geben kann, dessen Flä-
cheninhaltsmaßzahl eine Quadratzahl ist.
Sind a und b die Katheten und c die Hypotenuse eines pythagoräischen Dreiecks
D1 , so sind a; b; c 2 N mit a2 C b 2 D c 2 , also bilden .a; b; c/ ein pythagoräisches
Zahlentripel. Behauptet wird, dass A1 D 12 ab keine Quadratzahl ist.
Zunächst stellt es keine Beschränkung der Allgemeinheit dar, wenn wir an-
nehmen, .a; b; c/ sei ein primitives pythagoräisches Tripel; sind nämlich die Flä-
cheninhalte von pythagoräischen Dreiecken mit teilerfremden Seitenlängen keine
Quadratzahlen, so gilt dies auch für alle anderen pythagoräischen Dreiecke:
Ist .a0 ; b 0 ; c 0 / ein pythagoräisches Tripel mit d WD ggT.a0 ; b 0 ; c 0 / > 1 und ist für
0 0
a WD ad , b WD bd die Zahl A WD 12 ab keine Quadratzahl, so ist auch A0 WD 12 a0 b 0 D
d 2  A keine Quadratzahl.
Nach den B RAHMAGUPTA-Formeln („indische Formeln“) lässt sich das primi-
tive pythagoräische Tripel .a; b; c/ in der Form

a D m2  n2 ; b D 2mn ; c D m2 C n2

mit m > n, ggT.m; n/ D 1, m 6 n mod 2 beschreiben. Wäre nun

1
A1 D ab D mn.m2  n2 / D mn.m C n/.m  n/
2
218 3 Heurismen der Reduktion

eine Quadratzahl, so müsste jeder der vier Faktoren eine Quadratzahl sein, weil
alle Faktoren paarweise teilerfremd sind. Es gäbe demnach natürliche Zahlen
u; v; p; q 2 N mit

m D u2 ; n D v 2 ; m C n D u2 C v 2 D p 2 und m  n D u2  v 2 D q 2 :

Da die Paritäten von m und n verschieden sind, müssen p und q beide ungerade
sein; da .m C n/ und .m  n/ teilerfremd sind, gilt dies auch für p und q. Deshalb
ist ggT.p C q; p  q/ D 2, und aus 2v 2 D .p C q/.p  q/ ergibt sich:
Es gibt r; s 2 N, r ungerade derart, dass entweder

p C q D 2r 2 und p  q D 4s 2

oder
p C q D 4s 2 und p  q D 2r 2
gilt. In jedem Fall ist aber p D r 2 C 2s 2 und q D ˙.r 2  2s 2 /, und man erhält

1 2
u2 D .p C q 2 / D .r 2 /2 C .2s 2 /2 :
2
Aus der Annahme der Existenz eines pythagoräischen Dreiecks D1 mit teilerfrem-
den Seitenlängen a; b; c und der Eigenschaft, dass der Flächeninhalt A1 D 12 ab
dieses Dreiecks eine Quadratzahl ist, können wir also ein pythagoräisches Drei-
eck D20 mit den Seitenlängen r 2 ; 2s 2 ; u konstruieren, dessen Flächeninhalt A02 D
r  2s 2 D .rs/2 wieder eine Quadratzahl ist und für den
1 2
2

1 2 n 1 1
A02 D r 2 s 2 D .p  q 2 / D < nm.m2  n2 / D A1
8 4 4 4

gilt. Ist das pythagoräische Tripel .r 2 ; 2s 2 ; u/ primitiv, so setze man D2 WD D20 ;


ist .r 2 ; 2s 2 ; u/ nicht primitiv, so betrachte man das primitive pythagoräische Tripel
.a2 ; b2 ; c2 /, welches .r 2 ; 2s 2 ; u/ erzeugt, und wähle als pythagoräisches Dreieck D2
dasjenige, dessen Seiten durch a2 ; b2 ; c2 gegeben sind.
In jedem Fall gilt für den Flächeninhalt A2 des pythagoräischen Dreiecks D2 mit
teilerfremden Seitenlängen:

1
A2 < A1 und A2 ist eine Quadratzahl :
4
Iteration dieser Konstruktion liefert eine unendliche Folge .Dn /n2N pythagoräi-
scher Dreiecke, deren Flächeninhaltsfolge .An /n2N eine streng monoton fallende
Folge von Quadratzahlen definiert – eine solche Folge kann es nicht geben.
Damit ist gezeigt, dass es kein pythagoräisches Dreieck geben kann, dessen Flä-
cheninhaltsmaßzahl eine Quadratzahl ist. 

In den Schriften F ERMATs werden viele Resultate ohne Beweis genannt, aber
immer wieder finden sich Hinweise auf die Methode der Descente Infinie. Mithilfe
3.2 Rückwärtsarbeiten und Pappos-Prinzip 219

der Werke späterer Mathematiker wie E ULER und L AGRANGE, die selbst in ih-
ren Arbeiten das Verfahren des unendlichen Abstiegs verwendeten, gelingt es aber,
wichtige Argumentationen von F ERMAT zu rekonstruieren.
Insofern profitiert die mathematische Nachwelt davon, dass F ERMAT die Metho-
de der Descente Infinie zu seinen wichtigsten Errungenschaften zählte; die Beispiele
sollten verdeutlicht haben, wie effektiv das Verfahren tatsächlich in manchen Pro-
blemstellungen der Zahlentheorie eingesetzt werden kann.

3.2 Rückwärtsarbeiten und Pappos-Prinzip

In Analogie zum Vorwärtsarbeiten (Abschn. 2.1.1) ließe sich auf der Basis der Pro-
blemraumhypothese nach N EWELL und S IMON das Rückwärtsarbeiten erklären: Es
geht um die Suche nach einem Weg im Problemraum, der von einem Zielzustand
(Z) zum Anfangszustand (A) (den Daten des Problems) führt.
Diese Deutung des Rückwärtsarbeitens ist in der Literatur vielfach anzutreffen,
wird der Vorgehensweise aber nicht gerecht, weil sie einen sehr wichtigen Aspekt
unbeachtet lässt. Generell muss zwischen ungerichteten Graphen und gerichteten
Graphen unterschieden werden – findet man also einen Weg von (Z) nach (A), so
ist nicht immer gewährleistet, dass man den gleichen Weg in umgekehrter Richtung
von (A) nach (Z) gehen kann!6 Genauer geht also darum, ausgehend von (Z) solche
Wege zu finden, die von (A) auf (Z) hin gerichtet oder vielleicht sogar bidirektional
sind.
Sehen wir uns zunächst ein einfaches Beispiel aus P ÓLYAs „Schule des Den-
kens“ an, anhand dessen die Situation mit einigen passenden Ergänzungen erläutert
werden kann.

Beispiel 3.5 (Umfüllversuche)


Wie kann man einem genügend großen Wasservorrat genau 6 Liter Wasser entneh-
men, wenn einem dazu nur zwei Gefäße zur Verfügung stehen, und zwar eines mit
einem Fassungsvermögen von 9 ` und ein anderes mit einem Fassungsvermögen
von 4 `?
Zunächst lässt sich feststellen, dass das Problem lösbar ist. Offenbar ist für jedes
c 2 Z die lineare diophantische Gleichung

9x C 4y D c

6
Beispiele für dieses Phänomen lassen sich etwa im Zusammenhang mit „Gewinnumformungen“
algebraischer Gleichungen finden: Sucht man Lösungen von Wurzelgleichungen, so besteht das
übliche Vorgehen darin, durch Umformungen der Gleichung, die im Allgemeinen keine Äqui-
valenzumformungen sind, Kandidaten für Lösungen zu finden und die gefundenen Kandidaten
mittels einer Probe darauf zu testen, ob es sich wirklich um Lösungen handelt. Durch mehrfaches
Quadrieren
p und Umsortieren
p ließe sich beispielsweise folgern, dass jede Lösung der Wurzelglei-
chung 2x  7  2x C 1 D 4 in der Menge D WD fx 2 R j x  72 g, auch eine Lösung der
Gleichung 2x C 1 D 9 sein müsste; die Probe ergibt aber, dass die einzige Lösung x D 4 der
linearen Gleichung keine Lösung der Wurzelgleichung ist.
220 3 Heurismen der Reduktion

lösbar, weil 1 D ggT.9; 4/ ein Teiler von c ist. Stünde jetzt ein drittes Gefäß (nicht
notwendig skaliert, aber mit situationsabhängig hinreichend großem Fassungsver-
mögen) zur Verfügung, so wäre jede beliebige Vielfachensummendarstellung n D
˛ 9Cˇ4 jeder Zahl n 2 N in den Koeffizienten 9 und 4 realisierbar. Offensichtlich
muss in einer solchen Darstellung mindestens eine der beiden Zahlen ˛; ˇ 2 Z po-
sitiv sein; ohne Beschränkung der Allgemeinheit sei ˛ > 0. Dann fülle man ˛-mal
das 9 `-Gefäß mit Wasser und entleere seinen Inhalt in das große Sammelgefäß. Ist
auch ˇ > 0, so fülle man ˇ-mal das 4 `-Gefäß mit Wasser aus dem Wasservorrat
und füge den Inhalt dem Wasser im Sammelgefäß hinzu; ist hingegen ˇ < 0, so
entnehme man dem Sammelgefäß jˇj-mal ein gefülltes 4 `-Gefäß mit Wasser. In
beiden Fällen befinden sich am Ende n D ˛  9 C ˇ  4 Liter Wasser im dritten
Gefäß.
Wenn kein drittes Gefäß zur Verfügung steht, so schränkt dies die abmessbaren
Wassermengen ein – mehr als 13 ` Wasser insgesamt lassen sich in einem 9 `-Gefäß
und in einem 4 `-Gefäß nicht unterbringen. Die physikalische Realisierbarkeit der
Operationen C4 ` und C9 ` (eine Füllung des betreffenden Gefäßes hinzufügen)
bzw. 4 ` und 9 ` (eine Füllung des betreffenden Gefäßes wegnehmen) und al-
ler Kompositionen davon, welche sich im Bereich n ` (1  n  13) bewegen, ist
jedoch unabhängig von der Existenz eines dritten Gefäßes; alle Mengen von n `
Wasser, n 2 f1; : : : ; 13g können mit den beiden Gefäßen abgemessen werden, ins-
besondere auch 6 `.
Kennt sich der Problemlöser in der Theorie der linearen diophantischen Glei-
chungen aus, so kann er die Lösungsmenge

L D f.2 C 4t; 3  9t/ j t 2 Zg

der Gleichung 9x C 4y D 6 bestimmen und daraus die „Minimallösungen“ der


Gleichung herausfiltern, welche die bequemsten Möglichkeiten bieten, 6 ` Wasser
mit den beiden Behältern abzumessen:

 Unter allen Lösungen .x; y/ 2 L mit x > 0 hat die Lösung .2; 3/ minimale
1-Norm.7
 Unter allen Lösungen .x; y/ 2 L mit x < 0 hat die Lösung .2; 6/ minimale
1-Norm.

Offenbar bestimmt die 1-Norm einer Lösung der Gleichung die Anzahl der zur
physikalischen Realisierung der Lösung notwendigen Vorgänge der Messgefäßfül-
lungen/Messgefäßentleerungen.
Wegen k.2; 3/k1 D 5 < 8 D k.2; 6/k1 würde man also 6 ` Wasser in der
Form 6 ` D 2  9 `  3  4 ` mit dem geringsten Aufwand abmessen.
Kennt man sich in der Theorie der linearen diophantischen Gleichungen nicht
aus, so kann man vermutlich nicht a priori beurteilen, ob das Problem lösbar ist
oder nicht.
Dennoch findet man die beiden Minimallösungen, wenn man systematisch mit
einem der beiden Gefäße dem Wasservorrat (mehrfach) a ` Wasser entnimmt und

7
Unter der 1-Norm von .x; y/ versteht man k.x; y/k1 WD jxj C jyj.
3.2 Rückwärtsarbeiten und Pappos-Prinzip 221

von der entnommenen Wassermenge (mehrfach) b ` durch Ausgießen des anderen


Gefäßes entfernt – mehr braucht man von den Deutungen der Rechenoperationen
Addition und Subtraktion unter dem kardinalen Zahlaspekt nicht verstanden zu ha-
ben. Insofern setzt P ÓLYAs Kommentar zur Problemsituation die falschen Akzente:

Wir fangen mit den zwei leeren Eimern an, wir versuchen dies und das, wir leeren und fül-
len, und wenn es uns nicht gelingt, fangen wir wieder von vorne an und versuchen etwas
anderes. Wir arbeiten vorwärts, von der gegebenen Anfangssituation zu der erstrebten End-
situation, von den Daten zu der Unbekannten. Es mag uns nach vielen Versuchen zufällig
gelingen.

Der Zufall spielt bei einer Vorwärtsstrategie zur Lösung des Problems („Wir fangen
mit den zwei leeren Eimern an“) keine Rolle!
Dies kann man unschwer an den beiden nachfolgend dargestellten Realisationen
der Minimallösungen .2; 3/ und .2; 6/ erkennen (Abb. 3.4).

Abb. 3.4 Operationsketten der Minimallösungen .2; 6/ (links) bzw. .2; 3/ (rechts)
222 3 Heurismen der Reduktion

In Abb. 3.4 wird links die physikalische Verwirklichung der Lösung .2; 6/ il-
lustriert. Geschöpft wird Wasser mit dem 4 `-Gefäß, weggeschüttet wird Wasser mit
dem 9 `-Gefäß. Dies manifestiert sich in Verkettungen von Operationen der Typen
C4 ` und 9 `, die ausgehend von der Anfangssituation (beide Eimer leer) so erfol-
gen müssen, dass sämtliche Zwischenergebnisse den zulässigen Bereich zwischen
1 ` und 13 ` nicht verlassen. Mathematisch können also höchstens drei Operatoren
.C4/ hintereinander ausgeführt werden, bevor ein Operator .9/ eingesetzt werden
muss; physikalisch sorge man einfach dafür, dass das 9 `-Gefäß ausgeschüttet wird,
sobald es vollständig gefüllt ist.
Die der Darstellung
6 ` D 2  9 ` C 6  4 `
entsprechende Überführung des Anfangszustands 0 ` in den Zielzustand 6 ` rea-
lisiert man dann durch die Operatorkette

(+4 ) (+4 ) (+4 ) (−9 ) (+4 ) (+4 ) (−9 ) (+4 )


0 6

Die physikalische Verwirklichung der Lösung .2; 3/ (Abb. 3.4, rechts) ist we-
niger aufwändig, wie es schon a priori durch Vergleich der 1-Normen der Lösungen
prognostiziert werden konnte.
Diesmal wird Wasser mit dem 9 `-Gefäß geschöpft und mit dem 4 `-Gefäß aus-
geschüttet; dabei entstehen Operatorketten der Elemente C9 ` und 4 `, die den
zulässigen Bereich zwischen 1 ` und 13 ` nicht verlassen, weil jederzeit so oft wie
möglich 4 ` von der bereits geschöpften Wassermenge weggenommen und erst da-
nach weitere 9 ` hinzugefügt werden.
Die der Darstellung
6` D 2 9` 34`
entsprechende Überführung des Anfangszustands 0 ` in den Zielzustand 6 ` er-
folgt über die Operatorkette

(+9 ) (−4 ) (−4 ) (+9 ) (−4 )


0 6

P ÓLYA selbst favorisiert in dieser Problemsituation das Rückwärtsarbeiten. Er


schlägt vor, man möge sich fragen, aus welchen Vorzuständen (V) sich der Zielzu-
stand (Z) (Abmessung von 6 ` Wasser) erreichen ließe, und anschließend versuchen,
einen dieser Vorzustände zu erreichen.
Nicht alle Zustände, die man aus (Z) herstellen kann, kommen als geeigneter
Vorzustand (V) infrage; zum Beispiel wäre die vollständige Befüllung des im End-
zustand 6 ` Wasser enthaltenden 9 `-Gefäßes möglich, aber aus diesem Zustand
kommt man nicht unmittelbar nach (Z) zurück!
Kandidaten sind nur diejenigen Konstellationen, welche durch umkehrbare Ope-
rationen aus (Z) herzustellen sind, also genau diejenigen, welche Resultate der
Anwendung eines Operators C4 `, 4 ` sind!
3.2 Rückwärtsarbeiten und Pappos-Prinzip 223

Auf diese Weise liefert das Rückwärtsarbeiten als Lösungspläne die von unten
nach oben gelesenen Operationsfolgen der Abb. 3.4; die Ausführung dieser Lö-
sungspläne geschieht dann progressiv wie beschrieben.
Das Verfahren ist also eine Analysis-Synthesis-Prozedur nach dem Vorbild der
griechischen Geometer, wie wir sie in Abschn. 2.1.2 eingeführt haben; das zentrale
Element dieser Prozedur, die Analysis, entspricht dabei dem Rückwärtsarbeiten. 

Als heuristischen Kreislauf kann man die Methode des Rückwärtsarbeitens über
das Fragenpaar (Teilzielfrage, Hilfsmittelfrage) charakterisieren, wie wir es auch
schon für das Vorwärtsarbeiten vorgenommen haben; die Problematik der Orientie-
rung von Wegen in Lösungsgraphen wird dabei berücksichtigt.

Rückwärtsarbeiten als heuristischer Kreislauf

(T) Zunächst versuche man, eine Antwort auf folgende Teilzielfrage zu fin-
den:
Woraus ließe sich
8 9 8 9
< die gesuchte Größe = < berechnen =
die Behauptung unmittelbar herleiten ‹
: ; : ;
die gesuchte Figur konstruieren

(H) Gelingt dies nicht, beantworte man zuerst die Frage nach geeigneten
Hilfsmitteln:
8 9
ˆ In welchen Formeln kommt die gesuchte Größe vor >
ˆ
ˆ >
>
ˆ
ˆ >
>
< Welche Sätze enthalten ähnliche Bedingungen =
Welchen konstruierbaren Teilfiguren enthält die gesuchte ‹
ˆ
ˆ >
>
ˆ
ˆ Figur, und welche Zusammenhänge darüber sind bekannt >
>
:̂ :: >
;
:

Ist die Hilfsmittelfrage beantwortet, wähle man ein „chancenreiches“


Hilfsmittel aus und gehe mit diesen neuen Informationen zurück nach (T).

Es liegt auf der Hand, dass eine Kernschwierigkeit der Vorgehensweise „Hilfs-
mittelfrage vor Teilzielfrage“ in der Auswahl eines „chancenreichen“ Hilfsmittels
besteht. Dieser Problematik versucht H ELMUT KÖNIG in seiner Anleitung zum
Rückwärtsarbeiten8 dadurch gerecht zu werden, dass er – insbesondere beim Lösen
geometrischer Beweisaufgaben – einen Hilfsmittelspeicher anzulegen empfiehlt.

8
KÖNIG , H: Einige für den Mathematikunterricht bedeutsame heuristische Vorgehensweisen. MU
38, Heft 3 (1992).
224 3 Heurismen der Reduktion

Für die Aufgabe des Nachweises eines identischen Winkelmaßes zweier Winkel
˛ und ˇ listet er sinngemäß die folgende Auswahl verschiedenartiger Hilfsmittel
auf:

 Existenz einer Bewegung mit .˛/ D ˇ


 Winkelgleichheit einander entsprechender Winkel in ähnlichen oder sogar kon-
gruenten Dreiecken
 Winkelgleichheit von Basiswinkeln in gleichschenkligen Dreiecken oder Trape-
zen
 Stufen- oder Wechselwinkel an Parallelen
 Gegenwinkel in Parallelogrammen
 Peripheriewinkel über gleichen Bögen
 Existenz eines Winkels  mit  D ˛ und  D ˇ

Angeregt wird hier die Schaffung beziehungsreichen epistemischen Wissens, wie es


im Zusammenhang mit den Heurismen der Variation angesprochen wurde. Wenn
die epistemische Struktur des Problemlösers genügend ausgebaut ist (und in dieser
Funktion muss das Anlegen eines Hilfsmittelspeichers im oben beschriebenen Sin-
ne gesehen werden), dann lassen sich Probleme dadurch lösen, dass sie mit dem zur
Problemlösung erforderlichen bereichsspezifischen Wissen des Problemlösers ver-
netzt werden – die heuristische Struktur des Problemlösers braucht in diesem Fall
nicht einzugreifen.
Eine heuristische Empfehlung bei der Suche nach Antworten auf die Teilzielfra-
ge wäre hingegen diese:

Kanalisiertes Rückwärtsarbeiten (Pappos-Prinzip)


Auf der Suche nach Teilzielen beim Rückwärtsarbeiten, die geeignete Vorzu-
stände (V) des Zielzustands (Z) definieren, unterziehe man den Zielzustand
(Z) invertierbaren Transformationen. Das Ergebnis (Z’) einer jeden solchen
Transformation ist ein Teilziel, welches das unmittelbare Erreichen von (Z)
ermöglicht.

Bei dieser Vorgehensweise garantiert die Invertierbarkeit der benutzten Trans-


formationen die Bidirektionalität der Wege zwischen (Z) und (Z’); der heuristische
Charakter der Methode kann daran abgelesen werden, dass a priori nicht klar ist,
welche invertierbare Transformation einen Zustand (Z’) herbeiführt, der von den
Problemdaten her erreichbar ist.
Im Kontext der konstruktiven Geometrie müsste hier die Frage beantwortet wer-
den, welche Figuren, die sich durch invertierbare Abbildungen aus (Z) herstel-
len lassen, aus den Problemdaten konstruierbar sind; in der konstruktiven Geo-
metrie ist die „kanalisierte“ Variante des Rückwärtsarbeitens unter dem Namen
3.2 Rückwärtsarbeiten und Pappos-Prinzip 225

„Pappos-Prinzip“ bekannt, was nicht verwundert, wenn man an die Beschreibung


der Analysis-Synthesis-Prozeduren durch Pappos von Alexandria denkt.

Beispiel 3.6 (Sehnenvierecke – PAPPOS-Prinzip)


Man konstruiere ein konvexes Sehnenviereck ABCD, dessen Seitenlängen
jABj D a jBC j D b
jCDj D c jDAj D d
die Zusatzbedingung a D b erfüllen.

Das gesuchte Sehnenviereck ließe sich unmittelbar konstruieren, wenn der Radi-
us seines Umkreises gegeben wäre, ebenso, wenn man ein Teildreieck konstruieren
könnte; beides lässt die Datenlage aber nicht zu.
Wir folgen der Idee des PAPPOS und suchen geeignete Teilziele unter den Zu-
ständen, die sich durch eine invertierbare Transformation aus dem in der Problem-
beschreibung veranschaulichten Endzustand ergeben. Kanonische Kandidaten für
solche Transformationen sind die Elemente der einzelnen Abbildungsgruppen; da
es sich um eine Problemstellung der Kongruenzgeometrie handelt (mit den Seiten-
längen sind Informationen vorgegeben, die nicht unter allgemeinen affinen Abbil-
dungen oder Ähnlichkeitsabbildungen, sondern nur unter Kongruenzabbildungen
invariant bleiben (! Invarianzpinzip)), sollte man Kongruenzabbildungen in Be-
tracht ziehen.
Wegen jABj D jBC j ist es naheliegend, eine Kongruenzabbildung auszufüh-
ren, die CB auf AB abbildet; dafür kommen sowohl eine geeignete Drehung ı um
B als auch die Spiegelung  an der Mittelsenkrechten von AC infrage. Da aber
 .fA; B; C g/ D fA; B; C g gilt und damit (Z) durch die Spiegelung nur marginal
verändert würde, ist zu vermuten, dass die Anwendung von ı größere Aussicht auf
Erfolg haben sollte.
Sei also ı die Drehung um B mit ı.C / D A und sei D 0 WD ı.D/. Dann ist
BAD 0 das Bilddreieck von BCD unter der Drehung ı, und die Punkte D; A
und D 0 sind kollinear, weil der Winkel ^DAD 0 bei A als Summe der Innenwinkel
des Sehnenvierecks bei A und bei C ein gestreckter Winkel sein muss9 (Abb. 3.5).

9
Bekanntlich ist ein konvexes Viereck genau dann ein Sehnenviereck, wenn die Winkelsumme
einander gegenüber liegender Innenwinkel jeweils 180ı beträgt.
226 3 Heurismen der Reduktion

Abb. 3.5 Dreieck BCD und


Bilddreieck BAD 0 unter der
Drehung ı

Wegen ı.BD/ D BD 0 ist das Dreieck DD 0 B gleichschenklig, und A 2 DD 0


teilt die Basis dieses gleichschenkligen Dreiecks im Verhältnis d W c.
Damit liegen genügend viele Informationen vor; das gleichschenklige Dreieck
DD 0 B mit dem Punkt A auf seiner Basis ist aus den Daten der Problemstellung
konstruierbar:

 Man zeichne die Strecke DD 0 mit jDD 0 j D d C c.


 Man zeichne einen Kreis um D mit dem Radius r D d ; dieser Kreis schneidet
DD 0 im Punkt A, der die Strecke DD 0 im Verhältnis d W c teilt.
 Die Mittelsenkrechte von DD 0 und der Kreis um A mit dem Radius r D a
schneiden sich im Punkt B.

Nun ist ein vom Anfangszustand (A) (Problemdaten) her erreichbarer Zustand (Z’)
realisiert, aus dem sich durch Anwendung der zu ı inversen Drehung der Endzu-
stand (Z) (Konvexes Sehnenviereck mit gegebenen Abmessungen) herstellen lässt:
Ist ı 1 die Drehung um B, die D 0 auf D abbildet, so ergibt sich der noch fehlende
Punkt C des gesuchten Sehnenvierecks als der Bildpunkt C WD ı 1 .A/ von A unter
ı 1 .10 Damit ist das Konstruktionsproblem gelöst. 

Die Leistungsfähigkeit des PAPPOS-Prinzips im Kontext elementargeometri-


scher Problemstellungen sollte damit demonstriert worden sein. Welcher Art aber
sind Problemsituationen, in denen man mit der restriktiven Suche nach Zwischen-
zielen, durch die sich das PAPPOS-Prinzip auszeichnet, nicht zum Ziel kommen
kann?
Klar ist, dass die Verwendbarkeit des PAPPOS-Prinzips in allen Problemstellun-
gen, die in irgendeiner Form eine Optimierungsaufgabe zum Gegenstand haben, in
Frage zu stellen ist:
Könnte man nämlich eine invertierbare Transformation T angeben, die aus
einer optimalen Lösung eine weniger gute Lösung herstellt, so wäre T 1 ein
„Lösungsverbesserungs-Operator“, den man einfach nur iterieren müsste, um zu ei-
ner optimalen Problemlösung zu gelangen. Optimierungsprobleme mit

10
Alternativ kann man natürlich C auch als den Schnittpunkt der Kreise um B mit Radius b und
um D mit Radius c gewinnen.
3.2 Rückwärtsarbeiten und Pappos-Prinzip 227

zugehörigen Operatoren dieser Art mag es geben, aber im Regelfall wird man
auf die allgemeinere Suche nach Zwischenzielen zurückgreifen müssen.
Zur Illustration möchte ich wieder die Thematik der Lotto-Designs aufgreifen,
deren zentrale Begrifflichkeiten schon in Beispiel 2.2 vorgestellt wurden.

Beispiel 3.7 (Lotto-Designs II – Rückwärtsarbeiten)


(1) Gegeben seien die n-Menge An D f1; : : : ; ng sowie ein .m; t/-Lotto-Design
S D fS1 ; : : : ; Sk g der Länge k zu An . Aus welchen einfacheren Lotto-Designs
lässt sich S konstruieren?
(2) Man verwende die Erkenntnisse aus (1), um ein möglichst gutes .6; 5/-Lotto-
Design zu A9 D f1; : : : ; 9g zu konstruieren.
Die Aufgabenstellung zerlegt die gesuchte Analysis-Synthesis-Prozedur in zwei
Teile: Teil (1) entspricht der Analyse, Teil (2) der Synthese.
Zur Beantwortung der Teilzielfrage (1) beobachte man zunächst, dass ein „ein-
facheres“ Lotto-Design SQ sich durch folgende Merkmale auszeichnen könnte:

 SQ könnte ein .m; t/-Lotto-Design zu An sein, dessen Länge kQ größer ist als k –
je mehr m-Blöcke ein .m; t/-Design zu An enthält, desto einfacher ist es.
 SQ könnte ein Lotto-Design zu An1 sein – je weniger Systemzahlen ein System
verarbeiten muss, desto einfacher ist es.

Die erste Idee wurde schon in Beispiel 2.2 verfolgt; dort haben wir die Längen
von Lotto-Designs sukzessive durch einen Streichalgorithmus reduziert; wenden
wir uns also der zweiten Idee zu:

Wie kann man ein .m; t/-Lotto-Design SQ zu An1 in ein .m; t/-Lotto-Design S
zu An überführen?

Offenbar zerfällt für m < n die Menge Pm .An / aller m-elementigen Teilmengen
von An in zwei Klassen: Klasse 1 besteht aus denjenigen m-Teilmengen von An ,
die n enthalten, und Klasse 2 besteht aus denjenigen m-Teilmengen von An , die n
nicht enthalten. Bei den m-Teilmengen der Klasse 2 handelt es sich offensichtlich
um die m-Teilmengen von An1 ; man beachte nun, dass alle m-Teilmengen von
An1 von mindestens einem der Blöcke aus SQ repräsentiert werden, denn SQ ist ein
.m; t/-Lotto-Design zu An1 .
Man muss also lediglich SQ mit einem solchen System S 0 von m-Teilmengen von
An vereinigen, dessen Blöcke jede der m-Teilmengen von An repräsentieren, die
das Element n enthalten. Dies ist offenbar dann der Fall, wenn die m-Blöcke des
Systems S 0 D fS10 ; : : : ; Sk0 0 g folgende Eigenschaften haben:

 Jeder m-Block aus S 0 ist von der Form Si0 D SOi [fng mit einer .m1/-Teilmenge
SOi von An1 .
 Das System SO WD fSO1 ; : : : ; SOk 0 g ist ein .m  1; t  1/-Lotto-Design zu An1 .
228 3 Heurismen der Reduktion

Damit ist die Analyse des Reduktionsschritts abgeschlossen, und wir können als
Resultat festhalten:

Konstruktion .m; t/-Design zu An1 aus .m; t/-Design zu An


Ist
SQ D fSQ1 ; : : : ; SQk1 g ein .m; t/-Lotto-Design zu An1
und ist

SO D fSO1 ; : : : ; SOk2 g ein .m  1; t  1/-Lotto-Design zu An1 ;

so definiert
(
SQi für 1  i  k1
S D fS1 ; : : : ; Sk1 Ck2 g mit Si WD
SOi k1 [ fng für k1 < i  k1 C k2

ein .m; t/-Lotto-Design zu An .

Wir nutzen nun diese Erkenntnis zur Bearbeitung des Aufgabenteils (2). Um
mittels des oben beschriebenen Konstruktionsverfahrens ein möglichst gutes .6; 5/-
Lotto-Design zu A9 zu gewinnen, starte man die Synthesis mit optimalen .6; 5/-
und .5; 4/-Lotto-Designs zu A7 .

 SQ WD fSQ1 g mit SQ1 WD f1; 2; 3; 4; 5; 6g ist ein optimales .6; 5/-Lotto-Design zu A7 .

Dies ist offensichtlich, denn jede 6-Teilmenge von A7 trifft SQ1 in wenigstens 5 Ele-
menten, und weniger als einen Block kann ein Lotto-Design nicht haben.

 SO D fSO1 ; SO2 ; SO3 g mit

SO1 WD f1; 2; 3; 4; 7g ; SO2 WD f1; 2; 5; 6; 7g ; SO3 WD f3; 4; 5; 6; 7g

ist ein optimales .5; 4/-Lotto-Design zu A7 .

Dies ist nicht offensichtlich, lässt sich aber verifizieren.


Sei T  A7 eine beliebige 5-Teilmenge. Trifft T den Block SO1 in mindestens 4
Elementen, so wird T von SO1 repräsentiert. Trifft T den Block SO1 in höchstens 3
Elementen, so muss A7 n SO1 D f5; 6g  T gelten. Würde nun T weder von SO2 noch
von SO3 repräsentiert, so hätte dies

jT \ f1; 2; 7gj  1 und jT \ f3; 4; 7gj  1

zur Folge, sodass T n f5; 6g nur höchstens zwei Elemente enthalten könnte – dies
steht im Widerspruch zur Tatsache, dass T fünfelementig ist. Damit ist SO als .5; 4/-
Lotto-Design zu A7 erkannt.
3.2 Rückwärtsarbeiten und Pappos-Prinzip 229

Aus weniger als 3 Blöcken kann ein .5; 4/-Lotto-Design zu A7 aber nicht
bestehen:

 Ein fester 5-Block B  A7 repräsentiert genau elf 5-Teilmengen von A7 ,


nämlich B selbst und alle 5-Teilmengen der Form B 0 [ fxg, wobei B 0 eine
4-Teilmenge von B und x 2 A7 n B sind – davon gibt es 54  2 D 10 Exemplare.

 Könnte man also nun jede der 75 D 21 fünfelementigen Teilmengen aus A7 mit
einem System SO 0 D fSO10 ; SO20 g von nur zwei 5-Blöcken SO10 ; SO20 repräsentieren, so
dürfte es nur höchstens eine fünfelementige Teilmenge von A7 geben, die sowohl
von SO10 als auch von SO20 repräsentiert wird – von dieser Sorte gibt es aber mehr,
weil SO10 und SO20 mindestens drei Elemente gemeinsam haben!11

Folglich ist SO ein optimales .5; 4/-Lotto-Design zu A7 .


Gemäß der in (1) erarbeiteten Konstruktionsvorschrift setzen sich das .6; 5/-
Lotto-Design SQ und das .5; 4/-Lotto-Design SO zu A7 zu einem .6; 5/-Lotto-Design
S zu A8 zusammen, wenn man S D fS1 ; : : : ; S4 g mit

S1 WD f1; 2; 3; 4; 5; 6g ; S2 WD f1; 2; 3; 4; 7; 8g ;
S3 WD f1; 2; 5; 6; 7; 8g ; S4 WD f3; 4; 5; 6; 7; 8g

definiert.
Mit ähnlichen kombinatorischen Überlegungen wie oben kann man sich davon
überzeugen, dass es kein .6; 5/-Lotto-Design zu A7 mit weniger als 4 Blöcken geben
kann – das Design S ist optimal! Wir haben also gemäß der in (1) ausgearbeiteten
Konstruktionsvorschrift aus optimalen Lotto-Designs zu A7 ein optimales Lotto-
Design zu A8 hergestellt, so dass vielleicht Grund zur Hoffnung besteht, dass man
aus diesem optimalen .6; 5/-Lotto-Design zu A8 und einem ebenfalls optimalen
.5; 4/-Lotto-Design zu A8 ein .6; 5/-Lotto-Design minimaler Länge zu A9 herstel-
len könnte.
Zu diesem Zweck betrachten wir das System SO WD fSO1 ; : : : ; SO5 g mit

SO1 D f1; 2; 3; 4; 5; g ; SO2 W D f1; 2; 6; 7; 8g ; SO3 WD f3; 4; 5; 6; 7g ;


SO4 W D f3; 4; 5; 6; 8g ; SO5 W D f3; 4; 5; 7; 8g

Dieses System SO ist tatsächlich ein .5; 4/-Lotto-Design minimaler Länge zu A8 ,


aber im Hinblick auf unser Ziel, ein möglichst gutes .6; 5/-Lotto-Design zu A9 zu
konstruieren, ist es vertretbar, auf den Nachweis dafür zu verzichten. Das aus S
und SO gemäß (1) konstruierte .6; 5/-Lotto-Design zu A9 hätte nämlich die Länge

11
Ist T WD SO10 \ SO20 mit jT j D 3, so gibt es genau vier 5-elementige Teilmengen, die von beiden
Blöcken des Systems SO 0 repräsentiert werden, nämlich die 5-Teilmengen der Form T [ fxg [ fyg
mit x 2 SO10 n T und y 2 SO20 n T . Ist jT j > 3, so haben SO10 und SO20 noch mehr als 3 Elemente
gemeinsam, sodass es noch mehr als 4 fünfelementige Teilmengen von A7 gibt, die sowohl von SO10
als auch von SO20 repräsentiert werden.
230 3 Heurismen der Reduktion

4 C 5 D 9, und in Beispiel 2.2 haben wir bereits ein besseres .6; 5/-Lotto-Design
der Länge 8 zu A9 konstruiert.
Dies macht deutlich, dass die Analysis-Synthesis-Konstruktion von Lotto-
Designs nicht die geeignete Methode zur Gewinnung bestmöglicher Designs ist;
wir werden später noch eine andere Technik am Beispiel eines .6; 5/-Designs zu
A12 vorstellen (Beispiel 3.11). 

Der Rest des Paragraphen über das Rückwärtsarbeiten soll noch einmal dem
Satz von Steiner und Lehmus gehören, der in Beispiel 1.38 behandelt wurde und für
den ein direkter Beweis mit abbildungsgeometrischen Methoden wünschenswert
schien. Wir werden einige Reduktionsschritte einer Analysis-Synthesis-Prozedur
durchführen, die zeigen werden, dass die früher prognostizierten Probleme Realität
werden.

Beispiel 3.8 (S TEINER und L EHMUS II – Analysis-Synthesis-Prozedur)


In Beispiel 1.38 wurde eine verschärfte Kontraposition folgender Aussage bewie-
sen:
In einem Dreieck ABC mit den Standardbezeichnungen seien D der Schnitt-
punkt der Innenwinkelhalbierenden von ˛ mit der Dreiecksseite a und E der
Schnittpunkt der Innenwinkelhalbierenden von ˇ mit der Dreiecksseite b. Falls
dann die inneren Winkelhalbierenden AD und BE gleich lang sind, so ist das
Dreieck ABC gleichschenklig mit jAC j D jBC j bzw. ˛ D ˇ.
Lassen sich aus den determinierenden Bestandteilen der Problemstellung Ele-
mente einer Anaylsis-Synthesis-Prozedur gewinnen, die einen direkten abbildungs-
geometrischen Beweis des Satzes erlauben?
Ein determinierendes Element der Randsituation ˛ D ˇ (Extremalprinzip, Kor-
respondenzhypothese) ist die Existenz eines Umkreises des Vierecks ABDE:
Ist ˛ D ˇ, so sind die Dreiecke ABD und BAE kongruent (wsw), wor-
aus neben jADj D jBEj (gleiche Länge der inneren Winkelhalbierenden!) auch
jAEj D jBDj folgt.

C C

E D E D

A B A B

Abb. 3.6 jAEj D jBDj und ABjjDE


3.2 Rückwärtsarbeiten und Pappos-Prinzip 231

Wegen jCAj D jCBj ist dann auch jCEj D jCDj, sodass sich mit der Um-
kehrung des 1. Strahlensatzes ABjjDE ergibt (Abb. 3.6). Da aber Stufenwinkel an
Parallelen gleich groß sind, schließt man auf
^AED D ^BDE D 180ı  ˛ ;
sodass sich im Viereck ABDE einander gegenüberliegende Winkel zu 180ı ergän-
zen und es sich deshalb um ein Sehnenviereck handelt (Abb. 3.7).

C C

E D E D

A B A B

Abb. 3.7 Schluss auf ˛ D ˇ

Die Existenz des Umkreises von ABDE bedingt andererseits ˛ D ˇ, weil ˛2 und
ˇ
2 als Peripheriewinkel über der Sehne DE dieses Kreises gleich groß sind.
Ebenso ergibt sich ˛ D ˇ aus jADj D jBEj und DEjjAB:
Wenn DEjjAB, ist im Dreieck ADE offenbar ^ADE D ˛2 (Wechselwinkel-
satz), ebenso folgt ^BED D ˇ2 , sodass die Dreiecke ADE und BED beide
gleichschenklig sind und jBDj D jDEj D jEAj gilt. Mit der zusätzlichen Bedin-
gung jADj D jBEj ergibt sich die Kongruenz der Dreiecke ADE und BED
(sss); daher gilt auch ˛ D ˇ.
Will man also aus jADj D jBEj auf ˛ D ˇ schließen und damit den Satz von
Steiner und Lehmus beweisen, so genügt es offenbar, einen der folgenden Sachver-
halte zu verifizieren:

 Das Viereck ABDE besitzt einen Umkreis.


 Die Strecken AB und DE sind parallel.

Versuchen wir zu zeigen, dass das Viereck ABDE unter den Voraussetzungen des
Satzes von Steiner und Lehmus einen Umkreis besitzt. Notwendige Voraussetzung
232 3 Heurismen der Reduktion

für die Existenz eines Umkreises von ABDE ist die Existenz einer Drehung, die B
auf D und E auf A abbildet. Eine solche Drehung lässt sich jedoch leicht angeben
(Abb. 3.8):

D=B’’
E

M w
A B

B’

Abb. 3.8 Drehung ı D w ı m mit ı.B/ D D und ı.E/ D A

Ist m die Mittelsenkrechte von AE und m die Spiegelung an m, so gilt m .E/ D


A. Sei nun B 0 WD m .B/ und sei w die Winkelhalbierende des Winkels ^B 0 AD.
Bezeichnet dann w die Spiegelung an w, so ist einerseits A 2 w und deshalb
w .A/ D A, und andererseits wird B 0 auf einen Punkt B 00 der Halbgeraden AD C
abgebildet.
Dass es sich bei B 00 um den Punkt D handelt, wird deutlich, wenn man die
Hintereinanderausführung ı WD w ı m beider Achsenspiegelungen betrachtet: Es
ist nämlich
ı.EB/ D AB 00 mit jAB 00 j D jEBj D jADj ;
sodass man wegen B 00 2 AD C auf B 00 D D schließen kann. Also handelt es sich
bei ı um eine Drehung mit dem Schnittpunkt M von w und m als Drehzentrum, die
E auf A und B auf D abbildet. Insbesondere ist damit M auch ein Punkt der Mit-
telsenkrechten m0 von BD, was im Folgenden die Konstruktion von M vereinfacht.
Wir prüfen nun, unter welchen Umständen die Existenz der Drehung ı auch
hinreichend dafür ist, dass das Viereck ABDE einen Umkreis besitzt.
Die gleichschenkligen Dreiecke MAE und MDB in Abb. 3.9 sind ähnlich,
weil sie im Winkel bei M (dies ist jeweils der Drehwinkel ' der Drehung ı) und
daher in allen Winkeln übereinstimmen. Der Umkreis von ABDE existiert offenbar
genau dann, wenn
R0 WD jMEj D jMDj DW R
3.2 Rückwärtsarbeiten und Pappos-Prinzip 233

Abb. 3.9 DEjjAB hinrei- C


chend für die Existenz eines
Umkreises von ABDE

D
E

M
A R’ R B

gilt, wenn also die Dreiecke MAE und MDB kongruent sind. Dies wieder-
um ist gleichbedeutend mit der Bedingung jAEj D jBDj oder der Bedingung
DEjjAB, wie wir oben gesehen haben.
Der nächste Reduktionsschritt ist damit getan, und wir prüfen, woraus man
DEjjAB folgern könnte.
In Abb. 3.10 seien P bzw. P 0 die Mittelpunkte der Strecken BE bzw. AD, und
ı bezeichne nach wie vor die oben konstruierte Drehung um M mit ı.B/ D D
und ı.E/ D A. Wegen ı.EB/ D AD gilt dann ı.P / D P 0 , sodass M auf der
Mittelsenkrechten zu PP 0 liegt; ferner ist ı.o/ D o0 , wenn o die Mittelsenkrechte
von EB und o0 die Mittelsenkrechte von AD bezeichnet. Sei nun o die Spiege-
lung an o und WD ı ı o . Dann ist eine Schubspiegelung mit .B/ D A und
.E/ D D.
Abb. 3.10 Schubspiegelung C
mit .B/ D A und
.E/ D D

D
E

S
P

M
A R B

o
234 3 Heurismen der Reduktion

Wäre nun die Verschiebungskomponente ! v der Schubspiegelung die Null-


verschiebung, dann wäre eine einfache Achsenspiegelung  t und deshalb die
Achse t dieser Spiegelung die gemeinsame Mittelsenkrechte von AB und DE. Dar-
aus folgte ABjjDE und damit die Behauptung des Satzes.
Damit ist der nächste Reduktionsschritt abgeschlossen, und das Problem ist zu-
rückgeführt auf den Nachweis der Tatsache, dass keine echte Schubspiegelung
ist. Dies wiederum ließe sich aus folgenden Gegebenheiten folgern (! weitere Re-
duktion):

 Man zeige, dass mindestens einen Fixpunkt hat.


 Man zeige, dass M 2 o (oder auch M 2 o0 ) gilt (nicht aus der Abbildung zu
entnehmen!).
 Man zeige, dass die Mittelpunkte der Strecken AB; DE und PP 0 nur dann auf
einer Geraden liegen können, wenn diese Strecken alle parallel sind.
(Das genügt, weil die Achse t der Schubspiegelung durch die Mittelpunkte
aller Strecken X .X/ verläuft! Ferner weiß man, dass t parallel zur Winkelhal-
bierenden des Winkels zwischen o und o0 und damit auch parallel zur Winkel-
halbierenden z des Winkels ^ASB verläuft, wenn S den Schnittpunkt von BE
mit AD bezeichnet.)

An dieser Stelle fallen zumindest mir keine weiteren Teilziele ein, aus denen sich
auf einen der oben genannten Sachverhalte schließen ließe. In solch einem Fall
empfiehlt es sich, den Analyseprozess bis zu einem Verzweigungspunkt zurückzu-
verfolgen und dort eine andere Richtung einzuschlagen; diese Methode bezeichnet
man als Back Tracking. Eine detailliertere Beschreibung des Back Tracking als
eine Vorgehensweise, mit der man bei der Entwicklung von Lösungsplänen vielver-
sprechende Komponenten früherer und gescheiterter Lösungsanläufe zielgerichtet
weiter verwenden kann, findet man in einem MU-Artikel von F RANK H EINRICH.12
Ohne die Schilderung weiterer Details möchte ich hier feststellen, dass meine
Lösungsversuche in anderen Zweigen des Planungsgraphen ebenfalls gescheitert
sind. Abb. 3.11 zeigt einige Zusammenhänge, die sich in der Situation aus Abb.
3.10 aufgrund der Gleichschenkligkeit des Dreiecks ABC ergeben.

 M ist nicht nur der Schnittpunkt der Mittelsenkrechten von BD und AE, son-
dern auch der Schnittpunkt der Mittelsenkrechten von BE und AD.
 Die Winkelhalbierende des Winkels ^P 0 SP ist auch die Winkelhalbierende des
Winkels ^PMP 0 und die gemeinsame Mittelsenkrechte von P 0 P ; AB und
DE.
 D liegt auf der Mittelsenkrechten von BE, E liegt auf der Mittelsenkrechten von
AD. ı.D/ D E, ı.A/ D B.
 jSEj D jSDj und jSAj D jSBj.

12
H EINRICH , F.: Wechseln von Lösungsanläufen als eine bedeutungsvolle heuristische Vorge-
hensweise beim Lösen mathematischer Probleme. In MU 47, Heft 6 (2001).
3.2 Rückwärtsarbeiten und Pappos-Prinzip 235

Abb. 3.11 Anknüpfungs- C


punkte für abbildungsgeome-
trische Beweise des Satzes
von Steiner und Lehmus

E D

S
P’ P
W S’

M
A B

o o’
z

Der Beweis irgendeines Zusammenhangs dieser Liste würde umgekehrt den Schluss
auf die Gleichschenkligkeit des Dreiecks ABC erlauben. Vielleicht findet der
geneigte Leser Spaß daran, sich an der Problematik zu versuchen? Doch Vorsicht:
Es besteht Suchtgefahr . . . 

Wir beschließen den Paragraphen mit einigen Bemerkungen P ÓLYAs zum Rück-
wärtsarbeiten, die den großen Stellenwert verdeutlichen, den der Altmeister dieser
Methode zuerkannte.

Beim Rückwärtsarbeiten können wir (. . . ) erwarten, die meiste Zeit auf das Lösen klar
formulierter Aufgaben zu verwenden (. . . ) Im allgemeinen ist daher das regressive Planen,
das Rückwärtsarbeiten, die „Analyse“ (in der Terminologie der griechischen Geometer)
vorzuziehen. Es kann keine starre Regel geben, aber das klügste wird immer sein, erst die
Unbekannte ins Auge zu fassen (die Behauptung, was man haben will) und dann die Daten
(. . . ) Man beginne damit, von der Unbekannten aus rückwärts zu arbeiten, wenn nicht ein
spezieller Grund für das gegenteilige Verfahren vorliegt – drängt einen eine gute Idee, von
den Daten auszugehen, so soll man das natürlich tun (. . . )
Der Weise fängt am Ende an, der Narr endet am Anfang. (. . . )
236 3 Heurismen der Reduktion

3.3 Modularisierung

Der Heurismus der Modularisierung ist besonders in der künstlichen Intelligenz von
herausragender Bedeutung, wo die Problemlösestrategie unter dem Namen „Divide
& Conquer“ oder als „Divide-Conquer-Glue – Strategy“ bekannt ist.

Modularisierung (Divide-Conquer-Glue - Strategie)


Zur Lösung eines umfangreichen Problems P könnte man folgendes Vorge-
hen wählen:

 Man zerlege das Problem P in Subprobleme P1 ; : : : ; Pn („Divide“).


 Man löse die Subprobleme P1 ; : : : ; Pn („Conquer“).
 Man kombiniere die Lösungen der Subprobleme zu einer Lösung des Aus-
gangsproblems P („Glue“).

Diese Problemlösestrategie ist in jedem umfangreicheren Computerprogramm


realisiert, wenn man das Schreiben eines Programms als das Durchlaufen eines
Problemlöseprozesses interpretiert: Jedes komplexe Programm ist eine Kollektion
einfacherer Programme, die ihrerseits wieder aus einfacheren Programmen zusam-
mengesetzt sind; der Prozess der Aufsplittung in kleinere Teilprogramme lässt sich
in der Regel auf vielen Ebenen zurückverfolgen. Diese Art der Programmstruktu-
rierung ist unverzichtbar, wenn man die Komplexität großer Systeme kontrollieren
will.
Beispielsweise verteilt sich der Quellcode aller Google-Dienste auf etwa neun
Millionen Dateien und umfasst mehr als zwei Milliarden Zeilen Programmcode mit
einem Speicherbedarf von 86 Terabyte. Würde man also sieben Tage pro Woche
täglich acht Stunden damit verbringen, den Code zu lesen, und könnte man dabei
eine Geschwindigkeit von einer Zeile pro zwei Sekunden durchhalten, so wäre man
ungefähr 380 Jahre lang mit dem Lesen des Programmcodes beschäftigt, und in
dieser Zeitspanne wäre nicht eine Sekunde dafür reserviert, die Routinen wirklich
zu verstehen!
Die Realisierung von Programmen dieser Größenordnung erfordert eine tiefe
modulare Struktur, sodass die einzelnen Programmieraufgaben in den genügend
kleinen Modulen unabhängig voneinander gelöst werden können und demzufolge
viele verschiedene Programmierer individuell zum Erfolg des Gesamtprojekts bei-
tragen können; bei Google haben rund 25 000 Software-Entwickler Zugriff auf den
Quellcode und ändern im Schnitt 15 Mio. Zeilen Code in 250 000 Dateien pro Wo-
che.
Der Transfer dieser in der künstlichen Intelligenz so erfolgreichen Methode in
die Welt des mathematischen Problemlösens leistet auch dort Erstaunliches, wobei
es nicht immer leicht ist, die Subprobleme zu identifizieren, in die ein gegebenes
Problem aufgespalten werden kann. Beginnen wir aber mit einem Beispiel, wo eine
mögliche Aufspaltung auf der Hand liegt.
3.3 Modularisierung 237

Beispiel 3.9 (Divide and Conquer – Aus eins mach’ zwölf)


Man zerlege den durch die Figur rechts angedeuteten „Katzenkopf“ in insgesamt
12 paarweise kongruente Teilfiguren.

Wir modularisieren die Problemstellung dadurch, dass wir die Katzenkopf-Figur


zunächst in n paarweise kongruente Teilfiguren zerlegen (n < 12), die dann ih-
rerseits in jeweils 12
n paarweise kongruente Teilfiguren zerlegt werden, wobei die-
ser Zerlegungsprozess schrittweise durch weitere Modularisierung realisiert wird.
Grundsätzlich bietet sich n D 2 oder n D 3 an, weil in beiden Fällen offensichtlich
ist, wie die Zerlegung vorgenommen werden könnte. Graphisch illustriert wird im
Folgenden der Fall n D 2.

Abb. 3.12 Zwei kongruente Trapeze, geteilt in je drei Dreiecke (divide)

In Abb. 3.12 erkennt man zunächst, wie die Ausgangsfigur in zwei kongruente
Teilfiguren (Trapeze) zerlegt werden kann. Jedes dieser Trapeze lässt sich in drei
paarweise kongruente Dreiecke partitionieren, sodass insgesamt bisher eine Zerle-
gung der Ausgangsfigur in sechs paarweise kongruente Dreiecke realisiert ist.

Abb. 3.13 Zerlegung der Dreiecke (conquer) und Lösung des Problems (glue)

Das Ausgangsproblem ist in dem Augenblick gelöst, wo es gelingt, diese Drei-


ecke in jeweils zwei kongruente Teildreiecke zu zerlegen – das bereitet aber offen-
sichtlich keine Probleme, wie Abb. 3.13 verdeutlicht. 
238 3 Heurismen der Reduktion

Eine oft verwendete Methode zur Zerlegung einer Problemstellung in Teilpro-


bleme ist die Modularisierung per Fallunterscheidung. In vielen Fällen gelingt es
damit sogar, unendlich viele Probleme an endlich viele Problemklassen zu verteilen,
die dann separat gelöst werden können; in diesem Zusammenhang spricht man von
der heuristischen Strategie der Finitarisierung. Typische Beispiele für die Finitari-
sierung einer Problemstellung liegen in folgenden Fällen vor:

 Prüfung der Regularitätseigenschaften von abschnittsweise definierten Funktio-


nen

Hierbei ist es in der Regel so, dass der Definitionsbereich einer Funktion in endlich
viele Intervalle partitioniert wird und die Regularität der Funktion im Inneren dieser
Intervalle unproblematisch ist, während sie am Rand der Intervalle a priori unklar
ist. Das Problem, die Regularität der Funktion in den unendlich vielen Punkten x
ihres Definitionsbereichs zu untersuchen, wird dann in die endlich vielen Fälle zer-
legt, dass x einer der endlich vielen Randpunkte der endlich vielen Intervalle oder
einer der Punkte der offenen Kerne der endlich vielen Intervalle ist.

 Lösung linearer Gleichungssysteme mit Parametern

In der Regel teilt man den Parameterbereich in drei Klassen, die den Rangbedin-
gungen an die Koeffizientenmatrix des Gleichungssystems zugeordnet sind, welche
über Unlösbarkeit, über eindeutige Lösbarkeit und über nicht eindeutige Lösbarkeit
des linearen Gleichungssystems entscheiden.

 Lösung zahlentheoretischer Probleme durch Argumentation für Restklassen

Hier wird die unendliche Menge der ganzen Zahlen in endlich viele Restklassen
bezüglich eines geeigneten Moduls m zerlegt; es findet eine Finitarisierung durch
Klassenbildung statt.
Die wohl aufsehenerregendste Problemlösung mittels Finitarisierung war die
Lösung des Vierfarbenproblems durch K ENNETH A PPEL und W OLFGANG H AKEN
im Jahr 1976.
Im Oktober 1852 hatte F RANCIS G UTHRIE (1831–1899), englischer Jurist, Ma-
thematiker und Botaniker, beim Färben von Landkarten entdeckt, dass er die Anfor-
derung, je zwei Länder mit gemeinsamer Grenzlinie immer unterschiedlich einzu-
färben, stets mit insgesamt höchstens vier Farben erfüllen konnte. Die Frage nach
dem Grund dieses Sachverhalts wurde von AUGUSTUS DE M ORGAN (1806–1871),
dem Lehrer von G UTHRIEs Bruder, als das Vierfarbenproblem bekannt gemacht.
Als nun im Computerzeitalter genügend Rechenleistung zur Verfügung stand,
gelang es A PPEL und H AKEN, das allgemeine Vierfarbenproblem an mehrere Tau-
send Problemklassen zu verteilen und diese einzeln mit einer IBM 360 (dem ersten
Großrechner der Geschichte) in vernünftiger Zeit abzuarbeiten.
3.3 Modularisierung 239

Dieser intensive Einsatz eines Computers beim Beweis eines mathematischen


Satzes hat damals heftige Grundlagendiskussionen ausgelöst:

Welche Rolle in der Beweisfindung darf der Computer übernehmen?

Im folgenden Beispiel erfüllt der Computer die Funktion, Hinweise für die Modula-
risierung einer „großen“, allerdings endlichen Problemstellung durch eine geeignete
Fallunterscheidung zu geben – es handelt sich um eine Quasi-Finitarisierung.

Beispiel 3.10 (Ziffernspiele)


Man bestimme die Menge M aller n 2 N mit der Eigenschaft, dass es eine Permu-
tation
!
1 2 3 4 5 6 7 8 9
 WD 2 S9
a1 a2 a3 a4 a5 a6 a7 a8 a9

derart gibt, dass

n D .a1 a2 a3 /10  .a4 a5 /10 D .a6 a7 /10  .a8 a9 /10

gilt,13 und gebe die betreffenden Faktorzerlegungen jeweils an.


Zunächst gibt es


D 15 120
.9  5/Š

Möglichkeiten, fünf verschiedene Ziffern aus f1; : : : ; 9g auszuwählen, daraus eine


dreistellige und eine zweistellige dekadische Zahl zu bilden und diese miteinander
zu multiplizieren. In jedem einzelnen dieser Fälle können noch 4Š D 24 Produkte
zweier zweistelliger Zahlen notiert werden, sodass beide beteiligten Faktoren ge-
meinsam alle vier verbleibenden Ziffern enthalten. Insgesamt müssen also 15 120 
24 D 362 880 Konstellationen daraufhin überprüft werden, ob das Gleichheitszei-
chen zwischen den Produkttermen korrekt ist oder nicht, und es stellt sich die Frage,
wie man alle Lösungen des Problems finden kann, ohne diesen großen Aufwand
treiben zu müssen.
Als brute-force-Strategie ist Systematisches Probieren mit dem Computer ein-
setzbar, und wenn der Rechner alle 362 880 Fälle durchgespielt hat, gibt er M und
die folgende Liste aller Lösungen aus:

13
Für z0 ; : : : ; zk 2 f0; 1; 2; : : : ; 9g sei mit .zk zk1 : : : z1 z0 /10 die dekadische Zifferndarstellung
P
der Zahl z D kiD0 zi  10i bezeichnet.
240 3 Heurismen der Reduktion

Lösungen des Ziffernspiel-Problems


Es ist M D fn1 ; : : : ; n11 g mit

n1 D 3634 D 158  23 D 79  46 D 46  79
n2 D 3726 D 138  27 D 69  54 D 54  69
n3 D 3886 D 134  29 D 67  58 D 58  67
n4 D 4002 D 174  23 D 69  58 D 58  69
n5 D 4234 D 146  29 D 73  58 D 58  73
n6 D 4662 D 259  18 D 74  63 D 63  74
n7 D 5022 D 186  27 D 93  54 D 54  93
n8 D 5056 D 158  32 D 79  64 D 64  79
n9 D 5568 D 174  32 D 96  58 D 58  96
n10 D 7008 D 584  12 D 96  73 D 73  96
n11 D 7448 D 532  14 D 98  76 D 76  98

Es wäre langweilig, das Problem jetzt als gelöst zu betrachten. Auch wenn man
nun alle Möglichkeiten kennt, aus den Ziffern 1; : : : ; 9 drei zweistellige Zahlen und
eine dreistellige Zahl im Zehnersystem so zu bilden, dass jede dieser Ziffern genau
einmal auftritt und dass das Produkt der dreistelligen Zahl mit einer der zweistelli-
gen Zahlen gleich dem Produkt der beiden anderen zweistelligen Zahlen ist – der
intellektuellen Herausforderung hat man sich bisher nicht gestellt.
Um eine Idee davon zu bekommen, welche mathematischen Hilfsmittel man ein-
setzen könnte, um die Anzahl der zu überprüfenden Fälle zu verkleinern, studiere
man die Liste der Lösungen in der Hoffnung, Muster finden zu können – damit ist
die Rolle des Computers auf die eines Hilfsmittels zur Mustererkennung reduziert!
Folgende Regelmäßigkeiten fallen sofort auf:

Beobachtung

(B 1) Jede Lösungszahl n 2 M hat eine der Ziffern 2; 4; 6; 8 als Endziffer.


(B 2) Für alle Lösungen n D .a1 a2 a3 /10  .a4 a5 /10 D .a6 a7 /10  .a8 a9 /10 ist
fa1 ; a4 g 2 ff1; 2g; f1; 3g; f1; 5gg.

Die Beobachtungen geben Hinweise darauf, welche Kategorien mathematischer


Zusammenhänge zu untersuchen sind, wenn man verstehen will, wie die Lösungen
zustande kommen.

 (B 1) deutet darauf hin, dass man sich für die Zehnerreste gewisser aus den
Ziffern ai zu bildender Produkte interessieren muss.
3.3 Modularisierung 241

 (B 2) zeigt, dass unter allen Lösungen

n D .a1 a2 a3 /10  .a4 a5 /10 D .a6 a7 /10  .a8 a9 /10

kein Fall mit a1 a4 > 5 auftritt; also muss man sich für die Größe von Produkten
.a1 a2 a3 /10  .a4 a5 /10 in Abhängigkeit von den verwendeten Ziffern interessieren.
 Dass auch der Fall fa1 ; a4 g D f1; 4g unter allen Lösungen nicht auftritt, kann als
Hinweis darauf verstanden werden, dass Größenabschätzungen und Kongruenz-
betrachtungen mod 10 miteinander kombiniert werden müssen, um Lösungen
herauszufiltern.

Sehen wir uns zunächst die Ziffern der Produkte in Abhängigkeit von den Ziffern
der Faktoren an; die Analyse und anschließende Formalisierung der Abläufe bei
der Multiplikation im dekadischen Stellenwertsystem führt auf die Ergebnisse, die
in Satz 3.1 zusammengestellt sind.

Satz 3.1
Bezeichnet man für r 2 R die größte ganze Zahl kleiner oder gleich r mit Œr,14
so lassen sich für die Ziffern eines Produktes im dekadischen Stellenwertsystem
folgende Zusammenhänge feststellen:
a) Für die Zerlegung des Produkts

p1 D .a1 a2 a3 /10  .a4 a5 /10

in seine dezimalen Stellenwerte Einer (E), Zehner (Z), Hunderter (H ) gilt:

.a1 a2 a3 /10  .a4 a5 /10 D x1 H C y1 Z C z1 E

mit
"  #
a2  a5 C a3  a4 C a310a5
x1 D 10  a1  a4 C a1  a5 C a2  a4 C I
10
"  #
ha  a i a2  a5 C a3  a4 C a310a5
3 5
y1 D a2  a5 C a3  a4 C  10  I
10 10
ha  a i
3 5
z1 D a3  a5  10  :
10
b) Für die Zerlegung des Produkts

p2 D .a6 a7 /10  .a8 a9 /10

in seine dezimalen Stellenwerte Einer (E), Zehner (Z), Hunderter (H ) gilt:

.a6 a7 /10  .a8 a9 /10 D x2 H C y2 Z C z2 E

14
Die Funktion Œ W R ! Z ordnet jeder reellen Zahl ihren ganzzahligen Anteil zu und wird
deshalb als Ganzteilfunktion bezeichnet; das Symbol Œ  ist als G AUSS-Klammer bekannt.
242 3 Heurismen der Reduktion

mit
"  a7 a9  #
a6  a9 C a7  a8 C
x2 D a6  a8 C 10
I
10
"  #
ha  a i a6  a9 C a7  a8 C a710a9
7 9
y2 D a6  a9 C a7  a8 C  10  I
10 10
ha  a i
7 9
z2 D a7  a9  10  :
10
An den Ziffern der dekadischen Zifferndarstellungen der Produkte

p1 D .a1 a2 a3 /10  .a4 a5 /10 und p2 D .a6 a7 /10  .a8 a9 /10

lassen sich sofort drei notwendige Bedingungen für p1 D p2 ablesen:

(1) p1 D p2 ) z1 z2 mod 10, also

a3  a5 a7  a9 mod 10 :

(2) p1 D p2 ) y1 y2 mod 10, also


ha  a i ha  a i
3 5 7 9
a2  a5 C a3  a4 C a6  a9 C a7  a8 C mod 10 :
10 10
(3) p1 D p2 ) x1 D x2 , also
"  a3 a5  #
a2  a5 C a3  a4 C
10  a1  a4 C a1  a5 C a2  a4 C 10
10
"  a7 a9  #
a6  a9 C a7  a8 C 10
D a6  a8 C :
10

Alle Ziffernkonstellationen, die mindestens eine der notwendigen Voraussetzungen


(1) bis (3) nicht erfüllen, scheiden als Kandidaten für Lösungen aus.
Um nun für manche Konstellationen den Nachweis zu erbringen, dass eine der
Bedingungen (1) bis (3) nicht erfüllt sein kann, folgen wir der von (B 2) angeregten
Idee, a-priori-Abschätzungen für die Größe von Produkten der Form p1 bzw. p2 in
Abhängigkeit von den verwendeten Ziffern durchzuführen.
Zum Ziel führen die Abschätzungen, die in Satz 3.2 zusammengestellt sind.
3.3 Modularisierung 243

Satz 3.2
Mit ai ; bi .i 2 N/ seien im Folgenden Ziffern aus f1; : : : ; 9g bezeichnet.

a) Unter allen Produkten p1 D .a1 a2 a3 /10  .a4 a5 /10 mit fa1 ; : : : ; a5 g D


fb1 ; : : : ; b5 g und b1 < b2 < b3 < b4 < b5 ist

pb1 WD .b2 b4 b5 /10  .b1 b3 /10

minimal.
b) Unter allen Produkten p1 D .a1 a2 a3 /10  .a4 a5 /10 mit festem fa1 ; a4 g D fx; yg,
x > y und fa2 ; a3 ; a5 g D fb1 ; b2 ; b3 g mit b1 < b2 < b3 ist

pb1 WD .xb2 b3 /10  .yb1 /10

minimal.
c) Unter allen Produkten p1 D .a1 a2 a3 /10  .a4 a5 /10 mit festem fa3 ; a5 g D fx; yg,
x > y und fa1 ; a2 ; a4 g D fb1 ; b2 ; b3 g mit b1 < b2 < b3 ist

pb1 WD .b2 b3 x/10  .b1 y/10

minimal.
d) In a), b) und c) werden die Minimalprodukte pb1 größer, wenn man sie für Ziffern
bQi mit bi  bQi 8i; bi0 < bQi0 für mindestens ein i0 berechnet.
e) Unter allen Produkten p2 D .a6 a7 /10  .a8 a9 /10 mit fa6 ; : : : ; a9 g D fb1 ; : : : ; b4 g
und b1 < b2 < b3 < b4 ist

pb2 WD .b3 b2 /10  .b4 b1 /10

maximal.
f) Unter allen Produkten p2 D .a6 a7 /10  .a8 a9 /10 mit festem fa6 ; a8 g D fx; yg,
x > y und fa7 ; a9 g D fb1 ; b2 ; g mit b1 < b2 ist

pb2 WD .xb1 /10  .yb2 /10

maximal.
g) Unter allen Produkten p2 D .a6 a7 /10  .a8 a9 /10 mit festem fa7 ; a9 g D fx; yg,
x > y und fa6 ; a8 g D fb1 ; b2 ; g mit b1 < b2 ist

pb2 WD .b1 x/10  .b2 y/10

maximal.
244 3 Heurismen der Reduktion

Auf der Basis von Satz 3.1 und Satz 3.2 lässt sich der Kandidatenkreis möglicher
Lösungen stark einschränken:

 Es gibt keine Lösungen n 2 N mit n 0 mod 5.


 Es gibt keine Lösungen n 2 N mit n 1 mod 2.
 Es gibt keine Lösungen von n D .a1 a2 a3 /10  .a4 a5 /10 D .a6 a7 /10  .a8 a9 /10 für
a1  a4 > 5.
 Es gibt keine Lösungen von n D .a1 a2 a3 /10  .a4 a5 /10 D .a6 a7 /10  .a8 a9 /10 für
fa1 ; a4 g D f1; 4g.

Positiv formuliert:

 Lösungen von
n D .a1 a2 a3 /10  .a4 a5 /10 D .a6 a7 /10  .a8 a9 /10
mit einem injektiven 9-Tupel .a1 ; : : : ; a9 / aus f1; : : : ; 9g existieren bestenfalls
für
n 2 Œ02 n Œ010 und fa1 ; a4 g 2 ff1; 2g; f1; 3g; f1; 5gg :

Damit sind die Beobachtungen (B1) und (B2), die wir beim Studium der Liste aller
Lösungen des Problems festgehalten haben, mathematisch verifiziert und verstan-
den.
Dies führt zu einer Modularisierung der Problemstellung dadurch, dass jetzt in
den drei für fa1 ; a4 g möglichen Fällen nach Lösungen gesucht werden kann. Jeder
dieser Fälle enthält spezifische Informationen über a1 und a4 , welche die a-priori-
Abschätzungen aus Satz 3.2 um weitere Abschätzungen ergänzen, mit denen man
die Kandidatenliste möglicher Lösungen weiter verkürzen kann.
Am einfachsten ist es, in den drei für fa1 ; a4 g möglichen Fällen durch das Stu-
dium von x1 und x2 aus Satz 3.1 diejenigen Situationen auszuschließen, in denen
a6  a8 zu klein ist; die Ergebnisse dieser Analyse sind in Satz 3 zusammengefasst.

Satz 3.3
Für alle Lösungen n D .a1 a2 a3 /10  .a4 a5 /10 D .a6 a7 /10  .a8 a9 /10 des Problems
gilt:

1. Ist fa1 ; a4 g D f1; 2g, so folgt a6  a8  21.


2. Ist fa1 ; a4 g D f1; 3g, so folgt a6  a8  30.
3. Ist fa1 ; a4 g D f1; 5g, so folgt a6  a8  54.

Dadurch ist die Kandidatenliste für Lösungen so geschrumpft, dass man alle
Lösungen des Problems durch Abarbeiten der einzelnen Fälle finden kann. In je-
dem der für fa1 ; a4 g möglichen Fälle betrachte man die Unterfälle der Endziffern
2; 4; 6; 8 möglicher Lösungszahlen n 2 N. Man prüfe dann jeweils die oben für
p1 D p2 formulierten notwendigen Bedingungen (1) und (2):
Ist jeweils (1) erfüllt, so sind bis auf a2 ; a6 ; a8 alle Ziffern festgelegt (genauer:
fa1 ; a4 g; fa3 ; a5 g; fa7 ; a9 g sind festgelegt). Kandidaten für Lösungen sind diejeni-
gen, für die
3.3 Modularisierung 245

 mit den Bezeichnungen aus Satz 3.2, b), c) und f), g) pb2  pb1 gilt,
 die Kongruenzen (2) erfüllt sind und
 die notwendigen Bedingungen aus Satz 3 gelten.

Man findet insgesamt

 21 Kandidaten für den Fall fa1 ; a4 g D f1; 2g, sieben davon sind Lösungen;
 26 Kandidaten für den Fall fa1 ; a4 g D f1; 3g, zwei davon sind Lösungen;
 7 Kandidaten für den Fall fa1 ; a4 g D f1; 5g, zwei davon sind Lösungen.

Aus der Gesamtzahl von 362 880 denkbaren Kandidaten für Lösungen haben wir
mit mathematischen Mitteln 54 Kandidaten herausgefiltert, deren Überprüfung dann
zu den 11 tatsächlichen Lösungen M D fn1 ; : : : ; n11 g führt. Eine weitere Re-
duktion der Zahl zu prüfender Fälle lässt sich durch eine Verfeinerung der Grö-
ßenabschätzungen in Satz 3 erreichen, wenn man für die speziellen Werte von
fa3 ; a5 g; fa7 ; a9 g in den einzelnen für fa1 ; a4 g zu betrachtenden Fällen argumentiert.
Ob dies sinnvoll ist, entscheidet der Vergleich des Aufwands für bessere Abschät-
zungen mit dem Aufwand für die Einzelprüfung von mehr Kandidaten. 

Die im oben diskutierten Beispiel vorgenommene Modularisierung duch Fall-


unterscheidung hat eine Eigenschaft, die besonders beim Einsatz von Divide and
Conquer-Algorithmen in der künstlichen Intelligenz von Bedeutung ist: Die Sub-
probleme, in die das Ausgangsproblem zerlegt wird, sind voneinander unabhängig
– jeder Fall kann isoliert für sich behandelt werden, ohne dass eine einzelne Lö-
sung für einen anderen Fall relevant wäre. Maschinell könnte die Bearbeitung der
Teilprobleme also durch Parallelalgorithmen erfolgen, was im Vergleich zur Ver-
wendung sequenzieller Algorithmen einiges an Rechenzeit spart.
Bei der Konstruktion von Lotto-Designs durch Modularisierung kann man nicht
erwarten, dass Lösungen einzelner Teilprobleme voneinander unabhängig wären;
einen Eindruck davon haben schon die Beispiel 2.2 und Beispiel 3.7 vermittelt.
Nicht zuletzt deshalb ist meines Wissens bis heute (2017) für n  10 nicht geklärt,
wie groß die Anzahl L.n/ der Blöcke in einem optimalen .6; 5/-Lotto-Design zu An
ist und wie ein solches Design konkret aussieht. Man kennt nur untere und obere
Abschätzungen für L.n/, wobei sich die unteren Abschätzungen15 aus kombinato-
rischen Überlegungen ergeben und die oberen Abschätzungen die Blockanzahlen
der jeweils aktuell besten Designs wiedergeben. Die meisten der aktuellen Rekord-
Designs sind mit Simulated Annealing-Algorithmen gefunden worden. Eine Liste
der präzisesten unteren und oberen Abschätzungen für optimale Blockanzahlen in
allgemeineren Lotto-Designs wird von B EN PAK C HING L I an der University of
Manitoba geführt; momentan allerdings wird die Liste scheinbar nicht aktualisiert.
Faszinierend an der Thematik ist, dass in besonders symmetrischen Konstella-
tionen durch mathematische Ansätze, welche die Symmetrien der Problemstellung
reflektieren (! Symmetrieprinzip), absolut konkurrenzfähige Lotto-Designs entwi-
ckelt werden können, wie das folgende Beispiel zeigt.

15
„Für ein .6; 5/-Lotto-Design zu An braucht man mindestens . . . Blöcke.“.
246 3 Heurismen der Reduktion

Beispiel 3.11 (Lotto-Designs III – Modularisierung)


Man konstruiere ein möglichst gutes .6; 5/-Lotto-Design zu A12 .
Wir beachten das Symmetrieprinzip und arbeiten die Symmetrien der Problem-
stellung heraus, in der Hoffnung, daraus Lösungsansätze entwickeln zu können,
welche diese Symmetrien reflektieren.
In der speziellen Situation m D 6, n D 2m D 12, t D 5, für die hier ein .m; t/-
Lotto-Design zu An hergestellt werden soll, fallen sofort folgende Besonderheiten
auf:

 Die Liste der 6-elementigen Teilmengen von A12 , von denen grundsätzlich jede
als Block eines .6; 5/-Lotto-Designs zu A12 infrage kommt, lässt sich in Paare
zueinander komplementärer Teilmengen von A12 aufteilen:
Genau dann ist Z  A12 ein 6-Block von A12 , wenn auch Z 0 WD .A12 n Z/ ein
6-Block von A12 ist.
 Ein 6-Block B von A12 repräsentiert genau dann die sechselementige Teilmenge
Z  A12 , wenn die zu Z komplementäre sechselementige Teilmenge Z 0 D
.A12 n Z/ von dem zu B komplementären Block B 0 WD .A12 n B/ repräsentiert
wird.

Als Konsequenz dieser Sachverhalte ergibt sich aus dem Symmetrieprinzip:


In „guten“ .6; 5/-Lotto-Designs S zu A12 sollten nur Paare zueinander komple-
mentärer 6-Blöcke von A12 auftreten! Diese Konstruktionsvorgabe wird nun schritt-
weise umgesetzt.

1. Schritt: Wahl der ersten beiden 6-Blöcke des Systems.


Man wähle zwei beliebige zueinander komplementäre 6-Blöcke von A12 aus,
also etwa

S1 WD f1; 2; 3; 4; 5; 6g I S2 WD S10 D f7; 8; 9; 10; 11; 12g :

Diese beiden Blöcke repräsentieren jede 6-elementige Teilmenge von A12 , die min-
destens 5 Elemente aus einer der Mengen S1 oder S2 enthält.

2. Schritt: Analyse der mit der Wahl von S1 ; S2 im 1. Schritt vorgenommenen Mo-
dularisierung der Problemstellung (P) und weitere Aufspaltung in Teilprobleme.
Die Wahl von S1 ; S2 induziert folgende Modularisierung des Problems (P):

Modularisierung von (P)

(P 1) Man repräsentiere durch ein Sub-Design .SD/1 alle diejenigen 6-ele-


mentigen Teilmengen von A12 , die mindestens 5 Elemente mit einer
der Mengen S1 oder S2 gemeinsam haben – dieses Teilproblem ist mit
.SD/1 D fS1 ; S2 g bereits gelöst.
3.3 Modularisierung 247

(P 2) Man repräsentiere durch ein Sub-Design .SD/2 alle diejenigen 6-ele-


mentigen Teilmengen von A12 , die mit keiner der Mengen S1 ; S2 mehr
als 4 Elemente gemeinsam haben – dieses Teilproblem ist noch nicht
gelöst und kann weiter modularisiert werden.

Zur weiteren Modularisierung des Subproblems (P 2) stellen wir fest, dass sich
die vom Subdesign .SD/1 nicht repräsentierten 6-elementigen Teilmengen Z von
A12 in drei Typklassen einteilen lassen:

 Mengen Z  A12 vom Typ (2/4):


Dabei handelt es sich um diejenigen 6-Teilmengen von A12 , die genau 2 Ele-
mente von S1 und genau 4 Elemente von S2 enthalten, wie zum Beispiel Z1 D
f1; 2; 7; 8; 9; 10g.
 Mengen Z  A12 vom Typ (3/3):
Dabei handelt es sich um diejenigen 6-Teilmengen von A12 , die genau 3 Ele-
mente von S1 und genau 3 Elemente von S2 enthalten, wie zum Beispiel Z2 D
f1; 2; 3; 7; 8; 9g.
 Mengen Z  A12 vom Typ (4/2):
Dabei handelt es sich um diejenigen 6-Teilmengen von A12 , die genau 4 Ele-
mente von S1 und genau 2 Elemente von S2 enthalten, wie zum Beispiel Z3 D
f1; 2; 3; 4; 8; 9g.

Offenbar wird keine 6-elementige Teilmenge vom Typ (2/4) durch einen 6-Block
vom Typ (4/2) repräsentiert und umgekehrt.
Aber: 6-Blöcke vom Typ (3/3) können 6-elementige Teilmengen aller drei Typen
repräsentieren! Im Beispiel oben werden Z1 und Z3 von Z2 repräsentiert, ebenso
repräsentiert Z2 die Menge f1; 2; 3; 7; 8; 10g vom Typ (3/3).
Dies legt folgende Modularisierung des Subproblems (P 2) nahe:

Modularisierung von (P 2)

(P 2)1 Man konstruiere zunächst ein Sub-Design .SD/2;1 aus Paaren zueinan-
der komplementärer Blöcke vom Typ (3/3), welches alle 6-elementigen
Teilmengen vom Typ (3/3) repräsentiert.
(P 2)2 Man stelle fest, welche Teilmengen der Typen (2/4) und (4/2) von
.SD/2;1 nicht repräsentiert werden, und konstruiere ein Sub-Design
.SD/2;2 aus Paaren zueinander komplementärer Blöcke, das die noch
fehlenden Teilmengen der Typen (2/4) und (4/2) repräsentiert.

Damit wäre der Part „Divide“ der Divide/Conquer/Glue-Prozedur erledigt. Das


Zusammensetzen der Lösungen der einzelnen Subprobleme („Glue“) würde darin
248 3 Heurismen der Reduktion

bestehen, die Sub-Designs .SD/2;1 und .SD/2;2 zum in (P 2) gesuchten Sub-Design


.SD/2 zu vereinigen, welches alle 6-elementigen Teilmengen von A12 repräsentiert,
die mit keiner der Mengen S1 ; S2 mehr als 4 Elemente gemeinsam haben, und dann
aus .SD/2 und .SD/1 ein .6; 5/-Lotto-Design S zu A12 zusammenzustellen.
Vorher müssen aber die Subprobleme erobert werden („Conquer“), was nun in
den nächsten Schritten geschehen soll.

3. Schritt: Lösung  des Subproblems (P 2)1 .


Da es jeweils 63 D 20 Möglichkeiten gibt, drei Elemente aus S1 bzw. aus S2
auszuwählen, gibt es 2020 D 400 Teilmengen vom Typ (3/3) von A12 . Einen guten
Überblick über alle Teilmengen vom Typ (3/3) kann man sich dadurch verschaffen,
dass man eine quadratische Tabelle (! Tabellendarstellung als heuristisches Hilfs-
mittel) mit 20  20 D 400 Feldern anlegt, die den 400 Teilmengen vom Typ (3/3)
eindeutig zuzuordnen sind.
Dies kann dadurch geschehen, dass man die 3-elementigen Teilmengen von
S1 als Zeilenkoordinaten und die 3-elementigen Teilmengen von S2 als Spal-
tenkoordinaten verwendet – das Feld mit den Koordinaten fx1 ; x2 ; x3 g  S1
(Zeile) und fy1 ; y2 ; y3 g  S2 (Spalte) vertritt dann in A12 den 6-Block B D
fx1 ; x2 ; x3 ; y1 ; y2 ; y3 g vom Typ (3/3). Der Vorteil dieser Art der Veranschaulichung
ist, dass die Felder der Tabelle leer bleiben und für weitere Eintragungen zur
Verfügung stehen.
Wenn man nun zusätzlich noch die 3-elementigen Teilmengen in den Zeilen und
den Spalten der Tabelle lexikographisch ordnet, dann liegen sich zwei zueinander
komplementäre (3/3)-Teilmengen M und M 0 punktsymmetrisch zum Symmetrie-
zentrum des Quadrats gegenüber. Diese Art der Anordnung wird sich später als
sehr nützlich erweisen, wenn wir nicht nur der Anschauung entnehmen, sondern
auch formal begründen wollen, dass eine bestimmte Auswahl von Paaren zuein-
ander komplementärer Blöcke vom Typ (3/3) alle 6-elementigen Teilmengen vom
Typ (3/3) repräsentiert. Verdeutlicht wird der Zusammenhang in Abb. 3.14, wo-
bei statt der lexikographisch geordneten 3-elementigen Teilmengen von S1 bzw. S2
nur deren Elemente in streng monotoner Anordnung als Zeilenkoordinaten bzw. als
Spaltenkoordinaten angegeben werden.
Wir wählen nun die 40 Blöcke vom Typ (3/3), die auf den Feldern der Diago-
nalen des Quadrats angesiedelt sind, als Blöcke S3 ; : : : ; S42 unseres angestrebten
Subdesigns .SD/2;1 ; in Abb. 3.15 ist jeder dieser Blöcke Si .3  i  42/ durch
ein fettgedrucktes, größer gesetztes, grau unterlegtes und unterstrichenes i auf den
Diagonalen gekennzeichnet. Die durch die Blöcke S3 ; : : : ; S42 repräsentierten 6-
elementigen Teilmengen des Typs (3/3) von A12 werden anschließend mit i in der
Tabelle markiert, wenn Si bei streng monoton wachsender Anordnung der Indizes
der erste Block ist, der die betreffende Teilmenge repräsentiert.
Bei dieser Prozedur wird, wie Abb. 3.15 zeigt, offenbar jedes Feld der quadra-
tischen Tabelle ausgefüllt – das bedeutet: Jede Teilmenge des Typs (3,3) von A12
wird durch mindestens einen der Blöcke S3 ; : : : ; S42 repräsentiert. Deshalb definiert
.SD/2;1 WD fS3 ; : : : ; S42 g
ein Subdesign, welches das Subproblem .P 2/1 löst.
3.3 Modularisierung 249

Abb. 3.14 Paare komplementärer Blöcke vom Typ (3/3) in punktsymmetrischer Anordnung

Dass nun .P 2/1 von .SD/2;1 gelöst wird, ist kein Zufall. Die Symmetrie der
Blockauswahl erzwingt, dass eine jede Teilmenge des Typs (3,3) von A12 von min-
destens einem der Blöcke aus .SD/2;1 repräsentiert wird; die Symmetrien des Sub-
problems .P 2/1 werden vom Subdesign .SD/2;1 reflektiert. Dies kann man folgen-
dermaßen einsehen:
(1) Sei B ein beliebiger der ausgewählten Blöcke vom Typ (3/3) auf einer der
Diagonalen des Quadrats. Dann ist B von der Form

B D B1 [ B2 mit B1  S1 ; B2  S2 ; jB1 j D jB2 j D 3 :

O der sich auf der anderen Diagonalen


In der gleichen Zeile wie B steht ein Block B,
befindet und deshalb in derselben Spalte steht wie der zu B komplementäre Block
B 0 . Folglich ist BO der Block

BO D B1 [ .S2 n B2 / ;

der mit B nur die drei Elemente aus B1 gemeinsam hat. Also gibt es keine Teilmen-
ge vom Typ (3/3), die sowohl von B als auch von BO repräsentiert würde.
250 3 Heurismen der Reduktion

Abb. 3.15 Lösung des Subproblems .P 2/1 durch das Subdesign .SD/2;1

B und BO repräsentieren aber jeweils genau 10 Teilmengen vom Typ (3/3) in ihrer
gemeinsamen Zeile:

 B repräsentiert sich selbst und alle (3/3)-Teilmengen der Form

Z D B1 [ Z1 [ fxg ;

wobei Z1 alle zweielementigen Teilmengen von B2 (es handelt sich um drei


verschiedene) durchläuft und x 2 .S2 n B2 / zu wählen ist (auch davon gibt’s drei
Elemente). Daher repräsentiert B genau 1 C 3  3 D 10 Teilmengen vom Typ
(3/3) in der mit BO gemeinsamen Zeile der Tabelle.
 BO repräsentiert sich selbst und alle (3/3)-Teilmengen der Form

Z D B1 [ Z2 [ fxg ;

wobei Z2 alle zweielementigen Teilmengen von .S2 n B2 ) (wiederum 3) durch-


läuft und x 2 B2 zu wählen ist (auch hier 3 Möglichkeiten). Daher repräsentiert
3.3 Modularisierung 251

BO ebenfalls genau 1 C 3  3 D 10 Teilmengen vom Typ (3/3) in der mit B ge-


meinsamen Zeile der Tabelle.

Das bedeutet, dass alle 20 Teilmengen vom Typ (3/3), die mit B und BO in einer
gemeinsamen Zeile stehen, von B und BO zusammen repräsentiert werden.
(2) In gleicher Weise könnte man feststellen, dass je zwei Blöcke B und BO
vom Typ (3/3), die in derselben Spalte auf zwei verschiedenen Diagonalen ste-
hen, zusammen alle 20 Teilmengen vom Typ (3/3) repräsentieren, die mit B und BO
gemeinsam in dieser Spalte stehen.
(3) Weil die Anordnung der ausgewählten Blöcke vom Typ (3/3) durchgängig
von der in (1) und (2) beschriebenen Art ist (jede Zeile und jede Spalte ist mit genau
zwei Blöcken auf verschiedenen Diagonalen vertreten), werden alle 400 Teilmen-
gen vom Typ (3/3) durch S3 ; : : : ; S42 repräsentiert – .SD/2;1 löst das Subproblem
.P 2/1 .
Damit können wir uns der Lösung des Subproblems .P 2/2 zuwenden. Vielleicht
hilft uns die Symmetrie der Blockauswahl auch hier weiter – wir werden sehen.
Zunächst muss festgestellt werden, welche Teilmengen der Typen (2/4) und (4/2)
von A12 durch die Blöcke von .SD/2;1 nicht repräsentiert werden.

4. Schritt:  Feststellung
  der unrepräsentierten Teilmengen vom Typ (4/2).
Es gibt 64  62 D 15  15 D 225 Teilmengen des Typs (4/2) von A12 , die man
durch die Felder einer quadratischen Tabelle mit den 4-elementigen Teilmengen
von S1 als Zeilenkoordinaten und den 2-elementigen Teilmengen von S2 als Spal-
tenkoordinaten veranschaulichen kann (Abb. 3.16). In jedes Feld trägt man nun ein,
durch welche Blöcke von .SD/2;1 die dem Feld zugehörige (4/2)-Teilmenge reprä-
sentiert wird; am Ende geben die leeren Felder die unrepräsentierten Teilmengen
vom Typ (4/2) an.
Offenbar gibt es keine leeren Felder – alle (4/2)-Teilmengen werden repräsen-
tiert! Da es keine unrepräsentierten Teilmengen des Typs (4/2) von A12 gibt, exis-
tieren auch keine unrepräsentierten Teilmengen vom Typ (2/4), denn das Subdesign
.SD/1;2 ist aus Paaren zueinander komplementärer Blöcke aufgebaut; .P 2/2 ist also
ebenfalls gelöst.
Der bisher mittels Systematischen Probierens geführte Nachweis der Tatsache,
dass alle Teilmengen vom Typ (4/2) durch die Blöcke des Subdesigns .SD/2;1 re-
präsentiert werden, lässt sich unter Ausnutzung der Symmetrie der Blockauswahl
folgendermaßen durch einen kombinatorischen Beweis ersetzen.
Sei Z  A12 eine beliebige Teilmenge vom Typ (4/2). Dann gibt es eine 4-
elementige Teilmenge M D fx1 ; x2 ; x3 ; x4 g  S1 und eine 2-elementige Teilmenge
D  S2 mit Z D M [ D. Man betrachte in der quadratischen Tabelle der Blöcke
vom Typ (3/3) (Abb. 3.15) diejenigen vier Zeilen, deren Zeilenkoordinaten durch
die 3-elementigen Teilmengen
M1 D fx1 ; x2 ; x3 g ; M2 D fx1 ; x2 ; x4 g ; M3 D fx1 ; x3 ; x4 g ; M4 D fx2 ; x3 ; x4 g
der Menge M gegeben sind. In jeder dieser 4 Zeilen liegen genau zwei Blöcke des
Systems .SD/1;2 . Wir bezeichnen für i D 1; 2; 3; 4 mit Bi denjenigen Block des
252 3 Heurismen der Reduktion

Abb. 3.16 Repräsentation aller (4/2)-Teilmengen durch die Blöcke von .SD/2;1

Subdesigns, der in der durch Mi gegebenen Zeile auf der Hauptdiagonalen (Dia-
gonale von links oben nach rechts unten) der quadratischen Tabelle liegt; der zu Bi
bezüglich S2 komplementäre Block auf der Nebendiagonalen in der durch Mi gege-
benen Zeile werde mit BOi benannt. In dieser Situation ermöglicht es die Symmetrie
3.3 Modularisierung 253

der Anordnung, die Spaltenkoordinaten T1 ; : : : ; T4 der Blöcke B1 ; : : : ; B4 explizit


anzugeben:
B1 D M 1 [ T1 für T1 D fx1 C 6; x2 C 6; x3 C 6g  S2 I
B2 D M 2 [ T2 für T2 D fx1 C 6; x2 C 6; x4 C 6g  S2 I
B3 D M 3 [ T3 für T3 D fx1 C 6; x3 C 6; x4 C 6g  S2 I
B4 D M 4 [ T4 für T4 D fx2 C 6; x3 C 6; x4 C 6g  S2 :

Die Spaltenkoordinaten TOi der Blöcke BOi sind dann jeweils durch TOi D S2 n Ti
gegeben. Setzt man S1 n M DW fx5 ; x6 g, so ergibt sich:

BO1 D M1 [ TO1 für TO1 D fx4 C 6; x5 C 6; x6 C 6g  S2 I


BO2 D M2 [ TO2 für TO2 D fx3 C 6; x5 C 6; x6 C 6g  S2 I
BO3 D M3 [ TO3 für TO3 D fx2 C 6; x5 C 6; x6 C 6g  S2 I
BO4 D M4 [ TO4 für TO4 D fx1 C 6; x5 C 6; x6 C 6g  S2 :

Wenn jetzt eine der 3-elementigen Teilmengen Ti , TOi .1  i  4/ von S2 die


2-elementige Teilmenge D  S2 enthält, dann wird Z D M [ D offenbar reprä-
sentiert (3 Übereinstimmungen von Z mit der betreffenden Zeilenkoordinate, und
zusätzlich 2 Übereinstimmungen von Z mit der entsprechenden Spaltenkoordinate,
die D enthält). Man muss also festzustellen, ob durch T D fT1 ; : : : ; T4 ; TO1 ; : : : ; TO4 g
ein .3; 2/-Covering-Design von S2 gegeben ist; dies ist die Sprechweise dafür, dass
ein System T D fT1 ; : : : ; T` g dreielementiger Teilmengen Ti einer Menge A die
Eigenschaft hat, dass jede 2-elementige Teilmenge von A in mindestens einem der
Blöcke Ti des Systems T enthalten ist.
Um diese Tatsache zu verifizieren und damit den Beweis der Behauptung abzu-
schließen, argumentiert man zweckmäßig wie folgt:

 Die vier Blöcke TO1 ; : : : ; TO4 enthalten jeweils 32 D 3 zweielementige Teilmen-
gen, von denen die Menge fx5 C 6; x6 C 6g in jedem der TOi enthalten ist und
die anderen zweielementigen Teilmengen paarweise verschieden sind. Deshalb
handelt es sich um genau 4  3  3 D 9 verschiedene zweielementige Teilmengen
von S2 , die jeweils in mindestens einem der Blöcke TO1 ; : : : ; TO4 enthalten sind.
 Da jede zweielementige Teilmenge eines der TOi mindestens ein Element der
Menge fx5 C 6; x6 C 6g enthält, andererseits aber für alle i D 1; : : : ; 4 die
Mengen fx5 C 6; x6 C 6g und Ti eine leere Schnittmenge haben, kann keine der
2-elementigen Teilmengen von S2 , welche in einem der Ti enthalten ist, gleich-
zeitig in einem der TOi enthalten sein.
 Zu den bereits durch TO1 ; : : : ; TO4 erfassten 9 zweielementigen Teilmengen von S2
kommt also noch die Anzahl aller zweielementigen Teilmengen von S2 hinzu,
die von T1 ; : : : ; T4 erfasst werden – keine wird dabei doppelt gezählt.
Dies sind im Einzelnen:
– drei in T1 enthaltene zweielementige Teilmengen von S2 ;
254 3 Heurismen der Reduktion

– zwei in T2 enthaltene zweielementige Teilmengen von S2 , die noch nicht in


T1 enthalten sind;
– eine in T3 enthaltene zweielementige Teilmenge von S2 , die noch nicht in T1
oder T2 enthalten ist.
Macht insgesamt 3C2C1 D 6 weitere 2-elementige Teilmengen von S2 ; weitere
kommen nicht hinzu, weil alle 2-elementigen Teilmengen von T4 bereits von
T1 ; T2 ; T3 erfasst werden.
 Insgesamt sind also 6 C 9 D 15 zweielementige Teilmengen von S2 in min-
destens
6 einem der Blöcke T1 ; : : : ; T4 ; TO1 ; : : : ; TO4 enthalten; da es aber genau
2
D 15 zweielementige Teilmengen von S2 gibt, sind dies alle!

Damit ist bewiesen, dass T ein .3; 2/-Covering Design von S2 ist, was wiederum
den Beweis abschließt, dass alle Teilmengen des Typs (4/2) von A12 von den Blö-
cken S3 ; : : : ; S42 repräsentiert werden.
Da aber das Subdesign .SD/1;2 aus Paaren zueinander komplementärer Blöcke
aufgebaut ist, werden auch alle Teilmengen des Typs (2/4) von A12 von den Blöcken
S3 ; : : : ; S42 repräsentiert, genauso wie alle Teilmengen des Typs (3/3) von A12 (vgl.
Lösung des Subproblems .P 2/1 ). Wir können also feststellen, dass mit
S WD .SD/1 [ .SD/2 D .SD/1 [ .SD/2;1 D fS1 ; : : : ; S42 g
ein .6; 5/-Lotto-Design zu A12 gewonnen ist, welches nur 42 Blöcke enthält.

.6; 5/-Lotto-Design S zu A12 mit 42 Blöcken


Konstruiert wurde das 42-er Design S D fS1 ; : : : ; S42 g mit

S1 D f1; 2; 3; 4; 5; 6g S2 D f7; 8; 9; 10; 11; 12g S3 D f1; 2; 3; 7; 8; 9g


S4 D f4; 5; 6; 7; 8; 9g S5 D f4; 5; 6; 10; 11; 12g S6 D f1; 2; 3; 10; 11; 12g
S7 D f1; 2; 4; 7; 8; 10g S8 D f3; 5; 6; 7; 8; 10g S9 D f3; 5; 6; 9; 11; 12g
S10 D f1; 2; 4; 9; 11; 12g S11 D f1; 2; 5; 7; 8; 11g S12 D f3; 4; 6; 7; 8; 11g
S13 D f3; 4; 6; 9; 10; 12g S14 D f1; 2; 5; 9; 10; 12g S15 D f1; 2; 6; 7; 8; 12g
S16 D f3; 4; 5; 7; 8; 12g S17 D f3; 4; 5; 9; 10; 11g S18 D f1; 2; 6; 9; 10; 11g
S19 D f1; 3; 4; 7; 9; 10g S20 D f2; 5; 6; 7; 9; 10g S21 D f2; 5; 6; 8; 11; 12g
S22 D f1; 3; 4; 8; 11; 12g S23 D f1; 3; 5; 7; 9; 11g S24 D f2; 4; 6; 7; 9; 11g
S25 D f2; 4; 6; 8; 10; 12g S26 D f1; 3; 5; 8; 10; 12g S27 D f1; 3; 6; 7; 9; 12g
S28 D f2; 4; 5; 7; 9; 12g S29 D f2; 4; 5; 8; 10; 11g S30 D f1; 3; 6; 8; 10; 11g
S31 D f1; 4; 5; 7; 10; 11g S32 D f2; 3; 6; 7; 10; 11g S33 D f2; 3; 6; 8; 9; 12g
S34 D f1; 4; 5; 8; 9; 12g S35 D f1; 4; 6; 7; 10; 12g S36 D f2; 3; 5; 7; 10; 12g
S37 D f2; 3; 5; 8; 9; 11g S38 D f1; 4; 6; 8; 9; 11g S39 D f1; 5; 6; 7; 11; 12g
S40 D f2; 3; 4; 7; 11; 12g S41 D f2; 3; 4; 8; 9; 10g S42 D f1; 5; 6; 8; 9; 10g

 
Angesichts der Tatsache, dass man es mit 125
D 792 fünfelementigen Teilmen-
gen von A12 zu tun hat, die sämtlich von diesen 42 Blöcken repräsentiert werden,
3.3 Modularisierung 255

mag man mit mir in der Ansicht übereinstimmen, dass es sich bei S um ein „gutes“
Lotto-Design handelt. 

Welchen mathematischen Stellenwert das erzielte Resultat tatsächlich hat und


wo sich gegebenenfalls Ansätze zur Verbesserung des Ergebnisses verbergen, un-
tersucht man in Phase IV („Rückschau“) des Problemlöseprozesses nach P ÓLYA:

Wie gut kann ein Resultat sein, das mit elementaren heuristischen Methoden aus
der Symmetrie der Problemstellung entwickelt wurde, wenn man bedenkt, dass
die Wettbewerber weltweit ganze Armeen von Computern mit der aufwändigen
algorithmischen Suche nach Lotto–Designs beschäftigen?

Man würde vermuten, dass allgemein bei Problemstellungen der kombinatorischen


Optimierung nicht zuletzt wegen der großen zu bearbeitenden Datenmengen der
Computer ein unverzichtbares Hilfsmittel ist, wenn man brauchbare Resultate er-
zielen will. Aber: Das oben konstruierte .6; 5/-Lotto-Design S zu A12 mit seinen
42 Blöcken ist absolut konkurrenzfähig!
Bis zum Beginn des Jahres 2002 war die beste bekannte obere Abschätzung für
L.12/ gegeben durch L.12/  42. Will sagen: Das beste bis dahin bekannte .6; 5/-
Lotto-Design zu A12 umfasste genau 42 Blöcke und damit keinen einzigen Block
weniger als das oben vorgestellte!
Im Mai 2002 kündigte dann I LIYA B LUSKOV von der University of Northern
British Columbia in Prince George, Kanada, einen neuen Weltrekord in Gestalt von
L.12/  38 an. Freundlicherweise hat er mir sein Design überlassen, und es ist viel-
leicht interessant, unser 42er-Design S und B LUSKOVs 38er-Design T miteinander
zu vergleichen.

.6; 5/-Lotto-Design T zu A12 mit 38 Blöcken (nach Bluskov)


Konstruiert wurde das 38-er Design T D fT1 ; : : : ; T38 g mit

T1 D f1; 2; 3; 4; 5; 6g T2 D f1; 2; 3; 4; 10; 11g T3 D f1; 2; 3; 7; 9; 10g


T4 D f1; 2; 3; 5; 8; 11g T5 D f1; 2; 4; 8; 9; 12g T6 D f1; 2; 4; 6; 7; 11g
T7 D f1; 2; 7; 9; 10; 11g T8 D f1; 2; 6; 8; 10; 12g T9 D f1; 2; 5; 6; 10; 12g
T10 D f1; 3; 4; 10; 11; 12g T11 D f1; 3; 5; 7; 9; 12g T12 D f1; 3; 6; 8; 9; 11g
T13 D f1; 3; 6; 10; 11; 12g T14 D f1; 3; 6; 7; 8; 10g T15 D f1; 4; 6; 7; 9; 12g
T16 D f1; 4; 5; 8; 9; 10g T17 D f1; 4; 5; 7; 8; 10g T18 D f1; 5; 6; 9; 10; 11g
T19 D f1; 5; 7; 8; 11; 12g T20 D f2; 3; 4; 6; 9; 10g T21 D f2; 3; 4; 7; 8; 12g
T22 D f2; 3; 6; 9; 11; 12g T23 D f2; 3; 6; 7; 11; 12g T24 D f2; 3; 5; 8; 10; 11g
T25 D f2; 4; 5; 9; 11; 12g T26 D f2; 4; 5; 7; 8; 9g T27 D f2; 4; 5; 7; 10; 12g
T28 D f2; 4; 6; 8; 10; 11g T29 D f2; 5; 6; 7; 8; 9g T30 D f3; 4; 7; 8; 9; 11g
T31 D f3; 4; 5; 7; 9; 11g T32 D f3; 4; 5; 6; 8; 12g T33 D f3; 5; 8; 9; 10; 12g
T34 D f3; 5; 6; 7; 10; 11g T35 D f4; 6; 7; 9; 10; 12g T36 D f4; 5; 6; 8; 11; 12g
T37 D f5; 6; 7; 8; 9; 12g T38 D f7; 8; 9; 10; 11; 12g
256 3 Heurismen der Reduktion

Abb. 3.17 Paare komplementärer Blöcke vom Typ (3/3) in punktsymmetrischer Anordnung in
Bluskovs 38er-Design

Wie unser Design S umfasst auch B LUSKOVs Design mit T1 D f1; 2; 3; 4; 5; 6g


und T38 D f7; 8; 9; 10; 11; 12g ein Paar komplementärer 6-Blöcke, welches die
ersten sechs bzw. die letzten sechs Zahlen aus A12 verarbeitet. Die übrigen sechs-
unddreißig Blöcke T2 ; : : : ; T37 lassen sich folgendermaßen nach Typen einteilen:
 Es gibt genau 24 Blöcke vom Typ (3/3), angeordnet in 12 Paaren zueinander
komplementärer Blöcke.
 Unter den übrigen 12 Blöcken befinden sich genau 6 Blöcke vom Typ (2/4) und
genau 6 Blöcke vom Typ (4/2), die sich in 6 Paare zueinander komplementärer
Blöcke aufteilen lassen.
Man setze jetzt SQ1 WD T1 , SQ2 WD T38 und bezeichne mit SQ3 ; : : : ; SQ26 die Folge der le-
xikographisch angeordneten Blöcke vom Typ (3/3) unter den T2 ; : : : ; T37 . Wählt man
dann die gleiche Art der Veranschaulichung wie für die Blöcke S3 ; : : : ; S42 des Sys-
tems S (quadratische Tabelle mit lexikographisch angeordneten Koordinaten aus SQ1
(Zeile) und SQ2 (Spalte)), so bilden auch SQ3 ; : : : ; SQ26 ein zum Symmetriezentrum des
Quadrats punktsymmetrisches Muster, wie Abb. 3.17 zeigt.
3.3 Modularisierung 257

Allerdings repräsentieren diese 24 Blöcke vom Typ (3/3) nicht alle 6-elemen-
tigen Teilmengen des Typs (3/3) von A12 ; dies zeigt Abb. 3.18, die in der Form der
Darstellung Abb. 3.15 entspricht. Die durch die Blöcke SQ3 ; : : : ; SQ26 repräsentierten
6-elementigen Teilmengen des Typs (3/3) von A12 sind in der Tabelle mit i markiert,
wenn SQi der erste Block (bei streng monoton wachsender Anordnung der Indizes)
ist, der die betreffende Teilmenge repräsentiert.

Abb. 3.18 Von SQ3 ; : : : ; SQ26 repräsentierte Teilmengen des Typs (3/3) in Bluskovs 38er-Design

Die weißen Felder in Abb. 3.18 kennzeichnen diejenigen 6-Teilmengen Z  A12


vom Typ (3/3), die von SQ1 ; : : : ; SQ26 unrepräsentiert sind; die sechs Paare zueinander
komplementärer 6-Blöcke der Typen (2/4) und (4/2), die neben SQ1 ; : : : ; SQ26 noch
zum System T gehören, repräsentieren aber die fehlenden Teilmengen vom Typ
(3/3).
Davon und von der Tatsache, dass das System T auch alle Teilmengen der Typen
(2/4) und (4/2) von A12 repräsentiert, kann man sich in jedem einzelnen Fall (ggf.
mit Unterstützung des Computers) überzeugen.
258 3 Heurismen der Reduktion

Möglicherweise ist also eine Verbesserung unseres .6; 5/-Lotto-Designs S da-


durch möglich, dass man geeignete Paare zueinander komplementärer (3/3)-Blöcke
durch bestimmte Paare zueinander komplementärer (2/4)- bzw. (4/2)-Blöcke er-
setzt; welches die ersten Kandidaten sind, die sich für einen eventuellen Austausch
anbieten, zeigt Abb. 3.16, die damit doch noch eine wichtige Rolle übernehmen
kann:

Wenn eine 6-elementige Teilmenge Z vom Typ (2/4) oder (4/2) von vier (!)
verschiedenen Blöcken des Typs (3/3) repräsentiert wird, dann repräsentiert um-
gekehrt Z einen jeden dieser vier Blöcke vom Typ (3/3)!

Es könnte interessant sein, diesen Gedanken vertieft weiter zu verfolgen und den
Simulated-Annealing-Algorithmen, mit denen derzeit die meisten Rekorddesigns
gefunden werden, solche Symmetrieüberlegungen als Selektionskriterien an die Sei-
te zu stellen. Erneut ist hier zu sehen, dass die Rückschau in Pólya-Phase IV we-
sentliche Beiträge zur Problemfindung (! Problemlösen im weiteren Sinne) leisten
kann; diese Rolle der Rückschau wurde auch schon in den Abschlussbetrachtungen
zu Beispiel 3.8 und Beispiel 3.10 deutlich.
In allen behandelten Beispielen zum Heurismus der Modularisierung war ein
fruchtbarer Nebeneffekt der Verwendung dieser Strategie erkennbar:
Selbst wenn es nicht gelingen sollte, Subprobleme zu identifizieren, in die eine
gegebene Problemstellung erfolgreich zerlegt werden kann, so erfordert doch das
Bemühen darum ein profundes Eindringen in die Problemstruktur, und dies trägt in
der Regel zum besseren Verständnis des Problems (Pólya-Phase I) bei.
Eine Gefahr der Methode ist darin zu sehen, dass möglicherweise bei der Zer-
legung eines Problems in Teilprobleme kritische Aspekte der Problemstellung aus-
geblendet werden und dadurch die Natur des Problems verändert wird. Hier ist wie
immer Sorgfalt geboten – die Phase der Rückschau ist ein unverzichtbarer Bestand-
teil des Problemlöseprozesses.

3.4 Quintessenz für Problemlöser

Die Heurismen der Reduktion sind in erster Linie Verfahren mit logischem Charak-
ter, mit denen man nach Voraussetzungen für einen angestrebten Zielzustand (Z)
oder aber nach falschen Konsequenzen der gegenteiligen Annahme (:Z) sucht.
Die „Suche nach falschen Konsequenzen von (:Z)“ rückt sofort die Argumen-
tation durch Widerspruch („reductio ad absurdum“) ins Blickfeld reduktiver Stra-
tegien, die in einem historisch besonders bedeutsamen Denkmuster zusammen mit
einer Sonderform des Extremalprinzips eingesetzt wird. Dabei handelt sich um die

 Methode des unendlichen Abstiegs („la descente infinie“),

in der es darum geht, die Annahme (:Z) dadurch zum Widerspruch zu führen, dass
man einen unendlichen Prozess in Gang setzt, der eine geeignete Größe von Schritt
3.4 Quintessenz für Problemlöser 259

zu Schritt verkleinert, obwohl diese Größe nur endlich viele kleinere Werte als den
Startwert annehmen kann.
In der konkreten Gestaltung dieses „Abstiegs“, also in dem schöpferischen Pro-
zess, aus der angenommenen Existenz eines Objekts mit bestimmten Eigenschaften
ein kleineres Objekt dieser Art zu konstruieren, besteht die zentrale Schwierigkeit
der Methode; hierfür gibt es kein universelles Verfahren und keine Erfolgsgarantie,
weshalb die Einordnung der Methode des unendlichen Abstiegs als Heurismus un-
zweifelhaft ist, auch wenn das Verfahren demonstrativen Charakter hat. Dennoch
lohnt sich der Versuch in allen Problemstellungen, denen wohlgeordnete Struktu-
ren zu Grunde liegen, wie etwa in Problemen der Zahlentheorie, die im Bereich
der durch das Prinzip vom kleinsten Element wohlgeordneten natürlichen Zahlen
angesiedelt sind.
Die „Suche nach Voraussetzungen für (Z)“ wird bei der

 Strategie des Rückwärtsarbeitens

umgesetzt. Man sucht dabei nach Teilzielen (T), von denen man unmittelbar den
Zielzustand (Z) erreichen könnte; dies entspricht dem Part der Analyse in den
Analysis-Synthesis-Prozeduren der griechischen Geometer.
Wenn man die Suche nach solchen Teilzielen dadurch steuert, dass man den
Zielzustand (Z) invertierbaren Transformationen unterzieht und die Ergebnisse (Z’)
dieser Operationen als Zwischenziele ins Auge fasst, bedient man sich einer Vari-
ante des Rückwärtsarbeitens, die als

 Kanalisiertes Rückwärtsarbeiten (PAPPOS-Prinzip)

bekannt ist. Diese Methode lässt sich oft in Problemstellungen der synthetischen
Geometrie erfolgreich einsetzen; in den meisten Problemstellungen, die in irgend-
einer Form ein Optimierungsproblem zum Gegenstand haben, ist diese kanalisierte
Form des Rückwärtsarbeitens zu restriktiv und daher eher ungeeignet.
Von herausragender Bedeutung ist in der künstlichen Intelligenz (KI) der

 Heurismus der Modularisierung,

der dort unter der Bezeichnung Divide & Conquer oder als Divide-Conquer-Glue-
Strategy geführt wird.
Dabei geht es darum, ein Problem (P) in Subprobleme P1 ; : : : ; Pn aufzuspalten,
diese Subprobleme zu lösen (was eventuell weitere Zerlegungen der Subprobleme
in Subsubprobleme erforderlich macht) und dann die Lösungen der Subprobleme
zu einer Lösung des ursprünglichen Problems (P) zusammenzusetzen.
Der Transfer dieser Methode in die Welt des mathematischen Problemlösens
birgt oft die Schwierigkeit, geeignete Subprobleme zu identifizieren, in die sich ein
Problem aufspalten ließe.
260 3 Heurismen der Reduktion

Eine Standardmethode zur Modularisierung einer mathematischen Problemstel-


lung ist jedoch die

 Modularisierung per Fallunterscheidung.

Gelingt es einem dabei, unendlich viele Einzelprobleme an endlich viele Problem-


klassen zu verteilen, so spricht man in diesem Zusammenhang von der

 Strategie der Finitarisierung

einer Problemstellung. In der Zahlentheorie wird die Finitarisierung durch Klas-


senbildung erfolgreich eingesetzt, wobei in erster Linie die Restklassen mod m
Verwendung finden.
Im Zusammenhang mit der Reduktion einer „sehr großen“, aber endlichen Zahl
von Fällen einer Problemsituation auf überschaubar viele („wenige“) Fälle, die mit
verträglichem Aufwand bearbeitet werden können, spricht man von einer Quasi-
Finitarisierung der Problemstellung.
Auch wenn es bisweilen nicht gelingt, eine geeignete Modularisierung einer
Problemstellung zu finden, trägt die dabei durchzuführende Analyse der Problem-
struktur regelmäßig zu einem besseren Verständnis des Problems bei und leistet auf
diese Weise einen wichtigen Beitrag zur Pólya-Phase I.
Unsere Überlegungen aus diesem Kapitel fließen in eine finale Verfeinerung
von P ÓLYAs Phasenmodell des Problemlöseprozesses ein. Die reduktiven Strategi-
en entfalten ihre Wirksamkeit in verschiedenen Phasen, die einander wechselseitig
beeinflussen und deshalb im Sinne eines heuristischen Kreislaufs in der Regel mehr-
fach zu durchlaufen sind; darauf haben wir schon bei früheren Verfeinerungen des
P ÓLYAschen Phasenmodells hingewiesen.

Problemlösephasen nach Pólya (Finale Verfeinerung)

I. Verstehen der Aufgabe


a) Identifikation des Problems
b) Auffinden einer geeigneten Darstellung des Problems
II. Ausdenken eines Plans
a) Variation der Problemwahrnehmung (Reorganisation)
b) Variation der Problemstellung unter Beachtung des Invarianz-, des
Symmetrie- und des Extremalprinzips
c) Generieren von Vermutungen durch induktive Prozeduren
d) Suche nach logischen Hindernissen mit reduktiven Prozeduren
e) Vorbereiten von Analysis-Synthesis-Prozeduren durch Rückwärtsar-
beiten
f) Modularisierung der Problemstellung
3.4 Quintessenz für Problemlöser 261

III. Ausführen des Plans


a) Vorwärtsarbeiten
b) Kontrollierte Durchführung von Approximationsprozessen
IV. Rückschau
a) Kontrolle der Lösung durch Rückübersetzung in den ursprünglichen
Problemkontext
b) Analyse der Lösung und des Lösungsprozesses im Hinblick auf mög-
liche Verbesserungen und Erweiterungen (Problemfindung)

Angesichts der Tatsache, dass das Problemlösen im engeren Sinne im Fokus


unserer Betrachtungen gestanden hat, möchte ich noch einen prominenten Befür-
worter der These, dass die Problemfindung wesentlicher Bestandteil aller Problem-
löseprozesse sein sollte, zu Wort kommen lassen.
In der Mathematik ist die Kunst, eine Frage zu stellen, höher zu bewerten als die Kunst, sie
zu lösen.
G EORG C ANTOR (1845–1918)

Dieser extreme Standpunkt reflektiert die Rolle der Mathematik als eine kumulative
Wissenschaft, die ihre Erkenntnisse seit der Epoche E UKLIDs nach strengsten Maß-
stäben und für alle Zeiten gültig gesichert hat; ein Voranschreiten ist nur möglich,
wenn man deduktiv gesicherte Antworten auf „gute“ Fragen nach bislang unbe-
kannten Zusammenhängen findet und die gewonnenen Einsichten denjenigen der
mehr als 5000 mathematischen Theorien als mathematische Sätze hinzufügt, in de-
nen diese Zusammenhänge von Bedeutung sind.
Es steht aber außer Zweifel, dass die „guten“ Fragen bei der Bearbeitung ma-
thematischer Probleme entdeckt werden, und zwar unabhängig davon, ob diese
Probleme lösbar sind oder nicht – man denke etwa an die unzähligen mathema-
tischen Neuentwicklungen im Zuge der fast 2000 Jahre andauernden Versuche, die
drei Klassischen Probleme der Geometrie (Quadratur des Kreises, Winkeltrisekti-
on, Kubusverdoppelung) zu lösen, was sich erst im 19. Jahrhundert als unmöglich
herausstellte.
Problemlösen ist der Kern allen mathematischen Fortschritts, und deshalb sei-
en zum Abschluss allen Lehrenden und Lernenden der Mathematik, dabei insbe-
sondere denjenigen, die selbst den Beruf der Lehrerin oder des Lehrers im Fach
Mathematik anstreben, die Worte P ÓLYAs ans Herz gelegt:
Teaching is not a science; it is an art. If teaching were a science there would be a best way
of teaching and everyone would have to teach like that. Since teaching is not a science,
there is great latitude and much possibility for personal differences . . . let me tell you what
my idea of teaching is. Perhaps the first point, which is widely accepted, is that teaching
must be active, or rather active learning . . . the main point in mathematics teaching is to
develop the tactics of problem solving.
G EORGE P ÓLYA (1887–1985)
Personenverzeichnis

A E LSCHENBROICH , H ANS -J ÜRGEN, 62


A RCHIMEDES von Syrakus (ca. 287–212 E NGEL , A RTHUR , 45, 121
v. Chr.), 164, 180 E RDÖS , PAUL (1913–1996), 137, 141
A RISTOTELES, 9 E UDOXOS von Knidos (408–355 v. Chr.), 179
E UKLID, 9, 184, 210
B E ULER , L EONHARD (1707–1783), 4, 16, 122,
BANACH , S TEPHAN, 20 154, 178, 208, 218
B ENDER , P ETER , 174
B ERNOULLI , JAKOB (1654–1705), 176 F
B ERNOULLI , J OHANN (1667–1748), 176 F ERMAT, P IERRE DE (1601–1665), 12, 122,
B ESSEL , F RIEDRICH W ILHELM 153, 168, 208, 217, 218
(1784–1846), 189 F ISCHER , W OLFGANG, 189
B LUSKOV, I LIYA, 255
B OLZANO , B ERNHARD (1781–1848), 192 G
B OURBAKI , 16 G ALE , DAVID, 74
B RAHMAGUPTA (598–ca. 670), 213, 217 G ARDNER , M ARTIN, 75
B RUNER , J EROME S., 3 G AUSS , C ARL F RIEDRICH, 16, 21, 189
G OURSAT, E DOUARD (1858–1936), 190
C
G RASSMANN , H ERMANN G., 17
C ARTESIUS, 12
G REEN , G EORGE (1793–1841), 189
C AUCHY, AUGUSTIN -L OUIS (1789–1857),
G ROSS , O LIVER , 75
56, 178, 189
G RÉGOIRE DE S AINT-V INCENT
C OXETER , H AROLD S COTT M ACDONALD,
(1584–1667), 180
105
G UTHRIE , F RANCIS (1831–1899), 238
C UTLER , B ILL , 165

D H
DE M ORGAN , AUGUSTUS (1806–1871), 198 H AAS , N ICOLA, 99
D ESCARTES , R ENÉ (1596–1650), 12, 13 H ADAMARD , JAQUES -S ALOMON, 85
D IEDERICH , K LAS, 84 H AKEN , W OLFGANG, 238
D IOPHANT von Alexandria (um 250 n. Chr.), H ALL , M ONTY, 163
168, 217 H EIN , P IET (1905–1996), 74
D IRICHLET, G USTAV P ETER L EJEUNE - H EINRICH , F RANK , 234
(1805–1859), 137 H ENDERSON , A RCHIBALD , 105
D ÖRNER , D IETRICH, 1 H ESSE , OTTO, 23
H ILBERT, DAVID, 20
E H IPPASOS von Metapont (ca. 500–440
E HRENFELS , C HRISTIAN VON, 39 v. Chr.), 208

© Springer-Verlag GmbH Deutschland, ein Teil von Springer Nature 2018 263
W. Schwarz, Problemlösen in der Mathematik, https://doi.org/10.1007/978-3-662-56762-3
264 Personenverzeichnis

H ISCHER , H ORST , 199 P YTHAGORAS (ca. 560–480 v. Chr.), 9, 208


H URWITZ , A DOLF, 23 P ÓLYA , G EORG, 2, 13, 33, 66, 149, 158, 198,
207, 221
K
KOFFKA , K URT , 39 R
KÖHLER , W OLFGANG, 39 R ADO , R ICHARD (1906–1989), 137
KÖNIG , H ELMUT , 167 R AMSEY, F RANK P LUMPTON (1903–1930),
141
L R IEMANN , B ERNHARD, 56
L ACROIX , S YLVESTRE F., 16 R IESZ , F RIGYES, 20
L AGRANGE , J OSEPH L OUIS, 16, 218
L AKATOS , I MRE (1922–1974), 150 S
L EGENDRE , A DRIEN -M ARIE (1752–1833), S CHEID , H ARALD , 64, 90, 199
160 S CHOLZ , E RHARD, 20
L EHMUS , C HRISTIAN L UDOLF, 105 S CHREIBER , A LFRED, 38, 174, 207
L EIBNIZ , G OTTFRIED W ILHELM S IEGEL , C ARL L UDWIG, 56
(1646–1716), 153 S IMON , H ERBERT A., 165, 219
L EUDERS , T IMO, 163 S TEINER , JAKOB , 101
L I , B EN PAK C HING, 245 S TOKES , G EORGE G ABRIEL (1819–1903),
L IEB , I NGO, 189 189
S TURM , C., 105
M S YLVESTER , JAMES J OSEPH, 101
M ACH , E RNST , 39 S ZEKEREZ , G YORGY (*1911), 141
M AXWELL , JAMES C LERK, 16
M C N EAL , J EFFERY D EAN, 91, 154 T
M ESCHKOWSKI , H ERBERT (1909–1990), 209 TAYLOR , B ROOK, 84
M ONGE , G ASPARD, 16 T OEPLITZ , OTTO, 176, 184
M ONTMORT, P IERRE R ÉMOND DE
(17./18. Jahrh.), 124 V
M ORGAN , AUGUSTUS DE (1806–1871), 238 VON F RITZ , K URT (1900–1995), 208

N W
NASH , J OHN F ORBES (*1928), 74 W EIERSTRASS , K ARL (1815–1897), 178,
N EWELL , A LLEN, 165, 219 189, 192
W EIL , A NDRÉ (1906–1998), 208
P W ERTHEIMER , M AX, 3, 39, 44
PAPPOS von Alexandria (um 300 n. Chr.), 167, W EYL , H ERMANN, 20
225 W ILES , A NDREW, 168
PASCAL , B LAISE (1623–1662), 156, 198 W INTER , H EINRICH, 208
P EANO , G IUSEPPE , 17 W ITTMANN , E., 33
P ELL , J OHN (1610–1685), 213 W USSING , H ANS -L UDWIG, 184
Sachverzeichnis

A arithmetisches Mittel, 10, 22


Abbildungsgeometrie, 59 Ästhetik in der Mathematik, 66
Abstände, 17 Ausgangszustand, 1
abstrakter Vektorraumbegriff, 16 Automorphismus, 58
Abstraktion, 4
Abzähltechniken, 109 B
affine Abbildung, 59, 60 Back Tracking, 234
affin-lineare Funktion, Approximation durch, Barriere, 2
185, 191 Baumdiagramm, 27
Ähnlichkeitsabbildung, 59, 61 Begriffsbildung, 150
Akusmatiker, 208 beliebiges k-Tupel, 112
algebraische Geometrie, 16 Beobachtung, 151
algorithmische Verfahren, 165 Bereichsstrukturierung, 40
Analogie, 153 B ERNOULLI-Ungleichung, 177
Analogiebildung, 34 Beweis durch doppelte Exklusion, 183
Analogiebildung durch Restriktion, 37, 75 beziehungsreiches Wissen, 33
biholomorph äquivalent, 57
Analogien, Muster von, 152
biholomorphe Abbildung, 55
Analogisierung, 33
Binomialkoeffizient, 156, 206
Analysis-Synthesis, 167
Binomischer Lehrsatz, 88, 91, 122
Analysis-Synthesis-Prozedur, 168, 202, 223
Bisektion, 191
Analytische Geometrie, 16
box argument, 137
Anfangsverteilung, 28 B RAHMAGUPTA -Formeln, 217
Annäherung von Zahlen, 175 Bridg-it, 74
Anzahlformel für k-fache kartesische brute-force-Stratgie, 164
Produkte, 110
Anzahlformeln, 90 C
apagogische Beweisführung, 183 C, 55
Appel, Kenneth, 238 C AUCHY-R IEMANNsche
Approximation, 174 Differenzialgleichungen, 190
Approximation als Leitidee, 175 C AUCHYscher Integralsatz, 189
Approximation als universelle Idee, 175 charakteristisches Polynom, 29, 55
Approximation durch Kettenbrüche, 214 Covering Design, 253
äquivalente Umformulierung, 102
äquivalentes Problem, 83 D
Archimedisches Axiom, 178 Deckabbildung, 67
Argumentation durch Widerspruch, 207 deep structures, 2, 168

265
266 Sachverzeichnis

deklaratives Wissen, 11 Fallunterscheidung, 238, 239


D ESCARTESsches Schema, 13, 207 Finitarisierung, 238
Determinationsfunktion des Extremalen, 99 Fixelement, 54
diagonalisierbare Matrix, 29 Fixgerade, 54
Diffeomorphismus, 56 Fixpunkt, 54
Differentialgeometrie, 16 fixpunktfreie Permutationen, 124
Dilatationen, 60 Fixpunktgerade, 54
direkter Vergleich, 64 Fixrichtung, 54
Distraktoren, 83 Flächeninhalte, 10
Divide & Conquer, 236 Flächeninhaltsformel für Dreiecke, 68
Divide/Conquer/Glue, 247 Formel von L EGENDRE , 160
Divide-Conquer-Glue-Strategy, 236 Forward Chaining, 169
Division mit Rest, 161 fraktale Geometrie, 16
Dominosteine, 129
Drehstreckung, 58
Drei-Türen-Paradoxon, 163 G
dérangements, 124 Gallai (Grünwald), Tibor, 102
Dynamische Geometriesoftware (DGS), 54 Gauß-Aufgabe, 38
Dynamisierung, 62 Gebiet, 55
Generalisierung, 83
E Generierung von Vermutungen durch syst.
Ebene, 12, 17 Prob., 162
Ecke, 5 geometrische Approximation, 174
eigentliche Bewegung, 60, 66 geometrische Größenbereiche, 10
Eigenvektor, 29 geometrische Reihe, 71, 84, 182
Eigenwert, 29 geometrische Wahrscheinlichkeit, 24
Einheitskreisscheibe, 59 geometrisches Mittel, 10
E–I–S-Schema, 3 Gerade, 12, 17
Elektrodynamik, 16 geradentreu, 59
Ellipsoid, 12 gerader Anteil, 139
enaktive Ebene, 3 gerichteter Graph, 9
endlicher Wahrscheinlichkeitsraum, 127 geschlossener Integrationsweg, 189
Energieerhaltungssatz, 48 Gesetz der Ähnlichkeit, 41
enumerative Kombinatorik, 90, 109 Gesetz der Figur-Grund-Gliederung, 41
epistemische Struktur, 1 Gesetz der Geschlossenheit, 41
Ergodensatz, 30 Gesetz der guten Kurve, 41
ergodische Markow-Ketten, 30 Gesetz der Nähe, 41
Euklid, 92 Gesetz des gemeinsamen Schicksals, 41
E UKLIDischer Algorithmus, 210 Gesetze der Gruppierung, 41
euklidischer Vektorraum, 17 Gestalt, 39
Euler-Affinität, 55 Gestaltpsychologie, 3
E ULER sche '-Funktion, 122 Gestalttheorie, 39
Eulersche Zahl e, 125 gewichtetes arithmetisches Mittel, 46
Euler-Weg, 5 gleichmäßige Konvergenz, 175
Evaluierungsfunktionen, 166 gleichseitiges Dreieck, 61
Exhaustion, 174, 191 globale Approximation, 176, 185
Exhaustionsmethode, 180 Goldener Schnitt, 209
Exponentialreihe, 125 Graph, 5
Extremalprinzip, 60, 99, 174, 202, 212 Graphentheorie, 4, 16
Extremwerte mit Nebenbedingungen, 25 Greedy-Strategien, 173
Grenzprozesse in der Analysis, 175
F Grenzwert, 182
Fährmann-Problem, 6 größtes gemeinsames Maß, 210
Sachverzeichnis 267

H Inzidenzrelation, 104
Halbebene, 12 Inzidenzstruktur, 102, 104
Halbraum, 12 Inzidenztafel einer Relation, 128
Hamilton, William Rowan, 16 Irrationalität, 209
Happy Ending Problem, 141
harmonisches Mittel, 10 K
Hauptsatz über monotone Folgen, 191 Kante, 5
Hessesche Matrix, 23 Kantenmodell, 8
Hessesche Normalenform, 26 Kantenzug, 6
heuristische Struktur, 1 kartesisches Koordinatensystem, 12
heuristische Suche, 166 Kathetensatz, 11
Hex, 74, 76 Kegelschnitt, 12
Hilfsmittelfrage, 166, 223 Kettenbruch, 214
Hill Climbing, 169 Kettenbruchapproximation, 214
Höhensatz, 11 k-Kollektion, 112
holomorphe Funktion, 85 k-Kombination, 112
Holomorphie, 56 Klassifikationsprobleme, 54
homogene Markow-Kette, 29 Kleiner-Relation, 10
Homöomorphismus, 56 Kleines Eins-plus-Eins, 3
Hurwitz-Kriterium, 23 kleinste obere Schranke, 178
Hyperboloid, 12 kombinatorische Optimierung, 170
Hyperebene, 26 kommensurabel, 67
Kompaktifizierung von C, 55
I komplementärer Subgraph, 36
Identifikationsfunktion des Extremalen, 99 komplementäres Ereignis, 28
ikonische Ebene, 3 komplementäres Zählen, 118
indirekter Beweis, 100 Komplexe Differenzierbarkeit, 56
indirekter Vergleich, 65 konform, 57
indische Formeln, 217 Kongruenzabbildung, 59
Induktionsanfang, 200 Kongruenzsatz (wsw), 106
Induktionsaxiom, 199 Königsberger-Brücken-Problem, 4
Induktionsproblem der Erkenntnistheorie, 199 konstante Funktion, Approximation durch, 185
Induktionsschluss, 200 Koordinatengeometrie, 12
Induktionsstrategien, 206 Koordinatensystem, 12
induktive Struktur, 199 Korrespondenzhypothese, 99
induktives Schließen, 149 Kosinussatz, 12
injektives k-Tupel, 112, 244 k-Teilmenge, 112
Inkommensurabilität, 209 k-tes Moment einer Funktion, 186
innerer Teilpunkt, 107 Künstliche Intelligenz, 168
Instruktionsfragen, 33 k-Variation, 112
Integrationsweg, 189
Intervalladditivität des Integrals, 187 L
Intervallhalbierung, 191 Lagrange, 70
Intervallhalbierungsverfahren, 192 Lagrange-Multiplikatoren, 25
Intervallschachtelung, 50, 179 längentreu, 59
Intervallschachtelungsaxiom, 178 Lineare Algebra, 20
intuitiver Grenzwertbegriff, 71 lineare diophantische Gleichung, 221
Invarianten, 45 lineare Gleichung, 12
Invarianzprinzip, 225 lineare Optimierung, 13
Inversion, 58 lineare Ungleichung, 12
Inzidenz, 51, 60 Linearität des Integrals, 186
Inzidenzaxiome, 102 lokal konform, 57
Inzidenzgeometrie, 104 lokale Approximation, 176, 185
268 Sachverzeichnis

lokal-gleichmäßige Konvergenz, 175 Peano-Algebra, 199


Lösung eines Problems, 1 P EANOsches Axiomensystem, 199
Lotto-Design, 170, 227, 245, 246 Pentagon, 209
Pentagramm, 208, 209
M Peripheriewinkel, 107
Mathematiker, 208 Pfadregel, 27
Mathematisierung, 4 Phasierung des Problemlöseprozesses, 2
Mathe-Prisma, 6 pigeon-hole principle, 137
Maximum-Norm, 133 Planungsvieleck, 14
means-end-analysis, 168 Plato, 67
meromorphe Funktion, 85 Platonische Körper, 67
Minimallösungen von l. d. G., 221 plausibles Schließen, 149
Mischungsvorgänge, 46 Poker, 114
Mittelparallele, 97 Polynom vom Grad  k, Approximation
Mittel-Ziel-Analyse, 168 durch, 185
mittlere Teileranzahl, 130 Prägnanzgesetz, 39
Modularisierung, 109, 111 prämathematischer Beweis, 71
Monotonie des Integrals, 187 Primzahlsieb, 158
Monotonieaxiom, 178 Prinzip der Inklusion und Exklusion, 121
Monsterfunktion des Extremalen, 99, 202 Prinzip der kleinsten Quadrate, 21
Monty-Hall-Problem, 163 Prinzip des doppelten Zählens, 51, 127
Multiplikation im Stellenwertsystem, 241 Prinzip des nichtzureichenden Grundes, 66, 72
multiplikative Funktion, 122 Prinzip vom kleinsten Element, 202, 212
Mustererkennung, 240 Problem, 1
Problemfindung, 150
N Problemlösen im engeren Sinne, 207
Näherungsbrüche der, 214 Problemraumhypothese, 165, 219
Neun-Punkte-Problem, 44 Problemstruktur, 258
Noether, Max, 16 Problemwahrnehmung, 2
1-Norm, 17, 221 Produktregel, 110
Normalenform, 17 prozedurales Wissen, 11
n-te harmonische Zahl, 132 Pseudoprimzahl, 154
Punkthex, 77
O
Punktspiegelung, 66
offenkundige Symmetrie, 67
punktweise Konvergenz, 175
Ordnung einer Ecke, 52
pythagoräisches Dreieck, 217
Ordnung einer Kante, 52
pythagoräisches Zahlentripel, 217
Ordnungsstruktur, 101
Pythagoras, 11
Organisation der Wahrnehmung, 40
Pólya, 235
orientierungstreu, 57, 60
orthogonale Projektion, 23
Orthogonalität, 17 Q
Quasi-Empirismus, 150
P
Paarbildungsstrategie, 73 R
PAPPOS-Prinzip, 61 reductio ad absurdum, 207
Parabelsegment, 181 Reduktion der Problemkomplexität, 83
Paraboloid, 12 Reduktionsstrategien, 206
Paradoxon des Erfinders, 91 Regressionsgerade, 21
Parallelentreue, 55, 59 Rekursives Zählen, 111
Parallelstreckung, 60 Relationen, 6
Parameterform, 17 Rencontre-Zahlen, 124
Partition, 36 Repräsentationsmodi nach Bruner, 3
PASCAL sches Dreieck, 156 Ring der zahlentheoretischen Funktionen, 90
Sachverzeichnis 269

Rolle des Computers, 240 Symmetrieprinzip, 44, 64, 66, 157, 245, 246
Rückwärtsarbeiten, 61, 166, 219 Symmetrieprinzip als Spielstrategie, 72
Rückwärtsstrategien, 206 symmetrische Gruppe Sn , 68
symmetrische Matrix, 29
S Systematisches Probieren, 86, 215, 239, 251
Satz vom gleichschenkligen Dreieck, 108
Satz vom Supremum, 191 T
Satz von B OLZANO -W EIERSTRASS, 192 Tabellendarstellung, 6, 248
Satz von der Gebietstreue, 57 Tangram, 164
Satz von der offenen Abbildung, 56 Taylor-Formel, 85
Satz von Euler-Fermat, 122 Taylorreihe, 85
Satz von Pythagoras, 92 Teilersummenfunktion  , 70
Satz von R AMSEY, 141 Teilverhältnis, 60
Satz von S TOKES, 189 teilverhältnistreu, 59
Teilzielfrage, 166, 223
Satzgruppe des Pythagoras, 11
Tetraeder, 8
Scherung, 97
Tetraedernetz, 8
Schriftliche Division: deutsches
Thales von Milet, 34
Normalverfahren, 175
Topologie, 16
Schubfachprinzip, 137
Transformationsprinzip, 4
Schubfachprinzip, verschärfte Version, 140
Translation, 58
Siebformel, 121
Traveling Salesman Problem, 165
Siehe-Beweis, 71
Treppenfunktion, Approximation durch, 185
Simulated Annealing, 174, 258
trivialer Graph auf n Ecken, 52
Simuliertes Ausglühen, 174
Sinussatz, 12 U
Skalarprodukt, 17 überschlägiges Rechnen, 175
Spezialisierung, 83, 91, 153 Übersummativität, 39
spezifische Wärmekapazität, 48 Umformulierung, 33
Spur eines Integrationsweges, 189 Umstrukturierung, 109
stationäre Verteilung einer Markow-Kette, 30 ungerader Anteil, 139
Steiner-Lehmus, 230 unikursal, 5
stetig, 185 unvollendete Induktion, 151
stetige Verzinsung, 177
stochastische Matrix, 29 V
stochastischer Prozess, 28 Variation der Darstellung, 3
stochastischer Vektor, 29 Variation der Wahrnehmung, 38
Stomachion des A RCHIMEDES, 164 Variation des Allgemeinheitsgrades, 83
2. Strahlensatz, 103 Vektorraum, 16
Streckenlängen, 10 verallgemeinerter Satz von Pythagoras, 93
streckenverhältnistreu, 61 Verallgemeinerung, 83, 153
struktureller Transfer, 33 Verallgemeinerung zur Befreiung von
Subgraph, 36 Restriktionen, 84
Suche nach gemeinsamen Verallgemeinerung zur Reduzierung der
Verallgemeinerungen, 95 Problemkomplexität, 84
Summenformeln für die m-ten Potenzen, 135 Verschiebungen, 60
Summenregel, 109 versteckte Symmetrie, 67
Supremum, 178 Verteilen von Größen, 72
Supremumsaxiom, 178 Vier kombinatorische Grundaufgaben, 111
surface structures, 2 Vierfarbenproblem, 238
symbolische Ebene, 3 Vier-Quadrate-Satz, 70
Symmetriebegriff, operationalisierte Fassung, vollendete Induktion, 151, 197
68 vollständige Induktion, 86, 198, 216
Symmetriegesetz, 41 vollständiger Graph auf vier Ecken, 8
270 Sachverzeichnis

Vollständigkeit, 178 Wohlordnungsaxiom, 202


Vorwärtsarbeiten, 166
Vorwärtsstrategien, 206
Z
W Zahlaspekt, kardinaler, 221
Wahrnehmungspsychologie, 38 Zählen durch Bijektion, 110
Wärmemenge, 48 Zählprinzipien, 90, 109
Wechselwegnahme, 210 zentrische Streckung, 60, 62
Weidezaun-Aufgabe, 162 Zentrumswinkel, 108
Weierstraß, 186 Zielzustand, 1
Weierstraßscher Approximationssatz, 186 Zwei-Quadrate-Satz, 208
Winkel, 17 Zwischenwertsatz, 192
winkeltreu, 57, 59, 61 Zwischenziele, restriktive Suche nach, 226

Das könnte Ihnen auch gefallen