Problemlösen in
der Mathematik
Ein heuristischer Werkzeugkasten
Problemlösen in der Mathematik
Wolfgang Schwarz
Problemlösen
in der Mathematik
Ein heuristischer Werkzeugkasten
Wolfgang Schwarz
Fakultät 4 / Mathematik
Bergische Universität Wuppertal
Wuppertal, Deutschland
Springer Spektrum
© Springer-Verlag GmbH Deutschland, ein Teil von Springer Nature 2018
Das Werk einschließlich aller seiner Teile ist urheberrechtlich geschützt. Jede Verwertung, die nicht
ausdrücklich vom Urheberrechtsgesetz zugelassen ist, bedarf der vorherigen Zustimmung des Verlags.
Das gilt insbesondere für Vervielfältigungen, Bearbeitungen, Übersetzungen, Mikroverfilmungen und
die Einspeicherung und Verarbeitung in elektronischen Systemen.
Die Wiedergabe von Gebrauchsnamen, Handelsnamen, Warenbezeichnungen usw. in diesem Werk be-
rechtigt auch ohne besondere Kennzeichnung nicht zu der Annahme, dass solche Namen im Sinne der
Warenzeichen- und Markenschutz-Gesetzgebung als frei zu betrachten wären und daher von jedermann
benutzt werden dürften.
Der Verlag, die Autoren und die Herausgeber gehen davon aus, dass die Angaben und Informationen in
diesem Werk zum Zeitpunkt der Veröffentlichung vollständig und korrekt sind. Weder der Verlag noch
die Autoren oder die Herausgeber übernehmen, ausdrücklich oder implizit, Gewähr für den Inhalt des
Werkes, etwaige Fehler oder Äußerungen. Der Verlag bleibt im Hinblick auf geografische Zuordnungen
und Gebietsbezeichnungen in veröffentlichten Karten und Institutionsadressen neutral.
Springer Spektrum ist ein Imprint der eingetragenen Gesellschaft Springer-Verlag GmbH, DE und ist
ein Teil von Springer Nature.
Die Anschrift der Gesellschaft ist: Heidelberger Platz 3, 14197 Berlin, Germany
Vorwort
Das griechische Verb heuriskein (deutsch: finden, entdecken) liefert den Wortstamm
für die Bezeichnung einer Wissenschaft, die der Mathematikdidaktiker H EINRICH
W INTER als die Kunde „vom Gewinnen, Finden, Entdecken, Entwickeln neuen
Wissens und vom methodischen Lösen von Problemen (. . . )“ charakterisiert hat:
die Heuristik.
Heuristik ist keineswegs auf die Gewinnung neuer Erkenntnisse in der Mathe-
matik beschränkt; dennoch zeigt das Werk großer Mathematiker von der Antike
bis zur Neuzeit1 , dass die Heuristik gerade in der Mathematik schon immer eine
zentrale Rolle eingenommen hat. Heuristik ist ein wesentlicher Bestandteil mathe-
matischer Erkenntnisprozesse, ob es nun darum geht, potenzielle mathematische
Zusammenhänge zu entdecken oder Begründungen für vermutete Zusammenhänge
zu finden.
In der Mathematikdidaktik besteht Konsens darüber, dass Lernende in Schule
und Hochschule in der aktiven Auseinandersetzung mit Problemlöse- und Problem-
findungsprozessen die Mathematik nicht als „Fertigprodukt“, sondern als kreativen
Prozess erfahren sollen; folglich müssen sie über gesichertes strategisches Wissen
– ein Instrumentarium heuristischer Strategien – verfügen, das sie in Problemlöse-
prozessen flexibel und methodenkompetent einsetzen können.
Dies macht deutlich, dass insbesondere zukünftige Lehrerinnen und Lehrer des
Fachs Mathematik in ihrer universitären Ausbildung heuristische Kompetenzen er-
werben müssen: nicht nur, um durch systematischen Rückgriff auf Heurismen und
die Reflexion heuristischer Strategien beim problemgesteuerten Aufbau fachmathe-
matischen Wissens nachhaltig zu lernen (dies ist für alle Studierenden mathemati-
scher Fachrichtungen von Bedeutung), sondern auch, um später ihre Schülerinnen
und Schüler beim Erwerb heuristischer Kompetenzen adäquat unterstützen zu kön-
nen.
Fraglich ist aber, ob sich allein durch wiederholte Anwendung bestimmter Me-
thoden beim Lösen von Übungsaufgaben, wie sie traditionell wöchentlich zu den
einzelnen Fachvorlesungen gestellt werden, im Bereich des Problemlösens län-
1
Exemplarisch seien A RCHIMEDES , D ESCARTES , L EIBNIZ , B OLZANO genannt.
V
VI Vorwort
2
Es handelt sich größtenteils um Überarbeitungen von Inhalten meiner Habilitationsschrift aus
dem Jahr 2004.
Vorwort VII
niveaus abbilden. Außerdem muss festgestellt werden, dass in den meisten Fällen
Mischformen heuristischer Strategien bei der Bearbeitung mathematischer Proble-
me eingesetzt werden; darüber hinaus weisen manche Heurismen so mannigfaltige
Verflechtungen mit anderen heuristischen Strategien auf, dass man sie durchaus
auch anders als im Folgenden beschrieben hätte eingruppieren können.
Noch eine Anmerkung zum Layout: Im Text finden sich vereinzelt Hinweise auf
Farbgebungen einzelner Abbildungsteile, die sich im Schwarz-Weiß-Druck nicht
weiter verfolgen lassen. Prinzipiell liegen aber alle Abbildungen farbig vor, so dass
man beim Download des Buchs als eBook davon profitieren kann, wenn diese Hin-
weise beibehalten werden.
XI
XII Beispielverzeichnis
Inhaltsverzeichnis
1.1 Variation der Darstellung (Interpretation) . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.2 Variation der Problemstellung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
Gegeben sei eine nicht-offene Problemstellung, d. h., es liegt eine Situation vor, in
der ein Ausgangszustand und ein Zielzustand beschrieben sind. Eine Lösung des
Problems besteht dann darin, ein Instrumentarium von Transformationen bereit zu
stellen, mit deren Hilfe der Ausgangszustand in den Zielzustand überführt werden
kann, und diese Wandlung damit durchzuführen.
Diese Sicht der Dinge ist einfach, aber für unsere Zwecke präzise genug. In der
Literatur wird zur Abgrenzung von „Problemen“ gegen „Aufgaben“ oft noch hin-
terfragt, ob der Person des Problemlösers ein System von Transformationen, die den
Ausgangszustand in den Zielzustand überführen, prinzipiell bekannt ist oder ob der
Einsatz strategischen Wissens zur Lösung des Problems erforderlich ist: im ersten
Fall ist die Rede von „Aufgaben“, im zweiten Fall spricht man von „Problemen“.
Ein passendes Begriffssystem zur präziseren Beschreibung des Phänomens lie-
fert die Kognitionspsychologie, in der Denkprozesse als Informationsverarbeitungs-
prozesse interpretiert werden. Die kognitive (also auf Denken und Erkennen ge-
richtete) Struktur eines menschlichen Individuums wird von D IETRICH D ÖRNER
als zweigeteilt, in eine epistemische und eine heuristische Struktur, angenommen.
Die epistemische Struktur trägt vereinfacht gesehen den Aufbau eines semantischen
Netzes, dessen Knoten im einfachsten Fall den Objekten eines Realbereichs und
dessen Kanten Beziehungen zwischen diesen Objekten entsprechen. Das semanti-
sche Wissensnetz über einen Realbereich ist individuell unterschiedlich groß, und
es ist zeitlichen Veränderungen durch Lernen und Vergessen unterworfen. Was die
allzu anschauliche Vorstellung von einem Netz übersteigt, ist die Tatsache, dass es
Begriffshierarchien und Stufen der Abstraktion gibt. Gerade für das Mathematik-
lernen ist es typisch, dass das, was auf einer früheren Lernstufe als Beziehungen
zwischen Dingen memoriert wurde, später selbst zu Dingen wird, zwischen denen
dann erneut Beziehungen gesucht werden.
Über der epistemischen ist als Metastruktur die heuristische Struktur angeordnet.
Deren Aktivität bezieht sich nicht direkt auf einen außersubjektiven Realbereich,
sondern darauf, wie vom Subjekt das Wissen über einen Realbereich im weites-
ten Sinne organisiert, konkret: gewonnen, umgeformt, intersubjektiv verknüpft,
angewandt, bewertet, . . . werden kann. Die heuristische Struktur besitzt die Fähig-
keit, Knoten des Wissensnetzes neu mit anderen zu verbinden oder gar neue Teile
einzufügen; ihr wesentlicher Inhalt sind Heurismen (heuristische Strategien), also
Handlungsprogramme, deren Aktivierung in Problemlöseprozessen weiter helfen
kann. Mit ihnen kann man zwar keine Lösung erzwingen (dann läge eine Routi-
neaufgabe vor), jedoch einen weiterführenden Einfall, eine erhellende Entdeckung
wahrscheinlicher machen. Der Einsatz von Heurismen kann bei der Überwindung
der Barriere1 helfen, der sich der Problemlöser im Versuch, den Ausgangszustand
in den Zielzustand zu überführen, gegenüber sieht; Problem und Problemlösung
werden dann von der Art der Barriere beeinflusst.
Angesichts der Tatsache, dass es grundsätzlich ohnehin unmöglich ist, zwischen
Aufgaben und Problemen zu unterscheiden, ohne über exakte Kenntnisse der Werk-
zeuge zu verfügen, die dem Problemlöser individuell zur Verfügung stehen (sub-
jektiver Problemcharakter), möchte ich der Einfachheit halber in der Tradition des
Altmeisters G EORG P ÓLYA (1887–1985) beide Begriffe synonym verwenden; so
ist es auch im englischsprachigen Raum („problem“) üblich.
Offensichtlich sollte jeder Problemlöseprozess mit der Analyse von Ausgangszu-
stand und Zielzustand beginnen; dies entspricht der ersten Phase und der Vorberei-
tung der zweiten Phase in P ÓLYAs berühmter Phasierung des Problemlöseprozes-
ses:
1
Dieser Begriff wurde von D ÖRNER eingeführt.
1.1 Variation der Darstellung (Interpretation) 3
Im 20. Jahrhundert gewannen Richtungen der Psychologie, welche den Wert von
Veranschaulichung für das menschliche Denken betonten, Einfluss auf die Didaktik;
zu nennen wären hier in erster Linie die Gestaltpsychologie M AX W ERTHEIMERs
und deren Weiterentwicklung durch J EROME S. B RUNER.
Auf B RUNER geht die Unterscheidung dreier Repräsentationsmodi zurück, was
heute in der Mathematikdidaktik als das E–I–S-Schema bekannt ist:
Im Anfertigen einer Zeichnung muss aber nicht unbedingt eine Repräsentation auf
ikonischer Ebene liegen: In der Mathematik kann es sich dabei auch um eine sym-
bolische Form der Darstellung handeln, was damit zu tun hat, dass in den einzelnen
mathematischen Teilgebieten mehrere formale Sprachen nebeneinander existieren,
wenn man unter „formaler Sprache“ die Bildung von Reihen von Zeichen nach
wohlbestimmten syntaktischen und semantischen Regeln versteht.
Innermathematisch liegt die Kraft der Variation der Darstellung im Wechsel
verschiedener symbolischer Darstellungsformen („Transformationsprinzip“), wo-
bei manche symbolischen Darstellungen in der Mathematik (Geometrie, Graphen-
4 1 Heurismen der Variation
theorie) zusätzlich ikonischen Charakter haben, was sie für Klärungen von Problem-
situationen besonders leistungsfähig macht. Dies soll nun an einigen Beispielen
demonstriert werden.
Das wesentliche Element der Formulierung eines verbal gegebenen Problems in der
formalen Sprache eines Teilgebiets der Mathematik („Mathematisierung“) besteht
im damit verbundenen Prozess der Abstraktion: Durch das „Absehen von unwe-
sentlichen Dingen“ wird die Problemsituation überschaubarer und damit leichter zu
lösen. Wir beginnen mit einem Klassiker aus dem 18. Jahrhundert, der interessante
Konsequenzen für die Entwicklung der Mathematik hatte.
2
Im Gegenuhrzeigersinn sind dies von links unten die Grüne Brücke, die Köttel-Brücke, die Hohe
Brücke, die Honig-Brücke, die Holz-Brücke, die Schmiede-Brücke und die Krämer-Brücke.
1.1 Variation der Darstellung (Interpretation) 5
Nicht immer legt die verbale Formulierung eines Problems so suggestiv des-
sen Interpretation als graphentheoretisches Problem nahe (eine Brücke, die zwei
Stadtgebiete verbindet, als Verbindungskante zweier Ecken (Stadtgebiete)), wie das
folgende Beispiel zeigt.
3
Bei Bedarf findet der interessierte Leser Erläuterungen des graphentheoretischen Hintergrunds
in „Elemente der Geometrie“ (Scheid / Schwarz), welches in 5. Auflage ebenfalls bei Springer-
Spektrum erschienen ist.
6 1 Heurismen der Variation
Diese zehn Zustände sind die Ecken des zusammenhängenden Graphen in Abb.
1.3; zwei dieser Ecken sind durch eine Kante verbunden, wenn die zugehörigen
Zustände durch Einsatz des Bootes ineinander überführt werden können.
In der Sprache der Graphentheorie besteht das Problem darin festzustellen, wie
viele Kanten der kürzeste Kantenzug enthält, der die Ecken F W ZK und ; mitein-
ander verbindet.
K FZK
FWZK WK FWK Z FZ ∅
W FWZ
Die Aufgabe ist durch einfaches Abzählen zu lösen (es sind 7). Wieder ist allein
durch die Repräsentation des Problems in einem Graphen die Aufgabenstellung so
klar formuliert, dass die Lösung offensichtlich wird.
Graphen treten natürlich nicht nur als Inzidenzstrukturen auf, sondern auch als
Graphen von Relationen. Knobelaufgaben vom Typ „red ghost, yellow ghost, green
ghost“, wie sie z. B. im interaktiven Multimedia-Projekt Mathe-Prisma der Fakultät
4 / Mathematik der Bergischen Universität Wuppertal angeboten werden, verlangen
abstrakt nichts anderes als die Festlegung einer Zuordnung, sei es durch ihren Gra-
phen oder ihre Wertetabelle. Beides simultan lässt sich durch Tabellendarstellungen
erledigen, ein sehr effektives heuristisches Hilfsmittel.
vierelementige Teilmenge von A B, deren Elemente durch die Felder einer Ta-
belle, in der die Elemente von A als Zeilenkoordinaten und die Elemente von B als
Spaltenkoordinaten fungieren, repräsentiert werden können (Abb. 1.4).
Damit wären der Hamster Strolch, die Katze Tiger, der Hund Maxi und der Pa-
pagei Carlo erkannt (Abb. 1.6).
achten, dass bei der Übertragung einer Problemsituation in einen anderen Gegen-
standsbereich keine Übersetzungsfehler auftreten! Wie leicht das passieren kann,
zeigt folgendes Beispiel.
Wieder liegt es nahe, die Stäbe als physikalisches Modell der Kanten eines Gra-
phen zu verstehen, in dessen Ecken jeweils genau drei Stabenden zusammentreffen.
Der gesuchte Graph hat sechs Kanten, die mit jeweils zwei Ecken inzidieren. Wenn
andererseits jede Ecke des gesuchten Graphen die Ordnung 3 hat, muss es sich um
insgesamt vier Ecken handeln, damit zusammen 12 D 2 6 Inzidenzen gezählt
werden können. Man könnte also versucht sein, die ursprüngliche Fragestellung im
Kontext der Graphentheorie in der Form
„Gibt es einen Graphen mit vier Ecken der Ordnung 3 und sechs Kanten?“
zu formulieren und den vollständigen Graphen auf vier Ecken als Lösung des Pro-
blems anzusehen.
Dass damit das ursprüngliche Problem in Wahrheit noch nicht gelöst ist, sieht
man, wenn man versucht, mit den Stäben ein ebenes Modell des vollständigen Gra-
phen auf vier Ecken zu legen – diese Versuche müssen scheitern! Der Grund dafür
liegt darin, dass Graphen als Inzidenzstrukturen topologische Objekte sind und des-
halb geometrische und erst recht metrische Informationen einer Problemstellung
bei der Übertragung des Problems in einen graphentheoretischen Kontext verloren
werden. Die Stäbe im Sechs-Stäbe-Problem enthalten aber solche Informationen:
Es handelt sich um Modelle von Strecken (geometrische Information), die zudem
noch gleich lang sind (metrische Information). Wenn man also graphentheoretische
Elemente zur Beschreibung des Sechs-Stäbe-Problems benutzen will, dann können
diese nur einen klärenden Beitrag leisten, aber keine vollständige Beschreibung des
Problems liefern!
Eine der Problemdatenlage angemessene Formulierung der Aufgabe wäre aber:
„Gibt es ein geometrisches Objekt mit sechs gleich langen Kanten, welches to-
pologisch zum vollständigen Graphen auf vier Ecken äquivalent ist?“
zwischen dem arithmetischen Mittel A.a; b/, dem geometrischen Mittel G.a; b/
und dem harmonischen Mittel H.a; b/ zweier verschiedener positiver Zahlen a; b 2
R.
10 1 Heurismen der Variation
aCb p 2
A.a; b/ WD I G.a; b/ WD ab I H.a; b/ WD :
2 1
a C 1
b
Was ist nun erreicht? Mit dem Heurismus der Variation der Darstellung wurde
die geforderte Begründung einer Ungleichung auf den visuell zugänglichen Ver-
gleich bestimmter Streckenlängen zurückgeführt. Allerdings ist nur eine Repräsen-
tantenstrecke der beteiligten Mittelwerte evident (nämlich die von A.a; b/); die
Konstruktion der beiden anderen Repräsentantenstrecken erfordert entweder de-
klaratives und prozedurales Wissen im Kontext der Satzgruppe des P YTHAGORAS
(dann wäre die vollständige Präsentation des Problems im Gegenstandsbereich der
Geometrie geschafft) oder aber bereits jetzt den Einsatz strategischen Wissens, nur
um eine geometrische Repräsentation des Problems zu finden.
Dies macht deutlich, dass bei komplexeren Problemstellungen die vollständi-
ge Interpretation des Problems in einer anderen Sprache ein dynamischer Prozess
ist, der nicht notwendig (wie bei den im vorigen Abschnitt behandelten einfachen
Beispielen) vor der zweiten P ÓLYAschen Phase des Problemlöseprozesses abge-
schlossen sein muss!
Zur abschließenden Lösung des Problems des Mittelwertvergleichs im Begriffs-
system der Geometrie kann die Satzgruppe des P YTHAGORAS verhelfen. Abb. 1.10
enthält alle notwendigen Informationen für eine Argumentation mit dem Höhensatz
und dem Kathetensatz.
Wie oben begründet gilt jM C j D A.a; b/, weiter ist nach dem Höhensatz
jF C j2 D a b, also jF C j D G.a; b/. Der algebraische Zusammenhang
Eine neue Ära des Systemwechsels zwischen Geometrie und Algebra wurde zu
Beginn des 17. Jahrhunderts eingeleitet, als P IERRE DE F ERMAT (1605–1661)
und R ENÉ D ESCARTES (1596–1650) der synthetischen Geometrie klassisch-
4
Derjenige, der an dieser Stelle den „variablen Horizont der Evidenz“, wie es der niederländische
Mathematikdidaktiker F REUDENTHAL auszudrücken pflegte, noch nicht erreicht zu haben glaubt,
kann zur Not mit dem aus dem Satz von Pythagoras zu folgernden Argument, dass in jedem recht-
winkligen Dreieck die Hypotenuse die längste Dreiecksseite ist, endgültig überzeugt werden.
12 1 Heurismen der Variation
Geraden in der Ebene (Ebenen im Raum) lassen sich als Lösungsmengen linea-
rer Gleichungen mit zwei Variablen (mit drei Variablen) beschreiben,
Halbebenen bzw. Halbräume ergeben sich als Lösungsmengen linearer Unglei-
chungen,
Lagebeziehungen zwischen Geraden und/oder Ebenen lassen sich an der Lö-
sungsmenge linearer Gleichungssysteme ablesen,
Berechnungen fehlender Stücke in Polygonen werden mit Mitteln der Trigono-
metrie, insbesondere Sinussatz und Kosinussatz möglich,
Affine Abbildungen der Ebene (n D 2) und des Raumes (n D 3) können durch
Abbildungsvorschriften
fW Rn ! Rn
.x1 ; : : : ; xn / 7! f .x1 ; : : : ; xn /
Der Dualismus von Geometrie und Algebra ist eine Ausprägung einer universel-
len Methode des Problemlösens, welche D ESCARTES zu entwickeln beabsichtigte.
Die von D ESCARTES in seinen unvollendet gebliebenen „Regeln zur Anleitung des
Geistes“ ursprünglich verfolgte Idee („Descartessches Schema“) lässt sich5 grob
folgendermaßen zusammenfassen:
5
So P ÒLYA 1966 im ersten Band seines Buches „Vom Lösen mathematischer Aufgaben“.
1.1 Variation der Darstellung (Interpretation) 13
Descartessches Schema
1. Man reduziere jede Art von Problem auf ein mathematisches Problem.
2. Man reduziere jede Art von mathematischem Problem auf ein algebrai-
sches Problem.
3. Man reduziere jedes algebraische Problem auf die Lösung einer einzigen
Gleichung.
D ESCARTES selbst muss bemerkt haben, dass seine Idee in vielen Fällen nicht
zu realisieren war; möglicherweise hat er deshalb seine „Regeln zur Anleitung des
Geistes“ nicht vollendet und nur Teile davon in sein späteres Werk „Discours de la
méthode“ übernommen.
Dennoch lässt sich aus P ÒLYAs Kommentaren zu den unbeendeten Regeln von
D ESCARTES ein Heurismus gewinnen, der für die Mathematik und zahlreiche An-
wendungen von großer Bedeutung ist und den A LFRED S CHREIBER folgenderma-
ßen beschreibt6 :
Die Herauslösung von Problemen aus ihrer verbalen Fassung und ihre Darstel-
lung im Begriffssystem der Algebra stellt heuristisches Handeln dar; jedesmal,
wenn ein Problem durch das „Aufstellen von Gleichungen“ gelöst wird, befolgt der
Problemlöser also das D ESCARTESsche Schema. Diese Zuordnung birgt die Gefahr,
D ESCARTES’ Ansinnen unangemessen einseitig zu verstehen: D ESCARTES selbst
hat in seiner „Géométrie“ Wege aufgezeigt, wie man algebraische Gleichungen
geometrisch lösen kann. So studierte er zum Beispiel zur Lösung einer algebrai-
schen Gleichung vom Grad 5 oder 6 die Schnittpunkte eines Kreises mit einer Kurve
vom Typ
axy D abc C acx bx 2 x 3 ;
die später Cartesische Parabel genannt wurde. Im Zentrum der D ESCARTESschen
Überlegungen stand eine Einheit von geometrischen und algebraischen Arbeitswei-
sen.
Diese Einheit ist in bemerkenswerter Weise auch in modernen Problemstellun-
gen realisiert, die im Kontext der linearen Optimierung angesiedelt sind. Hier geht
es darum, absolute Extrema linearer Funktionen Z („Zielfunktionen“) in n Varia-
blen unter Beachtung gewisser Nebenbedingungen zu bestimmen, die sich ihrerseits
6
Alfred Schreiber: Lehrveranstaltungs-Materialien zur Heuristik (2002).
14 1 Heurismen der Variation
Optimierungsproblem
Man bestimme in der Lösungsmenge L des Ungleichungssystems
.1/ x1 0 .2/ x2 0
.3/ x1 100 .4/ x2 70
.5/ x1 C x2 140 .6/ x1 C 2x2 180
Wären die Koordinaten von S nicht ganzzahlig gewesen, so hätte man ein Z2 -
Gitter in das Koordinatensystem legen können und m als das größte aller t, für die
g t noch mindestens einen Punkt auf dem im Planungsvieleck gelegenen Teil des
Z2 -Gitters hat, bestimmen können.
klassifizierte L EONHARD E ULER Kurven und Flächen durch die Analyse ihrer
Gleichungen, mit denen sie im Koordinatensystem beschrieben werden konnten,
wobei er sowohl in kartesischen als auch in schiefwinkligen Koordinatensyste-
men arbeitete und auch die linearen Transformationsgleichungen des Übergangs
zwischen diesen Koordinatensystemen angab. Bis zum Ende des 18. Jahrhunderts
setzte sich dann unter dem Einfluss von J OSEPH L OUIS L AGRANGE (1736–1813),
G ASPARD M ONGE (1746–1818) und S YLVESTRE F. L ACROIX (1765–1843) der
Begriff „Analytische Geometrie“ für diese Art der Auseinandersetzung mit geome-
trischen Figuren durch.
Die Vernetzung von Teilen der analytischen Geometrie mit Teilen anderer mathe-
matischer Disziplinen hat sich in mehreren Fällen verselbständigt und zur Entste-
hung neuer mathematischer Teilgebiete geführt. Im frühen 19. Jahrhundert begrün-
dete C ARL F RIEDRICH G AUSS (1777–1855) die Differentialgeometrie als Synthese
aus analytischer Geometrie und Differentialrechnung7 , und im späten 19. Jahrhun-
dert entstand unter maßgeblicher Beteiligung von M AX N OETHER (1844–1921)
aus der Theorie der algebraischen Kurven und Flächen die algebraische Geometrie.
Die Topologie hat ebenfalls (koordinaten-)geometrische Wurzeln: Ursprünglich
untersuchte man solche Eigenschaften von Punktmengen („geometrischen Figu-
ren“) im dreidimensionalen Anschauungsraum, die unter topologischen Abbildun-
gen („Homöomorphismen“)8 erhalten blieben. Unter diesem Gesichtspunkt könnte
man auch die Graphentheorie als Teil der Topologie verstehen: Graphen als Inzi-
denzstrukturen werden durch ihre Inzidenzmatrizen charakterisiert, und diese sind
topologische Invarianten.
Eine junge geometrische Forschungsrichtung, die ihre Blütezeit in den 80er/90er
Jahren des 20. Jahrhunderts erlebt hat, ist die fraktale Geometrie, welche diejenigen
Phänomene studiert, die sich bei Iterationen von Ähnlichkeitsabbildungen ergeben;
die Entstehung dieser mathematischen Disziplin war erst im Zeitalter des Compu-
ters und leistungsfähiger Computer-Grafik-Programme möglich.
Einer der fruchtbarsten Prozesse im Dialog zwischen Algebra und Geometrie seit
Beginn des 19. Jahrhunderts, der einen Wiederaufschwung der Geometrie einleite-
te, war die Genese des Vektorraumbegriffs, an deren Ende die Festschreibung des
allgemeinen Vektorraumbegriffs über einem beliebigen Körper stand (B OURBAKI
1947).
Damit wurden im Rahmen der modernen Strukturalgebra zwei unterschiedliche
Traditionen vereint, die sich im 19. Jahrhundert aus zwei verschiedenen Quellen zur
„Vektorrechnung“ entwickelt hatten:
7
C ARL F RIEDRICH G AUSS (1777–1855): „Disquisitiones circa superficies curvas“.
8
Bijektive Abbildungen, die stetig sind und deren Umkehrabbildungen ebenfalls stetig sind.
1.1 Variation der Darstellung (Interpretation) 17
Durch die Einbettung der analytischen Geometrie des 18. /19. Jahrhunderts in die
Theorie der euklidischen Vektorräume9 wird es jetzt möglich, alle Punktmengen der
Ebene bzw. des Raumes mithilfe von Vektorraumoperationen in den euklidischen
Vektorräumen R2 bzw. R3 zu beschreiben. Dies hat insbesondere folgende Vorteile:
Wieder ist die Liste geometrischer Begriffe und Verfahren und ihrer Entsprechun-
gen in der vektoriellen analytischen Geometrie zu lang, um sie hier vollständig
aufschreiben zu können. Exemplarisch seien genannt:
!
9
Man identifiziere einen Punkt P im Koordinatensystem mit dem Ortsvektor !
p D OP , dessen
Standardkomponenten die Koordinaten des Punktes P im R (n D 2; n D 3) sind.
n
10
Zur begrifflichen Abgrenzung der modernen analytischen Geometrie gegen die analytische
Geometrie des 18. /19. Jahrhunderts spricht man auch von „Analytischer Geometrie in vektori-
eller Darstellung“.
11
Skalarprodukte auf reellen Vektorräumen sind positiv-definite, symmetrische Bilinearformen.
18 1 Heurismen der Variation
!
u ;!
v wieder das Skalarprodukt verwendet wird
0 D E 1
!
u ;!
v
@^.!
u ;!
v / D arccos A :
!
!
uv
c 2 D a2 C b 2 (S. d. Pythagoras)
h2 D p q (Höhensatz)
b 2 D p c I a2 D q c (Kathetensatz)
Dann entsprechen die in den Sätzen der Satzgruppe des Pythagoras genannten Län-
gen den Normen der Vektoren gleichen Namens, es ist also
! !
a D !
a ; b D b ; c D !
c ; h D h ; p D !
p und q D !
q :
Setzt man zur Berechnung dieser Normen die Eigenschaften des Skalarprodukts
geschickt ein, so ergeben sich daraus unmittelbar die Aussagen der Satzgruppe des
Pythagoras.
1.1 Variation der Darstellung (Interpretation) 19
!
Es ist !
c D .! a C b /, also gilt
2 D E
c 2 D ! c D ! c ; !
c
D E D E
D .! a C !
b /; .! a C ! a C !
b / D .1/2 .!
! !
b /; .a C b /
D E D! E D! ! E D! !E
D !
a ;!
a C b ;! a C a; b C b; b
D E D ! E D! ! E
D !
a ;!
a C2 ! a; b C b; b :
!
Da die Vektoren !
a und b zueinander orthogonal sind, verschwindet das Skalar-
!
produkt h!
a ; b i, und man erhält
D E D! !E
2 !
2
c2 D ! a C b ; b D !
a ;!
a C b D a2 C b 2 ;
!
! !
Aufgrund der Orthogonalität der Vektoren h und ! p sowie h und ! q ist h h ; !
pi D
!
!
!
!
h q ; h i D 0; außerdem schließen die Vektoren p und q einen Winkel von 0ı
miteinander ein, sodass
D E D E
! p D !
q ;!
q D !
p ;! ! !
! !
!
p q cos ^. p ; q / D p q
!
!
weil die Orthogonalität der Vektoren !
a und b die Gleichung h!
a ; b i D 0 impli-
ziert. Aber
E D!
D! E
!
b ;! c D p h ;! c
D E D! E
D ! c
p ;! h ;!
c
D E
D ! p ;!
c 0
D E
D ! p ;!
c
!
D ! p c cos ^.!
p ;!
c /
!
D ! p c ;
Die algebraische Struktur eines Vektorraums mit Skalarprodukt ist ein abstrak-
tes Konstrukt, dessen Objekte und Operationen nichts mit unserer Anschauung in
der kartesischen Geometrie zu tun haben müssen – man denke etwa an den Vek-
torraum C Œa; b der auf einem kompakten Intervall Œa; b R stetigen Funktionen
f W Œa; b ! R mit dem Skalarprodukt
Zb
hf; gi WD f .x/ g.x/ dx :
a
Angesichts der Universalität des Konzepts ist es daher nicht verwunderlich, dass im
ersten Drittel des 20. Jahrhunderts die Vektorraumterminologie und die damit ver-
bundenen Aspekte der Linearen Algebra auch in andere Teilgebiete der Mathematik
als grundlegendes Werkzeug eingeführt wurden.
Ganz besonders bedeutend war dies zunächst in der damals neuen Funktional-
analysis mit den Protagonisten DAVID H ILBERT (1862–1943), F RIGYES R IESZ
(1880–1956) und S TEPHAN BANACH (1893–1945)); H ERMANN W EYL (1885–
1955) integrierte die Vektorraumterminologie in G AUSS’ Differentialgeometrie.
Die Auswahl an mathematischen Gegenstandsbereichen, welche Parallel-Reprä-
sentationen im Begriffssystem der Linearen Algebra zulassen, ist seither konti-
nuierlich gewachsen. Bisweilen sind diese Darstellungen analytisch-geometrisch
interpretierbar (in Verallgemeinerung ihrer Entsprechungen im Fall der Zwei- oder
Dreidimensionalität) und können deshalb einem vertieften Verständnis einer Pro-
blemstellung dienlich sein. Damit werden wir uns im folgenden Abschnitt näher
beschäftigen.
1.1 Variation der Darstellung (Interpretation) 21
Da sich dieses Buch unter anderem an Studierende mit dem Berufsziel Lehramt
an Gymnasien richtet, scheint es sinnvoll, Beispiele für das Wechselspiel zwischen
Linearer Algebra und anderen Teilgebieten der Mathematik aus denjenigen Berei-
chen auszuwählen, die für zukünftige Mathematiklehrer in der Oberstufe besonders
interessant sind, also aus der Analysis und der Statistik/Stochastik.
Vielfach kann das Problem der Extremwertbestimmung von genügend oft diffe-
renzierbaren Funktionen mehrerer Variablen (mit und ohne Nebenbedingungen) als
eine einfache Abstandsbestimmung zwischen linearen Untermannigfaltigkeiten12
im Rn interpretiert werden, was den aufwändigen Kalkül der Differenzialrechnung
mehrerer Veränderlicher überflüssig macht.
12
Hierbei werden auch Punkte als (0-dimensionale) lineare Untermannigfaltigkeiten aufgefasst.
13
Die Summe der quadratischen vertikalen Abstände aller Punkte der Punktwolke zu g soll mini-
mal werden.
22 1 Heurismen der Variation
X
n
f .m; b/ WD .yi mxi b/2 :
i D1
fW R2 ! R
Pn
.m; b/ 7! i D1 .yi mxi b/ ;
2
6 ˛ x 2
i C ˇ nx D x y
i i7
4 i D1 i D1 5 . /
˛x C ˇ D y
Da für mindestens ein Paar .i; j / ; i ¤ j auch xi ¤ xj und damit ebenso xi x ¤
xj x gilt, ist
X n
0< .xi x/2
i D1
X n X
n X
n
D xi2 2x xi C x2
i D1 i D1 i D1
X
n
D xi2 nx 2 ;
i D1
von f ist nach dem Hurwitz-Kriterium15 positiv definit, denn ihre Determinante ist
positiv (Berechnung vgl. Determinante der Koeffizientenmatrix von . /), und es gilt
P n
i D1 xi > 0 (wegen xi ¤ xj für mindestens ein Paar .xi ; xj /). Daher ist .˛; ˇ/ die
2
14
Benannt nach OTTO H ESSE (1811–1874).
15
Benannt nach A DOLF H URWITZ (1859–1919).
16
Nicht notwendig mit Mitteln der Differenzialrechnung! Hier würde sogar die Scheitelpunktsbe-
stimmung einer Parabel genügen.
17
H. Scheid: Wahrscheinlichkeitsrechung. Mathematische Texte, Bd. 6. BI-Wissenschaftsverlag,
Mannheim.
24 1 Heurismen der Variation
Die Bestimmungsgleichungen . / für ˛ und ˇ erhält man dann aus den Ortho-
gonalitätsbedingungen
D E D E
!
y ˛!
x ˇ!
z ; !
x D 0 und !
y ˛!
x ˇ!
z ; !
z D 0 :
Die Ermittlung der Parameter ˛ und ˇ der Regressionsgeraden geschieht jetzt wie
oben, wobei der Nachweis der Minimumseigenschaft nicht mehr erforderlich ist.
rades“ zweimal derselbe Ausfall auftritt, ist die Wahrscheinlichkeit des Ereignisses
X
n
A D f.x1 ; x1 /; : : : ; .xn ; xn /g mit P .A/ D pi2 DW f .p1 ; : : : ; pn / :
i D1
In der Sprache der Analysis stellt sich das Problem folgendermaßen dar:
fW Rn ! R
Pn
.p1 ; : : : ; pn / 7! 2
i D1 pi
Die Lösung dieses Problems ist Routine, aber lästig. Zunächst ermittelt man mit-
hilfe des Satzes über die Lagrange-Multiplikatoren die Kandidaten .a1 ; : : : ; an / für
Extrema von f unter der Nebenbedingung g D 0 als Lösungen des Gleichungssys-
tems 2 3
@f @g
.a1 ; : : : ; an / D .a1 ; : : : ; an /
6 @p1 @p1 7
6 7
6 @f @g 7
6 .a1 ; : : : ; an / D .a1 ; : : : ; an / 7
6 7
6 @p2 @p2 7
6 7
6 :: :: 7
6 : D : 7
6 7
6 7
6 @f @g 7
6 .a1 ; : : : ; an / D .a1 ; : : : ; an /7
4 @pn @pn 5
g.a1 ; : : : ; an / D 0 :
Im konkret vorliegenden Fall ergibt sich das Gleichungssystem
2 3
2a1 D
6 2a2 D 7
6 7
6 7
6 :: :: 7
6 :D: 7
6 7
6 7
6 2an D 7
6 7
6Xn 7
4 5
ai 1 D 0
i D1
der einzige Kandidat für das gesuchte Extremum, und für jede Wahl von p1 ; : : : ; pn
mit
1 X n
pi WD C ˛i .1 i n/ und pi D 1
n i D1
ergibt sich
X
n
f .p1 ; : : : ; pn / D pi2
i D1
X n
1 2X
n X n
D 2
C ˛i C ˛i2
i D1
n n i D1 i D1
„ ƒ‚ … „ƒ‚…
D0 0
X
n
1
D f .p1e ; : : : ; pne / ;
i D1
n2
g.p1 ; : : : ; pn / D 0 bzw. p1 C p2 C C pn 1 D 0
!
1
a Dp ! n0
n
18
Benannt nach A NDREI M ARKOW (1856–1922).
28 1 Heurismen der Variation
und
wobei P .G=H / die bedingte Wahrscheinlichkeit von G unter der Bedingung H be-
zeichne. Stochastische Prozesse dieser Art nennt man Markow-Ketten; der oben
beschriebene Übergang von q ! nach !
qk wird üblicherweise in Matrix-Vektor-
k1
Schreibweise notiert, also in der Form
!
!
1p p ! :
! DW M q
qk D qk1 k1
p 1p
Die stochastische Matrix19 M D .mij /2i;j D1 wird als die Übergangsmatrix der
Markow-Kette bezeichnet; stets gibt mij D P .Xk D i=Xk1 D j / die bedingte
Wahrscheinlichkeit dafür an, dass Xk den Wert i annimmt, wenn Xk1 den Wert j
hatte.
In unserem Beispiel sind die Einträge der Übergangsmatrix unabhängig von k,
man spricht dann von einer homogenen Markow-Kette.
Zur Bestimmung von !
qn muss man also nur M n !
q0 berechnen, was bekanntlich
leicht ist, wenn M diagonalisierbar ist, denn dann bereitet die Berechnung von
M n keine Schwierigkeiten. Unsere Matrix M ist aber symmetrisch, folglich ist sie
diagonalisierbar!
Zum Zwecke der Diagonalisierung von M bestimmt man zuerst die Eigenwerte
1 D 1 und 2 D 1 2p von M als Nullstellen des charakteristischen Polynoms
f ./ D .1 p /2 p 2 von M . Als Eigenvektoren zu den Eigenwerten 1 ; 2
ergeben sich z. B. e1 WD .1; 1/t und e2 WD .1; 1/t .
Wählt man als Transformationsmatrix B diejenige reguläre Matrix, deren Spal-
tenvektoren e1 und e2 sind, so folgt
0 1
! 1 1 !
1 1 B 2 1 0
BD 1
D@ 2 C ; B 1 M B D
1 A
; B ;
1 1 1 0 1 2p
2 2
19
Einen Vektor mit ausschließlich nicht-negativen Komponenten, die sich zu 1 addieren, nennt
man einen stochastischen Vektor; unter einer stochastischen Matrix versteht man eine Matrix,
deren Spaltenvektoren sämtlich stochastisch sind.
30 1 Heurismen der Variation
ist der eindeutig bestimmte stochastische Eigenvektor von M zum Eigenwert 1 und
damit eine stationäre Verteilung der Markow-Kette.
Je länger der Parlamentarier also den Manipulationsversuchen seiner Fraktion
oder der Opposition ausgesetzt ist, desto größer ist die Wahrscheinlichkeit, dass er
mit der inneren Einstellung eines „entschiedenen sowohl als auch“ in der Tradition
W ILLY B RANDTs20 zur Abstimmung schreitet.
20
Diese Formulierung wählte seinerzeit W ILLY B RANDT , als er die Haltung seiner Partei zur
Atomenergie kommentieren sollte.
1.1 Variation der Darstellung (Interpretation) 31
Die Identifikation eines Problems wird manchmal explizit durch eine konkrete
Fragestellung angeregt, kann aber auch der Person des Problemlösers überlassen
bleiben, wenn es sich um offene Problemstellungen handelt.21 Die Phasen Ia) und
Ib) bedingen sich gegenseitig, denn ein wesentlicher Punkt der Problemidentifika-
tion ist die Analyse der mathematischen Natur der Problemdaten, und diese dient
gleichzeitig als Kontrollstrategie für das Auffinden einer geeigneten Darstellung des
Problems.
Geht es um Zuordnungen? Dann lege man die Graphen der Zuordnungen oder
deren Wertetabelle fest, vorzugsweise in einer Tabelle.
Sind Größenvergleiche anzustellen? Dann kommen nur Repräsentationen inner-
halb der Größenbereiche mathematischer Disziplinen in Frage. Im Bereich der
Geometrie sind dies: Längen, Flächeninhalte, Rauminhalte, Winkelgrößen.
Werden Zustandsänderungen beschrieben, ohne dass die einzelnen Zustände me-
trische oder geometrische Informationen enthalten? Dann liegt die Verwendung
von Graphen nahe.
Kann man das Problem im Begriffssystem der Algebra durch Gleichungen oder
Ungleichungen beschreiben? Dann versuche man vom Wechselspiel zwischen
Algebra und Analytischer Geometrie zu profitieren.
Handelt es sich um Extremwertbestimmungen? Dann kann man bisweilen die
Maschinerie der Analysis durch geometrische Interpretationen im Begriffssys-
tem der Linearen Algebra ersetzen. Davon profitiert man manchmal auch bei der
Beschreibung stochastischer Prozesse.
21
In einem Unterricht, der sich an der Philosophie des entdeckenden Lernens orientiert, werden
häufig offene Aufgabenstellungen in geeigneten Kontexten behandelt.
1.2 Variation der Problemstellung 33
Wenn nun ein Problem identifiziert und eine geeignete Darstellung des Problems
(zumindest in Teilen) gefunden ist, damit aber noch kein Lösungsweg erkennbar
wird, dann kann man sich innerhalb des gewählten Repräsentationssystems ver-
schiedener heuristischer Techniken bedienen, die durch Variation unterschiedlicher
Aspekte der Aufgabenstellung (des Allgemeinheitsgrades, der Problemdaten, der
Anordnung der Daten, des Anspruchs an die Exaktheit der Lösung usw.) mögli-
cherweise einen Plan zur Lösung des Problems reifen lassen. Wie bereits früher
erwähnt, werden Heurismen bei Problemlöseprozessen selten in Reinform verwen-
det; die meisten Strategien der Variation sind aber Mischformen aus den Idealtypen,
die im Folgenden an charakteristischen Beispielen vorgestellt werden.
Sichtet man die Instruktionsfragen, die G EORG P ÓLYA in seiner „Schule des Den-
kens“ auflistet, um dem Leser die Inhalte der einzelnen Stufen seines Phasensche-
mas des Problemlöseprozesses zu verdeutlichen, so fällt auf, dass eine Familie von
Fragen der Phase II darauf abzielt, die Lösungsfindung durch deutliches Herausar-
beiten der Bezüge des Problems zu früher erworbenem Wissen zu erleichtern:
Hast Du die Aufgabe schon früher gesehen? Oder hast Du dieselbe Aufgabe in
einer wenig verschiedenen Form gesehen?
Kennst Du eine verwandte Aufgabe? Kennst Du einen Lehrsatz, der förderlich
sein könnte?
Kannst Du die Aufgabe anders ausdrücken? Kannst Du sie auf noch verschiede-
ne Weise ausdrücken?
Das zwischen den Zeilen dieser Fragen angeregte strategische Handeln besteht
offenbar darin, durch Umformulierung und Analogisierung einer Problemstellung
strukturelle Gemeinsamkeiten mit bereits gelösten Problemen gezielt aufzusuchen;
in diesem Zusammenhang spricht man bisweilen von strukturellem Transfer.
Durch verschiedenartige äquivalente Formulierungen22 eines mathematischen
Sachverhalts kann beziehungsreiches Wissen aufgebaut werden, welches günstige
Bedingungen für divergentes Denken im Sinne W ITTMANNs schafft. Dazu seien
22
Auch innerhalb eines Repräsentationssystems, d. h. ohne Variation der Darstellung!
34 1 Heurismen der Variation
Die Menge der Punkte, von denen aus eine gegebene Strecke unter einem rechten
Winkel erscheint, ist der Kreis, der diese Strecke zum Durchmesser hat.
Die Spitzen aller rechtwinkligen Dreiecke über einer gegebenen Hypotenuse c
liegen auf dem Kreis mit c als Durchmesser.
Der Umkreis eines rechtwinkligen Dreiecks hat seinen Mittelpunkt in der Mitte
der Hypotenuse.
Die Scheitel der rechten Winkel aller rechtwinkligen Dreiecke mit der gleichen
Hypotenuse AB haben vom Mittelpunkt der Strecke AB die gleiche Entfernung,
nämlich die Hälfte von AB.
Variation: In jedem rechtwinkligen Dreieck ist die Seitenhalbierende [der Hypo-
tenuse]25 gleich groß wie die halbe Hypotenuse.
In einem Sehnenviereck, dessen eine Diagonale durch den Kreismittelpunkt
geht, sind die dieser Diagonalen gegenüberliegenden Winkel beide je gleich 90ı .
Zu einem Peripheriewinkel von 90ı gehört als Mittelpunktswinkel immer ein
gestreckter Winkel, also ein Kreisdurchmesser.
Der zu einem Bogen von 180ı gehörige Umfangswinkel beträgt 90ı .
Aus der Sicht des Problemlösers interessant ist dabei die Tatsache, dass die Umfor-
mulierung einer Problemstellung durch die Erhöhung der Anzahl angesprochener
Bereichsbezüge die Wahrscheinlichkeit dafür erhöht, dass Anknüpfungspunkte mit
dem Wissensinhalt der epistemischen Struktur des Problemlösers gefunden werden
und so Ideen für einen Lösungsplan entwickelt werden können.
Die Analogiebildung beim Problemlösen bezeichnet die meist anspruchsvolle
heuristische Tätigkeit, ein in einem System S1 gegebenes Problem in ein für die
Person des Problemlösers überschaubareres System S2 zu übertragen, Lösungside-
en für das nach S2 transferierte Problem zu entwickeln, diese Ideen nach S1 zu
reimportieren und für die Lösung des ursprünglichen Problems nutzbar zu machen.
Diese vage Formulierung macht deutlich, wie universell der Heurismus der Analo-
gisierung eingesetzt werden kann, und zwar nicht nur beim Problemlösen, sondern
auch beim Ausbau mathematischer Theorien.
Die Kehrseite der Universalität des Prinzips ist, dass im konkreten Fall der Ver-
wendung der Strategie der Analogisierung beim Problemlösen in der Regel nicht
klar ist, welches überschaubarere System S2 und welche Analogisierungstransfor-
mation T W S1 ! S2 für die Lösung des Ausgangsproblems P hilfreich sein könn-
te. Ein naheliegendes Kriterium für die Auswahl von S2 und T W S1 ! S2 wäre in
der Zielsetzung zu sehen, die Informationsverluste beim Rücktransfer einzelner Lö-
sungskonzepte für T .P / in die ursprüngliche Problemsituation P zu minimieren.
23
Benannt nach T HALES VON M ILET (ca. 650–560 v. Chr.), einem der „Sieben Weisen“ Griechen-
lands, der sich mit P YTHAGORAS den Ruhm des Begründers der frühgriechischen Mathematik
teilt.
24
C LAUS , H. J.: Einführung in die Didaktik der Mathematik, 2. Auflage. Darmstadt 1995.
25
Ergänzt durch den Verfasser.
1.2 Variation der Problemstellung 35
Auch dies ist wieder ein sehr allgemeiner Hinweis, der in konkreten Situationen
nur bedingt hilfreich ist; meist bedarf es eben der Beachtung weiterer heuristischer
Prinzipien, um geeignete Analogiebildungen finden zu können. So könnte man et-
wa das Vorgehen, bei Aufgabenstellungen der diskreten Mathematik Beziehungen
zwischen den beteiligten Objekten festzustellen und das Problem auf Systeme mi-
nimaler Zahl von Objekten herunterzutransformieren, für die diese Beziehungen
noch sinnvoll aufrechterhalten werden können, als Analogiebildung unter Beach-
tung des Extremalprinzips deuten. Der inhaltliche Schwerpunkt von Analogiebil-
dungen unter Beachtung diverser heuristischer Strategien liegt bei den verwendeten
Heurismen selbst, die an anderer Stelle in dieser Arbeit diskutiert werden.
Sicherheitshalber sei noch einmal explizit festgestellt, dass die hier verwendete
Deutung des Begriffs der Analogisierung weniger restriktiv gefasst ist als in Tei-
len insbesondere der englischsprachigen Literatur: Bisweilen ist die Terminologie
„analogous problem“ im Sinne dessen zu verstehen, was in der hier vorgestellten
Systematik als ein „äquivalentes Problem“ zu verstehen wäre, erzielt durch Umfor-
mulierung in einem fest gewählten Repräsentationssystem oder durch Darstellung
des Problems in einem anderen Gegenstandsbereich (Variation der Darstellung).
Zur Erläuterung soll ein Beispiel dienen, welches in P OUNDSTONEs „Labyrinths of
Reason“ zu finden ist.26
26
Freie und sinnklärende Übersetzung durch den Verfasser: Im Original ist die Rede von „eit-
her . . . or“, allerdings ist damit im mathematischen Englisch häufig auch ohne den Zusatz „(or
both)“ das nicht ausschließende „oder“ gemeint, was hier angebracht wäre, da offenbar beide Be-
dingungen simultan erfüllbar sind.
36 1 Heurismen der Variation
Drei Personen sind einander völlig fremd, wenn zwischen je zwei der zugehöri-
gen drei Ecken eine Kante gestrichelt eingezeichnet ist; drei Personen kennen sich
paarweise untereinander, wenn zwischen je zwei der drei zugehörigen Ecken eine
Kante ungestrichelt eingezeichnet ist. In der Sprache der Graphentheorie ließe sich
das ursprüngliche Problem daher folgendermaßen formulieren:
Man finde eine Begründung dafür, dass in jeder Partition des vollständigen Gra-
phen auf sechs Ecken in genau zwei Subgraphen mindestens einer der beiden
Teilgraphen seinerseits den vollständigen Graphen auf drei Ecken (K3 ) als Sub-
graphen enthält.
Die Lösung dieses graphentheoretischen Problems ließe sich Zug um Zug in ei-
ne Lösung des ursprünglichen Problems zurückübersetzen – beide Probleme sind
äquivalent.
Eine Analogisierung käme ins Spiel, wenn man ein ähnliches, aber einfache-
res graphentheoretisches Problem formulierte, um aus dessen Lösung Ideen für
die Lösung des zum ursprünglichen Problem äquivalenten graphentheoretischen
Problems zu entwickeln. Naheliegende Analogiebildungen (mit Absicht vorsich-
tigerweise fragend formuliert!) wären:
(1) Ist es richtig, dass in jeder Partition des vollständigen Graphen auf vier Ecken
in genau zwei Subgraphen mindestens einer der beiden Teilgraphen seinerseits
den vollständigen Graphen auf zwei Ecken als Subgraphen enthält?
(2) Ist es richtig, dass in jeder Partition des vollständigen Graphen auf vier Ecken
in genau zwei Subgraphen mindestens einer der beiden Teilgraphen seinerseits
den vollständigen Graphen auf drei Ecken als Subgraphen enthält?
Anders ist die Situation bei der Analogiebildung (2): Partitioniert man den voll-
ständigen Graphen auf vier Ecken derart, dass keiner von zwei komplementären
Subgraphen G1 ; G2 eine Ecke der Ordnung 3 hat, so enthält weder G1 noch G2 den
vollständigen Graphen auf drei Ecken als Subgraphen (Abb. 1.18).
Obwohl die Frage (2) negativ beantwortet werden muss, gewinnt man aus der
Analogisierung (2) die entscheidende Idee für die Lösung des ursprünglichen gra-
phentheoretischen Problems:
Wenn man zeigen kann, dass in jeder Zerlegung des vollständigen Graphen auf
sechs Ecken in zwei Subgraphen G1 ; G2 mindestens einer dieser Subgraphen eine
Ecke der Ordnung n 3 enthält, dann ergibt sich wörtlich wie oben, dass G1 oder
G2 (oder beide) den vollständigen Graphen auf drei Ecken als Teilgraphen enthalten
müssen. Nun hat aber jede Ecke E im vollständigen Graphen auf sechs Ecken die
Ordnung 5 D 0 C 5 D 1 C 4 D 2 C 3; in jeder Partition G1 ; G2 ist also E eine Ecke
mindestens der Ordnung 3 von G1 oder G2 . Damit ist das Problem gelöst.
1 C 2 C 3 C C 49 C 50 C 51 C 52 C C 98 C 99 C 100
D .1 C 100/ C .2 C 99/ C .3 C 98/ C C .49 C 52/ C .50 C 51/
D 101 50 D 5050 :
Aus der Perspektive der Wahrnehmungspsychologie lässt sich diese spezielle Vorge-
hensweise der Reorganisation der Problemdaten als Ausprägung einer allgemeinen
heuristischen Strategie auffassen, die folgendermaßen strukturiert ist:
27
Einer der engsten Freunde des älteren Gauß, S ARTORIUS VON WALTERSHAUSEN, überlieferte
diese Anekdote in der Gedenkschrift „Gauß zum Gedächtnis“, Leipzig 1856.
1.2 Variation der Problemstellung 39
28
Diese Sicht der Dinge ist auch unter dem Namen „E HRENFELSkriterium der Übersummativität“
bekannt.
29
Als Perzept bezeichnet man das erfahrene Ergebnis des gesamten Wahrnehmungsprozesses, al-
so weder den physikalischen Gegenstand noch sein Abbild in einem Rezeptorensystem, sondern
die Auswertung der sensorischen Informationen und ihre Einordnung in das bereits vorhandene
Wissen.
40 1 Heurismen der Variation
Interpretierte man aber die grau eingefärbte Fläche als Hintergrund der Abbil-
dung, so wäre das Perzept eine auf dem Kopf stehende Treppe mit weißer Seiten-
wand. Zur Hervorhebung dieser unterschiedlichen Interpretationen wird in Abb.
1.21 der jeweilige Hintergrund von den Konturen des Objekts gelöst und eine text-
liche visuelle Hilfe hinzugefügt.
30
Für beide Auffassungen gibt es experimentelle Bestätigungen, wahrscheinlich muss beides be-
rücksichtigt werden.
1.2 Variation der Problemstellung 41
Die Grenzen zwischen Figur und Grund werden dabei als Konturen interpretiert,
die zur jeweiligen Figur gehören und ihren Umriss markieren.
Dem Gesetz der Figur-Grund-Gliederung sind von den Gestalttheoretikern
weitere Gestaltgesetze untergeordnet worden, in denen Bedingungen beschrieben
werden, die die Zuordnung gewisser Teile des Sehfeldes zu Figur oder Grund
favorisieren. Wenn etwa im Sehfeld extrem symmetrische und weniger symmetri-
sche oder asymmetrische Objekte erscheinen, besteht die Tendenz, die Ebenen der
Figur-Grund-Organisation in Abhängigkeit vom Ausprägungsgrad der Symmetrie
der Objekte anzuordnen und das symmetrischste Bildelement als Figur, die asym-
metrischsten Bildelemente als Grund sowie die weniger symmetrischen Objekte
als nachgeordnete Figuren wahrzunehmen („Symmetriegesetz“).
Dieser Effekt tritt sogar dann auf, wenn es die wahrgenommene Figur eigent-
lich gar nicht gibt. In Abb. 1.22 sieht man ein weißes Dreieck, welches Teile eines
schwarzen Dreiecks und dreier schwarzer Kreise verdeckt, obwohl die Bildvorlage
tatsächlich nur drei Winkel und drei Kreissektoren enthält.
Abb. 1.22 Illusionäre
Konturen: Gesetz der Ge-
schlossenheit
Das gesamte weiße Feld wird von unserem Wahrnehmungssystem in zwei Ebe-
nen geteilt: in der obersten Ebene das weiße Dreieck als Figur, in der untersten
Ebene der weiße Grund. Wo diese Teilung erfolgt, fügt das Wahrnehmungssystem
die Grenzen hinzu, und man nimmt eine illusionäre Kontur wahr. Der Organisati-
onsprozess, der dazu führt, unvollständige Figuren als vollständig wahrzunehmen,
wird als Gesetz der Geschlossenheit bezeichnet.
Die Gesetze der Gruppierung legen Kriterien fest, nach denen einzelne Teile ei-
ner Darstellung als zusammengehörig wahrgenommen werden. Von W ERTHEIMER
selbst wurden unter anderem das Gesetz der Nähe, das Gesetz der Ähnlichkeit, das
Gesetz der guten Kurve und das Gesetz des gemeinsamen Schicksals formuliert.
Das Gesetz der Ähnlichkeit besagt, dass einander ähnliche Objekte unter sonst
gleichen Bedingungen als zusammengehörig wahrgenommen werden. Dabei kann
sich „Ähnlichkeit“ auf unterschiedliche Aspekte wie Kontur, Textur, Farbton, Hel-
ligkeit, Größe oder Vergleichbares beziehen.
Das Gesetz der Nähe stellt fest, dass unter sonst gleichen Bedingungen dicht bei-
einander positionierte Objekte im Wahrnehmungsprozess zusammengruppiert wer-
den. Beides kann vor dem Hintergrund des Prägnanzgesetzes verstanden werden:
Die Bilder werden so wahrgenommen, dass die Gestalten vom visuellen System
schneller und einfacher kodiert werden können.
42 1 Heurismen der Variation
Bei der Betrachtung von Abb. 1.23 nimmt man wahrscheinlich links eine verti-
kale Anordnung von Kreisen und Quadraten wahr, die jeweils spaltenweise zusam-
mengruppiert werden – hier dominiert das Gesetz der Ähnlichkeit. Rechts sollte
ein horizontales Muster von Kreisen und Quadraten, die zeilenweise zusammen-
gruppiert werden, sichtbar sein – hier dominiert das Gesetz der Nähe.
Die Wahl der Objektabstände in Abb. 1.24 links lässt erwarten, dass die Prädo-
minanz einzelner Gruppierungsgesetze ungeklärt bleibt und sich das Perzept eines
horizontalen oder auch eines vertikalen Musters ergibt. Durch die Verringerung der
Ähnlichkeiten zwischen Kreisen und Quadraten über die Erhöhung des farblichen
Kontrastes lässt sich jedoch die Wahrscheinlichkeit dafür erhöhen, dass das Gesetz
der Ähnlichkeit an Bedeutung gewinnt und eher ein vertikales Muster wahrgenom-
men wird (Abb. 1.24, rechts).
Besteht die Ähnlichkeit von Objekten darin, dass sie sich mit derselben Ge-
schwindigkeit in die gleiche Richtung bewegen, so ist die Tendenz des Wahrneh-
mungssystems, dem Gesetz der Ähnlichkeit Vorrang vor anderen Gestaltgesetzen
einzuräumen und diese Objekte als zusammengehörig zu gruppieren, sehr stark.
Diese Übertragung des Gesetzes der Ähnlichkeit in die Kategorie bewegter Objek-
te wurde von W ERTHEIMER als Gesetz des gemeinsamen Schicksals bezeichnet.
Auch ohne die reale Existenz einer Bewegung tritt der Effekt in abgeschwächter
Form auf; visuelle Hinweise auf potenzielle Bewegungen oder angedeutete gleiche
Orientierungen genügen.
1.2 Variation der Problemstellung 43
In Abb. 1.25 wären nach dem Gesetz der Nähe oder dem Gesetz des gemein-
samen Schicksals Gruppierungen der einzelnen Punkte zu verschiedenen Kurven
denkbar. Wahrscheinlich gruppiert man die Punkte aber zu Verbindungskurven von
A und C bzw. von B und D.
Die Tendenz unseres Wahrnehmungssystems, vorrangig Perzepte glatter Kurven
zu entwickeln, wurde von den Gestalttheoretikern als Gesetz der guten Kurve be-
zeichnet. Auch dieses Gesetz ließe sich auf der Grundlage des Prägnanzgesetzes
verstehen, dem, wie wir gesehen haben, in der Systematik der Gestaltgesetze eine
ähnliche übergeordnete Bedeutung zukommt wie dem Gesetz der Figur-Grund-
Gliederung.
Nun zurück zur Gauß-Aufgabe:
Welche Informationen über unsere wahrscheinliche Wahrnehmung der Aufgabe
1 C 2 C 3 C C 49 C 50 C 51 C 52 C C 98 C 99 C 100
lassen sich aus den Gestaltgesetzen gewinnen?
Das Gesetz der Nähe sorgt dafür, dass einander benachbarte Zahlen (wie z. B.
1 und 2) in dieser Darstellung eher zusammengruppiert werden als weit auseinan-
derliegende Zahlen (wie z. B. 1 und 100). Die konventionelle Leserichtung (von
links nach rechts) legt angesichts der Länge der Zeichenkette die Operatordeutung
der Addition nahe (zuerst 1, dann C2, dann C3, . . . ), was durch die Abschnitte
„C C“ noch verstärkt wird. Die damit hervorgehobene links-rechts-Orientierung
führt über das Gesetz des gemeinsamen Schicksals zum Perzept einer von links nach
rechts orientierten Kette von Additionsoperatoren.
Zur Variation der Problemwahrnehmung müssen Umstrukturierungen vorge-
nommen werden, die dieses Perzept unwahrscheinlich machen; durchzuführen
sind also Reorganisationen der Problemdaten, welche die Rechenrichtung ändern.
Folgende Umstrukturierungen sind naheliegend:
1 C 2 C 3 C C 49 C 50 C 51 C 52 C C 98 C 99 C 100 ;
also Berechnung von
100 C 99 C 98 C C 52 C 51 C 50 C 49 C C 3 C 2 C 1 :
44 1 Heurismen der Variation
1 C 2 C 3 C C 49 C 50 C 51 C 52 C C 98 C 99 C 100 ;
! ! !
1 C 2 C 3 C C 49 C 50 C 51 C 52 C C 98 C 99 C 100 ;
! ! !
Die erste Umstrukturierung liefert keine neuen Erkenntnisse, aber die zweite und
die dritte legen den Lösungsweg frei, den der neunjährige G AUSS gegangen sein
soll – mit Sicherheit ohne jegliches Wissen um gestalttheoretische Zusammenhän-
ge, ebenso sicher aber mit einer überragenden mathematischen Begabung, die ihn
die Symmetrien der Problemstellung hat erkennen lassen.
Heuristisches Handeln unter dem Gesichtspunkt des Symmetrieprinzips werden
wir in Abschn. 1.2.3 im Zusammenhang mit dem Invarianzprinzip thematisieren;
zuvor aber soll die heuristische Strategie der Variation der Problemwahrnehmung
noch an einem Klassiker unter den geometrischen Problemen demonstriert werden,
dem berühmten Neun-Punkte-Problem von W ERTHEIMER.
Man wird deshalb wahrscheinlich versucht sein, einen Streckenzug mit vier Stre-
cken zu finden, der alle Punkte verbindet, aber die quadratische Kontur der Figur
nicht verlässt – ein solcher Streckenzug existiert allerdings nicht.
„If there is repetition, look for what does not change!“ – mit diesen Worten um-
schrieb einst A RTHUR E NGEL31 die unter dem Namen „Invarianzprinzip“ bekannte
heuristische Strategie, welche darin besteht, Invarianten gewisser Transformationen
oder Algorithmen zu studieren und daraus Informationen für die Lösbarkeit von
Problemen zu gewinnen; dabei sind grundsätzlich zwei Ausprägungen denkbar.
Einerseits kann es sein, dass die betreffenden Algorithmen oder Transformatio-
nen bereits im Problemkontext vorgegeben sind, wie beispielsweise in folgender
Situation:
Gegeben sind eine Menge Z von Zuständen und ein Algorithmus, der Z in sich
überführt. Das Problem besteht darin zu entscheiden, ob ein gewisser Anfangszu-
stand Za durch den Algorithmus in endlich vielen Schritten in den Endzustand
Ze überführt werden kann. Findet man nun eine unter dem Algorithmus invari-
ante Funktion f auf Z mit f .Za / ¤ f .Ze /, so muss die Frage offenbar verneint
werden – das Problem ist gelöst (vgl. Beispiel 1.18).
31
E NGEL , A.: Problem-solving strategies. Springer, New York (1998).
46 1 Heurismen der Variation
Die Invariante, mit deren Hilfe man Formel (MF) herleiten kann, ist die unver-
änderte Gesamtzahl m der Mengeneinheiten des Rohstoffs R in S1 ; : : : ; Sn vor der
Mischung (m D m1 p1 C m2 p2 C C mn pn ) oder nach der Mischung (m D
p .m1 C C mn / ) von jeweils mi Einheiten des Stoffs Si ; aus der Gleichung
m1 p1 C m2 p2 C C mn pn D p .m1 C C mn /
Ebenso findet man mit der Mischungsformel heraus, dass man durch Umfüllen von
2;5 ` des Getränks mit einem Sektanteil von 13 in die Schüssel mit reinem Orangen-
saft dort eine Mischung mit einem Sektanteil von 16 erhält:
1 m1 13 C 5
0 1 5 5
D 2
) m1 D ) m1 D :
6 m1 C 5
2
6 12 2
Man muss also nur 2;5 ` Saft in die Mischung und dann 2;5 ` der neuen Mischung in
den Saft schütten, um jeweils 5 ` Sekt-Orangensaft-Mischgetränk mit einem Sekt-
anteil von 16 bzw. einem Sektanteil von 13 herzustellen.
Man hätte das Invarianzprinzip aber auch ohne direkte Verwendung der Mi-
schungsformel zur Lösung dieses Problems benutzen können:
Solange sich in beiden Gefäßen gleich viel Flüssigkeit befindet und der Sekt-
anteil in der einen Schüssel ˛ 12 mit 0 ˛ 1 ist, muss der Sektanteil in der
anderen Schüssel .1 ˛/ 12 sein – Sekt verschwindet nicht beim Umfüllen, die
Gesamtmenge an Sekt ist eine Invariante der Umverteilungstransformation.
Es genügt demnach, durch Auffüllen mit 2;5 ` Orangensaft den Sektanteil der
Mischung von 12 auf 13 D 23 12 zu verringern (˛ D 23 ) und dann durch Umfüllen von
2;5 ` der Mischung in das Gefäß mit dem Orangensaft dafür zu sorgen, dass beide
Bowlenschalen gleich viel Flüssigkeit enthalten – die Light-Version hat dann den
gewünschten Sekt-Anteil von 16 D .1 23 / 12 , und die Party ist gerettet.
Der gleiche Gedankengang führt auf eine elegante Lösung des folgenden, in der
einen oder anderen Variante häufig zitierten Wein-Mischproblems.
Danach wird ein Löffel der Mischung in den Weißwein zurückgegeben, so dass nun
beide Gläser wieder gleich voll sind. Befindet sich jetzt mehr Weißwein im Rotwein
als Rotwein im Weißwein?
Da am Ende des Austauschvorgangs in beiden Gläsern gleich viel Flüssigkeit ist,
müssen die ausgetauschten Mengen unabhängig von den durchgeführten Manipu-
lationen gleich sein; folglich sind auch die Anteile von Rotwein im Weißwein und
von Weißwein im Rotwein identisch.
Die Verwendung der Mischungsformel wäre unnötig kompliziert, würde aber
durch eine abgewandelte Formulierung des Problems, welche als Distraktoren zu-
sätzlich Quantifizierungen der Flüssigkeitsmengen vornimmt, die vorhanden sind
bzw. ausgetauscht werden, nahegelegt.
32
Nach P ETER /W INKLMAIER in Mathematik Lehren, Bd. 115 (2002).
33
Deshalb spielt es keine Rolle, ob man die Temperaturen auf der Kelvin-Skala oder der Celsius-
Skala angibt.
34
Das Energiequantum, welches man 1 g einer bestimmten Substanz zuführen muss, um ihre Tem-
peratur um 1 K zu erhöhen.
35
Man beachte die vorsichtige Formulierung „. . . stehen ungefähr zur Verfügung, . . . “ in der Pro-
blemformulierung!
1.2 Variation der Problemstellung 49
so gilt
c1 m1 T1 C c2 m2 T2
c1 m1 .T1 Tm / D c2 m2 .Tm T2 / bzw. Tm D :
c1 m1 C c2 m2
Sind n Körper am Wärmeaustausch beteiligt, so lässt sich die Formel zur Bestim-
mung der Mischtemperatur auf
Pn
ci mi Ti
Tm D Pi D1
n
i D1 ci mi
Ungefähr stehen also m1 C m2 D 180 ` C 225 ` D 405 ` Liter Wasser der Tempe-
ratur 35ı C zur Verfügung.
sowie
wobei H das harmonische Mittel und A das arithmetische Mittel bezeichne. Man
prüfe, ob .Pn /n2N konvergiert und bestimme gegebenenfalls den Grenzwert.
Offenbar ist .Pn /n2N eine Punktfolge im 1. Quadranten des Koordinatensystems,
denn sämtliche Glieder der Koordinatenfolgen .xn /n2N und .yn /n2N sind positiv.
Nach Voraussetzung ist x1 < y1 , und aus xn < yn folgt (vgl. Beispiel 1.5)
36
Idee der Aufgabe nach E NGEL , A.: Problem-solving strategies. Springer, New York (1998).
50 1 Heurismen der Variation
woraus sich
2xn yn
xn < D H.xn ; yn / D xnC1
xn C yn
ergibt; die Folge .xn /n2N ist damit streng monoton wachsend.
Insgesamt ist damit bisher klar, dass es sich bei der Folge .In /n2N D .Œxn; yn /n2N
um eine Folge abgeschlossener Intervalle mit I1
I2
In
InC1
: : :
handelt. Der quantitative Vergleich zwischen arithmetischem und harmonischem
Mittel ergibt, dass limn!1 .yn xn / D 0 gilt, denn
xn C yn 2xn yn
ynC1 xnC1 D A.xn ; yn / H.xn ; yn / D
2 xn C yn
.xn C yn /2 4xn yn .yn xn /2
D D
2.xn C yn / 2.yn C xn /
yn xn yn xn
D
2 y C xn
„ n ƒ‚ …
<1
1
< .yn xn / ;
2
also ist n
1 ba n!1
ynC1 xnC1 < .y1 x1 / D ! 0:
2 2n
Offenbar ist also .In /n2N sogar eine Intervallschachtelung, gegen deren Kern ˛ die
Folgen .xn /n2N und .yn /n2N jeweils konvergieren. Damit ist limn!1 Pn D .˛; ˛/ .
Die Frage, welches denn nun der Kern ˛ der Intervallschachtelung .In /n2N ist,
wird vermöge einer weiteren Invariante der Rekursionsvorschrift beantwortet:
Für alle n 2 N ist
2xn yn xn C yn
xnC1 ynC1 D D xn yn ;
xn C yn 2
1.2 Variation der Problemstellung 51
demnach handelt es sich bei der Produktfolge .xn yn /n2N um die konstante Folge
.xn yn /n2N D .ab/n2N . Wegen
p
folgt sofort ˛ D ab D G.a; b/ – der Kern der Intervallschachtelung .In /n2N ist
das geometrische Mittel von a und b.
Ein weiterer Typ von Invarianten, die in Beipielen zur Ausprägung (Inv 1) des
Invarianzprinzips vorgestellt werden sollen, sind Paritäten oder allgemeiner Rest-
klassen mod n. Wir beginnen mit dem Partygast-Problem.
Man begründe, dass in jedem Graph auf n Ecken ohne Schlingen und isolierte
Kanten37 die Anzahl der Ecken ungerader Ordnung gerade ist.
37
Kanten der Ordnung 0 werden als isolierte Kanten, Kanten der Ordnung 1 als Schlingen (loops)
bezeichnet.
52 1 Heurismen der Variation
Für jede Ecke E des Graphen bezeichne .E/ die Ordnung der Ecke, also die
P E inzidiert. Ist dann E die Menge aller Ecken des
Zahl der Kanten, mit denen
Graphen, so gilt jI j D E2 E .E/.
In einem Graphen ohne Schlingen und isolierte Kanten hat jede Kante K die
Ordnung 2, inzidiert also mit genau zwei Ecken. Bezeichnet dann K die Menge
aller Kanten des Graphen, so gilt jI j D 2jK j.
gewinnt man unmittelbar die Information, dass in der Summe links die Zahl der
ungeraden Summanden gerade sein muss.
Eine Parität als Invariante kommt dann ins Spiel, wenn man sich einen beliebi-
gen, fest vorgegebenen Graphen G auf n Ecken ohne Schlingen und isolierte Kanten
schrittweise aus dem trivialen Graphen auf n Ecken, der ausschließlich isolierte
Ecken enthält, aufgebaut denkt: In jedem Schritt wird eine neue, in G auftretende
Verbindungskante zweier Ecken hinzugefügt, bis man den trivialen Graphen auf n
Ecken zu G vervollständigt hat. Bei jedem Hinzufügen einer Verbindungskante sind
die in Abb. 1.27 veranschaulichten drei Fälle möglich.
1. Fall: u u
Werden zwei Ecken ungerader Ordnung miteinander verbunden, dann wird die bis-
herige Anzahl der Ecken ungerader Ordnung um 2 reduziert.
2. Fall: g g
Werden zwei Ecken gerader Ordnung miteinander verbunden, dann wird die bishe-
rige Anzahl der Ecken ungerader Ordnung um 2 erhöht.
3. Fall: u g
Wird eine Ecke ungerader Ordnung mit einer Ecke gerader Ordnung verbunden,
dann wird die bisherige Anzahl der Ecken ungerader Ordnung nicht verändert.
Die Anzahl der Ecken ungerader Ordnung ändert sich im gesamten Vervollständi-
gungsprozess also nur um ganzzahlige Vielfache von 2 – die Parität bleibt dabei
unverändert. Da im trivialen Graphen auf n Ecken die Anzahl der Ecken ungera-
1.2 Variation der Problemstellung 53
der Ordnung aber 0 und damit gerade ist, gilt dies auch für die Anzahl der Ecken
ungerader Ordnung in G.
Das folgende Beispiel mit beliebigen Restklassen als Invarianten realisiert die
zu Beginn des Abschnitts exemplarisch genannte Situation für die Verwendung von
(Inv 1).
Aber f ist eine Invariante jeder durch die Regeln erlaubten Umverteilung. Geht
nämlich Z 0 aus Z dadurch hervor, dass aus beiden Nachbarschüsseln der Schüssel
j jeweils eine Münze entnommen und in Schüssel j gelegt wird, so unterscheiden
sich f .Z 0 / und f .Z/ in den Summanden mit den Nummern .j 1/; j und .j C 1/,
alle anderen Summanden bleiben unverändert; genauer gilt
Deshalb ist der Wechsel von f .Za / D Œn2n zu f .Ze / D Œ02n unter Beachtung der
Regeln offenbar nicht möglich.
54 1 Heurismen der Variation
und diese Gleichung ist wegen der Regularität der Matrix .A E/ eindeutig lösbar.
Die eindeutig bestimmte Lösung !
x D . r3
3 / gibt den einzigen Fixpunkt F von ' an.
Wegen
! ! !! !
'
3 !
C x D'
3 !
CAx D
3
C A!x
B B
3 3 3
liefert jeder Eigenvektor von A eine Fixrichtung von 'B , und jede Gerade durch F
in Richtung eines Eigenvektors von A ist eine Fixgerade von '.
1.2 Variation der Problemstellung 55
ergibt. An dieser Beziehung lässt sich die Parallelentreue von ' ablesen; allgemein
ist die Parallelität von Geraden eine Invariante affiner Abbildungen. Die Kon-
struktion von Bildpunkten nicht auf den Fixgeraden gelegener Punkte (wie die
Konstruktion des Bildpunktes C 0 von C unter der Abbildung ') erfolgt damit wie
in Abb. 1.28 angedeutet.
An der Schnittstelle des Übergangs von (Inv 1) zu (Inv 2) liegt die Theorie der
biholomorphen Abbildungen zwischen Gebieten G1 ; G2 C in der Kompaktifi-
zierung C D C [ fz1 g der komplexen Ebene C.
Es würde an dieser Stelle zu weit führen, den benötigten Begriffsapparat der
klassischen Funktionentheorie aufzubauen, um das produktive Zusammenspiel bei-
der Ausprägungen des Invarianzprinzips im Kontext des „conformal mapping“ zu
erläutern. Dennoch möchte ich eine Übersicht der Invarianten angeben, die auf dem
Weg zum Hauptresultat der Theorie der biholomorphen Abbildungen im Rahmen
einer Vorlesung zur Funktionentheorie einer Veränderlichen – dem Riemannschen
38
Darunter versteht man die Verkettung einer Parallelstreckung an einer Achse a in Richtung einer
Geraden b mit einer Parallelstreckung an der Achse b in Richtung der Geraden a bei beliebigen
Streckfaktoren, wobei a und b nicht parallel sind.
56 1 Heurismen der Variation
fW R ! R ( 1
x 2 cos für x ¤ 0
x 7! f .x/ WD x2
0 für x D 0
überzeugen kann.39
Jede auf einer offenen Menge U C komplex differenzierbare40 Funktion ist
aber automatisch beliebig oft komplex differenzierbar auf U . Mit anderen Worten:
39
Diese Funktion ist auf R differenzierbar, aber f 0 ist an der Stelle x D 0 nicht stetig.
40
Die Funktion f W U ! C heißt in z0 2 U komplex differenzierbar, wenn es eine in z0 stetige
Funktion W U ! C mit f .z/ D f .z0 / C .z z0 /.z/ für alle z 2 U gibt – man beachte die
formale Analogie zur Differenzierbarkeit von Funktionen f W I ! R, I R!
41
Für einen Bereich U C nennt man f W U ! C holomorph in U , wenn f in jedem Punkt
z0 2 U eine Potenzreihenentwicklung mit positivem Konvergenzradius besitzt.
1.2 Variation der Problemstellung 57
Offenheit ist eine topologische Invariante unter der Abbildung mit nicht-
konstanten holomorphen Funktionen.
Gebietstreue ist eine topologische Invariante unter der Abbildung mit nicht-
konstanten holomorphen Funktionen.
Dann nennt man f eine lokal konforme Abbildung; sind G1 ; G2 Gebiete in C und
f W G1 ! G2 eine bijektive, lokal konforme Abbildung, dann nennt man f kon-
form.
Die durch differenzialgeometrische Invarianten charakterisierten konformen
Abbildungen zwischen Gebieten in C lassen sich analytisch beschreiben, denn es
gilt:
f W G1 ! G2 ist genau dann konform, wenn f biholomorph ist.
Umgekehrt sind damit weitere Invarianten (geometrischer Natur) biholomorpher
Abbildungen zwischen Gebieten in C gefunden, die für die explizite Konstruktion
einer biholomorphen Abbildung f W G1 ! G2 genutzt werden können, wenn ge-
sichert ist, dass eine solche existiert; in diesem Fall nennt man die Gebiete G1 und
G2 biholomorph äquivalent. Zusammengefasst:
5. Holomorphie nahe z1 wird nun über lokale Karten von C so erklärt, dass sich
alle Sätze, die das Verhalten einer holomorphen Funktion in der Nähe eines Punk-
tes z0 2 C betreffen, auf Abbildungen übertragen lassen, die nahe z1 holomorph
sind (! Invarianzprinzip zur Begriffserweiterung). Insbesondere haben bijektive
holomorphe Abbildungen f W G1 ! G2 zwischen Gebieten G1 ; G2 in C wieder
58 1 Heurismen der Variation
6. Jedes von der identischen Abbildung verschiedene Element T von Aut C hat
höchstens zwei Fixpunkte, denn der Ansatz T .z/ D z führt auf eine lineare oder
eine quadratische Gleichung.
Daraus folgt aber, dass jedes T 2 Aut C durch drei Punkte z1 ; z2 ; z3 2 C und
deren Bilder eindeutig festgelegt ist. Ist nun
z z1 z2 z1
T1 W z 7! DV.z; z1 ; z2 ; z3 / WD W
z z3 z2 z3
42
Jede Gerade enthalte dabei den Punkt z1 .
1.2 Variation der Problemstellung 59
43
Benannt nach J OSEPH L IOUVILLE (1809–1882).
60 1 Heurismen der Variation
Der zu begründende Sachverhalt über die geometrische Figur des Dreiecks um-
fasst begrifflich Punkte, Geraden, Strecken, Inzidenz und Teilverhältnis.
Im Sinne von (Inv 2) muss man nun nach Transformationen suchen, die Punkte
auf Punkte, Geraden auf Geraden, Strecken auf Strecken, Dreiecke auf Dreiecke
abbilden und Inzidenz und Teilverhältnis als Invarianten haben, in der Hoffnung,
durch Anwendung einer solchen Transformation die Problemstellung derart zu va-
riieren, dass man Hinweise auf eine Lösung des Problems finden kann.
Die allgemeinsten Transformationen der gesuchten Art sind affine Abbildungen
der euklidischen Ebene; je zwei Dreiecke lassen sich affin aufeinander abbilden,
genauer: durch höchstens drei aufeinanderfolgende Parallelstreckungen ineinander
überführen45 .
Folglich genügt es, den Satz über den Schwerpunkt im Dreieck für ein einziges
Dreieck zu beweisen, dann gilt er für alle! Man wähle sich dazu ein spezielles Drei-
eck mit besonders angenehmen Eigenschaften, nämlich ein gleichseitiges Dreieck;
diese Auswahl ist im Hinblick auf das sog. Extremalprinzip (Abschn. 1.2.4) nahe-
liegend.
Den Symmetrieeigenschaften des gleichseitigen Dreiecks kann man nun die
postulierten Zusammenhänge unmittelbar entnehmen (Abb. 1.29). So fallen etwa
die Seitenhalbierenden mit den Winkelhalbierenden w˛ ; wˇ ; w zusammen; der
Schnittpunkt S von w˛ und wˇ hat von AC den gleichen Abstand wie von AB
44
Inzidenzautomorphismen affiner Ebenen heißen Dilatationen, wenn Gerade und Bildgerade
stets parallel sind.
45
Dieser Sachverhalt kann als Pendant des Dreispiegelungssatzes in der Kategorie der affinen
Abbildungen verstanden werden, denn jede affine Abbildung ist durch ein Dreieck und dessen
Bilddreieck eindeutig bestimmt.
1.2 Variation der Problemstellung 61
und von AB den gleichen Abstand wie von BC , also auch von AC den gleichen
Abstand wie von BC , so dass S auch auf w liegt.
Abb. 1.29
Seitenhalbierenden-Satz im
gleichseitigen Dreieck
P; Q 2 AB I R 2 BC I S 2 AC :
Die allgemeinsten Affinitäten, die stets Quadrate auf Quadrate abbilden, sind
Ähnlichkeitsabbildungen, denn diese sind sowohl winkeltreu als auch streckenver-
hältnistreu. Es genügt also, als Zwischenziel ein Quadrat herzustellen, welches sich
mit einer Ähnlichkeitsabbildung auf das gesuchte Quadrat PQRS abbilden lässt.
Das hier beschriebene Denkmuster ist typisch für geometrische Konstruktions-
aufgaben und wird uns bei der Behandlung der Heurismen der Reduktion (! Rück-
wärtsarbeiten, Pappos-Prinzip) noch näher beschäftigen.
62 1 Heurismen der Variation
Ist aber R der Schnittpunkt der Halbgeraden AR0C mit BC und Z D Z.AI k/
diejenige zentrische Streckung mit Streckzentrum A und Streckfaktor k, die R0 auf
R abbildet, so liegen die Bildpunkte P D Z.P 0 /; Q D Z.Q0 / auf AB und der
Bildpunkt S D Z.S 0 / auf AC , weil alle Geraden durch das Streckzentrum A Fix-
geraden der zentrischen Streckung Z.AI k/ sind.
Das Bild des Quadrats P 0 Q0 R0 S 0 unter der zentrischen Streckung Z.AI k/ ist
dann ein Quadrat PQRS mit den verlangten Eigenschaften (Abb. 1.30, rechts).
46
Auf der 38. Jahrestagung der GDM in Augsburg (1. März bis 5. März 2004).
47
K. B REINLINGER : Ein Problempaket zur analytischen Geometrie. Der Mathematikunterricht
24, Heft 6 (1978). Friedrich-Verlag, Seelze.
1.2 Variation der Problemstellung 63
Der elementarmathematisch interessierte Leser sollte in der Lage sein, diese Be-
weispläne zu realisieren.
Ich selbst möchte jedoch an dieser Stelle – inspiriert von einem elementargeo-
metrischen Beweis, den mir H ARALD S CHEID skizziert hat – einen vektorfreien
abbildungsgeometrischen Beweis führen, der einen diskreten Hinweis auf einen na-
hen Verwandten des Invarianzprinzips, nämlich das Symmetrieprinzip, enthält.
Zu zeigen ist, dass für zwei beliebig gewählte Positionen H1 ; H2 des Hexen-
turms und die von dort aus gemäß der Vorschrift konstruierten Positionen P1 ; R1
bzw. P2 ; R2 der Pflöcke gilt: Der Mittelpunkt S1 der Strecke P1 R1 ist gleich dem
Mittelpunkt S2 der Strecke P2 R2 – dann bezeichnet S WD S1 D S2 die Position des
Schatzes.
Offenbar ist es aber nicht nötig, einen direkten Vergleich durchzuführen:
Man kann eine mögliche Position H des Hexenturms fest vorgeben und für die-
se Lage H die Positionen P; R der Pflöcke sowie den Mittelpunkt S der Strecke
PR ermitteln. Stellt sich jetzt heraus, dass S stets auch der Mittelpunkt der Stre-
cke P 0 R0 ist, wenn die Punkte P 0 ; R0 die Positionen der Pflöcke markieren, welche
gemäß der Vorschrift ausgehend von einer Position H 0 des Hexenturms konstru-
1.2 Variation der Problemstellung 65
iert wurden, dann ist insbesondere der Nachweis S1 D S2 für beliebige Wahl von
H1 ; H2 geführt, und zwar vermöge eines indirekten Vergleichs von S1 und S2 über
S:
S1 D S und S2 D S ) S1 D S2 :
Ein Kriterium für die Festlegung von H könnte es sein, H so zu wählen, dass die
Konstruktion der Punkte P; R; S möglichst einfach ist und dass man die Variation
der Konfiguration, die bei Übergang von H zu H 0 entsteht, möglichst gut verfolgen
kann. Diese Bedingungen sind zum Beispiel dann erfüllt, wenn man H als Mittel-
punkt der Strecke BE wählt, wie Abb. 1.31 zeigt.
Zunächst ergeben sich die Punkte P und R durch Ergänzung der Strecke BE
zu einem Rechteck BERP , dessen kürzere Seiten ER; BP die Längen jBP j D
jERj D 12 jBEj haben. Konstruiert man nun ausgehend von H 0 ¤ H vorschriftsge-
mäß die Punkte P 0 und R0 wie in Abb. 1.32, so lässt sich Folgendes erkennen:
Bezeichnet D1 die Drehung um E um 90ı im Gegenuhrzeigersinn und D2 die
gleich orientierte Vierteldrehung um B, so gilt einerseits
D1 .R/ D H ; D1 .R0 / D H 0 ; D1 .S/ D T
und andererseits
D2 .H / D P ; D2 .H 0 / D P 0 ; D2 .T / D S ;
woraus folgt:
D2 ı D1 .R/ D P ; D2 ı D1 .R0 / D P 0 ; D2 ı D1 .S/ D S :
Trifft dies zu, so kann man hoffen, durch Herausarbeiten der Symmetrien einer
Problemstellung Hinweise auf mögliche Lösungsansätze, die diese Symmetrien re-
flektieren, zu gewinnen. Dieses heuristische Prinzip ist unter dem Namen „Symme-
trieprinzip“ bekannt.
48
Unter vorhandenen Möglichkeiten sollte keine bevorzugt werden, wenn es keinen zureichenden
Grund für eine Unterscheidung gibt.
1.2 Variation der Problemstellung 67
Diese algebraische Beschreibung des Phänomens der Symmetrie erlaubt es, das
Konzept auf andere mathematische Objekte auszudehnen und ganz allgemein die
Symmetrie einer Struktur durch deren Invarianz unter gewissen Transformations-
gruppen zu erklären.
Dies legitimiert die Einordnung des Symmetrieprinzips unter den Verwandten
des Invarianzprinzips, weist aber gleichzeitig darauf hin, dass in Problemsituationen
generell zwischen offenkundigen und versteckten Symmetrien zu unterscheiden ist:
Ist die Transformationsgruppe, über die eine bestimmte Art von Symmetrie definiert
ist, eine der vertrauten Deckabbildungsgruppen der Geometrie, so handelt es sich
meist um eine offenkundige Symmetrie oder aber um eine versteckte Symmetrie,
die durch leichte Modifikationen der Problemstellung (Einzeichnen von Hilfsfigu-
ren etc.) herauszuarbeiten ist. Betrachten wir dazu ein Beispiel.
als genügend präzise, um aus dem Studium der vertauschbaren Teile Nutzen für die
Problemlösung zu ziehen.
Die Darstellung der 100er-Zahl k D .z1 z0 /100 in der Form k D z1 100 C z0 liefert
sodass eine Gleichung des Systems genau dann erfüllt ist, wenn die Summe der
Quadrate der Hunderterziffern der Zifferndarstellungen von n1 ; n2 ; n3 im 100er-
System gleich der Summe der Quadrate ihrer Einerziffern ist. Die ersten drei Glei-
chungen des Systems sind damit äquivalent zu
Wieder lassen sich in jeder dieser beiden Gleichungen derart Zahlenpaare .k1 ; `1 /;
.k2 ; `2 /; .k3 ; `3 / bilden, dass die Gleichung von der Form k12 Ck22 Ck32 D `21 C`22 C`23
ist und die Zifferndarstellungen von ki ; `i – diesmal im dekadischen System – durch
Vertauschung von Einerziffer und Zehnerziffer auseinander hervorgehen. Wie oben
ergibt sich, dass das System
zur Gleichung
42 C 52 C 62 D 22 C 32 C 82
äquivalent ist, und diese ist erfüllt – es handelt sich um zwei verschiedene Darstel-
lungen der Zahl n D 77 als Summe dreier Quadratzahlen.
Weitere Beispiele der gesuchten Art erhält man aus diesen Darstellungen der
Zahl 77, indem man andere Paarbildungen vornimmt und nach dem symmetrischen
Bauplan Gleichungen daraus zusammensetzt (! Symmetrieprinzip in der Funktion
der Erzeugung neuen Wissens), wie etwa
482 C 532 C 622 D 842 C 352 C 262 ; 482 C 522 C 632 D 842 C 252 C 362 ; : : :
und
Der Phantasie sind dabei nur durch die Anzahl injektiver 3-Tupel aus einer 3-Menge
Grenzen gesetzt.
Der Vorrat an solchen Beispielen ist (wenn man auch Darstellungen mit zwei
oder vier Summanden zulässt) unerschöpflich, denn nach dem Vier-Quadrate-Satz
von L AGRANGE lässt sich jede natürliche Zahl als Summe von höchstens vier Qua-
dratzahlen darstellen, und solche Darstellungen sind im Allgemeinen nicht eindeu-
tig, wenn es auch unendlich viele Ausnahmen gibt; zum Beispiel ist jede ungerade
Primzahl auf genau eine Art als Summe zweier Quadratzahlen darstellbar.
Unter Berücksichtigung der Reihenfolge der Summanden gibt es zur natürlichen
Zahl n D 2˛ u, u ungerade, ˛ 2 N0 genau
(
8 .u/ für ˛ D 0 ;
4 .n/ D
24 .u/ für ˛ > 0
viele Darstellungen als Summe von vier (nicht notwendig teilerfremden) Quadrat-
zahlen, wobei die Teilersummenfunktion bezeichnet.
1.2 Variation der Problemstellung 71
Versteckten Symmetrien einer Problemstellung kommt man oft durch die Reprä-
sentation des Problems in anderen Systemen (! Variation der Darstellung) auf die
Spur, vorzugsweise durch Darstellungen im Gegenstandsbereich der Geometrie.
X 1 1
1 1 1 1 1
D i
D C C C C:::
3 i D1
4 4 16 64 256
X
n
1 x nC1
xi D ;
i D0
1x
X
n X
n X
n1
1 xi x xi D 1 C .x i x i / x nC1
i D0 i D0 i D1
folgern kann. Für jedes x 2 R mit jxj < 1 gilt limn!1 x nC1 D 0; deshalb ist
1
X 1
xi D für alle x 2 R mit jxj < 1 ;
i D0
1x
1
X 4
xi D
i D0
3
bzw.
X 1
1 4 1
i
D 1D :
i D1
4 3 3
Eine „einsichtige“ Begründung dieser Formel, die mit einem intuitiven Grenz-
wertbegriff 50 auskommt, wird möglich, wenn man die Symmetrien der Reihe im
Kontext einer Situation des Verteilens von Größen herausarbeitet.
49
Hierbei handelt es sich um eine Form prämathematischen Beweisens, bei der konkrete Hand-
lungen durch ikonische Darstellungen vorgestellter Handlungen ersetzt werden.
50
Erschreckenderweise gibt es auch immer mehr Studierende mathematischer Fachrichtungen, die
nur über ein intuitives, bestenfalls inhaltliches, selten aber formales Verständnis des Grenzwertbe-
griffs verfügen.
72 1 Heurismen der Variation
nC1
Die Verallgemeinerung dieser Darstellung auf das Verteilen von nC1 eines Ku-
chens an n Personen liefert einen „Siehe-Beweis“ für
1
X 1 1
D :
i D1
.n C 1/i n
51
Dies ermöglicht die Beschreibung des Spiels in Form eines gerichteten Graphen, in dem jeder
Spielzug als eine gerichtete Kante zwischen den als Ecken interpretierten Zuständen eingezeichnet
wird, die der Spielzug ineinander überführt.
52
Der das Spiel beschreibende gerichtete Graph enthält dann keine geschlossen-unikursalen ge-
richteten Subgraphen (circuits).
1.2 Variation der Problemstellung 73
Das Spiel endet mit dem Sieg von Spieler S 2 fA; Bg, wenn S einen Zustand
erreicht, der dem anderen Spieler keinen durch die Spielregeln erlaubten Zug
mehr lässt.53 Eine solche Situation tritt zwangsläufig nach endlich vielen Zügen
ein.
Wenn im Verlauf eines solchen Spiels der Spieler S einen Zug ausführen kann, der
die Menge M aller verbleibenden Spielzustände derart in zweielementige Teilmen-
gen
n o [n
.i / .i /
Mi WD Z1 ; Z2 ; Mi \ Mj D ; ; M D Mi
i D1
zerlegt, dass für i D 1; : : : ; n jeder Zustand aus Mi mit einem legalen Zug in den
komplementären Zustand aus Mi überführt werden kann, dann gibt es offenbar eine
sichere Gewinnstrategie für S: Macht sein Gegner einen Zug, der einen Zustand aus
M
herbeiführt, so antworte S mit einem Zug, der den komplementären Zustand aus
M
erreicht. Auf diese Weise gewinnt S, weil seinem Gegner zuerst die erlaubten
Züge ausgehen.
Bei dieser „Paarbildungsstrategie“ gewinnt S, weil er nach dem Prinzip des
nichtzureichenden Grundes keinen der Züge wählt, die sich symmetrisch beantwor-
ten lassen. S strebt den einzigen ungepaarten Zustand an und stellt damit sicher,
dass sich die erzeugten Symmetrien in seinem Spielverhalten widerspiegeln kön-
nen.
53
Bei Spielen, in denen es darauf ankommt, als erster einen Zustand aus einer Klasse von „Ge-
winnzuständen“ zu erreichen, lege man einfach definitorisch fest, dass nach dem Eintritt eines
Gewinnzustandes kein legaler Zug mehr existiert.
74 1 Heurismen der Variation
WD kC1 2 aus dem Spiel; ist k gerade, so nimmt Spieler B die Münzen M und
MC1 mit WD k2 weg.
In beiden Fällen verbleibt eine Anordnung aus zwei Ketten mit gleich vielen
Münzen, bei der wegen der Nachbarschaftsbedingung nur aus jeweils einer Kette
Münzen entnommen werden dürfen. Jeden folgenden Zug von A kann B mit einem
isomorphen Zug in der jeweils anderen Kette beantworten, so dass in jedem Fall B
die letzte Münze bekommt.
Oben rechts ist zur Verdeutlichung eine von B gewonnene Partie des Brücken-
spiels illustriert.
Gibt es für einen der Spieler eine Gewinnstrategie?
Der kommerzielle Erfolg des Spiels „Bridg-it“ ist wohl damit zu erklären, dass
es einige Jahre gedauert hat, bis in der Kolumne von M ARTIN G ARDNER im Scien-
tific American die erste gefundene Gewinnstrategie veröffentlicht werden konnte.
Es handelt sich um die in Abb. 1.36 beschriebene Paarbildungsstrategie nach
O LIVER G ROSS: Spieler A eröffnet mit dem eingezeichneten Zug und beantwortet
jeden Spielzug von B, dessen eingezeichnete Strecke eine der gestrichelten Lini-
en an einem Ende berührt, durch Einzeichnen einer Strecke, die das andere Ende
derselben gestrichelten Linie trifft.
Diese Paarbildungsstrategie garantiert den Sieg des Spielers A, wenn auch nicht
unbedingt in der minimal möglichen Anzahl von Zügen54 .
Mir ist nicht bekannt, wie G ROSS diese Gewinnstrategie entdeckt hat, aber ei-
ne zielführende heuristische Strategie wäre die Analogiebildung durch Restriktion
(Abschn. 1.2.1) gewesen. Man entwickle einfach eine alternative, dimensionsredu-
zierte Form des Brückenspiels, indem man sich auf einen Spielplan mit jeweils 32
schwarzen und orangen Punkten beschränke. Für diese Variante lässt sich sofort er-
kennen, wie A das Spiel gewinnt (Abb. 1.37).
54
G ROSS spricht in diesem Zusammenhang von einer „demokratischen Strategie“, welche das
Spiel gegen einen stumpfsinnigen Gegner stumpfsinnig und gegen einen raffinierten Gegner raffi-
niert gestalte.
76 1 Heurismen der Variation
Offenbar muss dass B auf Zug 1 (schwarz) von A mit Zug 1 (orange) antworten,
um das Spiel nicht sofort zu verlieren. Dies wiederum zwingt A zu Zug 2 (schwarz),
aber dieser Spielzug verhindert nicht nur die sofortige Niederlage von A, sondern
besiegelt sogleich die zukünftige Niederlage von Spieler B: Sowohl auf Spielzug
2a (orange) als auch auf Spielzug 2b (orange) kann A mit den gewinnbringenden
Zügen 3a (schwarz) bzw. 3b (schwarz) antworten.
Die Spielzüge, mit denen Spieler A im dimensionsreduzierten Brückenspiel die
Züge von B beantwortet, um das Spiel zu gewinnen, genügen der in Abb. 1.36
skizzierten Paarbildungssymmetrie, sodass man die G ROSSsche Gewinnstrategie
für das Original-Bridg-it durch Rücktransfer der Paarbildungsstrategie des „Mini-
Bridg-it“ in das Originalspiel hätte gewinnen können.
Die bei der Hinwendung zum Mini-Brückenspiel vorgenommene Analogiebil-
dung durch Restriktion geschieht unter der Maßgabe, den Spielplan auf die minima-
len Abmessungen zu verkleinern, für die noch strategische Überlegungen angestellt
werden können; noch kleinere Spielpläne liefern offenbar einzügige und deshalb
nicht zurücktransformierbare Gewinnstrategien.
Dies lässt sich als Analogiebildung unter Beachtung des Extremalprinzips deu-
ten, welches erfolgreich im Zusammenspiel mit vielen heuristischen Strategien ein-
gesetzt werden kann und besonders intensive Verflechtungen mit den Heurismen
aufweist, die in Abschn. 1.2.4 thematisiert werden.
Zuvor aber soll noch zum Abschluss dieses Abschnitts das oben bereits erwähnte
Spiel Hex diskutiert werden.
Spieler A (schwarz) und Spieler B (orange) belegen abwechselnd eines der noch
unbesetzten Sechsecke mit einem Spielstein ihrer Farbe, wobei ein einmal gesetzter
Stein nicht mehr bewegt werden darf. Sieger ist derjenige, dem es zuerst gelingt,
seine beiden Grundlinien durch einen zusammenhängende Kette von Spielsteinen
1.2 Variation der Problemstellung 77
seiner Farbe zu verbinden; oben rechts ist zur Verdeutlichung eine von B gewonne-
ne Partie von Hex illustriert.
Gibt es für einen der Spieler eine Gewinnstrategie?
Dieses Spiel weist gewisse strukturelle Ähnlichkeiten mit Bridg-it auf, ist aber
zumindest für große n deutlich komplizierter. Davon überzeugt man sich am besten
dadurch, dass man eine zu Hex topologisch äquivalente Spielform – nennen wir sie
„Punkthex“ – herstellt, in der es wie bei Bridg-it darum geht, benachbarte Punkte
miteinander zu verbinden.
Abb. 1.38 zeigt links einen .4 4/-Spielplan von Hex und rechts einen dazu to-
pologisch äquivalenten .4 4/-Spielplan von Punkthex, der dadurch entsteht, dass
eine Raute durch drei Reihen mit jeweils sechs gleichseitigen Dreiecken parkettiert
wird, deren Ecken dann den Sechsecksfeldern des .4 4/-Hexspielplans entspre-
chen.
Abb. 1.39 illustriert zwei identische Spielverläufe von Hex und Punkthex, in de-
nen A mit seinem vierten Zug gewinnt.
In der Version Punkthex wird ein direkter Vergleich des Spiels mit Bridg-it mög-
lich. Offenbar besteht ein Unterschied darin, dass jedes freie Feld von jedem Spieler
besetzt werden darf, während bei Bridg-it jeder Spieler nur Felder seiner eigenen
Farbe belegen kann. Außerdem besitzt Punkthex mehr Freiheitsgrade als Bridg-it:
Sofern nicht besetzte Felder dies verhindern, kann man sich bei Punkthex von den
Eckfeldern in zwei bzw. drei Richtungen (bei Bridg-it: in zwei), von den anderen
78 1 Heurismen der Variation
Randfeldern in vier Richtungen (bei Bridg-it: in drei) und von den Zentrumsfeldern
in sechs (bei Bridg-it: in vier) Richtungen bewegen. Je größer das Spielfeld ist,
desto stärker machen sich diese Unterschiede bemerkbar. Die von den Princetoner
Studenten damals bevorzugten Abmessungen eines Hex-Bretts lagen bei n D 14;
auf einem .14 14/-Spielplan gibt es eine solch astronomische Zahl von Spiel-
möglichkeiten55 , dass eine vollständige Analyse des Spiels wohl kaum zu leisten
ist.
Kehren wir nun aber zur hexagonalen Original-Version des Spiels zurück, deren
Gestalt – so hat es mir J OHN NASH persönlich bestätigt – sich nicht zuletzt des-
wegen durchgesetzt hat, weil in den historischen Gebäuden des Mathematischen
Instituts („Old Fine Hall“) einige Fußböden, genauer: die Fußböden der Toiletten
mit regelmäßigen Sechsecken parkettiert waren (und heute noch sind) und so den
Studenten mehr als genug Spielpläne in variablen Größen zur Verfügung standen.56
Die in der Problembeschreibung illustrierte Partie auf einem .8 8/-Brett war
bereits zu Gunsten von B entschieden, nachdem beide Spieler ihren vierten Zug
gemacht hatten und mit dem in Abb. 1.40, links dargestellten Spielzustand eine von
ca. 3;1 1011 Spielsituationen, die nach dem vierten Zug beider Spieler möglich
sind, erreicht war.
Jeden Zug von A, der in der rechten Spielhälfte von B ausgeführt wird, interpre-
tiere B als Versuch, die Anbindung von 3 (orange) an die rechte Grundlinie von B
zu verhindern und antworte mit einem Zug in der rechten Spielhälfte mit dem Ziel,
genau dies zu erreichen.
Jeden Zug von A, der in der linken Spielhälfte von B ausgeführt wird, fasse B
als Versuch auf, die Anbindung von 4 (orange) an die linke Grundlinie von B zu
blockieren und antworte mit einem Zug in der linken Spielhälfte, der genau diese
Anbindung zum Ziel hat; in spätestens drei in der linken Spielhälfte ausgeführten
Spielzügen ist das möglich.
55
Nach den ersten drei Zügen beider Spieler sind bereits mehr als 1012 verschiedene Spielzustände
möglich!
56
„An alternative slang name for the game was Bathroom . . . “ – J OHN F ORBES NASH am
10.02.2004.
1.2 Variation der Problemstellung 79
Der optimale Zug 5 von A in der linken Hälfte ist mit 5 (schwarz) in Abb. 1.40,
rechts eingetragen; alle anderen 5. Züge von A in der linken Hälfte würden zu einer
Anbindung von 4 (orange) an die linke Grundlinie in zwei Zügen führen:
Besetzt nämlich A in seinem fünften Zug die Felder X oder Y , so antwortet
B mit der Besetzung von Feld Z, alle anderen fünften Züge von A in der linken
Spielhälfte außer dem eingezeichneten Zug 5 (schwarz) beantwortet B mit der Be-
setzung des Feldes Y – dann erreicht B mit einem weiteren Zug die Anbindung von
4 (orange) an die linke Grundlinie.
Auch der optimale 5. Zug hilft aber A nicht weiter, wenn B richtig spielt.
Beantwortet nämlich B Zug 5 (schwarz) mit Zug 5 (orange) wie in Abb. 1.41
eingezeichnet, dann erreicht B eine Position zur Anbindung von 4 (orange) an die
linke Grundlinie in zwei weiteren Zügen vermöge der grafisch angedeuteten Paar-
bildung. Besetzt A mit seinem sechsten Zug in der linken Spielhälfte keines der mit
den Pfeilen gepaarten Felder, so belegt B mit seinem sechsten Zug ein beliebiges
Feld zwischen 4 (orange) und 5 (orange), anderenfalls besetzt B das Feld, das ihm
von dem Paarbildungspfeil zugewiesen wird. Ein möglicher Spielverlauf zur An-
bindung von 4 (orange) an die linke Grundlinie ist in Abb. 1.42, links dargestellt.
Auch in der rechten Spielhälfte kann A nicht verhindern, dass B seine Grundlinie
erreicht.
A muss in seinem nächsten Zug Feld Z aus Abb. 1.42, rechts besetzen, da ande-
renfalls B dieses Feld einnimmt und 2 (orange) an seine rechte Grundlinie anbinden
kann, sofern nicht A sowohl seinen achten als auch seinen neunten Spielstein in
80 1 Heurismen der Variation
Nach dem passenden neunten Antwortzug von B wie in Abb. 1.43 kann A den
Sieg von B in höchstens drei weiteren Zügen nicht mehr verhindern, wenn B die
mit den roten Pfeilverbindungen gekennzeichnete Paarbildungsstrategie verfolgt.
Die Diskussion der in der Problembeschreibung skizzierten Partie macht deut-
lich, wie kompliziert Hex ist, wenn es auf großen Spielplänen gespielt wird. Für
kleine Spielfelder lassen sich allerdings leicht Gewinnstrategien für A angeben, wie
Abb. 1.44 zeigt. Sobald A mit seinem Eröffnungszug eines der rot gerahmten Sechs-
ecke belegt, gewinnt er das Spiel. Auch auf .5 5/-Spielplänen lässt sich zeigen,
dass A gewinnt, wenn er das Spiel mit der Besetzung des Symmetriezentrums des
Spielbretts eröffnet.
Für Spieler S 2 fA; Bg ist genau dann die Verbindung seiner beiden Grundlinien
mit einer zusammenhängenden Kette von Spielsteinen unmöglich, wenn eine
Kette seines Gegners existiert, mit der dieser seine beiden Grundlinien verbindet
und damit das Spielfeld für S in zwei Zusammenhangskomponenten zerlegt, von
denen jede nur eine der Grundlinien von S enthält.
Dieses einfache topologische Argument zeigt, dass das Spiel nicht mit einem
Unentschieden enden kann – spätestens wenn alle Felder des Spielplans belegt
sind, existiert genau eine Kette einer Farbe, die den Sieger des Spiels definiert.
Weil das Spiel endlich ist, einer der Spieler das Spiel gewinnen muss und bei-
de Spieler abwechselnd ihre Züge mit vollständigem Einblick in die Züge ihres
Gegners ausführen, hat notwendig einer der Spieler eine Gewinnstrategie! Ge-
nau dann hat nämlich S 2 fA; Bg keine Gewinnstrategie, wenn sein Gegner S 0
jeden beliebigen Zug von S bei optimalem Spiel so beantworten kann, dass das
Spiel nicht mit einem Sieg von S endet – die Nicht-Existenz einer Gewinnstrate-
gie für S ist also äquivalent zur Existenz einer Strategie für S 0 , die dem Spieler S 0
zumindest ein Unentschieden garantiert. Da aber das Spiel nicht unentschieden
enden kann, ist die Nicht-Existenz einer Gewinnstrategie für S gleichbedeutend
mit der Existenz einer Gewinnstrategie für S 0 .
Hätte B eine Gewinnstrategie, so könnte A diese Gewinnstrategie stehlen! Dazu
eröffnet A mit einem beliebigen Zug und folgt danach der Gewinnstrategie von
B. Ist er dabei irgendwann gezwungen, auf das Feld zu setzen, welches er mit
seinem Eröffnungszug besetzt hat, so führt er einen weiteren beliebigen Zug
aus und spielt mit der Strategie von B weiter. Jedesmal, wenn die Imitation der
Gewinnstrategie des Spielers B von Spieler A verlangt, einen Stein auf ein Feld
zu setzen, das er mit seinem zuletzt ausgeführten beliebigen Extrazug belegt
hat, führt A einen neuen arbiträren Zug aus. Auf diese Weise spielt A nach der
Gewinnstrategie von B mit einem zusätzlichen Stein auf dem Brett.
Da ein zusätzlicher Stein immer ein Vorteil und niemals ein Nachteil ist, gewinnt
A, was die Annahme der Existenz einer Gewinnstrategie für B zum Widerspruch
führt. Also hat A eine Gewinnstrategie.
In Kenntnis der Tatsache, dass bei Hex Spieler A bevorteilt ist57 , hat man sich um
diverse Änderungen der Spielbedingungen bemüht, die diesen Vorteil ausgleichen
sollten.
Ein naheliegender Vorschlag bestand darin, auf einem n .n C 1/-Brett zu spie-
len und dem Spieler A die beiden Grundlinien zuzuweisen, die .n C 1/ Sechsecke
auseinander liegen, in der Hoffnung, dass sich der Startvorteil und der Vorteil des
kürzeren Weges ausgleichen könnten.
Im Mathematical Intelligencer 17 (1995) veröffentlichte aber J OHN W. M IL -
NOR, ein Freund und Studienkollege von J OHN NASH aus Princetoner Zeiten
und inzwischen ein mit den höchsten Auszeichnungen58 der Branche gewürdigter
Mathematiker, einen konstruktiven Beweis für die Existenz einer Gewinnstrategie
des Spielers B, der auf einer wunderschönen Schubspiegelungssymmetrie beruht
(Abb. 1.45).
Jeden Zug des Spielers A auf dem abgebildeten .7 8/-Board, der ein Feld mit
einem bestimmten Buchstaben belegt, beantwortet B durch Besetzung des zweiten
Feldes mit diesem Buchstaben. Die mit Großbuchstaben markierten Felder gehen
aus den mit Kleinbuchstaben markierten Feldern durch eine Schubspiegelung her-
vor, bei der zunächst um ein Sechseck parallel zur orangen Grundlinie verschoben
und dann eine Spiegelung an der Achse durch die Großbuchstabenreihe A; B; C; : : :
vorgenommen wird. Auf diese Weise entstehen kongruente Ketten der Spieler A
und B, wobei die Kette des Spielers B wegen der kürzeren zu überbrückenden Ent-
fernung zwischen den Grundlinien zuerst die Verbindung derselben erreicht.
Dieser Beweis dokumentiert nicht nur erneut die Verwendbarkeit des Symme-
trieprinzips bei Strategiespielen, sondern macht auch deutlich, wie sehr NASHs
Beweis aus dem Jahr 1949 auf der Symmetrie des .n n/-Spielfelds beruhte.
57
Schließlich hat A eine Gewinnstrategie!
58
Fields-Medaille 1962; Wolf-Preis 1989; Abel-Preis 2011.
1.2 Variation der Problemstellung 83
Gegeben seien ein Körper K mit einem Symmetriezentrum S und eine Gerade
g. Man bestimme eine Ebene E, die g enthält und K in zwei volumengleiche
Teilkörper zerlegt.
ist jedoch trivial; für S 2 g löst offenbar jede Ebene E mit g E das Problem, und
für S … g, liefert die durch die Bedingungen g E, S 2 E eindeutig bestimmte
Ebene E eine Lösung des allgemeineren und daher auch des ursprünglichen Pro-
blems.
84 1 Heurismen der Variation
In Beispiel 1.30 wurde durch die Generalisierung der Problemstellung die Kom-
plexität des Ausgangsproblems reduziert, da Informationen bezüglich der Lage von
g oder bezüglich des Aufbaus eines Oktaeders aus der Problemstellung ausgeblen-
det wurden. Die Reduktion der Problemkomplexität ist aber nicht das einzige Ziel,
welches sich mit dem Heurismus der Generalisierung verfolgen lässt, wie es P ÓLYA
einst formulierte:
Der umfassendere Plan kann mehr Aussicht auf Erfolg haben, vorausgesetzt, daß er nicht
auf bloßem Anspruch beruht, sondern auf irgendeinem Blick für die Dinge über das unmit-
telbar Sichtbare hinaus.
Plakativ umformuliert und interpretiert stellt P ÓLYA hier fest, dass sich die Land-
schaft aus der Perspektive des Adlers besser überblicken lässt als aus der Per-
spektive des Kriechtiers, sodass bisweilen der mit der Befreiung von Restriktionen
verbundene Ausflug in mathematisch höher gelegene Regionen neue Einblicke er-
laubt, welche die Lösung des ursprünglichen Problems erleichtern.
Hier ein Beispiel für dieses Denkmuster, das mich schon als Student fasziniert
hat, als es mein späterer Doktorvater K LAS D IEDERICH in einer Vorlesung zur
klassischen Funktionentheorie vorstellte.
und für jxj 1 ist diese Potenzreihe divergent, weil dann ihre Summandenfolge
keine Nullfolge bildet und damit ein notwendiges Kriterium für die Konvergenz
einer Reihe verletzt ist. Folglich ist 1; 1Œ das Konvergenzintervall der Taylorreihe
von f mit Entwicklungspunkt x0 D 0.
Die elegante Lösung für den Fall x0 D 0 beruht auf der sofort einsichtigen
Möglichkeit, die Potenzreihenentwicklung von f auf die geometrische Reihe zu-
rückzuführen. Für x0 ¤ 0 bietet sich diese Möglichkeit nicht, sodass man sich der
Mühe unterziehen müsste, die Koeffizienten ai der Taylorreihe
1
X
Tf Ix0 .x/ D ai .x x0 /i
i D0
59
Benannt nach B ROOK TAYLOR (1685–1731).
1.2 Variation der Problemstellung 85
f .i / .x0 /
ai WD für i 2 N0
iŠ
zu bestimmen und dann das Konvergenzverhalten der Potenzreihe zu untersuchen;
der Konvergenzradius R der Reihe ließe sich zur Not60 mit der Hadamard-
Formel61
p 1
1 1
R D lim sup jai j
i
mit WD 1 und WD 0
i !1 0 1
gilt; man muss sich lediglich von einer unnötigen Restriktion befreien und komplexe
Methoden zur Lösung des Problems einsetzen.
Die Funktion f lässt sich zu einer meromorphen Funktion fO auf C fortsetzen,
welche in C n fi; ig holomorph ist. Die Potenzreihenentwicklung von fO um einen
beliebigen Punkt z0 2 C konvergiert auf jeder offenen Kreisscheibe .z0 I r/, die
in C n fi; ig liegt, normal gegen fO; damit gilt für den Konvergenzradius R der
Potenzreihe zunächst einmal R minfjz0 ij; jz0 C ijg.
Die isolierten Singularitäten von fO in ˙i sind Polstellen und daher nicht hebbar,
sodass R > minfjz0 ij; jz0 C ijg nicht möglich ist; also muss R D minfjz0
ij; jz0 C ijg gelten.
Wird nun speziell z0 WD x0 2 R als Entwicklungspunkt gewählt, so ist
q q
jx0 ij D jx0 C ij D 1 C x02 und daher R D 1 C x02 ;
wodurch der Konvergenzkreis .x0 ; R/ der Reihe festgelegt ist. Die Einschränkung
dieser Potenzreihe auf R ist die Taylorreihe Tf Ix0 .x/ von f mit Entwicklungspunkt
60
Meist hält die Analysis elegantere Methoden zur Bestimmung des Konvergenzradius einer Po-
tenzreihe bereit.
61
Benannt nach JACQUES -S ALOMON H ADAMARD (1865–1963).
86 1 Heurismen der Variation
Zu zeigen:
! !
X
m
m X
mC1
mC1
.1/k k m1 D 0 H) .1/k k m D 0 :
k k
kD0 kD0
Da die Induktionsvoraussetzung
PmC1 mC1 beim Beweis verwendet werden muss, gilt es,
k m
Umformungen von kD0 .1/ k durchzuführen, die eine Abspaltung des
P m k
Terms m kD0 k .1/k m1
k ermöglichen. Unter Verwendung diverser Eigenschaf-
ten der Binomialkoeffizienten ergibt sich:
! !
X mC1
mC1 X mC1
mC1
.1/ k D .m C 1/
k m
.1/k k m1
k k
kD0 kD0
!
Xm
m
.m C 1/ .1/k k m1 :
k
kD0
und damit eine zu . / analoge Formel für kleinere Exponenten von k gelten.
Probieren
PmC1wir systematisch,
mC1 indem wir etwa für m D 3 und p D 0; 1; 2; 3 die
k mp
Summe kD0 k
.1/ k berechnen:
!
X4
4
.1/k k 3p
k
kD0
8
ˆ
ˆ 1 03 C .4/ 13 C 6 23 C .4/ 33 C 1 43 D 0 für p D 0 I
ˆ
ˆ
< 1 02 C .4/ 12 C 6 22 C .4/ 32 C 1 42 D 0 für p D 1 I
D
ˆ
ˆ 1 0 C .4/ 1 C 6 2 C .4/ 3 C 1 4 D 0 für p D 2 I
1 1 1 1 1
ˆ
:̂
1 00 C .4/ 10 C 6 20 C .4/ 30 C 1 40 D 0 für p D 3 :
Der Fall p D m ist dabei natürlich schon allgemein bekannt, denn laut dem Bino-
mischen Lehrsatz gilt
! !
X mC1
mC1 X mC1
mC1
.1/k k 0 D .1/k 1mC1k D .1 C .1//mC1 D 0 :
k k
kD0 kD0
88 1 Heurismen der Variation
Diese Analyse der Situation legt nahe, einen Induktionsbeweis für folgende Gene-
ralisierung der Formel . / zu versuchen, die für p D 0 in . / übergeht:
Für alle n 2 N und für alle p 2 N0 mit 0 p n gilt:
!
X
nC1
nC1
. / .1/k k np D 0 :
k
kD0
!
X
m
m
D .m C 1/ .1/k k m1p C .1/mC1 .m C 1/mp1 .m C 1/
k1
kD1
" ! !#
Xm
mC1 m
D .m C 1/ .1/k k m1p
k k
kD1
C .m C 1/.1/mC1 .m C 1/m1p
! !
X mC1
mC1 Xm
m
D .m C 1/ .1/k k m1p .m C 1/ .1/k k m1p
k k
kD1 kD1
! !
X mC1
mC1 Xm
m
D .m C 1/ .1/k k m1p .m C 1/ .1/k k m1p
k k
kD0 kD0
!
X mC1
mC1
D .m C 1/ .1/k k m1p ;
k
kD0
P m
denn laut Induktionsvoraussetzung gilt m
kD0 k .1/ k
k m1p
D 0.
Für p D m 1 bleibt wieder nichts zu zeigen (Binomischer Lehrsatz); sei also
0 p m 2. Wie oben erhält man dann
!
X
mC1
mC1
.1/k k m1p
k
kD0
! !
X mC1
mC1 X
m
m
D .m C 1/ k m2p
.1/ k .m C 1/ .1/k k m2p ;
k k
kD0 kD0
Diskutiert man das Problem mit einem Zahlentheoretiker, so fallen diesem unter
Garantie strukturelle Ähnlichkeiten von . / mit diversen Anzahlformeln für speziel-
le Abbildungen zwischen m-elementigen Mengen und r-elementigen Mengen auf.
H ARALD S CHEID machte mich auf die Tatsache aufmerksam, dass sich die Anzahl
zm .r/ der Surjektionen einer m-elementigen Menge auf eine r-elementige Menge
mithilfe der Formel !
Xr
r
zm .r/ D .1/k .r k/m
k
kD0
r
berechnen lässt (siehe auch Beispiel 1.42). Die Symmetrie kr D rk der Binomi-
alkoeffizienten führt auf die Gleichung
!
X
r
r
zm .r/ D .1/k .r k/m
r k
kD0
!
Xr
r
D .1/r .1/rk .r k/m
r k
kD0
!
Xr
r
D .1/r
.1/k k m :
k
kD0
fW R ! R
P nC1
x 7! f .x/ WD nC1
kD0
k n kx
k .1/ k e
der Funktion g gewinnen kann, an der man sofort sieht, dass sämtliche Ableitungen
von g an der Stelle x D 0 verschwinden, weil jede den Faktor .e x 1/ enthält.
Die Tatsache g .
/ .0/ D 0 für alle
beweist wieder die Verallgemeinerung . /
der Formel . /, die ihrerseits durch den Spezialfall g .n/ .0/ D 0 verifiziert wird.
Die hier realisierte Idee zu einem Beweis der Formel . / mit Mitteln der reellen
Analysis verdanke ich meinem Freund J EFF M C N EAL, mit dem ich in der inspirie-
renden Atmosphäre des Mathematischen Instituts der Princeton University etliche
Stunden intensiver Arbeit an Fragestellungen der komplexen Analysis, ebenso aber
auch ausgedehnte Phasen geistiger Entspannung durch die Beschäftigung mit „re-
creational mathematics“ habe verbringen dürfen.
Nach dem Studium der oben diskutierten Beispiele sollte das von P ÓLYA so
genannte „Paradoxon des Erfinders“, nach dem „eine Reihe von Fragen leichter zu
beantworten sein kann als gerade nur eine“, nicht länger paradox erscheinen, und
wir können ein weiteres Muster heuristischen Handelns herausstellen.
Dies hat allerdings unmittelbare Konsequenzen für den zur Generalisierung dua-
len Heurismus der Spezialisierung, der einfach darin besteht, zu einer neuen Pro-
92 1 Heurismen der Variation
Die Dreiecke ABC , ACF und CBF sind ähnlich, weil sie alle rechtwink-
lig sind und paarweise einen weiteren Winkel gemeinsam haben.
Sind nun ABC 0 ; ACF1 und CBF2 die Bilddreiecke von ABC ; ACF
und CBF unter den Punktspiegelungen an den Seitenmitten der Seiten AB ; AC
und CB, so sind auch ABC 0 , ACF1 und CBF2 ähnlich.
62
Diskutiert in P ÓLYA: Generalization, specialization, analogy. American Mathematical Monthly
55 (1948).
1.2 Variation der Problemstellung 93
Zusätzlich ist der Flächeninhalt Fc des Dreiecks ABC 0 über der Hypotenuse
c von ABC gleich der Summe der Flächeninhalte Fb ; Fa der Dreiecke ACF1
und CBF2 über den Katheten b und a von ABC , weil Kongruenzabbildungen
insbesondere flächeninhaltstreu sind (Abb. 1.46).
Werden nun beliebige ähnliche Figuren Ga , Gb und Gc über den Seiten63 a; b; c
des Dreiecks ABC gezeichnet und sind Ga ; Gb und Gc deren Flächeninhalte, so
gilt
Ga Gb Gc
D D ;
Fa Fb Fc
also auch
Fa Gc Fb Gc
Ga C Gb D C
Fc Fc
Fa C Fb
D Gc ;
Fc
Die Beweisführung in Beispiel 1.33 beruht offenbar darauf, dass der eviden-
te Sachverhalt Fa C Fb D Fc eine äquivalente Verallgemeinerung Ga C Gb D
Gc („Verallgemeinerter Satz von Pythagoras“) besitzt, die ihrerseits den Satz von
Pythagoras als (äquivalenten) Spezialfall enthält; Abb. 1.47 verdeutlicht die Zusam-
menhänge.
63
„Über den Seiten . . . “ soll insbesondere bedeuten, dass diejenigen Ähnlichkeitsabbildungen, die
Gi auf Gj abbilden, jeweils auch i auf j abbilden (i; j 2 fa; b; cg).
94 1 Heurismen der Variation
Abb. 1.47 Gemeinsame Verallgemeinerung von Ausgangssituation und Satz des Pythagoras
Die zunächst noch versteckte Analogie zwischen der Ausgangsfigur in der Pro-
blembeschreibung und der Veranschaulichung des Satzes von Pythagoras in Abb.
1.47 wird offensichtlich nach zwei Schritten:
Das allgemeine Denkmuster, das hier den Schlüssel zur Lösung des Problems
enthält, ist die Suche nach gemeinsamen Verallgemeinerungen. Aus der zur Genera-
lisierung dualen Perspektive der Spezialisierung wird an diesem Beispiel deutlich,
dass manchmal Hoffnung besteht, dass sich die Lösungen mehrerer Spezialfälle
einer Problemstellung, die dann die Rolle einer gemeinsamen Verallgemeinerung
dieser Spezialfälle übernimmt, zu einer Lösung des allgemeineren Problems zusam-
mensetzen lassen, wenn man nicht sogar schon bei der Lösung eines Spezialfalls
1.2 Variation der Problemstellung 95
A 2 a; B 2 b und C 2 c :
64
N. H AAS: Das Extremalprinzip als Element mathematischer Denk- und Problemlöseprozesse
– Untersuchungen zur deskriptiven, konstruktiven und systematischen Heuristik. Verlag Franzbe-
cker, Hildesheim (2000).
96 1 Heurismen der Variation
Man wähle A1 2 a, trage in A1 an a einen Winkel von 60ı an; der Schnittpunkt
von c mit dem freien Schenkel dieses Winkels sei C1 . Ist dann B1 der Schnittpunkt
von a mit dem freien Schenkel des in C1 an C1 A1 angetragenen 60ı -Winkels, so ist
A1 B1 C1 ein gleichschenkliges Dreieck mit zwei Basiswinkeln von 60ı , also ein
gleichseitiges Dreieck. Dieses Dreieck genügt den Anforderungen der Problemstel-
lung im Spezialfall b D a.
Die drei Winkel, die sich bei C1 zu einem gestreckten Winkel ergänzen, haben
laut Wechselwinkelsatz jeweils ein Winkelmaß von 60ı . Ist also A2 B2 C2 das Bild-
dreieck von A1 B1 C1 unter der 60ı -Drehung ı um A1 im Gegenuhrzeigersinn, so
gilt A2 D A1 , B2 D C1 und C2 2 c (Abb. 1.49); folglich löst das gleichseitige
Dreieck A2 B2 C2 den Spezialfall b D c des Konstruktionsproblems.
Am Zusammenspiel der beiden Spezialfälle lässt sich ablesen, wie die allgemei-
ne Konstruktionsaufgabe gelöst werden kann.
Ist generell AC die Bildstrecke einer Strecke AB bei einer 60ı -Drehung um A,
so ist ABC gleichseitig, denn AC und AB sind die Schenkel des gleichschenk-
ligen Dreiecks ABC mit Basiswinkeln von 12 .180ı 60ı / D 60ı ; dieser Sach-
verhalt wurde oben bei der Konstruktion des gleichseitigen Dreiecks A1 B1 C1
verwendet.
Geht man nun vom speziellen Dreieck A1 B1 C1 aus, setzt A WD A1 und wählt
einen beliebigen Punkt B 2 B1 C1 , dann wird, wie in Abb. 1.49 dargestellt, die
Strecke B1 C1 bei einer 60ı -Drehung ı um A auf eine Bildstrecke B2 C2 abgebildet,
die auf der Geraden c liegt, insbesondere ist C WD ı.B/ 2 c und das Dreieck
ABC gleichseitig.
Insbesondere gilt dies, wenn B wie in Abb. 1.50 als der Schnittpunkt von b mit
B1 C1 gewählt wird; dann ist ABC gleichseitig und die Bedingungen A 2 a,
B 2 b und C 2 c sind erfüllt.
1.2 Variation der Problemstellung 97
Ist nämlich ABC ein Dreieck mit dem Innenwinkel ˛ in A, dann kann man
zunächst ABC zu einem Parallelogramm ABDC mit dem Innenwinkel ˛ bei A
und dem doppeltem Flächeninhalt von ABC ergänzen (Abb. 1.51, links).
Zeichnet man nun die Mittelparallele C1 D1 des Parallelogramms mit C1 D1 jj AB
ein so ist für A1 WD A und B1 WD B das Parallelogramm A1 B1 D1 C1 eine Lösung
des Problems im betrachteten Spezialfall (Abb. 1.51, mitte).
Der allgemeine Fall kann nun auf den Spezialfall zurückgeführt werden (Abb.
1.51, rechts):
Ist im Dreieck ABC der Innenwinkel bei A von ˛ verschieden, so überführe
man es durch eine Scherung in ein flächeninhaltsgleiches65 Dreieck ABC 0 mit
dem Innenwinkel ˛ bei A.
65
Auch ohne Kenntnis der Tatsache, dass Scherungen flächeninhaltstreue Abbildungen sind, kann
man die Flächeninhaltsgleichheit der Dreiecke ABC und ABC 0 daran erkennen, dass sie in
Grundseite und Höhe übereinstimmen (! Flächeninhaltsformel für Dreiecke).
98 1 Heurismen der Variation
Die Dualität der Strategien wird auch im folgenden Beispiel noch einmal deut-
lich, das aber primär den Blick auf ein anderes heuristisches Prinzip lenken soll.
X
6
1 27
kD 2i D D 27 1 D 127
i D0
12
Für j D 1 findet offenbar nur ein Spiel statt, es gibt einen Verlierer und einen
Gewinner (den Turniersieger).
Für j D 2 finden zunächst zwei Halbfinals statt, deren Verlierer ausscheiden;
die beiden Sieger bestreiten das Endspiel, hier gibt es einen Verlierer und einen
Gewinner (den Turniersieger).
Für j D : : :
Die Konzentration auf den einzigen Spieler, der kein Spiel verloren hat, lässt sich
im Sinne einer Strategie deuten, die im weitesten Sinne darin besteht, bei Problem-
66
Es handelt sich um die Australian Open in Melbourne, die French Open in Paris, die All England
Championships in Wimbledon und die US Open in Flushing Meadows/New York.
1.2 Variation der Problemstellung 99
We are trying to prove the existence of an object with certain properties. The extremal pin-
ciple tells us to pick an object which maximizes or minimizes some function. The resulting
object is then shown to have the desired property by showing that a slight perturbation
(variation) would further increase or decrease the given function. If there are several opti-
mizing objects, then it is usually immaterial which one we use. In addition, the extremal
principle is mostly constructive, giving an algorithm for constructing the object.
Dies ist allerdings nur eine Facette dessen, was N ICOLA H AAS in ihrer sehr
tief gehenden und sehr systematischen Auseinandersetzung mit der Rolle „des Ex-
tremalen“ für menschliches Denken und Handeln allgemein, für die Entwicklung
mathematischer Denkweisen und Theorien und für heuristisches Handeln im Rah-
men von Problemlöseprozessen unter der Überschrift „Das Extremalprinzip als
heuristische Strategie“ in ihrem bereits erwähnten Buch behandelt hat.
Ich möchte hier eine kurze Zusammenschau ihrer zentralen Ergebnisse vorstel-
len, damit deutlich wird, wie sich das Extremalprinzip in unsere Systematik der
Heurismen der Variation einordnet.
Auf der Grundlage der an unzähligen Beipielen festzumachenden Korrespon-
denzhypothese, nach der Objekte, die hinsichtlich einer ausgewählten Eigenschaft
extremal sind, oft auch bezüglich anderer Merkmale besondere Kennzeichen auf-
weisen, formuliert N ICOLA H AAS drei Substrategien des Extremalprinzips, die
durch unterschiedliche Funktionen „des Extremalen“ in den einzelnen Problem-
strukturen gekennzeichnet sind:
67
E NGEL , A.: Problem-solving strategies. Springer, New York (1998).
100 1 Heurismen der Variation
Man erkennt, dass das Extremalprinzip als heuristisches Prinzip im engeren Sin-
ne des „Extremalen“ von Ordnungsstrukturen lebt, die erst dann ihre Wirksamkeit
für den Problemlöser entfalten können, wenn es ihm gelingt, diese Ordnungsstruk-
turen mit der Einführung geeigneter Maße zu entdecken oder gar erst zu induzieren
– darüber entscheidet die Ausgestaltung des mathematischen „Usepackage IKEA“
(Intuition, Kreativität, Erfahrung, Ausdauer) in der Person des Problemlösers.
Bei allgemeinerer Interpretation des „Extremalen“ in dem oben beschriebe-
nen Sinne lassen sich zwar bisweilen Erfahrungsdefizite überspielen, das ändert
aber nichts daran, dass erst das richtige Gespür für das problemangepasste Maß
Lösungen entstehen lässt, die aufgrund ihrer Eleganz und Kürze den Mathematik-
Ästheten zu beeindrucken in der Lage sind.
In diesem Zusammenhang möchte ich zwei Beispiele diskutieren, die zu den
„Klassikern“ zählen; es handelt sich um das Sylvester-Problem68 und den Satz von
Steiner und Lehmus69 .
68
Benannt nach JAMES J OSEPH S YLVESTER (1814–1897).
69
Formuliert im Jahr 1840 von C HRISTIAN L UDOLF L EHMUS (1780–1863) und von JAKOB
S TEINER (1796–1865) im gleichen Jahr bewiesen.
102 1 Heurismen der Variation
Vier Jahre vor seinem Tod stellte J. J. S YLVESTER diese Aufgabe in den Mathe-
matical Questions and Solutions from the Educational Times70 . Den ersten Beweis
hat S YLVESTER nicht mehr erlebt, denn es vergingen vierzig Jahre, bis der unga-
rische Mathematiker T IBOR G ALLAI (G RÜNWALD ) im Jahr 1933 als erster das
Problem mit einer komplizierten Beweisführung lösen konnte.
Im Jahr 1948 gelang aber L EROY K ELLY ein Nachweis mit beeindruckend ein-
fachen Mitteln, der in die Sammlung „Proofs from THE BOOK“ aufgenommen
wurde. Die entscheidende Idee des Beweises beruht auf Substrategie (1) des Ex-
tremalprinzips. Ich halte es für sinnvoll, die in der Charakterisierung der Substra-
tegien des Extremalprinzips eingeführten Begrifflichkeiten auf die hier vorliegende
Problemsituation zu übertragen, um die zur Illustration notwendigen Bezüge her-
zustellen, zumal bei der Besprechung der Aufgabe in der einschlägigen Literatur
zum Problemlösen oft die finale Sorgfalt fehlt. Beginnen wir mit einer äquivalenten
Neuformulierung der Behauptung als Existenzaussage:
Sei nun G die Menge aller Verbindungsgeraden von je zwei Punkten aus P . Dann
ist .P ; G ; 2/ eine endliche Inzidenzstruktur, die zu einer Inzidenzgeometrie wird,
wenn P1 ; : : : ; Pn nicht kollinear sind und deshalb auch das dritte Inzidenzaxiom
erfüllt ist.
Dadurch wird nun sichergestellt, dass die Menge
M WD f.A; g/ 2 P G j A … gg
nicht leer ist; auf dieser nicht leeren, endlichen Menge definiert die Funktion
ein Maß, wobei mit dist.A; g/ der euklidische Abstand des Punktes A von der Ge-
raden g bezeichnet sei. Durch die Kleiner-Relation in R ist .M / geordnet, und als
endliche Menge positiver Zahlen hat .M / ein kleinstes Element d > 0.
Sei jetzt .Pi ; `/ 2 M mit .Pi ; `/ D d gewählt und sei F der Fußpunkt des
Lotes von Pi auf ` (Abb. 1.52, links). Dann hat ` die durch „Die Gerade enthält
genau zwei Punkte aus P “ definierte Eigenschaft E, denn sonst würde die Minima-
litätseigenschaft von .Pi ; `/ zerstört.
70
Heft 59 (1893), S. 98, Question No. 11851.
1.2 Variation der Problemstellung 103
Um dies einzusehen, mache man sich zunächst klar, dass der Fall F 2 P nicht
eintreten kann (Abb. 1.52, rechts).
Wäre F DW Pk 2 P und Pj 2 P ein weiterer Punkt der Geraden `71 mit
` D gPk Pj , so hätte die Verbindungsgerade h D gPj Pi der Punkte Pi und Pj einen
geringeren Abstand d 0 von Pk D F als die Gerade ` von Pi , was sich elementargeo-
metrisch dadurch begründen lässt, dass d die Hypotenuse in einem rechtwinkligen
Dreieck ist, das d 0 als Kathete hat. Folglich ist F … P .
Wären nun mindestens drei Punkte der Menge P Elemente der Geraden `, etwa
Pj ; Pk und Pm , dann lägen wegen F … P mindestens zwei davon in der gleichen
Halbebene bezüglich der Trägergeraden gFPi (dies seien ohne Beschränkung der
Allgemeinheit die Punkte Pj und Pk ), und einer dieser beiden hätte eine geringere
Entfernung von F als der andere (O. B. d. A. gelte dist.F; Pk / < dist.F; Pj /). Dann
läge die in Abb. 1.53, links beschriebene Situation vor.
71
Dieser existiert, weil jede Gerade einer Inzidenzgeometrie mindestens zwei Punkte enthält.
104 1 Heurismen der Variation
im Widerspruch zur Minimalität von jM in .Pi ; `/. Also enthält die unter der Vor-
aussetzung der Nicht-Kollinearität von P1 ; : : : ; Pn konstruierte Gerade ` nur genau
zwei Punkte, womit das Sylvester-Problem gelöst wäre.
Der weniger erfahrene Mathematiker wird sich vielleicht darüber wundern, wie
man auf die Idee kommen kann, das Abstandsmaß auf der oben eingeführten Men-
ge M in Betracht zu ziehen, wo doch M weder aus Punkten noch aus Geraden
(den die Problemstellung konstituierenden geometrischen Objekten), sondern aus
Paaren von Punkten und Geraden besteht.
Aus Expertensicht ist die Idee aber naheliegend, denn sobald in der Mathematik
von „Punkten“ (den Elementen einer Menge P ) und „Geraden“ (den Elementen
einer Menge G ) sowie von „Der Punkt P liegt auf der Geraden g“ (dadurch wird
eine Relation I zwischen P und G erklärt) die Rede ist, handelt es sich bei dem
Tripel .P ; G ; I / um eine Inzidenzstruktur mit I als Inzidenzrelation. Wenn in einer
solchen Inzidenzstruktur die Inzidenzaxiome
erfüllt sind, dann liegt eine Struktur vor, die man eine Inzidenzgeometrie nennt.
Im Sylvester-Problem ist eine Inzidenzstruktur vorgegeben (eine endliche
Menge P von Punkten der euklidischen Ebene sowie die Menge G ihrer eu-
klidischen Verbindungsgeraden), für die gezeigt werden soll, dass sie – un-
ter der Voraussetzung, es handelt sich um eine Inzidenzgeometrie (! Nicht-
Kollinearitätsbedingung!) – eine Gerade enthält, die mit genau zwei Punkten
aus P inzidiert. Die Inzidenzrelation „2“ in .P ; G ; 2/ definiert eine Teilmenge R
von P G , sodass es durchaus natürlich erscheint, im Hinblick auf die Verwen-
dung des Extremalprinzips eine Ordnung auf einer geeigneten Menge von Paaren
.A; g/ 2 P G induzieren zu wollen. Welches Maß man hierzu zweckmäßigerweise
verwenden könnte, wird deutlich, wenn man die korrespondierenden Eigenschaften
der Extremalsituation
untersucht.
In diesem extremen Fall gilt R D P G ; liegt aber der Extremfall nicht vor, dann
ist das dritte Inzidenzaxiom erfüllt, und die Betrachtung der Menge M WD P G nR
macht Sinn, denn diese Differenzmenge ist dann nicht länger leer.
Dass in M die Abstandsfunktion ein geeignetes Instrument ist, um eine Ordnung
auf M zu induzieren, ist wieder naheliegend.
1.2 Variation der Problemstellung 105
So leicht die Umkehrung des Satzes von Steiner und Lehmus zu beweisen ist,
nach der in einem gleichschenkligen Dreieck die inneren Winkelhalbierenden der
Basiswinkel gleich lang sind, so knifflig ist der Beweis des Satzes selbst, wenn man
ihn mit Mitteln der synthetischen Geometrie führen will.
Bereits im Jahr 1840 wurde C. S TURM in einem Brief von C HRISTIAN L UDOLF
L EHMUS gebeten, den Satz mit rein geometrischen Mitteln zu beweisen. S TURM
gab die Herausforderung an verschiedene Mathematiker weiter, und der erste, der
sie meisterte, war JAKOB S TEINER, weshalb der Satz unter dem Namen „Satz von
Steiner und Lehmus“ bekannt wurde.
Mit großer Regelmäßigkeit wurden ab 1842 bis in die erste Hälfte des 20. Jahr-
hunderts ständig neue Abhandlungen über diesen Satz verfasst; die faszinieren-
de Geschichte dieses Problems und seiner zahlreichen Lösungen hat A RCHIBALD
H ENDERSON (1877–1963) aufgeschrieben72 .
Schon im Dezember 1937 hatte H ENDERSON, der sich nicht nur als Mathemati-
ker, sondern auch als Biograph von G EORGE B ERNARD S HAW betätigt hat, einen
Artikel mit dem Titel „An essay on the internal bisector problem to end all essays
on the internal bisector problem“ im Journal of the Elisha Mitchell Scientific So-
ciety veröffentlicht, in dem er zuerst nachwies, dass eine ganze Reihe der bis dahin
publizierten Beweise fehlerhaft waren, und daran anschließend selbst zehn korrekte,
aber sämtlich lange und umständliche Beweise angab.
Wohltuend kurz und unkompliziert hingegen ist ein Beweis nach H AROLD
S COTT M ACDONALD C OXETER (1907–2003), der Ähnlichkeiten mit einem Be-
weis von L EHMUS aus dem Jahr 1850 aufweist. In diesem Beweis wird eine
72
A. H ENDERSON: The Lehmus-Steiner-Terquem-Problem in Global Survey. Scripta Mathema-
tica 21 (1955).
106 1 Heurismen der Variation
verschärfte Kontraposition73 der Aussage des Satzes von Steiner und Lehmus ge-
zeigt, nämlich die, dass in einem Dreieck mit zwei verschiedenen Winkeln der
kleinere Winkel die längere innere Winkelhalbierende besitzt74 ; zentrales Hilfsmit-
tel bei dieser Beweisführung ist der Peripheriewinkelsatz der Kreisgeometrie.
Sehen wir uns C OXETERs Beweis einmal mit geschärftem Blick für das Extre-
malprinzip an. Abb. 1.54 zeigt ein Dreieck ABC mit zwei verschieden großen
Innenwinkeln ˛ D ^BAC , ˇ D ^CBA, ˛ > ˇ. Zu zeigen ist, dass in dieser
Situation jwˇ j > jw˛ j gilt, wenn w˛ D AD und wˇ D BE die inneren Winkelhal-
bierenden der Winkel ˛ und ˇ im Dreieck ABC bezeichnen.
In der Randsituation ˛ D ˇ wären w˛ und wˇ gleich lang, denn dann wären die
Dreiecke ABD und ABE nach dem Kongruenzsatz (wsw) für Dreiecke kongruent.
Ein determinierendes Element dieser Randsituation ist die minimale absolute Län-
gendifferenz der Winkelhalbierenden, die nicht kleiner als 0 werden kann; allerdings
ist dieses Maß für die Problemstellung zu unspezifisch, da es um den Nachweis ei-
ner Aussage über das Vorzeichen von jwˇ j jw˛ j geht – die Differenz jwˇ j jw˛ j
soll für ˛ > ˇ positiv sein.
Laut Korrespondenzhypothese könnte es aber auch andere Besonderheiten der
extremalen Randsituation ˛ D ˇ geben, die mit dem Übergang zu ˛ > ˇ verloren
gehen. Eine davon ist die Eigenschaft, dass das Viereck ABDE im Fall ˛ D ˇ
einen Umkreis besitzt, für ˛ > ˇ jedoch nicht (Abb. 1.55).
Im gleichschenkligen Dreieck ABC (links) folgt wegen ˛ D ˇ, dass sich im
Viereck ABDE Paare einander gegenüberliegender Winkel zu 180ı ergänzen, wie
dies für ˛ und ^BDE angedeutet ist. Diese Bedingung ist notwendig und hinrei-
chend für die Existenz eines Umkreises des Vierecks ABDE.
73
Der Kontrapositionssatz besagt, dass die Aussage p ) q logisch äquivalent zur Aussage
.:q/ ) .:p/ ist, wobei mit .:w/ die Verneinung (Negation) der Aussage w bezeichnet wer-
de.
74
H. C OXETER : Introduction to Geometry. John Wiley & Sons, New York (1961).
1.2 Variation der Problemstellung 107
Läge im rechten Dreieck ABC aus Abb. 1.55 mit ˛ > ˇ der Schnittpunkt E
der Winkelhalbierenden wˇ mit der Dreiecksseite AC auf dem Umkreis des Drei-
ecks ABD, so wäre DE eine Sehne dieses Kreises, über der mit ^DBE D ˇ2
und ^DAE D ˛2 zwei verschieden große spitze Peripheriewinkel lägen, was laut
Peripheriewinkelsatz unmöglich ist.
Aber Vorsicht – noch sind wir nicht am Ziel!
Mit der graphischen Darstellung in Abb. 1.55, rechts wird suggeriert, dass der
Schnittpunkt P der Winkelhalbierendengeraden von ˇ mit dem Umkreis des Drei-
ecks ABD ein innerer Teilpunkt von BE ist und deshalb jBP j < jBEj gilt. Das
muss aber begründet werden, denn sonst könnte man Abb. 1.55 ebenso gut die Be-
ziehung jBEj > jADj entnehmen, die wir gerade erst beweisen wollen . . .
Die Begründung liefert erneut der Peripheriewinkelsatz (Abb. 1.56).
Der Winkel ^DBP D ˇ2 ist ein Peripheriewinkel über dem gleichen von der
Sehne DP begrenzten Bogen wie der Winkel ^DAP , also ist auch ^DAP D ˇ2 .
Wegen ^DAE D ˛2 > ˇ2 D ^DAP folgt P 2 BE, P ist also innerer Teilpunkt
von BE.
108 1 Heurismen der Variation
Zum endgültigen Nachweis von jBEj > jADj genügt es deshalb, jBP j > jADj
zu zeigen, denn weil P ein Punkt der Strecke BE ist, gilt jBEj > jBP j.
Bei jBP j > jADj handelt es sich offenbar um eine Aussage über Längen von
Sehnen im Kreis, die verschieden großen spitzen Winkeln gegenüber liegen:
Die Sehne BP liegt dem Winkel ^PAB D ˛2 C ˇ2 , die Sehne AD dem Winkel
^ABD D ˇ gegenüber, und wegen ˛ > ˇ ist
1
90ı D .˛ C ˇ C /
2
1
> .˛ C ˇ/ D ^PAB
2
1
> .ˇ C ˇ/ D ^ABD :
2
Der aus der Dreieckslehre bekannte Sachverhalt, dass in jedem Dreieck mit
verschieden großen Winkeln dem größeren Winkel jeweils die längere Seite ge-
genüberliegt75 , hat aber folgendes Analogon in der Kreislehre:
Liegen zwei Sehnen BP und AD eines Kreises zwei verschiedenen spitzen Pe-
ripheriewinkeln ' und ı gegenüber, so gehört zum kleineren Winkel die kürzere
Sehne.
Auch dieser Zusammenhang ergibt sich aus dem Peripheriewinkelsatz (Abb. 1.57):
Sind ' und ı diejenigen spitzen Peripheriewinkel, die über den jeweils kürzeren
der zu den Sehnen BP und AD gehörigen Kreisbögen b1 und b2 liegen, und gilt
etwa ' < ı, dann ist der zu ' gehörige Zentrumswinkel ^PMB über b1 (D 2')
auch kleiner als der zu ı gehörige Zentrumswinkel ^DMA über b2 (D 2ı).
Zum kleineren Zentrumswinkel gehört aber die kürzere Sehne, wie man nach
derjenigen Drehung des Dreiecks PMB um M , die P in A überführt, unschwer
erkennen kann.
Damit ist jBP j > jADj gezeigt, und der Satz von Steiner und Lehmus ist be-
wiesen.
75
Dies ist eine Folgerung aus dem Satz vom gleichschenkligen Dreieck, nach dem in jedem Dreieck
ABC die Bedingungen jCAj D jCBj und ^CAB D ^CBA äquivalent sind.
1.2 Variation der Problemstellung 109
jM j D jM1 j C C jMk j :
2. Zählen durch Bijektion Sind M und A endliche Mengen und ist 'W A ! M
eine bijektive Abbildung, dann gilt jM j D jAj.
Jede Abzählung einer n-elementigen Menge (im Folgenden kurz: „n-Menge“)
B ist durch eine bijektive Abbildung W f1; : : : ; ng ! B gegeben, mit der die
Elemente von B durchnummeriert werden (für 1 i n ist .i/ ist das i-te
Element der Menge B).
Ist also A eine endliche Menge, deren Elementezahl jAj DW n sich durch einen
Zählprozess W f1; : : : ; ng ! A leicht bestimmen lässt, so legt die durch in-
duzierte Anordnung von A vermöge der Bijektion ' ı W f1; : : : ; ng ! M eine
Strukturierung von M fest, welche auch die Bestimmung der Mächtigkeit jM j D n
von M ermöglicht.
Will man beispielsweise die Anzahl der Elemente der Potenzmenge M WD P .B/
einer k-Menge B D fb1 ; : : : ; bk g ermitteln, so genügt es, die Anzahl der Elemente
der Menge A WD f0; 1gk zu bestimmen, denn vermöge der Abbildung
'W M ! A (
1; falls bi 2 X
X 7! .t1 ; : : : ; tk / mit ti WD
0; falls bi … X
wird jeder Teilmenge X von B bijektiv genau ein k-Tupel '.X/ 2 f0; 1gk zugeord-
net.
Die Bestimmung von jAj ist aber einfach, wenn man das folgende, in der Kom-
binatorik als Produktregel bekannte Zählprinzip verwendet.
76
In der Kombinatorik spricht man in diesem Zusammenhang auch von k-Wörtern aus dem Al-
phabet L; in dieser Terminologie bezeichnet man dann die i -te Komponente eines k-Tupels als
den i -ten Buchstaben des k-Wortes.
1.2 Variation der Problemstellung 111
Die vom Zählen nach der Produktregel reflektierte Umstrukturierung der Menge M
besteht in der gedanklichen Anordnung ihrer Elemente als Punktmuster innerhalb
eines k-dimensionalen Würfels.
Zu diesem Zweck bilde man L vermöge 'W L ! f0; : : : ; n 1g bijektiv
auf den Abschnitt f0; : : : ; n 1g von N0 ab und identifiziere Lk mittels WD
.'; : : : ; '/W Lk ! '.L/k mit den nk -vielen Punkten der Menge '.L/k , welche
aus den Punkten mit ganzzahligen Koordinaten im Würfel W WD Œ0; n 1k Rk
besteht.
Die Auszählung der Punkte im Punktmuster .M / kann nun über das rekursive
Zählen erfolgen, welches als nächstes Zählprinzip vorgestellt wird.
jMj C1 j D nj C1 jMj j ;
denn es ist
Mj C1 D f.a; b; 0; : : : ; 0/ 2 Rk j a 2 Mj ; b 2 La g;
wobei La L zwar eine eventuell von a abhängige Teilmenge von L ist, aber
auf jeden Fall unabhängig von a stets genau nj C1 Elemente hat. Rekursiv errechnet
man nun
jMk j D nk jMk1 j
D nk nk1 jMk2 j D : : :
D nk nk1 n1 :
Dem rekursiven Zählen liegt wieder deutlich der Heurismus der Modularisierung
zu Grunde – die Mächtigkeiten der Mengen M1 ; : : : ; Mk1 lassen sich über die
Rekursionsvorschrift derart zusammensetzen, dass man daraus die Elementezahl
von M D Mk bestimmen kann.
Mit diesen Zählprinzipien steht ein Instrumentarium zur Verfügung, welches die
Lösung der vier kombinatorischen Grundaufgaben ermöglicht und die epistemische
Struktur des Problemlösers mit den jeweiligen Anzahlformeln bereichert, was für
die Bewältigung von Zählaufgaben enorm hilfreich ist.
112 1 Heurismen der Variation
Es handelt sich darum, die k-Auswahlen aus einer n-Menge mit (1) oder ohne
(2) Berücksichtigung der Reihenfolge und mit (a) oder ohne (b) Wiederholungen zu
zählen.
Abb. 1.58 zeigt eine schematische Darstellung der vier Grundaufgaben der Kom-
binatorik mit den üblichen Bezeichnungen für die zu zählenden Objekte.
(a) erlaubt?
(1) beachtet
(beliebiges k-Tupel)
(k-Variation, k-Tupel)
(b) verbietet?
Auf wie viele Arten und Wiederholungen
kann man aus einer (injektives k-Tupel)
n-Menge k Elemente
auswählen, wenn man (a) erlaubt?
die Reihenfolge (2) nicht beachtet
(k-Kollektion)
(k-Kombination)
(b) verbietet?
und Wiederholungen
(k-Teilmenge)
Wir werden nun die vorgestellten Zählprinzipien benutzen, um die den einzelnen
Grundaufgaben zugehörigen Anzahlformeln herzuleiten; das Ergebnis ist:
Die Anzahlformeln (1a) und (1b) ergeben sich unmittelbar aus der Produktregel,
denn für alle i D 1; : : : ; k hat man zur Besetzung der i-ten Komponente eines k-
Tupels jeweils n Möglichkeiten zur Verfügung, wenn Wiederholungen erlaubt sind
() (1a)), und man hat jeweils .n i C 1/ Möglichkeiten zur Verfügung, wenn
Wiederholungen verboten sind und deshalb die i 1 Elemente, mit denen man die
Komponenten 1 bis i 1 besetzt hat, nicht mehr wählbar sind () (1b)).
Mithilfe des Zählens durch Bijektion und der Summenregel lassen sich (2b) auf
(1b) und (2a) auf (2b) zurückführen.
77
n
Dies ist eine Definition für die Binomialkoeffizienten k
.
1.2 Variation der Problemstellung 113
Zunächst sei M die Menge aller injektiven k-Tupel aus der n-Menge L. Dann
wird durch (
˛ und ˇ enthalten bis auf die
˛ ˇW ,
Reihenfolge die gleichen Elemente
jM j nŠ
aD D :
kŠ kŠ.n k/Š
.0; : : : ; 0; 1 ; 0; : : : ; 0; 1 ; : : : ; 0; : : : ; 0; 1 ; 0; : : : ; 0/
„ ƒ‚ … „ ƒ‚ … „ ƒ‚ … „ ƒ‚ …
1 2 n1 n
Also gibt es genau so viele k-Kollektionen aus der n-Menge L, wie es Möglich-
keiten gibt, aus den Platznummern f1; 2; : : : ; n C k 1g exakt k verschiedene
auszuwählen und die zugehörigen Plätze mit 0 zu besetzen – dies sind nach (2b)
aber genau nCk1
k
viele, womit auch (2a) begründet wäre.
Die Hauptschwierigkeit der Anwendung der bisher vorgestellten Zählregeln in
Problemstellungen der enumerativen Kombinatorik besteht in der Regel nicht darin,
die auf das Problem passenden Anzahlformeln auszuwählen – normalerweise wird
deutlich, ob in abzuzählenden k-Auswahlen Wiederholungen erlaubt sind und ob
es auf die Reihenfolge ankommt. Oft bereitet es aber Probleme, den Zählprozess so
zu strukturieren, dass die Produktregel und die Summenregel anwendbar werden;
zur Verdeutlichung dieser Problematik behandeln wir Zählaufgaben im Kontext des
originär US-amerikanischen Glücksspiels „Poker“, das in den letzten Jahren (zu-
mindest in einigen Varianten) auch in Deutschland populär geworden ist.
114 1 Heurismen der Variation
Das Blatt enthält mindestens zwei Karten gleichen Wertes (z. B. zwei oder mehr
Damen).
Das Blatt enthält fünf Karten nur einer Farbe (fünf Herzkarten, fünf Pikkarten,
fünf Karokarten oder fünf Kreuzkarten).
Das Blatt enthält fünf aufeinander folgende Kartenwerte (z. B. 8; 9; 10; Bube,
Dame), wobei das As nur als die niedrigste oder die höchste der fünf Karten
gewählt werden kann.
(Demnach sind As, 2; 3; 4; 5 und 10, Bube, Dame, König, As bewertet; Dame,
König, As, 2; 3 gelten nicht als fünf aufeinander folgende Kartenwerte und sind
daher nur dann bewertet, wenn alle Karten die gleiche Farbe haben).
78
Eine community card ist eine offen auf dem Tisch liegende Karte, die jeder Spieler als eine
Karte seiner Hand betrachten darf; eine wild card ist eine Jokerkarte, die jede beliebige der 52
Spielkarten repräsentieren kann.
79
Dabei erhält jeder Spieler 7 Karten, die er ungesehen verdeckt vor sich aufstapeln muss. Nach
einem simplen Verfahren, welches viele Gelegenheiten für Wetteinsätze bietet, werden alle Karten
nacheinander aufgedeckt. Der Spieler mit der höchsten einzelnen Karte gewinnt.
80
Sofern nicht durch vorgeordnete Spielregeln einer Pokerrunde anders geregelt, entscheidet je-
weils der durch Rotation wechselnde Kartengeber über die Variante von Poker, die als nächste
gespielt wird.
1.2 Variation der Problemstellung 115
(1) ONE PAIR (Z. B. zwei Damen und drei andere paarweise verschiede-
ne Karten ohne eine weitere Dame)
(2) TWO PAIRS (Z. B. zwei Achten, zwei Buben und eine von Acht und
Bube verschiedene Karte)
(3) THREE OF A KIND (Z. B. drei Siebenen und zwei von Sieben verschiedene
Karten unterschiedlicher Werte)
(4) STRAIGHT (Fünf aufeinander folgende Kartenwerte, aber nicht alle
von einer Farbe)
(5) FLUSH (Fünf Karten von nur einer Farbe, aber nicht in fünf auf-
einander folgenden Kartenwerten)
(6) FULL HOUSE (Ein Paar und ein Drilling, z. B. zwei Könige und drei
Zehnen)
(7) FOUR OF A KIND (Vier Karten gleichen Wertes, z. B. vier Asse, und eine
beliebige fünfte Karte)
(8) STRAIGHT FLUSH (Fünf aufeinander folgende Kartenwerte genau einer
Farbe)
(Der nicht aufgeführte ROYAL FLUSH ist ein Spezialfall von (8) mit den Karten-
werten 10, Bube, Dame, König, As. Die Pokerblattkategorie HIGH CARD soll hier
nicht zu den bewerteten Pokerblättern gezählt werden; hat kein Spieler ein bewer-
tetes Blatt, so gewinnt bei high games der Spieler mit der höchsten Karte.81 )
Ein Block (i) ist höher zu bewerten als ein Block (j), wenn es weniger Möglich-
keiten gibt, ein Pokerblatt aus Block (i) zusammenzustellen als es Möglichkeiten
gibt, ein Pokerblatt aus Block (j) zu konfigurieren; innerhalb eines jeden Blocks
entscheidet die Wertigkeit der Karten über die Reihenfolge der Blätter. Durch Aus-
zählen der einzelnen Blöcke werden wir nun feststellen, dass (1) bis (8) in dieser
Reihenfolge nach Wertigkeiten aufsteigend angeordnet sind.
Kategorie (1)
Man wähle zuerst
einen aus dreizehn Kartenwerten, der doppelt vorkommen soll;
dies ist auf 13
1 D 13 Arten möglich.
Anschließend wähle man zwei aus vier Karten dieses Werts aus, was auf 42 D 6
Arten geht. Aus den verbleibenden
zwölf anderen Kartenwerten wähle man zu-
nächst drei aus – dafür gibt es 12
3 D 220 Möglichkeiten –, und dann wähle man
für jeden einzelnen dieser
drei Werte jeweils eine aus vier Karten dieses Wertes aus,
wozu man jedesmal 41 D 4 Wahlmöglichkeiten hat.
Nach der Produktregel gibt es damit
13 6 220 43 D 1 098 240
Pokerblätter der Kategorie One Pair.
Man hätte auch anders zählen können: Genau dann hält man ein Pokerblatt der
Sorte One Pair, wenn man exakt vier verschiedene Kartenwerte auf der Hand hat
81
Haben zwei Spieler im direkten Vergleich denselben höchsten Kartenwert, entscheidet der
zweithöchste usw.
116 1 Heurismen der Variation
( 13 D 715 Möglichkeiten). Von diesen wähle man einen, der als Paar vorkommen
4
soll ( 41 D 4 Möglichkeiten), dann zwei aus vier möglichen Karten dieses Wertes
( 4 D 6 Möglichkeiten) und jeweils eine aus vier Karten der übrigen drei Werte (je
42
1
D 4 Möglichkeiten). Auch diese Zählmethode führt mit der Produktregel auf
So viel zur erforderlichen Strukturierung des Zählprozesses; die Anzahl der Po-
kerblätter in den Kategorien (2) bis (8) werden wir jetzt nur noch situationsange-
passt zählen.
Kategorie (2)
Zur Zusammenstellung eines Pokerblatts
der Kategorie Two Pairs wähle man drei
von dreizehn Kartenwerten aus ( 13 D 286 Möglichkeiten), entscheide sich für
3
zwei dieser drei, welche als Paare vorkommen sollen ( 32 D 3 Möglichkeiten),
wähle bei diesen jeweils zwei aus vier Karten aus (je 42 D 6 Möglichkeiten) und
lege sich auf eine von vier Karten des dritten Wertes fest ( 41 D 4 Möglichkeiten.
Damit ist
286 3 62 4 D 123 552
die Anzahl der Pokerblätter der Kategorie Two Pairs.
1.2 Variation der Problemstellung 117
Kategorie (3)
Ein Pokerblatt der Sorte Three Of A Kind konfiguriert man durch Auswahl drei-
er Kartenwerte (286 Möglichkeiten), von denen einer dreifach vorkommen soll (3
Möglichkeiten) und dafür drei aus vier möglichen Karten zu wählen sind (4 Mög-
lichkeiten). Für die beiden anderen Werte wähle man jeweils eine von vier Karten
aus (jeweils 4 Möglichkeiten). Insgesamt gibt es demnach
286 3 4 42 D 54 912
Kategorie (4)
Ein Straight ergibt sich, wenn man zunächst fünf aufeinander folgende Karten-
werte aussucht (10 Möglichkeiten, da als kleinste Karte einer 5er-Serie nur As,
2; 3; : : : ; 10 in Frage kommen, denn man darf nicht über das As hinaus zählen)
und dann für die einzelnen Karten jeweils eine von vier Farben wählt, wobei aber
nicht alle Karten die gleiche Farbe haben dürfen, weil sonst ein Pokerblatt vom Typ
Straight Flush entstünde (bleiben 45 4 D 1020 Möglichkeiten). Folglich gibt es
10 1020 D 10 200
Kategorie (5)
Zur Zusammenstellung eines Flush wählt man eine von vier Farben (4 Möglich-
keiten) und darin fünf nicht aufeinander folgende verschiedene Kartenwerte ( 13
5
13
10 D 1277 Möglichkeiten, denn 10 aus den 5 -vielen 5-Auswahlen sind fortlau-
fend). Insgesamt gibt es also
4 1277 D 5108
Kategorie (6)
Ein Pokerblatt
der Sorte Full House konfiguriert man durch Auswahl zweier Kar-
tenwerte ( 13
2 D 78 Möglichkeiten), von denen einer dreifach vorkommen soll (2
Möglichkeiten).
Für diesen sind dann drei aus vier möglichen
Karten zu wählen
( 43 D 4 Möglichkeiten), für den anderen zwei aus vier ( 42 D 6 Möglichkeiten).
Insgesamt gibt es demnach
78 2 4 6 D 3744
Kategorie (7)
Ein Pokerblatt des Typs Four Of A Kind erhält man, wenn man von einem Kar-
tenwert alle vier Karten auswählt (13 Möglichkeiten) und eine beliebige der noch
übrigen 48 Karten hinzufügt (48 Möglichkeiten). Folglich gibt es
13 48 D 624
Kategorie (8)
Es gibt (siehe oben) 10 Möglichkeiten, fünf aufeinander folgende Kartenwerte aus-
zusuchen, für jede davon kann eine von vier Farben gewählt werden. Also gibt es
10 4 D 40
1 098 240 C 123 552 C 54 912 C 10 200 C 5108 C 3744 C 624 C 40 D 1 296 420
bewertete Pokerblätter.
Dieses Resultat hätte man natürlich auch einfacher ermitteln können, frei nach
dem Motto: „In order to know how many friends you have, it might be helpful to
count your enemies!“, welches auf das Prinzip des komplementären Zählens an-
spielt.
1 302 540 unbewertete und somit 2 598 960 1 302 540 D 1 296 420 bewertete Po-
kerblätter.
Auffallend ist, dass die Anzahlen bewerteter und unbewerteter Pokerblätter an-
nähernd gleich sind; die Differenz liegt in der Größenordnung von 6000, sodass
man durch eine Abwandlung der Pokerregeln, welche die Anzahl bewerteter Poker-
blätter um etwa 3000 erhöht, auf einen nahezu perfekten Ausgleich hoffen kann.
Dazu bietet es sich an, die Anzahl der Straights um etwa 30 % zu erhöhen;
man könnte etwa erlauben, dass beim Straight über das As hinaus gezählt wer-
den darf, sodass auch fBube; Dame; König; As; 2g, fDame; König; As; 2; 3g und
fKönig; As; 2; 3; 4g als 5-Teilmengen aufeinander folgender Kartenwerte auftreten.
Auf diese Weise erhielte man als Anzahl S möglicher Straights:
S D 13 .45 4/ D 13 260 :
82
Jedes Pokerblatt, das mindestens eine Zwei enthält, ist offenbar bewertet, denn die Zwei als wild
card kombiniert sich mit jeder weiteren Karte auf der Hand des Spielers mindestens zu einem
Pokerblatt der Kategorie One Pair.
120 1 Heurismen der Variation
bewertete Pokerblätter für den Fall, dass mit dem Kartenwert Zwei als wild card
gespielt wird.
Darunter befindet sich auch eine neue Kategorie von bewertetem Pokerblatt,
nämlich FIVE OF A KIND; dies ist das am höchsten bewertete Pokerblatt dieser
Spielvariante, denn es gibt davon genau 672 Exemplare83 , während man 2552 Blät-
ter der Kategorie Straight Flush zusammensetzen kann (davon 32 ohne wild card,
544 mit genau einer wild card, 1320 mit genau zwei wild cards und 656 mit genau
drei wild cards)84 .
Offenbar wird hier ein Pokerblatt vom Typ „vier Zweien und eine weitere Kar-
te“ nicht zur Kategorie Straight Flush gezählt, obwohl man durch geeignete Wahl
von Repräsentanten für die vier wild cards einen Straight Flush erzeugen könnte.
Der Grund dafür ist, dass man zur Wahrung der paarweisen Elementefremdheit der
einzelnen Blöcke (! Anwendbarkeit der Summenregel!) jedes Blatt mit wild cards
nur einer Kategorie zuordnet, nämlich der höchsten85 durch geeignete Belegung
der wild cards erreichbaren Stufe.
Ist beim Auszählen von Mengenvereinigungen die paarweise Elementefremdheit
der einzelnen beteiligten Mengen nicht gegeben, so muss die Summenregel wie
folgt verfeinert werden, um eine passende Abzähltechnik zu gewinnen.
Nun kann man die Elementezahl von M nach der Summenregel bestimmen:
83
Davon überzeuge man sich am besten dadurch, dass man den Zählprozess nach der Anzahl der
verwendeten wild cards additiv zerlegt und die Summenregel verwendet.
84
Hier zähle man partitioniert nach der Anzahl der verwendeten wild cards und innerhalb eines
jeden dieser Blöcke in Abhängigkeit von dem niedrigsten von der wild card verschiedenen Karten-
wert. Beispiel:
Für Straight Flush mit exakt zwei wild cards und Acht als niedrigstem Kartenwert
gibt es 42 4 42 D 144 Möglichkeiten (zwei aus vier der Werte 9; 10; Bube; Dame, in vier Farben,
kombiniert mit zwei aus vier Zweien).
85
Zumindest dann, wenn man sich für ein möglichst gut bewertetes Blatt interessiert („high ga-
mes“).
1.2 Variation der Problemstellung 121
Wegen Mi D ŒMi n.M1 \M2 / [ .M1 \M2 / für i D 1; 2 bietet es sich aber an, zur
Berechnung von jM j die Summe jM1 j C jM2 j zu bilden und zu berücksichtigen,
dass in dieser Summe die Elemente von M1 \ M2 zweimal gezählt werden, sodass
sich
jM j D jM1 j C jM2 j jM1 \ M2 j
ergibt.
Die oben vorgenommene Umstrukturierung von M und die dazu passende Ab-
zähltechnik lässt sich auf die Auszählung der Vereinigungsmenge von n endlichen
Mengen verallgemeinern (! Generalisierung).
Satz (Siebformel)
Es sei M D M1 [ M2 [ [ Mn die Mengenvereinigung der endlichen Mengen
M1 ; : : : ; Mn . Dann gilt
ˇ ˇ
X
n X ˇˇ \ ˇ
ˇ
jM j D .1/i C1 ˇ Mj ˇ ;
ˇ ˇ
i D1 J 2Pi .N / ˇj 2J ˇ
Die Leistungsfähigkeit des Zählprinzips der Inklusion und Exklusion soll nun an
einigen Beispielen aus der elementaren Zahlentheorie demonstriert werden.
'W N ! N
m 7! '.m/ WD jfk 2 f1; : : : ; mg j ggT.k; m/ D 1gj ;
welche jeder natürlichen Zahl m die Anzahl der zu m teilerfremden Zahlen k mit
1 k m zuordnet, trägt den Namen E ULERsche '-Funktion.
Diese Funktion spielt in der Zahlentheorie eine große Rolle; man denke etwa an
den Satz von Euler/Fermat86 und seine zahlreichen Konsequenzen.
Wie kann man die Werte '.m/ aus den Primfaktorzerlegungen der Zahlen m
bestimmen?
Offenbar gilt '.1/ D 1 und '.p/ D p 1, wenn p eine Primzahl ist. Auch
für Primzahlpotenzen p ˛ , ˛ 2 N lässt sich '.p ˛ / leicht durch Abzählen bestim-
men: Jede p-te der Zahlen 1; : : : ; p ˛ ist durch p teilbar, alle anderen sind zu p
teilerfremd. Daher gilt
1
'.p ˛ / D p ˛ p ˛1 D p ˛ 1 :
p
Unter Verwendung der Tatsache, dass ' multiplikativ87 ist, erhält man daraus sofort
das gewünschte Resultat. Hat m 2 N die kanonische Primfaktorzerlegung m D
p1˛1 p2˛2 pn˛n , so gilt
1 1 1 1
'.m/ D p1˛1 1 pn˛n 1 Dm 1 1 :
p1 pn p1 pn
86
Danach ist stets a'.m/
1 mod m, wenn die Zahlen a und m teilerfremd sind. Für Primzahlen
m geht dieser Satz auf F ERMAT zurück, der allgemeine Fall wurde von E ULER bewiesen.
87
Eine von der Nullfunktion verschiedene zahlentheoretische Funktion f heißt multiplikativ,
wenn für teilerfremde a; b stets f .ab/ D f .a/f .b/ gilt.
1.2 Variation der Problemstellung 123
Der Nachweis der Multiplikativität von ' ist aber nach meinen persönlichen Erfah-
rungen bei den Studierenden nicht sehr beliebt, obwohl er lediglich auf einer ge-
eigneten Strukturierung des Abschnitts f1; : : : ; abg der natürlichen Zahlen beruht,
bei der die zwischen 1 und ab gelegenen Repräsentanten der einzelnen Restklassen
mod b spaltenweise nach Restklassen separiert in ein rechteckiges Zahlenschema
eingetragen werden.
Die Berechnung von '.m/ aus der Primfaktorzerlegung von m ist aber auch
über das komplementäre Zählen in Verbindung mit dem rekursiven Zählen und der
Siebformel möglich.
Sind nämlich p1 ; : : : ; pn die verschiedenen Primteiler von m und ist M WD
f1; 2; : : : ; mg, so ist ein Element k der Menge M genau dann nicht teilerfremd
zu m, wenn die Teilermenge Tk von k mindestens eine der Primzahlen p1 ; : : : ; pn
enthält. Für i D 1; : : : ; n bezeichne nun Mi WD fk 2 M j pi 2 Tk g die Menge aller
durch pi teilbaren Zahlen von M . Dann definiert die Mächtigkeit der Mengenver-
einigung M1 [ [ Mn die Anzahl der nicht zu m teilerfremden Zahlen von M ,
woraus sich
'.m/ D m jM1 [ [ Mn j
ergibt. Zur Berechnung von jM1 [ [ Mn j mithilfe der Siebformel brauchen wir
Informationen über die Elementezahlen der Durchschnitte von jeweils i der Mengen
M1 ; : : : ; Mn (1 i n). Ist aber J 2 Pi .N / eine i-elementige Teilmenge von
N D f1; : : : ; ng mit J D fj1 ; : : : ; ji g, so gilt
ˇ ˇ
ˇ ˇ
ˇ\ ˇ ˇ ˇ m
ˇ Mj ˇ D ˇMj \ Mj \ \ Mj ˇ D ;
ˇ ˇ j2 pji
1 2 i
ˇj 2J ˇ pj1 p
was sich durch rekursives Zählen ermitteln lässt: Jede pj` -te der Zahlen aus M ,
die durch jede der Primzahlen p1 ; : : : ; pj`1 teilbar sind, ist auch durch pj` teilbar
.2 ` i/, also ist
ˇ ˇ ˇ ˇ
ˇMj \ Mj \ \ Mj ˇ D ˇMj \ Mj \ \ Mj ˇ 1 .2 ` i/ ;
1 2 ` 1 2 `1
pj`
und es gilt jMj1 j D m
pj1 . Also ist
'.m/ D m jM1 [ [ Mn j
ˇ ˇ
ˇ ˇ
X
n X ˇ\ ˇ
Dm .1/i C1 ˇ Mj ˇ
ˇ ˇ
i D1 J 2Pi .N / ˇj 2J ˇ
X
n X m
DmC .1/i Q
i D1 j 2J pj
J 2Pi .N /
2 3
1 X 1 X 1
D m 41 C C .1/n 5
p
1j1 n j1
p p
1j1 <j2 n j1 j2
p1 2 : : : pn
p
1 1
Dm 1 1 ;
p1 pn
124 1 Heurismen der Variation
wobei der Übergang von der vorletzten zur letzten Gleichung dieser Kette besser in
umgekehrter Richtung verstanden werden kann (Ausmultiplizieren der Klammern
nach dem Distributivgesetz).
wobei .i / jeweils die Nummer der Kugel angibt, welche beim i-ten Zug gezogen
wird (1 i n). Eine solche Permutation beschreibt offenbar genau dann ein
dérangement, wenn .i / ¤ i für alle i 2 f1; : : : ; ng gilt, wenn also fixpunktfrei
ist. Folglich ist für jedes n 2 N die n-te Rencontre-Zahl Dn durch die Anzahl der
fixpunktfreien Permutationen in Sn gegeben (Zählen durch Bijektion).
Sei jetzt Mi WD f 2 Sn j .i / D ig die Menge aller Permutationen
S in Sn
mit dem Fixpunkt i (1 i n). Dann ist Dn D jSn j j niD1 Mi j, und zur
Berechnung des Subtrahenden mit der Siebformel benötigen wir Informationen
über die Elementezahlen der Durchschnitte von jeweils i der Mengen M1 ; : : : ; Mn
(1T i n). Für jede feste i-Teilmenge J der Menge N WD f1; : : : ; ng gilt aber
j j 2J Mj j D .n i/Š, denn jede Permutation 2 Sn mit den i Fixpunkten aus J
legt umkehrbar eindeutig eine Permutation der .n i/-elementigen Menge N n J
88
Essai d’Analyse sur les Jeux de Hazard, Paris 1708.
1.2 Variation der Problemstellung 125
Aus dieser expliziten Angabe der Rencontre-Zahlen lässt sich leicht eine rekursive
Definition der Folge .Dn /n2N herleiten: Es ist D1 D 0, und für n 2 gilt
!
X n
.1/i X
n1
.1/i .1/n
Dn D nŠ D n .n 1/Š C D n Dn1 C .1/n :
i D0
iŠ i D0
iŠ nŠ
Eine weitere rekursive Definition der Folge .Dn /n2N ist durch
Der Anteil der fixpunktfreien unter allen Permutationen einer n-Menge ist dem-
Pn .1/i
nach jS Dn
nj
D i D0 i Š – diese Summenfolge konvergiert für n ! 1 gegen
exp.1/ D e , wobei e die E ULERsche Zahl ist.89 Für große n ergibt sich deshalb
1
Wenn man also für n verschiedene politische Ausschüsse (die offenbar in genü-
gend großer Zahl vorhanden sind) n thematisch unterschiedliche Sitzungsvorlagen
erstellt, diese aber zufällig auf die einzelnen Sitzungszimmer verteilt, dann besteht
eine Wahrscheinlichkeit von annähernd 63 % dafür, dass zumindest in einer der Sit-
zungen nicht am Thema vorbei diskutiert wird . . .
P1 xi
89
Die Exponentialreihe iD0 iŠ ist für jedes x 2 R konvergent zum Grenzwert exp.x/.
126 1 Heurismen der Variation
Als letztes Beispiel zur Siebformel beweisen wir die Formel für die Anzahl zm .r/
der surjektiven Abbildungen einer m-Menge auf eine r-Menge, von der bei der
Behandlung des Beispiels 1.32 die Rede war.
zm .r/ D r m jM1 [ [ Mr j :
und Exklusion
zm .r/ D r m jM1 [ [ Mr j
ˇ ˇ
ˇ ˇ
X
r X ˇ\ ˇ
Dr
m
.1/kC1 ˇ ˇ
ˇ Mj ˇ
kD1 ˇ
J 2Pk .N / j 2J ˇ
X
r X
D rm C .1/k .r k/m
kD1 J 2Pk .N /
!
X
r
r
Dr Cm
.1/
k
.r k/m
k
kD1
!
X
r
r
D .1/k .r k/m
k
kD0
Das Prinzip der Inklusion und Exklusion greift nicht nur bei der Bestimmung
von Anzahlen, sondern lässt sich auf die Bestimmung der Werte solcher Funktio-
nen P auf einem System endlicher Mengen verallgemeinern, die (wie speziell die
Anzahlfunktion) additiv sind, für die also
X
P .M / D P .fmg/ ; M endliche Menge
m2M
jRa j und sb WD jSb j die Mächtigkeiten der Fasern, so gilt für die Elementezahl
von I : X X
ra D jI j D sb :
a2A b2B
Die vom Prinzip des doppelten Zählens reflektierte Strukturierung der Menge I
wird in Abb. 1.59 verdeutlicht.
Abb. 1.59 Inzidenztafel I b1 b2 b3 b4 b5
a1 × ×
a2 ×
a3 × ×
a4 × × ×
Als binäre Relation ist I eindeutig durch die zugehörige Inzidenztafel festgelegt.
Hier werden in einem Rechtecksschema die Elemente von A als Zeilenkoordinaten
und die Elemente von B als Spaltenkoordinaten eingetragen, dann notiert man eine
Markierung (beispielsweise ein ) im Feld mit den Koordinaten .ai ; bj /, falls ai
mit bj inzidiert, womit die Situation .ai ; bj / 2 I sprachlich umschrieben wird;
Abb. 1.59 zeigt exemplarisch die Inzidenztafel der Relation
Offenbar stimmt jI j mit der Anzahl der Kreuzchen in der Inzidenztafel von I
überein, die man unter anderem sowohl zeilenweise als auch spaltenweise zählen
könnte, wobei jI j eine Invariante der Variation der Abzähltechnik ist. Nun finden
sich in der Zeile mit der Zeilenkoordinate ai aber jeweils genau rai Kreuzchen
(eines in jeder Spalte mit einer Spaltenkoordinate bj , welche zur Faser von I über ai
gehört), analog sind in der Spalte mit der Spaltenkoordinate bj genau sbj Kreuzchen
eingetragen. P
Zeilenweises Auszählen der Markierungen realisiert demnach P jI j D a2A ra ,
spaltenweises Auszählen der Markierungen
P realisiert jI j D b2B sb .
P
Im Allgemeinen sind nun a2A ra und b2B sb Funktionen von jAj und jBj,
sodass man von der Feststellung
X X
. / ra D jI j D sb
a2A b2B
Bei Interpretation von . / als Bestimmungsgleichung für jAj oder jBj kann man
möglicherweise eine dieser Mächtigkeiten bestimmen, wenn man die andere
kennt (Beispiel 1.43).
1.2 Variation der Problemstellung 129
Dabei wird zwischen zwei Dominosteinen nicht unterschieden, wenn sie durch
eine eigentliche Bewegung ineinander überführt werden können.
Wie viele verschiedene Domino-Steine gibt es?
Zur Klärung der Vorschriften noch einmal ein Beispiel:
Abb. 1.60 Existieren-
de, nicht existierende und
miteinander identifizierte
Dominosteine
Mithilfe des Prinzips des doppelten Zählens könnte man die Aufgabe folgender-
maßen lösen:
Zwischen der Menge A aller Dominosteine und der Menge B D f0; 1; 2; : : : ; 6g
aller Augenzahlen erkläre man die Relation I durch
1
jAj D jBj.jBj C 1/
2
für jAj, woraus sich jAj bestimmen lässt, wenn jBj bekannt ist. Für jBj D 7 erhält
man jAj D 28.
1X
n
.1/ C .2/ C C .n/
.n/ WD D .k/
n n
kD1
ist hingegen nur geringen Schwankungen unterworfen, denn es gilt für alle n 2 N:
90
Die Teilermenge einer Primzahlpotenz p k ist durch Tpk D f1; p; p 2 ; : : : ; p k g gegeben.
1.2 Variation der Problemstellung 131
.a; b/ 2 In , a j b
definierte Relation zwischen An und Bn . Die Inzidenztafel von In ist von der in Abb.
1.61 beschriebenen Form, wobei in der letzten Spalte insgesamt .n/ Kreuzchen
einzutragen wären, aber nur für zwei davon ohne konkrete Festlegung der Zahl n
feststeht, wo sie notiert werden müssen.
2 × × × × ...
3 × × ...
4 × × ...
5 × ...
6 × ...
7 × ...
8 × ...
.. .. ..
. . .
n ×
Für a 2 An besteht die Faser von In über a aus allen Vielfachen von a zwischen
a und n, d. h. es ist Ra D Va \ Bn und ra D Œ na , wenn durch Œx die größte ganze
Zahl t mit t x bezeichnet wird.
Zählt man die Inzidenzen zeilenweise, erhält man also
n h i
X n
jI j D :
k
kD1
X
n
jI j D .k/ ;
kD1
denn für b 2 Bn besteht die Faser von In1 über b aus allen positiven Teilern von b,
sodass Sb mit der Teilermenge Tb übereinstimmt und deshalb sb D .b/ gilt.
Hier führt das Prinzip des doppelten Zählens auf eine Näherungsformel für die
mittlere Teileranzahl .n/ der ersten n natürlichen Zahlen:
132 1 Heurismen der Variation
Wegen
n h i n ˇh i
X X X n ˇˇ
n
n n ˇ n
D C n mit jn j ˇ ˇn1Dn
k k k k
kD1 kD1 kD1
erhält man
1X 1 X hni
n n
1
.n/ D .k/ D jI j D
n n n k
kD1 kD1
ˇ ˇ
Xn
1 n ˇ n ˇ
D C mit ˇˇ ˇˇ 1 :
k n n
kD1
fW Œ1; n ! R
x 7! x1
X
n Z n
X
n1
1 1 1 1
hn 1 D < dx D ln.n/ < D hn :
k x k n
kD2 1 kD1
oder auch
.n/ D ln.n/ C ın mit jın j < 2 :
X X
n X
n
jI j D sb D skC1 D km :
b2B kD0 kD0
Zur Gewinnung einer Summenformel für die m-ten Potenzen muss man nun wie
üblich jI j auf eine andere Art zählen und die Invarianz der Mächtigkeit von I unter
dem Wechsel der Zähltechnik ausnutzen. Diesmal hilft es im Gegensatz zu den
bisher behandelten Beispielen aber nicht, zum Vergleich die Zahl der Inzidenzen
durch zeilenweises Auszählen der Inzidenztafel zu bestimmen!
Ist nämlich a D .a1 ; : : : ; am / 2 A, so gilt für die Faser Ra von I über a:
Ra D ; .) ra D 0/ im Fall kak1 D n C 1 ;
Ra D fn C 1g .) ra D 1/ im Fall kak1 D n ;
Ra D fn C 1; ng .) ra D 2/ im Fall kak1 D n 1 ;
Ra D fn C 1; n; n 1g .) ra D 3/ im Fall kak1 D n 2 ;
:: :: :: ::
: : : :
Ra D fn C 1; n; n 1; : : : ; 2g .) ra D n/ im Fall kak1 D 1 :
k wird von mindestens einer der Komponenten a1 ; : : : ; am von a als Wert ange-
nommen.
Keine der Komponenten von a ist mit einem der Werte k C 1; : : : ; n C 1 belegt.
91
Es ist kak1 WD max.ja1 j; : : : ; jam j/ D max.a1 ; : : : ; am / für alle a D .a1 ; : : : ; am / 2 A.
134 1 Heurismen der Variation
Mit diesen Informationen lässt sich die Inzidenztafel von I zeilenweise auszäh-
len, und man erhält:
X
jI j D ra
a2A
X
n
D .k m .k 1/m / .n C 1 k/
kD1
X
n X
n
D k m .n C 1 k/ .k 1/m .n C 1 k/
kD1 kD1
X
n1 X
n1
D nm C k m .n C 1 k/ k m .n k/
kD1 kD0
X
n1
D nm C k m .n C 1 k .n k//
kD1
X
n1 X
n
D nm C km D km :
kD1 kD0
Damit ist leider nichts gewonnen; dasselbe Resultat ergab sich beim spaltenweisen
Auszählen der Inzidenzen. Deshalb müssen die Inzidenzen auf eine andere Weise
gezählt werden, denn der Vergleich zwischen dem zeilenweisen und spaltenweisen
Auszählen der Inzidenztafel führt in diesem Beispiel nicht zum Ziel.
Zu diesem Zweck betrachten wir für 1 r m die Mengen
˚ ˇ
Mr WD a D .a1 ; : : : ; am / 2 A ˇ jfa1 g [ fa2 g [ [ fam gj D r :
Jedes Mr enthält genau diejenigen m-Tupel aus A, deren Komponenten sich aus
exakt r verschiedenen Elementen der Menge B zusammensetzen. Folglich ist A D
M1 [ [ Mm eine Partition von A, so dass für jedes feste b 2 B
[
Sb D fa 2 A j .a; b/ 2 I g D fa 2 Mr j .a; b/ 2 I g
1rm
sowie
X
m
sb D jfa 2 Mr j .a; b/ 2 I gj
rD1
und diese Art des Zählens führt auf die gewünschte Formel.
1.2 Variation der Problemstellung 135
Um dies einzusehen, wähle man ein festes r 2 f1; : : : ; mg und betrachte nach-
einander absteigend die Anzahlen der Inzidenzen von b D n C 1; b D n; : : : ; b D 1
mit Elementen von Mr :
b D n C 1 inzidiert mit zm .r/ nr Elementen von Mr , denn:
Zunächst gibt es nr viele r-Teilmengen von B, in denen das Element nC1 nicht
vorkommt und aus denen sich deshalb die Werte der m-Tupel a 2 Mr , die mit
b D n C 1 inzidieren, zusammensetzen dürfen. Für jede r-Menge fx1 ; : : : ; xr g
existieren aber zm .r/ viele m-Tupel aus fx1 ; : : : ; xr g mit der Eigenschaft, dass
jedes xi in mindestens einer Komponente des m-Tupels als Wert auftritt, denn
jedes solche m-Tupel definiert umkehrbar eindeutig eine surjektive Abbildung
von f1; : : : ; mg auf fx1 ; : : : ; xr g.
b D n inzidiert mit zm .r/ n1 Elementen von Mr , denn:
r
Es gibt n1 r viele r-Teilmengen von B, in denen die Elemente n C 1 und n
nicht vorkommen und aus denen sich deshalb die Werte der m-Tupel a 2 Mr ,
die mit b D n inzidieren, zusammensetzen dürfen. Für jede dieser r-Teilmengen
fx1 ; : : : ; xr g existieren zm .r/ viele m-Tupel aus fx1 ; : : : ; xr g mit den verlangten
Eigenschaften (s. o.).
:::
b D r C 1 inzidiert mit zm .r/ rr Elementen von Mr , denn:
Die einzige r-Teilmenge von B, in denen die Elemente n C 1; n; n 1; : : : ; r C 1
nicht vorkommen und aus denen sich deshalb die Werte der m-Tupel a 2 Mr ,
die mit b D r C 1 inzidieren, zusammensetzen dürfen, ist f1; : : : ; rg. Es gibt
zm .r/ viele m-Tupel aus f1; : : : ; rg mit den verlangten Eigenschaften.
Ist b r, so gibt es keine Inzidenzen von b mit a 2 Mr , denn für alle a 2 Mr
gilt kak1 r b.
wobei die letzte Identität eine leicht zu beweisende Eigenschaft der Binomialkoef-
fizienten ist92 . Insgesamt erhalten wir
! !
Xm Xn Xm
nC1
jI j D jfa 2 Mr j .a; k C 1/ 2 I gj D zm .r/
rD1 rD1
r C1
kD0
92
Für n r ist nichts zu zeigen, für n > r kann man einen Beweis durch
vollständige
Induktion
über n führen, der im Induktionsschritt die bekannte Beziehung nC1rC1
C nC1
r
D nC2rC1
benutzt,
die den zeilenweisen Aufbau des Pascalschen Dreiecks ermöglicht. Im Anschluss an Beispiel 1.45
zählen wir jI j auf eine weitere Weise und geben damit einen anderen Beweis mithilfe des Prinzips
des doppelten Zählens.
136 1 Heurismen der Variation
Auch die letztlich zielführende Abzählung der Inzidenzen in Beipiel 1.45 orien-
tierte sich an der Faserung der Inzidenztafel; wenn man sich davon löst, lassen sich
die Inzidenzen wesentlich unkomplizierter zählen.
Man erkläre dazu in der Menge I A B eine Äquivalenzrelation durch
(Man beachte, dass wegen kak1 < b für .a; b/ 2 I offenbar b nicht Element der
Menge fa1g [ fa 2 g [ [ fam g ist.)
Da es nC1 rC1
viele .r C 1/-Teilmengen von B gibt, existieren auch nC1 rC1
viele Äquivalenzklassen Œ.a; b/ mit a 2 Mr (Zählen durch Bijektion). Je-
de einzelne dieser Klassen enthält zm .r/ Elemente, denn jedes m-Tupel a0 D
.a10 ; : : : ; am
0
/ 2 Mr bestimmt umkehrbar eindeutig eine surjektive Abbildung der
m-Menge f1; : : : ; mg auf die r-Menge fa10 g [ fa20 g [ [ fam 0
g. Laut Produktregel
gibt es demnach !
X n Xm
nC1
k D jI j D
m
zm .r/
rD1
r C1
kD0
Inzidenzen.
(D) Schubfachprinzip
Auch beim nun vorgestellten Prinzip der enumerativen Kombinatorik steht nicht
das Zählen selbst, sondern der Erkenntnisgewinn durch Zählen im Vordergrund.
1.2 Variation der Problemstellung 137
Verteilt man n Gegenstände auf k Schubfächer und gilt dabei k < n, dann gibt
es am Ende wenigstens ein Fach, in dem sich mindestens zwei Gegenstände be-
finden.
Bekannten unter den Personen, die sich momentan im Hotel aufhalten93 . Wie ist
das möglich?
Es sei X die Menge aller Personen, die sich zu einem beliebig, aber fest ge-
wählten Zeitpunkt im Hotel aufhalten, und es sei jXj DW n 2 N. Ferner bezeichne
f W X 7! f0; : : : ; n 1g diejenige Abbildung, welche jeder Person x 2 X die
Anzahl ihrer Bekannten unter den Menschen von X zuordnet; dann ist Y WD f .X/
eine k-Teilmenge von f0; : : : ; n 1g mit k < n, wie man folgendermaßen einsehen
kann:
Ist 0 2 f .X/, so gibt es eine Person x 2 X, die sonst niemanden kennt. Dann
folgt aber n 1 … f .X/, denn jemand, der n 1 Bekannte unter den n Personen
aus X hätte, müsste auch mit x bekannt sein. Ist umgekehrt n 1 2 f .X/, so gibt
es eine Person x 0 2 X, die mit allen anderen bekannt ist. Da jeder x 0 kennt, hat
niemand 0 Bekannte, also ist 0 … f .X/.
Damit ist f W X ! Y eine Abbildung von einer n-Menge in eine k-Menge
mit k < n, und nach dem Schubfachprinzip existiert mindestens ein y0 2 Y mit
jf 1 .y0 /j 2. Sind dann x1 ; x2 2 f 1 .y0 /, x1 ¤ x2 , so ist f .x1 / D f .x2 / D y0 ,
also haben x1 und x2 beide y0 viele Bekannte unter den Personen aus X.
93
Dabei sei vorausgesetzt, dass sich stets mindestens zwei Personen im Hotel aufhalten; ebenso,
dass die Relation „ist Bekannter von“ symmetrisch ist: Zwar kennt man den Promi an der Bar, aber
zu seinen Bekannten darf man ihn dann und nur dann zählen, wenn man auch ihm bekannt ist!
1.2 Variation der Problemstellung 139
94
In Anspielung auf die orientalischen Märchen, mit denen S CHEHERAZADE ihren König 1001
Nächte hindurch unterhielt, ist die Zahl 1001 bei den Wuppertaler Studierenden des Grund-
schullehramts als „Märchenzahl“ eingeführt, deren Primfaktorzerlegung 1001 D 7 11 13 man
möglichst auswendig wissen sollte.
140 1 Heurismen der Variation
n1 n1
jXj jY j Dk D n 1 < n D jXj ;
k k
was offenbar nicht möglich ist. Da die kleinste ganze Zahl größer als n1
k aber durch
Œ n1
k C 1 gegeben ist, lässt sich folgende schärfere Fassung des Schubfachprinzips
formulieren:
(S1) Verteilt man n Gegenstände auf k Schubfächer und gilt dabei k < n, dann
gibt es am Ende wenigstens ein Fach, in dem sich mehr als n1k
Gegenstände
befinden.
(S2) Will man bei der Verteilung von n Gegenständen auf k Schubfächer sicher
sein, dass sich am Ende in wenigstens einem Fach mindestens m Gegenstände
befinden, dann braucht man n .m 1/k C 1 Gegenstände.
Auch für die Verwendung der präziseren Version des Schubfachprinzips möchte ich
zwei Beispiele angeben.
1 1 2 2 3 3 4 4
0; 1Œ D 0; [ ; [ ; [ ; [ ;1
5 5 5 5 5 5 5 5
DW I1 [ I2 [ I3 [ I4 [ I5
1.2 Variation der Problemstellung 141
[
5
Qı D I
I DW Q
;D1
95
Die Koautorenschaft-Distanz zu E RDÖS wird augenzwinkernd mit der sog. „Erdös-Zahl“ ge-
messen: E RDÖS selbst hat die Erdös-Zahl 0, jeder seiner 504 Koautoren aus gemeinschaftlichen
Arbeiten hat die Erdös-Zahl 1. Hat jemand nicht mit E RDÖS zusammen publiziert, aber eine Ar-
beit mit einem seiner Koautoren geschrieben, bekommt er die Erdös-Zahl 2 usw. Mehr als 200 000
Mathematiker haben eine Erdös-Zahl kleiner oder gleich 5.
142 1 Heurismen der Variation
den Rest ihres langen Lebens gemeinsam, seit 1948 in Australien; beide starben
eines natürlichen Todes am 28.08.2005 im Abstand von 30 Minuten.
Die von E RDÖS und S ZEKEREZ bei ihrer Lösung des Problems verwendete
Verallgemeinerung des Schubfachprinzips ist der Satz von Ramsey96 , den man in-
klusive seiner Anwendung auf das Happy Ending Problem in der Literatur findet.97 ;
für den Nachweis der Existenz monotoner Teilfolgen der Länge k C 1 in beliebigen
Zahlenfolgen der Länge k 2 C 1 ist aber die verschärfte Version des Schubfachprin-
zips wie oben formuliert ausreichend.
Für 1 i k 2 C 1 bezeichne `i die Länge (Elementezahl) der längsten beim
Folgenglied ai beginnenden monoton wachsenden Teilfolge von a1 ; : : : ; ak 2 C1 .
Existiert ein i 2 f1; : : : ; k 2 C 1g mit `i k C 1, so haben wir eine monoton
wachsende und damit eine monotone Folge der erforderlichen Länge gefunden.
Ist jedoch `i k für alle i D 1; : : : ; k 2 C 1, dann existiert laut Schubfachprinzip
(verschärfte Version) zur Abbildung
Für ein solches s 2 f1; : : : ; kg mit `1 .s/ D fj1 ; : : : ; jkC1 g und j1 < j2 < <
jkC1 ist aj1 ; aj2 ; : : : ; ajkC1 eine Teilfolge der Länge k C 1 von a1 ; : : : ; ak 2 C1 ; die-
se Teilfolge ist aber monoton fallend, denn wäre für irgendein
2 f1; : : : ; kg die
Ungleichung aj
< aj
C1 erfüllt, dann ließe sich die bei aj
C1 beginnende monoton
wachsende Teilfolge der Länge s durch Voranstellen des Folgenglieds aj
< aj
C1
zu einer bei aj
beginnenden monoton wachsenden Teilfolge der Länge s C 1 er-
gänzen, was der Bedingung `.j
/ D s widerspräche.
Damit ist für den Fall, dass a1 ; : : : ; ak 2 C1 keine monoton wachsende Teilfolge
der Länge k C 1 besitzt, eine monoton fallende Teilfolge der Länge k C 1 ge-
funden; in jedem Fall existiert also eine monotone Teilfolge der Länge k C 1 von
a1 ; : : : ; ak 2 C1 .
Verteile die Objekte möglichst gleichmäßig – also mit maximaler Symmetrie – auf die vor-
handenen Schubfächer
96
Benannt nach dem Philosophen und Mathematiker F RANK P LUMPTON R AMSEY (1903–1930).
97
H ALDER / H EISE : Einführung in die Kombinatorik. Carl Hanser Verlag, München (1976).
1.2 Variation der Problemstellung 143
oder aber:
Versuche, maximal viele Elemente auf die Schubfächer aufzuteilen, ohne dass ein Schubfach
mehr als q viele Elemente enthält.
Zur Verdeutlichung dieser Position ein letztes Beispiel, in dem wir maximal viele
Gegenstände auf verschiedene Schubladen so verteilen, dass am Ende keine Schub-
lade mehr als einen Gegenstand enthält.
f .z/ f .w/ D a1 .z w/ C a2 .z 2 w 2 / C C an .z n w n /
und
j 1
X
.z w / D .z w/
j j
z j 1k w k für alle j 2 N :
kD0
In Abschn. 1.2 wird unter dem Primat der Variation eine Systematik von Heurismen
vorgestellt, die in erster Linie der Phase II („Ausdenken eines Plans“) in P ÓLYAs
Phasenschema des Problemlöseprozesses zuzuordnen sind, die aber auch Rückwir-
kungen auf Phase I („Verstehen der Aufgabe“) haben können, wenn die Prüfung
von Lösungsansätzen deutlich macht, dass das Verständnis der Problemsituation
noch nicht abgeschlossen ist.
Jede Lösungsplanung beginnt in natürlicher Weise mit der Untersuchung der
Frage, ob das vorliegende Problem irgendwelche Gemeinsamkeiten mit Aufgaben-
stellungen aufweist, deren Lösungen dem Problemlöser individuell vertraut sind.
Das gezielte Aufsuchen struktureller Gemeinsamkeiten mit bereits gelösten Proble-
men wird durch die heuristischen Tätigkeiten
Äquivalentes Umformulieren
Analogisieren
144 1 Heurismen der Variation
unterstützt, wobei in jedem einzelnen Fall zu prüfen ist, inwieweit der Transfer
eines Lösungsansatzes einer analogen Problemstellung auf das Originalproblem
möglich ist.
Ein Erfolg versprechendes Denkmuster bei der Analogiebildung ist die Ana-
logiebildung durch Restriktion, welche als Analogisierung unter Beachtung des
Extremalprinzips eingeordnet werden kann.
Jede Umformulierung eines Problems bewirkt (und wird wirksam durch) ei-
ne veränderte Problemwahrnehmung. Diese lässt sich aber auch dadurch errei-
chen, dass man sich die Gesetzmäßigkeiten seiner persönlichen Wahrnehmung eines
Problems bewusst macht – Hinweise auf die mentalen Verarbeitungsprozesse, die
beim Zusammenfügen einzelner Sinneseindrücke zu einer wahrgenommenen En-
tität durchlaufen werden, geben die wichtigsten Gesetze der Gestalttheorie – und
dann die Problemdaten zielgerichtet umstrukturiert. Dies charakterisiert die heuris-
tische Strategie der
Wenn es nicht bei der Umstrukturierung der Problemdaten bleibt, sondern Trans-
formationen der Daten vorgenommen werden, kommt ein Heurismus von immenser
Tragweite ins Spiel, nämlich das Invarianzprinzip. Dabei kann es sich um pro-
bleminhärente Transformationen handeln, die im Kontext der Aufgabenstellung
vorgegeben sind; in diesem Fall empfiehlt das Invarianzprinzip, Eigenschaften oder
Zusammenhänge zu suchen, die sich unter den gegebenen Transformationen nicht
ändern, die also Invarianten der gegebenen Transformationen sind. Es kann sich
aber auch um Transformationen handeln, die vom Problemlöser als tool eingesetzt
werden, weil sie im Problemkontext vorgegebene Relationen und Eigenschaften in-
variant lassen; die Suche nach solchen Transformationen ist ebenfalls heuristisches
Handeln im Sinne des Invarianzprinzips. Beide Ausprägungen des Invarianzprin-
zips:
um aus dem Studium der vertauschbaren Teile Nutzen für die Lösung des Problems
ziehen zu können; speziell bei geometrischen Problemstellungen bietet es sich aber
an, die vertrauten Deckabbildungsgruppen zur Charakterisierung der Symmetrien
zu verwenden.
Symmetrien in geometrischen Problemkontexten sind meist offenkundig oder
lassen sich durch marginale Modifikationen (Einzeichnen von Hilfsfiguren etc.)
leicht aufdecken. Versteckten Symmetrien in anderen mathematischen Gegenstands-
bereichen kann man eventuell durch eine Repräsentation der jeweiligen Problem-
stellung im Begriffssystem der Geometrie (! Variation der Darstellung) auf die
Spur kommen.
In Form des von P ÓLYA formulierten Prinzips des nichtzureichenden Grundes
tritt das Symmetrieprinzip im Zusammenhang mit mathematischen Strategiespielen
auf. Bisweilen ermöglicht es dort die explizite Konstruktion von Gewinnstrategi-
en, zumindest aber können unter gewissen Bedingungen an die Spielregeln nicht-
konstruktive Existenzbeweise für Gewinnstrategien geführt werden.
Zwei zueinander duale Heurismen, deren Zielrichtung es ist, aus der Variati-
on des Allgemeinheitsgrades einer Problemstellung Lösungsansätze zu entwickeln,
sind
Bei ihrer Verwendung treten zwei Phänomene auf, die leicht falsch eingeschätzt
werden:
(1) Die Verallgemeinerung einer Aufgabenstellung kann den Prozess der Lösungs-
findung vereinfachen, indem sie den Blick auf neue Einsichten freilegt, wenn
unnötige Restriktionen aus der Problemstellung eliminiert werden.
(2) Die Spezialisierung einer Problemstellung ist nicht notwendig mit so vielen
Informationsverlusten verbunden, dass ein Rücktransfer von Lösungsansätzen in
die ursprüngliche Aufgabenstellung unmöglich scheint; es gibt sogar Situationen, in
denen durch Spezialisierung der Übergang zu einer äquivalenten Problemstellung
geschafft wird.
Zumindest aber besteht stets die Hoffnung, dass sich die Lösungen mehrerer
Spezialfälle einer Problemstellung zu einer Lösung des ursprünglichen Problems
zusammensetzen lassen, welches dann die Rolle einer gemeinsamen Verallgemei-
nerung der Spezialfälle übernimmt.
Ein Aspekt, unter dem Spezialisierungen betrachtet werden können, ist die Be-
achtung des Extremalpinzips. Dieser Heurismus basiert auf der Korrespondenzhy-
pothese:
Mit einer hinreichend allgemeinen Interpretion des Begriffs des „Extremalen“ kann
man die Spezialisierung einer Problemstellung unter Beachtung des Extremalprin-
zips wie folgt deuten:
Zum Nachweis, dass kein Element einer Grundmenge G eine bestimmte Eigen-
schaft E hat, versuche man eine den Elementen von G zugehörige Extremalität
zu finden, die sich mit E nicht in Einklang bringen lässt.
Dieser Katalog von Zähltechniken lässt sich mit den daraus herzuleitenden Anzahl-
formeln für k-Auswahlen aus n-Mengen vervollständigen und stellt so das passende
Instrumentarium zur Lösung von Zählproblemen der enumerativen Kombinatorik
dar.
Weniger um das Zählen selbst als um den Erkenntnisgewinn durch Zählen geht
es bei den folgenden beiden Prinzipien:
Unsere Überlegungen aus Abschn. 1.2 fließen in eine zweite Verfeinerung von
P ÒLYAs Phasenmodell des Problemlöseprozesses ein und führen zu folgender Dar-
stellung:
Dabei ist zu beachten, dass die Phasen einander wechselseitig beeinflussen und des-
halb im Sinne eines heuristischen Kreislaufs ggf. mehrfach zu durchlaufen sind.
Heurismen der Induktion
2
Inhaltsverzeichnis
2.1 Heurismen der unvollendeten Induktion . . . . . . . . . . . . . . . . . . . . . . . . . . . . 151
2.2 Vollendete Induktion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 197
Die Mathematik wird als demonstrative Wissenschaft angesehen. Doch ist das nur einer
ihrer Aspekte. Die fertige Mathematik, in fertiger Form dargestellt, erscheint als rein de-
monstrativ. Sie besteht nur aus Beweisen. Aber die im Entstehen begriffene Mathematik
gleicht jeder anderen Art menschlichen Wissens, das im Entstehen ist. Man muß einen ma-
thematischen Satz erraten, ehe man ihn beweist; man muß die Idee eines Beweises erraten,
ehe man die Details ausführt. Man muß Beobachtungen kombinieren und Analogien ver-
folgen; man muß immer und immer wieder probieren. Das Resultat der schöpferischen
Tätigkeit des Mathematikers ist demonstratives Schließen, ist ein Beweis; aber entdeckt
wird der Beweis durch plausibles Schließen, durch Erraten. Wenn das Erlernen der Mathe-
matik einigermaßen ihre Erfindung widerspiegeln soll, so muß es einen Platz für Erraten,
für plausibles Schließen haben.
1
P ÓLYA , G: Mathematik und plausibles Schließen, Band 1. Birkhäuser, Basel (1962).
© Springer-Verlag GmbH Deutschland, ein Teil von Springer Nature 2018 149
W. Schwarz, Problemlösen in der Mathematik, https://doi.org/10.1007/978-3-662-56762-3_2
150 2 Heurismen der Induktion
2
Obgleich P ÓLYA mehrfach darauf hinweist, dass es sich beim „plausiblen Schließen“ nicht um
ein folgerichtiges Schließen im deduktiven Sinne handelt, scheint es Missverständnisse hinsicht-
lich des formallogischen Wertes seiner „Regeln des plausiblen Schließens“ zu geben.
3
inductio (lat.): das Hineinführen.
4
Vertritt man wie I MRE L AKATOS (1922–1974) den mathematikphilosophischen Standpunkt des
Quasi-Empirismus, der den Dogmatismus undefinierter Grundbegriffe ablehnt und den Axiomen
einer mathematischen Theorie allenfalls Erklärungskraft, niemals aber Beweiskraft für die aus
ihnen deduzierten Sätze zubilligt, dann existiert auch in der Mathematik nur Mutmaßlichkeit, je-
doch keine gesicherte Wahrheit. Positiv gesehen: Mathematische Forschung produziert relative
Wahrheiten, also Wahrheiten im Bezug auf ein Axiomensystem.
2.1 Heurismen der unvollendeten Induktion 151
Wie oben bemerkt, gibt es Formen induktiven Schließens (wie etwa die vollstän-
dige Induktion), die aufgrund der Eigenschaften der mathematischen Strukturen, in
denen sie verwendet werden, demonstrativen Charakter haben; nennen wir sie (die
Heurismen der) vollendete(n) Induktion.
Ebenso gibt es Formen induktiven Schließens, die auf plausible, aber nicht for-
mallogisch begründbare Verallgemeinerungen singulärer Beobachtungen setzen,
um Problemfindungsprozesse und Problemlöseprozesse voranzubringen – solche
Denkmuster gehören zu den Heurismen der unvollendeten Induktion, von denen in
diesem Abschnitt die Rede sein soll.
2 j 22 2
3 j 23 2
4 − 24 2
5 j 25 2
6 − 26 2
7 j 27 2
8 − 28 2
9 − 29 2
10 − 210 2
11 j 211 2
Ziel muss offenbar sein, aus den hier präsentierten Zusammenhängen Muster ab-
zulesen oder (durch leichte Manipulationen an den Daten) Muster herzustellen (!
Variation; Symmetrieprinzip), die dann zur Formulierung einer Vermutung Anlass
geben, die es näher zu untersuchen gilt.
Mögliche Elemente der Situationsanalyse könnten folgende Fragen (und Ant-
worten) sein:
Beobachtung
Auf der Grundlage dieser gesicherten Feststellung beginnt ein Prozess der Ex-
ploration zur Beantwortung der Frage, ob es weitere Zahlen gibt, für die sich ana-
loge Eigenschaften konstatieren lassen. Als probates Mittel in dieser Phase des
Erkenntnisprozesses bietet sich das Systematische Probieren an.
5
Es gilt 7 j n genau dann, wenn 7 j Q300 .n/, wobei Q30 .n/ die alternierende Quersumme dritter
Stufe von n in dezimaler Zifferndarstellung bezeichnet.
2.1 Heurismen der unvollendeten Induktion 153
Es hat den Anschein, als ließen sich die Beobachtungen (1) und (2) auf weit mehr
natürliche Zahlen verallgemeinern als auf die Zahlen zwischen 2 und 11; gestützt
wird diese Annahme durch die Erfahrungen, welche wir mit dem Heurismus des
Systematischen Probierens sammeln konnten.
Durch Induktion, also die Ableitung von Schlussfolgerungen aus einzelnen vor-
gegebenen Fakten, könnte man sich nun zu folgender Vermutung veranlasst sehen:
Vermutung
Mit der Äußerung dieser Vermutung befinden wir uns übrigens in guter Gesell-
schaft, denn auch G OTTFRIED W ILHELM L EIBNIZ (1646–1716) hielt den postu-
lierten Sachverhalt um 1680 für plausibel.
Seine Stützen der Thesen (1) und (2) waren dabei noch weitaus fundierter als un-
sere singulären Beobachtungen; natürlich kannte L EIBNIZ den von F ERMAT (1601–
1665) für Primzahlen bewiesenen Spezialfall des in Beispiel 1.40 besprochenen
Satzes von Euler/Fermat, wonach für jede ungerade Primzahl p insbesondere p j
2p1 1 folgt.
Für jede Primzahl p gilt deshalb p j 2 .2p1 1/ D 2p 2, d. h., Teil (1) der
Vermutung ist ein Satz, eine anerkannte Wahrheit der Zahlentheorie!
Gefunden haben wir diese Wahrheit, indem wir Analogien in den Daten als
Muster erkannt haben, in Verallgemeinerung unserer Beobachtungen eine Vermu-
tung formuliert haben, zur Untermauerung dieser Vermutung mittels Systemati-
schen Probierens zu einer Kette von Spezialisierungen unserer Vermutung überge-
gangen sind, welche weitere Einzelbeobachtungen lieferten, die mit der Vermutung
im Einklang standen, und schließlich die wissenschaftliche Absicherung unserer
Vermutung durch einen Beweis (Rückführung auf einen bewiesenen Satz) vorge-
nommen haben.
Verallgemeinerung, Spezialisierung und Analogie sind nicht nur im Umfeld heu-
ristischer Strategien der Variation zu finden, sondern in der hier beschriebenen
Weise die konstituierenden Denkmuster der Induktion, wie es bei P ÓLYA ausführ-
lich beschrieben wird.
Kommen wir nun zu Teil (2) der Vermutung. Ich wage zu behaupten, dass durch
Systematisches Probieren wohl kaum ein Gegenbeispiel gefunden werden könnte,
und dennoch: Teil (2) der Vermutung trifft nicht zu; auch L EIBNIZ lag falsch!
Betrachten wir die zusammengesetzte Zahl z D 341 D 11 31. Wegen 210
1 mod 11 und 210
1 mod 31 folgt
34
210
1 mod 341 und 2341
2 210
2 1
2 mod 341 ;
154 2 Heurismen der Induktion
also gilt 2341 2
0 mod 341, gleichbedeutend mit 341 j 2341 2. Damit ist Teil
(2) der Vermutung falsifiziert.
Unterhalb von n D 2000 gibt es neben z D 341 allerdings nur noch sechs (!)
weitere zusammengesetzte Zahlen z mit der Eigenschaft z j 2z 2, nämlich die
Zahlen
Es wird nicht wenig paradox erscheinen, in jenem Teil der mathematischen Wissenschaften,
den man gewöhnlich die reine Mathematik nennt, Beobachtungen große Bedeutung beizu-
legen, da der geläufigen Ansicht nach Beobachtungen auf physische Objekte beschränkt
sind, welche die Sinne beeindrucken. Da wir die Zahlen auf den reinen Intellekt beziehen
müssen, können wir kaum verstehen, wie Beobachtungen und Quasi-Experimente bei einer
Untersuchung der Natur der Zahlen von Nutzen sein können.
Doch sind tatsächlich, wie ich durch sehr gute Argumente dartun werde, die heute be-
kannten Eigenschaften der Zahlen größtenteils durch Beobachtung entdeckt worden, und
zwar lange bevor ihre Wahrheit durch strenge Beweise bestätigt wurde. Es gibt sogar viele
Zahleneigenschaften, die uns gut bekannt sind, die wir aber noch nicht beweisen können;
Beobachtungen allein haben zu ihrer Kenntnis geführt. Somit sehen wir, daß wir in der
Zahlentheorie, die noch sehr unvollkommen ist, unsere höchsten Hoffnungen auf Beobach-
tung setzen dürfen. Sie wird uns zu immer neuen Eigenschaften führen, die wir hinterher zu
beweisen suchen werden.
Die Art des Wissens, die nur von Beobachtungen gestützt wird und noch nicht bewiesen
ist, muß sorgfältig von der Wahrheit unterschieden werden; sie wird, wie wir gewöhnlich sa-
gen, durch Induktion gewonnen. Doch haben wir Fälle gesehen, in denen bloße Induktion zu
Irrtum geführt hat. Darum sollten wir große Sorgfalt darauf verwenden, nicht solche Zah-
leneigenschaften, die wir durch Beobachtung entdeckt haben, und die allein durch Indukti-
on gestützt werden, als wahr zu akzeptieren. In der Tat sollten wir eine solche Entdeckung
als Gelegenheit dazu benützen, die entdeckten Eigenschaften genauer zu untersuchen und
sie zu beweisen oder zu widerlegen; in beiden Fällen können wir etwas Nützliches lernen.
Durchlaufen wir den bei der Diskussion von Pseudoprimzahlen dargestellten kreati-
ven Prozess noch einmal bei der Behandlung einer offenen Problemstellung. Diese
spezielle Aufgabe habe ich aus einem überraschenden Sachzusammenhang entwi-
ckelt, der mir, um es mit den Worten E ULERs zu sagen, im Stadium „einer Art des
6
„Relativ“ wenige, denn es gibt unendlich viele Zahlen dieser Art!
2.1 Heurismen der unvollendeten Induktion 155
Wissens, welches nur von Beobachtungen gestützt und noch nicht bewiesen ist“,
vor einigen Jahren von J EFF M C N EAL bei einer unserer Princetoner Sitzungen zu
„recreational mathematics“ zugetragen wurde. Ich selbst habe später die „Ent-
deckung als Gelegenheit dazu benutzt, die entdeckten Eigenschaften genauer zu
untersuchen“ und möchte feststellen, dass dieses Beispiel in geradezu hervorragen-
der Weise dazu geeignet ist, die Rolle der Suche nach Mustern sowohl im Prozess
der Problemfindung als auch im Prozess der Problemlösung im engeren Sinne zu
verdeutlichen.
Unser Problemfindungsprozess beginnt mit der Suche nach Mustern in Abb. 2.1.
Vorstellbar ist7 , dass man durch sukzessiv verfeinerte Fragestellungen bei der Ana-
lyse der (ggf. zur Mustererzeugung leicht zu manipulierenden) Problemdaten zu
einigen Beobachtungen kommt; die erste Beobachtung könnte die folgende sein:
Beobachtung
7
Natürlich wären auch andere Beobachtungen denkbar – es handelt sich um eine offene Problem-
stellung.
156 2 Heurismen der Induktion
Diese marginale Variation der Daten ermöglicht – z. B. anhand der durch farb-
liche Codierung als zusammengehörig gekennzeichneten Zeilen und Spalten – die
Beantwortung der Fragen (M 1) bis (M 3) und damit präzisere Angaben zum vor-
liegenden Muster, die an den übrigen kompletten Zeilen verifiziert werden können
und die sich folgendermaßen als detailliertere Beobachtungen formulieren lassen:
Beobachtung
Auch die unvollständigen Zeilen der Tabelle geben Fragmente des wahrgenom-
menen Musters korrekt wieder, sodass der induktive Schluss erlaubt scheint, man
möge sich das Muster zeilenweise auf beliebig viele Zeilen fortgesetzt denken.
Aber: Mit welchem Ziel? Welche informationstragende Gruppierung der teils
markierten, teils unmarkierten Zahlen ist bisher unentdeckt?
Der entscheidende Hinweis ergibt sich aus dem Symmetrieprinzip:
Zur Herstellung des Musters tragen wir zeilenweise die Binomialkoeffizienten
des PASCALschen Dreiecks in die Tabelle ein; dabei verschieben wir mit jeder
neuen Zeile den ersten Eintrag um zwei Spalten nach rechts. Dann markieren wir
zeilenweise die Elemente der Vielfachenmengen der einzelnen Zeilenkoordinaten
und stellen so Gruppierungen von markierten und unmarkierten Zahlen her.
Informationsträger sind aber nicht nur die Zeilen, sondern auch die Spalten einer
rechtecksförmigen Tabellenstruktur; diese haben wir bisher nicht berücksichtigt und
folglich die Symmetrien der Problemstellung nicht herausgearbeitet (Abb. 2.3).
Sofort fällt auf, dass es Spalten gibt, in denen ausschließlich markierte Zahlen
stehen, während in anderen Spalten unmarkierte oder sowohl markierte als auch un-
markierte Zahlen auftreten. Die Objekte im Gegenstandsbereich der Zahlentheorie,
deren charakteristische Merkmale die vertikale Gruppierung herbeiführen würden,
sind offensichtlich, und wir halten fest:
Beobachtung
8
Benannt nach B LAISE PASCAL (1623–1662).
158 2 Heurismen der Induktion
Auf der Grundlage der festgehaltenen Beobachtungen lässt sich eine Vermutung
formulieren, in deren Verifikation (oder vielleicht Falsifikation? Man denke an das
Phänomen der Pseudoprimzahlen!) eine Problemstellung zu sehen ist, welche die
Aufmerksamkeit des Mathematikers verdient.
Vermutung
Man lege eine Tabelle an und nummeriere die Zeilen und Spalten fortlaufend
mit Elementen aus N0 .
Nun trage man zeilenweise von links nach rechts die 0-te, die 1-te, : : : Zei-
le des PASCALschen Dreiecks in die Tabelle ein, wobei in jeder n-ten Zeile
der erste Binomialkoeffizient n0 in der 2n-ten Spalte notiert wird; anschlie-
ßend markiere man in jeder einzelnen Zeile diejenigen Zahlen, die Vielfache
der Zeilennummer sind.
Vermutlich gilt für alle j 2 N:
Ist der Algorithmus für alle Zeilen mit den Zeilennummern 0; : : : ; j durch-
geführt, so ist p 2 f2; : : : ; 2j g genau dann eine Primzahl, wenn alle
Zahlen der Spalte p markiert sind.
Sollte die Vermutung richtig sein, beschreibt der oben angegebene Algorith-
mus ein skurriles (und bis dato niemandem meiner Gesprächspartner bekanntes!)
Primzahlsieb, das nach jeweils j Verfahrensschritten alle Primzahlen p 2j her-
ausfiltert. Zum Versuch der Verifikation der Vermutung bedienen wir uns erneut
der im Zusammenhang mit den Pseudoprimzahlen diskutierten und von P ÓLYA
angeregten („Die sorgfältige Beobachtung von Spezialfällen, die uns zu einem all-
gemeinen mathematischen Resultat führt, kann uns auch dessen Beweis an die Hand
geben.“) Heurismen der Induktion.
Zunächst fällt auf, dass im vorliegenden
Zahlenmuster die Zahl 1 eine dominie-
rende Rolle spielt – wegen n0 D nn D 1 für alle n 2 N0 taucht die Zahl 1 in
jeder Zeile der Tabelle (mit Ausnahme der 0-ten Zeile, wo sie nur einmal auftritt)
zweimal auf.
Aber: Die Zahl 1 wird beim Abarbeiten des Algorithmus in der j -ten Zeile dann
und nur dann gestrichen, wenn sie zur Vielfachenmenge der Zeilenkoordinate j
gehört, und dies ist nur für j D 1 der Fall! In jeder Spalte
mit der Spaltenkoordinate
2j; j 2 N; j > 1 steht also in der j -ten Zeile mit j0 D 1 eine unmarkierte Zahl,
und wir können als Tatsachen festhalten:
Könnte man nun die Gültigkeit analoger Tatsachen für die ungeraden zusammen-
gesetzten natürlichen Zahlen und die ungeraden Primzahlen feststellen, so wäre
unsere Vermutung verifiziert.
Betrachten wir zunächst die Spalten mit zusammengesetzten ungeraden natür-
lichen Zahlen als Spaltenkoordinaten. Wenn in einer jeden solchen Spalte eine 1
eingetragen wäre, hätte man eine zu (T 1) analoge Feststellung in der Kategorie der
zusammengesetzten ungeraden natürlichen Zahlen gefunden – für alle in Abb. 2.3
erfassten Fälle ist das richtig.
Aber bereits in Spalte 25 ist keine 1 zu finden, wie es sich am rechten Rand der
Abb. 2.3 andeutet und wie man durch Systematisches Probieren herausfinden kann;
also müssen wir uns weiter mit den Spalten, deren Spaltenkoordinaten z zusam-
mengesetzte ungerade Zahlen sind, beschäftigen.
Offenbar ist z 2 N genau dann zusammengesetzt und ungerade, wenn es eine
ungerade Primzahl p ¤ z und ein j 2 N mit z D .2j C 1/ p gibt.9 An der
Darstellung
ablesen ließe. Folglich müsste p ein Primteiler mindestens einer der Faktoren .jp
1/; .jp 2/ : :: ; .jp p C 1/ sein; dies ist offensichtlich nicht der Fall und führt
die Annahme, jp p sei ein Vielfaches von .jp/, zum Widerspruch.
Damit ist ein Analogon zu (T 1) in der Kategorie der ungeraden zusammenge-
setzten natürlichen Zahlen gefunden, und wir notieren die Tatsache
9
Man spalte mit p den kleinsten aller Primteiler von z ab; weil z zusammengesetzt ist, gilt p ¤ z.
Als Komplementärteiler von z bezüglich p ergibt sich dann eine von 1 verschiedene natürliche
Zahl, die ungerade sein muss, weil z ungerade ist.
160 2 Heurismen der Induktion
Zum endgültigen Nachweis der Tatsache, dass für jede ungerade Primzahl p alle
Einträge in Spalte p der Tabelle markiert sind, bleibt also nur noch zu zeigen:
Dazu müssen wir uns davon überzeugen, dass unter den oben genannten Vorausset-
zungen jeder Primfaktor q, der in der Primfaktorzerlegung von n mit dem Expo-
nenten ˛ auftritt, mit einem Exponenten ˇ ˛ in der Primfaktorzerlegung von kn
erscheint.
Der Exponent eq .mŠ/ eines Primfaktors q in der Primfaktorzerlegung von
mŠ; m 2 N kann mit der Formel von Legendre11 bestimmt werden. Es ist
1
X
m
eq .mŠ/ D ;
i D1
qi
wobei natürlich nur endlich viele der Summanden von 0 verschieden sind.12 Folg-
n
lich gilt für den Exponenten eq . k / des Primfaktors q in der Primfaktorzerlegung
10
Mit Œ j 1
3
wird die größte ganze Zahl j 1
3
bezeichnet; allgemein definiert Œx den ganzzahli-
gen Anteil von x.
11
Benannt nach A DRIEN -M ARIE L EGENDRE (1752–1833).
12
Wegen limi!1 q i D 1 ist 0 < qmi < 1 für i i0 D i0 .q/ und deshalb Œ qmi D 0 für fast alle
i 2 N.
2.1 Heurismen der unvollendeten Induktion 161
n
des Binomialkoeffizienten k D nŠ
kŠ.nk/Š :
!! 1
n X n nk k
. / eq D i ;
k i D1
qi q i q
wobei auch hier wieder nur endlich viele Summanden ungleich 0 sind.
Jeder Summand nimmt dabei entweder den Wert 0 oder den Wert 1 an, was man
mithilfe der Division mit Rest erkennen kann. Sind nämlich
dann ist
nk k r1 .i/ C r2 .i/ n
i
C i
D v1 .i/ C v2 .i/ v1 .i/ C v2 .i/ C i
D i ;
q q q q
also
(
n nk k 1 für q i r1 .i/ C r2 .i/ < 2q i I
D
qi qi qi 0 für 0 r1 .i/ C r2 .i/ < q i :
Sei nun ˛ 2 N der Exponent, mit dem der Primfaktor q in der Primfaktorzerlegung
von n auftritt; dann gilt für alle i D 1; : : : ; ˛: q i j n.
Außerdem gilt für alle i D 1; : : : ; ˛: q i − .n k/ und q i − k, weil sonst nach
den grundlegenden Teilbarkeitsregeln auch q i j 2n C k gelten müsste; dies ist aber
ausgeschlossen, weil p D 2n C k eine ungerade Primzahl mit p > n q i ist.
Daher ist für alle i D 1; : : : ; ˛ einerseits q i > r1 .i/ > 0 und q i > r2 .i/ > 0,
aber wegen q i j n gilt gleichzeitig r1 .i/ C r2 .i/
0 mod q i , sodass sich zwangs-
läufig
r1 .i/ C r2 .i/
r1 .i/ C r2 .i/ D q i bzw. D1
qi
ergibt. Folglich sind in der Summe . / die ersten ˛ Summanden jeweils gleich 1,
dass der Primfaktor q in der Primfaktorzerlegung des Binomial-
und man erkennt,
koeffizienten nk mit einem Exponenten ˇ ˛ auftritt.
Dies beweist die Behauptung hinsichtlich der Markierung der Elemente in den
Spalten mit ungeraden Primzahlen als Spaltenkoordinaten, und wir können als
Anaologon zu (T 2) in der Kategorie ungerader Primzahlen festhalten:
Die Tatsachen (T 1) bis (T 4) zusammen belegen nun die Behauptung, dass der
vorgestellte Algorithmus ein Primzahlsiebverfahren darstellt.
162 2 Heurismen der Induktion
pierte Reihe von Simulationen eines Zufallsexperiments an, um anhand der beob-
achteten Ereignisse erste Einschätzungen der Situation vornehmen zu können – hier
handelt es sich um Systematisches Probieren in reinster Form!
Regelmäßig kann damit auch die Analyse von Paradoxien erleichtert werden, al-
so von Situationen, in denen man an das Falsche glaubt, weil es intuitiv naheliegt,
während die nur analytisch erfassbare Wahrheit verdrängt wird. Ein Klassiker ist
das Drei-Türen-Paradoxon, welches Ende der 60er Jahre im Anschluss an seine
Ausstrahlung in der von M ONTY H ALL moderierten US-Gameshow „Let’s make
a deal“ weltweites Aufsehen erregte und seitdem in den Vereinigten Staaten als
das M ONTY-H ALL-Problem bekannt ist. Dabei ging es darum, dass hinter einer
von drei Türen ein Gewinn (Auto) und hinter den anderen beiden Türen zwei Nie-
ten (Ziegen) verborgen waren; die Kandidatin durfte eine Tür auswählen, hinter
der sie das Auto vermutete. Daraufhin öffnete H ALL eine der beiden anderen Tü-
ren, hinter der sich eine Ziege befand,13 und bot der Kandidatin an, sie dürfe ihre
ursprünglich getroffene Entscheidung revidieren und eine andere Tür wählen. Es
war die richtige Entscheidung, das Angebot anzunehmen, denn damit erhöhte sich
die Gewinnwahrscheinlichkeit von 13 auf 23 , wie man unschwer feststellen kann,
wenn man mit dem Konzept der bedingten Wahrscheinlichkeit vertraut ist.14 Für
die Öffentlichkeit (auch für manche Mathematiker!) war das Phänomen jedoch der-
maßen „counter-intuitive“15 , dass in der folgenden Show eine Simulation durchge-
führt wurde, damit für die Schar der Entrüsteten die Wahrheit zumindest plausibel
wurde.
In Problemstellungen der Analysis steht Systematisches Probieren am Anfang
jeder nicht unmittelbar aus den Daten abzuleitenden Vermutung über das makrosko-
pische Verhalten von Funktionen, von Zahlenfolgen, von Funktionenfolgen oder das
mikroskopische Änderungsverhalten von Funktionen. Das Einzige, was sich daran
seit E ULERs „Quasi-Experimenten“ dramatisch geändert hat, sind die Werkzeuge
des Systematischen Probierens; heute steht als heuristisches Werkzeug der Com-
puter mit seinen visuellen und numerischen Möglichkeiten zur Verfügung, und es
entsteht „ein heuristischer Kreislauf zwischen dem Mensch und seinem Auftrag-
nehmer Maschine“, wie T IMO L EUDERS bemerkt.
Die zentralen heuristischen Funktionen des Systematischen Probierens in
Problemlöse- und Problemfindungsprozessen lassen sich aber unabhängig vom
potenziellen Einsatz jedweder maschinellen Hilfen konkret angeben.
13
Unabhängig von der Wahlentscheidung der Kandidatin existiert mindestens eine andere Tür mit
Ziege dahinter!
14
Auch ohne Kenntnis bedingter Wahrscheinlichkeiten ist dies einsichtig, wenn man bedenkt, dass
die Entscheidung, das Tauschangebot anzunehmen, genau dann falsch ist, wenn man ursprünglich
die richtige der drei Türen gewählt hatte – Letzteres geschah mit einer Wahrscheinlichkeit von 13 .
15
Intuitiv würde man vielleicht vermuten, dass es keine Rolle spielt, ob man das Tauschange-
bot annimmt oder nicht; hinter einer von zwei verbleibenden Türen ist der Preis, also stehen die
Chancen 50:50, dass es sich um die Tür handelt, die man ausgewählt hat!?
164 2 Heurismen der Induktion
Systematisches Probieren
Das Systematische Probieren ist ein wesentliches Element induktiven heuris-
tischen Handelns.
Seine zentrale heuristische Funktion besteht im Generieren von Vermu-
tungen über mathematische Zusammenhänge; solche Vermutungen können
durch fortgesetztes Systematisches Probieren erhärtet oder falsifiziert wer-
den.
Systematisches Probieren verankert die heuristischen Vorgehensweisen
der Spezialisierung, der Generalisierung und der Analogiebildung in den
Denkmustern der Induktion; das sorgfältige Studium einer systematischen
Kette von Spezialfällen kann den Blick für gemeinsame Generalisierungen
oder Analogien öffnen.
16
Wahrscheinlich ursprünglich Ostomachion; man muss davon ausgehen, dass der Titel bei der
Überlieferung verstümmelt wurde.
17
Beim TSP geht es darum, eine Rundreise durch n Städte so zu planen, dass ein bestimmter
Faktor (Reisezeit, Distanzen, . . . ) minimiert wird.
166 2 Heurismen der Induktion
Auch die künstliche Intelligenz muss daher auf intelligentere Algorithmen zu-
rückgreifen, wenn „große“ Problemräume zu durchsuchen sind. Um dem Dilemma
der rechenaufwandsbedingten Intraktabilität zu entgehen, wird der Suchraum nicht
komplett, sondern „heuristisch“ durchsucht, womit wir wieder beim Thema wä-
ren: Nun geben die Werte unterschiedlicher Evaluierungsfunktionen an jeder Stelle
des Graphen Hinweise darauf, in welcher Richtung die Suche am geschicktesten
fortzusetzen sein könnte.
Im Rahmen solcher heuristischen Algorithmen erfolgt erneut ein Rollenwechsel
des Systematischen Probierens: Jetzt handelt es sich um einen Heurismus, der al-
gorithmisch abgewickelt wird; die Systematik, nach der einzelne Pfade durchsucht
werden und andere unberücksichtigt bleiben, wird vom jeweils verwendeten Algo-
rithmus bestimmt.
Umfassendere Beschreibungen des Problemlösens durch (optimiertes) Suchen in
großen Problemraumgraphen findet man in Standardwerken über künstliche Intel-
ligenz.18
2.1.2 Vorwärtsarbeiten
Folgt man der oben beschriebenen Metapher des Problemlösens als Suche nach
einem Weg von einem Anfangszustand (A) zu einem Zielzustand (Z), dann fallen
einem sofort zwei konträre Möglichkeiten auf, die Suche anzulegen:
Man könnte versuchen, sich von (A) nach (Z) zu bewegen, oder man könnte
versuchen, von (Z) nach (A) zu kommen.
Übliche und semiotisch naheliegende Bezeichnungen für diese Vorgehenswei-
sen sind Vorwärtsarbeiten und Rückwärtsarbeiten, wobei das Vorwärtsarbeiten als
„datengetriebene“ Strategie zu den induktiven Methoden gezählt werden kann. Die
Lösungssuche beginnt bei den bekannten Daten der Problemstellung, von denen
man progressiv in das Ziel hineingeführt zu werden sucht.
Als heuristischen Kreislauf kann man die Methode des Vorwärtsarbeitens über
das Fragenpaar (Teilzielfrage, Hilfsmittelfrage) charakterisieren:
18
Etwa in RUSSEL /N ORVIG: Artificial Intelligence: A Modern Approach. Prentice Hall (2003).
2.1 Heurismen der unvollendeten Induktion 167
(H) Gelingt dies nicht, beantworte man zuerst die Frage nach geeigneten
Hilfsmitteln:
8 9
ˆ
ˆ In welchen Formeln kommen die gegebenen Größen vor >
>
ˆ
ˆ >
>
ˆ
ˆ Welche Theorien thematisieren ähnliche Bedingungen >
>
ˆ
ˆ >
>
< Welchen geometrischen Themenkreisen können die Bestim- =
‹
ˆ
ˆ
mungsstücke zugeordnet werden >
>
ˆ
ˆ >
>
ˆ
ˆ Welche Sätze besitzen gleichartige Voraussetzungen >
>
ˆ >
>
:̂ :: ;
:
Ist die Hilfsmittelfrage beantwortet, gehe man mit diesen neuen Informa-
tionen zurück nach (T).
Die sogenannte Heuristik ist (. . . ) ein (. . . ) Lehrgebiet für den Gebrauch derjenigen, wel-
che, nachdem sie die allgemeinen Elemente schon durchgenommen haben, sich die Fertig-
keit aneignen wollen, mathematische Aufgaben zu lösen. Sie wurde (. . . ) behandelt (. . . )
von (. . . ) Euklid, Apollonius und von Aristäus dem Älteren. Sie geht vor mittels Analyse
und Synthese.
In der Analyse gehen wir aus vom Verlangten (. . . ) und nehmen (. . . ) das was zu tun
verlangt bereits als getan an. (. . . ) wir ziehen Folgerungen daraus (. . . ) bis wir einen Punkt
erreicht haben, den wir als Ausgangspunkt bei der Synthese verwenden können. (. . . ) Diese
Art der Behandlung nennen wir (. . . ) rückläufiges Schließen.
In der Synthese wird umgekehrt das bereits Bekannte oder als gültig Zugelassene, was
wir in der Analyse zuletzt angetroffen haben, als Ausgangspunkt benutzt.
19
KÖNIG , H: Einige für den Mathematikunterricht bedeutsame heuristische Vorgehensweisen.
MU 38, Heft 3 (1992).
20
Nachzulesen in einem Artikel von B ERND Z IMMERMANN aus G LATFELD , M.: Finden, Erfin-
den, Lernen: Zum Umgang mit Mathematik unter heuristischem Aspekt. Verlag P.Lang, Frankfurt
(1990).
168 2 Heurismen der Induktion
Will man etwa die Menge L aller Lösungen der linearen diophantischen Glei-
chung21
16x 12y D 20
bestimmen, so liest man leicht die spezielle Lösung .x0 ; y0 / D .2; 1/ ab und ermit-
telt daraus progressiv die Menge aller Lösungen zu
Allein aufgrund der vorherigen Analyse, dass sich zwei ganzzahlige Lösungstupel
der Gleichung nur um ganzzahlige Vielfache von .3; 4/ unterscheiden können (!
Ausgangspunkt (Z), nämlich Lösungen der Gleichung), führt die Ermittlung einer
speziellen Lösung (! Ausgangspunkt (A), nämlich die Gleichung) von (A) nach
(Z) hin – es handelt sich um eine Analysis-Synthesis-Prozedur.
Eine neuzeitliche Erscheinungsform von Analysis-Synthesis-Prozeduren könnte
man in der Mittel-Ziel-Analyse (means-end-analysis) sehen, die in der künstlichen
Intelligenz vielfach als die wichtigste Strategie angesehen wird, mit der in großen
Suchräumen selektive Suchen vorgenommen werden können.
Hierbei wird zunächst eine detaillierte Liste der Unterschiede zwischen An-
fangszustand (A) und Zielzustand (Z) erstellt, und anschließend führt man eine
Operation aus, welche die Disparitäten zwischen (A) und (Z) verringert. Dabei ist
es möglich, dass man zur Unterschiedsreduktion den Zustand (A) in einen Zustand
(A’) überführt, der (Z) ähnlicher ist als (A) (! Vorwärtsarbeiten); ebenso kann man
aber (Z) in einen Zustand (Z’) transformieren, welcher (A) ähnlicher ist als (Z) (!
Rückwärtsarbeiten).
Synthese ohne vorhergehende Analyse scheint schwierig, vergleichbar etwa dem
Vorhaben, aus einzelnen Bauteilen ein Modellflugzeug zusammenzusetzen, ohne
über einen Bauplan zu verfügen – diese Leistung kann allenfalls von erfahrenen
Modellbauern erbracht werden.
So überrascht es nicht, dass reines Vorwärtsarbeiten hauptsächlich von Exper-
ten eingesetzt wird, wenn sie die deep structures einer Problemstellung identifiziert
haben und ihr breiteres bereichsspezifisches Wissen einsetzen können, um von (A)
straight forward nach (Z) zu gelangen. Fehlt jedoch dieses Expertenwissen, gerät
der Problemlöseprozess beim Vorwärtsarbeiten leicht außer Kontrolle, wenn sich
21
Benannt nach dem hellenistischen Mathematiker D IOPHANT von Alexandria, der vermutlich
um 250 n. Chr. lebte und dessen „Arithmetica“ im 17. Jahrhundert P IERRE DE F ERMAT zu inter-
essanten zahlentheoretischen Studien anregte. Auf dem Rand seiner D IOPHANT -Ausgabe notierte
F ERMAT , dass er die Unlösbarkeit der Gleichung x n C y n D z n für n 3 im Bereich der natürli-
chen Zahlen beweisen könne, aber der Buchrand zu wenig Platz für diesen Beweis biete – der von
A NDREW W ILES 1995 in den Annals of Mathematics publizierte Beweis des Satzes von Fermat
füllte am Ende insgesamt 139 Buchseiten.
2.1 Heurismen der unvollendeten Induktion 169
der eingeschlagene Weg von (A) in Richtung auf (Z) zu sehr verzweigt und man
keinen Hinweis darauf hat, welchem Pfad man folgen soll; in diesem Zusammen-
hang stellte P ÓLYA fest:
Beim Vorwärtsarbeiten müssen wir (. . . ) darauf gefaßt sein, daß wir einen großen Teil der
Zeit mit unschlüssigem Schwanken zubringen angesichts verschiedener Aufgaben, die wir
in Angriff nehmen könnten, oder mit der Bearbeitung von Aufgaben, die uns, selbst wenn
gelöst, nichts helfen.
Eine auf den ersten Blick gute Idee, der Verzweigungsproblematik des „For-
ward Chaining“ Herr zu werden, ist eine unter dem Namen Hill Climbing bekannte
Variante des Vorwärtsarbeitens. Diese lässt sich am besten durch eine geringfügi-
ge Adaption der Reisemetapher des Problemlöseprozesses (Weg von (A) nach (Z)
finden) erklären.
Man stelle sich dazu vor, der Anfangszustand (A) eines Problems befinde sich
am Fuß eines Berges, auf dessen Gipfel der Zielzustand (Z) angesiedelt sei. Wenn
nun keine Aufstiegsroute vorgezeichnet ist, der man folgen kann, so könnte man
offenbar die Strategie verfolgen, seinen Weg so zu wählen, dass er ständig bergauf
verläuft; sobald man bemerkt, dass es bergab geht, drehe man um und korrigiere
seine Richtung.
Übertragen auf den Problemlöseprozess bedeutet dies, dass man ausschließlich
zu solchen Teilzielen voranzuschreiten versucht, die dem angestrebten Zielzustand
„näher“ sind. So weit, so gut: Die Qualität eines Computerschach-Programms lässt
sich unter anderem daran festmachen, dass völlig unsinnige Züge nicht in Erwägung
gezogen werden. Allerdings kann es manchmal von großem Nutzen sein, einen
Figurenverlust (! in vielen Fällen Vergrößerung der Distanz zum Ziel „Spielge-
winn“) in Kauf zu nehmen, aber dadurch seine Position entscheidend zu verbessern!
In der Metapher des Bergsteigens: Durch ein paar Schritte bergab lässt sich gege-
benenfalls ein besserer Weg zum Gipfel finden.
In der Regel fällt es jedoch dem menschlichen Denken schwer, beim Problem-
lösen Maßnahmen in Betracht zu ziehen, die den Abstand zum Ziel vergrößern;
bisweilen ist dies aber zwingend notwendig, um das Ziel überhaupt erreichen zu
können. In der Situation aus Abb. 2.5 würde man mit der Hill Climbing-Strategie
auf dem Nebengipfel hängen bleiben.
Zur Illustration des Hill Climbing an einem konkreten Beispiel möchte ich einen
Gegenstandsbereich wählen, der im Folgenden noch öfter aufgegriffen wird, um
170 2 Heurismen der Induktion
Im ersten Schritt wird dieses Lotto-Design dadurch verbessert, dass wir einen
beliebigen Block des Systems herausgreifen – hier: S1 D f1; 2; 3; 4; 5; 6g, dunkel-
blau markiert – und dann alle Blöcke aus dem 84er-Design entfernen, die durch S1
repräsentiert werden. Die von S1 repräsentierten Blöcke des Systems sind in Abb.
2.6 hellblau markiert; durch S1 und die Gesamtheit aller bisher nicht eingefärbten
Blöcke ist nun ein verbessertes .6; 5/-Lotto-Design zu A9 gegeben, das nur noch
aus 66 Blöcken besteht.
Dieses .6; 5/-Lotto-Design der Länge 66 zu A9 kann nun dadurch weiter verbes-
sert werden, dass man einen Block S2 ¤ S1 aus dem 66er-Design herausgreift und
alle 6-Teilmengen aus dem 66er-Design entfernt, die von S2 repräsentiert werden.
Konnte die Selektion von S1 aus Symmetriegründen noch beliebig erfolgen,22 um
22
Jede 6-Teilmenge B von A9 repräsentiert genau 6 3 C 1 D 19 Mengen aus P6 .A9 /.
172 2 Heurismen der Induktion
Nach Wahl von S2 D f1; 2; 3; 4; 7; 8g (orange dunkel) und Markierung der von
S2 repräsentierten Blöcke des 66er-Designs (orange hell) verbleibt mit S1 ; S2 und
der Gesamtheit aller bisher nicht eingefärbten Blöcke ein .6; 5/-Lotto-Design der
Länge 52 zu A9 .
2.1 Heurismen der unvollendeten Induktion 173
Das Endprodukt der iterativen Selektion des ersten Blocks ist in Abb. 2.8 zu
sehen: Wir haben ein .6; 5/-Lotto-Design S D fS1 ; : : : ; S9 g der Länge k D 9 zu
A9 konstruiert, dessen einzelne Blöcke durch
S1 D f1; 2; 3; 4; 5; 6g S2 D f1; 2; 3; 4; 7; 8g S3 D f1; 2; 3; 5; 7; 9g
S4 D f1; 2; 3; 6; 8; 9g S5 D f1; 2; 4; 5; 8; 9g S6 D f1; 2; 4; 6; 7; 9g
S7 D f1; 2; 5; 6; 7; 8g S8 D f2; 3; 4; 6; 8; 9g S9 D f3; 4; 5; 6; 7; 8g
gegeben sind.
23
Das englische „greedy“ bedeutet „gierig“. Greedy-Strategien bestehen darin, sich in jedem
einzelnen Schritt stets für diejenige Möglichkeit zu entscheiden, die adhoc den größten Fortschritt
verspricht.
174 2 Heurismen der Induktion
verfolgt und jeweils einen solchen Block ausgewählt, der maximal viele bisher
unrepräsentierte 6-Teilmengen repräsentiert, so wäre man leicht zu einem .6; 5/-
Lotto-Design der Länge k D 8 zu A9 gelangt, nämlich zu S D fS1 ; : : : ; S8 g mit
S1 D f1; 2; 3; 4; 5; 6g I S2 D f4; 5; 6; 7; 8; 9g I
S3 D f1; 2; 3; 7; 8; 9g I S4 D f2; 3; 5; 6; 8; 9g I
S5 D f1; 2; 4; 6; 7; 8g I S6 D f2; 3; 4; 5; 7; 9g I
S7 D f1; 3; 5; 6; 7; 9g I S8 D f1; 3; 4; 5; 8; 9g :
Experten der KI stehen dem Hill Climbing kritisch gegenüber; RUSSEL und
N ORVIG beschreiben die Vorgehensweise plakativ mit: „Like climbing Everest in
thick fog with amnesia“. Das Hängenbleiben auf lokalen Maxima oder ebenen
Plateaus wird in der KI mit verfeinerten Suchalgorithmen wie dem Simulated An-
nealing („Simuliertes Ausglühen“) vermieden, bei dem man zeitweise auch Opera-
tionen erlaubt, die die Distanz zwischen (A) und (Z) vergrößern. Dabei werden die
Zeitpunkte, zu denen distanzvergrößernde Schritte erlaubt sind, zufällig ausgewählt.
Die Wahrscheinlichkeit für die Erlaubnis eines Abwärtsschrittes ist zu Beginn der
Suche relativ groß, wird aber im Lauf der Suche verringert, ebenso wie das erlaubte
Maß der Distanzvergrößerung.
Der humanoide Problemlöser sollte sich einfach der Tatsache bewusst sein, dass
die vom Extremalprinzip nahegelegte Anwendung derjenigen Operation, die die
Diskrepanz zwischen (A) und (Z) maximal verringert, nicht immer vorteilhaft ist.
Die Verzweigungsproblematik des Vorwärtsarbeitens ist aber nicht nur eine
Schwäche, sondern zugleich auch eine Chance des Vorgehens: Systematisches
Voranschreiten von (A) in verschiedene Richtungen erhöht die Anzahl angespro-
chener Bereichsbezüge, und der Problemlöser kann hoffen, Anknüpfungspunkte
mit dem bereichsspezifischen Wissen seiner epistemischen Struktur finden und
diese zu einem Lösungsplan vervollständigen zu können. Wie oben erwähnt, steigt
die Wahrscheinlichkeit dafür mit dem Grad des Expertentums in der Person des
Problemlösers.
Nach P ETER B ENDER und A LFRED S CHREIBER lassen sich „alle nur erdenklichen
Prozeduren der Annäherung“ mit dem Begriff der Exhaustion beschreiben, wenn
man Exhaustionsformen in die vier Typen
Figuren, Flächen und Funktionen beschränken, die sich komplett auf ideellem Ni-
veau abspielen, bietet es sich an, hier generell von Approximation zu sprechen und
den Begriff der Exhaustion für eine besondere Form der geometrischen Approxima-
tion zu reservieren.
In der Rolle der Annäherung von Zahlen begegnet uns die Approximation be-
reits beim überschlägigen Rechnen in der Grundschule. Im Rahmen des deutschen
Normalverfahrens der schriftlichen Division ist das überschlägige Dividieren der
wichtigste (und für die Grundschüler schwierigste) Verfahrensschritt, denn die da-
mit verbundene approximative Faktorisierung des jeweiligen Teildividenden lässt
ziffernweise den gesuchten Quotienten der Divisionsaufgabe entstehen. Weiterhin
ist das Überschlagsrechnen in der Arithmetik in der Funktion der Lösungskontrolle
zu sehen, und beim Sachrechnen wirkt es unreflektierten und voreiligen „Lösungen“
entgegen, indem es die Aufmerksamkeit auf Größenordnungen der verarbeiteten
Zahlen lenkt.
Als universelle Idee (Leitidee) finden wir den Gedanken der Approximation in
der Analysis wieder, zu deren wesentlichsten Aufgaben das Studium von Grenz-
prozessen gehört. Hier geht es darum, komplizierte mathematische Objekte (Funk-
tionen, Maße, Größen usw.) durch einfachere oder leichter zugängliche Objekte
anzunähern und die Näherungsfehler zu kontrollieren. Man hofft dabei, dass die
angenehmeren Eigenschaften der approximierenden Objekte an die approximierten
Objekte vererbt werden und dass parallel ablaufende infinitesimale Prozesse ver-
tauschbar sind.
Genau diese Hoffnung rückt die Idee der Approximation in den Bereich einer
wirklichen Heuristik – ob die Hoffnung erfüllt werden kann, hängt entscheidend
von der Qualität der Approximation ab, die sich in unterschiedlichen Konvergenz-
begriffen manifestiert; im Zusammenhang mit Funktionenfolgen muss z. B. zwi-
schen punktweiser Konvergenz, lokal-gleichmäßiger Konvergenz und gleichmäßi-
ger Konvergenz unterschieden werden, womit längst nicht alle Formen der Kon-
vergenz von Funktionenfolgen aufgezählt sind. Es ist also wesentlich, den Begriff
„Güte der Approximation“ als Fundament aller Approximationsmethoden heraus-
zuarbeiten. Zusammengefasst:
24
Diese Ungleichung geht auf ein anderes Mitglied der schweizer Mathematiker-Dynastie, näm-
lich auf Jakobs jüngeren Bruder J OHANN B ERNOULLI (1667–1748) zurück.
2.1 Heurismen der unvollendeten Induktion 177
Xn1
1
1C (wegen kŠ 2k1 für alle k 2 N)
2k
kD0
n
1 12
D1C (Summenformel für die geometrische Reihe)
1 12
1
1C 1 D 3:
2
178 2 Heurismen der Induktion
Das (streng) monotone Wachstum der Folge .sn /n2N wurde oben bereits durch den
Zinseszinseffekt plausibel gemacht, es lässt sich aber leicht auch theoretisch absi-
chern, denn für n > 1 ist
nC1 n
sn 1 n n
D n1 D 1 2
n
sn1 n n n1
n1
1 n
> 1n 2 (Bernoulli-Ungleichung)
n n1
D 1:
Da nun offenbar die Zahlen sn mit wachsendem n beständig größer werden, aber
nicht über den Wert 3 hinaus kommen können, ist es klar, dass der magischen Geld-
vermehrung durch Verkürzung der Zinszahlungszeiträume eine „Grenze“ gesetzt
ist, und es ist plausibel, dass man sich dieser „Grenze“ immer besser annähert,
wenn man sn für immer größere n berechnet.
Dies ist ein typisches Beispiel für die Bedeutung von Folgen und Grenzwer-
ten im Prozess der schrittweisen Annäherung an eine schwer zugängliche Größe.
Im Zeitalter B ERNOULLIs waren die Konzepte von Konvergenz und Grenzwert
einer Zahlenfolge noch wenig präzisiert; erst im 19. Jahrhundert begann die
exakte Grundlegung der Analysis mit der Präzisierung des Grenzwertbegriffs
durch AUGUSTIN -L OUIS C AUCHY (1789–1857) und durch K ARL W EIERSTRASS
(1815–1897). Die intuitiv einsichtige Vorstellung, dass eine monoton wachsende,
nach oben beschränkte Folge .an /n2N reeller Zahlen einen Grenzwert hat (und dass
dieser die kleinste obere Schranke (das Supremum) der Menge aller Folgenglieder
ist), ist derart plausibel, dass man sogar bereit sein könnte, diesen Umstand im
Rahmen einer axiomatischen Kennzeichnung der reellen Zahlen als Axiom auf-
zunehmen („Monotonieaxiom“), welches die Vollständigkeit und gleichzeitig die
Archimedizität von R beschreibt.25
Der Grenzwert der Folge .sn /n2N wird in Anlehnung an eine Abhandlung von
L EONHARD E ULER aus dem Jahr 1743 als die E ULERsche Zahl e bezeichnet.
Durch Systematisches Probieren (Berechnung von immer mehr Folgengliedern –
„Aufzählaspekt“ von Zahlenfolgen) kann man zu der Überzeugung kommen, dass
e 2;7180 eine Näherung von e mit drei gültigen Nachkommaziffern sein sollte,
weil sich bei sukzessiver Vergrößerung von n für n > 5000 in den Werten von sn
nur noch Veränderungen in der Größenordnung < 103 zu ergeben scheinen. Aber
Vorsicht! Ebenso hätte man in der Nähe von n D 1500 auf die Idee kommen kön-
25
In jedem angeordneten Körper .K; C; ; / sind das Supremumsaxiom („Jede nicht-leere, nach
oben beschränkte Teilmenge von K besitzt ein Supremum in K“) und das Monotonieaxiom („Jede
nach oben beschränkte, monoton wachsende Folge von Elementen aus K hat in K einen Grenz-
wert“) äquivalent. Beide beschreiben sowohl die Vollständigkeit von K als auch die Archimedizität
von K, welche sich getrennt durch das Intervallschachtelungsaxiom („Jede Intervallschachtelung
in K besitzt einen Kern in K“) und das Archimedische Axiom („Für alle a; b 2 K mit 0K < a < b
gibt es ein n 2 N mit na > b“) charakterisieren ließen. Umgekehrt kann man unter dem Postulat
der Axiomengruppe „Intervallschachtelungsaxiom und Archimedisches Axiom“ auf die Gültigkeit
von Monotonieaxiom und Supremumsaxiom schließen.
2.1 Heurismen der unvollendeten Induktion 179
nen, die Tausendstel-Ziffer 7 für eine gültige Ziffer zu halten, denn bei sukzessiver
Vergrößerung von n tat sich nicht mehr viel im Bereich der vierten Nachkomma-
stelle. Dennoch erreicht man nahe n D 5000 in sn die Tausendstel-Ziffer 8, und
woher soll man wissen, ob nicht vielleicht doch für hinreichend große n jeweils
sn > 2;719 gilt?
Erkenntnisse über die Güte der Approximation werden möglich, wenn man den
gesuchten Grenzwert von zwei Seiten approximiert, wenn man also eine Inter-
vallschachtelung durchführt. Neben der (streng) monoton wachsend gegen e kon-
vergenten Folge .sn /n2N betrachten wir zusätzlich die Folge .tn /n2N mit tn WD
.1 C n1 / sn für alle n 2 N. Dann gilt:
Die oben dokumentierte Annäherung an die E ULERsche Zahl wäre ein Bei-
spiel für lokale Approximation; es erfolgte eine Annäherung an einen einzigen
Punkt. Im Falle der Annäherung an kompliziertere, aus mehreren Elementen zu-
sammengesetzte mathematische Objekte muss man im Blick haben, dass diverse
lokale Approximationsprozesse gleichzeitig ablaufen müssen, was auch mit unter-
schiedlichen Geschwindigkeiten passieren darf. In dieser Situation spricht man von
globaler Approximation. Es scheint also passend, die Ausschöpfung krummlinig
begrenzter Flächen durch Polygonflächen, die auf E UDOXOS von Knidos (408–
355 v. Chr.) zurückgeht und den griechischen Mathematikern fortan als Substi-
tut für unsere Integralrechnung zur Verfügung stand, als einen Prozess der globa-
len Approximation anzusehen, auch wenn dieser mit der Zielsetzung erfolgt, ein
einziges Objekt, nämlich eine Zahl (ein Flächeninhaltsmaß oder eine Kurvenlän-
ge) anzunähern. Dieses für die Antike typische Verfahren geometrischer Appro-
ximation ist unter dem Namen „Exhaustionsmethode“ bekannt; die Bezeichnung
wurde im Jahre 1647 von G RÉGOIRE DE S AINT-V INCENT (1584–1667) einge-
führt.
In der Exhaustionsmethode kann sowohl eine der ältesten bekannten heuristi-
schen Strategien als auch eine der ersten präzisen Beweistechniken gesehen werden,
wobei die mathematisch strenge Verwendung der Methode mit dem Namen A R -
CHIMEDES von Syrakus (287–212 v. Chr.) assoziiert wird. In der Einleitung seines
Buches über die Quadratur der Parabel26 schreibt A RCHIMEDES, wie man bei H I -
SCHER und S CHEID27 nachlesen kann:
(. . . ) und zwar habe ich die Lösung des Problems zuerst durch Methoden der Mechanik
gefunden, alsdann durch Methoden der reinen Geometrie. Von den Forschern, die sich
früher mit Geometrie beschäftigten, versuchten einige zu zeigen, daß es möglich sei, ei-
ne geradlinig begrenzte Figur zu konstruieren, die einem gegebenen Kreise oder einem
gegebenen Kreiselement flächengleich ist. Alsdann versuchten sie das gleiche zu zeigen für
ein Ellipsensegment (. . . ) Daß aber je ein Mathematiker versucht hätte, die Fläche eines
Parabelsegments zu quadrieren, wie es mir gelungen ist, ist mir nicht bekannt. Ich zeige
nämlich, daß der Inhalt jedes Parabelsegments um ein Drittel größer ist als das Dreieck,
das mit ihm gleiche Grundlinie und Höhe hat. Dabei bediene ich mich folgenden Hilfssat-
zes zum Beweise: Es ist möglich, ein Vielfaches der Differenz zweier gegebener Größen zu
finden, das größer ist als eine beliebige gegebene Fläche. Die früheren Geometer haben
sich auch dieses Hilfssatzes bedient; denn daß der Inhalt der Kreisfläche dem Quadrat des
Radius proportional ist (. . . ) haben sie unter Benutzung dieses Hilfssatzes bewiesen.
Der von A RCHIMEDES erwähnte Hilfssatz ist nichts anderes als das Archime-
dische Axiom, welches allerdings schon im 4. Jahrhundert v. Chr. bei der axio-
matischen Grundlegung des „Größenbegriffs“ verwendet wurde, womit sich die
griechischen Mathematiker dieser Epoche in heutiger Terminologie den archime-
disch angeordneten Halbkörper der positiven reellen Zahlen als Arbeitsbereich ver-
26
In der Antike war man bemüht, krummlinig begrenzte Flächen mit Zirkel und Lineal in flächen-
inhaltsgleiche Quadrate zu verwandeln; daher hat sich damals für Flächeninhaltsbestimmungen
der Name „Quadratur“ durchgesetzt.
27
H ISCHER / S CHEID: Grundbegriffe der Analysis: Genese und Beispiele aus didaktischer Sicht.
Spektrum Akademischer Verlag, Heidelberg (1995).
2.1 Heurismen der unvollendeten Induktion 181
schafft haben. Auf welche Weise A RCHIMEDES unter Rückgriff auf dieses Axiom
bei seiner exakten Parabelquadratur ohne Grenzwertbegriff (!) auskommen konnte,
werden wir im folgenden Beispiel klären.
1.0
Man nennt C den Scheitel des Parabelsegments und seinen Normalabstand von
AB die Höhe des Parabelsegments; dieser Normalabstand von C zu AB ist gleich-
zeitig die Höhe des Dreiecks ABC .
In dieser Situation behaupteteA RCHIMEDES, den folgenden Flächeninhaltsver-
gleich anstellen zu können:
Ist A1 WD .ABC / der Flächeninhalt des Dreiecks ABC und ist S das
Flächenmaß des Parabelsegments über der Sehne AB, so gilt
4
SD A1 :
3
Zum Nachweis dieses Zusammenhangs zeichnete A RCHIMEDES in die beiden Pa-
rabelsegmente über den Parabelsehnen BC und AC nun erneut Dreiecke CBP
bzw. ACQ ein, deren Grundlinie und Höhe jeweils mit Grundlinie und Höhe der
zugehörigen Parabelsegmente übereinstimmten (Abb. 2.10).
182 2 Heurismen der Induktion
1.0
Aus heutiger Sicht wäre damit der Beweis der Formel erbracht, denn man könnte
über den Grenzwert der geometrischen Reihe argumentieren:
1 k
X 1 1 4
S D lim Sn D A1 D A1 D A1 :
n!1
kD0
4 1 1
4
3
2.1 Heurismen der unvollendeten Induktion 183
A RCHIMEDES stand allerdings kein Konzept zur Analyse des infiniten Prozesses
zur Verfügung; er gelangte durch das Studium endlicher geometrischer Reihen zu
der Vermutung S D 43 A1 , und zwar wie folgt:
Aus An D 14 An1 erhält man
1 4 4 1 1
An C An D An D An1 D An1 ;
3 3 3 4 3
daher ist
1 1
. / Sn C An D Sn1 C An C An
3 3
1
D Sn1 C An1 D : : :
3
1 4
D S1 C A1 D A1 :
3 3
Die der Anschauung zu entnehmende Einsicht, dass die Folge .Sn /n2N den gesuch-
ten Flächeninhalt S des Parabelsegments beliebig gut approximiert, wobei sich die
beim n-ten Schritt neu hinzukommenden Flächeninhalte An dem Maß 0 nähern,
macht den Zusammenhang S D 43 A1 plausibel, beweist ihn aber noch nicht. Den
endgültigen Beweis seiner heuristisch-induktiv gewonnenen Flächenformel führ-
te A RCHIMEDES apagogisch (doppelte Exklusion), indem er die Annahmen (1)
S < 43 A1 und (2) S > 43 A1 unter Rückgriff auf das Archimedische Axiom zum
Widerspruch führte.
4 1
A1 S D " > n1 A1 D An ;
3 4
4 1
A1 Sn D An < An ;
3 3
sodass man insgesamt auf die Beziehung
4 4
A1 Sn < A1 S
3 3
geführt wird, welche Sn > S zur Folge hat – dies ist nach Konstruktion von Sn aber
unmöglich.
184 2 Heurismen der Induktion
ˇ
< D˛ bzw. ˛ <
2 2 2
folgt. Mit anderen Worten: Der nach dem .k 1/-ten Schritt vorliegende Flächen-
überschuss S Sk1 wird im k-ten Schritt um mehr als die Hälfte reduziert, es ist
also n1 n
1 1 1
S Sn < .S Sn1 / < < .S S1 / < S:
2 2 2
Nach Wahl von n ist 2n " > S bzw. . 12 /n S < ", sodass sich insgesamt die
Ungleichung n
1 4
S Sn < S < " D S A1
2 3
ergibt. Dies ist nur für Sn > 43 A1 möglich, was aber im Widerspruch zu . / steht,
wonach Sn C 13 An D 43 A1 oder aber Sn D 43 A1 13 An < 43 A1 gilt.
Damit ist der Beweis der Flächeninhaltsformel für das Parabelsegment abge-
schlossen.
Vielleicht noch eine Bemerkung zur Präzision des oben angegebenen Bewei-
ses. H ISCHER und S CHEID gehen davon aus, A RCHIMEDES habe die Existenz
eines n 2 N mit der Eigenschaft S Sn < " der Anschauung entnommen. Der
Mathematikhistoriker H ANS -L UDWIG W USSING hielt es aber für denkbar, dass
A RCHIMEDES die folgende, in Buch X der Elemente des E UKLID notierte (und in
unserer Darstellung oben implizit hergeleitete) Folgerung aus dem Archimedischen
Axiom ohne weiteren Kommentar benutzt hat:
Nimmt man bei Vorliegen zweier ungleicher (gleichartiger) Größen von der größeren ein
Stück mehr als die Hälfte weg und vom Rest ein Stück größer als die Hälfte und wieder-
holt dies immer, dann muß einmal eine Größe übrig bleiben, die kleiner als die kleinere
Ausgangsgröße ist.
Vor diesem Hintergrund wäre die Stellungnahme von OTTO T OEPLITZ zur griechi-
schen Exhaustionsmethode, die er im Zusammenhang mit einem ähnlich geführten
Beweis des Satzes, dass sich die Flächenmaße zweier Kreise zueinander verhalten
wie die Quadrate der Kreisdurchmesser, abgegeben hat, besser nachvollziehbar:
2.1 Heurismen der unvollendeten Induktion 185
Damit ist der indirekte Beweis logisch lückenlos erbracht. Alles Mysterium, das dem un-
endlichen Prozeß sonst anhaftet, ist auf das Stetigkeitsaxiom28 geschoben, mit dem man
sich ein für allemal abzufinden hat, anstatt bei jedem Beweise erneut Anleihe bei dunklen
Evidenzen zu machen. Das ist der Sinn des griechischen Exhaustionsverfahrens.
X
k
f .j / .x0 /
f .x/ D .x x0 /j C r.x/.x x0 /k :
j D0
jŠ
Ist Œa; b R ein kompaktes Intervall, so lässt sich jede stetige Funktion
f W Œa; b ! R auf Œa; b gleichmäßig durch Treppenfunktionen approximieren
(globale Approximation).
Genauer gilt: Zu jedem " > 0 gibt es Treppenfunktionen 'W Œa; b ! R und
W Œa; b ! R mit
'.x/ f .x/ .x/ und j .x/ '.x/j < " für alle x 2 Œa; b ;
woraus insbesondere jf .x/'.x/j < " und jf .x/ .x/j < " für alle x 2 Œa; b
folgt.
28
Damit meint T OEPLITZ das Archimedische Axiom.
186 2 Heurismen der Induktion
Ist Œa; b R ein kompaktes Intervall, so lässt sich jede stetige Funktion
f W Œa; b ! R auf Œa; b gleichmäßig durch Polynome approximieren (globale
Approximation).
Das bedeutet: Zu jedem " > 0 gibt es ein Polynom P mit
An der letzten dieser Aussagen, welche auch unter dem Namen „W EIERSTRASS-
scher Approximationssatz“ bekannt ist, möchte ich noch einmal verdeutlichen, was
ich in der Charakterisierung des Heurismus der Approximation mit der Kontrolle
der Güte einer Approximation gemeint habe.
Die approximierenden Objekte sind hier Polynome, also C 1 -Funktionen; das
approximierte Objekt ist hier eine beliebige stetige Funktion. Da es stetige Funk-
tionen gibt, die nicht differenzierbar sind, ist die Approximation einer Funktion im
Sinne der gleichmäßigen Konvergenz offenbar nicht gut genug, um die über die
Stetigkeit hinausgehende Regularität der approximierenden Objekte an das appro-
ximierte Objekt zu vererben. Im Gegensatz dazu wird aber die Stetigkeit im Falle
(lokal-) gleichmäßiger Konvergenz auf die Grenzfunktion übertragen.
Im folgenden Beispiel werden wir uns insbesondere mit der Frage der Vertausch-
barkeit infinitesimaler Prozesse im Rahmen von Approximationsvorgängen befas-
sen.
Zb X
n X
n Zb
f .x/ ak x dx D
k
ak f .x/x k dx D 0 :
a kD0 kD0 a
Insbesondere gilt dies für solche Polynome P , mit denen man nach dem W EIER -
STRASSschen Approximationssatz die stetige Funktion f auf dem Intervall Œa; b
gleichmäßig approximieren kann. Das von f P approximierte Objekt ist f
2.1 Heurismen der unvollendeten Induktion 187
Rb
f D f 2 ; ließe sich also die „angenehme Eigenschaft“ a f .x/P .x/ dx D 0
der approximierenden Objekte an das approximierte Objekt vererben, dann wäre
Rb 2
a f .x/ dx D 0.
Gäbe es jetzt in dieser Situation ein x0 2 Œa; b mit f .x0 / ¤ 0, so wäre
f 2 .x0 / DW c > 0, und wir könnten die stetige Funktion f 2 nahe x0 durch die
konstante Funktion gW x 7! c approximieren. Dann fände man zu " WD c2 ein
ı > 0 derart, dass für alle x 2 Œa; b \ Œx0 ı; x0 C ı DW Œ˛; ˇ die Ungleichung
jf 2 .x/ cj < " erfüllt wäre, so dass insbesondere f 2 .x/ c2 für alle x 2 Œ˛; ˇ
gelten müsste. Aufgrund der Monotonie des Integrals und der Intervalladditivität
des Integrals wäre dann aber
Zb Z˛ Zˇ Zb
f .x/ dx D
2
f .x/ dx C
2
f .x/ dx C
2
f 2 .x/ dx
a a ˛ ˇ
Z˛ Zˇ Zb
c
0 dx C dx C 0 dx
2
a ˛ ˇ
c
.ˇ ˛/ > 0
2
Rb
im Widerspruch zu a f 2 .x/ dx D 0.
Folglich ist die Behauptung f
0 auf Œa; b in dem Moment bewiesen, wo
Rb 2
a f .x/ dx D 0 gezeigt ist. In der Hoffnung Rb
auf eine zielführende Einsicht be-
Rb
trachte man die Qualität der Annäherung von a f 2 .x/ dx durch a f .x/P .x/ dx,
quantifiziert durch die Differenz der Integrale. Offenbar gilt
Zb Zb Zb
f 2 .x/ dx f .x/P .x/ dx D f .x/ .f .x/ P .x// dx ;
a a a
Rb Rb
und man erkennt, dass wegen a f .x/P .x/ dx D 0 der Wert von a f 2 .x/ dx
Rb
durch den Wert von a f .x/.f .x/ P .x// dx bestimmt wird – dieser kann aber
durch geeignete Wahl des die Funktion f approximierenden Polynoms P kontrol-
liert werden. Präziser:
Ist " > 0 beliebig vorgegeben und M WD maxfjf .x/j j x 2 Œa; bg29 , so wähle
man gemäß dem W EIERSTRASSschen Approximationssatz ein Polynom P derart,
dass
1
M jf .x/ P .x/j < " für alle x 2 Œa; b
.b a/ C 1
29
Die stetige Funktion jf j nimmt auf dem Kompaktum Œa; b ihr Maximum an.
188 2 Heurismen der Induktion
Zb Zb
0 f .x/ dx D
2
f .x/ .f .x/ P .x// dx
a a
Zb
jf .x/j jf .x/ P .x/j dx
a
Zb
M jf .x/ P .x/j dx
a
1
< .b a/ " < ":
.b a/ C 1
Rb
Da 0 a f 2 .x/ dx < " für jedes beliebige " > 0 gilt, ist zwangsläufig
Rb 2
a f .x/ dx D 0, was den Beweis der Behauptung abschließt.
Implizit ist in obiger Argumentation auch der Schlüssel30 zur Erkenntnis ent-
halten, dass bei gleichmäßiger Konvergenz stetiger Funktionenfolgen die infinitesi-
malen Prozesse der Integration und des Übergangs zur Grenzfunktion miteinander
vertauscht werden können: Ist .hn /n2N eine Folge auf Œa; b stetiger Funktionen,
welche auf Œa; b gleichmäßig gegen die (dann zwangsläufig stetige) Grenzfunktion
h konvergiert, so gilt bekanntlich
Zb Zb Zb
h.x/ dx D lim hn .x/ dx D lim hn .x/ dx :
n!1 n!1
a a a
Rb
Mit diesem Wissen lässt sich der Nachweis von a f 2 .x/ dx D 0 leichter führen:
Ist .Pn /n2N eine Folge von Polynomen, welche auf Œa; b gleichmäßig gegen
die stetige Funktion f konvergiert, so konvergiert die Funktionenfolge .f Pn /n2N
stetiger Funktionen auf Œa; b gleichmäßig gegen die stetige Funktion f 2 , und man
erhält
Zb Zb
f .x/ dx D lim
2
f .x/Pn .x/ dx D lim 0 D 0 ;
n!1 n!1
a a
Wir beschließen den Abschnitt über Näherungsprozesse mit einem Beispiel für
Erkenntnisgewinn in der Analysis durch lokale Approximation von Funktionen,
30
Zielführend ist in den meisten Grenzbetrachtungen für Integralfolgen im Kontext gleichmäßiger
Rb Rb
Konvergenz eine Standard-Abschätzung vom Typ j a h.x/ dxj a jh.x/j dx .ba/khkŒa;b ,
wobei khkŒa;b WD supfjh.x/j j x 2 Œa; bg die Supremumsnorm von h auf Œa; b bezeichnet.
2.1 Heurismen der unvollendeten Induktion 189
das durch seine enorme Tragweite beeindruckt – das als C AUCHYscher Integral-
satz bekannte Theorem beherrscht mit seinen Konsequenzen die gesamte klassische
Funktionentheorie. Der Satz besagt:31
Sei U C offen, f eine auf U komplex differenzierbare Funktion und sei
R WD fz D x C iy j a x b ; c y d g U
ein in U enthaltenes kompaktes Rechteck. Dann gilt für jeden geschlossenen Inte-
grationsweg32 in U , welcher den Rand @R von R parametrisiert:33
Z Z
f .z/ dz DW f .z/ dz D 0 :
@R
Bekannt war dieser Sachverhalt schon C ARL F RIEDRICH G AUSS, wie aus dem
berühmten Brief von G AUSS an F RIEDRICH W ILHELM B ESSEL (1784–1846) vom
18. Dezember 1811 hervorgeht; allerdings hat G AUSS seine Kenntnisse nicht vor
1831 veröffentlicht, sodass der Satz zu Recht C AUCHYs Namen trägt.
In den im 19. Jahrhundert geführten Beweisen des C AUCHYschen Integralsatzes
wurden ausschließlich reelle Methoden verwendet, wie etwa die folgende:
Ist f WD u C iv mit u D Re f und v D Im f sowie z D x C Riy mit x D Re z
und y D Im z () dz D dx C idy), so zerfällt das Randintegral @R f .z/ dz über
den positiv orientierten Rand @R von R in die Summanden
Z Z Z
f .z/ dz D .u.z/dx v.z/dy/ C i .v.z/dx C u.z/dy/ :
@R @R @R
Wenn nun f 0 stetig ist, dann kann man die beiden reellen Integrale auf der rechten
Seite mit dem Satz von Stokes34 bzw. dem schon im ersten Viertel des 19. Jahrhun-
derts unter dem Namen Satz von Green35 bekannten Spezialfall weiter umformen,
31
Es gibt viele verschiedene Versionen des C AUCHYschen Integralsatzes, die sich mehr in ih-
rem topologischen als in ihrem analytischen Inhalt unterscheiden. Die hier zitierte Form ist als
C AUCHYscher Integralsatz für Rechtecke bekannt und entspricht den topologischen Bedingungen
in der Originalarbeit von C AUCHY aus dem Jahr 1825.
32
Ein geschlossener Integrationsweg in G ist durch eine stückweise stetig differenzierbare Funk-
tion W Œa; b ! G mit .a/ D .b/ gegeben, wobei Œa; b R ein kompaktes Intervall ist.
Die Bildmenge Sp WD .Œa; b/ G wird als die Spur von bezeichnet; tritt eine Teilmen-
ge M C als Spur eines Integrationsweges auf, so sagt man, parametrisiere M . Es ist in
der Funktionentheorie üblich, einen Weg und seine Spur mit demselben Symbol zu kennzeichnen,
wenn Missverständnisse ausgeschlossen sind.
33
Ist W Œa; b ! C ein Integrationsweg und f eine auf Sp stetige Funktion, so
R Rb 0
ist f .z/ dz WD a f ..t // .t / dt („Wegintegral von f längs “).
34
Benannt nach G EORGE G ABRIEL S TOKES (1819–1903).
35
Benannt nach G EORGE G REEN (1793–1841).
190 2 Heurismen der Induktion
Die Integranden beider Flächenintegrale sind jeweils identisch null, weil f komplex
differenzierbar ist, denn dann36 erfüllen u D Re f und v D Im f die C AUCHY-
R IEMANNschen Differenzialgleichungen
@u @v @u @v
D und D :
@x @y @y @x
R
Also gilt auch @R f .z/ dz D 0.
In der Tat musste in allen frühen Beweisen des C AUCHYschen Integralsatzes
die Voraussetzung der Stetigkeit von f 0 explizit (oder stillschweigend) verwendet
werden. Wie ärgerlich die Notwendigkeit dieser Zusatzannahme beim Aufbau der
Funktionentheorie ist, wird deutlich, wenn man eine der Konsequenzen des Theo-
rems betrachtet:
Warum sollte für f die stetige komplexe Differenzierbarkeit gefordert werden müs-
sen, wo sich doch dann für f .k/ mit k 2 die Stetigkeit von f .k/ automatisch aus
der komplexen Differenzierbarkeit von f .k/ ergibt?
Es dauerte aber bis zum Ende des 19. Jahrhunderts, bevor E DOUARD G OUR -
SAT (1858–1936) der erste Beweis des C AUCHYschen Integralsatzes für Rechtecke
ohne Stetigkeitsforderungen an f 0 gelang. Unter dem Gesichtspunkt „lokale Ap-
proximation“ soll G OURSATs eleganter Beweis nun vorgestellt werden.
36
Genauer gilt sogar: f ist komplex differenzierbar genau dann, wenn f reell differenzierbar ist
und die C AUCHY-R IEMANN schen Differenzialgleichungen für f erfüllt sind.
37
Dies ergibt sich mithilfe der C AUCHYschen Integralformel, welche ihrerseits aus dem
C AUCHYschen Integralsatz folgt.
2.1 Heurismen der unvollendeten Induktion 191
G OURSATs Beweis verzichtet völlig auf reelle Methoden der Analysis und cha-
rakterisiert die komplexe Differenzierbarkeit einer Funktion über eine formal der
rellen Situation entsprechende Linearisierungsbedingung:
Die Funktion f W U ! C ist genau dann komplex differenzierbar, wenn es zu
jedem z0 2 U eine in z0 stetige Funktion rW U ! C mit r.z0 / D 0 gibt, sodass
für alle z 2 U gilt:
38
Jede monoton wachsende (fallende) und nach oben (nach unten) beschränkte Folge reeller Zah-
len ist in R konvergent.
39
Jede nach oben beschränkte, nicht-leere Teilmenge von R besitzt in R ein Supremum.
192 2 Heurismen der Induktion
B OLZANO -W EIERSTRASS40 oder den Zwischenwertsatz41 geht; auch als ein auf
der Vollständigkeit von R beruhendes Nullstellenverfahren tritt die Bisektionsme-
thode unter der Bezeichnung „Intervallhalbierungsverfahren“ in Erscheinung.
4 Z
X Z
f .z/ dz D f .z/ dz ;
i D1
@R.i / @R
denn die Teilwege längs der Symmetrieachsen von R werden jeweils zweimal in
entgegengesetzten Richtungen durchlaufen, sodass sich die Integrationen längs die-
ser Teilwege neutralisieren (Abb. 2.11).
Ist nun R1 unter den Teilrechtecken R.i / so gewählt, dass das Randintegral über
@R1 maximalen Betrag hat (! Extremalprinzip), so folgt wegen
ˇ ˇ ˇ ˇ ˇ ˇ
ˇZ ˇ ˇ 4 Z ˇ 4 ˇ Z ˇ
ˇ ˇ ˇX ˇ X ˇ ˇ
ˇ f .z/ dz ˇ D ˇ f .z/ dz ˇ ˇ f .z/ dz ˇ;
ˇ ˇ ˇ ˇ ˇ ˇ
ˇ ˇ ˇ i D1 .i / ˇ i D1 ˇ .i / ˇ
@R @R @R
40
Jede unendliche, beschränkte Teilmenge von R besitzt in R einen Häufungspunkt. Dieser Satz
ist nach B ERNHARD B OLZANO und K ARL W EIERSTRASS benannt.
41
Jede auf einem Intervall I R stetige Funktion, welche die Werte ˛ und ˇ (˛ < ˇ) annimmt,
nimmt auch jeden Wert 2 Œ˛; ˇ zwischen ˛ und ˇ als Funktionswert an.
2.1 Heurismen der unvollendeten Induktion 193
abschätzen lässt. Außerdem gilt für die Länge L.@R1 / des Integrationsweges @R1
und den Durchmesser D.R1 / des Teilrechtecks R1 :
1 1
L.@R1 / D L.@R/ und D.R1 / D D.R/ ;
2 2
wenn L.@R/ bzw. D.R/ die Länge des Integrationsweges @R bzw. den Durchmesser
des Rechtecks R bezeichnen.
Auf R1 wende man nun eine analoge Bisektion an, dann erhält man ein Teil-
rechteck R2 von R1 mit
ˇ ˇ ˇ ˇ
ˇZ ˇ ˇ ˇ ˇˇ Z ˇ
ˇ
ˇ ˇ 1ˇZ ˇ 2ˇ ˇ
ˇ ˇ ˇ ˇ 1 ˇ f .z/ dz ˇ
ˇ f .z/ dz ˇ ˇ f .z/ dz ˇ ˇ ˇ
ˇ ˇ 4ˇ ˇ 4 ˇ ˇ
ˇ @R2 ˇ ˇ @R1ˇ @R
und
2 2
1 1 1 1
L.@R2 / D L.@R1 / D L.@R/ sowie D.R2 / D D.R1 / D D.R/ :
2 2 2 2
Wird der Bisektionsprozess in gleicher Weise fortgesetzt, so erhält man eine Folge
.Rn /n2N von Rechtecken mit folgenden Eigenschaften:
(1) Es ist R
R1
R2
R3
Rn
RnC1
: : :
(2) Für n 2 N gilt L.@R
R n / D . 2 / L.@R/
1 n
R und D.Rn / D . 2 / D.R/.
1 n
T
Aus (1) und (2) folgt, dass es ein z0 2 C mit n2N Rn D fz0 g gibt.42
Dieser Punkt z0 ist der gesuchte Punkt in U , in dem die komplex differenzierbare
Funktion f durch ihre Linearisierung f .z0 / C f 0 .z0 /.z z0 / so gut approximier-
bar ist, dass das Randintegral über den Fehlerterm
R r.z/.z z0 / kontrollierbar bleibt;
daraus erhält man eine Abschätzung für j @R f .z/ dzj, die den C AUCHYschen In-
tegralsatz beweist.
Sei dazu " > 0 beliebig vorgegeben. Weil r in z0 stetig ist, gibt es ein ı > 0
derart, dass für alle z 2 U mit jz z0 j < ı gilt:
"
jr.z/ r.z0 /j D jr.z/j < :
L.@R/ D.R/
42
Wird aus jedem Rn ein Punkt zn gewählt, so hat die beschränkte Folge .zn /n2N in R1 nach dem
Satz von B OLZANO -W EIERSTRASS einen Häufungspunkt z0 , der zu R1 gehört, weil R1 kompakt
ist. Nach (1) ist aber für jedes > 1 der Punkt z0 auch Häufungspunkt
T der Folge .zn /n in R
und liegt deshalb imT Kompaktum R . Mehr als einen Punkt kann n2N Rn wegen (2) aber nicht
enthalten, woraus n2N Rn D fz0 g folgt. Alternativ hätte man auch die Intervallschachtelungen
betrachten können, die durch die Projektionen der Rechtecksfolge .Rn /n2N auf die reelle bzw. die
imaginäre Achse für Re z0 bzw. für Im z0 gegeben sind.
194 2 Heurismen der Induktion
Gemäß (2) kann n 2 N so groß gewählt werden, dass D.Rn / D . 12 /n D.R/ < ı
erfüllt ist. Dann gilt wegen (3):
ˇ ˇ ˇ ˇ
ˇZ ˇ ˇZ ˇ
ˇ ˇ ˇ ˇ
ˇ
ˇ f .z/ dz ˇ 4n ˇ ˇ
ˇ ˇ f .z/ dz ˇ
ˇ ˇ ˇ ˇ
@R ˇ @Rn ˇ
ˇ ˇ
ˇZ Z ˇ
ˇ ˇ
nˇ 0 ˇ
D4 ˇ f .z0 / C f .z0 /.z z0 / dz C r.z/.z z0 / dz ˇ
ˇ ˇ
ˇ @Rn @Rn ˇ
ˇ ˇ
ˇZ ˇ
ˇ ˇ
ˇ ˇ
D 4n ˇ r.z/.z z0 / dz ˇ
ˇ ˇ
ˇ @Rn ˇ
"
< 4n L.Rn /D.Rn / D ":
L.@R/ D.R/
R R
Da j @R f .z/ dzj < " für jedes " > 0 gilt, folgt @R f .z/ dz D 0, womit der Beweis
des C AUCHYschen Integralsatzes für Rechtecke erbracht wäre.
Die Aussage des C AUCHYschen Integralsatzes für Rechtecke lässt sich wesent-
lich verschärfen; so gilt z. B.
Z
f .z/ dz D 0
43
Einfach-zusammenhängende Gebiete G C lassen sich auf viele unterschiedliche Weisen
charakterisieren. Eine sehr anschauliche Beschreibung ist: .C n G/ hat keine beschränkten Zu-
sammenhangskomponenten, G hat also keine „Löcher“.
2.1 Heurismen der unvollendeten Induktion 195
In Abschn. 2.1 werden heuristische Strategien diskutiert, die den Denkmustern der
Induktion zuzuordnen sind; diese begleiten den schöpferischen Prozess der „im Ent-
stehen begriffenen“ Mathematik bei der Problemfindung und der Problemlösung,
bei der Begriffsbildung und sogar bei der Beweisführung. Zur Abgrenzung gegen
Formen induktiven Schließens, welche demonstrativen Charakter haben (Vollstän-
dige Induktion), ist bei den hier vorgestellten Strategien die Rede von Heurismen
der unvollendeten Induktion.
Bereits im Mathematikunterricht der Primarstufe kann der
verständlich beschreiben: Beginnt die Lösungssuche bei (A) und versucht man sich
progressiv von den bekannten Daten der Problemstellung zum Zielzustand (Z) vor-
zuarbeiten, dann handelt es sich um das als „Vorwärtsarbeiten“ bezeichnete indukti-
ve Vorgehen. Dieses ist nicht unbedingt mit der Synthesis der klassisch-griechischen
Analysis-Synthesis-Prozeduren zu identifizieren, da dort die Synthese ihre Wirk-
samkeit vorwiegend im Zusammenspiel mit der Analyse entfaltet und eher die Rolle
einer vorwärts gerichteten Ausführung eines Plans spielt, der regressiv entworfen
wurde.
Reines Vorwärtsarbeiten erfordert Einsicht in die deep structures einer Problem-
stellung, damit man sich zielgerichtet von (A) nach (Z) bewegen kann, auch wenn
196 2 Heurismen der Induktion
sich die Pfade verzweigen; daher ist es erklärlich, dass reine Vorwärtsstrategien in
erster Linie von Experten eingesetzt werden.
Der Verzweigungsproblematik des Vorwärtsarbeitens versucht man bisweilen
dadurch Herr zu werden, dass man aus einer Gesamtheit von Lösungsschritten zu
verschiedenen Teilzielen stets solche Schritte auswählt, die den größten Fortschritt
versprechen. Diese Strategie lässt sich metaphorisch so deuten, dass man auf dem
Weg von (A) nach (Z), wobei sich (A) am Fuß und (Z) auf dem Gipfel eines Berges
befinden, ausschließlich und dabei möglichst steil bergauf vorangeht; das erklärt
den Namen
Hill Climbing
Nach wie vor gilt, dass die Phasen einander wechselseitig beeinflussen und des-
halb im Sinne eines heuristischen Kreislaufs ggf. mehrfach zu durchlaufen sind.
Die vollständige Induktion ist ein Beweisverfahren, das häufig von Nutzen ist bei der Verifi-
zierung mathematischer Vermutungen, zu denen man durch irgendein induktives Verfahren
gelangt ist. Wollen wir uns daher Erfahrung in induktiver mathematischer Forschung an-
eignen, so ist es wünschenswert, die Technik der vollständigen Induktion einigermaßen zu
beherrschen.
An dieser Beschreibung wird deutlich, dass die vollständige Induktion zwar nur
schwer als autonome heuristische Strategie eingestuft werden kann, dass aber ein
Ineinandergreifen heuristischer (! unvollendete Induktion) und demonstrativer
Vorgehensweisen im Kontext der vollständigen Induktion realisierbar und dem ma-
thematischen Erkenntnisgewinn förderlich ist. Nicht zuletzt deshalb scheinen kriti-
sche Anmerkungen44 wie
Mit geringen Anforderungen an das Denkvermögen wird man unter Einhaltung formaler
Rechenregeln zielsicher auf die Lösung (. . . ) geführt . . . ,
Ist A.n/ eine Aussageform, bei der eine Peano-Algebra M einen zulässigen Ob-
jektbereich für die Variable n bildet, und ist eine Aussage vom Typ „Für alle
n 2 M gilt A.n/“ zu zeigen, dann könnte man einen Beweis mittels vollständi-
ger Induktion versuchen.
44
M. G LATFELD in Überlegungen zum Induktionsbegriff – unter fachdidaktischer Hinsicht. Verlag
Peter Lang, Frankfurt (1987).
45
Eine Bezeichnung für die Handlung, mit der man die Induktionsvoraussetzung für die Durch-
führung des Induktionsschlusses nutzbar machen kann.
2.2 Vollendete Induktion 199
wenn man sich die Wirkungsbedingungen der vollständigen Induktion etwas ge-
nauer ansieht.
Aus philosophischer Perspektive ist die vollständige Induktion ein faszinierendes
Verfahren, beweist sie doch mit endlichen Mitteln unendlich viele Aussagen (im Fall
M D N: A.1/ gilt, A.2/ gilt, A.3/ gilt, A.4/ gilt, A.5/ gilt, . . . ).
Prinzipiell ist es nicht möglich, universelle Aussagen wie
aus einer endlichen Anzahl singulärer Bestätigungen („Dieser Rabe hier ist schwarz.“
„Jener Rabe dort ist ebenfalls schwarz.“ . . . ) zu deduzieren, und zwar unabhängig
davon, wie viele Verifikationen an Einzelfällen vorgenommen werden;46 lediglich
die Plausibilität der Allaussage wächst mit der Anzahl der Bestätigungen, die man
in Einzelfällen erhalten hat, ohne auf ein Gegenbeispiel zu stoßen.
Diese Einsicht hat zu einer Vielzahl unterschiedlicher Ansätze zur Rechtferti-
gung oder zur Ablehnung induktiver Schlüsse in den Wissenschaften geführt; in der
Mathematik aber scheint das „Induktionsproblem“ der Erkenntnistheorie im Zu-
sammenhang mit universellen Aussagen im Kontext der natürlichen Zahlen nicht
zu existieren.
Dies ist einzig und allein auf die induktive Struktur des Zahlenbereichs N, wie
sie durch dessen axiomatische Beschreibung nach R ICHARD D EDEKIND (1831–
1916) und nach G IUSEPPE P EANO (1852–1932) zum Ausdruck gebracht wird,
zurückzuführen:
Definition (Peano-Algebra)
Für eine Menge M , ein Objekt e und eine einstellige Funktion ' nennt man das
Tripel .M; e; '/ eine Peano-Algebra, wenn gilt:
46
Solange es weniger sind als die (endliche) Anzahl aller Raben, die die Erde je bevölkert haben
und noch bevölkern werden.
200 2 Heurismen der Induktion
Dieses Axiom verleiht dem Beweisverfahren der vollständigen Induktion die Fä-
higkeit, mit einem endlichen Argument unendlich viele Wahrheiten zu sichern; aus
(P 5) ergibt sich nämlich, dass Folgendes richtig ist:
richtig ist, dann besitzt T die Eigenschaften e 2 T und '.T / T , sodass man mit
(P 5) auf T D M schließen kann und folglich A.x/ für alle x 2 M gilt.
Sowohl der Induktionsanfang als auch der Induktionsschluss sind endliche Ar-
gumente – beim Induktionsanfang ist dies offensichtlich, beim Induktionsschluss
nicht unmittelbar, weil es sich schließlich um eine Allaussage handelt. Trotzdem
genügt es offenbar, für ein beliebiges Element x 2 M zu zeigen, dass die Implika-
tion A.x/ ) A.'.x// wahr ist, denn dann gilt A.x/ ) A.'.x// für alle x 2 M .
Der Schluss von
auf
ist deshalb demonstrativ, weil es sich um einen induktiven Schluss nach vollständi-
ger Aufzählung handelt:
Die unendlich vielen Schritte, die eigentlich beim Induktionsschluss durchge-
führt werden müssen, sind formal alle gleich und können deshalb mit variablem x
alle gleichzeitig vollzogen werden.
Man muss sich allerdings sorgfältig davon überzeugen, dass die Argumente tat-
sächlich formal alle gleich sind, also für jedes x 2 M grundsätzlich gültig wären –
anderenfalls verliert die aufzählende Induktion ihre Vollständigkeit und damit ihren
demonstrativen Charakter. Sehen wir uns dazu ein typisches Beispiel an.
2.2 Vollendete Induktion 201
Das oben benutzte formale Argument gilt also nicht für jedes beliebige n 2 N, son-
dern nur für alle n 2 N mit n 2 – die aufzählende Induktion ist nicht vollständig,
sie hat keine Beweiskraft.
Der Rahmen für den oben (falsch) durchgeführten Induktionsbeweis war die
P EANO-Algebra .N; 1;
/ mit der Nachfolgerfunktion
, in der Allaussagen der
Form
auf der Grundlage von (PKE) dienen, die in der Regel folgendermaßen strukturiert
ist:
Man nehme an, es gebe ein n0 2 N, für welches A.n0 / nicht gilt. Dann ist
M WD fn 2 N j :A.n/ ist wahrg nicht leer und besitzt nach (PKE) ein kleinstes
Element m. Man versuche, die Existenz dieses kleinsten Elements m von M zum
Widerspruch zu führen.
Die heuristische Strategie besteht offenbar darin, die Monsterfunktion des Ex-
tremalen in einem Widerspruchsbeweis zu nutzen; das prozessorientierte Indukti-
onsprinzip ist mit dem objektorientierten Extremalprinzip verwandt, das hier seine
Wirkung in einer Analysis-Synthesis-Prozedur entfaltet. Üblicherweise hat die da-
bei durchzuführende reductio ad absurdum folgende Struktur:
Zur Illustration des oben beschriebenen Perspektivwechsels betrachten wir ein ein
letztes Beispiel.
Zu je zwei P EANO-Algebren .M; e; '/ und .N; f; / gibt es eine bijektive Abbildung ˛W M !
47
a) auf der Grundlage von (P 5); b) auf der Grundlage von (PKE),
dass ein Produkt von n aufeinander folgenden natürlichen Zahlen stets durch nŠ
teilbar ist.
Zu a): Der Versuch eines Beweises durch vollständige Induktion über n wird
vom Problemcharakter her in kanonischer Weise nahegelegt.
Der Induktionsanfang bereitet keine Probleme, weil 1Š D 1 Teiler einer jeden
natürlichen Zahl ist – hier ist nichts zu zeigen.
Nehmen wir also an, für irgendein beliebiges, aber festes n 2 N sei sicherge-
stellt, dass nŠ ein Teiler jedes Produktes von n aufeinander folgenden natürlichen
Zahlen ist (Induktionsvoraussetzung).
Zu zeigen ist, dass dann .n C 1/Š ein Teiler jedes Produktes von .n C 1/ aufein-
ander folgenden natürlichen Zahlen ist (Induktionsbehauptung).
Sei ein solches Produkt PnC1 von .n C 1/ aufeinander folgenden natürlichen
Zahlen vorgelegt; dann gibt es ein k 2 N0 derart, dass sich PnC1 in der Form
Y
nC1
PnC1 D .k C 1/ .k C 2/ .k C n/ .k C n C 1/ D .k C j /
j D1
PnC1 D .k C 1/ .k C 2/ .k C n/ .k C n C 1/
Yn
D .k C n C 1/ .k C j /
j D1
Y
n Y
n
Dk .k C j / C .n C 1/ .k C j /
j D1 j D1
Y
n Y
n
D .k C j / C .n C 1/ .k C j / :
j D0 j D1
Q
Laut Induktionsvoraussetzung ist nŠ ein Teiler von jnD1 .k C j /, also .n C 1/Š ein
Qn
Teiler von .n C 1/ j D1 .k C j /. Folglich gilt für k 2 N0 :
. / .n C 1/Š j .k C 1/ .k C 2/ .k C n C 1/
, .n C 1/Š j k .k C 1/ .k C n/ ;
und das ist die Aussage, die wir jetzt mittels vollständiger Induktion bewiesen ha-
ben, wenn wir uns noch davon überzeugen, dass sie für n D 1 korrekt ist – das steht
aber außer Zweifel, weil das Produkt zweier aufeinander folgender ganzer Zahlen
stets gerade ist.
Strukturell bemerkenswert an diesem Perspektivwechsel ist, dass man durch In-
duktion über n einen Rekursionsschluss von .k C 1/ auf k gewinnen kann, den man
jetzt nur progressiv (durch Induktion über k) ausführen muss, um die Teilbarkeit
von PnC1 durch .n C 1/Š zu beweisen:
Für k D 0 und beliebiges n 2 N gilt offenbar
.n C 1/Š j k .k C 1/ .k C n/ ;
„ ƒ‚ …
D0
.n C 1/Š j k .k C 1/ .k C n/
.n C 1/Š j .k C 1/ .k C 2/ .k C n C 1/
der Tatsache, dass nŠ jedes Produkt von n aufeinander folgenden natürlichen Zahlen
teilt, ist gelungen.
Zu b) Wir führen nun den Beweis auf der Grundlage von (PKE) in Anlehnung
an die oben formulierte Beweisheuristik.
Angenommen, es gibt ein n 2 N, zu dem man ein Produkt von n aufeinander
folgenden natürlichen Zahlen finden kann, welches nicht durch nŠ teilbar ist. Laut
(PKE) gibt es dann eine kleinste natürliche Zahl m mit dieser Eigenschaft; offenbar
ist m > 1, weil jede Zahl durch 1Š D 1 teilbar ist.
Unter allen Produkten von m aufeinander folgenden natürlichen Zahlen, die
nicht durch mŠ teilbar sind, wähle man jetzt das kleinste Produkt Pm aus – dies
ist wieder nach (PKE) möglich.
Sei jetzt k 2 N0 so gewählt, dass
Pm D .k C 1/ .k C 2/ .k C m 1/ .k C m/
Pm D .k C 1/ .k C 2/ .k C m 1/ k
C .k C 1/ .k C 2/ .k C m 1/ m
D k .k C 1/ .k C 2/ .k C m 1/
C .k C 1/ .k C 2/ .k C m 1/ m
DW Pm0 C Pm1 m :
Pm0 D k .k C 1/ .k C 2/ .k C m 1/
ist ein Produkt von m aufeinander folgenden natürlichen Zahlen, und es gilt Pm0 <
Pm . Weil nun Pm das kleinste aller Produkte von m aufeinander folgenden natürli-
chen Zahlen ist, welches nicht durch mŠ teilbar ist, muss gelten:
mŠ j Pm0 (1)
Pm1 D .k C 1/ .k C 2/ .k C m 1/
des zweiten Summanden ist ein Produkt von .m 1/ aufeinander folgenden natür-
lichen Zahlen, und wegen m > 1 ist .m 1/ 2 N. Aufgrund der Minimalität von
m unter allen natürlichen Zahlen n mit der Eigenschaft, dass man ein Produkt von
n aufeinander folgenden natürlichen Zahlen finden kann, welches nicht durch nŠ
teilbar ist, muss .m 1/Š j Pm1 und deshalb
mŠ j Pm1 m (2)
206 2 Heurismen der Induktion
gelten. Aus (1) und (2) ergibt sich aber mithilfe der Summenregel der Teilbarkeit48 ,
dass mŠ ein Teiler von Pm ist – dies steht im Widerspruch zur Wahl von m und
von Pm . Damit ist der Beweis der Aussage, dass jedes Produkt von n aufeinander
folgenden natürlichen Zahlen durch nŠ teilbar ist, auf der Grundlage von (PKE)
geführt.
Zu klären bliebe noch die Frage, weshalb Beispiel 2.8 unter dem Titel „Binomi-
alkoeffizienten einmal anders“ geführt wird.
Offenbar gilt genau dann nŠ j .k C 1/ .k C n/, wenn
.k C 1/ .k C n/ kŠ .k C 1/ .k C n/ .k C n/Š
D D
nŠ nŠ kŠ nŠ kŠ
eine natürliche Zahl ist. Der
letzte
Bruch jedoch ist nur eine andere Schreibweise für
den Binomialkoeffizienten kCn n , und kennt man dessen kombinatorische Bedeutung
als Anzahl der n-Teilmengen einer .k C n/-Menge,49 so ist nichts weiter zu zeigen.
Beispiel 2.8 dient nicht nur als weiterer Beleg dafür, dass ein Beweis mittels
vollständiger Induktion in der Regel nicht der eleganteste denkbare Beweis ist, son-
dern es verdeutlicht auch exemplarisch, dass es sich bei Induktion und Rekursion
um zwei Seiten derselben Medaille handelt.
Ist eine Zahlenfolge .an /n2N rekursiv definiert, so kann man beispielsweise
jedes n-te Folgenglied aus dem (den) vorigen Folgenglied(ern) berechnen oder
auch
ihre Eigenschaften induktiv dadurch beweisen, dass man den durch die Rekursi-
onsvorschrift beschriebenen Zusammenhang im Induktionsschritt verwendet.
48
Aus t j a und t j b folgt stets t j .a C b/.
49
Vgl. dazu die Ausführungen zu den vier kombinatorischen Grundaufgaben in Abschn. 1.2.5.
Heurismen der Reduktion
3
Inhaltsverzeichnis
3.1 La Descente Infinie – der unendliche Abstieg . . . . . . . . . . . . . . . . . . . . . . . . . 208
3.2 Rückwärtsarbeiten und Pappos-Prinzip . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 219
3.3 Modularisierung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 236
3.4 Quintessenz für Problemlöser . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 258
Es wurde bereits angedeutet, dass man es bei den Heurismen der Reduktion mit
Strategien zu tun hat, die überwiegend regressiv orientiert sind. Dies hat zur Folge,
dass die betreffenden Strategien – im Gegensatz zu den Heurismen der Induktion –
kaum bei der Problemfindung, sondern vorwiegend beim Problemlösen im engeren
Sinne eingesetzt werden.
Nach A LFRED S CHREIBER handelt es sich bei den Heurismen der Reduktion
mehrheitlich um Verfahren mit logischem Charakter, mit denen man nach Voraus-
setzungen oder nach falschen Konsequenzen sucht; diese Charakterisierung rückt
sofort die Argumentation durch Widerspruch ins Blickfeld reduktiver Strategien,
zumal der namensgebende Begriff reductio (lat: Zurückführung) für die hier be-
trachtete Klasse von Heurismen ein Bestandteil der lateinischen Bezeichnung „re-
ductio ad absurdum“ dieses logischen Instruments ist.
Die vielfältigen semantischen Bezüge von „Reduktion“ verlangen aber eine ge-
wisse Vorsicht bei der Zuordnung, wie es beispielsweise im Zusammenhang mit
P ÓLYAs Charakterisierung des D ESCARTESschen Schemas (Abschn. 1.1.2) deut-
lich wird:
Obwohl mehrfach davon die Rede ist, man solle ein Problem des Sachzusam-
menhangs A auf ein Problem des Kontextes B reduzieren, steht bei der empfohlenen
Vorgehensweise eigentlich die Neurepräsentation des Problems in einem anderen
Begriffssystem im Vordergrund, womit in erster Linie der Heurismus der Variation
der Darstellung angesprochen wäre. Ebenso wenig sollte eine heuristische Strate-
gie nur deshalb den Heurismen der Reduktion zugeordnet werden, weil sie eine
Reduktion der Problemkomplexität bewirkt – viele Strategien der unterschiedlichs-
ten Merkmale erfüllen diese Funktion.
© Springer-Verlag GmbH Deutschland, ein Teil von Springer Nature 2018 207
W. Schwarz, Problemlösen in der Mathematik, https://doi.org/10.1007/978-3-662-56762-3_3
208 3 Heurismen der Reduktion
Wir beginnen unsere Systematik der Heurismen der Reduktion mit einem Denk-
muster, das von besonderem historischen Interesse ist. Es handelt sich um eine Ar-
gumentationsform, welche eine besondere Ausprägung des Extremalprinzips dar-
stellt, die konsequent mit der reductio ad absurdum kombiniert wird: die Methode
des „unendlichen Abstiegs“ (la descente infinie).
Auch wenn es F ERMATs Verdienst ist, die Methode der descente infinie präzise
beschrieben und ihre herausragende Rolle für die Weiterentwicklung der Zahlen-
theorie definiert zu haben – die Ursprünge des unendlichen Abstiegs lassen sich bis
in die frühgriechische Mathematik zurückverfolgen.
Der Altphilologe K URT VON F RITZ (1900–1995) vertritt die These, H IPPASOS
von Metapont (ca. 500–440 v. Chr.), einer der Schüler des P YTHAGORAS, habe bei
der Beschäftigung mit dem Pentagramm, dem Erkennungszeichen der Pythagoräer,
die Existenz der Inkommensurabilität entdeckt und damit nach P YTHAGORAS’ Tod
das Weltbild der Pythagoräer zum Einsturz gebracht.2 Dies hatte einen Grundlagen-
streit zur Folge, der eine Spaltung der P YTHAGORAS-Jünger in zwei Gruppierungen
versursachte: die Akusmatiker – die Vertreter der „reinen Lehre“, für die P YTHAGO -
RAS’ Wort Gesetz war – und die Mathematiker, die mit H IPPASOS von der Existenz
inkommensurabler Strecken überzeugt waren und sich um weitere Fortschritte ihrer
Wissenschaft bemühten.
1
Am Weihnachtstag 1640 verkündete F ERMAT in einem Brief an M ARIN M ERSENNE (1588–
1648) ohne Beweis, dass jede Primzahl p der Gestalt p D 4n C 1; n 2 N bis auf die Reihenfolge
der Summanden genau eine Darstellung als Summe zweier Quadratzahlen besitzt. Der erste doku-
mentierte Beweis dieses Satzes stammt von E ULER (1754), der seinen Beweis bezeichnenderweise
auf der Grundlage von F ERMAT s descente infinie führte. Eine sehr informative Diskussion des
Zwei-Quadrate-Satzes unter historischem, didaktischem und heuristischem Aspekt findet man in
einem Artikel von H EINRICH W INTER in Mathematische Semesterberichte 50 (2003).
2
K. VON F RITZ : Die Entdeckung der Inkommensurabilität durch Hippasos von Metapont. Annals
of Mathematics 46 (1945).
3.1 La Descente Infinie – der unendliche Abstieg 209
Die Legende berichtet, H IPPASOS sei von den Göttern für diesen Frevel mit
dem Tod durch Schiffsuntergang bestraft worden – die bloße Existenz einer solchen
Überlieferung kann als Beleg dafür angesehen werden, dass Forschungsfeindlich-
keit keine Erfindung der Neuzeit ist. Man sollte die Hoffnung nicht aufgeben, dass
irgendwann eine moderne Gesellschaft die historische Chance wahrnimmt, dieser
langen Tradition ein Ende zu setzen und die passenden gesellschaftspolitischen und
wirtschaftspolitischen Maßnahmen zu ergreifen.
Zwar scheint bis heute nicht einwandfrei geklärt, ob das Phänomen der Inkom-
mensurabilität tatsächlich am regelmäßigen Fünfeck entdeckt wurde3 und deshalb
H IPPASOS als Entdecker der Irrationalität angesehen werden kann, aber es scheint
gewiss, dass H IPPASOS’ impliziter Beweis der Irrationalität des Verhältnisses des
Goldenen Schnitts4 das erste bekannte Beispiel für die Verwendung der Methode
des unendlichen Abstiegs in der Mathematikgeschichte ist. Deshalb soll die Errun-
genschaft des H IPPASOS hier vorgestellt werden und zur Erläuterung der Methode
dienen.
3
p
Die Irrationalität von 2 lässt sich an der Inkommensurabilität von Seite und Diagonale eines
Quadrats feststellen, womit zumindest ein weiterer Kandidat mit Entdeckungspotenzial genannt
wäre.
4
Die Diagonale d und die Seite s des regelmäßigen Fünfecks
p genügen der Verhältnisgleichung
d
s
D d ss
mit der positiven Lösung x D ds D 12 .1 C 5/, welche als Verhältnis des Golde-
nen Schnitts bezeichnet wird. Zur Zeit des H IPPASOS war der Goldene Schnitt aber noch nicht
bekannt; wie die Pythagoräer dennoch regelmäßige Fünfecke zeichnen konnten, kann man bei
H. M ESCHKOWSKI : Denkweisen großer Mathematiker. Ein Weg zur Geschichte der Mathematik.
Vieweg Verlag, Braunschweig (1967) nachlesen.
210 3 Heurismen der Reduktion
Nach Weltsicht der Pythagoräer vermochten die natürlichen Zahlen und ihre Ver-
hältnisse das Wesen aller Dinge zu beschreiben („Alles ist Zahl“). Insbesondere
stand damit fest, dass das Verhältnis zweier gleichartiger Größen a und b stets
durch das Verhältnis zweier natürlicher Zahlen m und n beschrieben werden konn-
te: Es musste zu a und b eine Einheitsgröße e mit a D me und b D ne, ein
gemeinsames Maß von a und b, geben – wenn das Verhältnis a W b zweier gleichar-
tiger Größen kein Verhältnis m W n von Zahlen wäre, was sollte es dann sein?
H IPPASOS wies aber nach, dass die Seite s und die Diagonale d im regelmäßi-
gen Fünfeck kein gemeinsames Maß besitzen. Wir beschreiben im Folgenden seine
Argumentation in heutiger Sprechweise.
Vorgegeben seien zwei „gleichartige Größen“ (bedeutet: Elemente desselben
Größenbereichs) a und b mit a > b. Genau dann ist e ein gemeinsames Maß von a
und b, wenn e auch ein gemeinsames Maß der Größen b und a b ist, denn es gilt:
a1 WD maxfb; a bg ; b1 WD minfb; a bg
a2 WD maxfb1 ; a1 b1 g ; b2 WD minfb1 ; a1 b1 g
H IPPASOS erkannte nun (Abb. 3.2), dass es die Geometrie des Pentagons er-
laubt,5 einem regelmäßigen Fünfeck F1 mit der Diagonalen d1 und der Seite s1 ein
kleineres Pentagon F2 anzugliedern, dessen Diagonale d2 die Länge s1 und dessen
Seite s2 die Länge d1 s1 hat.
Damit wird die Fragestellung, ob Diagonale und Seite im regelmäßigen Fünf-
eck ein gemeinsames Maß besitzen, in den Einflussbereich der Wechselwegnahme
gerückt:
Genau dann haben die Seite s1 und die Diagonale d1 im Pentagon F1 ein gemein-
sames Maß, wenn die Seite s2 D minfs1 ; d1 s1 g D d1 s1 und die Diagonale
d2 D maxfs1 ; d1 s1 g D s1 im Pentagon F2 ein gemeinsames Maß haben.
Der Prozess, einem regelmäßigen Fünfeck Fn mit Seite sn und Diagonale dn ein
regelmäßiges Fünfeck FnC1 mit Seite snC1 D dn sn und Diagonale dnC1 D sn
anzugliedern, ist jedoch – zumindest gedanklich – ad infinitum fortsetzbar, denn in
jedem Pentagon ist die Diagonale länger als die Seite. Abb. 3.3 veranschaulicht die
Situation mit einer passenden Figurenfolge.
5
Zuerst kann man sich durch elementargeometrische Überlegungen davon überzeugen, dass in
jeder Ecke eines Pentagons mit eingezeichnetem Diagonalenstern drei gleich große Winkel von
jeweils 36ı aneinanderstoßen; mithilfe des Satzes vom Stufenwinkel ergibt sich daraus, dass im
Pentagon jede Seite und die ihr nicht anliegende Diagonale parallel sind. Damit wird die in Abb.
3.2 gezeigte Angliederung möglich.
212 3 Heurismen der Reduktion
Aus der Diskussion von Beispiel 3.1 lässt sich eine allgemeine Beschreibung der
Vorgehensweise extrapolieren, die F ERMAT als La Descente Infinie im Zusammen-
hang mit dem Zwei-Quadrate-Satz exemplarisch erläutert hat.
p
Beispiel 3.2 (Descente Infinie und die Irrationalität von n)
Es sei n 2 N keine Quadratzahl.
p Man begründe mit dem Verfahren des unendlichen
Abstiegs, dass dann n irrational ist. p
Angenommen,
p für eine Nicht-Quadratzahl n 2 N wäre n rational. Dann könn-
te man n in der Form
p a
nD mit a; b 2 N
b
als gewöhnlichen Bruch darstellen.
p Zur Ausgestaltung des Abstiegspkonstruieren
wir aus der Bruchdarstellung n D ab eine neue Bruchdarstellung n D ab11 mit
p
b1 < b und a1 < a. Die dazu verfügbare Information über n ist, dass n nicht
ganzzahlig ist, also gibt es ein t 2 N mit t < ab < t C 1. Daraus folgt
a nb ta a1
a.a tb/ D nb 2 atb D b.nb ta/ bzw. D DW
b a tb b1
mit 0 < b1 D a tb < b und a1 WD nb ta < a (wegen 0 < b1 < b und ab D ab11 ).
p p
Demnach kannpman aus jeder Bruchdarstellung n D ab von n eine neue
Bruchdarstellung n D ab11 mit b1 < b und a1 < a konstruieren; die Annahme der
p
Existenz einer Bruchdarstellung von n pführt auf die Existenz einer unendlichen
Folge . bn /n2N von Bruchdarstellungen n D abnn mit an ; bn 2 N, wobei die Fol-
an
gen .an /n2N und .bn /n2N streng monoton fallend sind. Unendliche streng monoton
fallende Folgen natürlicher Zahlen kann es aber nach dem Prinzip vom kleinsten
Element nicht geben.p
Folglich besitzt n keine Bruchdarstellung, wenn n 2 N keine Quadratzahl ist.
x 2 dy 2 D 1
die P ELLsche Gleichung zu d . Irrtümlich hat E ULER behauptet, J OHN P ELL (1610–
1685) habe als erster Gleichungen dieses Typs studiert; auf E ULERs Irrtum beruht
die Namensgebung. Tatsächlich aber hat bereits B RAHMAGUPTA (598–ca. 670)
denjenigen, die sich als Mathematiker profilieren wollten, das Studium der Glei-
chung x 2 92y 2 D 1 empfohlen.
214 3 Heurismen der Reduktion
x 2 3y 2 D 1 :
gilt. Ein allgemeines Verfahren zur Bestimmung p der Grundlösung beruht auf der
Periodizität der Kettenbruchentwicklung von d .
Auch ohne nennenswerte zahlentheoretische Kenntnisse lassen sich aber die Lö-
sungen der P ELLschen Gleichung zu kleinen Nicht-Quadratzahlen d 2 N mit
heuristischen Ansätzen bestimmen, wie wir jetzt für das Beispiel d D 3 zeigen
werden.
Zunächst ist klar, dass es genügt, sich auf Lösungen im Bereich der natürlichen
Zahlen zu konzentrieren, weil jede Lösung .x0 ; y0 / 2 N 2 die ganzzahligen Lösun-
gen
.x0 ; y0 / 2 Z2 ; .x0 ; y0 / 2 Z2 ; .x0 ; y0 / 2 Z2
induziert und sich umgekehrt jede ganzzahlige Lösung .x0 ; y0 / 2 Z2 in dieser Wei-
se aus der Lösung .jx0 j; jy0 j/ 2 N 2 ergibt.
Ist nun .x0 ; y0 / 2 N 2 eine Lösung der Gleichung x 2 3y 2 D 1 mit großen
Werten x0 ; y0 2 N, so gilt
x02 1
x02 D 1 C 3y02 und deshalb D 3C 2 3;
y02 y0
woraus x0 p
3
y0
folgt. Man könnte also auf die Idee kommen, Lösungen der P ELLschen Gleichung
zu d D 3 im Bereich der natürlichen Zahlen unterpsolchen Paaren .x; y/ 2 N 2
zu suchen, die in Bruchschreibweise xy die Zahl 3 approximieren (! lokale
Pk
p sich offenbar die Näherungsbrüche . Qk /k2N0 der Ket-
Approximation); dazu eignen
tenbruchdarstellung von 3. Es ist
p p 1
3D1C 31 D1C ;
1
1C p
2C 31
3.1 La Descente Infinie – der unendliche Abstieg 215
p
also lässt sich 3 in der Form
p 1
3D1C
1
1C
1
2C
1
1C
1
2C
1
1C
2C:::
notiert. Wir berechnen die ersten Glieder der Folge der Näherungsbrüche von
Œ1; 1; 2:
1 1 2
Œ1 D1 I D Œ1; 1 D1C D I
1 1 1
1 5 1 7
Œ1; 1; 2 D1C D I Œ1; 1; 2; 1 D1C D I
1 3 1 4
1C 1C
2 1
2C
1
19 26
Œ1; 1; 2; 1; 2 D : : : D I Œ1; 1; 2; 1; 2; 1 D : : : D :
11 15
Durch Systematisches Probieren stellt man fest, dass durch die Zahlenpaare
Von der Richtigkeit dieser Vermutung überzeugt man sich durch vollständige
Induktion über k:
Der Induktionsanfang ist erledigt, weil .x1 ; y1 / D .2; 1/ schon als Lösung er-
kannt wurde.
Im Induktionsschluss benutzen wir die rekursive Definition der Folge. Ist
.xk ; yk / eine Lösung, so gilt xk2 3yk2 D 1. Daraus folgt für .xkC1 ; ykC1 / D
.2xk C 3yk ; xk C 2yk /:
2
xkC1 3ykC1
2
D .2xk C 3yk /2 3.xk C 2yk /2
D 4xk2 C 12xk yk C 9yk2 3xk2 12xk yk 12yk2
D xk2 3yk2
D 1;
also ist auch .xkC1 ; ykC1 / eine Lösung, falls .xk ; yk / eine Lösung ist.
Damit ist gezeigt, dass alle Glieder der oben definierten Folge ..xk ; yk //k2N
Lösungen der P ELLschen Gleichung zu d D 3 sind. Der Nachweis, dass es kei-
ne weiteren Lösungen im Bereich der natürlichen Zahlen gibt, kann nun mit der
Methode des unendlichen Abstiegs geführt werden.
Dazu nehmen wir an, es gebe eine Lösung .u1 ; v1 / 2 N 2 der P ELLschen Glei-
chung x 2 3y 2 D 1, die nicht zur Menge M WD f.xk ; yk / j k 2 Ng gehört. Mithilfe
der inversen Abbildung f 1 zu f , die durch
! !
1 t 2 3 u
f .u; v/ WD
1 2 v
.u2 ; v2 / WD f 1 .u1 ; v1 /
eine „kleinere“ Lösung (im Sinne von u2 < u1 , v2 < v1 ) der P ELLschen Gleichung
zu d D 3; von der Lösungseigenschaft kann man sich wie oben durch Nachrechnen
überzeugen, die „Verkleinerungseigenschaft“ von f 1 folgt aus der offensichtli-
chen „Vergrößerungseigenschaft“ von f .
Genau dann ist dabei .u2 ; v2 / 2 N 2 , wenn gilt:
Wäre 2u1 3v1 , so folgte 4u21 9v12 und damit u21 C 3.u21 3v12 / D u21 C 3 0
– Widerspruch!
Wäre u1 2v1 , so folgte u21 4v12 und damit 1 D u21 3v12 v12 , zwingend
also v1 D 1 und .u1 ; v1 / D .2; 1/ 2 M – Widerspruch!
3.1 La Descente Infinie – der unendliche Abstieg 217
Damit sind die Bedingungen (1) und (2) erfüllt, und es gilt .u2 ; v2 / 2 N 2 . Wäre
.u2 ; v2 / 2 M , so wäre auch .u1 ; v1 / D f .u2 ; v2 / 2 M – Widerspruch! Also ist
.u2 ; v2 / 2 .N 2 n M /.
Aus der Annahme der Existenz einer Lösung .u1 ; v1 / 2 .N 2 nM / der P ELLschen
Gleichung zu d D 3 lässt sich also durch
Als letztes Beispiel zum Verfahren der Descente Infinie betrachten wir einen
Klassiker, nämlich Fermats Lösung des Problems 26 aus Buch VI der Arithmetica
des D IOPHANT. F ERMAT hat dieses Problem mit der Methode des unendlichen
Abstiegs gelöst und daran seine Methode ausführlich erläutert.
a D m2 n2 ; b D 2mn ; c D m2 C n2
1
A1 D ab D mn.m2 n2 / D mn.m C n/.m n/
2
218 3 Heurismen der Reduktion
eine Quadratzahl, so müsste jeder der vier Faktoren eine Quadratzahl sein, weil
alle Faktoren paarweise teilerfremd sind. Es gäbe demnach natürliche Zahlen
u; v; p; q 2 N mit
m D u2 ; n D v 2 ; m C n D u2 C v 2 D p 2 und m n D u2 v 2 D q 2 :
Da die Paritäten von m und n verschieden sind, müssen p und q beide ungerade
sein; da .m C n/ und .m n/ teilerfremd sind, gilt dies auch für p und q. Deshalb
ist ggT.p C q; p q/ D 2, und aus 2v 2 D .p C q/.p q/ ergibt sich:
Es gibt r; s 2 N, r ungerade derart, dass entweder
p C q D 2r 2 und p q D 4s 2
oder
p C q D 4s 2 und p q D 2r 2
gilt. In jedem Fall ist aber p D r 2 C 2s 2 und q D ˙.r 2 2s 2 /, und man erhält
1 2
u2 D .p C q 2 / D .r 2 /2 C .2s 2 /2 :
2
Aus der Annahme der Existenz eines pythagoräischen Dreiecks D1 mit teilerfrem-
den Seitenlängen a; b; c und der Eigenschaft, dass der Flächeninhalt A1 D 12 ab
dieses Dreiecks eine Quadratzahl ist, können wir also ein pythagoräisches Drei-
eck D20 mit den Seitenlängen r 2 ; 2s 2 ; u konstruieren, dessen Flächeninhalt A02 D
r 2s 2 D .rs/2 wieder eine Quadratzahl ist und für den
1 2
2
1 2 n 1 1
A02 D r 2 s 2 D .p q 2 / D < nm.m2 n2 / D A1
8 4 4 4
1
A2 < A1 und A2 ist eine Quadratzahl :
4
Iteration dieser Konstruktion liefert eine unendliche Folge .Dn /n2N pythagoräi-
scher Dreiecke, deren Flächeninhaltsfolge .An /n2N eine streng monoton fallende
Folge von Quadratzahlen definiert – eine solche Folge kann es nicht geben.
Damit ist gezeigt, dass es kein pythagoräisches Dreieck geben kann, dessen Flä-
cheninhaltsmaßzahl eine Quadratzahl ist.
In den Schriften F ERMATs werden viele Resultate ohne Beweis genannt, aber
immer wieder finden sich Hinweise auf die Methode der Descente Infinie. Mithilfe
3.2 Rückwärtsarbeiten und Pappos-Prinzip 219
der Werke späterer Mathematiker wie E ULER und L AGRANGE, die selbst in ih-
ren Arbeiten das Verfahren des unendlichen Abstiegs verwendeten, gelingt es aber,
wichtige Argumentationen von F ERMAT zu rekonstruieren.
Insofern profitiert die mathematische Nachwelt davon, dass F ERMAT die Metho-
de der Descente Infinie zu seinen wichtigsten Errungenschaften zählte; die Beispiele
sollten verdeutlicht haben, wie effektiv das Verfahren tatsächlich in manchen Pro-
blemstellungen der Zahlentheorie eingesetzt werden kann.
In Analogie zum Vorwärtsarbeiten (Abschn. 2.1.1) ließe sich auf der Basis der Pro-
blemraumhypothese nach N EWELL und S IMON das Rückwärtsarbeiten erklären: Es
geht um die Suche nach einem Weg im Problemraum, der von einem Zielzustand
(Z) zum Anfangszustand (A) (den Daten des Problems) führt.
Diese Deutung des Rückwärtsarbeitens ist in der Literatur vielfach anzutreffen,
wird der Vorgehensweise aber nicht gerecht, weil sie einen sehr wichtigen Aspekt
unbeachtet lässt. Generell muss zwischen ungerichteten Graphen und gerichteten
Graphen unterschieden werden – findet man also einen Weg von (Z) nach (A), so
ist nicht immer gewährleistet, dass man den gleichen Weg in umgekehrter Richtung
von (A) nach (Z) gehen kann!6 Genauer geht also darum, ausgehend von (Z) solche
Wege zu finden, die von (A) auf (Z) hin gerichtet oder vielleicht sogar bidirektional
sind.
Sehen wir uns zunächst ein einfaches Beispiel aus P ÓLYAs „Schule des Den-
kens“ an, anhand dessen die Situation mit einigen passenden Ergänzungen erläutert
werden kann.
9x C 4y D c
6
Beispiele für dieses Phänomen lassen sich etwa im Zusammenhang mit „Gewinnumformungen“
algebraischer Gleichungen finden: Sucht man Lösungen von Wurzelgleichungen, so besteht das
übliche Vorgehen darin, durch Umformungen der Gleichung, die im Allgemeinen keine Äqui-
valenzumformungen sind, Kandidaten für Lösungen zu finden und die gefundenen Kandidaten
mittels einer Probe darauf zu testen, ob es sich wirklich um Lösungen handelt. Durch mehrfaches
Quadrieren
p und Umsortieren
p ließe sich beispielsweise folgern, dass jede Lösung der Wurzelglei-
chung 2x 7 2x C 1 D 4 in der Menge D WD fx 2 R j x 72 g, auch eine Lösung der
Gleichung 2x C 1 D 9 sein müsste; die Probe ergibt aber, dass die einzige Lösung x D 4 der
linearen Gleichung keine Lösung der Wurzelgleichung ist.
220 3 Heurismen der Reduktion
lösbar, weil 1 D ggT.9; 4/ ein Teiler von c ist. Stünde jetzt ein drittes Gefäß (nicht
notwendig skaliert, aber mit situationsabhängig hinreichend großem Fassungsver-
mögen) zur Verfügung, so wäre jede beliebige Vielfachensummendarstellung n D
˛ 9Cˇ4 jeder Zahl n 2 N in den Koeffizienten 9 und 4 realisierbar. Offensichtlich
muss in einer solchen Darstellung mindestens eine der beiden Zahlen ˛; ˇ 2 Z po-
sitiv sein; ohne Beschränkung der Allgemeinheit sei ˛ > 0. Dann fülle man ˛-mal
das 9 `-Gefäß mit Wasser und entleere seinen Inhalt in das große Sammelgefäß. Ist
auch ˇ > 0, so fülle man ˇ-mal das 4 `-Gefäß mit Wasser aus dem Wasservorrat
und füge den Inhalt dem Wasser im Sammelgefäß hinzu; ist hingegen ˇ < 0, so
entnehme man dem Sammelgefäß jˇj-mal ein gefülltes 4 `-Gefäß mit Wasser. In
beiden Fällen befinden sich am Ende n D ˛ 9 C ˇ 4 Liter Wasser im dritten
Gefäß.
Wenn kein drittes Gefäß zur Verfügung steht, so schränkt dies die abmessbaren
Wassermengen ein – mehr als 13 ` Wasser insgesamt lassen sich in einem 9 `-Gefäß
und in einem 4 `-Gefäß nicht unterbringen. Die physikalische Realisierbarkeit der
Operationen C4 ` und C9 ` (eine Füllung des betreffenden Gefäßes hinzufügen)
bzw. 4 ` und 9 ` (eine Füllung des betreffenden Gefäßes wegnehmen) und al-
ler Kompositionen davon, welche sich im Bereich n ` (1 n 13) bewegen, ist
jedoch unabhängig von der Existenz eines dritten Gefäßes; alle Mengen von n `
Wasser, n 2 f1; : : : ; 13g können mit den beiden Gefäßen abgemessen werden, ins-
besondere auch 6 `.
Kennt sich der Problemlöser in der Theorie der linearen diophantischen Glei-
chungen aus, so kann er die Lösungsmenge
Unter allen Lösungen .x; y/ 2 L mit x > 0 hat die Lösung .2; 3/ minimale
1-Norm.7
Unter allen Lösungen .x; y/ 2 L mit x < 0 hat die Lösung .2; 6/ minimale
1-Norm.
Offenbar bestimmt die 1-Norm einer Lösung der Gleichung die Anzahl der zur
physikalischen Realisierung der Lösung notwendigen Vorgänge der Messgefäßfül-
lungen/Messgefäßentleerungen.
Wegen k.2; 3/k1 D 5 < 8 D k.2; 6/k1 würde man also 6 ` Wasser in der
Form 6 ` D 2 9 ` 3 4 ` mit dem geringsten Aufwand abmessen.
Kennt man sich in der Theorie der linearen diophantischen Gleichungen nicht
aus, so kann man vermutlich nicht a priori beurteilen, ob das Problem lösbar ist
oder nicht.
Dennoch findet man die beiden Minimallösungen, wenn man systematisch mit
einem der beiden Gefäße dem Wasservorrat (mehrfach) a ` Wasser entnimmt und
7
Unter der 1-Norm von .x; y/ versteht man k.x; y/k1 WD jxj C jyj.
3.2 Rückwärtsarbeiten und Pappos-Prinzip 221
Wir fangen mit den zwei leeren Eimern an, wir versuchen dies und das, wir leeren und fül-
len, und wenn es uns nicht gelingt, fangen wir wieder von vorne an und versuchen etwas
anderes. Wir arbeiten vorwärts, von der gegebenen Anfangssituation zu der erstrebten End-
situation, von den Daten zu der Unbekannten. Es mag uns nach vielen Versuchen zufällig
gelingen.
Der Zufall spielt bei einer Vorwärtsstrategie zur Lösung des Problems („Wir fangen
mit den zwei leeren Eimern an“) keine Rolle!
Dies kann man unschwer an den beiden nachfolgend dargestellten Realisationen
der Minimallösungen .2; 3/ und .2; 6/ erkennen (Abb. 3.4).
Abb. 3.4 Operationsketten der Minimallösungen .2; 6/ (links) bzw. .2; 3/ (rechts)
222 3 Heurismen der Reduktion
In Abb. 3.4 wird links die physikalische Verwirklichung der Lösung .2; 6/ il-
lustriert. Geschöpft wird Wasser mit dem 4 `-Gefäß, weggeschüttet wird Wasser mit
dem 9 `-Gefäß. Dies manifestiert sich in Verkettungen von Operationen der Typen
C4 ` und 9 `, die ausgehend von der Anfangssituation (beide Eimer leer) so erfol-
gen müssen, dass sämtliche Zwischenergebnisse den zulässigen Bereich zwischen
1 ` und 13 ` nicht verlassen. Mathematisch können also höchstens drei Operatoren
.C4/ hintereinander ausgeführt werden, bevor ein Operator .9/ eingesetzt werden
muss; physikalisch sorge man einfach dafür, dass das 9 `-Gefäß ausgeschüttet wird,
sobald es vollständig gefüllt ist.
Die der Darstellung
6 ` D 2 9 ` C 6 4 `
entsprechende Überführung des Anfangszustands 0 ` in den Zielzustand 6 ` rea-
lisiert man dann durch die Operatorkette
Die physikalische Verwirklichung der Lösung .2; 3/ (Abb. 3.4, rechts) ist we-
niger aufwändig, wie es schon a priori durch Vergleich der 1-Normen der Lösungen
prognostiziert werden konnte.
Diesmal wird Wasser mit dem 9 `-Gefäß geschöpft und mit dem 4 `-Gefäß aus-
geschüttet; dabei entstehen Operatorketten der Elemente C9 ` und 4 `, die den
zulässigen Bereich zwischen 1 ` und 13 ` nicht verlassen, weil jederzeit so oft wie
möglich 4 ` von der bereits geschöpften Wassermenge weggenommen und erst da-
nach weitere 9 ` hinzugefügt werden.
Die der Darstellung
6` D 2 9` 34`
entsprechende Überführung des Anfangszustands 0 ` in den Zielzustand 6 ` er-
folgt über die Operatorkette
Auf diese Weise liefert das Rückwärtsarbeiten als Lösungspläne die von unten
nach oben gelesenen Operationsfolgen der Abb. 3.4; die Ausführung dieser Lö-
sungspläne geschieht dann progressiv wie beschrieben.
Das Verfahren ist also eine Analysis-Synthesis-Prozedur nach dem Vorbild der
griechischen Geometer, wie wir sie in Abschn. 2.1.2 eingeführt haben; das zentrale
Element dieser Prozedur, die Analysis, entspricht dabei dem Rückwärtsarbeiten.
Als heuristischen Kreislauf kann man die Methode des Rückwärtsarbeitens über
das Fragenpaar (Teilzielfrage, Hilfsmittelfrage) charakterisieren, wie wir es auch
schon für das Vorwärtsarbeiten vorgenommen haben; die Problematik der Orientie-
rung von Wegen in Lösungsgraphen wird dabei berücksichtigt.
(T) Zunächst versuche man, eine Antwort auf folgende Teilzielfrage zu fin-
den:
Woraus ließe sich
8 9 8 9
< die gesuchte Größe = < berechnen =
die Behauptung unmittelbar herleiten ‹
: ; : ;
die gesuchte Figur konstruieren
(H) Gelingt dies nicht, beantworte man zuerst die Frage nach geeigneten
Hilfsmitteln:
8 9
ˆ In welchen Formeln kommt die gesuchte Größe vor >
ˆ
ˆ >
>
ˆ
ˆ >
>
< Welche Sätze enthalten ähnliche Bedingungen =
Welchen konstruierbaren Teilfiguren enthält die gesuchte ‹
ˆ
ˆ >
>
ˆ
ˆ Figur, und welche Zusammenhänge darüber sind bekannt >
>
:̂ :: >
;
:
Es liegt auf der Hand, dass eine Kernschwierigkeit der Vorgehensweise „Hilfs-
mittelfrage vor Teilzielfrage“ in der Auswahl eines „chancenreichen“ Hilfsmittels
besteht. Dieser Problematik versucht H ELMUT KÖNIG in seiner Anleitung zum
Rückwärtsarbeiten8 dadurch gerecht zu werden, dass er – insbesondere beim Lösen
geometrischer Beweisaufgaben – einen Hilfsmittelspeicher anzulegen empfiehlt.
8
KÖNIG , H: Einige für den Mathematikunterricht bedeutsame heuristische Vorgehensweisen. MU
38, Heft 3 (1992).
224 3 Heurismen der Reduktion
Für die Aufgabe des Nachweises eines identischen Winkelmaßes zweier Winkel
˛ und ˇ listet er sinngemäß die folgende Auswahl verschiedenartiger Hilfsmittel
auf:
Das gesuchte Sehnenviereck ließe sich unmittelbar konstruieren, wenn der Radi-
us seines Umkreises gegeben wäre, ebenso, wenn man ein Teildreieck konstruieren
könnte; beides lässt die Datenlage aber nicht zu.
Wir folgen der Idee des PAPPOS und suchen geeignete Teilziele unter den Zu-
ständen, die sich durch eine invertierbare Transformation aus dem in der Problem-
beschreibung veranschaulichten Endzustand ergeben. Kanonische Kandidaten für
solche Transformationen sind die Elemente der einzelnen Abbildungsgruppen; da
es sich um eine Problemstellung der Kongruenzgeometrie handelt (mit den Seiten-
längen sind Informationen vorgegeben, die nicht unter allgemeinen affinen Abbil-
dungen oder Ähnlichkeitsabbildungen, sondern nur unter Kongruenzabbildungen
invariant bleiben (! Invarianzpinzip)), sollte man Kongruenzabbildungen in Be-
tracht ziehen.
Wegen jABj D jBC j ist es naheliegend, eine Kongruenzabbildung auszufüh-
ren, die CB auf AB abbildet; dafür kommen sowohl eine geeignete Drehung ı um
B als auch die Spiegelung an der Mittelsenkrechten von AC infrage. Da aber
.fA; B; C g/ D fA; B; C g gilt und damit (Z) durch die Spiegelung nur marginal
verändert würde, ist zu vermuten, dass die Anwendung von ı größere Aussicht auf
Erfolg haben sollte.
Sei also ı die Drehung um B mit ı.C / D A und sei D 0 WD ı.D/. Dann ist
BAD 0 das Bilddreieck von BCD unter der Drehung ı, und die Punkte D; A
und D 0 sind kollinear, weil der Winkel ^DAD 0 bei A als Summe der Innenwinkel
des Sehnenvierecks bei A und bei C ein gestreckter Winkel sein muss9 (Abb. 3.5).
9
Bekanntlich ist ein konvexes Viereck genau dann ein Sehnenviereck, wenn die Winkelsumme
einander gegenüber liegender Innenwinkel jeweils 180ı beträgt.
226 3 Heurismen der Reduktion
Nun ist ein vom Anfangszustand (A) (Problemdaten) her erreichbarer Zustand (Z’)
realisiert, aus dem sich durch Anwendung der zu ı inversen Drehung der Endzu-
stand (Z) (Konvexes Sehnenviereck mit gegebenen Abmessungen) herstellen lässt:
Ist ı 1 die Drehung um B, die D 0 auf D abbildet, so ergibt sich der noch fehlende
Punkt C des gesuchten Sehnenvierecks als der Bildpunkt C WD ı 1 .A/ von A unter
ı 1 .10 Damit ist das Konstruktionsproblem gelöst.
10
Alternativ kann man natürlich C auch als den Schnittpunkt der Kreise um B mit Radius b und
um D mit Radius c gewinnen.
3.2 Rückwärtsarbeiten und Pappos-Prinzip 227
zugehörigen Operatoren dieser Art mag es geben, aber im Regelfall wird man
auf die allgemeinere Suche nach Zwischenzielen zurückgreifen müssen.
Zur Illustration möchte ich wieder die Thematik der Lotto-Designs aufgreifen,
deren zentrale Begrifflichkeiten schon in Beispiel 2.2 vorgestellt wurden.
SQ könnte ein .m; t/-Lotto-Design zu An sein, dessen Länge kQ größer ist als k –
je mehr m-Blöcke ein .m; t/-Design zu An enthält, desto einfacher ist es.
SQ könnte ein Lotto-Design zu An1 sein – je weniger Systemzahlen ein System
verarbeiten muss, desto einfacher ist es.
Die erste Idee wurde schon in Beispiel 2.2 verfolgt; dort haben wir die Längen
von Lotto-Designs sukzessive durch einen Streichalgorithmus reduziert; wenden
wir uns also der zweiten Idee zu:
Wie kann man ein .m; t/-Lotto-Design SQ zu An1 in ein .m; t/-Lotto-Design S
zu An überführen?
Offenbar zerfällt für m < n die Menge Pm .An / aller m-elementigen Teilmengen
von An in zwei Klassen: Klasse 1 besteht aus denjenigen m-Teilmengen von An ,
die n enthalten, und Klasse 2 besteht aus denjenigen m-Teilmengen von An , die n
nicht enthalten. Bei den m-Teilmengen der Klasse 2 handelt es sich offensichtlich
um die m-Teilmengen von An1 ; man beachte nun, dass alle m-Teilmengen von
An1 von mindestens einem der Blöcke aus SQ repräsentiert werden, denn SQ ist ein
.m; t/-Lotto-Design zu An1 .
Man muss also lediglich SQ mit einem solchen System S 0 von m-Teilmengen von
An vereinigen, dessen Blöcke jede der m-Teilmengen von An repräsentieren, die
das Element n enthalten. Dies ist offenbar dann der Fall, wenn die m-Blöcke des
Systems S 0 D fS10 ; : : : ; Sk0 0 g folgende Eigenschaften haben:
Jeder m-Block aus S 0 ist von der Form Si0 D SOi [fng mit einer .m1/-Teilmenge
SOi von An1 .
Das System SO WD fSO1 ; : : : ; SOk 0 g ist ein .m 1; t 1/-Lotto-Design zu An1 .
228 3 Heurismen der Reduktion
Damit ist die Analyse des Reduktionsschritts abgeschlossen, und wir können als
Resultat festhalten:
so definiert
(
SQi für 1 i k1
S D fS1 ; : : : ; Sk1 Ck2 g mit Si WD
SOi k1 [ fng für k1 < i k1 C k2
Wir nutzen nun diese Erkenntnis zur Bearbeitung des Aufgabenteils (2). Um
mittels des oben beschriebenen Konstruktionsverfahrens ein möglichst gutes .6; 5/-
Lotto-Design zu A9 zu gewinnen, starte man die Synthesis mit optimalen .6; 5/-
und .5; 4/-Lotto-Designs zu A7 .
Dies ist offensichtlich, denn jede 6-Teilmenge von A7 trifft SQ1 in wenigstens 5 Ele-
menten, und weniger als einen Block kann ein Lotto-Design nicht haben.
zur Folge, sodass T n f5; 6g nur höchstens zwei Elemente enthalten könnte – dies
steht im Widerspruch zur Tatsache, dass T fünfelementig ist. Damit ist SO als .5; 4/-
Lotto-Design zu A7 erkannt.
3.2 Rückwärtsarbeiten und Pappos-Prinzip 229
Aus weniger als 3 Blöcken kann ein .5; 4/-Lotto-Design zu A7 aber nicht
bestehen:
S1 WD f1; 2; 3; 4; 5; 6g ; S2 WD f1; 2; 3; 4; 7; 8g ;
S3 WD f1; 2; 5; 6; 7; 8g ; S4 WD f3; 4; 5; 6; 7; 8g
definiert.
Mit ähnlichen kombinatorischen Überlegungen wie oben kann man sich davon
überzeugen, dass es kein .6; 5/-Lotto-Design zu A7 mit weniger als 4 Blöcken geben
kann – das Design S ist optimal! Wir haben also gemäß der in (1) ausgearbeiteten
Konstruktionsvorschrift aus optimalen Lotto-Designs zu A7 ein optimales Lotto-
Design zu A8 hergestellt, so dass vielleicht Grund zur Hoffnung besteht, dass man
aus diesem optimalen .6; 5/-Lotto-Design zu A8 und einem ebenfalls optimalen
.5; 4/-Lotto-Design zu A8 ein .6; 5/-Lotto-Design minimaler Länge zu A9 herstel-
len könnte.
Zu diesem Zweck betrachten wir das System SO WD fSO1 ; : : : ; SO5 g mit
11
Ist T WD SO10 \ SO20 mit jT j D 3, so gibt es genau vier 5-elementige Teilmengen, die von beiden
Blöcken des Systems SO 0 repräsentiert werden, nämlich die 5-Teilmengen der Form T [ fxg [ fyg
mit x 2 SO10 n T und y 2 SO20 n T . Ist jT j > 3, so haben SO10 und SO20 noch mehr als 3 Elemente
gemeinsam, sodass es noch mehr als 4 fünfelementige Teilmengen von A7 gibt, die sowohl von SO10
als auch von SO20 repräsentiert werden.
230 3 Heurismen der Reduktion
4 C 5 D 9, und in Beispiel 2.2 haben wir bereits ein besseres .6; 5/-Lotto-Design
der Länge 8 zu A9 konstruiert.
Dies macht deutlich, dass die Analysis-Synthesis-Konstruktion von Lotto-
Designs nicht die geeignete Methode zur Gewinnung bestmöglicher Designs ist;
wir werden später noch eine andere Technik am Beispiel eines .6; 5/-Designs zu
A12 vorstellen (Beispiel 3.11).
Der Rest des Paragraphen über das Rückwärtsarbeiten soll noch einmal dem
Satz von Steiner und Lehmus gehören, der in Beispiel 1.38 behandelt wurde und für
den ein direkter Beweis mit abbildungsgeometrischen Methoden wünschenswert
schien. Wir werden einige Reduktionsschritte einer Analysis-Synthesis-Prozedur
durchführen, die zeigen werden, dass die früher prognostizierten Probleme Realität
werden.
C C
E D E D
A B A B
Wegen jCAj D jCBj ist dann auch jCEj D jCDj, sodass sich mit der Um-
kehrung des 1. Strahlensatzes ABjjDE ergibt (Abb. 3.6). Da aber Stufenwinkel an
Parallelen gleich groß sind, schließt man auf
^AED D ^BDE D 180ı ˛ ;
sodass sich im Viereck ABDE einander gegenüberliegende Winkel zu 180ı ergän-
zen und es sich deshalb um ein Sehnenviereck handelt (Abb. 3.7).
C C
E D E D
A B A B
Die Existenz des Umkreises von ABDE bedingt andererseits ˛ D ˇ, weil ˛2 und
ˇ
2 als Peripheriewinkel über der Sehne DE dieses Kreises gleich groß sind.
Ebenso ergibt sich ˛ D ˇ aus jADj D jBEj und DEjjAB:
Wenn DEjjAB, ist im Dreieck ADE offenbar ^ADE D ˛2 (Wechselwinkel-
satz), ebenso folgt ^BED D ˇ2 , sodass die Dreiecke ADE und BED beide
gleichschenklig sind und jBDj D jDEj D jEAj gilt. Mit der zusätzlichen Bedin-
gung jADj D jBEj ergibt sich die Kongruenz der Dreiecke ADE und BED
(sss); daher gilt auch ˛ D ˇ.
Will man also aus jADj D jBEj auf ˛ D ˇ schließen und damit den Satz von
Steiner und Lehmus beweisen, so genügt es offenbar, einen der folgenden Sachver-
halte zu verifizieren:
Versuchen wir zu zeigen, dass das Viereck ABDE unter den Voraussetzungen des
Satzes von Steiner und Lehmus einen Umkreis besitzt. Notwendige Voraussetzung
232 3 Heurismen der Reduktion
für die Existenz eines Umkreises von ABDE ist die Existenz einer Drehung, die B
auf D und E auf A abbildet. Eine solche Drehung lässt sich jedoch leicht angeben
(Abb. 3.8):
D=B’’
E
M w
A B
B’
D
E
M
A R’ R B
gilt, wenn also die Dreiecke MAE und MDB kongruent sind. Dies wieder-
um ist gleichbedeutend mit der Bedingung jAEj D jBDj oder der Bedingung
DEjjAB, wie wir oben gesehen haben.
Der nächste Reduktionsschritt ist damit getan, und wir prüfen, woraus man
DEjjAB folgern könnte.
In Abb. 3.10 seien P bzw. P 0 die Mittelpunkte der Strecken BE bzw. AD, und
ı bezeichne nach wie vor die oben konstruierte Drehung um M mit ı.B/ D D
und ı.E/ D A. Wegen ı.EB/ D AD gilt dann ı.P / D P 0 , sodass M auf der
Mittelsenkrechten zu PP 0 liegt; ferner ist ı.o/ D o0 , wenn o die Mittelsenkrechte
von EB und o0 die Mittelsenkrechte von AD bezeichnet. Sei nun o die Spiege-
lung an o und WD ı ı o . Dann ist eine Schubspiegelung mit .B/ D A und
.E/ D D.
Abb. 3.10 Schubspiegelung C
mit .B/ D A und
.E/ D D
D
E
S
P
M
A R B
o
234 3 Heurismen der Reduktion
An dieser Stelle fallen zumindest mir keine weiteren Teilziele ein, aus denen sich
auf einen der oben genannten Sachverhalte schließen ließe. In solch einem Fall
empfiehlt es sich, den Analyseprozess bis zu einem Verzweigungspunkt zurückzu-
verfolgen und dort eine andere Richtung einzuschlagen; diese Methode bezeichnet
man als Back Tracking. Eine detailliertere Beschreibung des Back Tracking als
eine Vorgehensweise, mit der man bei der Entwicklung von Lösungsplänen vielver-
sprechende Komponenten früherer und gescheiterter Lösungsanläufe zielgerichtet
weiter verwenden kann, findet man in einem MU-Artikel von F RANK H EINRICH.12
Ohne die Schilderung weiterer Details möchte ich hier feststellen, dass meine
Lösungsversuche in anderen Zweigen des Planungsgraphen ebenfalls gescheitert
sind. Abb. 3.11 zeigt einige Zusammenhänge, die sich in der Situation aus Abb.
3.10 aufgrund der Gleichschenkligkeit des Dreiecks ABC ergeben.
M ist nicht nur der Schnittpunkt der Mittelsenkrechten von BD und AE, son-
dern auch der Schnittpunkt der Mittelsenkrechten von BE und AD.
Die Winkelhalbierende des Winkels ^P 0 SP ist auch die Winkelhalbierende des
Winkels ^PMP 0 und die gemeinsame Mittelsenkrechte von P 0 P ; AB und
DE.
D liegt auf der Mittelsenkrechten von BE, E liegt auf der Mittelsenkrechten von
AD. ı.D/ D E, ı.A/ D B.
jSEj D jSDj und jSAj D jSBj.
12
H EINRICH , F.: Wechseln von Lösungsanläufen als eine bedeutungsvolle heuristische Vorge-
hensweise beim Lösen mathematischer Probleme. In MU 47, Heft 6 (2001).
3.2 Rückwärtsarbeiten und Pappos-Prinzip 235
E D
S
P’ P
W S’
M
A B
o o’
z
Der Beweis irgendeines Zusammenhangs dieser Liste würde umgekehrt den Schluss
auf die Gleichschenkligkeit des Dreiecks ABC erlauben. Vielleicht findet der
geneigte Leser Spaß daran, sich an der Problematik zu versuchen? Doch Vorsicht:
Es besteht Suchtgefahr . . .
Wir beschließen den Paragraphen mit einigen Bemerkungen P ÓLYAs zum Rück-
wärtsarbeiten, die den großen Stellenwert verdeutlichen, den der Altmeister dieser
Methode zuerkannte.
Beim Rückwärtsarbeiten können wir (. . . ) erwarten, die meiste Zeit auf das Lösen klar
formulierter Aufgaben zu verwenden (. . . ) Im allgemeinen ist daher das regressive Planen,
das Rückwärtsarbeiten, die „Analyse“ (in der Terminologie der griechischen Geometer)
vorzuziehen. Es kann keine starre Regel geben, aber das klügste wird immer sein, erst die
Unbekannte ins Auge zu fassen (die Behauptung, was man haben will) und dann die Daten
(. . . ) Man beginne damit, von der Unbekannten aus rückwärts zu arbeiten, wenn nicht ein
spezieller Grund für das gegenteilige Verfahren vorliegt – drängt einen eine gute Idee, von
den Daten auszugehen, so soll man das natürlich tun (. . . )
Der Weise fängt am Ende an, der Narr endet am Anfang. (. . . )
236 3 Heurismen der Reduktion
3.3 Modularisierung
Der Heurismus der Modularisierung ist besonders in der künstlichen Intelligenz von
herausragender Bedeutung, wo die Problemlösestrategie unter dem Namen „Divide
& Conquer“ oder als „Divide-Conquer-Glue – Strategy“ bekannt ist.
In Abb. 3.12 erkennt man zunächst, wie die Ausgangsfigur in zwei kongruente
Teilfiguren (Trapeze) zerlegt werden kann. Jedes dieser Trapeze lässt sich in drei
paarweise kongruente Dreiecke partitionieren, sodass insgesamt bisher eine Zerle-
gung der Ausgangsfigur in sechs paarweise kongruente Dreiecke realisiert ist.
Abb. 3.13 Zerlegung der Dreiecke (conquer) und Lösung des Problems (glue)
Hierbei ist es in der Regel so, dass der Definitionsbereich einer Funktion in endlich
viele Intervalle partitioniert wird und die Regularität der Funktion im Inneren dieser
Intervalle unproblematisch ist, während sie am Rand der Intervalle a priori unklar
ist. Das Problem, die Regularität der Funktion in den unendlich vielen Punkten x
ihres Definitionsbereichs zu untersuchen, wird dann in die endlich vielen Fälle zer-
legt, dass x einer der endlich vielen Randpunkte der endlich vielen Intervalle oder
einer der Punkte der offenen Kerne der endlich vielen Intervalle ist.
In der Regel teilt man den Parameterbereich in drei Klassen, die den Rangbedin-
gungen an die Koeffizientenmatrix des Gleichungssystems zugeordnet sind, welche
über Unlösbarkeit, über eindeutige Lösbarkeit und über nicht eindeutige Lösbarkeit
des linearen Gleichungssystems entscheiden.
Hier wird die unendliche Menge der ganzen Zahlen in endlich viele Restklassen
bezüglich eines geeigneten Moduls m zerlegt; es findet eine Finitarisierung durch
Klassenbildung statt.
Die wohl aufsehenerregendste Problemlösung mittels Finitarisierung war die
Lösung des Vierfarbenproblems durch K ENNETH A PPEL und W OLFGANG H AKEN
im Jahr 1976.
Im Oktober 1852 hatte F RANCIS G UTHRIE (1831–1899), englischer Jurist, Ma-
thematiker und Botaniker, beim Färben von Landkarten entdeckt, dass er die Anfor-
derung, je zwei Länder mit gemeinsamer Grenzlinie immer unterschiedlich einzu-
färben, stets mit insgesamt höchstens vier Farben erfüllen konnte. Die Frage nach
dem Grund dieses Sachverhalts wurde von AUGUSTUS DE M ORGAN (1806–1871),
dem Lehrer von G UTHRIEs Bruder, als das Vierfarbenproblem bekannt gemacht.
Als nun im Computerzeitalter genügend Rechenleistung zur Verfügung stand,
gelang es A PPEL und H AKEN, das allgemeine Vierfarbenproblem an mehrere Tau-
send Problemklassen zu verteilen und diese einzeln mit einer IBM 360 (dem ersten
Großrechner der Geschichte) in vernünftiger Zeit abzuarbeiten.
3.3 Modularisierung 239
Im folgenden Beispiel erfüllt der Computer die Funktion, Hinweise für die Modula-
risierung einer „großen“, allerdings endlichen Problemstellung durch eine geeignete
Fallunterscheidung zu geben – es handelt sich um eine Quasi-Finitarisierung.
9Š
D 15 120
.9 5/Š
13
Für z0 ; : : : ; zk 2 f0; 1; 2; : : : ; 9g sei mit .zk zk1 : : : z1 z0 /10 die dekadische Zifferndarstellung
P
der Zahl z D kiD0 zi 10i bezeichnet.
240 3 Heurismen der Reduktion
n1 D 3634 D 158 23 D 79 46 D 46 79
n2 D 3726 D 138 27 D 69 54 D 54 69
n3 D 3886 D 134 29 D 67 58 D 58 67
n4 D 4002 D 174 23 D 69 58 D 58 69
n5 D 4234 D 146 29 D 73 58 D 58 73
n6 D 4662 D 259 18 D 74 63 D 63 74
n7 D 5022 D 186 27 D 93 54 D 54 93
n8 D 5056 D 158 32 D 79 64 D 64 79
n9 D 5568 D 174 32 D 96 58 D 58 96
n10 D 7008 D 584 12 D 96 73 D 73 96
n11 D 7448 D 532 14 D 98 76 D 76 98
Es wäre langweilig, das Problem jetzt als gelöst zu betrachten. Auch wenn man
nun alle Möglichkeiten kennt, aus den Ziffern 1; : : : ; 9 drei zweistellige Zahlen und
eine dreistellige Zahl im Zehnersystem so zu bilden, dass jede dieser Ziffern genau
einmal auftritt und dass das Produkt der dreistelligen Zahl mit einer der zweistelli-
gen Zahlen gleich dem Produkt der beiden anderen zweistelligen Zahlen ist – der
intellektuellen Herausforderung hat man sich bisher nicht gestellt.
Um eine Idee davon zu bekommen, welche mathematischen Hilfsmittel man ein-
setzen könnte, um die Anzahl der zu überprüfenden Fälle zu verkleinern, studiere
man die Liste der Lösungen in der Hoffnung, Muster finden zu können – damit ist
die Rolle des Computers auf die eines Hilfsmittels zur Mustererkennung reduziert!
Folgende Regelmäßigkeiten fallen sofort auf:
Beobachtung
(B 1) deutet darauf hin, dass man sich für die Zehnerreste gewisser aus den
Ziffern ai zu bildender Produkte interessieren muss.
3.3 Modularisierung 241
kein Fall mit a1 a4 > 5 auftritt; also muss man sich für die Größe von Produkten
.a1 a2 a3 /10 .a4 a5 /10 in Abhängigkeit von den verwendeten Ziffern interessieren.
Dass auch der Fall fa1 ; a4 g D f1; 4g unter allen Lösungen nicht auftritt, kann als
Hinweis darauf verstanden werden, dass Größenabschätzungen und Kongruenz-
betrachtungen mod 10 miteinander kombiniert werden müssen, um Lösungen
herauszufiltern.
Sehen wir uns zunächst die Ziffern der Produkte in Abhängigkeit von den Ziffern
der Faktoren an; die Analyse und anschließende Formalisierung der Abläufe bei
der Multiplikation im dekadischen Stellenwertsystem führt auf die Ergebnisse, die
in Satz 3.1 zusammengestellt sind.
Satz 3.1
Bezeichnet man für r 2 R die größte ganze Zahl kleiner oder gleich r mit Œr,14
so lassen sich für die Ziffern eines Produktes im dekadischen Stellenwertsystem
folgende Zusammenhänge feststellen:
a) Für die Zerlegung des Produkts
mit
" #
a2 a5 C a3 a4 C a310a5
x1 D 10 a1 a4 C a1 a5 C a2 a4 C I
10
" #
ha a i a2 a5 C a3 a4 C a310a5
3 5
y1 D a2 a5 C a3 a4 C 10 I
10 10
ha a i
3 5
z1 D a3 a5 10 :
10
b) Für die Zerlegung des Produkts
14
Die Funktion Œ W R ! Z ordnet jeder reellen Zahl ihren ganzzahligen Anteil zu und wird
deshalb als Ganzteilfunktion bezeichnet; das Symbol Œ ist als G AUSS-Klammer bekannt.
242 3 Heurismen der Reduktion
mit
" a7 a9 #
a6 a9 C a7 a8 C
x2 D a6 a8 C 10
I
10
" #
ha a i a6 a9 C a7 a8 C a710a9
7 9
y2 D a6 a9 C a7 a8 C 10 I
10 10
ha a i
7 9
z2 D a7 a9 10 :
10
An den Ziffern der dekadischen Zifferndarstellungen der Produkte
a3 a5 a7 a9 mod 10 :
Satz 3.2
Mit ai ; bi .i 2 N/ seien im Folgenden Ziffern aus f1; : : : ; 9g bezeichnet.
minimal.
b) Unter allen Produkten p1 D .a1 a2 a3 /10 .a4 a5 /10 mit festem fa1 ; a4 g D fx; yg,
x > y und fa2 ; a3 ; a5 g D fb1 ; b2 ; b3 g mit b1 < b2 < b3 ist
minimal.
c) Unter allen Produkten p1 D .a1 a2 a3 /10 .a4 a5 /10 mit festem fa3 ; a5 g D fx; yg,
x > y und fa1 ; a2 ; a4 g D fb1 ; b2 ; b3 g mit b1 < b2 < b3 ist
minimal.
d) In a), b) und c) werden die Minimalprodukte pb1 größer, wenn man sie für Ziffern
bQi mit bi bQi 8i; bi0 < bQi0 für mindestens ein i0 berechnet.
e) Unter allen Produkten p2 D .a6 a7 /10 .a8 a9 /10 mit fa6 ; : : : ; a9 g D fb1 ; : : : ; b4 g
und b1 < b2 < b3 < b4 ist
maximal.
f) Unter allen Produkten p2 D .a6 a7 /10 .a8 a9 /10 mit festem fa6 ; a8 g D fx; yg,
x > y und fa7 ; a9 g D fb1 ; b2 ; g mit b1 < b2 ist
maximal.
g) Unter allen Produkten p2 D .a6 a7 /10 .a8 a9 /10 mit festem fa7 ; a9 g D fx; yg,
x > y und fa6 ; a8 g D fb1 ; b2 ; g mit b1 < b2 ist
maximal.
244 3 Heurismen der Reduktion
Auf der Basis von Satz 3.1 und Satz 3.2 lässt sich der Kandidatenkreis möglicher
Lösungen stark einschränken:
Positiv formuliert:
Lösungen von
n D .a1 a2 a3 /10 .a4 a5 /10 D .a6 a7 /10 .a8 a9 /10
mit einem injektiven 9-Tupel .a1 ; : : : ; a9 / aus f1; : : : ; 9g existieren bestenfalls
für
n 2 Œ02 n Œ010 und fa1 ; a4 g 2 ff1; 2g; f1; 3g; f1; 5gg :
Damit sind die Beobachtungen (B1) und (B2), die wir beim Studium der Liste aller
Lösungen des Problems festgehalten haben, mathematisch verifiziert und verstan-
den.
Dies führt zu einer Modularisierung der Problemstellung dadurch, dass jetzt in
den drei für fa1 ; a4 g möglichen Fällen nach Lösungen gesucht werden kann. Jeder
dieser Fälle enthält spezifische Informationen über a1 und a4 , welche die a-priori-
Abschätzungen aus Satz 3.2 um weitere Abschätzungen ergänzen, mit denen man
die Kandidatenliste möglicher Lösungen weiter verkürzen kann.
Am einfachsten ist es, in den drei für fa1 ; a4 g möglichen Fällen durch das Stu-
dium von x1 und x2 aus Satz 3.1 diejenigen Situationen auszuschließen, in denen
a6 a8 zu klein ist; die Ergebnisse dieser Analyse sind in Satz 3 zusammengefasst.
Satz 3.3
Für alle Lösungen n D .a1 a2 a3 /10 .a4 a5 /10 D .a6 a7 /10 .a8 a9 /10 des Problems
gilt:
Dadurch ist die Kandidatenliste für Lösungen so geschrumpft, dass man alle
Lösungen des Problems durch Abarbeiten der einzelnen Fälle finden kann. In je-
dem der für fa1 ; a4 g möglichen Fälle betrachte man die Unterfälle der Endziffern
2; 4; 6; 8 möglicher Lösungszahlen n 2 N. Man prüfe dann jeweils die oben für
p1 D p2 formulierten notwendigen Bedingungen (1) und (2):
Ist jeweils (1) erfüllt, so sind bis auf a2 ; a6 ; a8 alle Ziffern festgelegt (genauer:
fa1 ; a4 g; fa3 ; a5 g; fa7 ; a9 g sind festgelegt). Kandidaten für Lösungen sind diejeni-
gen, für die
3.3 Modularisierung 245
mit den Bezeichnungen aus Satz 3.2, b), c) und f), g) pb2 pb1 gilt,
die Kongruenzen (2) erfüllt sind und
die notwendigen Bedingungen aus Satz 3 gelten.
21 Kandidaten für den Fall fa1 ; a4 g D f1; 2g, sieben davon sind Lösungen;
26 Kandidaten für den Fall fa1 ; a4 g D f1; 3g, zwei davon sind Lösungen;
7 Kandidaten für den Fall fa1 ; a4 g D f1; 5g, zwei davon sind Lösungen.
Aus der Gesamtzahl von 362 880 denkbaren Kandidaten für Lösungen haben wir
mit mathematischen Mitteln 54 Kandidaten herausgefiltert, deren Überprüfung dann
zu den 11 tatsächlichen Lösungen M D fn1 ; : : : ; n11 g führt. Eine weitere Re-
duktion der Zahl zu prüfender Fälle lässt sich durch eine Verfeinerung der Grö-
ßenabschätzungen in Satz 3 erreichen, wenn man für die speziellen Werte von
fa3 ; a5 g; fa7 ; a9 g in den einzelnen für fa1 ; a4 g zu betrachtenden Fällen argumentiert.
Ob dies sinnvoll ist, entscheidet der Vergleich des Aufwands für bessere Abschät-
zungen mit dem Aufwand für die Einzelprüfung von mehr Kandidaten.
15
„Für ein .6; 5/-Lotto-Design zu An braucht man mindestens . . . Blöcke.“.
246 3 Heurismen der Reduktion
Die Liste der 6-elementigen Teilmengen von A12 , von denen grundsätzlich jede
als Block eines .6; 5/-Lotto-Designs zu A12 infrage kommt, lässt sich in Paare
zueinander komplementärer Teilmengen von A12 aufteilen:
Genau dann ist Z A12 ein 6-Block von A12 , wenn auch Z 0 WD .A12 n Z/ ein
6-Block von A12 ist.
Ein 6-Block B von A12 repräsentiert genau dann die sechselementige Teilmenge
Z A12 , wenn die zu Z komplementäre sechselementige Teilmenge Z 0 D
.A12 n Z/ von dem zu B komplementären Block B 0 WD .A12 n B/ repräsentiert
wird.
Diese beiden Blöcke repräsentieren jede 6-elementige Teilmenge von A12 , die min-
destens 5 Elemente aus einer der Mengen S1 oder S2 enthält.
2. Schritt: Analyse der mit der Wahl von S1 ; S2 im 1. Schritt vorgenommenen Mo-
dularisierung der Problemstellung (P) und weitere Aufspaltung in Teilprobleme.
Die Wahl von S1 ; S2 induziert folgende Modularisierung des Problems (P):
Zur weiteren Modularisierung des Subproblems (P 2) stellen wir fest, dass sich
die vom Subdesign .SD/1 nicht repräsentierten 6-elementigen Teilmengen Z von
A12 in drei Typklassen einteilen lassen:
Offenbar wird keine 6-elementige Teilmenge vom Typ (2/4) durch einen 6-Block
vom Typ (4/2) repräsentiert und umgekehrt.
Aber: 6-Blöcke vom Typ (3/3) können 6-elementige Teilmengen aller drei Typen
repräsentieren! Im Beispiel oben werden Z1 und Z3 von Z2 repräsentiert, ebenso
repräsentiert Z2 die Menge f1; 2; 3; 7; 8; 10g vom Typ (3/3).
Dies legt folgende Modularisierung des Subproblems (P 2) nahe:
Modularisierung von (P 2)
(P 2)1 Man konstruiere zunächst ein Sub-Design .SD/2;1 aus Paaren zueinan-
der komplementärer Blöcke vom Typ (3/3), welches alle 6-elementigen
Teilmengen vom Typ (3/3) repräsentiert.
(P 2)2 Man stelle fest, welche Teilmengen der Typen (2/4) und (4/2) von
.SD/2;1 nicht repräsentiert werden, und konstruiere ein Sub-Design
.SD/2;2 aus Paaren zueinander komplementärer Blöcke, das die noch
fehlenden Teilmengen der Typen (2/4) und (4/2) repräsentiert.
Abb. 3.14 Paare komplementärer Blöcke vom Typ (3/3) in punktsymmetrischer Anordnung
Dass nun .P 2/1 von .SD/2;1 gelöst wird, ist kein Zufall. Die Symmetrie der
Blockauswahl erzwingt, dass eine jede Teilmenge des Typs (3,3) von A12 von min-
destens einem der Blöcke aus .SD/2;1 repräsentiert wird; die Symmetrien des Sub-
problems .P 2/1 werden vom Subdesign .SD/2;1 reflektiert. Dies kann man folgen-
dermaßen einsehen:
(1) Sei B ein beliebiger der ausgewählten Blöcke vom Typ (3/3) auf einer der
Diagonalen des Quadrats. Dann ist B von der Form
BO D B1 [ .S2 n B2 / ;
der mit B nur die drei Elemente aus B1 gemeinsam hat. Also gibt es keine Teilmen-
ge vom Typ (3/3), die sowohl von B als auch von BO repräsentiert würde.
250 3 Heurismen der Reduktion
Abb. 3.15 Lösung des Subproblems .P 2/1 durch das Subdesign .SD/2;1
B und BO repräsentieren aber jeweils genau 10 Teilmengen vom Typ (3/3) in ihrer
gemeinsamen Zeile:
Z D B1 [ Z1 [ fxg ;
Z D B1 [ Z2 [ fxg ;
Das bedeutet, dass alle 20 Teilmengen vom Typ (3/3), die mit B und BO in einer
gemeinsamen Zeile stehen, von B und BO zusammen repräsentiert werden.
(2) In gleicher Weise könnte man feststellen, dass je zwei Blöcke B und BO
vom Typ (3/3), die in derselben Spalte auf zwei verschiedenen Diagonalen ste-
hen, zusammen alle 20 Teilmengen vom Typ (3/3) repräsentieren, die mit B und BO
gemeinsam in dieser Spalte stehen.
(3) Weil die Anordnung der ausgewählten Blöcke vom Typ (3/3) durchgängig
von der in (1) und (2) beschriebenen Art ist (jede Zeile und jede Spalte ist mit genau
zwei Blöcken auf verschiedenen Diagonalen vertreten), werden alle 400 Teilmen-
gen vom Typ (3/3) durch S3 ; : : : ; S42 repräsentiert – .SD/2;1 löst das Subproblem
.P 2/1 .
Damit können wir uns der Lösung des Subproblems .P 2/2 zuwenden. Vielleicht
hilft uns die Symmetrie der Blockauswahl auch hier weiter – wir werden sehen.
Zunächst muss festgestellt werden, welche Teilmengen der Typen (2/4) und (4/2)
von A12 durch die Blöcke von .SD/2;1 nicht repräsentiert werden.
4. Schritt: Feststellung
der unrepräsentierten Teilmengen vom Typ (4/2).
Es gibt 64 62 D 15 15 D 225 Teilmengen des Typs (4/2) von A12 , die man
durch die Felder einer quadratischen Tabelle mit den 4-elementigen Teilmengen
von S1 als Zeilenkoordinaten und den 2-elementigen Teilmengen von S2 als Spal-
tenkoordinaten veranschaulichen kann (Abb. 3.16). In jedes Feld trägt man nun ein,
durch welche Blöcke von .SD/2;1 die dem Feld zugehörige (4/2)-Teilmenge reprä-
sentiert wird; am Ende geben die leeren Felder die unrepräsentierten Teilmengen
vom Typ (4/2) an.
Offenbar gibt es keine leeren Felder – alle (4/2)-Teilmengen werden repräsen-
tiert! Da es keine unrepräsentierten Teilmengen des Typs (4/2) von A12 gibt, exis-
tieren auch keine unrepräsentierten Teilmengen vom Typ (2/4), denn das Subdesign
.SD/1;2 ist aus Paaren zueinander komplementärer Blöcke aufgebaut; .P 2/2 ist also
ebenfalls gelöst.
Der bisher mittels Systematischen Probierens geführte Nachweis der Tatsache,
dass alle Teilmengen vom Typ (4/2) durch die Blöcke des Subdesigns .SD/2;1 re-
präsentiert werden, lässt sich unter Ausnutzung der Symmetrie der Blockauswahl
folgendermaßen durch einen kombinatorischen Beweis ersetzen.
Sei Z A12 eine beliebige Teilmenge vom Typ (4/2). Dann gibt es eine 4-
elementige Teilmenge M D fx1 ; x2 ; x3 ; x4 g S1 und eine 2-elementige Teilmenge
D S2 mit Z D M [ D. Man betrachte in der quadratischen Tabelle der Blöcke
vom Typ (3/3) (Abb. 3.15) diejenigen vier Zeilen, deren Zeilenkoordinaten durch
die 3-elementigen Teilmengen
M1 D fx1 ; x2 ; x3 g ; M2 D fx1 ; x2 ; x4 g ; M3 D fx1 ; x3 ; x4 g ; M4 D fx2 ; x3 ; x4 g
der Menge M gegeben sind. In jeder dieser 4 Zeilen liegen genau zwei Blöcke des
Systems .SD/1;2 . Wir bezeichnen für i D 1; 2; 3; 4 mit Bi denjenigen Block des
252 3 Heurismen der Reduktion
Abb. 3.16 Repräsentation aller (4/2)-Teilmengen durch die Blöcke von .SD/2;1
Subdesigns, der in der durch Mi gegebenen Zeile auf der Hauptdiagonalen (Dia-
gonale von links oben nach rechts unten) der quadratischen Tabelle liegt; der zu Bi
bezüglich S2 komplementäre Block auf der Nebendiagonalen in der durch Mi gege-
benen Zeile werde mit BOi benannt. In dieser Situation ermöglicht es die Symmetrie
3.3 Modularisierung 253
Die Spaltenkoordinaten TOi der Blöcke BOi sind dann jeweils durch TOi D S2 n Ti
gegeben. Setzt man S1 n M DW fx5 ; x6 g, so ergibt sich:
Damit ist bewiesen, dass T ein .3; 2/-Covering Design von S2 ist, was wiederum
den Beweis abschließt, dass alle Teilmengen des Typs (4/2) von A12 von den Blö-
cken S3 ; : : : ; S42 repräsentiert werden.
Da aber das Subdesign .SD/1;2 aus Paaren zueinander komplementärer Blöcke
aufgebaut ist, werden auch alle Teilmengen des Typs (2/4) von A12 von den Blöcken
S3 ; : : : ; S42 repräsentiert, genauso wie alle Teilmengen des Typs (3/3) von A12 (vgl.
Lösung des Subproblems .P 2/1 ). Wir können also feststellen, dass mit
S WD .SD/1 [ .SD/2 D .SD/1 [ .SD/2;1 D fS1 ; : : : ; S42 g
ein .6; 5/-Lotto-Design zu A12 gewonnen ist, welches nur 42 Blöcke enthält.
Angesichts der Tatsache, dass man es mit 125
D 792 fünfelementigen Teilmen-
gen von A12 zu tun hat, die sämtlich von diesen 42 Blöcken repräsentiert werden,
3.3 Modularisierung 255
mag man mit mir in der Ansicht übereinstimmen, dass es sich bei S um ein „gutes“
Lotto-Design handelt.
Wie gut kann ein Resultat sein, das mit elementaren heuristischen Methoden aus
der Symmetrie der Problemstellung entwickelt wurde, wenn man bedenkt, dass
die Wettbewerber weltweit ganze Armeen von Computern mit der aufwändigen
algorithmischen Suche nach Lotto–Designs beschäftigen?
Abb. 3.17 Paare komplementärer Blöcke vom Typ (3/3) in punktsymmetrischer Anordnung in
Bluskovs 38er-Design
Allerdings repräsentieren diese 24 Blöcke vom Typ (3/3) nicht alle 6-elemen-
tigen Teilmengen des Typs (3/3) von A12 ; dies zeigt Abb. 3.18, die in der Form der
Darstellung Abb. 3.15 entspricht. Die durch die Blöcke SQ3 ; : : : ; SQ26 repräsentierten
6-elementigen Teilmengen des Typs (3/3) von A12 sind in der Tabelle mit i markiert,
wenn SQi der erste Block (bei streng monoton wachsender Anordnung der Indizes)
ist, der die betreffende Teilmenge repräsentiert.
Abb. 3.18 Von SQ3 ; : : : ; SQ26 repräsentierte Teilmengen des Typs (3/3) in Bluskovs 38er-Design
Wenn eine 6-elementige Teilmenge Z vom Typ (2/4) oder (4/2) von vier (!)
verschiedenen Blöcken des Typs (3/3) repräsentiert wird, dann repräsentiert um-
gekehrt Z einen jeden dieser vier Blöcke vom Typ (3/3)!
Es könnte interessant sein, diesen Gedanken vertieft weiter zu verfolgen und den
Simulated-Annealing-Algorithmen, mit denen derzeit die meisten Rekorddesigns
gefunden werden, solche Symmetrieüberlegungen als Selektionskriterien an die Sei-
te zu stellen. Erneut ist hier zu sehen, dass die Rückschau in Pólya-Phase IV we-
sentliche Beiträge zur Problemfindung (! Problemlösen im weiteren Sinne) leisten
kann; diese Rolle der Rückschau wurde auch schon in den Abschlussbetrachtungen
zu Beispiel 3.8 und Beispiel 3.10 deutlich.
In allen behandelten Beispielen zum Heurismus der Modularisierung war ein
fruchtbarer Nebeneffekt der Verwendung dieser Strategie erkennbar:
Selbst wenn es nicht gelingen sollte, Subprobleme zu identifizieren, in die eine
gegebene Problemstellung erfolgreich zerlegt werden kann, so erfordert doch das
Bemühen darum ein profundes Eindringen in die Problemstruktur, und dies trägt in
der Regel zum besseren Verständnis des Problems (Pólya-Phase I) bei.
Eine Gefahr der Methode ist darin zu sehen, dass möglicherweise bei der Zer-
legung eines Problems in Teilprobleme kritische Aspekte der Problemstellung aus-
geblendet werden und dadurch die Natur des Problems verändert wird. Hier ist wie
immer Sorgfalt geboten – die Phase der Rückschau ist ein unverzichtbarer Bestand-
teil des Problemlöseprozesses.
Die Heurismen der Reduktion sind in erster Linie Verfahren mit logischem Charak-
ter, mit denen man nach Voraussetzungen für einen angestrebten Zielzustand (Z)
oder aber nach falschen Konsequenzen der gegenteiligen Annahme (:Z) sucht.
Die „Suche nach falschen Konsequenzen von (:Z)“ rückt sofort die Argumen-
tation durch Widerspruch („reductio ad absurdum“) ins Blickfeld reduktiver Stra-
tegien, die in einem historisch besonders bedeutsamen Denkmuster zusammen mit
einer Sonderform des Extremalprinzips eingesetzt wird. Dabei handelt sich um die
in der es darum geht, die Annahme (:Z) dadurch zum Widerspruch zu führen, dass
man einen unendlichen Prozess in Gang setzt, der eine geeignete Größe von Schritt
3.4 Quintessenz für Problemlöser 259
zu Schritt verkleinert, obwohl diese Größe nur endlich viele kleinere Werte als den
Startwert annehmen kann.
In der konkreten Gestaltung dieses „Abstiegs“, also in dem schöpferischen Pro-
zess, aus der angenommenen Existenz eines Objekts mit bestimmten Eigenschaften
ein kleineres Objekt dieser Art zu konstruieren, besteht die zentrale Schwierigkeit
der Methode; hierfür gibt es kein universelles Verfahren und keine Erfolgsgarantie,
weshalb die Einordnung der Methode des unendlichen Abstiegs als Heurismus un-
zweifelhaft ist, auch wenn das Verfahren demonstrativen Charakter hat. Dennoch
lohnt sich der Versuch in allen Problemstellungen, denen wohlgeordnete Struktu-
ren zu Grunde liegen, wie etwa in Problemen der Zahlentheorie, die im Bereich
der durch das Prinzip vom kleinsten Element wohlgeordneten natürlichen Zahlen
angesiedelt sind.
Die „Suche nach Voraussetzungen für (Z)“ wird bei der
umgesetzt. Man sucht dabei nach Teilzielen (T), von denen man unmittelbar den
Zielzustand (Z) erreichen könnte; dies entspricht dem Part der Analyse in den
Analysis-Synthesis-Prozeduren der griechischen Geometer.
Wenn man die Suche nach solchen Teilzielen dadurch steuert, dass man den
Zielzustand (Z) invertierbaren Transformationen unterzieht und die Ergebnisse (Z’)
dieser Operationen als Zwischenziele ins Auge fasst, bedient man sich einer Vari-
ante des Rückwärtsarbeitens, die als
bekannt ist. Diese Methode lässt sich oft in Problemstellungen der synthetischen
Geometrie erfolgreich einsetzen; in den meisten Problemstellungen, die in irgend-
einer Form ein Optimierungsproblem zum Gegenstand haben, ist diese kanalisierte
Form des Rückwärtsarbeitens zu restriktiv und daher eher ungeeignet.
Von herausragender Bedeutung ist in der künstlichen Intelligenz (KI) der
der dort unter der Bezeichnung Divide & Conquer oder als Divide-Conquer-Glue-
Strategy geführt wird.
Dabei geht es darum, ein Problem (P) in Subprobleme P1 ; : : : ; Pn aufzuspalten,
diese Subprobleme zu lösen (was eventuell weitere Zerlegungen der Subprobleme
in Subsubprobleme erforderlich macht) und dann die Lösungen der Subprobleme
zu einer Lösung des ursprünglichen Problems (P) zusammenzusetzen.
Der Transfer dieser Methode in die Welt des mathematischen Problemlösens
birgt oft die Schwierigkeit, geeignete Subprobleme zu identifizieren, in die sich ein
Problem aufspalten ließe.
260 3 Heurismen der Reduktion
Dieser extreme Standpunkt reflektiert die Rolle der Mathematik als eine kumulative
Wissenschaft, die ihre Erkenntnisse seit der Epoche E UKLIDs nach strengsten Maß-
stäben und für alle Zeiten gültig gesichert hat; ein Voranschreiten ist nur möglich,
wenn man deduktiv gesicherte Antworten auf „gute“ Fragen nach bislang unbe-
kannten Zusammenhängen findet und die gewonnenen Einsichten denjenigen der
mehr als 5000 mathematischen Theorien als mathematische Sätze hinzufügt, in de-
nen diese Zusammenhänge von Bedeutung sind.
Es steht aber außer Zweifel, dass die „guten“ Fragen bei der Bearbeitung ma-
thematischer Probleme entdeckt werden, und zwar unabhängig davon, ob diese
Probleme lösbar sind oder nicht – man denke etwa an die unzähligen mathema-
tischen Neuentwicklungen im Zuge der fast 2000 Jahre andauernden Versuche, die
drei Klassischen Probleme der Geometrie (Quadratur des Kreises, Winkeltrisekti-
on, Kubusverdoppelung) zu lösen, was sich erst im 19. Jahrhundert als unmöglich
herausstellte.
Problemlösen ist der Kern allen mathematischen Fortschritts, und deshalb sei-
en zum Abschluss allen Lehrenden und Lernenden der Mathematik, dabei insbe-
sondere denjenigen, die selbst den Beruf der Lehrerin oder des Lehrers im Fach
Mathematik anstreben, die Worte P ÓLYAs ans Herz gelegt:
Teaching is not a science; it is an art. If teaching were a science there would be a best way
of teaching and everyone would have to teach like that. Since teaching is not a science,
there is great latitude and much possibility for personal differences . . . let me tell you what
my idea of teaching is. Perhaps the first point, which is widely accepted, is that teaching
must be active, or rather active learning . . . the main point in mathematics teaching is to
develop the tactics of problem solving.
G EORGE P ÓLYA (1887–1985)
Personenverzeichnis
D H
DE M ORGAN , AUGUSTUS (1806–1871), 198 H AAS , N ICOLA, 99
D ESCARTES , R ENÉ (1596–1650), 12, 13 H ADAMARD , JAQUES -S ALOMON, 85
D IEDERICH , K LAS, 84 H AKEN , W OLFGANG, 238
D IOPHANT von Alexandria (um 250 n. Chr.), H ALL , M ONTY, 163
168, 217 H EIN , P IET (1905–1996), 74
D IRICHLET, G USTAV P ETER L EJEUNE - H EINRICH , F RANK , 234
(1805–1859), 137 H ENDERSON , A RCHIBALD , 105
D ÖRNER , D IETRICH, 1 H ESSE , OTTO, 23
H ILBERT, DAVID, 20
E H IPPASOS von Metapont (ca. 500–440
E HRENFELS , C HRISTIAN VON, 39 v. Chr.), 208
© Springer-Verlag GmbH Deutschland, ein Teil von Springer Nature 2018 263
W. Schwarz, Problemlösen in der Mathematik, https://doi.org/10.1007/978-3-662-56762-3
264 Personenverzeichnis
N W
NASH , J OHN F ORBES (*1928), 74 W EIERSTRASS , K ARL (1815–1897), 178,
N EWELL , A LLEN, 165, 219 189, 192
W EIL , A NDRÉ (1906–1998), 208
P W ERTHEIMER , M AX, 3, 39, 44
PAPPOS von Alexandria (um 300 n. Chr.), 167, W EYL , H ERMANN, 20
225 W ILES , A NDREW, 168
PASCAL , B LAISE (1623–1662), 156, 198 W INTER , H EINRICH, 208
P EANO , G IUSEPPE , 17 W ITTMANN , E., 33
P ELL , J OHN (1610–1685), 213 W USSING , H ANS -L UDWIG, 184
Sachverzeichnis
265
266 Sachverzeichnis
H Inzidenzrelation, 104
Halbebene, 12 Inzidenzstruktur, 102, 104
Halbraum, 12 Inzidenztafel einer Relation, 128
Hamilton, William Rowan, 16 Irrationalität, 209
Happy Ending Problem, 141
harmonisches Mittel, 10 K
Hauptsatz über monotone Folgen, 191 Kante, 5
Hessesche Matrix, 23 Kantenmodell, 8
Hessesche Normalenform, 26 Kantenzug, 6
heuristische Struktur, 1 kartesisches Koordinatensystem, 12
heuristische Suche, 166 Kathetensatz, 11
Hex, 74, 76 Kegelschnitt, 12
Hilfsmittelfrage, 166, 223 Kettenbruch, 214
Hill Climbing, 169 Kettenbruchapproximation, 214
Höhensatz, 11 k-Kollektion, 112
holomorphe Funktion, 85 k-Kombination, 112
Holomorphie, 56 Klassifikationsprobleme, 54
homogene Markow-Kette, 29 Kleiner-Relation, 10
Homöomorphismus, 56 Kleines Eins-plus-Eins, 3
Hurwitz-Kriterium, 23 kleinste obere Schranke, 178
Hyperboloid, 12 kombinatorische Optimierung, 170
Hyperebene, 26 kommensurabel, 67
Kompaktifizierung von C, 55
I komplementärer Subgraph, 36
Identifikationsfunktion des Extremalen, 99 komplementäres Ereignis, 28
ikonische Ebene, 3 komplementäres Zählen, 118
indirekter Beweis, 100 Komplexe Differenzierbarkeit, 56
indirekter Vergleich, 65 konform, 57
indische Formeln, 217 Kongruenzabbildung, 59
Induktionsanfang, 200 Kongruenzsatz (wsw), 106
Induktionsaxiom, 199 Königsberger-Brücken-Problem, 4
Induktionsproblem der Erkenntnistheorie, 199 konstante Funktion, Approximation durch, 185
Induktionsschluss, 200 Koordinatengeometrie, 12
Induktionsstrategien, 206 Koordinatensystem, 12
induktive Struktur, 199 Korrespondenzhypothese, 99
induktives Schließen, 149 Kosinussatz, 12
injektives k-Tupel, 112, 244 k-Teilmenge, 112
Inkommensurabilität, 209 k-tes Moment einer Funktion, 186
innerer Teilpunkt, 107 Künstliche Intelligenz, 168
Instruktionsfragen, 33 k-Variation, 112
Integrationsweg, 189
Intervalladditivität des Integrals, 187 L
Intervallhalbierung, 191 Lagrange, 70
Intervallhalbierungsverfahren, 192 Lagrange-Multiplikatoren, 25
Intervallschachtelung, 50, 179 längentreu, 59
Intervallschachtelungsaxiom, 178 Lineare Algebra, 20
intuitiver Grenzwertbegriff, 71 lineare diophantische Gleichung, 221
Invarianten, 45 lineare Gleichung, 12
Invarianzprinzip, 225 lineare Optimierung, 13
Inversion, 58 lineare Ungleichung, 12
Inzidenz, 51, 60 Linearität des Integrals, 186
Inzidenzaxiome, 102 lokal konform, 57
Inzidenzgeometrie, 104 lokale Approximation, 176, 185
268 Sachverzeichnis
Rolle des Computers, 240 Symmetrieprinzip, 44, 64, 66, 157, 245, 246
Rückwärtsarbeiten, 61, 166, 219 Symmetrieprinzip als Spielstrategie, 72
Rückwärtsstrategien, 206 symmetrische Gruppe Sn , 68
symmetrische Matrix, 29
S Systematisches Probieren, 86, 215, 239, 251
Satz vom gleichschenkligen Dreieck, 108
Satz vom Supremum, 191 T
Satz von B OLZANO -W EIERSTRASS, 192 Tabellendarstellung, 6, 248
Satz von der Gebietstreue, 57 Tangram, 164
Satz von der offenen Abbildung, 56 Taylor-Formel, 85
Satz von Euler-Fermat, 122 Taylorreihe, 85
Satz von Pythagoras, 92 Teilersummenfunktion , 70
Satz von R AMSEY, 141 Teilverhältnis, 60
Satz von S TOKES, 189 teilverhältnistreu, 59
Teilzielfrage, 166, 223
Satzgruppe des Pythagoras, 11
Tetraeder, 8
Scherung, 97
Tetraedernetz, 8
Schriftliche Division: deutsches
Thales von Milet, 34
Normalverfahren, 175
Topologie, 16
Schubfachprinzip, 137
Transformationsprinzip, 4
Schubfachprinzip, verschärfte Version, 140
Translation, 58
Siebformel, 121
Traveling Salesman Problem, 165
Siehe-Beweis, 71
Treppenfunktion, Approximation durch, 185
Simulated Annealing, 174, 258
trivialer Graph auf n Ecken, 52
Simuliertes Ausglühen, 174
Sinussatz, 12 U
Skalarprodukt, 17 überschlägiges Rechnen, 175
Spezialisierung, 83, 91, 153 Übersummativität, 39
spezifische Wärmekapazität, 48 Umformulierung, 33
Spur eines Integrationsweges, 189 Umstrukturierung, 109
stationäre Verteilung einer Markow-Kette, 30 ungerader Anteil, 139
Steiner-Lehmus, 230 unikursal, 5
stetig, 185 unvollendete Induktion, 151
stetige Verzinsung, 177
stochastische Matrix, 29 V
stochastischer Prozess, 28 Variation der Darstellung, 3
stochastischer Vektor, 29 Variation der Wahrnehmung, 38
Stomachion des A RCHIMEDES, 164 Variation des Allgemeinheitsgrades, 83
2. Strahlensatz, 103 Vektorraum, 16
Streckenlängen, 10 verallgemeinerter Satz von Pythagoras, 93
streckenverhältnistreu, 61 Verallgemeinerung, 83, 153
struktureller Transfer, 33 Verallgemeinerung zur Befreiung von
Subgraph, 36 Restriktionen, 84
Suche nach gemeinsamen Verallgemeinerung zur Reduzierung der
Verallgemeinerungen, 95 Problemkomplexität, 84
Summenformeln für die m-ten Potenzen, 135 Verschiebungen, 60
Summenregel, 109 versteckte Symmetrie, 67
Supremum, 178 Verteilen von Größen, 72
Supremumsaxiom, 178 Vier kombinatorische Grundaufgaben, 111
surface structures, 2 Vierfarbenproblem, 238
symbolische Ebene, 3 Vier-Quadrate-Satz, 70
Symmetriebegriff, operationalisierte Fassung, vollendete Induktion, 151, 197
68 vollständige Induktion, 86, 198, 216
Symmetriegesetz, 41 vollständiger Graph auf vier Ecken, 8
270 Sachverzeichnis