Sie sind auf Seite 1von 29

Freie Universität Berlin

Fachbereich Philosophie und Geisteswissenschaften


Institut für Philosophie
Habelschwerdter Allee 30
14195 Berlin

Vergleichen und Ordnen – Kommunizieren und Begreifen


Ein Ansatz zur Beschreibung der menschlichen Wahrnehmung

Hausarbeit
Seminar: Transzendentale Physikbegründung bei Kant und C. F. v. Weizsäcker
Dozent: Prof. Dr. Holm Tetens
Wintersemester 2007/2008
2

Inhalt
1 Einleitung

2 Vergleichen und Ordnen


2.1 Inputs
2.2 Elementares Vergleichen
2.3 Direkter und indirekter Vergleich
2.4 Metrik – Topologie – Ordnung – Toleranz
2.5 Mehrstufigkeit

3 Sehen
3.1 Vom ungeordneten Nervenbündel zur 2D-Abbildung
3.2 Indirekter Vergleich

4 Kommunizieren und Begreifen


4.1 Hypothese
4.2 Kommunikation
4.3 Unstetigkeit und der Begriff des Begriffs
4.4 Kommunikation und Feedback
4.5 Separation der Zeichen
4.6 Abstraktion der Zeichen
4.7 Entstehung und Dynamik eines Begriffs
4.8 Dynamik eines isolierten Begriffs
4.8.1 Lokale Toleranz (Familienähnlichkeit)
4.8.2 Globale Toleranz (Prototypen)
4.9 Sprache und komplexe begriffliche Struktur

5 Schluss

Anhang

Literatur
3

1 Einleitung
Das Programm transzendentaler Physikbegründung, so wie von Kant und C. F. v. Weizsäcker
verfolgt, sucht nach notwendigen Bedingungen der Möglichkeit von Erfahrung mit dem Ziel
zu zeigen, wie die Physik, die die von uns wahrnehmbare Welt beschreiben soll, aufgebaut
sein muss. Zu der Frage, was überhaupt der Gegenstand einer physikalischen Theorie ist und
wovon die Rede ist, wenn ein Physiker von einzelnen Objekten spricht, schreibt Weizsäcker:
„Wie es möglich ist, ... [ein bestimmtes Objekt als dieses Objekt wahrzunehmen], ist nicht
Gegenstand unserer physikalischen Theorie; daß es möglich ist, ist Voraussetzung jeder
solchen Theorie. ... Daß wir Objekte aus dem Weltganzen sinnvoll gedanklich herauslösen
können, versteht sich nicht von selbst“ ([1], S. 199). Dieses Herauslösen der Objekte ist aber
die Grundlage für ein Verständnis der Welt, das ist nicht nur in der Physik so. Die Entstehung
einzelner Begriffe, die ein rationales Verständnis der Welt erst ermöglichen, beinhaltet
ebenfalls ein solches Herauslösen. Dabei entsteht sowohl eine größere Ordnung als auch die
Fähigkeit differenziert wahrzunehmen, was eng miteinander verknüpft ist. Der Mensch, so
wie er auf die Welt kommt, ist nicht einmal in der Lage ein Objekt mit den Augen zu fixieren.
Es sieht aus, als müsste er zuerst lernen, was ein Objekt überhaupt ist und sich somit die
Grundlage seiner Erkenntnis selbst legen. Wie aber kann er das lernen, wenn ihm nichts als
bloße Sinneswahrnehmungen gegeben sind?
Diese Frage hat mich zu den Überlegungen des ersten Teils dieser Arbeit motiviert: Ich wollte
zeigen, dass sich unter minimalen theoretischen Voraussetzungen eine komplexe Ordnung der
Wahrnehmung schaffen lässt. Das Ergebnis ist ein mathematisches Modell, das auf der Basis
elementarer Vergleiche eine gegebene Menge von Wahrnehmungen strukturiert. Ich glaube
zeigen zu können, dass es möglich ist zu lernen, dass Augen zum Sehen, Ohren zum Hören,
Händen zum Fühlen usw. da sind.
Im zweiten Teil der Arbeit beschäftige ich mich damit, wie bestimmte Phänomene auf
höheren Ebenen des menschlichen Geistes beschrieben werden können, wenn man davon
ausgeht, dass sich alle geistigen Fähigkeiten eines Menschen nach den von mir beschriebenen
Prinzipien zum Erschließen der Welt entwickeln. Ich werde untersuchen wie Zeichen und
begriffliche Strukturen entstehen können und versuche zu erklären, wie wir einzelne,
voneinander abgegrenzte Begriffe haben können.
4

2 Vergleichen und Ordnen

„Erfahrung heißt aus der Vergangenheit für die Zukunft lernen.“


(Carl Friedrich von Weizsäcker: [2], S. 29)

Ich möchte hier kein neuro-physiologisches Modell aufstellen, es soll ein funktionales Modell
sein, mit dem Ziel zu zeigen, dass bestimmte Vorgänge prinzipiell möglich sind (und zwar
sogar unter relativ geringen Voraussetzungen). Solche funktionalistischen Ansätze 1 haben den
Vorteil, dass sie auf verschiedene (auch nicht-physische) Weisen realisiert sein können. Das
Modell ist aber von der Vorstellung inspiriert, dass unsere Wahrnehmungen durch eine
Wechselwirkung mit der Umwelt zustande kommen und in Form von neuronalen Impulsen
vorliegen und verarbeitet werden. Ich werde die Wahrnehmungen als einen Informationsstrom
in Form einer zeitlichen Folge von Inputs beschreiben. Die Inputs werden über einen längeren
Zeitraum derart verarbeitet, dass einerseits Information über die innere Struktur eines Inputs
gewonnen wird und andererseits neue Inputs auf der Basis der bis dahin eingetroffenen Inputs
(der „Erfahrung“) sinnvoller interpretiert werden können.

2.1 Inputs
Ich beschreibe die Wahrnehmung zu einem Zeitpunkt t durch einen N-dimensionalen Input-

Vektor I (t ) , dessen Koordinaten Werte aus dem Intervall [0,1] annehmen können, wobei ich
die einzelnen Koordinaten mit Indizes bezeichne (z.B. Ik). In einem physiologischen Bild
wäre N die Anzahl der Nervenfasern aller Rezeptoren. Eine Festlegung der Koordinaten auf
die Werte Null oder Eins entspräche einer digitalen Funktionsweise des Zentralnervensystems
(feuern/nicht-feuern), das Modell setzt dies jedoch nicht voraus.2 An der Einschränkung auf
endlich viele Dimensionen werde ich aus Gründen der Anschaulichkeit festhalten, es
widerspricht jedoch nichts einer mathematischen Erweiterung.

2.2 Elementares Vergleichen


Um die Inputs in irgendeiner Weise zu verarbeiten, muss ein Minimum an Fähigkeiten
vorausgesetzt werden. Die zentrale Voraussetzung des Modell ist, dass zu jedem Zeitpunkt

1
vgl. z.B. den Ansatz von Warren S. McCulloch, den Menschen als Turingmaschine zu beschreiben, in der nur
zwei Rückkopplungsmechanismen determiniert sind: „a desire to play and a desire to win“ (Warren S.
McCulloch nach [3], S. 54).
2
vgl. dazu die Diskussionen zur Digital-Analog-Problematik auf den Macy Konferenzen ([4]), dort insbesondere
den Beitrag von Ralph W. Gerard: Some of the Problems Concerning Digital Notions in the Central Nervous
System, S. 171-202.
5

die Möglichkeit besteht die Werte zweier Koordinaten eines Inputs zu vergleichen. 3 Ich wähle
als Vergleichsfunktion den Betrag der Differenz | Ii – Ij |. Aus den Vergleichen der Werte der
Koordinaten zu einem Zeitpunkt bildet sich über einen längeren Zeitraum hinweg die
Fähigkeit nicht nur die Werte der Koordinaten, sondern die Koordinaten selbst miteinander zu
vergleichen: Der Vergleichswert zweier Koordinaten ist der zeitliche Mittelwert der
Vergleiche ihrer Werte, zu jedem Paar von Koordinaten existiert also genau ein
Vergleichswert. Die Menge dieser Werte lässt sich in einer N × N − Matrix darstellen:

Aij := | I i (t ) − I j (t ) | t .

Aij gibt also den mittleren Abstand der Werte der i-ten und j-ten Koordinate an. Ein Maß dafür
wie ähnlich sich die Werte zweier Koordinaten im Mittel waren ist

Wij := 1− | I i (t ) − I j (t ) | t .

Wij und Aij sind beide aus [0,1], wobei im digitalen Bild (Input-Koordinaten Null oder Eins)
Wij und Aij für große Zeiten gegen die Wahrscheinlichkeit konvergieren, dass die
entsprechenden Koordinaten zu einem Zeitpunkt gleiche bzw. verschiedene Werte haben. Im
Allgemeinen konvergiert Aij gegen den Erwartungswert des Abstandes der entsprechenden
Koordinaten und Wij gegen 1 – Aij. Ich nenne W und A Ähnlichkeitsmatrix und
Abstandsmatrix. In ihnen schlagen sich alle Erfahrungen nieder, die ein Mensch macht, und
sie beeinflussen wie zukünftige Erfahrungen interpretiert werden (siehe unten). Die zeitliche
Mittelung erfolgt vom Zeitpunkt der Geburt bis zur Gegenwart.4

2.3 Direkter und indirekter Vergleich


Die elementaren Vergleiche der Koordinaten bzw. ihrer Werte stellen die Voraussetzung
dafür dar zwei Inputs miteinander zu vergleichen. Ich definiere den Abstand zweier Inputs zu
einem Zeitpunkt als

  1  
d ( I 1 , I 2 ) := || I 1 − I 2 ||1
N

3
Ich denke eine grundlegende Fähigkeit zu vergleichen ist eine notwendige Voraussetzung für Leben überhaupt,
da sonst eine Reaktion auf die Umwelt gar nicht möglich wäre.
4
Es wäre auch denkbar andere Mittelungen zu verwenden. Ein exponentiell geglätteter Mittelwert würde z.B.
berücksichtigen, dass Erfahrungen mit der Zeit verblassen.
6

mit der Betragsnorm

N

|| x ||1 := ∑ | x i | .
i =1

Der Abstand zweier Inputs entspricht also dem Mittelwert der Abstände ihrer Koordinaten
und liegt wieder in [0,1].5 Diese Möglichkeit zwei Inputs miteinander zu vergleichen nenne
ich einen direkten Vergleich. Die Ähnlichkeitsmatrix W bietet eine zusätzliche Möglichkeit
zwei Inputs miteinander zu vergleichen. Sie induziert einen Endomorphismus V auf dem
Raum der Inputs:

 1   1 N
V ( I ) := W ⋅ I
N
bzw. Vk ( I ) =
N
∑W
i =1
ki ⋅ Ii .

Von einem indirekten Vergleich über A spreche ich, wenn die Inputs zunächst transformiert
und anschließend direkt verglichen werden:

   
d ind . ( I 1 , I 2 ) = d (V ( I 1 ),V ( I 2 )) .

Anschaulich gesprochen führt die Transformation dazu, dass sich der Wert einer Koordinate
auf alle ihr ähnlichen Koordinaten überträgt. Je ähnlicher sich zwei Koordinaten in der Matrix
sind d.h. je ähnlicher sich ihre Werte im Mittel waren, desto ähnlicher sind sich ihre Werte
nach der Transformation, selbst wenn sie sich vor der Transformation stark unterschieden
haben. Zwei Inputs, die sich im direkten Vergleich nicht ähneln, sind sich also im indirekten
Vergleich unter Umständen sehr ähnlich. Diese Ähnlichkeit besteht aber nur aufgrund
bestimmter Erfahrungen. Ein indirekter Vergleich realisiert in formaler, mathematischer
Weise das, was ich im zweiten Teil der Arbeit (in Einklang mit dem üblichen Sprachgebrauch
) als Assoziation bezeichnen werde.

5
Die Betragsnorm ist eine p-Norm für p = 1. Die p-Norm für einen N-dimensionalen Vektorraum ist definiert
N

als || x || p := ( ∑| x
i =1
i | p ) 1 / p . Für die euklidische Norm (p=2) müsste man schon mehr als die Betragsfunktion
und Mittelwertbildung voraussetzen, nämlich Multiplizieren und Radizieren.
7

2.4 Metrik – Topologie – Ordnung – Toleranz


Die Betragsfunktion erfüllt alle Kriterien einer Metrik

1. | x − y |= 0 ⇔ x = y (Definitheit)
2. | x − y |=| y − x | (Symmetrie)
3. | x − y |≤| x − z | + | z − y | (Dreiecksungleichung)

Diese Eigenschaft überträgt sich auf die Abstandsmatrix, was unter anderem daran liegt, dass
die zeitliche Mittelung mit der Addition kommutiert, so dass auf A die Dreiecksungleichung
erfüllt

AXY = | X − Y | t ≤ | X − Z | + | Z − Y t
= | X − Z | t + | Z − Y | t = AXZ + AZY

Mit Aij ist also eine erfahrungsabhängige Metrik auf der Menge der Koordinaten K gegeben.
Auf dem metrischen Raum (K,A) ist die ε -Umgebung eines Punktes x definiert als

U ε ( x ) := { y ∈ K | Axy < ε } ε >0.

Die ε -Umgebungen erzeugen als Basis eine Topologie, so dass man auch von der
erfahrungsabhängigen Topologie der Inputs sprechen kann. Ich verweise hier auf den Begriff
der Topologie, weil es eine allgemeinere, mengentheoretische Struktur ist, die nicht das
Messen von Abständen voraussetzt. Zwei metrische Objekte, die topologisch äquivalent sind,
müssen nicht zwangsläufig dieselbe Metrik besitzen. Viele Überlegungen im zweiten Teil der
Arbeit setzen nur die Existenz einer Topologie nicht aber einer Metrik voraus. Auf diese
Weise kann ich auch den Begriff des Messens in Bezug auf geistige Vorgänge weitgehend
vermeiden. Für einige abschließende Überlegungen bezüglich der Bildung von Begriffen
werde ich allerdings wieder konkreter und setze eine Metrik voraus. Ich führe deshalb noch
einige Konzepte ein, die aber erst im Abschnitt zur Familienähnlichkeits-Konzeption wichtig
werden und vorerst übersprungen werden können. Das erste Konzept baut auf dem Begriff der
ε -Umgebung auf und kann zum Ordnen eines metrischen Raumes genutzt werden.

Die ε -Ordnung einer Grundmenge G mit einer zugeordneten Metrik ist das mächtigste
Mengensystem disjunkter Mengen deren Vereinigung G ist, wobei jeder Punkt in
derselben Menge wie seine ε -Umgebung liegt.
8

Die ε -Ordnung einer Grundmenge lässt sich iterativ konstruieren. Man beginnt mit einem
Mengensystem, in dem jeder Punkt der Grundmenge als einziges Element in genau einer
Menge liegt. Man sucht nun Paare von Punkten verschiedener Mengen deren Abstand kleiner
als ε ist und vereinigt die zugehörigen Mengen. Existiert kein solches Paar von Punkten
mehr, stellt das vorliegende Mengensystem die ε -Ordnung der Grundmenge dar. Jede ε -
Ordnung einer Menge erzeugt (als Basis) eine Topologie auf der Menge. Je kleiner ε ist,
desto feiner ist dabei die Topologie.
Das zweite und dritte Konzept bauen aufeinander auf und sind verwandt mit dem der ε -
Ordnung. Ich definiere zunächst die Isolation I eines Punktes x aus R in einer Teilmenge
U ⊆ R unter Rückgriff auf die Metrik d des Raumes R als

I ( x, U ) := min{d ( x, y ) | y ∈U }

Nun definiere ich die lokale Toleranz τ der Menge U als

τ (U ) := max{I ( x, U ) | x ∈U }

Die lokale Toleranz einer Menge gibt also an, wie groß die größte in ihr vorkommende

Isolation eines Punktes ist. Für die lokale Toleranz τ einer Menge M ε einer ε -Ordnung gilt

immer τ (M ε ) ≤ ε .

2.5 Mehrstufigkeit
Mit Mehrstufigkeit meine ich, dass primäre Inputs, denen eine Ähnlichkeitsmatrix zugeordnet
ist, zu Elementen von sekundären Inputs, also Inputs einer zweiten Stufe werden können. Es
ist auch möglich primäre Inputs mit sekundären Inputs zu „verschalten“, sie also als
gemischten Input auf einer höheren Stufe zu verwenden. Die Nervenfasern unserer Augen,
Ohren usw. bilden unseren visuellen, akustischen usw. Sinn; unsere Sinne bilden eine
Wahrnehmung zu einem Zeitpunkt; die Wahrnehmungen in einem bestimmten Zeitraum
bilden eine Erfahrung; die Erfahrungen bilden so etwas wie das Weltbild.
Diese Struktur soll nur eine grobe Idee darstellen. Das vorgelegte Modell beinhaltet die
Mehrstufigkeit nur, wenn man es wiederholt anwendet. Folgende Grafik soll diesen Aufbau
verdeutlichen:
9

Koordinaten
Inputs

1.Stufe K1, K2, K3, ... d(Ki, Kj)


zusammenfassen ind. Vergleich

? d(Ii, Ij)
gleich I1, I2, I3, …
gleich
2.Stufe K’1, K’2, K’3, ... d(K’i, K’j)
zusammenfassen ind. Vergleich
? d(I’i, I’j)
gleich I’1, I’2, I’3, …
gleich
3.Stufe K’’1, K’’2, K’’3, ... d(K’’i, K’’j)
zusammenfassen
ind. Vergleich
?
usw. usw.
gleich
gleich
usw. usw.

Mehrstufigkeit ist eine Möglichkeit komplexere Abläufe zu modellieren:


Ein Input 1.Stufe besteht aus einer Menge von Koordinaten, die zu jedem Zeitpunkt einen
bestimmten Werte annehmen. Man kann die Menge der Inputs 1.Stufe nun als Koordinaten
2.Stufe interpretieren und zu einem Input 2.Stufe zusammenfassen. Ein Problem ist hierbei,
dass die Menge von Inputs 1.Stufe mit der Zeit immer größer wird und kein Input wiederholt
auftritt. Man müsste deshalb ähnliche Inputs zu einer Koordinate „bündeln“ und außerdem
einen gewissen Zeitraum abwarten, bis sich die Werte der Koordinaten „angesammelt“ haben.
Die Voraussetzung für eine Bündelung liefert die Ähnlichkeits- bzw. Abstandsmatrix, mit
deren Hilfe man ähnliche bzw. nah beieinander liegende Inputs auf dieselbe Koordinate
abbilden könnte. Die Fähigkeit zu vergleichen setzt sich ebenfalls fort: Elementare Vergleiche
der Koordinaten 1.Stufe ermöglichen nach der zeitlichen Mittelung indirekte Vergleiche der
Inputs 1.Stufe, die wiederum als elementare Vergleiche der Koordinaten 2.Stufe verwendet
werden können.

3 Sehen
Ich möchte am Beispiel des Sehens das Modell konkret anwenden und seine Erklärungskraft
demonstrieren. Unter geringfügig vereinfachten Bedingungen lässt sich mit dem Modell
erklären, wie aus den Informationen des Sehnervs die zweidimensionale Charakteristik des
10

visuellen Sinns gewonnen werden kann. Außerdem werde ich das Prinzip des indirekten
Vergleichs anhand eines Beispiels verdeutlichen.

3.1 Vom ungeordneten Nervenbündel zur 2D-Abbildung


Ich wähle den Sehnerv eines Auges als Input des Modells. Er enthält ca. 1 Mio. Nervenfasern,
in die jeweils verschieden viele Rezeptoren der Netzhaut münden.6 Der Input zu einem
Zeitpunkt wird also durch N = 1 Mio. Koordinaten beschrieben, die angeben, ob die jeweilige
Faser grade feuert (Eins) oder nicht (Null). Ich gehe dabei davon aus, dass eine Faser feuert,
wenn Licht auf die zugehörigen Rezeptoren fällt,7 die unterschiedliche Farbsensitivität der
Rezeptoren und das Ansprechen auf Druck wird vernachlässigt. Ich werde nun die
Abstandsmatrix A explizit ausrechnen. Der Differenzbetrag der Koordinaten X und Y zu
einem Zeitpunkt t, dessen zeitliches Mittel den Wert AXY ergibt, hängt davon ab, ob zu diesem
Zeitpunkt beide Rezeptoren gleichermaßen angeregt (bzw. nicht angeregt) werden oder ob die
Anregung verschieden ist. Die Mittelung über alle Zeitpunkte wird durch eine Mittelung über
alle möglichen Bilder ersetzt, wobei jedes Koordinatenpaar (abhängig von der Position der
zugehörigen Rezeptoren auf der Netzhaut und dem aktuellen Bild) einen Abstand von Null
oder Eins hat. Da zwei Rezeptoren immer auf einer Geraden liegen lässt sich das Problem
eindimensional beschreiben, ein Bild der Breite B wird also durch eine reelle Funktion auf
[0,B] dargestellt. Ich vereinfache das wahrgenommene Objekt zu einer Kastenfunktion die
durch ihre Breite b und den Abstand a ihres rechten Randes vom linken Bildrand angegeben
wird. Außerdem nehme ich an, dass b und a gleichverteilt sind, also alle Positionen und alle
Breiten mit gleicher Wahrscheinlichkeit auftreten. 8 Die beiden Rezeptoren X und Y werden
durch ihren Abstand x bzw. y (o.B.d.A. x < y) vom linken Bildrand beschrieben. Liegt ein
Rezeptor innerhalb des Kastens, feuert er, liegt er außerhalb, feuert er nicht.

6
Die physiologischen Fakten finden sich z.B. in [5].
7
Beim menschlichen Auge stimmt dieses Bild der punktweisen Informationsübertragung weitgehend, vgl. aber
Untersuchungen zur Funktionsweise eines Froschauges, das die Bildinformation vor der Weiterleitung an das
Gehirn vorverarbeitet, so dass nicht jede Faser einem Bildpunkt entspricht: [6].
8
Der Fehler durch die Vereinfachung zu kastenförmigen Objekten ist kleiner als es zunächst schein, da sich
jedes Bild in guter Näherung als eine Summe solcher Kastenfunktionen darstellen lässt. Da eine Summation mit
der Mittelung kommutiert, kann auch zunächst gemittelt und anschließend summiert werden bzw. ein Bild in
mehrere Kasten-Bilder zerlegt werden ohne dass dadurch ein Fehler entsteht. Die Annahme einer
Gleichverteilung der Breite erzeugt im Gegensatz dazu sicherlich einen größeren Fehler.
11

0 x y a

Der Abstand der beiden Koordinaten zum Zeitpunkt t hängt nun vom Abstand ihrer
Rezeptoren auf der Netzhaut, D =| x − y | , und dem Bild, das durch die Breite b und Position
a des Kastens beschrieben wird, ab. Über a und b wird in der Rechnung gemittelt, da dies die
Parameter sind, die die Menge aller Bilder charakterisiert. Ich schreibe für den Abstand

d a ,b ( x, y ) . Die Werte, über die später integriert werden muss, lassen sich durch eine

Fallunterscheidung erfassen:

b < D und b > D und Abstand


a ∈ [0, x ] a ∈ [0, x ]  d a ,b ( X , Y ) = 0
a ∈ [ x , x + b] a ∈ [ x, y ]  d a ,b ( X , Y ) = 1
a ∈ [ x + b, y ] a ∈ [ y , x + b]  d a ,b ( X , Y ) = 0
a ∈ [ y , y + b] a ∈ [ x + b, y + b]  d a ,b ( X , Y ) = 1
a ∈ [ y + b, B + b] a ∈ [ y + b, B + b]  d a ,b ( X , Y ) = 0

Mittelt man d a ,b ( x, y ) über die verschiedenen Kastenpositionen a, erhält man

Fall: b < D Fall: b > D


B +b
1 2b 2D
B+b ∫d
0
a ,b ( X , Y ) ⋅ da
B+b B+b

Mittelt man nun noch über die verschiedenen Kastenbreiten bis zu einer maximalen Breite
bmax ( b max ≥ D ) erhält man

AXY = d a ,b ( X , Y ) a ,b

1
b max
 1 B +b  1  2b
D b max
2D 
=
b max ∫  B + b ∫ d a ,b ( X , Y ) ⋅ da  ⋅ db = b max  ∫ B + b ⋅ db + ∫ B + b ⋅ db 
   
0  0  0 D 
12

2   B   B + b max  
=  D + B ⋅ ln  + D ⋅ ln 
b max  B + D  B + D 

AXY

0.6

0.5

0.4

0.3

0.2

0.1

D
0.5 1 1.5 2
B =1;
bmax = 1 (blau); bmax = 1.5 (grün); bmax = 2 (gelb); bmax = 2.5 (rot)

Die Ableitung nach D ist

dAXY 2  B D  B + b max   2  B + b max 


= 1 − − + ln  = ⋅ ln >0
dD b max  B+D B+D  B + D   b max  B + D 

wenn − B < D < b max .

Da die Breite des Bildes und des Kastens B und b immer größer Null sind und die maximale
Kastenbreite bmax größer als der größte Rezeptorenabstand (der maximal B sein kann) ist, ist
die Ableitung immer positiv und AXY also eine steigende Funktion des Abstandes der
entsprechenden Rezeptoren auf der Netzhaut. Wie auch die Grafik zeigt, ist für große Werte
von bmax (d.h. wenn es Objekte gibt die das Blickfeld bei weitem überschreiten, was in der
Realität der Fall ist) der Zusammenhang zwischen AXY und D annähernd linear. Die durch A
induzierte Metrik und Topologie (siehe oben) ist dann äquivalent zu einer Ebene. Dieses
Ergebnis ist empirischer Natur und nicht selbstverständlich. Die Topologie des Hörnervs ist
beispielsweise eine ganz andere:9 Die entscheidende physikalische Größe, die
Luftschwingungen, lässt sich durch eine eindimensionale Größe, die Frequenz,

9
Für eine genauere Beschreibung der Funktionsweise des menschlichen Gehörs siehe ebenfalls [5].
13

charakterisieren, auch das Hörorgan (die Kochlea, die das Corti-Organ enthält) ist linear
aufgebaut und auch der Hörnerv leitet die Information im Prinzip frequenzaufgelöst weiter. Es
gibt aber zwei Phänomene, die eine lineare Topologie verhindern. Zum einen gibt es
Resonanzphänomene im Innenohr (Wanderwellentheorie), die eine frequenzaufgelöste
Wahrnehmung ermöglichen, aber auch dazu führen dass selbst bei einer sinusförmigen
Anregung nicht nur Sinneszellen in einem kleinen Bereich, sondern auch Obertöne stimuliert
werden. Zum anderen treten auch in der Natur Resonanzphänomene auf, so dass es praktisch
keine reinen Sinusschwingungen gibt. Die durch benachbarte Frequenzen bzw. Nachbarschaft
der Rezeptoren erzeugte Nähe überlagert sich also mit der durch Resonanzeffekte erzeugten
Nähe, was eine komplexere Topologie bedeutet.
Die entscheidende Erkenntnis dieser Überlegungen ist, dass die durch die Abstandsmatrix
erzeugte Topologie des Sehnervs äquivalent zur Topologie der Netzhaut bzw. der
Bildinformation ist und dasselbe auch im Fall anderer Sinnesorgane zu erwarten ist. Auch die
Zuordnung eines Schmerzes zu einer bestimmten Ursache ist keinesfalls selbstverständlich,
sondern setzt die differenzierte Erlernung aller Einzelheiten voraus (die Zuordnung einzelner
Körperteile zum eigenen Körper, die Koordination dieser Körperteile, die Zuordnung der
sensitiven Informationen zu einem Körperteil).
Diese Art von Lernprozess wird durch das Modell beschrieben und wenn man das Verhalten
von Säuglingen beobachtet, hat man das Gefühl, dass all ihre Handlungen nur einem Zweck
dienen – ihre Matrizen möglichst schnell zu füllen.

3.2 Indirekter Vergleich


Folgendes Beispiel soll den Effekt eines indirekten Vergleichs verdeutlichen: Ein Mensch
sieht nacheinander ein rotes Quadrat und ein grünes Quadrat. Beide seien gleich groß,
befinden sich an der exakt selben Position des Blickfeldes und ihre Farbe sei derart, dass das
rote ausschließlich die L-Zapfen (Rotrezeptoren) und das grüne ausschließlich die M-Zapfen
(Grünrezeptoren) anregt. Was haben die beiden Wahrnehmungen gemeinsam? Der direkte
Vergleich der Inputs ergibt, dass zwar die gleiche Anzahl von Rezeptoren angeregt wurde,
jedoch kein Rezeptor beiden Bildern gemeinsam ist: das eine Mal waren es nur „Rote“, das
andere Mal nur „Grüne“. Die beiden Bilder haben zunächst also nur gemeinsam, dass
überhaupt irgendetwas gesehen wurde. Vergleicht man nun indirekt über die
Ähnlichkeitsmatrix der Rezeptoren, ist das Ergebnis ein anderes: Benachbarte Rezeptoren
verschiedener Farbe habe in der Matrix eine relativ hohe Ähnlichkeit durch Objekte, die
sowohl die roten als auch die grünen Rezeptoren anregen (z.B. weiße Objekte). Dies kommt
14

im indirekten Vergleich zum Tragen, da beide Quadrate den gleichen Raumbereich füllen, die
angeregten Rezeptoren also auf der Netzhaut benachbart liegen und die Inputs nach der
Transformation deshalb viel größere Ähnlichkeit haben als zuvor. Die im direkten Vergleich
nicht sehr ähnlichen Wahrnehmungen sind im indirekten Vergleich deutlich ähnlicher, für
zwei Objekte, die sich nur in ihrer Farbe unterscheiden, ist genau das charakteristisch. Erst der
indirekte Vergleich über die Ähnlichkeitsmatrix der Nervenfasern macht es möglich von
räumlicher Kongruenz oder Form zu sprechen.

4 Kommunizieren und Begreifen


Dieser Teil der Arbeit basiert auf der Hypothese, dass sich der gesamte menschliche Geist
nach ähnlichen Prinzipien ausbildet, wie den im ersten Teil beschriebenen. Die
Argumentation kann nun allerdings nicht mehr mit der mathematischen Exaktheit
durchgeführt werden. Der grundlegende Gedankengang lautet zusammengefasst: Die in der
Kommunikation verwendeten Begriffe stellen eine Abbildung vom Raum der verwendeten
Zeichen in den Raum der Erfahrungen dar. Diese Abbildung ist nicht stetig, da der Zeichen-
Raum und der Erfahrungsraum topologisch nicht äquivalent sind. Die Kommunikation
erzeugt ein Feedback und somit eine Dynamik der Zeichen und der verwendeten Begriffe. Die
Folge dieser Dynamik ist, dass sich einzelne Zeichen herausbilden und sich die Begriffe durch
Kommunikation verändern.

4.1 Hypothese
Die Hypothese ist zweiteilig und lautet:

1) Auf der Menge aller Wahrnehmungen, die ein einzelner Mensch macht, existiert eine
erfahrungsabhängige Topologie.

2) Verschiedene Wahrnehmungen eines einzelnen Menschen können durch Erfahrungen


miteinander assoziiert werden.

Sucht man nach Entsprechungen von 1) und 2) im mathematischen Modell, wären das am
ehesten die (durch die Abstandsmatrix induzierte) Topologie und der indirekten (durch die
Ähnlichkeitsmatrix realisierte) Vergleich. Je zwei Wahrnehmungen haben einen mehr oder
weniger großen Abstand und sind mehr oder weniger stark assoziiert (im mathematischen
Modell durch Werte aus [0,1] quantifiziert). Ich gehe aber davon aus, dass Abstand und
15

Ähnlichkeit nun nicht mehr so direkt miteinander zusammenhängen wie das im


mathematischen Modell der Fall ist. Um einige Überlegungen zu vereinfachen und eine
Definition dessen, was ein Begriff sein soll, zu ermöglichen, gehe ich teilweise zu einem
diskreten Bild über und nehme an, dass zwei Wahrnehmungen nur entweder assoziiert oder
nicht assoziiert sein können. Die Assoziation wäre mit dieser Vereinfachung eine binäre
Relation, die jeder Wahrnehmung eine bestimmte Menge von Wahrnehmungen eindeutig
zuordnet.

4.2 Kommunikation
Kommunikation ist ein sehr weiter Begriff, unter dem je nach Kontext Verschiedenes
verstanden wird.10 Ich meine damit in dieser Arbeit vor allem bewusste zwischenmenschliche
Kommunikation. Diese setzt aber etwas voraus, das man selbst auch schon als Vorform der
Kommunikation bezeichnen könnte, nämlich die oben genannten Assoziationen. Anhand
folgender Grafik lassen sich einige Begriffe besser erläutern:

Extensionaler Bereich Intensionaler Bereich

Zeichen Zeichen
(extensional) (intensional) Begriff / Assoziation
Kommunikation

Objekt Bedeutung

Mit (zwischenmenschlicher) Kommunikation bezeichne ich den Versuch (eines Menschen),


einen Sachverhalt so in für andere Erfahrbares (Zeichen) umzusetzen, dass diese eine
ausreichend präzise Vorstellung des Sachverhalts bekommen. Was „ausreichend präzise“
bedeutet ist dabei kontextabhängig.
Mit einem Zeichen meine ich das beim Versuch der Kommunikation erzeugte Erfahrbare,
aber auch die Erfahrung selbst. „Zeichen“ hat also eine intensionale und eine extensionale
Bedeutung. Ich bemühe mich darum keine Unklarheiten aufkommen zu lassen. Wichtig ist,
dass ich mit dem Begriff des Zeichens nicht voraussetze, dass es sich um einzelne, separate
Zeichen handelt,11 diese Separation soll erst erklärt werden.

10
vgl. dazu z.B. die verschiedenen Definitionen von Kommunikation in der Soziologie, Biologie,
Informationstheorie, Kybernetik, Nachrichtentechnik, Psychologie, Systemtheorie usw.
11
Dieses weiter gefasste Verständnis eines Zeichens ähnelt dem von z.B. Charles Sanders Peirce (siehe z.B. [7]).
16

Mit der Bedeutung eines Zeichens meine ich das, was das Zeichen durch Assoziation auslöst.
Die Bedeutung ist eine intensionale Größe.
Eine Assoziation ist im Spezialfall der Kommunikation die Verbindung zwischen einem
Zeichen (intensional) und seiner Bedeutung. Sie ist hier also eine Abbildung vom Raum der
Zeichen in den Raum der Bedeutungen, was beides Unterräume der Menge aller
Wahrnehmungen sind.
Das bezeichnete Objekt ist die zur Bedeutung gehörende Extension (d.h. das
Wahrgenommene der Wahrnehmung, die mit der Wahrnehmung des Zeichens (extensional),
also dem Zeichen (intensional), assoziiert wird).
Ein Begriff ist mit einer Assoziation verwandt, eine präzisere Formulierung folgt im nächsten
Abschnitt.

4.3 Unstetigkeit und der Begriff des Begriffs


Ich möchte die durch Assoziation realisierte Abbildung zwischen Zeichen- und
Bedeutungsraum etwas genauer betrachten. Ich gehe dabei von dem oben erwähnten diskreten
Bild einer Assoziation aus. Der Definitionsbereich der Abbildung ist im Fall der
zwischenmenschlichen Kommunikation die Menge aller Wahrnehmungen, die von anderen
Menschen bewusst erzeugt werden können, im speziellen Fall von verbaler Kommunikation
ist es z.B. die Menge der Laute, die ein Mensch bewusst von sich geben kann. Da Menschen
über so gut wie alles kommunizieren, kann man davon ausgehen, dass der Bildbereich die
Menge aller Wahrnehmungen ist. Nach Hypothese 1) besitzen nun Zeichen- und
Bedeutungsraum (Definitions- und Bildbereich) jeweils eine bestimmte Topologie. Mit
größter Wahrscheinlichkeit sind diese Topologien nicht äquivalent. Dafür spricht erstens, dass
die Menge aller Wahrnehmungen sehr viel mächtiger ist als die Menge der Zeichen, die nur
eine kleine Teilmenge aller Wahrnehmungen ist und es wäre verwunderlich, wenn sich bei
einer solchen Erweiterung die Topologie nicht ändern würde. Zweitens ist die Topologie
erfahrungsabhängig, so dass sie sich zumindest im Laufe der Zeit höchstwahrscheinlich
ändert und auch bei verschiedenen Menschen nicht identisch ist.
Die Konsequenz einer nicht-äquivalenten Topologie von Zeichen- und Bedeutungsraum ist,
dass keine stetige Abbildung zwischen beiden möglich ist. Unter einem Begriff verstehe ich
nun die Einschränkung der allgemeinen durch Assoziation realisierten Abbildung auf einen
stetigen Bereich. Ein Begriff beinhaltet also einen Zeichenbereich, einen Bedeutungsbereich
und die Abbildung zwischen beiden. Jedes Element des Zeichenbereichs wird dabei auf jedes
Element des Bedeutungsbereiches abgebildet. Dieses Verständnis impliziert ein Verhältnis
17

von Zeichen, Bedeutung und Begriff, wie es das semiotische Dreieck darstellt. Ein Zeichen
(extensional) verweist auf ein Objekt, wobei die Bedeutung des Zeichens, also die subjektive,
intensionale Verbindung zwischen Zeichen und Objekt, durch den Begriff gegeben ist. Es
wäre vorteilhaft, wenn der Zusammenhang von Zeichen, Bedeutung und Objekt eindeutig
wäre. Das ist jedoch in dem hier verwendeten Modell nicht der Fall, da sich die Begriffe auf
der Basis individueller Erfahrung bilden, und auch in der Praxis stellt sich diese Annahme oft
als falsch heraus. „So entstehen leicht die fundamentalsten Verwechslungen (deren die ganze
Philosophie voll ist).“ (Wittgenstein: Tractatus logico-philosophicus [8], 3.324)

4.4 Kommunikation und Feedback


Bewusste Kommunikation ist mit einem bestimmten Zweck verbunden und eine begriffliche
Struktur setzt sich mit größerer Wahrscheinlichkeit gegen eine andere durch, wenn sie diesen
Zweck optimal erfüllt. Der Zweck der Kommunikation kann dabei sehr verschieden sein:
Manchmal ist ein grobes Verständnis zweckmäßig, in anderen Situationen sind feine
Bedeutungsunterschiede wichtig. Ob eine Kommunikation erfolgreich verläuft, hängt sowohl
von den verwendeten Zeichen als auch von ihren Bedeutungen ab, so dass sowohl im
Zeichenbereich als auch im Bedeutungsbereich eines Begriffs eine Dynamik erzeugt wird.
Für Zeichen und Bedeutungen der Begriffe gilt außerdem gleichermaßen, dass eine minimale
Übereinstimmung notwendige Voraussetzung für eine erfolgreiche Kommunikation ist. In
vielen Situationen liefert allerdings der Kontext, in dem die Kommunikation stattfindet, für
das Verständnis entscheidende Informationen, wobei der Anteil des Kontextes am Erfolg der
Kommunikation verschieden groß sein kann. Durch Kontextverständnis sind erstens größere
Abweichungen von Zeichen und Bedeutungen möglich ohne dass die Kommunikation
fehlschlägt und zweitens ist erst im Kontext ersichtlich, ob eine Kommunikation überhaupt
erfolgreich verlaufen ist. In diesem Sinne spiel der Kontext eine wichtige Rolle bei der
Entstehung der Dynamik von Zeichen und Bedeutungen.
Ich möchte im Folgenden auf der Seite der Zeichen die Herausbildung einzelner, separater
Zeichen und eine Abstrahierung der Zeichen erklären. Auf der Seite der Bedeutungen möchte
ich die grundlegenden Prinzipien ihrer Entwicklung beschreiben und in Ansätzen eine
Verbindung zu existierenden Theorien über die Struktur unserer Begriffe herstellen.

4.5 Separation der Zeichen


Der Zeichenraum ist im Prinzip beliebig dicht, das heißt, es gibt kein Zeichen, zu dem man
nicht ein beliebig ähnliches finden könnte. Die Abbildung der Zeichen auf ihre Bedeutungen
18

kann aber aus oben genannten Gründen nicht stetig sein. Es gibt also den Fall, dass ähnliche
Zeichen unterschiedliche Bedeutungen haben sowie den, dass unterschiedliche Zeichen
ähnliche Bedeutungen haben. Letzterer ist unproblematisch, da er keine Missverständnisse
hervorruft. Ersterer aber führt zu Missverständnissen, sobald die Kommunikation geringfügig
gestört wird oder das Verständnis der Zeichen bei den Kommunikationspartnern nicht exakt
übereinstimmt. Für eine funktionierende Kommunikation muss die Bedeutung zuverlässig in
einen relativ engen Bereich eingeordnet werden können. Soll sie robust gegen Störungen sein,
müssen dafür Spielräume vorhanden sein. Insbesondere müssen zwischen ähnlichen Zeichen
mit verschiedener Bedeutung Bereiche liegen, die keinem der beiden Zeichen zugeordnet
sind. In der Praxis werden sich also durch Misserfolge in der Kommunikation zwischen
ähnlichen Zeichen mit verschiedener Bedeutung Bereiche ausbilden, die bedeutungsleer sind.
12
In dem Fall, dass die Bedeutungen ebenfalls ähnlich sind, ist solch eine Abgrenzung nicht
nötig. So ist z.B. die Lautstärke oft ein Maß für die Dringlichkeit der Aussagen: Dasselbe
Wort stellt in verschiedenen Lautstärken gesprochen eine dichte Menge verschiedener
Zeichen mit verschiedenen Bedeutungen dar, wobei die Lautstärke kein diskretes, sondern ein
kontinuierliches Maß für die Dringlichkeit ist. Diese Unterscheidung findet sich auch in
Watzlawicks Kommunikationstheorie wieder ([9], S. 61 ff.).

4.6 Abstraktion der Zeichen


Zeichen können sich über einen längeren Zeitraum hinweg derart verändern, dass die
Verknüpfung zwischen Zeichen und Objekt letztendlich nur noch durch Konvention gegeben
ist. Solche Zeichen nennt Charles Sanders Peirce Symbole, während er Zeichen, bei denen die
Verknüpfung mit dem Objekt durch direkte Ähnlichkeit oder einen natürlichen (kausalen)
Zusammenhang gegeben ist, Ikone bzw. Indizes nennt. 13 Ein Zeichen kann sich also von
einem Ikon oder Index unter ständiger Verwendung hin zu einem Symbol abstrahieren. Die
Ursache für solch eine Entwicklung kann z.B. sein, dass ein neues Zeichen entsteht und sich
die Zeichen im Zeichenraum wieder so anordnen, dass die geringsten Missverständnisse
auftreten.

12
Auf die Kritik, dass kein „Zeichen“ völlig bedeutungsleer ist, möchte ich erwidern, dass dieses Problem in
einer komplexeren Darstellung mit kontinuierlichen statt diskreten Assoziationswerten nicht aufträte. Das
Phänomen des bedeutungsleeren Bereiches zeigt sich im Fall einer konkret vorliegenden Sprache auch im
Begriff des Minimalpaares. Ein Minimalpaar beschreibt zwei Worte, die phonetisch zwar verschieden sind,
zwischen denen jedoch auch kein weiteres Wort in der Sprache existiert (z.B. (Hand, Hund), (Hand, Band), nicht
aber (Hund, Band) ).
13
siehe z.B. [7], S. 64.
19

4.7 Entstehung und Dynamik eines Begriffs


Ein Begriff entsteht aus der Not heraus zu kommunizieren. In einer Situation, in der
kommuniziert werden muss, wird versuchsweise das nächstliegende Zeichen gewählt.
Verläuft die Kommunikation erfolgreich (u.U. nur durch Kontextinformationen), wird das
Zeichen stärker mit der entsprechenden Wahrnehmung assoziiert. Ab einer gewissen Stärke
der Assoziation kann man die Verknüpfung zwischen Zeichen und Wahrnehmung (Objekt)
einen Begriff nennen. Der Unterscheid zwischen einer (tendenziell vagen) Assoziation und
einem (vorzugsweise eindeutigen) Begriff ist also graduell. Ein einmal entstandener Begriff
verändert sich nach demselben Prinzip wie eine Assoziation. 14 Es wird der nächstliegende
Begriff zur Beschreibung einer Wahrnehmung verwendet und durch diese Beschreibung
selbst verändert sich wiederum der Begriff, da sein Bedeutungsbereich (im diskreten Bild von
Assoziation gesprochen) nun ein Element mehr enthält.

4.8 Dynamik eines isolierten Begriffs


Um mich einer Beschreibung der Struktur der Begriffe zu nähern, versuche ich die Dynamik
eines Begriffs näher zu beschreiben, indem ich von einer idealisierten Situation ausgehe.
Normalerweise konkurrieren mehrere Begriffe, deren Bedeutungen benachbart sind, um die
Verwendung in der Kommunikation. Der Begriff, dessen Bedeutung die zu beschreibende
Wahrnehmung am besten erfasst, wird verwendet. In der Realität ist diese Entscheidung
häufig subjektiv geprägt oder hängt von Zufällen ab. Definiert man für die Wahrnehmung w
und den Begriff mit der Bedeutung B ein Maß α ( w, B ) , das die Abweichung der
Wahrnehmung vom Begriff angibt, kann man die α -Werte zweier Begriffe vergleichen und
danach einen der Begriffe wählen. Geht man idealisiert von einem einzelnen Begriff aus, kann
man die Konkurrenz mit den übrigen Begriffen durch einen pauschalen kritischen α -Wert
α krit modellieren und untersuchen, wie sich der Begriff bei verschiedenen Wahrnehmungen

verändert. Die genaue Definition von α ( w, B ) und α krit bestimmt wie sich die Begriffe
genau entwickeln. Hierüber lässt sich die Charakteristik der resultierenden begrifflichen
Struktur beeinflussen und auch an bestehende Theorien angleichen. Ich werde hier nicht
versuchen diesen Theorien samt ihrer Unzulänglichkeiten gerecht zu werden, sondern nur
beispielhaft zwei Varianten kurz anreißen. 15 Im Anhang befinden sich Grafiken, die die
folgenden Überlegungen in einer zweidimensionalen Darstellung veranschaulichen. Jeder
Punkt der Ebene stellt dabei eine mögliche Wahrnehmung dar, wobei die Wahrnehmungen,

14
Das ist wichtig, um das Modell in sich schlüssig zu halten.
15
Eine kurze Darstellung verschiedener Konzepte findet sich z.B. in [10], S. 91 ff.
20

die bereits in die Menge der Bedeutungen des Begriffs aufgenommen sind, mit schwarzen
Punkten markiert sind. Die Konzepte funktionieren nicht nur in 2D, sondern in beliebigen
Räumen, in denen eine Abstandsfunktion definiert ist.

4.8.1 Lokale Toleranz (Familienähnlichkeit)

„Und die Stärke des Fadens liegt nicht darin, dass irgend eine Faser durch seine ganze
Länge läuft, sondern darin, dass viele Fasern einander übergreifen“
(Wittgenstein: Philosophische Untersuchungen [8], § 67)

Eine insbesondere von Ludwig Wittgenstein vertretene Konzeption von Begriffen, die so
genannte Familien-Ähnlichkeits-Konzeption, besagt, dass verschiedene Objekte, die unter
einen Begriff fallen, nicht notwendigerweise nach genau einem Satz von Kriterien eindeutig
bestimmt sind. Vielmehr spielt ihre Verwandtschaft untereinander eine große Rolle, so dass es
passieren kann, dass zwei unter denselben Begriff fallende Objekte (je nach Version bzw.
Auslegung) nichts oder nur wenig gemeinsam haben.
Wählt man für α krit die lokale Toleranz der Bedeutung B des Begriffs, α krit = τ (B ) , und für
α ( w, B ) die Isolation der Wahrnehmung innerhalb der Bedeutung, α ( w, B ) = I ( w, B ) , so
entspricht die Entwicklung eines Begriffs der iterativen Konstruktion eines Elements einer ε -
Ordnung mit ε = τ (B ) . Die lokale Toleranz und damit ε kann im verlauf der Entstehung
zwar kleiner, nicht aber größer werden. Der Begriff verändert sich nicht mehr, wenn alle
Wahrnehmungen, die nicht Element seiner Bedeutung sind, seine lokale Toleranz verletzen
würden. Alle Elemente seiner Bedeutung sind durch „Schritte“ kleiner oder gleich τ (B )
miteinander verbunden. In den Grafiken ist zu erkennen, dass sich der Bereich möglicher
Bedeutungen an die vorhandenen Bedeutungen „anschmiegt“ und einzelne Elemente relativ
stark berücksichtigt.

4.8.2 Globale Toleranz (Prototypen)


Die so genannte Prototypen-Theorie besagt, dass das Fallen eines Objekts unter einen Begriff
von einem graduellen Kriterium, nämlich der Ähnlichkeit des Gegenstandes zu einem
Prototypen, abhängt. Dieser Prototyp muss dabei nicht notwendigerweise „wirklich“
existieren. Je nach Variante der Theorie kann auch das Fallen eines bestimmten Objektes
unter den entsprechenden Begriff selbst graduell sein.
21

Wählt man als α krit den mittleren Abstand der Elemente der Bedeutung B des Begriffs

1
α krit =
| B |2
∑ ∑ d ( x, y )
x∈B y∈B
und als α ( w, B ) den mittleren Abstand der Wahrnehmung zur

1
Bedeutung des Begriffs α ( w, B ) = ∑ d ( w, x ) , entwickelt sich der Begriff „kugelförmig“.
| B | x∈B
Die (virtuelle) Wahrnehmung, deren mittlerer Abstand zu den übrigen Bedeutungen am
geringsten ist, kann als der (virtuelle) Prototyp bezeichnet werden.

Beide Theorien, können ohne Probleme sowohl in diskreter als auch gradueller Weise
verwendet werden, wie auch in den Grafiken dargestellt. Im graduellen Fall wird keine

Entweder-Oder-Entscheidung mithilfe von α krit getroffen, sondern α ( w, B ) stellt ein


kontinuierliches Kriterium dar. Als Maß habe ich im graduellen Fall die Funktion

α ( w, B ) n
Exp ( −( ) ) mit n=2 (bzw. n=8) gewählt, da diese Funktion die α ( w, B ) -Werte
α krit
zwischen Null und Unendlich auf das Intervall [0,1] abbildet, wobei die breite der Verteilung

durch α krit bestimmt ist. Da jeder Punkt eine mögliche Wahrnehmung darstellt, können die
Werte somit interpretiert werden als Wahrscheinlichkeit, dass zur Beschreibung der
entsprechenden Wahrnehmung der Begriff verwendet wird. Der Exponent n ermöglicht einen
fließenden Übergang von diskreter zu gradueller Variante.

4.9 Sprache und komplexe begriffliche Struktur


Die Betrachtung eines isolierten Begriffs liefert noch keine Aussagen über den
Zusammenhang vieler Begriffe untereinander. Nach den hier gemachten Überlegungen lässt
sich allerdings auch prinzipiell keine allgemein gültige Struktur festlegen. Selbst wenn man
davon ausgeht, dass die Wahrnehmungen, die in das Modell eingespeist werden, die
resultierende Struktur eindeutig determinieren, so ist die Menge der Wahrnehmungen, die ein
Mensch konkret macht, immer noch von Zufällen bestimmt. Bei einer Interpretation mit
Wahrscheinlichkeitswerten, statt Entweder-Oder-Entscheidungen, wäre selbst bei einer
eindeutigen Menge an Wahrnehmungen die Entwicklung nicht determiniert. In beiden Fällen
lassen sich jedoch mit statistischen Methoden Aussagen treffen. Geht man davon aus, dass die
Wahrnehmungen einer „wirklichen“ Welt entspringen, die für alle Menschen gleich ist, kann
man statistische Überlegungen darüber anstellen, welche Wahrnehmungen ein Mensch mit
22

besonders hoher Wahrscheinlichkeit macht und welche davon wiederum für die
Kommunikation relevant sind. Auf diese Weise erhielte man Aussagen darüber, welche
Begriffe sich mit besonders großer Wahrscheinlichkeit bilden. Dieser Ansatz liefert auch die
Erklärung dafür, weshalb es eine relativ große Übereinstimmung der Begriffe verschiedener
Kulturen gibt – die zu beschreibende Welt ist dieselbe. Innerhalb einer Kultur entsteht eine
besonders große Übereinstimmung dadurch, dass einerseits neue Begriffe von anderen
Menschen erlernt werden und andererseits die Wechselwirkung durch Kommunikation, wie
oben beschrieben, zu einer Konvergenz der Begriffe und Zeichen führt.
Noch ein weiterer wichtiger Punkt ist bis hierher unerwähnt geblieben: Kommunikation ist
selbst wieder ein wahrnehmbares Phänomen. Das bedeutet, dass sich ganz von selbst eine
Metakommunikation, also eine Kommunikation über Kommunikation, einstellt. Die
Grammatik einer Sprache ist nichts anderes als eine begriffliche Erfassung sprachlicher
Phänomene. Und zur Bedeutung eines Wortes gehört nicht nur das Objekt oder der
Sachverhalt auf den es verweist, sondern ebenso der sprachliche Zusammenhang in dem es
normalerweise verwendet wird. Jedes Wort hat also immer schon grammatische
Implikationen aufgrund der Tatsache, dass seine Verwendung in der Sprache selbst wieder
eine Wahrnehmung ist.
In derselben Weise existieren natürlich auch Begriffe über Begriffe. Diese mehrschichtige
Struktur der Begriffe, wobei die Bedeutung mancher Begriffe nur in einer Aussage über
andere Begriffe liegt, ist etwas anderes als die teilweise geschachtelte und überlappende
Struktur von Begriffen. Diese Schachtelung (also dass die Bedeutung mancher Begriffe
vollständig innerhalb der Bedeutung eines anderen Begriffs liegt) und die Überlappung (also
dass nicht-identische Begriffe trotzdem gemeinsame Bedeutungen haben) verführt zu der
Vermutung der klassischen Begriffskonzeption, dass ein komplexer Begriff in basale Begriffe
zerlegt werden kann. Legt man meine Überlegungen zugrunde, ist die Ursache für
Schachtelung und Überlappung, dass in manchen Situationen ein präziserer Begriff benötigt
wird. Dieser liegt notwendigerweise zunächst innerhalb eines allgemeineren, er entwickelt
sich jedoch unabhängig von diesem und überschreitet u.U. auch die Grenzen des
übergeordneten Begriffs.

5 Schluss
Diese Arbeit schneidet eine Problematik an, die schon seit Jahrhunderten in unterschiedlichen
Ausprägungen in den verschiedensten Disziplinen auftaucht. Ich nenne sie (mit einem etwas
technischen Begriff) die Analog-Digital-Problematik. In anderen Kontexten drückt sich diese
23

Problematik in Gegensatzpaaren wie Sinne/Verstand, Form/Inhalt, kontinuierlich/diskret aus.


So unterscheidet schon Kant zwischen dem Verstand und den Sinnen, wobei ersterer immer
richtig und eindeutig urteilt, während letztere überhaupt nicht urteilen ([11], A S. 293 / B S.
350). Paul Watzlawick unterscheidet in seiner Kommunikationstheorie analoge und digitale
Kommunikation. Sein viertes Axiom besagt: „Menschliche Kommunikation bedient sich
digitaler und analoger Modalitäten“ ([9], S. 68). Die Analog-Digital-Problematik ist auch
eines der zentralen Themen in der Entstehungsgeschichte der Kybernetik gewesen ([12]).
Selbst in der Physik findet sie sich in Form des Welle-Teilchen-Dualismus wieder, der erst
durch die Quantenmechanik aufgelöst wurde. Die Problematik spiegelt sich in meinen Augen
auch in der herkömmlichen Unterscheidung zwischen Geistes- und Naturwissenschaften
wieder. Ich denke jedoch, dass eine strikte Trennung von digital und analog weder möglich
noch nötig ist. In diesem Sinne versuche ich in dieser Arbeit, naturwissenschaftliche
Techniken mit einem typisch geisteswissenschaftlichen Thema zu vereinen. Die
mathematische Formulierung verbindet dabei in zweierlei Weise Exaktheit und Flexibilität.
Erstens verarbeitet das Modell kontinuierlich neue Inputs und reagiert so auf äußere Einflüsse,
die Art und Weise dieser Reaktion ist jedoch exakt formuliert. Zweitens ist durch die präzise
Benennung bestimmter Parameter und Funktionen auch eine präzise Anpassung des gesamten
Modells möglich. Die mathematische Exaktheit der Formulierung und Berechnung des ersten
Teils der Arbeit ist für den Bereich der Begriffsbildung so nicht durchzuhalten. Der Grund
dafür ist in erster Linie die nicht-mathematische Natur vieler der bereits etablierten Begriffe.
Das bedeutet nicht zwangsläufig die Unmöglichkeit einer mathematischen Beschreibung.
Eine präzise Definition, so wie ich es für den Begriff des Begriffs versucht habe, macht die
Thematik mathematischen Überlegungen zugänglich. Viele Begriffe lassen sich außerdem
sowohl im mathematischen als auch im nicht-mathematische Kontext sinnvoll interpretieren,
wobei eine Festlegung oft nicht nötig ist. Die Entstehung separater Zeichen und stabiler
Bedeutungen wird als Bildung von „Eigenwerten“ des (über ein Feedback-Mechanismus
rekursiven) Aktes der Kommunikation beschrieben.16 Die konkrete Anpassung der
begrifflichen Struktur an Familienähnlichkeits- und Prototypen-Theorie lässt sich durch
Präzisierung eines allgemeineren Konzepts realisieren, wobei ohne Probleme Mischformen
verschiedener Theorien und ein fließender Übergang zwischen diskreter und gradueller
Interpretation möglich sind. Die Phänomene von Sprache, Metakommunikation und einer

16
Heinz von Foerster hat betont, dass die Kommunikabilien (Zeichen, Symbole, Wörter usw.) nicht
vorausgesetzt werden dürfen, sondern erklärt werden muss, wie sie als Eigenwerte einer rekursiven Funktion
entstehen (nach [3], S. 29).
24

komplexen begrifflichen Struktur (Hierarchie, Schachtelung und Überlappung) ergeben sich


im Modell von selbst, die Tatsache, dass Begriffe fast immer vage und offen sind17, ebenso.
Die Stärke eines mathematischen Ansatzes liegt grundsätzlich darin, dass bei einer präzisen
Formulierung auch Ungenauigkeiten präzise formuliert werden müssen und die Mathematik
auch hierfür das Werkzeug liefert. Ein gutes Beispiel sind die Heisenbergschen
Unschärferelationen in der Physik. Es wird also klar getrennt zwischen Dingen, die ihrer
Natur nach nicht präziser zu fassen sind und solchen, bei denen eine präzise Formulierung
bloß nicht gelungen ist. In den Geisteswissenschaften ist dieser Unterschied oft nicht leicht
festzustellen. Das Resultat ist teilweise, dass an falschen Stellen eine Präzisierung gesucht
bzw. darauf verzichtet wird. Ich denke, dass eine stärker naturwissenschaftliche Denkweise
(ohne in den, den Naturwissenschaften so oft vorgeworfenen, Reduktionismus zu verfallen) in
vielen Fällen eine klarere Argumentation zur Folge hätte und einer Mystifizierung und
Ideologiebildungen entgegenwirken würde.

17
vgl. [10], S. 97 ff.
25

Anhang
In den Folgenden Abbildungen stellen die schwarzen Punkte die zur Bedeutung eines Begriffs
gehörenden Elemente eines zweidimensionalen Bedeutungsraumes dar.

In den folgenden drei Abbildungen markieren die Linien den Rand des Bereichs innerhalb

dessen α ( w, B ) ≤ α krit für die oben angegebenen Definitionen der Familienähnlichkeits- (blau
) und Prototypen-Theorie (rot).

150

100

50

-300 -200 -100 100 200 300

-50

-100

-150
26

150

100

50

-300 -200 -100 100 200 300

-50

-100

-150

150

100

50

-300 -200 -100 100 200 300

-50

-100

-150
27

α ( w, B ) n
In den folgenden Abbildungen ist die Funktion Exp ( −( ) ) für n=2 (rechts) und n=8
α krit
(links) über der Bedeutungsebene aufgetragen. Bei der gemischten Theorie wurde im
Exponenten der Mittelwert aus Prototypen- und Familienähnlichkeits-Theorie verwenden:

1 α Pr ot ( w, B ) n α Fam ( w, B ) n
Exp ( − (( ) +( ) )) . Der aufgetragene Wert kann als
2 α Pr ot krit α Fam krit
Wahrscheinlichkeit dafür interpretiert werden, dass eine Wahrnehmung an der
entsprechenden Stelle versucht wird mithilfe des Begriffs, also einem Zeichen seiner
Zeichenmenge, zu kommunizieren. Je größer der Parameter n dabei ist, desto ähnlicher ist die
Beschreibung der diskreten Variante.

Bedeutungsmenge des Begriffs_________________________________________


28

n=8 n=2

Prototypen-Theorie___________________________________________________

Familienähnlichkeits-Theorie__________________________________________

Gemischte Theorie____________________________________________________
29

Literatur

[1] Weizsäcker, Carl Friedrich von: Die Einheit der Natur. München: dtv, 1974 (8. Aufl.
2002).
[2] Weizsäcker, Carl Friedrich von: Aufbau der Physik. München: dtv, 1988 (4. Aufl.
2002).
[3] Baecker, Dirk: Form und Formen der Kommunikation. Frankfurt am Main:
Suhrkamp, 2005.
[4] Pias, Klaus [Hrsg.]: Cybernetics: The Macy-Conferences 1946-1953 (Band I,
Transactions / Protokolle). Zürich; Berlin: diaphanes, 2003.
[5] Hick, Christian [u.a.] [Hrsg.]: Kurzlehrbuch Physiologie. München [u.a.]: Urban &
Fischer, 2002.
[6] McCulloch, Warren S.: What the Frog’s Eye tells the Frog’s Brain. In: Corning,
William C. [Hrsg.]: The Mind: Biological Approaches to its Functions, S. 233-258,
New York [u.a.]: Wiley, 1968.
[7] Peirce, Charles S.; Pape, Helmut [Hrsg.]: Phänomen und Logik der Zeichen. Frankfurt
am Main: Suhrkamp, 1983.
[8] Wittgenstein, Ludwig: Tractatus logico-philosphicus [u.a]. Werkausgabe Band 1,
Frankfurt am Main: Suhrkamp, 1984.
[9] Watzlawick, Paul [u.a.]: Menschliche Kommunikation. Formen, Störungen,
Paradoxien. Bern: Hans Huber, 2000.
[10] Baumann, Peter: Erkenntnistheorie. Stuttgart; Weimar: Metzler, 2006.
[11] Kant, Imanuel; Raymund Schmidt [Hrsg.]: Kritik der reinen Vernunft. Nach der 1.
und 2. Originalausgabe. Hamburg, Leipzig: Meiner, 1990.
[12] Pias, Claus: Analog, Digital, and the Cybernetic Illusion. In: Kybernetes, special
issue: Heinz von Foerster in memoriam, 33/2 (2004), S. 543-550.