Sie sind auf Seite 1von 76

III.

Methoden und
Verfahren
243
Kapitel III. 1:
Beobachtungsmethoden
und Auswertungsverfahren
in der Entwicklungspsychologie
Axel Schölmerich, Bochum & Holger Weßels, Berlin

Inhaltsverzeichnis
1. Einführung . . . . . . . . . . . . . . . . . . . . . . . . . . . 244 7. Die Rolle des Kontextes . . . . . . . . . . . . . . . . 248

2. Definition von Beobachtung . . . . . . . . . . . . . 244 8. Die Beobachtung von Interaktionen . . . . . . . 249

3. Ein historischer Überblick . . . . . . . . . . . . . . . 244 9. Zeitliche Struktur von Verhalten . . . . . . . . . 249

4. Die Rolle des menschlichen Beobachters . . 247 10. Statistische Weiterverarbeitung von
Beobachtungsdaten . . . . . . . . . . . . . . . . . . . . . . 251
5. Reliabilität und Beobachterüber- 10.1 Zeitunabhängige Analysen . . . . . . . . . . . . . 252
einstimmung . . . . . . . . . . . . . . . . . . . . . . . . . . . . 247 10.2 Zeitabhängige Analysen . . . . . . . . . . . . . . . 255

6. Auswahl des Beobachtungsgegenstandes . . 248 Literatur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 259


244 Methoden und Verfahren

1. Einführung vorher definierter Merkmale und die statisti-


sche Prüfbarkeit der Genauigkeit und Zuver-
Die Beobachtung von Artgenossen ist ein lässigkeit der Beobachtungen. Eine ähnliche,
zentrales Merkmal aller sozialen Lebewesen. aber knappere Definition stammt von Weick
Zweck einer solchen Beobachtung ist es in (1968): Bei wissenschaftlicher Beobachtung
der Regel, Informationen über die gegenwär- handelt es sich um die «... Selektion, Provoka-
tigen Handlungen und damit die Grundlagen tion, Aufnahme und Kodierung derjenigen
für Schlußfolgerungen über die Intentionen Verhaltensaspekte und der Umgebung, die
oder Handlungsziele anderer Lebewesen zu für empirische Zwecke relevant sind» [Über-
erhalten. Die Dekodiermechanismen, die es setzung der Autoren]. Der Vorteil der letzte-
dem Menschen erlauben, die Mimik und Ge- ren Definition liegt in der Betonung des Zu-
stik von Mitmenschen aus völlig unterschied- sammenhangs der Methode mit empirischen
lichen Kulturkreisen relativ korrekt zu inter- Zielen; diese Definition macht es zudem
pretieren, sind ein Ergebnis der Evolution, möglich, Beobachtungen, die beispielsweise
denn die Geschwindigkeit und Sicherheit der zu Aufzeichnungen in Tagebüchern führen,
Interpretation des Ausdrucksverhaltens der als wissenschaftliche Beobachtungen bezeich-
Artgenossen ist im Sinne der inklusiven Fit- nen zu können.
neß vorteilhaft. Alle Beobachtungsmethoden,
die in wissenschaftlichem Sinne eingesetzt
werden, bauen auf diesen Grundvorausset- 3. Ein historischer
zungen auf.
Überblick

2. Definition In der Entwicklungspsychologie haben Beob-


achtungsmethoden traditionell immer eine
von Beobachtung besondere Rolle gespielt. Dafür gibt es mehre-
re Gründe. Ein Teil der Probanden dieses
Wissenschaftliche Beobachtung unterschei- Fachgebietes entzieht sich anderen Untersu-
det sich von Alltagsbeobachtungen durch chungsmethoden mangels Sprachvermögen.
eine Reihe von Merkmalen. Feger (1995) zi- Die Entwicklungspsychologie unterhält zu
tiert Graumann (1966, S. 86), der Beobachtung Nachbargebieten besondere Beziehungen,
von Wahrnehmung unterscheidet: daher liegen methodische Einflüsse aus die-
sen Gebieten nahe. Besonders deutlich ist
«Die absichtliche aufmerksam-selektive
dieser Bezug zur Ethologie, deren hauptsäch-
Art des Wahrnehmens, die ganz bestimm-
liche Methode die Verhaltensbeobachtung ist
te Aspekte auf Kosten der Bestimmtheit
(s. Eibl-Eibesfeldt, 1995).
von anderen beachtet, nennen wir Beob-
Historisch kann man in Darwins Buch
achtung. Gegenüber dem üblichen Wahr-
‹The expression of emotions in man and ani-
nehmen ist das beobachtende Verhalten
mals›, das im Original 1872 erschienen ist,
planvoller, selektiver, von einer Suchhal-
einen frühen Katalog des Zusammenhangs
tung bestimmt und von vornherein auf
psychologisch definierter Konstrukte mit be-
die Möglichkeit der Auswertung des Be-
obachtbaren Phänomenen sehen. Ferner sind
obachteten im Sinne der übergreifenden
in historischer Sicht die ethnographischen
Absicht gerichtet».
Beobachtungen von Wundt (1927) relevant.
Die ausdruckspsychologischen Standardwer-
Feger präzisiert weiter: «... wenn die übergrei- ke von Bühler (1933) und Wolff (1944) sind
fende Absicht ist, eine wissenschaftliche An- zu den grundlegenden Werken zu zählen. Der
nahme zu prüfen und wenn sie in Planung nach van Hooff (1982) erste Forscher, der
und Bewertung bestimmten Kriterien genügt, zum Zwecke der Analyse nonverbalen Verhal-
geht die vorwissenschaftliche in die wissen- tens Filmaufnahmen einsetzte und ein Zei-
schaftliche Beobachtung über» (S. 3). Die chensystem entwickelte, mit dem sich diese
wichtigsten Kriterien sind dabei die Erfassung Gesten in systematischer Weise aufzeichnen
Beobachtungsmethoden und Auswertungsverfahren 245
lassen, ist in Vergessenheit geraten: Efron beim Betrachten des Gesichtes gewinnt, son-
(1941) beobachtete italienische Emigranten dern die Aktivität einzelner Muskeln und
in New York und bemerkte, daß diese einen Muskelgruppen in Form sogenannter «action
sehr reichhaltigen Gebrauch von Gesten und units» (AU) aufzuzeichnen. Izards und Doug-
Zeichen machten, um ihre Kommunikation hertys System ist dem gegenüber globaler
zu strukturieren. Birdwhistell (1970) verfei- und versucht, eher ganzheitliche Wahrneh-
nerte in den fünfziger Jahren das Zeichensy- mungen von bestimmten Grundemotionen
stem und legte besonderen Wert auf die Ab- zu machen, wie etwa auch Holodynski
bildung dynamischer Abläufe in der Zeit. In (1991). In neuester Zeit schließlich werden
choreographischen Anweisungen erkennt Versuche unternommen, Analysen von Ge-
man die Schwierigkeit, dynamische, zeitlich sichtsausdruck zu automatisieren (z. B. Kaiser,
strukturierte Vorgänge «auf Papier» wiederzu- 1990).
geben. In der Beobachtungsliteratur finden sich
Etwa seit Mitte des Jahrhunderts tauchen einige Themen, die jede neue Generation von
chronographische Beobachtungssysteme auf, Forschern beschäftigen. Dazu gehört der Ein-
also solche, die eine feste Koppelung an die fluß des Beobachters auf das zu beobachtende
physikalisch definierte Zeit beinhalten. Teil- Verhalten. Gesell (1928) konstruierte eine
weise wird das durch automatische Meßver- «Beobachtungskuppel», durch die der Beob-
fahren (z. B. Jaffe und Feldstein, 1970) reali- achter zwar hineinsehen konnte, selbst dem
siert, wobei meist isolierte Verhaltensweisen Kind aber verborgen blieb. C. Bühler (1927)
wie Bewegungen oder vokal-verbale Äuße- hat viele der noch heute aktuellen Probleme
rungen aufgezeichnet und dann auf ihre zeit- bei der Beobachtung von Säuglingen geschil-
liche Struktur hin analysiert werden. dert und einsichtsvolle Kommentare dazu
Besonders einflußreich auf die Entwick- verfaßt.
lung von Beobachtungsverfahren waren Ko- Heute spielt vor allen Dingen die Video-
diersysteme für den Gesichtsausdruck (FACS: technik eine bedeutende Rolle bei der Beob-
Ekman & Friesen, 1978; MAX: Izard, 1979; achtung, weil damit eine «ikonographische
AFFEX: Izard & Dougherty, 1980). Der we- Fixierung» (Thiel, 1989) und die endlose Wie-
sentliche Unterschied zwischen diesen Ko- derholbarkeit erzeugt werden kann.
diersystemen besteht in der Auflösung ganz- Der folgende Kasten faßt die hauptsächli-
heitlichen Ausdrucks in beobachtbare Einhei- chen Begriffe in Kurzdefinitionen zusammen.
ten. Das System von Ekman und Friesen bei- Für eine ausführliche Definition und Diskus-
spielsweise bezieht sich auf bestimmte Mus- sion fehlt hier der Raum, der Leser wird auf
kelgruppen bzw. einzelne Muskeln im Ge- Faßnacht (1995) verwiesen. Dort finden sich
sicht. Der Beobachter versucht nicht, den ausführliche Darstellungen zu den einzelnen
emotionalen Eindruck wiederzugeben, den er Begriffen.

Klassifizierung von Beobachtungsmethoden und wesentliche Begriffe


Verbalprotokoll: Das beobachtete Verhalten wird hier in Kategoriensystem: Eine Liste von Konstrukten, in die
Form verbaler Beschreibung wiedergegeben. Vorteil ist sich Verhaltensweisen oder Ereignisse, die zu beobachten
die einfache Durchführung ohne Entwicklung spezieller sind, einordnen lassen. Ein Kategoriensystem für Beob-
Zeichensysteme, Nachteil ist die oft problematische Bela- achtungszwecke sollte hinreichend breit sein, um alle auf-
stung des Beobachters durch Aufschreiben oder Diktie- tretenden Ereignisse einzusortieren. Kategorien der Beob-
ren. Manche Dinge sind zu schnell oder zu komplex, um achtung sollten exklusiv (d. h. jedes Verhalten kann nur
dabei mitzuschreiben. Gehört eher in die unsystemati- einer Kategorie zugeordnet werden) und exhaustiv (es gibt
sche Beobachtung, häufig ein guter Einstieg zur Gewin- für alle Verhaltensweisen eine Kategorie) definiert werden.
nung erster Hypothesen oder zur Definition eines Kate- Dies schließt die spätere Zusammenfassung oder Hierar-
goriensystems. chisierung der Kategorien nicht aus. Häufig ist es notwen-
dig, eine Restkategorie (für alle nicht in die inhaltlichen
Kategorien passenden Verhaltensweisen) einzurichten.
246 Methoden und Verfahren

Zeichensystem: Eine Zuordnung von Verhaltensweisen gut Verhaltensweisen unterschiedlicher Auftretenshäufig-


zu Elementen des Protokolls. Hier ist typischerweise (aber keit von einem solchen System erfaßt werden. Die
nicht notwendigerweise!) die Interpretationsleistung des «sample-rate» sollte doppelt so hoch sein wie die ‹schnell-
Beobachters am geringsten. sten› Ereignisse, was allerdings in der Praxis selten
erreicht wird. Vokalisationen in einer Dialogsituation
Ratings: Bei «ratings» werden Urteile über den Ausprä-
können beispielsweise ohne weiteres in 5-Sekunden-Tak-
gungsgrad einzelner Variablen erfaßt. Dabei unterschei-
ten aufeinander folgen, dann müßte man theoretisch im
det man zwischen unipolaren Ratings (z. B. der Ausprä-
2-Sekunden-Takt beobachten. Blickbewegungen sind
gungsgrad von Dominanz wird auf einer Skala von 0–5
dagegen deutlich schneller, und die Gefahr, ein solches
angegeben) und bipolaren Ratings (der Ausprägungsgrad
Ereignis zu ‹verpassen›, ist entsprechend größer.
wird auf einer Skala, die durch die Endpunkte Unterwür-
figkeit – Dominanz und ggf. einigen Zwischenstufen Checklist: Dieses bezeichnet ein Beobachtungsverfahren,
vorgegeben wird, eingetragen). Es empfiehlt sich, eine bei dem in Intervalltechnik beobachtet wird und der Be-
gerade Anzahl von Unterpunkten vorzugeben, um Ant- obachter eine vorbestimmte Liste von binären (ja / nein)
worttendenzen um die Mitte nicht zu unterstützen. Der Variablen ankreuzt. Dabei sind «Sample-Raten» von 20 bis
wesentliche Vorteil von Ratings ist die Möglichkeit, sich 40 Sekunden (z. B. 20 Sek. beobachten und zehn Sek. auf-
die Leistungsfähigkeit des Beobachters mit seiner Infor- schreiben) bei maximal 40 Variablen möglich, eher unter
mationsintegration zu Nutze zu machen. Damit kann zehn Variablen typisch. Die Zahl der parallel zu verarbei-
man relativ komplexe Dimensionen recht schnell und tenden Variablen hängt vom Training des Beobachters,
billig erfassen. Ratings werden häufig summarisch nach der Häufigkeit der einzelnen Verhaltensweisen, der Klar-
einer Episode abgegeben, aber es gibt auch Anwendun- heit der Definition der Variablen und anderen Faktoren
gen, wo Ratings in Intervalltechnik erhoben werden oder ab.
gar kontinuierlich, z. B. mit Hilfe von Joysticks oder ähn-
licher Technik. Im letzteren Fall handelt es sich dann um Echtzeit-Protokoll («real-time protocol»): Hier werden
ein analoges Echtzeit-Protokoll (wobei analog hier nur Ereignisse mit direktem Bezug zu einer physikalischen
«mit einer bestimmten, relativ hohen «sample-rate» Zeitachse festgehalten, und zwar typischerweise mit
erfaßt» bedeutet). Der Zusammenhang von Ratings und Beginn und Ende der einzelnen Verhaltensweisen. Dieses
Verhaltensbeobachtung im ethologischen Sinne ist kom- Verfahren setzt in der Regel technische Hilfsmittel
pliziert (s. Borkenau & Müller, 1992). (Videorecorder, Computer) voraus oder kann nur mit
sehr wenigen Auswertungskategorien durchgeführt wer-
Ereignisstichprobe («event sample»): Hier wird durch ein den. Typischerweise werden Echtzeit-Protokolle durch die
vorher definiertes Ereignis eine Beobachtungsepoche aus- Kodierung von Videofilmen erstellt. Man beachte, daß
gelöst, z. B. wartet der Beobachter, bis ein Kind einem an- bei jeder Art von dynamischer ikonographischer Fixie-
deren ein Spielzeug wegnimmt, und protokolliert dann rung (Film, Video) gewisse Intervalle vorliegen, beispiels-
das Geschehen für einige Minuten. Danach wird erneut weise 1/25 Sekunde pro Bild bei europäischer Fern-
gewartet, bis wieder ein Ereignis dieser Art eintritt. Dieses sehnorm (PAL) beziehungsweise 1/30 Sekunde bei ameri-
Verfahren ist insbesondere dann von Vorteil, wenn es um kanischer Norm (NTSC) oder 1/16 Sekunde bei einer
die Konsequenzen relativ seltener Ereignisse geht. Nach- Reihe von Film-Normen. Da aber diese Zeitgrenzen typi-
teil des Verfahrens ist die unbekannte Basisrate (d.h. die scherweise kürzer sind als die Reaktionszeit menschlicher
Auftretenswahrscheinlichkeit von Verhaltensweisen in Beobachter, ist diese technische Seite weniger wichtig.
den Episoden, die nicht erfaßt werden) von den beobach- Zudem kann man durch den Einsatz geeigneter Technik
teten Verhaltensweisen, was zu schweren statistischen (z. B. Hochgeschwindigkeitskamera und Auswertung in
Problemen führt. Zeitlupe) solche Grenzen fast beliebig verschieben. Echt-
Zeitstichprobe («time sample»): Hier wird von einer zeit-Protokolle haben den Vorteil, die zeitlichen und
willkürlich festgesetzten Anfangszeit an während einer relationalen Verhältnisse getreu abzubilden. Dies erlaubt
bestimmte Zeitspanne (z. B. 20 Minuten) beobachtet. Die- dann auch die Analyse von zeitlicher Anordnung und
ses Verfahren erlaubt die Bestimmung von ‘normativen’ Überlappung der verschiedenen Verhaltensweisen. Das
Basisraten, d.h., es gibt bei hinreichend langer Beobach- Echtzeit-Protokoll kann durch Zeitlupen- oder Zeitraffer-
tungszeit einen Schätzwert für die Wahrscheinlichkeit Kodierung entstanden sein, lediglich Echtzeit-Kodierung
des Auftretens einzelner Verhaltensweisen. Nachteil ist bedeutet, daß das Verhalten entweder im natürlichen
der oft erhebliche Zeitbedarf, bis etwas Interessantes Ablauf oder vom Band mit Normalgeschwindigkeit aus-
passiert. gewertet wurde.
Intervalltechnik: Häufig wird innerhalb einer Episode in Datenreduktion bezeichnet den Vorgang der Gewin-
festgelegten Zeitintervallen beobachtet. In der Regel gibt nung allgemeinerer Kennwerte aus Datensätzen. Ein typi-
es ein Beobachtungsintervall einer bestimmten Länge sches Beispiel ist das Auszählen der Häufigkeit eines
(«observe-interval») und ein darauf folgendes Schreibinter- Verhaltens. Aus dem ausführlichen Protokoll ist dann ein
vall («record-interval») mit ebenfalls festgelegter Länge, einzelner Kennwert geworden. Auch die Bildung von
das der Übertragung der beobachteten Daten auf einen größeren Kategorien aus kleineren Einheiten (z. B. wer-
Träger dient. In diesem Schreibintervall wird nicht beob- den Lächeln und Lachen zu positiver emotionaler Äußerung
achtet. Beide Intervalle zusammen legen die «sample- zusammengefaßt) gilt als Datenreduktion. Eine Redukti-
rate» fest. Von dieser «sample-rate» hängt es nun ab, wie on bedeutet immer einen gewissen Informationsverlust.
Beobachtungsmethoden und Auswertungsverfahren 247

4. Die Rolle des «Fremde Situation»-Test und Interaktions-


beobachtung) von unabhängigen Arbeits-
menschlichen Beobachters gruppen auswerten zu lassen. Grundsätzlich
ist jede Beobachtung eine Wahrnehmungslei-
Der menschliche Beobachter als Meßinstru- stung und als solche von dem gegenwärtigen
ment bringt seine spezifischen Probleme mit Zustand des wahrnehmenden Systems mit
sich. In der methodologischen Literatur fin- determiniert. Jede Beobachtung ist so in ge-
den sich Formulierungen wie «... der Beob- wisser Weise eine Interpretation von Ereignis-
achter ist das Problem ...». Im Vergleich mit sen in der Umgebung.
Problemen beispielsweise der experimentel-
len Psychologie oder der Fragebogenfor-
schung erscheint die Formulierung allerdings 5. Reliabilität und
übertrieben. Der menschliche Beobachter hat
natürlich sowohl in quantitativer wie auch in Beobachterübereinstimmung
qualitativer Hinsicht seine Verarbeitungs-
grenzen. Manche Situationen sind wegen In der Praxis der Beobachtung zeigt sich, daß
ihrer Komplexität durch einen Beobachter die Protokolle verschiedener Beobachter sich
nicht hinreichend genau abbildbar. Für eini- manchmal unterscheiden. Diese Unterschie-
ge Probleme lassen sich technische Lösungen de können systematischer oder unsystemati-
vorschlagen, z. B. bietet sich der Einsatz von scher Natur sein, d. h. sich bei verschiedenen
Film- und Videokameras bzw. Tonaufnahmen Durchgängen reproduzieren oder nicht repro-
an, um das Verhalten zunächst zu konservie- duzieren lassen. Ein Beispiel für einen syste-
ren und eine spätere Auswertung, beispiels- matischen Unterschied wäre eine Reaktions-
weise in Zeitlupe, vorzunehmen. Besonders zeitdifferenz zwischen zwei Beobachtern. Un-
bei Längsschnittstudien entstehen zwischen systematische Unterschiede entstehen bei-
dem Beobachter und den Beobachteten soziale spielsweise durch augenblicklich mangelnde
Beziehungen positiver oder negativer Art, Konzentration oder Ablenkung.
und die Gegenwart eines Beobachters ändert Solche Probleme sind durch Training der
das zu beobachtende Verhalten (beispiels- Beobachter mit geeignetem Instrumentarium
weise wird man bei Besuchen von Familien weitgehend kontrollierbar. Daher hängt der
kaum jemals Zeuge von Kindesmißhandlun- Wert von Verhaltensdaten nicht unwesent-
gen werden, die es offensichtlich unter Abwe- lich von der Supervision und dem Training
senheit von wissenschaftlichen Beobachtern der Beobachter ab. Nicht alle Fehler und Un-
durchaus gibt). Schließlich ist die Forderung stimmigkeiten zwischen Beobachtern sind al-
nach dem «blinden» Beobachter, mit der ge- lerdings im strengen Sinne Fehler der Beob-
meint ist, daß der Beobachter mit den kon- achter. Insbesondere ungeeignete Kategorien-
kreten Hypothesen, um die es in der Untersu- systeme und ungenaue Definitionen der zu
chung geht, nicht vertraut sein soll, häufig beobachtenden Verhaltensweisen sind die
unrealistisch. Um bestimmte Phänomene häufigsten Ursachen schlechter Übereinstim-
überhaupt systematisch beobachten zu kön- mung. Generell kann man sagen, daß es
nen, sind detaillierte Sachkenntnisse notwen- leichter ist, spezifische und genau definierte
dig. Diese machen es dem Beobachter leicht, kleine Verhaltenseinheiten einzelner Interak-
die tat-sächlichen Interessen und Ziele des tionspartner zu kodieren, als komplexe Beur-
Forschungsprojektes zu erschließen; oder – teilungen abzugeben.
häufig schlimmer – Beobachter bilden sich ei- Die Prüfung der Reliabilität geschieht über
gene Hypothesen, die aber nicht ausgespro- die Berechnung von Ähnlichkeitsmaßen. In
chen sind. Entscheidend ist hier, dafür zu sor- der älteren Literatur wurden häufig Korrelati-
gen, daß nicht Informationen über die Zu- onskoeffizienten benutzt, was aber nur unter
gehörigkeit einer Versuchsperson zu einer selten zutreffenden Voraussetzungen aussage-
Gruppe die eigentliche Beobachtung verfäl- fähige Indizes ergibt. Bei Kategorialdaten und
schen. Oft ist es auch empfehlenswert, ver- Häufigkeitsdaten ist inzwischen Cohens
schiedene Situationen (z.B. Klassifikation im Kappa (Cohen, 1960; 1968) das Standardmaß
248 Methoden und Verfahren

für die Reliabilität. Dabei korrigiert Kappa stimmte Anzahl von Stunden zur Kodierung
den Zusammenhang zwischen zwei Kodie- von Verhaltensweisen zur Verfügung. Es ist
rungen um die Auftretenshäufigkeit des Ver- also abzuschätzen, ob es für die Prüfung der
haltens. Es leuchtet ein, daß eine Verhaltens- Theorie günstiger ist, wenige Versuchsperso-
weise, die 95 % der Beobachtungszeit vorliegt, nen intensiver zu beobachten oder mehr Ver-
von beiden Beobachtern häufiger überein- suchspersonen mit einem gröberen System zu
stimmend kodiert wird, als ein Verhalten, das untersuchen.
nur in 50 % der Zeit auftritt. Generell ist zu beachten, daß sich Beob-
Es sollte festgehalten werden, daß eine achtungen mit hoher Auflösung immer zu
hohe Reliabilität nicht unbedingt der Aus- weniger detailreichen Datensätzen reduzieren
weis einer qualitativ hochwertigen Forschung lassen (durch Zusammenfassung von äquiva-
ist. Es gibt durchaus wissenschaftlich bedeut- lenten Beobachtungskategorien oder durch
same Erkenntnisse, die nicht von jedem Be- Bildung größerer Zeiteinheiten).
obachter repliziert werden können. Manche
Personen erweisen sich als trainingsresistent,
die Gründe dafür sind noch vollständig un- 7. Die Rolle des Kontextes
bekannt. In der Regel sind solche Probleme
bei der Bewertung komplexer Phänomene Verhalten spielt sich immer in einem Kontext
schwerwiegender. ab. Diese kontextuelle Gebundenheit ist häufig
sozialer Natur, d. h., wir beschäftigen uns in
der Entwicklungspsychologie besonders häufig
6. Auswahl des mit irgendwie gearteten Interaktionen zwi-
schen Menschen. Dies ist ganz besonders deut-
Beobachtungsgegenstandes lich in der Säuglingsforschung, trifft aber prin-
zipiell auf alle anderen entwicklungspsycholo-
Die Entscheidung darüber, welche Verhal- gischen Forschungsbereiche auch zu. Die so-
tensweisen beobachtet werden sollen und ziale Einbindung von Verhalten kann als ein
wie diese zu gliedern und einzuteilen sind, ist Sonderfall einer generellen Abhängigkeit des
zentrales Bestimmungsstück der Definition Verhaltens von seinem Kontext betrachtet wer-
von wissenschaftlicher Beobachtung. Der den – mit dem allerdings schwerwiegenden
Forscher muß in Übereinstimmung mit den Unterschied, daß sich nicht alle Kontexte mit
Hypothesen und der Theorie seines Gebietes vergleichbaren Methoden untersuchen lassen.
entscheiden, welche Verhaltensweisen als In- Beispielsweise könnte man in einer bestimm-
dikatoren für Bestandteile der zu prüfenden ten Entscheidungssituation die bisherigen Er-
Theorie angesehen werden sollen. Gleichzei- fahrungen einer Person als für ein Verständnis
tig sind aber auch viele Faktoren zu berück- des konkreten Verhaltens wesentlichen Hinter-
sichtigen, die sich nicht allein aus der wissen- grund betrachten. Diese Erfahrungen sind
schaftlichen Theorie, sondern auch aus Rand- durch Befragung oder biographische Metho-
bedingungen ergeben. Dazu gehört der Auflö- den zu erheben, nicht aber zu beobachten. Im
sungsgrad des Beobachtungssystems sowohl Sonderfall der Interaktion kann man das Ver-
hinsichtlich des Detailreichtums der Defini- halten mehrerer Beteiligter mit identischen
tionen der Verhaltensweisen als auch der Verfahren (vielleicht unterschiedlichen Defini-
Feinheit auf der Zeitachse. Die Zahl der zu tionen der relevanten Verhaltensweisen) pro-
untersuchenden Versuchspersonen determi- tokollieren und diesen Datensatz zum Gegen-
niert gleichzeitig aus statistischen Gründen stand der Analyse machen. Dabei zeigt sich,
die Zahl der in einer Untersuchung sinnvoll daß bei Interaktionsanalysen das Verhalten
zu behandelnden Variablen. Dies kann zu einer Person Teil des Kontextes für das Verhal-
einer Beschränkung auf eine bestimmte An- ten der anderen Person ist. Es besteht eine
zahl verschiedener Beobachtungskategorien (durch geeignete Analysetechnik umkehrbare)
führen. Typischerweise steht im Rahmen Figur-Grund-Beziehung.
eines wissenschaftlichen Projektes oder bei- In der Beobachtung einer Interaktion zwi-
spielsweise einer Diplomarbeit nur eine be- schen Mutter und Kind wird beispielsweise
Beobachtungsmethoden und Auswertungsverfahren 249
die Häufigkeit, mit der das Kind lächelt, vo- synchrones Interaktionsereignis oder als asyn-
kalisiert oder ein bestimmtes Objekt berührt, chrones Ereignis einzuschätzen. Der Datensatz
quantitativ erfaßt. Die so erzeugten Daten basiert auf einer Beobachtung mit einer
werden dann als Indikatoren für den Ausprä- «checklist» mit 28 definierten Verhaltenswei-
gungsgrad psychologisch relevanter Merkma- sen. Ein Beispiel für ein synchrones Interak-
le interpretiert. Das Kind wird als freundlich tionsereignis ist das Auftreten einer kindlichen
bezeichnet, wenn es häufig positive emotio- Vokalisation und einer responsiven Muttervoka-
nale Reaktionen zeigt, oder es wird auf der lisation im gleichen Zeitintervall. Das gemein-
Grundlage quantitativer Indikatoren ein be- same Auftreten von ‹Kind ist schläfrig› und
stimmter Entwicklungsstand festgestellt. Die ‹Mutter stimuliert› wird entsprechend als asyn-
Interpretierbarkeit der interindividuellen Un- chrones Ereignis bewertet. Mit dieser Methodik
terschiede hängt allerdings davon ab, ob die konnten Isabella und seine Kollegen zeigen,
kontextuelle Einbindung der Beobachtungen daß die so gewonnenen Maße der Synchro-
in den untersuchten Fällen identisch oder nie der Interaktion mit der Bindungssicher-
wenigstens vergleichbar war. Hat sich näm- heit am Ende des ersten Lebensjahres in
lich die eine Mutter mit ihrem Kind beschäf- einem systematischen Zusammenhang stan-
tigt, es wiederholt angelächelt, auf seine Vo- den. Dieses Vorgehen hat sicher den wesent-
kalisationen geantwortet und bei Anzeichen lichen Vorteil, neben der Synchronie auch
von Langeweile angemessen stimuliert, die die Basishäufigkeit bestimmter Verhaltens-
andere dagegen die kindlichen Signale igno- weisen der beiden Interaktionspartner ge-
riert, bei Übermüdung weiter stimuliert und trennt analysieren zu können. In einer Un-
intrusiv auf dem Durchsetzen der eigenen tersuchung, die mit ähnlicher Technik durch-
Handlungspläne bestanden, dann erscheint geführt wurde, zeigen Schölmerich, Fracasso,
es höchst unangemessen, Unterschiede in Lamb und Broberg (1995), daß die einzelnen
Häufigkeiten positiven Vokalisierens der Kin- Verhaltenshäufigkeiten in keinem systemati-
der als Indikatoren ihres Entwicklungsstandes schen Zusammenhang mit dem Entwick-
zu interpretieren. Die Erfassung des Kontex- lungsergebnis stehen, die Synchronie- und
tes und seine adäquate statistische Behand- Asynchroniewerte aber einen gewissen
lung ist unserer Auffassung nach das Schlüs- Vorhersagewert für die Bindungssicherheit
selproblem von Beobachtungsmethoden in haben.
der Entwicklungspsychologie und ungleich
wichtiger als zahlreiche traditionelle Unter-
scheidungen zwischen verschiedenen Beob- 9. Zeitliche Struktur von
achtungstechniken (siehe Kasten oben).
Verhalten

8. Die Beobachtung von In den beiden oben geschilderden Untersu-


chungen wurde eine zeitliche Koppelung (Auf-
Interaktionen treten im gleichen Zeitintervall) benutzt, um
individuelle Verhaltensweisen dyadisch inter-
Aus den Ausführungen zur kontextuellen pretieren zu können. Die zeitliche Struktur von
Einbettung von Verhalten folgt, daß man im Verhalten ist aber von viel grundlegenderer Be-
Falle von Interaktionsanalysen das Verhalten deutung. In der Entwicklungspsychologie ist
beider Teilnehmer getrennt erfassen sollte, dieser Aspekt offensichtlich, denn wir arbeiten
um danach mittels einer geeigneten Statistik in der Regel mit zeitgebundenen Phänomenen.
die Beziehung zwischen den Verhaltenswei- Ein ideales Beobachtungsprotokoll sollte nicht
sen zu analysieren. Dabei können komplexe nur die Häufigkeit bestimmter Verhaltenswei-
Definitionen verwendet werden. Beispiels- sen in vorgegebenen Zeiteinheiten angeben,
weise benutzen Isabella, Belsky und von Eye sondern den Beginn und das Ende der einzel-
(1989) eine umfangreiche Tabelle, um das nen Verhaltensweisen zeitlich genau lokalisie-
Auftreten von Verhaltensweisen der Mutter ren. Abbildung 1 zeigt einen solchen Datensatz in
und des Kindes im gleichen Zeitintervall als einer Vielkanaldarstellung.
250 Methoden und Verfahren

Abbildung 1: Ein zeitlich geordneter Datensatz mit vier Verhaltensweisen

Die Zeitachse verläuft in dieser Abbildung Statistikprogrammen, mit denen man diese
von links nach rechts, und in der Vertikalen deskriptiven Parameter berechnen kann.
sind die jeweiligen Kategoriennummern bzw. Die Kategorie mit der Nr. 123 (Kind quen-
die definierten Verhaltensweisen angegeben. gelt) beispielsweise kommt in diesem Falle 72
Ein schwarzer Block bedeutet die Beobach- mal vor und dauert insgesamt 6300 Sekun-
tung des entsprechenden Verhaltens zu dem den an. Die Kategorie 252 (Mutter tröstet mit
auf der x-Achse angegebenen Zeitpunkt. Körperkontakt) kommt 49 mal vor und dau-
Dabei bedeutet 123 Quengeln des Kindes, ert 4830 Sekunden an. Die beiden letzten Zei-
124 Weinen, 252 Trösten mit Körperkontakt len geben die Ergebnisse für definierte Kate-
und 253 vokal es / verbales Trösten. gorien wieder, hier sind das Quengeln und
Die Daten des vorliegenden Beispiels stam- das Weinen des Kindes zusammengefaßt
men aus einem Forschungsprojekt, in dem (125) sowie das Trösten mit und ohne Kör-
die frühen Erfahrungen von drei Monate perkontakt (254). Es ist zu beachten, daß bei
alten Säuglingen in verschiedenen Lebensbe- solchen Definitionen nicht einfach die Häu-
dingungen untersucht wurden, hier sind Aka- figkeiten der einzelnen Verhaltensweisen ad-
Pygmäen und Ngandu-Farmer aus Zentral- diert werden, so ist die Häufigkeit der Kombi-
afrika beobachtet worden (Hewlett, 1991). nation Quengeln / Weinen sogar geringer als
In der Praxis wird man selten die Daten in die Häufigkeit von Quengeln alleine. Dies
diesem Rohdatenformat berichten können. kann durch einen Wechsel von Quengeln zu
Es ist sehr schwierig, beispielsweise Ähnlich- Weinen und umgekehrt entstehen. Benutzt
keiten oder Unterschiede zwischen Gruppen man dann eine «Oder»-Definition (also Ver-
in solchen komplexen Mustern zu erkennen. halten = Quengeln oder Weinen), kann die
Insofern ist es vorteilhaft, diese Daten zusam- entstehende Variable mit geringerer Häufig-
menzufassen. Aus der Betrachtung von Abbil- keit auftreten. Immer aber sollte die Gesamt-
dung 1 geht unmittelbar hervor, daß ein sol- zeit einer kombinierten Variable mindestens
cher zeitgetreuer Datensatz sich durch einfa- so groß oder größer sein als die Gesamtzeit
ches Auszählen z. B. in Häufigkeitsdaten über- der Einzelvariablen mit der längsten Dauer.
setzen läßt. Betrachtet man das gleichzeitige Auftreten
Die folgende Tabelle zeigt einen Auszug von mindestens zwei Variablen (also die
aus den allgemeinen Kennwerten des Daten- «Und»–Verknüpfung), dann kann ebenfalls
satzes, der in der Abbildung 1 wiedergegeben die Häufigkeit größer oder kleiner sein als die
ist. Dabei werden in Spalte 3 die Häufigkeit, Häufigkeiten der einzelnen Variablen, aber
danach die Gesamtdauer in Sekunden, die die Gesamtdauer muß kleiner oder gleich der
mittlere Dauer, die Standardabweichung der kürzesten Dauer der Einzelvariablen sein.
mittleren Dauer, der prozentuale Anteil der Häufig werden Individuen unterschiedlich
Aktivität dieser Kategorie an der Gesamtzeit lange beobachtet. Um die Ergebnisse um die-
bzw. Kriteriumszeit und die Rate pro Minute sen Faktor zu korrigieren, werden proportio-
angegeben. Unterschiedliche Kodierungssy- nale Meßgrößen angegeben, d. h., die Häufig-
steme (s. Hinweise am Ende des Kapitels) keit wird in eine Rate pro Minute oder Sekun-
geben alle mehr oder minder entsprechende de umgerechnet, und die kumulierte Dauer
Kennwerte aus oder besitzen Schnittstellen zu einer Verhaltensweise wird als prozentualer
Beobachtungsmethoden und Auswertungsverfahren 251
Tabelle 1: Deskriptive Statistik (Auszug) für den Beispieldatensatz
Subjekt: 9 Dateiname: K009u 220 Zeit: 13:35:09
Code-Name Code Häufigkeit t(Aktiv) t(mittel t(std) t%(krit) F/min.

K-quengelt 123 72 6300.00 87.50 88.76 19.45 0.1334


K-schreit 124 22 1890.00 85.91 80.34 5.84 0.0408
M-körpl.-trösten 252 49 4830.00 98.57 98.93 14.91 0.0908
M-vokal/verbal-trösten 253 50 5310.00 106.20 116.14 16.39 0.0926
trösten 254 56 5670.00 101.25 114.92 17.51 0.1037
quengeln/schreien 125 71 7620.00 107.32 110.36 23.53 0.1315

Anteil der Gesamtzeit angegeben. Solche Findet man bei einer solchen Analyse
Werte sind in den beiden rechten Spalten der deutliche, aber nicht erwartete Effekte über
Tabelle oben angegeben. die Beobachtungszeit (Abnahme oder Zunah-
Abbildung 1 legt nahe, daß Trösten vor- me), so kann dies einen Hinweis auf einen
wiegend im Zusammenhang mit Weinen / möglichen Einfluß der Beobachtung auf das
Quengeln auftritt. Solche Zusammenhänge Verhalten darstellen. Treten am Anfang einer
testet man häufig über Korrelationen etwa Beobachtungsepisode besonders viele respon-
der Gesamtdauer der Variablen. Das ist aber sive Vokalisationen auf, gegen Ende aber nur
irreführend, da die kumulierten Parameter noch wenige, kann das ein Hinweis auf den
(wie Gesamtdauer vom Weinen / Quengeln Versuch der beobachteten Person sein, einen
und Trösten) auch bei hoher Korrelation besonders guten Eindruck zu erwecken.
nicht in zeitlichem Zusammenhang aufgetre- Unter Umständen erfolgt erst mit Gewöh-
ten sein müssen. Daher ist es vorzuziehen, nung an die Situation eine Reduzierung auf
die tatsächliche zeitliche Überlappung zu be- einen längerfristig stabilen Wert. Es ist in
rechnen, oder die bedingten Wahrscheinlich- jedem Fall zu empfehlen, die Möglichkeiten
keiten von Trösten während Weinen / Quen- der graphischen Darstellung von Beobach-
geln und während der restlichen Zeit mitein- tungsdaten zu nutzen, bevor weitere Analy-
ander zu vergleichen. Ein solches Vorgehen sen durchgeführt werden.
erlaubt es, Faktoren als quasi-experimentelle
Bedingungen einzuführen, die ihrerseits Er-
gebnisse der Beobachtungstätigkeit selbst 10. Statistische
sind. In solchen Fällen sollte sich der Unter-
sucher allerdings durch graphische Inspekti- Weiterverarbeitung
on seiner Daten davon überzeugen, daß die von Beobachtungsdaten
zugrundegelegten Zustände auch hinreichend
lange vorkommen. Proportionale Meßgrößen Im Gegensatz zu anderen Untersuchungsfor-
von seltenen Ereignissen ergeben zwangsläu- men liegen bei Beobachtungsstudien – wie
fig verzerrte und nicht aussagekräftige Daten. übrigens auch generell bei Längsschnittstudi-
In ähnlicher Weise kann man einzelne Ereig- en in der Entwicklungspsychologie (!) – meh-
nisse als Kriterium verwenden, um beispiels- rere sogenannte ‹Datenrecords› für jede Un-
weise in den auf eine Vokalisation folgenden tersuchungsperson vor. Während man zum
zehn Sekunden nach der durchschnittlichen Beispiel in einem Interview alle Fragen ein
Häufigkeit einer Antwort zu suchen. einziges Mal stellt und diese Antworten den
Vergleicht man bedingte Wahrscheinlich- Datensatz darstellen, wird bei Beobachtungen
keiten für aufeinanderfolgende passend ge- typischerweise eine Vielzahl von identischen
wählte Zeitintervalle, so erhält man Zeitfunk- Ereignissen (in unserem Beispiel: Weinen des
tionen. Solche Zeitfunktionen können bei Kindes oder Trösten der Mutter) festgehalten.
einer Langzeitbeobachtung Tagesrhythmen Diese Besonderheit, die man in der Statistik
aufzeigen, wie das in einer Untersuchung von auch als ‹hierarchische Datenstruktur› bezeich-
Leyendecker, Lamb, Schölmerich und Fracasso net, wird noch zusätzlich kompliziert durch
(1995) gezeigt werden konnte. die zweite Besonderheit von Beobachtungs-
252 Methoden und Verfahren

daten, nämlich ihre inhärente Zeitstruktur. In Tabelle 2: Rohdaten von Weinen und Trösten
aller Regel besteht das Ziel der Datenauswer- Zeiteinheit Kind weint Mutter tröstet
tung genau darin, diese Zeitstruktur zu erfas-
sen und z. B. auf mögliche Gruppen- oder Al- 0 0 0
tersunterschiede zu testen. Die Entwicklung 1 1 0
von Verfahren, mit denen man dieses Analy- 2 1 1
seziel erreichen kann, ist eng mit dem Auf- 3 1 1
kommen moderner Computer und entspre- 4 1 1
chender Programme verbunden.
5 0 1
Es lassen sich zunächst aufgrund des Ska-
6 0 0
lenniveaus der Daten zwei Gruppen von Ver-
fahren unterscheiden. Liegt ein kontinuierli-
ches oder zumindest hinreichend angenäher-
tes kontinuierliches Niveau vor (d. h. gibt es
zu jedem Zeitpunkt einen Meßwert wie zum Insgesamt liegen pro Person hier 1080 Zeit-
Beispiel die Körpergröße), dann ist die Zeit- einheiten vor. Bildet man nun eine Kreuzta-
reihenanalyse das am häufigsten eingesetzte belle des Verhaltens der Mutter und des Kin-
Verfahren zur Auswertung der Daten (Gott- des für alle Zeiteinheiten, dann erhält man
man & Ringland, 1981; Schmitz, 1990). Mei- folgendes Resultat:
stens beschränkt man sich allerdings bei Be-
obachtungen darauf, zu jedem Zeitpunkt fest-
zuhalten, ob ein bestimmtes Verhalten auf-
tritt oder nicht. Daher kommt den Verfahren, Tabelle 3: Kreuztabelle von Weinen und Trösten
die mit diskreten (ja / vielleicht / nein), meist Mutter tröstet
binären (0/1) Daten arbeiten, eine größere
Kind weint nein ja
Bedeutung zu, so daß nur diese hier vorge-
stellt werden. nein 1010 23
Ausgangspunkt dieser Verfahren ist dabei
eine gewöhnliche Kreuztabelle; das am häu- ja 14 33
figsten verwendete Verfahren, das sogenann-
te allgemeine log-lineare Modell, stellt im
Grunde genommen nichts anderes als eine Aus der Tabelle geht hervor, daß in 1010
Erweiterung dieses Ansatzes auf Tabellen dar, Zeiteinheiten das Kind nicht weint und die
in der mehr als zwei Variablen gleichzeitig Mutter auch nicht tröstet, während in 33
untersucht werden sollen. Zeiteinheiten das Kind weint und von der
Mutter getröstet wird. Da wir davon ausge-
hen, daß ein Zusammenhang zwischen dem
10.1 Zeitunabhängige Analysen Verhalten der Mutter und dem Verhalten des
Kindes besteht, benötigen wir ein Maß, mit
Beginnen wir mit dem etwas einfacheren Fall, dessen Hilfe wir die Stärke dieses Zusammen-
in dem auf die Analyse der zeitlichen Struktur hangs ausdrücken können. Eines der einfach-
zunächst verzichtet wird. Wir verwenden hier sten dieser Maße ist das sogenannte ‹Kreuz-
weiterhin das oben eingeführte Beispiel. Produkt-Verhältnis›, das berechnet wird,
Tabelle 2 gibt einen Auszug aus den Roh- indem man die Häufigkeiten in den zwei glei-
daten wieder. Dabei wird deutlich, daß das chen Zellen (ja-ja und nein-nein) miteinan-
Kind in der ersten Zeiteinheit nicht weint der multipliziert und durch das Produkt der
und die Mutter auch nicht tröstet. In der beiden anderen Zellen dividiert. Dabei wird
folgenden Zeiteinheit beginnt das Kind zu zu jeder Häufigkeit noch eine Konstante von
weinen, aber die Mutter tröstet nicht, 0.5 addiert, was die asymptotischen Eigen-
während in der dritten Zeiteinheit das Kind schaften des Koeffizienten verbessert (Bishop,
weiterhin weint und die Mutter begonnen Fienberg & Holland, 1975; Wickens, 1989).
hat, es zu trösten. Allgemein ausgedrückt ergibt sich somit
Beobachtungsmethoden und Auswertungsverfahren 253

( f 11 + .5)* ( f 22 + .5) wie homogen der Zusammenhang in der


Kreuzproduktverhältnis
Kreuzprodu =
ktverhältn is = Stichprobe ist, da wir diese Information
( f 21 + .5)* ( f 12 + .5) durch das Zusammenfassen in einer einzigen
in unserem Falle also Tabelle aufgeben. Es könnte also durchaus
1010.5* 33.5 sein, daß in einer Stichprobe von vielleicht
Kreuzproduktverhältnis
Kreuzprodu =
ktverhältn is = = 99.34 50 beobachteten Dyaden 30 einen positiven
23.5 * 14.5
Zusammenhang (wie in unserem Beispiel)
aufweisen, während bei 20 Dyaden über-
haupt kein (oder sogar ein entgegengesetzter)
Dieser Wert an sich ist allerdings nicht sehr
Zusammenhang besteht. Trotzdem würden
aussagekräftig, wir können weder die Stärke
wir mit großer Wahrscheinlichkeit bei der
noch die Richtung des Zusammenhangs an-
Analyse der kombinierten Tabelle ein positi-
geben. Dazu bietet sich der natürliche Loga-
ves Ergebnis erhalten, was aber nicht völlig
rithmus des Kreuzproduktverhältnisses an. In
richtig ist. Außerdem müßten wir zum Testen
unserem Beispiel ergibt sich
der Signifikanz bei einer solchen Analyse auf
Ln (Kreuzproduktverhältnis) = 4.60 die oben genannten Chi-Quadrat-Statistiken
zurückgreifen. Da wir aber in unserer Tabelle
Durch das Logarithmieren wird dabei das ur- Häufigkeiten und nicht die Anzahl der Perso-
sprüngliche Kreuzproduktverhältnis, das nur nen in der Stichprobe analysieren, überschät-
positive Werte annehmen kann (in der Tabel- zen wir mit einer solchen Analyse die Stärke
le gibt es keine negativen Werte !), in einen des Zusammenhangs, da beim Testen die An-
Wert umgewandelt, der prinzipiell gesehen zahl der Beobachtungen als Stichproben-
negativ wie positiv unendlich groß werden größe verwendet wird und jeder Signifikanz-
kann. Ein weiterer Vorteil ist, daß im Falle test eine direkte Funktion unter anderem der
einer vollständigen Unabhängigkeit der bei- Stichprobengröße ist.
den Variablen oder Verhaltensweisen der Lo- Es bietet sich nun aber die Möglichkeit an,
garithmus des Kreuzproduktverhältnisses den die oben beschriebene Berechnung des Kreuz-
Wert 0 annimmt. Das Vorzeichen des loga- produktverhältnisses für jede Mutter-Kind-
rithmierten Wertes gibt zudem Aufschluß Dyade einzeln durchzuführen. Diese für jede
über die Richtung des Zusammenhangs. Ein einzelne Dyade berechneten logarithmierten
negativer Wert zeigt an, daß die Häufigkeiten Kreuzproduktverhältnisse kann man dann di-
auf der Nebendiagonalen, d. h. in den Zellen, rekt für weitere Analysen benutzen. Beispiels-
die ungleiche Verhaltensweisen beinhalten, weise kann man einen einfachen «t-Test»
größer sind, als die Häufigkeiten in den Zel- durchführen, um die Hypothese zu testen,
len, die gleiche Verhaltensweisen beinhalten. daß der mittlere Zusammenhang in der Stich-
Ein positiver Wert hingegen weist den umge- probe null ist. Hierbei erhält man durch den
kehrten Fall aus. Zwischen dem Verhalten der Mittelwert der logarithmierten Kreuzprodukt-
Mutter und dem Verhalten des Kindes in un- verhältnisse die Information, in welcher
serem Beispiel besteht also ein positiver Zu- Richtung möglicherweise ein Zusammen-
sammenhang, das Verhalten der Mutter und hang besteht, und durch den «t-Test» die In-
des Kindes stimmen häufig überein. formation, ob dieser Zusammenhang stati-
Damit haben wir die Frage nach der Art stisch bedeutsam oder zufällig ist.
des Zusammenhangs beantwortet; wir wissen Bei größeren Stichproben oder Datenmen-
allerdings noch nicht, ob dieser Zusammen- gen empfiehlt sich der Einsatz von Stati-
hang stark oder schwach ist, oder, statistisch stikprogrammen. Das allgemeine log-lineare
gesehen, signifikant ist oder nicht. Eine sol- Modell ist in allen größeren Statistikprogram-
che Analyse kann nicht einfach auf einer men (SPSS, SAS, BMDP etc.) implementiert
Kreuztabelle beruhen, in der alle Daten von und basiert direkt auf dem logarithmierten
allen Dyaden zusammengezogen sind. Zwei Kreuzproduktverhältnis bzw. kann aus diesen
Gründe sind dafür ausschlaggebend (vgl. hergeleitet werden (Bishop et al., 1975; Ha-
hierzu Wickens, 1993): Erstens können wir in berman, 1978, 1979; eine gut verständliche
diesem Falle keine Aussage darüber machen, deutschsprachige Einführung gibt Langehei-
254 Methoden und Verfahren

ne, 1980). In diesem Falle muß die Analyse hang nicht besteht, das mittlere Kreuzpro-
mit drei Variablen – den beiden Beobach- duktverhältnis also 0 ist, was in diesem Falle
tungskategorien sowie der Identifikations- t = 23.90, p = .000 ergibt. In der Stichprobe
nummer der einzelnen Dyade – durchgeführt besteht also ein signifikanter Verhaltenszu-
werden. Bezeichnen wir das Verhalten des sammenhang. Auf diese Weise lassen sich je-
Kindes mit A, das Verhalten der Mutter mit B doch potentielle Gruppenunterschiede nicht
und die Mutter-Kind-Dyade mit C, dann er- überprüfen. Um zu testen, ob die Stärke des
gibt sich die Modellgleichung für das voll- Zusammenhangs sich zwischen den beiden
ständigste, das sogenannte saturierte Modell untersuchten Gruppen der Aka und der
als Ngandu unterscheidet, verwendet man den t-
Test für zwei unabhängige Stichproben und
eˆijk = λ + λ i + λ j + λ k + λ ij + λ ikj + λ jk + λ ijk .
ABC A B C AB AC BC ABC
überprüft, ob die Mittelwerte in beiden Grup-
pen gleich sind. Im vorliegenden Falle ergibt
ABC
Hierbei bezeichnet eˆijk den natürlichen Lo- sich für die Aka ein Mittelwert von 4.38 (SD
garithmus des Erwartungswertes in der Zelle 1.18) und für die Ngandu ein Wert von 4.27
ijk. Für das saturierte Modell ist dieser Erwar- (SD 1.17). Der Unterschied zwischen den
tungswert genau gleich dem tatsächlich be- Mittelwerten ist nicht signifikant (t = 0.30,
obachteten Wert, d. h., in diesem Falle ist p = .767), d. h., der Zusammenhang zwischen
ABC
eˆijk genau gleich dem natürlichen Logarith- dem Mutter- und dem Kindverhalten ist in
mus der beobachteten Häufigkeit in Zelle ijk. beiden Gruppen gleich stark.
Die auf der rechten Seite der Gleichung be- Verwendet man das allgemeine log-lineare
findlichen λ (lambda)-Parameter lassen sich Modell wie oben beschrieben, dann erhält
als numerische Quantitäten interpretieren, man neben den Parametern für den Zusam-
mit denen die jeweiligen Haupteffekte und menhang auch Parameter, mit deren Hilfe
Interaktionen am Zustandekommen dieser sich untersuchen läßt, ob es Unterschiede
beobachteten Häufigkeit beitragen. Zwei die- zwischen dem Verhalten der Kinder bzw. der
ser Parameter sind dabei für die Analyse unse- Mütter in den beiden Gruppen gibt. Für das
rer Beobachtungen von besonderem Interes- Kindverhalten ergibt sich hier zum Beispiel
se. Der Parameter λ ij quantifiziert den mitt- ein Wert für λ iA von 0.55, was besagt, daß im
AB

leren Zusammenhang zwischen A (dem Kind- Stichprobendurchschnitt die Häufigkeit für


verhalten) und B (dem Mutterverhalten) in ‹nicht-weinen› größer ist als die Häufigkeit
der Stichprobe. Der Parameter λ ijk
ABC
hinge- für weinen. Addieren wir zu diesem Parame-
gen quantifiziert, inwieweit dieser Zusam- ter die Parameter der individuellen Variabi-
menhang in der Dyade Ck von diesem Mit- lität λ ikAC hinzu und testen auf Gruppenun-
telwert abweicht. Dabei nimmt k die Werte terschiede, dann ergibt sich mit t = 7.35,
1,2 .... K an, wobei K die Anzahl der beobach- p = .000 ein signifikanter Unterschied zwi-
teten Dyaden darstellt. Addiert man beide schen den Kindern der Aka und der Ngandu.
Werte, dann erhält man eine Quantifizierung Die Mittelwerte machen dabei deutlich, daß
des jeweiligen Zusammenhangs, die genau 1/4 die Kinder der Aka signifikant seltener wei-
des oben beschriebenen logarithmierten nen (genau genommen weinen sie ‹signifi-
Kreuzproduktverhältnisses entspricht. kant häufiger nicht›, M = 0.91, SD = .38) als
Betrachten wir also in dem oben verwen- die Kinder der Ngandu (M = 0.20, SD = .22).
deten Beispiel alle 41 Mutter-Kind-Dyaden Ebenso läßt sich zeigen, daß die Aka-Mütter
und bilden die entsprechenden Kreuzpro- signifikant häufiger trösten als die Mütter der
duktverhältnisse, dann ergibt sich ein mittle- Ngandu (t = –3.15, p = .003), was ein interes-
res Kreuzproduktverhältnis von 4.32 bei einer santes Ergebnis andeutet: Obwohl die Kinder
Standardabweichung von 1.16. Will man nur der Ngandu insgesamt mehr weinen und
die Hypothese testen, daß zwischen dem Ver- gleichzeitig ihre Mütter seltener trösten als
halten der Mutter und dem Verhalten des dies bei den Aka der Fall ist, ist der Zusam-
Kindes ein Zusammenhang besteht, kann menhang zwischen den Verhaltensweisen der
man einen t-Test gegen die Nullhypothese Kinder und der Mütter in beiden Gruppen
durchführen, daß ein solcher Zusammen- gleich stark (s.o.). Dies könnte zum Beispiel
Beobachtungsmethoden und Auswertungsverfahren 255
dadurch zustande kommen, daß die Ngan- z. B. die Mutter das Kind tröstet, nachdem die-
du gelegentlich nicht trösten, wenn das ses zu weinen begonnen hat, d. h., daß das
Kind weint, und die Aka gelegentlich trö- Verhalten des Kindes zeitlich vor dem Verhal-
sten, wenn das Kind nicht weint. Man muß ten der Mutter auftritt.
hier beachten, daß bei diesen Analysen Um diese Kontingenz abzubilden, müssen
beide «Fehlerzellen» gleichen Einfluß auf wir die Zeit explizit in die Modellierung der
die berechnete Stärke des Zusammenhangs Daten integrieren. Dies geschieht, indem die
haben. beiden Variablen, das Kindverhalten und das
Mutterverhalten, nicht nur einmal in der
Analyse verwendet werden, sondern zweimal
10.2 Zeitabhängige Analysen – und zwar in zwei Zeiteinheiten, t und t+1.
Bezeichnen wir nun das Kindverhalten mit K
Der oben beschriebene Analyseweg läßt sich und das Mutterverhalten mit M, dann erhal-
relativ einfach auf solche Analysen erweitern, ten wir für jedes Verhalten zwei Variable, Kt
in denen gezielt die zeitliche Struktur der In- und Kt+1 für das Kind und Mt sowie Mt+1 für
teraktionen untersucht werden soll. Bei dem die Mutter. Eher technisch ausgedrückt be-
hier vorgeschlagenen Verfahren handelt es zeichnet man das Verhalten der beiden Ak-
sich um eine Neudefinition der relativ be- teure zum Zeitpunkt t+1 als ‹lagged behavior›
kannten Lag-Analyse (Gottman, 1979; Gott- und diese Art der Datenanalyse als Lag-Analy-
man & Bakeman, 1979; Sackett, 1978, 1979, se. Alle größeren Statistik-Programme (SPSS,
1987), um die es in der Vergangenheit einige BMDP, SAS, SYSTAT etc.) beinhalten eine
Diskussion gegeben hat (Allison & Liker, Funktion, mit der solche ‹lagged variables› er-
1982; Budescu, 1984, 1985). Aus unserer zeugt werden können. Die ursprüngliche Da-
Sicht stellt das Verfahren eine sehr attraktive tenmatrix wird dadurch um zwei Variablen
Möglichkeit zur Analyse zeitlicher Kontin- ergänzt und sieht dann in unserem Beispiel
genzen dar. Unser Vorschlag umgeht zudem exemplarisch so aus (Tab. 4).
die technischen Probleme, die die Diskussion Hierbei beinhalten dann die Variablen Kt
lange prägten. und Mt in der ersten Zeile das Verhalten bei-
Um den vorne vorgeschlagenen Ansatz zu der Akteure zu Beginn der Beobachtung, Kt+1
verstehen, ist es hilfreich, sich noch einmal und Mt+1 dagegen das Verhalten in der vor-
Tabelle 2 zu vergegenwärtigen. Die gewöhnli- hergehenden Sekunde. Am besten läßt sich
che Kreuztabellierung dieser Daten (Tab. 3) dies in kondensierter tabellarischer Form so
erbrachte, daß zwischen dem Mutter- und darstellen, daß alle Kombinationen des Mut-
dem Kindverhalten eine positive Kontingenz terverhaltens zu beiden Zeiteinheiten z. B. für
besteht, allerdings haben wir noch keine In- die Zeilen, alle Kombinationen des Kindver-
formationen über den zeitlichen Ablauf der haltens für die Spalten (oder umgekehrt) ver-
Interaktionen berücksichtigt. Zu erwarten wendet werden, so das sich die folgende Ta-
wäre jedoch eine zeitliche Struktur, in der belle ergibt (Tab. 5).

Tabelle 4: Lag-Tabelle Weinen und Trösten

Sekunde Kt Mt Kt+1 Mt+1

0 0 0
1 1 0 0 0
2 1 1 1 0
3 1 1 1 1
4 1 1 1 1
5 0 1 1 1
6 0 0 0 1
256 Methoden und Verfahren

Tabelle 5: Kreuz-Lag-Tabelle Weinen und Trösten

Mutter tröstet
nein / nein nein / ja ja / nein ja/ja

Kind weint nein / nein 974 11 12 8

nein / ja 11 13 0 3

ja / nein 7 1 16 3

ja / ja 1 5 2 12

Aus der Tabelle 5, die die gleiche Mutter- Verhalten des anderen Partners (z. B. der Mut-
Kind-Dyade darstellt wie Tabelle 2, wird deut- ter) in der nachfolgenden Zeitsequenz be-
lich, daß sich in 974 von 1010 Zeiteinheiten, stimmt, ein Zusammenhang in der umge-
in denen das Kind nicht weint und die Mut- kehrten Richtung jedoch nicht besteht. Von
ter nicht tröstet, weder das Verhalten des Kin- Bidirektionalität oder Symmetrie hingegen
des noch das der Mutter ändert. In jeweils elf spricht man, wenn das Verhalten beider In-
Zeiteinheiten ändert nur ein Interaktions- teraktionspartner sich im Zeitverlauf wechsel-
partner sein Verhalten, und in 13 Einheiten seitig beeinflußt, d. h. sowohl das Kindverhal-
ändern beide Partner ihr Verhalten gleichzei- ten auf das spätere Mutterverhalten wie auch
tig. Interessant ist an dieser Tabelle, daß die das Mutterverhalten auf das spätere Kindver-
Mutter acht mal in beiden Zeiteinheiten trö- halten einwirkt. Von erheblicher Bedeutung
stet, obwohl das Kind in keiner dieser Einhei- sind daneben die Konzepte der sog. Autokon-
ten weint, drei Mal tröstet die Mutter das tingenz und der Synchronität. Mit Autokontin-
Kind bereits, obwohl es erst in der nächsten genz wird dabei das Ausmaß bezeichnet, mit
Zeiteinheit zu weinen beginnt. dem das Verhalten des Kindes oder der Mut-
Gehen wir wiederum davon aus, daß mehr ter vom eigenen Verhalten in der vorherge-
als eine Dyade beobachtet wurde, besteht un- henden Zeiteinheit abhängt. Im allgemeinen
sere Analyse nunmehr aus fünf Variablen – wird diese Autokontingenz als reiner Störfak-
dem Kind- und dem Mutterverhalten zu je tor betrachtet, den es zu kontrollieren gilt,
zwei Zeitpunkten sowie der Identifikations- der aber keine inhaltliche oder interpretative
nummer der Dyade. Dadurch wird die Analy- Bedeutung hat. Wenngleich wir dieser Auffas-
se naturgemäß wesentlich komplexer, wobei sung nicht zustimmen, so muß aus Platz-
allerdings, wie wir im folgenden zeigen wer- gründen eine genauere Analyse der Autokon-
den, die unterschiedlichen Parameter eine tingenzen hier unterbleiben. Mit Synchro-
eindeutige und im Bezugsrahmen der Beob- nität schließlich bezeichnen wir den Zusam-
achtungen recht einfach zu verstehende Be- menhang zwischen dem Mutter- und dem
deutung haben. Sie lassen sich an zwei be- Kindverhalten in der jeweils gleichen Zeitein-
deutsame Konzepte aus diesem Bereich an- heit, im Grunde genommen also den Zusam-
binden: Dominanz (oder Asymmetrie) und Bi- menhang, wie er in der zeitunabhängigen
direktionalität (oder Symmetrie; vgl. z. B. Bu- Analyse untersucht wird.
descu, 1984, 1985; Gottman & Ringland,
1981). Von Dominanz oder Asymmetrie wird In eher technischen Kategorien ausgedrückt
gesprochen, wenn das Verhalten des einen lautet die log-lineare Modellgleichung für das
Interaktionspartners (z. B. des Kindes) das saturierte Modell aller fünf Variablen d. h., für

eˆijklm = λ + λ i t + λ j t+1 + λ k t + λ l t +1 + λ m + λ ij t t +1 + λ ik t t + λ il t t +1 + λ imt


ABCDE K K M M Dyade K ,K K ,M K ,M K , Dyade
+

λ Kjk t +1 ,M t ...+ λ Kijklm


t ,K t+ 1, M t , M t+ 1, Dyade
,
Beobachtungsmethoden und Auswertungsverfahren 257
jede Variable existiert ein sogenannter Haupt- daß der Zusammenhang zwischen dem Ver-
effekt. Daneben werden die Kombinationen halten der Mutter und dem des Kindes in der
dieser Haupteffekte systematisch durchge- Stichprobe überzufällige Variationen auf-
spielt, so daß sich Interaktionen erster Ord- weist, also nicht homogen ist. Analog dazu
nung, zweiter Ordnung usw. ergeben. Die verweist z. B. die signifikante Interaktion
λ Kikmt M t +1
, ,Dyade
genaue Bedeutung dieser einzelnen Interak- darauf, daß der (dominante oder
tionen ist Tabelle 6 zu entnehmen. asymmetrische) Zusammenhang vom Kindver-
Grundsätzlich ist dabei anzumerken, daß die halten auf das Mutterverhalten in der Stich-
Interaktionen zweiter und höherer Ordnung probe zu stark variiert, als daß man dies als zu-
so zu interpretieren sind, daß der Zusammen- fällig betrachten könnte.
hang zweier (im Grunde beliebiger) Variablen Tabelle 6 gibt alle definierbaren Interaktio-
nicht konstant bleibt, wenn man die dritte nen des log-linearen Modells wieder, und
hinzuzieht (vgl. Elliot, 1988; Holt, 1979; zwar gegliedert nach dem mittleren Zusam-
Long, 1984). Dies war bereits bei der Interak- menhang in der Stichprobe (in der linken
tion zwei. Ordnung im vorhergehenden Ab- Spalte) und den individuellen Abweichungen
schnitt über die zeitunabhängigen Analysen von den jeweiligen Mittelwerten (in der rech-
angeklungen, in dem die Interaktion zwei. ten Spalte). Die Bedeutung der jeweiligen Pa-
Ordnung, wenn sie signifikant ist, impliziert, rameter ist in der mittleren Spalte aufgeführt.

Tabelle 6: Bedeutung der statistischen Interaktionen

Mittlerer Zusammenhang Bedeutung Individuelle Variabilität

Synchronität zum Zeitpunkt t sagt

λ Kijklm
, , , ,Dyade
λ Kijklt K t+ 1 M t M t+t
, , , Synchronität zum Zeitpunkt t+1 vorher t K t+ 1 M t M t+t

λ Kijkt K t+ 1 M t λ Kijkmt K t+ 1 M t
, , Synchronität zum Zeitpunkt t sagt das Kindverhalten zum , , ,Dyade
Zeitpunkt t+1 vorher

λ Kijl t K t+ 1 M t +1 λ Kijlmt K t+ 1 M t +1
, , Kindverhalten zum Zeitpunkt t sagt Synchronität zum Zeit- , , , Dyade
punkt t+1 vorher

λ Kiklt M t M t +1 λ Kiklmt M t M t +1
, , Synchronität zum Zeitpunkt t sagt das Mutterverhalten zum , ,
Zeitpunkt t+1 vorher

λ Kjklt+ 1 M t M t +1 λ Kjklm
, , Mutterverhalten zum Zeitpunkt t sagt Synchronität zum Zeit- ,
t+ 1 M t M t +1 , , Dyade
punkt t+1 voraus

λ Kjl t+ 1 M t +1 λ Kjlmt+ 1 M t +1
, , , Dyade
Synchronität zum Zeitpunkt t+1

λ Kik t M t λ Kikmt M t
, Synchronität zum Zeitpunkt t , , Dyade

λ Kil t M t +1
Kindverhalten zum Zeitpunkt t sagt Mutterverhalten zum
λ Kilmt M t +1
, , ,Dyade
Zeitpunkt t+1 vorher

λ Kjk t+ 1 M t λ Kjkmt+ 1 M t
, Mutterverhalten zum Zeitpunkt t sagt Kindverhalten zum , ,Dyade
Zeitpunkt t+1 vorher

λ Kij t K t+ 1 λ Kijmt K t+ 1
, , , Dyade
Autokontingenz des Kindverhaltens

λ Mkl t M t +1 λ Mklmt M t +1
, , ,Dyade
Autokontingenz des Mutterverhaltens
258 Methoden und Verfahren

Bei den Interaktionen zweiter und höherer festzustellen. Der positive Zusammenhang
Ordnung ist dabei zu beachten, daß die vorge- bei den Aka kann dabei so interpretiert wer-
schlagene Interpretation nicht zwingend in den, daß die Mütter früher auf das Verhalten
dem Sinne ist, daß sie die einzig (technisch) des Kindes reagieren, als dies bei den Ngandu
mögliche darstellt. Im Rahmen der Analyse der Fall ist. Insoweit legt diese begrenzte Un-
von Beobachtungsdaten scheint sie uns aller- tersuchung der zeitlichen Struktur der Daten
dings unter inhaltlichen Gesichtspunkten die- nahe, daß die Mütter der Aka responsiver
jenige zu sein, die in den allermeisten Fällen sind als die Mütter der Ngandu, ein Unter-
angebracht sein dürfte, wenngleich sich unter schied, der allerdings erst hervortritt, wenn
sehr spezifischen Fragestellungen ein Wechsel die zeitliche Struktur der Beobachtung wie
des Interpretationsfokus anbieten mag. hier explizit in die Analyse mit einbezogen
Mit den in diesem Analyseschritt berech- wird. Bei der zeitunabhängigen Analyse oben
neten Größen oder Zusammenhangsmaßen konnte kein statistisch bedeutsamer Unter-
wird nunmehr ebenso verfahren wie mit den schied zwischen den beiden Gruppen nach-
Parametern im vorigen Abschnitt. Das mittle- gewiesen werden.
re Zusammenhangsmaß und die dyadenspe- Ein weiterer signifikanter Unterschied zwi-
zifische Abweichung hiervon werden schen den beiden Gruppen ergibt sich bei der
zunächst addiert und dann auf Verschieden- Autokontingenz der Mütter: Hier ist der Para-
heit von Null geprüft. Dabei ist allerdings zu meter für die Aka-Mütter signifikant kleiner
beachten, daß für diesen Test eine multivaria- als der Parameter der Ngandu-Mütter. Dies
te Prüfstatistik, «Hotelling’s T2» (z. B. in der könnte darauf hinweisen, daß die Ngandu-
SPSS-Prozedur MANOVA), verwendet werden Mütter sich in ihrem Verhalten seltener am
muß, da diese Daten nicht unabhängig von- Verhalten der Kinder orientieren als dies bei
einander sind (Wickens, 1993). den Aka-Müttern der Fall ist. Signifikant, aber
Führen wir die Analyse wie beschrieben nicht nochmals hier berichtet, sind zudem
durch, so ergeben sich die in Tabelle 7 darge- die Haupteffekte des Mutter- und Kindverhal-
stellten Ergebnisse. In der zweiten Spalte die- tens, die bereits bei der Analyse von Tabelle 3
ser Tabelle sind die Stichprobenmittelwerte kurz dargestellt wurden. Angemerkt sei
für die einzelnen Parameter wiedergegeben, zudem, daß die multivariaten Tests ebenfalls
grau unterlegte Zellen bedeuten dabei, daß signifikant waren und somit die Interpretati-
der Stichprobenmittelwert signifikant von on der univariaten Ergebnisse statistisch ab-
Null verschieden ist (α = .05). So läßt sich aus gesichert ist. Mit dieser Analyse haben wir ge-
der Tabelle z. B. ablesen, daß das Kindverhal- zeigt, wie wichtig es ist, ein tatsächlich auf
ten zum Zeitpunkt t im Stichprobenmittel die theoretischen Annahmen angepaßtes Mo-
einen signifikanten Einfluß auf das Mutter- dell zur statistischen Analyse zurückzugrei-
verhalten im folgenden Zeitpunkt hat, d. h., fen. Macht man Aussagen über die Beeinflus-
daß die Mutter auf das Weinen des Kindes sung eines Interaktionspartners durch einen
reagiert. Umgekehrt allerdings hat im Stich- anderen, dann ist es wesentlich, tatsächlich
probendurchschnitt das Mutterverhalten die zeitliche Struktur mit in diese Analyse
keine Vorhersagekraft für das nachfolgende einzubeziehen. Wir hoffen, daß hier deutlich
Verhalten des Kindes. wurde, daß die statistisch anspruchsvolle
In den nächsten beiden Spalten sind die Weiterverarbeitung von Beobachtungsdaten
Parameter-Mittelwerte für die beiden Grup- relativ einfach und konsequent möglich ist.
pen wiedergegeben und in der letzten Spalte Dieses Verfahren läßt sich, wie oben ange-
die Ergebnisse der univariaten F-Tests zur deutet, auf eine ganze Reihe von Situationen
Überprüfung der Unterschiede dieser Mittel- anwenden. Es wäre beispielsweise ebenfalls
werte. Bezogen auf den Zusammenhang zwi- möglich, die Prüfung der Übereinstimmung
schen dem Verhalten der Mutter und dem mehrerer Beobachter auf diese Weise durch-
nachfolgenden Verhalten des Kindes ergibt zuführen. Auf die Ähnlichkeit zwischen Da-
sich dabei ein bemerkenswerter Gruppenun- tensätzen aus Beobachtungsstudien und
terschied: Bei den Aka ist ein positiver, bei Längsschnittuntersuchungen haben wir
den Ngandu ein negativer Zusammenhang ebenfalls hingewiesen.
Beobachtungsmethoden und Auswertungsverfahren 259
Tabelle 7: Prüfung der Gruppenunterschiede zwischen Aka und Ngandu bei zeitabhängiger Analyse
Mittel Aka Ngandu Unterschied
(Stdv.) (Stdv.) (Stdv.) F (p)

Synchronität zum Zeitpunkt t sagt .302 .258 .343 3.89


Synchronität zum Zeitpunkt t+1 vorher (.142) (.160) (.111) (.056)
Synchronität zum Zeitpunkt t sagt .034 .010 .056 .95
das Kindverhalten zum Zeitpunkt t+1 vorher (.151) (.173) (.127) (.337)
Kindverhalten zum Zeitpunkt t sagt .187 .152 .220 2.28
Synchronität zum Zeitpunkt t+1 vorher (.145) (.132) (.153) (.139)
Synchronität zum Zeitpunkt t sagt .202 .215 .215 .44
das Mutterverhalten zum Zeitpunkt t+1 vorher (.117) (.104) (.130) (.511)
Mutterverhalten zum Zeitpunkt t sagt .194 .222 .168 1.29
Synchronität zum Zeitpunkt t+1 voraus (.153) (.162) (.142) (.262)
Synchronität zum Zeitpunkt t+1 .616 .616 .617 .00
(.168) (.164) (.176) (.976)
Synchronität zum Zeitpunkt t .600 .632 .570 1.25
(.179) (.168) (.188) (.271)
Kindverhalten zum Zeitpunkt t sagt .226 .204 .247 .98
Mutterverhalten zum Zeitpunkt t+1 vorher (.139) (.148) (.130) (.328)
Mutterverhalten zum Zeitpunkt t sagt .007 .078 –.061 5.63
Kindverhalten zum Zeitpunkt t+1 vorher (.197) (.203) (.170) (.023)
Autokontingenz des Kindverhaltens .416 .406 .425 .10
(.193) (.158) (.225) (.750)
Autokontingenz des Mutterverhaltens .587 .474 .694 15.01
(.211) (.177) (.186) (.000)

ment with provision for scaled disagreement or


Literatur partial credit. Psychological Bulletin, 70, 213–220.
Darwin, C. (1872). The expression of the emotions in man
and animals. Deutsche Übersetzung von J.V. Carus
Allison, P. D. & Liker. J. K. (1982). Analyzing sequenti- (1899): Der Ausdruck der Gemüthsbewegungen
al cetegorical data on dyadic interaction. A com- bei dem Menschen und den Thieren. Stuttgart.
ment on Gottman. Psychological Bulletin, 91, 393– Efron, D. (1941). Gesture and environment. New York.
403. Eibl-Eibesfeldt, I. (1995). Die Biologie des menschlichen
Bishop, Y. M. M., Fienberg, S. E, & Holland, P. W. Verhaltens. Grundriß der Humanethologie (3. Aufla-
(1975). Discrete multivariate analysis. Cambridge, ge). München: Piper.
MA: MIT Press. Ekman, P., & Friesen, W.V. (1978). The facial action co-
Birdwhistell, R. L. (1970). Kinesics and context. Philadel- ding system. Palo Alto, California: Consulting Psy-
phia: University of Philadelphia Press. chologist’s Press.
Borkenau, P. & Müller, B. (1992). Inferring act frequen- Elliot, G.C. (1988). Interpreting higher order effects in
cies and traits from behavior observations. Journal log-linear analysis. Psychological Bulletin, 103, 121–
of Personality, 60, 553–573. 130.
Budescu, D. V. (1984). Tests of lagged dominance in Faßnacht, G. (1995). Systematische Verhaltensbeobach-
sequential dyadic interaction. Psychological Bulle- tung. München: UTB Reinhard
tin, 96, 402–414. Feger, H. (1995). Planung und Bewertung von wissen-
Budescu, D. V. (1985). Analysis of dichotomous varia- schaftlichen Beobachtungen. In H. Feger & J. Bre-
bles in the presence of serial dependence. Psycholo- denkamp (Hrsg.), Enzyklopädie der Psychologie (The-
gical Bulletin, 97, 547–561. menbereich B, Serie I, Band 2, S. 1–75). Göttingen:
Bühler, C. (1927). Die ersten Verhaltensweisen des Hogrefe.
Kindes. Quellen und Studien zur Jugendkunde, Heft Gesell, A. (1928). Infancy and Human Growth. New
5. Jena: Fischer. York: McMillan.
Bühler, C. (1933). Ausdruckstheorie. Jena: Fischer. Gottman, J. M. & Bakeman, R. (1979). The sequential
Cohen, J. (1960). A coefficient of agreement for nomi- analysis of observational data. In M. E. Lamb, S. J.
nal scales. Educational and Psychological Measure- Suomi and G. R. Stephenson (Hrsg.), Social interac-
ment, 20, 37–46. tion analysis. Methodological issues. Madison, WI:
Cohen, J. (1968). Weighted kappa: Nominal scale agree- University of Wisconsin Press.
260 Methoden und Verfahren

Gottman, J. M. & Ringland, J. T. (1981). The analysis Sackett, G. P. (1987). Analysis of sequential social in-
of dominance and bidirectionality in social deve- teraction data: some issues, recent developments,
lopment. Child Development, 52, 393–412. and a causal inference model. In J. D. Osofsky
Gottman, J. M. (1979). Detecting cyclicity in social in- (Hrsg.), Handbook of infant development (2. Aufl.,
teractions. Psychological Bulletin, 86, 338–348. S. 855–878). New York: Wiley.
Graumann, C. F. (1966). Grundzüge der Verhaltensbe- Schmitz, B. (1990). Univariate and multivariate time-
obachtung. In E. Meyer (Hrsg.), Fernsehen in der series models: The analysis of intraindividual va-
Lehrerbildung (S. 86–107). München: Manz. riability and intraindividual relationships. In A.
Haberman, S.(1978). Analysis of qualitative data. Vol 1: von Eye (Hrsg.), Statistical methods in longitudinal
Introductory topics. New York: Academic Press. research, Vol II (S. 351–386). New York: Academic
Haberman, S.(1979). Analysis of qualitative data. Vol 2: Press.
New developments. New York: Academic. Schölmerich, A., Fracasso, M. P., Lamb, M. E., &
Hewlett, B. S. (1991). Intimate fathers: The nature and Broberg, A. G. (1995). Interactional harmony at 7
context of Aka Pygmy paternal infant care. Ann and 10 months of age predicts security of attach-
Arbor, MI: University of Michigan Press. ment as measured by Q-sort ratings. Social Deve-
Holodynski, M. (1991). Die Erfassung kindlicher Emo- lopment, 4, 62–74.
tionen. Zur Validierung eines holistischen, aus- Thiel, T. (1989). Der Einsatz von Video: eine erkennt-
drucksgestützten Emotionsratings (EMOS). In U. nistheoretische Analyse. In H. Keller (Hrsg.), Hand-
Schmidt-Denter (Hrsg.), Bericht über die 10. Tagung buch der Kleinkindforschung. Heidelberg: Springer.
Entwicklungspsychologie (S. 37). Köln. van Hooff, J. A. R. A. M. (1982). Categories and se-
Holt, D. (1979). Log-linear models for contingency quences of behavior: Methods of description and
table analysis. On the interpretation of parame- analysis. In K. R. Scherer & P. Ekman (Hrsg.),
ters. Sociological Methods & Research, 7, 330–336. Handbook of methods in nonverbal behavior research.
Isabella, R. A., Belsky, J., & von Eye, A. (1989). Origins Cambridge: Cambridge University Press.
of infant-mother attachment: an examination of Weick, K. E. (1968). Systematic observational methods.
interactional synchrony during the infant’s first In G. Lindzey & E. Aronson (Hrsg.), Handbook of
year. Developmental Psychology, 25(1),12–21. Social Psychology, Vol. 2 (S. 357–451). Reading,
Izard, C. E. (1979). The maximally discriminative facial Mass.: Addison-Wesley.
movement coding system (MAX). Newark, DE: Uni- Wickens, T. D. (1989). Multiway contingency tables ana-
versity of Delaware, Instructional Resources Cen- lysis for the social sciences. Hillsdale, N.J.: Erlbaum.
ter. Wickens, T. D. (1993). Analysis of contingency tables
Izard, C. E., & Dougherty, L. M. (1980). A system for with between-subjects variability. Psychological Bul-
identifying affect expressions by holistic judgements letin, 113, 191–204.
(AFFEX). Newark, DE: University of Delaware. Wolff, W. (1944). The expression of personality. New
Jaffe, J. & Feldstein, S. (1970). Rhythms of dialogue. New York.
York: Academic Press. Wundt, W. (1927). Völkerpsychologie. Leipzig: Barth.
Kaiser, S. (1990). Möglichkeiten und Grenzen der automa-
tischen Kodierung mimischen Verhaltens. Unveröf-
fentlichte Dissertation, Zürich.
Langeheine, R. (1980). Log-lineare Modelle zur multiva- Quellen für Kodier- und
riaten Analyse qualitativer Daten. München: Olden- Auswertungssysteme:
bourg.
Leyendecker, B., Lamb, M. E., Schölmerich, A. & Fra- Interact: Mangold Software Development
casso, M. P. (1995). The social worlds of 8- and 12- Pascal T. Mangold
month-old infants: Early experiences in two sub- Groschenweg 4, D–81825 München
cultural groups. Social Development, 4, 194–208. The Observer: Noldus Information Technology
Long, J. S. (1984). Estimable functions in log-linear P.O. Box 268
models. Sociological Methods & Research, 12, NL–6700 AG Wageningen
399–432. The Netherlands
Sackett, G. P. (Ed.) (1978). Observing behavior (Vol.2): Fax (31) 317-424496
Data collection and analysis methods (S. 79–98). www.diva.nl/noldus/
Baltimore: University Park Press. Camera: IEC Pro Gamma
Sackett, G. P. (1979). The lag sequential analysis of P.O. Box 841
contingency and cyclicity in behavioral interac- NL–9700 AV Groningen
tion research. In J. D. Osofsky (Hrsg.), Handbook of The Netherlands
infant development (S. 623–649). New York: Wiley. Fax (31) 050-636687
261
Kapitel III. 2:
Tagebücher, Gespräche und Erzählungen:
Zugänge zum Verstehen von Kindern
und Jugendlichen1
Siegfried Hoppe-Graff, Leipzig

Inhaltsverzeichnis
1. Einleitung . . . . . . . . . . . . . . . . . . . . . . . . . . . 262 6. Gespräche: Partiell standardisierte
Interviews . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 278
2. Ein Blick in die Psychologiegeschichte: 6.1 Exemplarische Studie: Damon & Hart (1988) 279
Tagebücher, spontane Sprachäußerungen 6.2 Durchführung und Aufzeichnung . . . . . . . 280
(Erzählungen) und Gespräche in den 6.3 Auswertung . . . . . . . . . . . . . . . . . . . . . . . . . 283
Anfängen der Entwicklungspsychologie . . . . . . 263
2.1 Historische Beobachtungen . . . . . . . . . . . . 263 7. Erzählungen . . . . . . . . . . . . . . . . . . . . . . . . . . 284
2.2 Schlußfolgerungen . . . . . . . . . . . . . . . . . . . 266 7.1 Exemplarische Studie:
Gilligan & Attanucci (1988) . . . . . . . . . . . . 285
3. Psychologiegeschichte, zweiter Teil: 7.2 Durchführung und Aufzeichnung . . . . . . . 286
Die Rückkehr von Tagebüchern, Gesprächen 7.3 Auswertung . . . . . . . . . . . . . . . . . . . . . . . . . 287
und Erzählungen in das Beobachtungsrepertoire
der Entwicklungspsychologie . . . . . . . . . . . . . . 267 8. Stärken und Schwächen der Verfahren . . . . 288

4. Erstes Resümee: Das Verhältnis von Methoden 9. Zweites Resümee und Ausblick: Das Netz
zum Gegenstand, den Zielen und den Theorien des Ichthyologen, das Beobachtungsideal
in der Entwicklungspsychologie . . . . . . . . . . . . 271 der Naturwissenschaften und Datenerhebung
in der Entwicklungspsychologie . . . . . . . . . . . . 291
5. Tagebuchaufzeichnungen . . . . . . . . . . . . . . . 271
5.1 Exemplarische Studie: Mendelson (1990) . 272 Literatur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 292
5.2 Durchführung und Aufzeichnung . . . . . . . 274
5.3 Auswertung . . . . . . . . . . . . . . . . . . . . . . . . 277

1 Ich danke Irma Engel für wertvolle Hilfen bei der Erstellung des Manuskriptes.
262 Methoden und Verfahren

1. Einleitung derer Qualität sind oder nicht zu den Zielen,


Fragestellungen und Theorien passen, auf die
Die Entwicklungspsychologie hat zum Ziel, sie bezogen werden. Für Gespräche (Inter-
Veränderungen im Erleben und Handeln views), vor allem aber für das Aufzeichnen
während des menschlichen Lebens zu erken- von Tagebüchern und das Protokollieren von
nen, zu beschreiben, zu erklären und zu ver- Erzählungen und anderen alltäglichen
stehen. Die Konstruktion und Verfeinerung Sprachäußerungen gilt in besonderem Maße,
wissenschaftlicher Methoden stellt hingegen daß sie erst in den letzten Jahren an Gewicht
kein eigenständiges Ziel entwicklungspsycho- gewonnen haben. Wir werden im übernäch-
logischer Forschung dar. Gleichwohl sind sten Abschnitt nach Gründen für diesen Pro-
Methoden für den Forscher ein unverzichtba- zeß suchen. Zuvor aber soll in Abschnitt 2
res Hilfsmittel auf dem Wege zu einem aufgezeigt werden, daß die aktuelle Hinwen-
immer tieferen und differenzierteren Ver- dung zu diesen Methoden eine Renaissance
ständnis der psychischen Entwicklung. For- darstellt, denn sie waren in einer früheren
schungsmethoden werden im allgemeinen in Phase der Entwicklungspsychologie schon
empirische und nicht-empirische Methoden einmal von großer Bedeutung, haben dann
eingeteilt. Empirischer Methoden bedient aber an Reputation verloren, weil sie nicht
sich der Forscher, wenn er Untersuchungen mehr zu einem sich wandelnden Begriff von
durchführt, um durch Beobachtung neue Er- akzeptablen Daten paßten. Wir werden die-
gebnisse zu gewinnen oder um theoretische sen Prozeß nachzeichnen und dann ein erstes
Sätze oder Behauptungen zu prüfen. Die Resümee zum Zusammenhang der For-
nicht-empirischen Methoden beschreiben schungsmethoden mit dem Gegenstand, den
hauptsächlich die Regeln wissenschaftlichen Zielen und den Theorien der Entwicklungs-
Denkens und Argumentierens. Innerhalb der psychologie ziehen (Abschnitt 4).
empirischen Methoden unterscheidet man Tagebücher, Gespräche und Erzählungen
abermals Methoden der Beobachtung oder mögen auf den ersten Blick als so verschie-
Datenerhebung von Methoden der Auswer- den erscheinen, daß man sich fragt, warum
tung oder Datenverarbeitung. Dieses Kapitel sie in ein und demselben Kapitel behandelt
befaßt sich mit ausgewählten Beobachtungs- werden. Die Gemeinsamkeiten werden im
verfahren: mit der Gewinnung von entwick- Laufe der Darstellung hervortreten. Die Be-
lungspsychologisch bedeutsamen Informatio- sonderheiten eines jeden Verfahrens sind der
nen aus Tagebüchern, aus Gesprächen und Grund dafür, daß wir sie in den Abschnitten
aus spontanen Sprachäußerungen im Alltag 5 bis 7 einzeln vorstellen. Wir werden jede
(insbesondere aus Erzählungen). Wie der Titel Methode zunächst an einem Untersuchungs-
anzeigt, ist die Darstellung auf die Anwen- beispiel veranschaulichen. Das Beispiel ist je-
dung dieser Methoden im Kindes- und weils so gewählt, daß es für das typische Vor-
Jugendalter beschränkt, doch kann angenom- gehen und für die typischen Probleme, aber
men werden, daß sie auch zur Erforschung auch für Wege zur Überwindung dieser Pro-
der Entwicklung im Erwachsenenalter und bleme besonders informativ ist. Die Verwen-
höheren Lebensalter genutzt werden können. dung von Erzählungen wird ausdrücklich
Bis vor kurzem hat sich das methodische nicht an einer Fragestellung zur Sprachent-
Interesse in der Psychologie auf Auswertungs- wicklung demonstriert, weil wir zeigen
methoden, vornehmlich auf Verfahren der möchten, daß die Relevanz dieser Daten über
statistischen Datenanalyse, gerichtet. Metho- das Nachzeichnen des Spracherwerbs hinaus-
den zur Gewinnung von Daten führten dage- geht. Es wird deutlich werden, daß die darge-
gen ein Schattendasein. Dieses Kapitel steht stellten Beobachtungsverfahren – wie alle
für den Wandel im Bewußtsein vieler Ent- psychologischen Methoden! – ihre spezifi-
wicklungspsychologen: Es wird immer deutli- schen Stärken und Schwächen haben (Ab-
cher, daß die diffizilsten und komplexesten schnitt 8). Diese Vorzüge und Nachteile sind
mathematischen Analyseverfahren nicht aber immer relativ zu den Zielen und Voran-
mehr sind als Glasperlenspielereien, wenn sie nahmen des Forschers. In einem abschließen-
auf Daten angewendet werden, die von min- den zweiten Resümee (Abschnitt 9) werden
Tagebücher, Gespräche und Erzählungen 263
wir nochmals auf die Frage zurückkommen, am ehesten die Veröffentlichung des Buches
wie man sich den Zusammenhang zwischen «Die Seele des Kindes» durch Wilhelm Preyer
den Methoden der Datenerhebung und den im Jahre 1882 in Frage. Der Autor griff in die-
substantiellen Zielen und Theorien der Ent- sem Werk vor allem auf eine Datenquelle
wicklungspsychologie vorzustellen hat, und zurück: auf akribisch geführte Tagebuchauf-
wir werden für Methodenpluralität plädieren. zeichnungen, die er von der Entwicklung sei-
Der Begriff Verstehen im Titel bedarf der Er- nes Sohnes angelegt hatte. Die Beobachtun-
läuterung, denn er wird dort mit mehrfacher gen begannen mit der Geburt und wurden
Bedeutung gebraucht. Zum einen bezeichnet bis zum Ende des dritten Jahres Tag für Tag
er ein Ziel der Entwicklungspsychologie. Je- fortgesetzt (s. auch Hoppe-Graff, 1989b).
doch verwenden wir Verstehen nicht im Preyer war von Haus aus Physiologe – deshalb
Sinne eines Gegensatzes zum Beschreiben räumte er den körperlichen Funktionen, ins-
und Erklären. Vielmehr schließt das Verste- besondere der Entwicklung der Bewegungen,
hen das Beschreiben und Erklären ein, geht breiten Raum ein. Seine Methode der Tage-
aber insbesondere dann darüber hinaus, buchaufzeichnung fand in den folgenden
wenn es um das Ziel geht, die Entwicklung Jahren vor allem in Amerika große Verbrei-
der individuellen Persönlichkeit nachzuzeich- tung (vgl. Stern, 1967, S. 5).
nen. Und Gespräche, alltägliche Sprachäuße- Während Preyers Veröffentlichung eher als
rungen (wie etwa Erzählungen von Kindern) historisches Datum von Interesse ist, erschien
und Tagebücher weisen, neben weiteren Vor- 1914 eine weitere Gesamtdarstellung der Ent-
zügen, die besondere Qualität auf, daß sie wicklung im Kindesalter, die sowohl in theo-
wertvolle Informationen zum Verständnis retischer Hinsicht als auch bezüglich der
des Einzelfalls enthalten. Zum anderen aber Qualität der Beobachtungen für lange Zeit in
soll mit dem Begriff Verstehen auch zum Aus- der deutschsprachigen Entwicklungspsycho-
druck gebracht werden, daß diese Methoden logie Maßstäbe gesetzt hat: William Sterns
besonders angemessen sind, um einen be- «Psychologie der frühen Kindheit bis zum sech-
stimmten Bereich der psychischen Entwick- sten Lebensjahr». Bis in die fünfziger und sech-
lung des Kindes oder Jugendlichen zu erfas- ziger Jahre ist dieses Werk aus gutem Grund
sen: die Entwicklung des Verstehens der Welt. als Lehrbuch der Entwicklungspsychologie
Piaget (1988 / 1926) hat dafür den Begriff des verwendet worden (Nachdruck der 9. Aufla-
«Weltbildes» geprägt: Es geht um die Art und ge: 1967). Es behandelt in kohärenter Darstel-
Weise, wie die Heranwachsenden der Welt, in lung unter anderem die Entwicklung der
der sie leben, «Sinn verleihen» und ihre Er- Sprache, des Denkens und der Intelligenz, «des
fahrungen und Erlebnisse mit «Bedeutungen» Gedächtnisses und der Übung», «des Trieb-,
versehen (vgl. dazu Abschnitt 2.1). Gemüts- und Willenslebens» und des Spielens
und der Phantasie. Das hohe Maß an theoreti-
scher Reflexion ergibt sich vor allem aus Sterns
2. Ein Blick in die Psycholo- Rückbindung seiner Entwicklungspsychologie
an eine philosophisch fundierte Auffassung
giegeschichte: Tagebücher, der menschlichen Persönlichkeit, von ihm als
spontane Sprachäußerungen «kritischer Personalismus» bezeichnet (s. hier-
zu Stern, 1906; 1930; s. auch Deutsch, 1991).
(Erzählungen) und Was den Reichtum, die Vielfalt und die An-
Gespräche in den Anfängen schaulichkeit der Beobachtungen angeht, so
der Entwicklungspsychologie kann William Stern aus einer nahezu uner-
meßlichen Quelle schöpfen, die er selbst gegra-
ben hat. Zusammen mit seiner Frau Clara hat
2.1 Historische Beobachtungen er über die Entwicklung ihrer drei Kinder
Hilde, Günter und Eva im Zeitraum von 1900
Will man die Entstehung der wissenschaftli- bis 1918 Tagebuch geführt.
chen Entwicklungspsychologie auf ein einzel- Zwischen der Theorie des kritischen Perso-
nes Geschehnis beziehen, so kommt dafür nalismus und der Beobachtungsmethode der
264 Methoden und Verfahren

Tagebuchaufzeichnung gibt es für Stern einen spräche mit Kindern: Untersuchungen zur Sozial-
immanenten Zusammenhang, denn ein psychologie und Pädagogik» (1928) dokumen-
Grundprinzip des Personalismus lautet: «Alle tiert insgesamt 154 dieser Dialoge und ent-
Trennungen innerhalb der Persönlichkeit hält daneben die entwicklungs- und sozial-
sind nur relativ, nur Abstraktionen ...; alle psychologische Interpretation («Diskussion»)
Teilentwicklungen einzelner Funktionen sind eines jeden Dialogs sowie allgemeine Schluß-
stets getragen von der persönlichen Gesamt- folgerungen, etwa über «die Metaphysik der
entwicklung.» (1967, S. 27). Wie aber ließe kindlichen Welt» oder «die Wunschwelt des
sich dieser Gesamtzusammenhang besser Kindes».
berücksichtigen als durch die kontinuierliche Anders als bei den Sterns, die die
Beobachtung und Protokollierung der Verän- Sprachäußerungen ihrer Kinder vorrangig
derungen in allen Funktionsbereichen und zum Studium der Sprachentwicklung heran-
der Gesamtpersönlichkeit? gezogen haben (Stern & Stern, 1907), richtet
Prädestiniert zur Durchführung dieser Be- sich die Aufmerksamkeit von David und Rosa
obachtungen sind theoretisch geschulte und Katz nicht auf die Erforschung der Kinderspra-
mit dem Kind vertraute Personen, also etwa che. Sie betrachten Gespräche als Zugang zu
Entwicklungspsychologen, die ihre eigenen anderen Funktionsbereichen, etwa dem Den-
Kinder beobachten. Die Verbindung von ken, Wünschen, Träumen und Fühlen. Aus-
theoretischem Wissen und Vertrautheit mit drücklich weisen sie darauf hin, daß die Ge-
den individuellen Eigenheiten und der Le- spräche mit ihren Kindern alles andere sind
benswelt des Kindes gibt ihnen ein besonde- als gezielte Befragungen:
res Maß an Kompetenz, um Entwicklungs-
«Am nächsten kommt man dem Charakter
prozesse zu erkennen, zu deuten und einzu-
der meisten hier mitgeteilten Gespräche,
ordnen.
wenn man sie als Plaudereien bezeich-
Weil er dem ganzheitlichen Ansatz des kri-
net. Wir haben nie mit den Kindern im er-
tischen Personalismus verpflichtet ist, ist die
habenen Stil gesprochen, sondern be-
Tagebuchaufzeichnung für Stern folgerichtig
mühten uns, die Unterhaltung immer so
eine bevorzugte Form der Datenerhebung,
schlicht und natürlich zu führen, wie es
aber sie ist nicht die einzige. In seinem Lehr-
die jeweilige Situation nur zuließ. Nie
buch plädiert er nachdrücklich für Metho-
war unsere Belehrung aufdringlich. Unse-
denpluralismus. Als weitere legitime Wege
re Antworten auf Fragen der Kinder oder
zur Gewinnung von Beobachtungen nennt er
die uns nötig erscheinenden eignen Fra-
etwa die experimentellen Methoden und in-
gen waren der jeweils gegebenen Lage
direkte Zugangsweisen, wie beispielsweise
so weit als möglich angepaßt.» (1928,
Kindheitserinnerungen von Erwachsenen.
S. 5).
Auch wenn sich William Stern bei seiner
Lehrbuchdarstellung primär auf die eigenen
Tagebücher stützte, so konnte er daneben Tagebücher bilden auch das «Ausgangsmate-
auch auf Tagebuchaufzeichnungen anderer rial» für Charlotte Bühlers «Das Seelenleben
Forscher zurückgreifen. Beispielsweise hatte des Jugendlichen», eine 1921 erstmals erschie-
auch das Ehepaar Scupin (1907, 1910) über nene Entwicklungspsychologie des Jugendal-
die Entwicklung ihres Sohnes Bubi Tagebuch ters (Nachdruck 1991), die von Oerter (1991,
geführt, und für spätere Auflagen seines Lehr- S. 3) als «ein historischer Meilenstein in der
buchs standen ihm auch die Tagebücher des Forschungsgeschichte der Entwicklung des
Ehepaars Katz zur Verfügung. Jugendalters» bezeichnet wird. Aber hier geht
Die von David und Rosa Katz geführten es um einen anderen Typus von Tagebüchern
Tagebücher unterscheiden sich deutlich von als bei den Sterns, den Scupins oder den
den Aufzeichnungen der Sterns, denn sie Katz’: Nicht der Forscher hat seine Beobach-
haben sich von vornherein auf die Protokol- tungen in Form von Tagebuchaufzeichnun-
lierung von Gesprächen beschränkt, die sie gen notiert, sondern Jugendliche selbst haben
mit ihren Kindern Wilhelm Theodor und Ju- das Tagebuch geschrieben. Es handelt sich
lius Gregor geführt haben. Ihr Buch «Ge- also eher um Selbstauskünfte in Form von Be-
Tagebücher, Gespräche und Erzählungen 265
richten über Befindlichkeiten, Erzählungen «Ich vertrete die Auffassung, daß derarti-
über Gegebenheiten, Reflexionen über das ge qualitative Aufzeichnungen nicht nur
Selbst. Bühler standen immerhin 76 derartige eine wesentliche Vorbedingung für erfolg-
«Jugendtagebücher» zur Verfügung, die in der reiches Experimentieren in der Entwick-
Regel über den Zeitraum von mehreren Jah- lungspsychologie darstellen. Sie werden
ren geführt worden waren. Sie war sich sogar dann einen unverzichtbaren Hinter-
durchaus der methodischen Probleme be- grund und ein Korrektiv darstellen, wenn
wußt, die auftreten, wenn man diese «literari- die experimentelle Technik perfektio-
schen Produktionen» als Forscher nutzt, um niert worden ist. Ohne eine solche Hin-
Schlußfolgerungen über die Entwicklung zu tergrundinformation über das gesamte
ziehen. Sie betont aber die Vorzüge mit Argu- Spektrum der Verhaltensweisen von Kin-
menten, die an Stern erinnern. So verweist dern in ganzheitlichen Situationen wird
sie etwa darauf, daß das vom Jugendlichen diese oder jene Reaktion auf eine be-
geschriebene Tagebuch grenzte experimentelle Aufgabe nicht
mehr sein als sterile und irreführende Ar-
«... durch Jahre hindurch uns das Leben
tefakte.» (1967, S. 4 [Übersetzung des
eines jungen Menschen begleiten läßt
Autors])
und ihn nicht nur in mißverständlichen
Einzeläußerungen, sondern von vielen
Obwohl Jean Piaget wahrscheinlich als der
Seiten her kennen lehrt. Dies ist der
berühmteste und einflußreichste Entwick-
große Vorzug des Tagebuchs vor einzel-
lungspsychologe gelten darf, ist wenig be-
nen Beobachtungen oder Experimenten.
kannt geworden, daß auch er Tagebücher ge-
Es ist ein Entwicklungsbuch. Es zeigt uns
führt hat. Seine sog. Säuglingsmonographien,
neben den direkt dargestellten Einzelhei-
die in den dreißiger und vierziger Jahren er-
ten Entwicklungstatsachen und eine Ent-
schienenen Bände «Das Erwachen der Intelli-
wicklungsrichtung.» (1991, S. 51).
genz beim Kinde» (1969a / 1936), «Der Aufbau
der Wirklichkeit beim Kinde» (1972a / 1937)
Und abermals wird hervorgehoben, daß nur und «Nachahmung, Spiel und Traum» (1969b /
theoretische Kenntnisse, die der Forscher als 1945), beruhen auf detaillierten Tagebüchern,
Leser des Tagebuchs hat, die Entwicklungstat- die Piaget über die Entwicklung seiner drei
sachen und die Entwicklungsrichtung deut- Kinder Jacqueline, Laurent und Lucienne in
lich werden lassen. Und schließlich finden den ersten beiden Lebensjahren angelegt hat.
wir auch bei Charlotte Bühler ein Plädoyer In die genannten Publikationen hat er eine
für Methodenpluralismus, also die Verwen- Vielzahl von diesen Beobachtungen eingear-
dung vielfältiger Wege der Datenerhebung beitet. Die Tagebücher selbst hat er unseres
(s. op. cit., S. 52). Wissens nie der Fachöffentlichkeit zugäng-
Im deutschsprachigen Raum nahezu unbe- lich gemacht, so daß sich nicht nachvollzie-
kannt geblieben sind die Tagebuchaufzeich- hen läßt, inwieweit die in die Säuglingsmo-
nungen von Susan Isaacs, die sie in der Zeit nographien übernommenen Beobachtungen
von 1924–1927 als Erzieherin in einem Kin- eine repräsentative Auswahl darstellen oder
derheim angelegt und in den beiden Bänden nur unter dem Gesichtspunkt der Illustration
«Intellectual growth in the young child» (1930) von Phänomenen ausgewählt worden sind
und «Social development in young children» (s. hierzu ausführlich Gratch & Schatz, 1987).
(1967/1933) publiziert hat. Es ist eine erstaun- Bevor Piaget die Tagebuchaufzeichnungen
liche Konvergenz, daß auch Isaacs, eine psy- zu seinen eigenen Kindern anlegte, hatte er
choanalytisch geschulte und orientierte Ent- in seinem «Frühwerk», den schon in den
wicklungspsychologin, erstens ähnliche Grün- zwanziger Jahren veröffentlichten Studien
de für die Bevorzugung von Tagebuchauf- «Sprechen und Denken des Kindes» (1972b /
zeichnungen anführt wie Stern und Bühler 1923), «Urteil und Denkprozeß des Kindes»
und zweitens ebenfalls die Notwendigkeit (1972c / 1924) und «Das Weltbild des Kindes»
sieht, diesen Zugang zur Entwicklung des Kin- (1988 / 1926), die Beobachtung und Protokol-
des durch andere Methoden zu ergänzen: lierung von Sprachäußerungen als Zugang
266 Methoden und Verfahren

zur Psychologie des Kindes bevorzugt. Die stimmte Form von erkundendem Gespräch,
beiden erstgenannten Werke, in denen es um die er klinisches Interview oder klinische Unter-
die formalen Merkmale des Denkens und der suchung nennt. Diese Bezeichnung soll auf
Sprache geht, basieren auf der Untersuchung Ähnlichkeiten des Gesprächs, das der For-
von spontanen Sprachäußerungen im Alltag. scher mit dem Kind führt, mit dem Gespräch
Zwei Mitarbeiterinnen Piagets beobachteten zwischen Psychiater und Patient hinweisen.
je ein Kind einen Monat lang vormittags in Das klinische Interview besteht nicht aus
der Vorschule und notierten genau, was das einer schematischen, stereotypen Abfolge
Kind sagte und in welchem Zusammenhang von Fragen, sondern muß vom Interviewer
das geschah. Der Rahmen der Vorschule, so theoriegeleitet den jeweiligen Äußerungen
meinte Piaget, gebe den Kindern jede Gele- des Kindes angepaßt werden. Wir führen für
genheit, miteinander zu spielen oder zu spre- diese Form des Gespräches eines Forschers
chen, wenn sie Lust dazu hätten. mit dem Heranwachsenden die Bezeichnung
Auf der Grundlage dieses Beobachtungs- «partiell standardisiertes Interview» ein (s. aus-
materials hat Piaget weitreichende, allgemein führlich Abschnitt 6).
bekannte Schlußfolgerungen gezogen. Unter-
scheidet man etwa zwischen der egozentri-
schen und der sozialisierten Funktion der
Sprache, so ist nach seinen Beobachtungen 2.2 Schlußfolgerungen
ein großer Teil der Äußerungen des Kindes
egozentrisch: «Diese Sprache ist zunächst ein- Obwohl mit diesem kurzen Ausflug in die
mal egozentrisch, weil das Kind nur von sich Psychologiegeschichte keinesfalls der An-
erzählt, vor allem aber, weil es nicht versucht, spruch verbunden sein kann, ein vollständi-
auf den Standpunkt des Zuhörers einzuge- ges oder repräsentatives Bild der entwick-
hen. ...» (1972b, S. 21). Man muß präzisieren, lungspsychologischen Erhebungsmethodik in
daß Piaget darin vor allem einen kognitiven den ersten Jahrzehnten dieses Jahrhunderts
und erst sekundär einen kommunikativen zu zeichnen, so wird doch deutlich, daß Tage-
Mangel sieht: Egozentrismus ist die Unfähig- buchaufzeichnungen, spontane Sprachäuße-
keit, sich in den Standpunkt eines anderen rungen und erkundende Gespräche als Da-
hineinzuversetzen und zu verstehen, daß des- tenquellen in der Frühphase der Entwick-
sen Sichtweise der Dinge von der eigenen ab- lungspsychologie eine bedeutsame Rolle ge-
weicht. Wir wissen heute, daß sich Piagets spielt haben. Bedeutsam waren sie, weil sie
These der Dominanz egozentrischer Äuße- relativ verbreitet waren und weil sie bei der
rungen nicht aufrechterhalten läßt und daß Gewinnung grundlegender Erkenntnisse ge-
er offensichtlich auch durch die Besonderhei- nutzt worden sind, etwa als Datenbasis für
ten seiner Beobachtungsmethode in die Irre Piagets epochale Theorie der geistigen Ent-
geführt worden ist. Übersehen wird aber häu- wicklung. Die historische Reminiszenz hat
fig, daß das Ehepaar Katz in dem oben ge- aber auch gezeigt, daß diese drei Verfahren
nannten Buch schon 1928 aufgrund der Aus- nicht immer deutlich zu trennen sind und
wertung der Gespräche von Kindern mit El- häufig miteinander verbunden werden, und
tern die «Egozentrismusthese» zurückgewie- sei es auch nur in der Person des Forschers.
sen hatte: «Wir gehen so weit, zu behaupten, Wir haben gesehen, daß Piaget nacheinander
daß die Äußerungen, die ein Kind in Anwe- auf die Protokollierung von spontanen Äuße-
senheit der Eltern hören läßt, so gut wie nie rungen im Alltag, das partiell standardisierte
egozentrischen Charakter tragen ...» (S. 4). Interview und die Tagebuchaufzeichnung
In «Das Weltbild des Kindes» hat sich Piaget zurückgegriffen hat, je nachdem, welchen
den Inhalten des Denkens und Sprechens zu- Zugang zum Kind das aktuelle For-
gewandt, und er hat – aus seiner Sicht: schungsthema erforderte. Das Ehepaar Stern
zwangsläufig – das Beobachtungsverfahren hat in seinen Tagebüchern eine Vielzahl von
ändern müssen. Er beobachtet nun nicht kindlichen Erzählungen und von erkunden-
mehr die spontanen Sprachäußerungen von den Gesprächen notiert (s. Behrens &
Kindern, sondern führt mit ihnen eine be- Deutsch, 1991), und die Tagebücher des Ehe-
Tagebücher, Gespräche und Erzählungen 267
paars Katz bestehen sogar aus nichts anderem genüber dem Experiment plädieren alle
als spontanen Gesprächen. genannten Forscher für Methodenvielfalt.
Im Rückblick springen mehrere Gemein- Teilweise praktizieren sie diesen Pluralis-
samkeiten ins Auge, die Stern, Katz, Bühler mus sogar in der eigenen Forschung,
und Isaacs (und mit Abstrichen auch Piaget) indem sie je nach Fragestellung verschie-
miteinander teilen: dene Methoden präferieren. William Stern
und Jean Piaget lassen sich als glänzende
1. Sie gehen davon aus, daß die Reduzierung Beispiele anführen; wir werden im näch-
der Datenerhebung auf das Experimentie- sten Abschnitt sehen, daß dieser Metho-
ren dem Ziel und dem Gegenstand der denpluralismus später verlorengegangen
Entwicklungspsychologie nicht gerecht ist und erst in den letzten Jahren in An-
wird. Unter dem Experimentieren verste- sätzen wiederkehrt.
hen sie dabei einen Zugang zu psycholo-
gischen Daten, der zwangsläufig zu einer
sehr starken Einengung des Untersu- 3. Psychologiegeschichte,
chungsgegenstands führt, etwa der Be-
schränkung auf eine einzelne, isolierte zweiter Teil: Die Rückkehr
Sprach-, Wahrnehmungs- oder Gedächt- von Tagebüchern,
nisleistung, und bei dem ein künstlicher
oder wenigstens ein reduzierter Beobach-
Gesprächen und Erzählun-
tungsrahmen geschaffen wird. «Redu- gen in das Beobachtungs-
ziert» oder «künstlich» ist die Beobach- repertoire der Entwick-
tungssituation im Vergleich zur alltägli-
chen Lebens- und Erfahrungswelt.
lungspsychologie
2. Deshalb bevorzugen die genannten Auto-
ren die Beobachtung von Sprachäußerun- In den letzten Jahren ist zu beobachten, daß
gen in Alltagssituationen, insbesondere in Tagebücher, klinische Interviews und Erzäh-
Verbindung mit der Protokollierung in lungen in das Methodenrepertoire der Ent-
einem umfassenden Tagebuch, das über wicklungspsychologie zurückkehren. Der Be-
einen längeren Zeitraum geschrieben griff Rückkehr schließt ein, daß sie zwi-
wird. schenzeitlich verschwunden waren.
3. Die Präferenz für Beobachtungen von Es besteht in der Geschichtsschreibung der
Spontanäußerungen, die relative Gering- Psychologie Einigkeit darüber, daß die ameri-
schätzung von experimenteller Kontrolle kanische Psychologie von den zwanziger bis
und der Blick auf die Gesamtpersönlich- zu den sechziger Jahren vom Behaviorismus
keit des Kindes durch die Auswahl ent- dominiert worden ist (s. z. B. Gardner, 1985;
sprechender Datenerhebungstechniken Zimbardo, 1995). Das galt auch weitgehend
sind theoretisch begründet. Am deutlich- für die Entwicklungspsychologie, denn die ab
sten wird dieser Zusammenhang bei Wil- etwa 1925 in Amerika entstehende «Kinder-
liam Stern in Form des kritischen Perso- psychologie» war, wie Höhn (1959, S. 35) ver-
nalismus, jedoch ist er auch bei Katz, merkt, «gar nicht im eigentlichen Sinne Ent-
Bühler und Isaacs sichtbar. Das bedeutet wicklungspsychologie, sondern will prakti-
aber auch, daß die höhere Wertschätzung sche Hilfe für die Erziehung des Kindes
der genannten Methoden nicht dadurch geben.» Der Behaviorismus ist dann vor
erklärt werden kann, daß zu der damali- allem durch die Kognitive Psychologie ab-
gen Zeit die experimentelle Untersu- gelöst worden – man spricht deshalb auch
chungsmethodik noch nicht so ausgefeilt von der «kognitiven Wende». Diese Wende
war wie heute. bedeutete, die Annahme zu akzeptieren, daß
4. Trotz der eindeutigen Präferenz für die Be- Menschen über geistige Inhalte, Strukturen
obachtung möglichst vielfältiger Verhal- und Prozesse verfügen und daß es eine sinn-
tensweisen des Kindes im natürlichen volle Aufgabe ist, diese zum primären For-
Kontext und trotz der Reserviertheit ge- schungsgegenstand der Psychologie zu ma-
268 Methoden und Verfahren

chen. Der Behaviorismus hatte Kognitionen «unwissenschaftlich». «Erlaubt» waren nun-


allenfalls als unvermeidbare Hilfskonstruktio- mehr nur noch objektive Beobachtungen des
nen (zum Beispiel als «intervenierende Varia- «offenen» Verhaltens («overt behavior»). Diese
blen») bei der Untersuchung von Reiz-Reakti- für die Methodologie der Psychologie so fol-
ons-Beziehungen angesehen, nicht aber als genreichen Normsetzungen möchten wir als
genuines Forschungsthema. Es dürfte sich methodologischen Behaviorismus bezeichnen.
erst im historischen Rückblick ausmachen Wie bei allen «großen» und «fundamenta-
lassen, ob der «kognitiven Wende» inzwi- len» Programmen muß man die Programma-
schen eine weitere grundlegende Zäsur in der tik von der Realisierung trennen. In der Reali-
Psychologie gefolgt ist. Es gibt jedenfalls in sierung hat der Behaviorismus zwar die Psy-
den letzten 10 bis 15 Jahren in der angelsäch- chologie für Jahrzehnte dominiert, zunächst
sischen Literatur eine Reihe von neuen Per- in den USA und England, später in Deutsch-
spektiven und Themen, durch die das Feld land. Aber es sind immer Nischen für Alter-
der Psychologie wesentlich heterogener ge- nativen vorhanden gewesen. Bartletts Ge-
worden ist, als es vor etwa 20 bis 30 Jahren dächtnispsychologie und Piagets kognitive
war. Zu ihnen gehört auch eine Neuorientie- Entwicklungspsychologie mögen als Beispiele
rung und Neubewertung von Datenerhe- dienen. Auch innerhalb des Behaviorismus
bungsverfahren. ist – im Laufe der Zeit zunehmend mehr –
Am radikalsten und einflußreichsten ist nichts so heiß gegessen worden, wie es ge-
das Programm des Behaviorismus von James kocht worden war. Manche der Behaviori-
Watson in dem Aufsatz «Psychologie, wie sie sten, beispielsweise Tolman, haben sowohl
der Behaviorist sieht» propagiert worden. bei der Konzeptualisierung des Gegenstands
Darin formulierte er unter anderem das fol- als auch in der empirischen Forschung de
gende methodologische Credo, an dem sich facto die Existenz von inneren Prozessen und
Generationen von Psychologen mehr oder deren Beobachtung zugelassen.
weniger orientierten: Für unsere historische Rekonstruktion
bleibt aber die wesentliche Konsequenz beste-
«Psychologie, wie sie der Behaviorist hen, daß in diesem Klima der engen Orientie-
sieht, ist ein vollkommen objektiver, ex- rung am Ideal der Naturwissenschaften für
perimenteller Zweig der Naturwissen- alltägliche Beobachtungen von inneren Pro-
schaft. Ihr theoretisches Ziel ist die Vor- zessen, wie sie bei Tagebuchaufzeichnungen,
hersage und Kontrolle von Verhalten. In- Interviews und Protokollen alltäglicher
trospektion spielt keine wesentliche Sprachäußerungen angezielt worden waren,
Rolle in ihren Methoden, und auch der wenig Raum bestand.
wissenschaftliche Wert ihrer Daten hängt Nach dem Ende des zweiten Weltkriegs
nicht davon ab, inwieweit sie sich zu hatte die bundesdeutsche Psychologie mit ei-
einer Interpretation in Bewußtseinsbe- niger Verzögerung den Denkansatz des Beha-
griffen eignen.» (1968/1913, S. 13) viorismus weitgehend unkritisch übernom-
men und war ihm vor allem in den sechziger
Watsons «behavioristisches Manifest» hatte und siebziger Jahren gefolgt, also noch zu
weitreichende Folgen (s. ausführlich Gardner, jener Zeit, als sich in der angelsächsischen
1985, Teil II). Es stellte die Gegenstandsbe- Psychologie die kognitive Wende längst voll-
stimmung (und mithin das Selbstverständnis) zogen hatte. Selbst wenn die Dominanz des
der Psychologie auf den Kopf. Nicht mehr behavioristischen Denkens in der Entwick-
Empfindungen, Gedanken und Absichten lungspsychologie nie ganz so weit ging wie
waren der legitime Gegenstand, sondern nur in anderen psychologischen Teilgebieten, so
noch das Verhalten. Mehr noch: Einherge- hat sich doch zunächst die amerikanische
hend mit der Neudefinition des Gegenstands und nach dem zweiten Weltkrieg auch die
wurde auch das Arsenal zulässiger wissen- deutsche Entwicklungspsychologie stark an
schaftlicher Methoden völlig neu bestückt. den Idealen des Behaviorismus orientiert.
Beschreibungen und Erklärungen von Be- Aus der Sicht dieser Methodenideale galt
wußtseinszuständen galten von nun an als besonders die Tagebuchaufzeichnung als
Tagebücher, Gespräche und Erzählungen 269
nicht objektiv und deshalb höchst «unwis- tungen in Tagebuchform in die Entwicklungs-
senschaftlich». Derartige Beobachtungen wer- psychologie. Es ist kein Zufall, daß in diesem
den in der Regel von nur einer Person vorge- Projekt die Sprachäußerungen von drei Kindern
nommen, ohne daß kontrolliert wird, ob ein möglichst vollständig aufgezeichnet wurden,
anderer Beobachter zu denselben Aufzeich- um den Verlauf der Sprachentwicklung zu be-
nungen gekommen wäre, was im Sinne der schreiben, denn die Mehrzahl der «neuen Ta-
klassischen Objektivitätsdefinition der Natur- gebuchstudien» hat den Spracherwerb zum
wissenschaft aber unbedingt erforderlich ist Gegenstand (s. ausführlich Abschnitt 5). Ein
(s. hierzu ausführlich Abschnitt 8). Oder es Teil der in Tagebuchform aufgezeichneten All-
wurde bemängelt, daß sich Tagebuchauf- tagsbeobachtungen zum Spracherwerb ist
zeichnungen in aller Regel auf die Beobach- mittlerweile in der Datenbank CHILDES
tung eines oder weniger Kinder beziehen und (MacWhinney, 1991) zusammengefaßt wor-
deshalb – angesichts der interindividuellen den, die im Prinzip allen Forschern für Sekun-
Variabilität menschlicher Entwicklung – Ver- däranalysen zur Verfügung steht. Bartsch und
allgemeinerungen nicht möglich wären. Wellman (1995) haben eine vielbeachtete Se-
Schließlich fand sich auch noch wiederholt kundäranalyse vorgelegt, in der das Datenma-
der Einwand, daß Tagebuchaufzeichnungen terial von CHILDES genutzt wurde, um die
meistens «theoriefrei» erfolgen und der Beob- Entwicklung der naiven Psychologie («theory
achter «alles Mögliche» sammelt, ohne eine of mind») bei Kindern im Alter von zwei bis
wissenschaftliche Fragestellung zu verfolgen. fünf Jahren zu untersuchen.
Die Tatsache, daß Autoren wie Piaget, Erikson Zwar sind partiell standardisierte Ge-
oder Stern unter Heranziehung von kasuisti- spräche in der Tradition von Piagets klini-
schen Tagebuchaufzeichnungen zu tiefgehen- schem Interview selbst in der Blütezeit des
den wissenschaftlichen Einsichten gekom- Behaviorismus nie ganz aus der Entwick-
men waren, geriet in Vergessenheit, und die lungspsychologie verschwunden, aber auch
potentiellen Vorzüge der Tagebuchaufzeich- ihr Stellenwert hat sich seit der kognitiven
nung, wie sie etwa von Stern oder Bühler her- Wende erhöht. Sie sind für die Bearbeitung
vorgehoben worden waren (s. Abschnitt 2.1), mancher Themen der aktuellen Entwick-
wurden ignoriert. lungspsychologie konstitutiv. Die Erfor-
In der Konsequenz der Orientierung an be- schung der Genese des moralischen Urteilens
havioristischen Methodenkriterien empfan- (Colby, Kohlberg, Gibbs & Lieberman, 1983;
den die bundesdeutschen Entwicklungspsy- Kohlberg, 1996), des Verstehens sozialer Kon-
chologen zwischen 1950 und 1980 eine ähnli- ventionen (Damon, 1984/1977; Turiel, 1983)
che Geringschätzung gegenüber spontanen und des Gesellschaftsverständnisses (Connell,
Sprachäußerungen des Kindes (etwa Erzählun- 1971; Furth, 1980) sowie der Entwicklung des
gen) und – mit Einschränkungen – auch für interpersonalen Verstehens (Selman, 1984/
klinische Interviews in Sinne Piagets. Im Un- 1980) und des Selbstkonzepts (Damon &
terschied zur Tagebuchaufzeichnung spielten Hart, 1988) sind ohne den Einsatz «semi-
unserem Eindruck nach dabei weniger strukturierter» Interviews nicht denkbar,
grundsätzliche methodische Vorbehalte eine denn alle diese Entwicklungsbereiche werden
Rolle, sondern entscheidend war, daß die mei- in der kognitiv-strukturtheoretischen Per-
sten Fragestellungen nach Daten verlangten, spektive erforscht, und kognitive Strukturen
die unter strikt kontrollierten und deshalb lassen sich – hier folgen die Autoren Piaget
standardisierten Bedingungen erhoben wer- (s. o.) – nur mittels des klinischen Interviews
den mußten. Diesem am Experiment orien- aufdecken.
tierten Ideal der Bedingungskontrolle durch Mit der Befreiung der Psychologie aus den
Standardisierung widersprach insbesondere theoretischen und methodischen Einengun-
auch der Freiraum, der beim klinischen Ge- gen des Behaviorismus wurden die Vorausset-
spräch im Sinne Piagets gelassen wird. zungen für die Renaissance des Tagebuchs
Roger Browns «A first language: The early sta- und verwandter Methoden geschaffen. Für
ges» (1973) signalisierte in Amerika die Rück- ihre derzeitige Attraktivität ist vermutlich
kehr der Aufzeichnung von Alltagsbeobach- aber auch eine Reihe aktueller Trends verant-
270 Methoden und Verfahren

wortlich, die wir hier kurz nennen wollen. Im Sinn macht. ... Will man eine Psychologie
Gegensatz zu dem oft zitierten geflügelten des Individuums erschaffen, so setzt das
Wort, daß Wissenschaft im Elfenbeinturm voraus, daß man zunächst ein integrati-
lebe, zeigt der Blick auf die Psychologie, wie ves Rahmenmodell für das Verständnis
wissenschaftsimmanente Veränderungen mit der historischen und kulturellen Existenz
Wandlungen des Zeitgeistes und soziokultu- von Personen entwickelt» (McAdams,
rellen Trends verwoben sind. Manche Beob- 1996, S. 296 [Übersetzung des Autors]).
achter (z. B. Giddens, 1991; Gergen, 1992)
charakterisieren unsere Zeit als die Postmoder-
Diese Perspektive wiederum bildet die Folie,
ne. Sie ist gekennzeichnet durch zunehmende
auf der sich verschiedene Trends in der aktu-
Infragestellung vieler Selbstverständlichkei-
ellen Psychologie verstehen lassen (vgl. auch
ten der Moderne, auch was unser Selbstkon-
Kap. I.2):
zept und unsere naive Psychologie angeht.
War die Moderne dazu angetan, eine positivi- 1. das Interesse an individuumszentrierten
stische, technokratische und rationalistische Strategien psychologischer Forschung
Sicht der Welt zu unterstützen, so geraten in (vgl. auch Deutsch & Hoppe-Graff, 1996).
der Postmoderne viele Überzeugungen und Den Gegensatz bilden die bisher dominie-
Klarheiten ins Wanken – der Glaube an Wis- renden nomothetischen Strategien. Der
senschaft und Technik, die Annahme, daß nomothetisch orientierte Forscher ist
objektive und rationale Diskurse möglich primär an generellen (nomothetischen)
seien, der Fortschrittsglaube, die Überzeu- Gesetzen interessiert und versucht die in-
gungskraft von geschlossenen Weltbildern dividuelle Entwicklung – wenn er sich
wie der marxistischen und der kapitalisti- überhaupt Individuen zuwendet – aus-
schen Ideologie. Die neue Unbestimmtheit schließlich durch Anwendung der allge-
und Unübersichtlichkeit findet nach Gergen meinen Gesetze auf den Einzelfall zu re-
(1992) eine Korrespondenz in der «Multi- konstruieren. In der Wissenschaftstheorie
phrenie» im Selbstkonzept des postmodernen der Psychologie ist es inzwischen ein All-
Menschen: gemeinplatz, daß dieses Programm ver-
schiedene grundlegende Mängel aufweist
«... Personen sind wie «Standorte» sich und deshalb nicht gelingen kann (vgl.
überschneidender Kräfte und aufeinan- von Wright, 1974). Zu den individuums-
der einwirkender Stimmen in einer spezi- zentrierten Strategien gehört die idiogra-
fischen sozialen Gemeinschaft .... Perso- phische Strategie, bei der das Verstehen
nen sind Geschöpfe, deren tiefste Iden- des Individuums aus der Konzentration
titäten durch ihre sozialen Einbettun- auf den Einzelfall gelingen soll, ohne daß
gen... oder ihren Standort im aktuellen dieser in allgemeinen Gesetzen rekonstru-
Diskurs bestimmt wird ...» (zit. nach Mc iert wird;
Adams, 1996, S. 298 [Übersetzung des 2. die Entstehung einer Kulturentwicklungs-
Autors]. psychologie, also einer Entwicklungspsy-
chologie, die Kultur als Rahmenbedin-
gung und effektiven Entwicklungsfaktor
Dieses postmoderne Weltbild bereitet den
theoretisch und empirisch einbezieht und
Boden sowohl für die Betonung des Individu-
den Entwicklungsprozeß als Kulturerwerb
ums in verschiedenen Teilbereichen der Psy-
rekonstruiert. Ein derartiges Programm
chologie als auch für die Konzentration auf
steht beispielsweise im Gegensatz zu den
den Zusammenhang von Individuum und
bis vor kurzem dominierenden Theorien,
Kultur:
wie etwa dem Neo-Nativismus oder dem
«Vieles von dem, was wir benötigen, um Informationsverarbeitungsansatz;
die individuelle Person zu beschreiben 3. die zunehmende Einsicht, daß nicht die
und zu verstehen, hat seine Grundlage in «objektiven Verhältnisse», sondern die
der Kultur dieser Person und in dem so- subjektiven Repräsentationen von Erfah-
ziohistorischen Setting, in dem ihr Leben rungen und die Deutungen und Bedeu-
Tagebücher, Gespräche und Erzählungen 271
tungen von Lebensbedingungen und Ge- Fragestellungen und deshalb sei ihre Ak-
schehnissen darüber entscheiden, wie die zeptanz primär anhand der Adäquatheit
Person handeln wird; und für die im Einzelfall angestrebten Unter-
4. die Attraktivität der Metapher der Erzäh- suchungsziele und Gegenstände zu bewer-
lung («narrative, story»), um zu charakteri- ten, ist zu einfach. Welche Methoden als
sieren, wie Menschen sich selbst, ihrem «wissenschaftlich» akzeptiert werden,
Handeln und ihren Erfahrungen Sinn zu wird in erster Linie nach Kriterien beur-
geben versuchen. teilt, die von dem allgemeinen theoreti-
schen Rahmen sowie von noch generelle-
Es liegt auf der Hand, daß alle diese Trends
ren Vorstellungen von Wissenschaftlich-
die Verwendung der in diesem Aufsatz refe-
keit abhängen. Wie der Blick in die Histo-
rierten Methoden nahelegen. Anders als die
rie gezeigt hat, haben sich die allgemei-
experimentelle Untersuchung des Einflusses
nen theoretischen Prämissen der Entwick-
von Variablen, bei der Gruppen (Stichpro-
lungspsychologie im Laufe der letzten
ben) von Personen unterschiedlichen Bedin-
hundert Jahre mehrmals grundlegend ver-
gungen («treatments») ausgesetzt werden, ist
ändert. Und wie wir noch sehen werden,
es Programm und Anliegen von Tagebüchern,
sind auch die generellen Kriterien von
das einzelne Individuum in seinen Besonder-
«Wissenschaftlichkeit» grundlegenden
heiten zu rekonstruieren – in den besonderen
Veränderungen unterworfen (vgl. Ab-
Lebenserfahrungen, die immer auch kulturel-
schnitt 8).
le Erfahrungen sind, wie auch in den Beson-
2. Folglich sind Wandlungen in den For-
derheiten seiner subjektiven Interpretation
schungsmethoden kein kumulativer Pro-
der Welt. Zu diesem Zweck nehmen in mo-
zeß der sukzessiven Vervollkommnung
dernen Tagebuchstudien (ähnlich wie schon
einmal eingeführter Verfahren. Die Ge-
in der Frühzeit der Entwicklungspsychologie)
schichte der akzeptierten und präferierten
Erzählungen und Gespräche mit den beob-
Methoden der Entwicklungspsychologie
achteten Personen eine zentrale Rolle ein.
ist von Diskontinuitäten und Zäsuren ge-
Aus der mit diesen Methoden verbundenen
kennzeichnet.
besonderen Kenntnis der Lebenswelt der Per-
3. Während die eingeengte Gegenstandsdefi-
son durch den Beobachter/Forscher – wir
nition des Behaviorismus seit einigen
werden unten dafür den Begriff Interpretati-
Jahrzehnten passé ist, gelten in weiten
onskompetenz vorschlagen – erwächst auch
Kreisen der Entwicklungspsychologie
ein besserer Zugang zum Verständnis jener
immer noch die Maximen des methodo-
Prozesse der Sinngebung und Bedeutungsver-
logischen Behaviorismus. Die Akzeptanz
leihung, die die subjektive Welt von den ob-
von Methoden der Datenerhebung wird
jektiven Gegebenheiten unterscheiden.
immer noch wie bei Watson nach Ge-
sichtspunkten beurteilt, die sich aus der
uneingeschränkten Orientierung der Psy-
chologie an dem Ideal der Naturwissen-
4. Erstes Resümee: Das schaften ergeben.
Verhältnis von Methoden
zum Gegenstand, den Zie-
len und den Theorien in der
5. Tagebuchaufzeichnungen
Entwicklungspsychologie
Der Terminus Tagebuchaufzeichnung ist
mehrdeutig. Er bezeichnet erstens eine längs-
Bevor wir näher auf die einzelnen Methoden
schnittliche Strategie entwicklungspsycholo-
eingehen, können wir schon an dieser Stelle
gischer Datenerhebung und zweitens eine
einige generelle Schlüsse ziehen.
spezielle Form der Dokumentation von Beob-
1. Die Vorstellung, Methoden seien das achtungen – eben im Tagebuch. Nur die erste
Werkzeug zur Untersuchung bestimmter Bedeutung ist aus methodischer Sicht belang-
272 Methoden und Verfahren

voll; ob die gesammelten Daten in einem Ta- Die folgenden Ausführungen stellen in ei-
gebuch oder auf Audiokassetten protokolliert nigen Punkten eine Revision unserer in
werden, ist hingegen unerheblich. einem früheren Aufsatz (Hoppe-Graff, 1989b)
Von einem Längsschnitt ist in der Entwick- vorgetragenen Sichtweise der Tagebuchme-
lungspsychologie immer dann die Rede, thodik dar. Beispielsweise war ein wesentli-
wenn die in die Untersuchung einbezogenen cher Gesichtspunkt der früheren Publikation
Personen wiederholt beobachtet werden, um die Gegenüberstellung und Abgrenzung der
auf der Basis dieser intraindividuellen Ver- klassischen und der modernen Tagebuchstu-
gleichsdaten Entwicklungsprozesse zu rekon- dien, verbunden mit einer impliziten höhe-
struieren. (Hingegen wird beim Querschnitt ren Wertschätzung der modernen Variante.
aus interindividuellen Vergleichen von Perso- Heute, acht Jahre später, möchten wir beides
nen aus verschiedenen Stichproben auf Ent- nicht mehr aufrechterhalten. Die Synopsis
wicklungsvorgänge geschlossen; vgl. Hoppe- hat sich als zu holzschnittartig erwiesen, und
Graff, 1989a; s. auch Kap. III.3) Die Tage- aus heutiger Sicht bewerten wir einige Merk-
buchaufzeichnung kann zwar nicht strikt male von Datenerhebungsstrategien anders
von anderen Längsschnittstrategien abgrenzt als früher.
werden, aber sie läßt sich durch eine Reihe Als exemplarische Studie wird die Untersu-
von typischen Eigenheiten charakterisieren. chung von Mendelson (1990) vorgestellt. Der
Typischerweise Autor selbst bezeichnet sie nicht als Tage-
buchstudie, sondern als Fallstudie. Dennoch
– werden in erster Linie Beobachtungen spon- handelt es sich aber eindeutig um eine Tage-
tanen Verhaltens in der alltäglichen Lebens- buchaufzeichnung im oben definierten
welt gesammelt; Beobachtungen provo- Sinne. Mendelsons Untersuchung ist als ein-
zierten Verhaltens unter kontrollierten Be- führendes Beispiel besonders geeignet, weil
dingungen haben allenfalls ergänzenden sie ein Exempel für die Einbindung von parti-
Charakter; ell strukturierten Interviews und Erzählungen
– ist die Stichprobe der Beobachtungen sehr in Tagebuchaufzeichnungen liefert.
umfangreich. Im Extremfall nimmt der Be-
obachter2 ständig am Leben der beobach-
teten Person teil. Als Beispiele können 5.1 Exemplarische Studie:
neben der unten vorgestellten exemplari- Mendelson (1990)
schen Studie die klassischen Tagebuchbe-
obachtungen ihrer Kinder Hilde, Günther Die Tagebuchstudie von Mendelson befaßt
und Eva durch ihre Eltern Clara und Wil- sich mit dem Übergang von der Rolle des Ein-
liam Stern dienen (s. Abschnitt 2.1); zelkindes in die Rolle des älteren Geschwi-
– ist die Personenstichprobe sehr klein. Häufig sterkindes. In anderer Perspektive sind An-
handelt es sich sogar um Einzelfallstu- passungsprozesse das zentrale Thema: Wie
dien; paßt sich ein etwa vierjähriges Kind an die
– kennt der Beobachter die beobachtete Person Geburt eines Geschwisterkindes und die
sehr gut und kann deshalb deren Hand- damit zusammenhängenden gravierenden
lungen und Äußerungen nicht nur «theo- Veränderungen in seiner Lebenswelt, speziell
riebezogen», sondern auch «personbezo- in seiner Familienrolle, an?
gen» einordnen und interpretieren; Das Interesse an dieser Fragestellung ist
– wird die Datenerhebung nicht auf ein speziel- aus Alltagsbeobachtungen in der eigenen Fa-
les Verfahren begrenzt. Der Beobachter be- milie erwachsen. Als Mendelson und seine
dient sich verschiedener Zugänge. Bei- Frau ihrem Sohn Simon erzählten, daß sie ein
spielsweise protokolliert er Erzählungen,
führt Gespräche, sammelt Kinderzeich-
nungen und notiert Spielbeobachtungen;
– wird wenigstens ein Teil der Beobachtun-
gen in einem chronologisch angelegten Tage- 2 Männliche Personbezeichnungen gelten auch für
buch protokolliert. Personen weiblichen Geschlechts.
Tagebücher, Gespräche und Erzählungen 273
Baby bekommen werden und daß Simon gen benutzt. Beispielsweise zeichnet er an-
dann der große Bruder sein wird, beobachtete hand der Tagesprotokolle quantitativ exakt
Mendelson einige überraschende Reaktionen. nach, wie sich nach Ashers Geburt der Um-
Beispielsweise war Simon sich sicher, daß das fang der von Simon mit Asher «gemeinsam»
Baby ein Junge sein würde, und er befürchte- unternommenen Aktivitäten (gemeinsame
te, nicht der große Bruder sein zu können, Mahlzeiten, Spielen, Hilfe bei der Versorgung
wenn eine Schwester geboren würde. Ashers) von Monat zu Monat veränderte.
Mendelsons Studie umfaßt einen Beobach- Derartige quantitative Analysen werden zwar
tungszeitraum von zehn Monaten. Sie be- häufig in die Ergebnisdarstellung eingebaut,
gann fünf Monate vor der Geburt von Asher, dennoch haben sie im Duktus von Mendels-
Simons Bruder, und endet fünf Monate da- ons Argumentation nur eine unterstützende
nach. Während dieses Zeitraums sammelte Funktion. Sie dienen zur Illustration oder Be-
der Autor eine Vielzahl von unterschiedli- stätigung bestimmter Veränderungen, die
chen Beobachtungen, um Simons Anpas- Mendelson als intuitiver Gesamteindruck evi-
sungsprozesse, insbesondere das aktive Erar- dent sind oder die er vor allem an besonders
beiten der neuen Rolle und die Veränderun- markanten Einzelbeobachtungen abliest. Mit
gen im Selbstkonzept, zu erfassen. Zu den Da- anderen Worten, das Gewicht der Daten be-
tenquellen gehörten mißt sich nicht nach statistischen Maßzah-
len oder Differenzen, sondern nach der in-
– tägliche Eintragungen («log entries») aller haltlichen Bedeutsamkeit der Beobachtung.
«einschlägigen» Äußerungen und Verhal- Ein Beispiel soll die Nutzung der Tage-
tensweisen von Simon in ein Tagebuch im buchbeobachtungen veranschaulichen. Die
engeren Sinne. Einschlägig bedeutet: «Ich Eintragung bezieht sich auf Simons Spiel-
zeichnete alles auf, was Simon tat oder phantasie, selbst das Baby zu sein («preten-
sagte, was auch nur entfernt damit zu tun ding to be a baby»).
haben konnte, daß er nun ein Bruder
wurde» (Mendelson, 1990, S. 207 [Über- «Nach Ashers Geburt tat Simon gelegent-
setzung des Autors]); lich so, als sei er ein Baby. Als Asher eine
– Gespräche zwischen Mendelson und Woche alt war, übernahm Simon nicht
Simon, die zunächst auf Audiokassetten bloß die Spielrolle des Babys, sondern er
aufgenommen und dann in das Tagebuch vertauschte die beiden Rollen regel-
übertragen wurden; recht. Dieses Spiel begann er, als er ge-
– Interviews eines studentischen Versuchs- badet wurde, und er setzte es fort, ob-
leiters mit Simon, die genauso dokumen- wohl er dabei nicht unterstützt und mehr-
tiert wurden; mals unterbrochen wurde. «Wir tun so,
– auf Audiokassetten aufgenommene Inter- als ob Du der Hummerpapa bist und ich
aktionen zwischen Simon und Asher; das Hummerbaby», schlug er als erstes
– Beurteilungen von Simons Verhalten mit- vor. «Und Du gibst mir ein Hummerbaby-
tels formeller Ratingskalen (unter ande- Bad.» Ein wenig später sagte er, daß wir
rem «Home Behavior Rating Scale») durch eine Hummer-Familie haben, mit einer
die beiden Eltern und Simons Betreuerin- Hummermama, einem Hummerpapa,
nen im Kindergarten; und einem Hummerbaby und einem großen
– «Tagesprotokolle» (Mendelson verwendet Hummerbruder. Ich fragte ihn, wer er sei:
hierfür die Bezeichnung «daily diaries»), das Hummerbaby oder der große Hum-
die an ausgewählten Tagen eine vollstän- merbruder. Er antwortete: «Ich bin das
dige Aufstellung aller Aktivitäten Simons Hummerbaby. Ich heiße Asher, und mein
lieferten. großer Bruder ist Simon.» ... Später sagte
Bev (Simons Mutter), daß sie das Baby
füttern werde, und Simon behauptete, er
Je nach ihrer Eigenart werden diese Beobach- sei Asher (vier Jahre, zehn Tage).» (Men-
tungen von Mendelson in unterschiedlicher delson, 1990, S. 99 [Übersetzung des Au-
Weise zur Beantwortung seiner Fragestellun- tors]).
274 Methoden und Verfahren

Aufgrund der theoretischen Einordnung und aber ist mit dieser Strategie eine Reihe von
Interpretation der Tagebuchstudie kommt Präferenzen hinsichtlich der einzelnen Me-
Mendelson zu dem generellen Fazit, daß das thoden verbunden. Bevorzugt und betont
Hineinwachsen in die Geschwisterrolle ein wird die Protokollierung anekdotischer Beob-
langwieriger, komplexer Prozeß ist. Er achtungen spontanen kindlichen Handelns
schließt ein, daß eine aktive Beziehung zu im alltäglichen Kontext, die dem «theoriege-
dem Baby aufgebaut wird und daß eine emo- leiteten Blick» des Beobachters besonders auf-
tionale Anpassung an die unausweichlichen gefallen sind.
Veränderungen in alltäglichen Routinen, in Während nach den traditionellen psycho-
den Familienbeziehungen und im Selbstkon- logischen Kriterien die Variablen und die Ver-
zept erfolgt. fahren zu ihrer Beobachtung mit Beginn der
Mendelson selbst diskutiert abschließend Studie unabänderlich festgelegt sind, weichen
auch das Problem der Generalisierbarkeit (s. manche Autoren von Tagebuchstudien aus-
ausführlich unten in diesem Abschnitt). Re- drücklich von diesem Prinzip ab (Mendelson,
plikationsstudien sind ein Schritt zu dessen 1990; Hoppe-Graff & Schmid, 1997). Sie be-
empirischer Lösung. Zum Übergang in die fürchten, daß eine derartige Eingrenzung des
Geschwisterrolle liegt inzwischen eine derar- Beobachtungsgegenstandes dazu führen könn-
tige Replikationsstudie vor (Hoppe-Graff & te, daß Daten übersehen werden, die erst im
Schmid, 1997). Wir untersuchten in einer Ta- Laufe der Studie besondere theoretische Rele-
gebuchstudie mit einer sehr ähnlichen Me- vanz gewinnen, weil nicht im voraus
thodik wie Mendelson, wie sich ein etwa überblickt werden konnte, wie sich beispiels-
zweieinhalbjähriges Mädchen an die Geburt weise in Mendelsons Studie Veränderungen
eines Bruders anpaßt. Auf der zuvor beschrie- des Selbstkonzepts oder die Versuche, die neue
benen Ebene der generellen Anpassungspro- Geschwisterrolle zu erwerben, äußern:
zesse bestätigen unsere Daten Mendelsons
«... Ich beschränkte mich nicht auf vorge-
Schlußfolgerungen; im einzelnen jedoch voll-
gebene Konstrukte und Meßverfahren.
zieht sich die Veränderung des Selbstkonzepts
Eine ernstzunehmende Fallstudie sollte
und die Übernahme der neuen Rolle anders.
ein den tatsächlichen Lebensverhältnis-
Beispielsweise kommt nach unserem Ein-
sen entsprechender Bericht über ein spe-
druck dem Als-ob-Spiel (Symbolspiel) für das
zifisches Individuum in einem spezifi-
zweieinhalbjährige Kind eine noch größere
schen Kontext sein. Deshalb versuchte
Bedeutung zu als für Simon.
ich Simon’s Erfahrungen so gut wie mög-
lich zu verstehen, indem ich für neue Er-
eignisse, Themen und Fragestellungen
5.2 Durchführung und Aufzeichnung offen blieb.» (Mendelson, 1990, S. xv).
Es gibt keine Methodenlehre der Tagebuch-
aufzeichnung, so wie es etwa eine Methodik Wer führt die Beobachtungen durch?
psychologischer Tests oder der Verhaltensbe-
obachtung gibt, denn die Tagebuchaufzeich- Nach dem traditionellen behavioristischen
nung ist eine Datenerhebungsstrategie und Methodenverständnis (s. Abschnitt 3) sollte
kein Beobachtungsverfahren. Wie oben be- es zwischen der direkten Beobachtung psy-
reits ausgeführt worden ist, läßt sie sich nicht chischer Merkmale durch eine Person (perso-
strikt, wohl aber durch charakteristische naler Beobachter) und der Beobachtung
Merkmale von anderen Forschungsstrategien durch ein Meßinstrument keinen grundle-
abgrenzen. genden Unterschied geben. Mehr noch: Das
Hinsichtlich der innerhalb dieser Strategie Meßinstrument – etwa ein Thermometer oder
eingesetzten Verfahren ist sie grundsätzlich eine Waage – ist in mancherlei Hinsicht das
«neutral»: Anekdotische Beobachtungen sind Ideal für den personalen Beobachter. Es ist in
ebenso möglich wie nach einem regelmäßi- dem Sinne objektiv, daß die «Beziehung» des
gen Plan wiederholt durchgeführte standardi- Instrumentes zum beobachteten Objekt sich
sierte Beobachtungen oder Tests. Tatsächlich nicht auf das Meßergebnis auswirkt.
Tagebücher, Gespräche und Erzählungen 275
Wir wissen aus der Alltagserfahrung und ausdrücklich ab. Sie plädieren also dafür, daß
aus der wissenschaftlichen Psychologie, daß Tagebuchaufzeichnungen bevorzugt von Per-
die psychologische Beziehung zwischen dem sonen durchgeführt werden, die sowohl
Beobachter und der beobachteten Person das «theoretisch vorbelastet» als auch «persön-
Resultat der Beobachtung weitgehend beein- lich befangen» sind. Ideale «Versuchsleiter»
flussen kann. Wir neigen beispielsweise zu von Tagebuchstudien sind nach diesem Ver-
Milde und Überschätzung, wenn wir die Lei- ständnis Entwicklungspsychologen, die die
stung eines Menschen beurteilen, den wir Entwicklung der eigenen Kinder beobachten
mögen, und wir neigen zu Härte und Unter- – wir verweisen abermals auf die Studien
schätzung, wenn uns jemand unsympathisch Mendelsons und des Ehepaars Stern.
ist. Wir neigen dazu, das zu sehen, was wir er- Natürlich werden die ersten beiden der
warten, und das zu übersehen, mit dem wir vier Prinzipien nicht aus Ignoranz verletzt,
nicht rechnen. Um diesen Verzerrungen («bia- sondern verlieren vor dem Hintergrund an-
ses») entgegenzuwirken, werden in der psy- derer methodologischer Prämissen ihr Ge-
chologischen Methodenlehre in aller Regel die wicht. Diese Prämissen lauten: (a) Je größer
folgenden Maßnahmen vorgeschlagen: die theoretischen Kenntnisse des Beobacht-
ers, um so eher ist er auch in der Lage, theo-
1. Nicht der in seiner Theorie und seinen
retisch relevantes Verhalten zu sehen bzw. ge-
theoriegeleiteten Erwartungen befangene
sehenes Verhalten als theorierelevant zu in-
Forscher sollte die Daten sammeln, son-
terpretieren (gemäß der kognitionspsycholo-
dern ein Assistent, der «blind» gegenüber
gischen Regel: «Man sieht nur, was man
den Fragestellungen und Erwartungen ist.
weiß»). (b) Je enger die Beziehung zu einer
2. Ähnlich wie die Objektivität von Ge-
Person ist, um so besser kennt man ihre per-
richtsverfahren dadurch gesteigert werden
sönlichen Eigenheiten; mit anderen Worten,
kann, daß Richter und Täter nicht mitein-
um so mehr weiß man darüber Bescheid, was
ander verwandt oder befreundet sind,
ihr Handeln bedeutet.
kann die Objektivität von psychologi-
Theoriekenntnisse und die persönliche Be-
schen Beobachtungen und Beurteilungen
ziehung zur beobachteten Person vergrößern
dadurch gesteigert werden, daß der «Ver-
die Interpretationskompetenz des Beobachters.
suchsleiter» und die «Versuchsperson» –
Nach unserer Meinung besteht die Kontro-
der Jargon deutet es bereits an! – in keiner
verse zwischen den Gegnern und den Befür-
persönlichen Beziehung zueinander ste-
wortern der Tagebuchmethode vor allem in
hen.
der gegensätzlichen Bewertung der Interpre-
3. Sofern es um Daten geht, die aus der Beur-
tationskompetenz. Die Gegner sehen darin
teilung von Beobachtungen entstehen,
keinen Gewinn, wohl aber die massive Ver-
sollten die Prozesse der Beobachtung und
letzung des klassischen Objektivitätsideals (s.
der Beurteilung so weit wie möglich von-
ausführlich unten in Abschnitt 8). Die Befür-
einander getrennt werden. Beispielsweise
worter betonen den in der Interpretations-
sollten die Beobachtungen mittels Video-
kompetenz liegenden Gewinn vor allem des-
aufzeichnung vom Versuchsleiter A vorge-
halb, weil sie ein anderes Vorverständnis vom
nommen werden, die davon unabhängi-
psychologischen Zugang zum Individuum
ge Beurteilung der Videoaufzeichnungen
haben und weil sie das klassische Objekti-
hingegen durch die Versuchsleiter B und
vitätsideal nicht teilen. Auch auf diese Positi-
C.
on gehen wir in Abschnitt 8 ein.
4. Die Versuchsleiter sollten an einem inten-
Nach unserer persönlichen Auffassung
siven Training teilnehmen, um die objek-
und nach unseren Erfahrungen (Hoppe-Graff
tive Beobachtung und Beurteilung ein-
& Kirchgässner; 1996; Hoppe-Graff &
zuüben.
Schmid, 1997) liegt in der Wertschätzung der
Die Befürworter der traditionellen und der Interpretationskompetenz bei den Befürwor-
modernen Tagebuchmethode schließen sich tern der Tagebuchaufzeichnung eine Notwen-
nur den letzten beiden Empfehlungen an, digkeit. Spielte sie keine Rolle, so gäbe es kei-
lehnen aber die ersten beiden Maßnahmen nen Grund, den enormen Aufwand, der mit
276 Methoden und Verfahren

Tagebuchaufzeichnungen verbunden ist, zu die anekdotischen Beobachtungen spontanen


betreiben. kindlichen Handelns im Alltag.
Nach den Erfahrungen unserer Arbeits-
gruppe hat es sich bewährt, die Beobachtun-
Wieviele Personen werden beobachtet? gen doppelt zu protokollieren und zusätzlich
in einem Tagebuch im engeren Sinne zu doku-
Obwohl es dafür keine immanente Notwen- mentieren (Kirchgässner, 1993a). In Kirchgäss-
digkeit gibt, sind Tagebuchstudien meistens ners (1993b) Studie zum frühen Gestener-
Einzelfallstudien. Daß sie keine Untersuchun- werb wurden alle «Äußerungen» von Gesten
gen an größeren Stichproben sein können, sobald wie möglich schriftlich notiert. Neben
ergibt sich zum einen zwangsläufig aus der dem Vollzug der Geste wurden protokolliert:
Favorisierung der besonderen persönlichen
– der situative Rahmen (wann und wo fand
Kenntnis von Beobachter und beobachteter
das «Ereignis» statt? Was war der generelle
Person und zum anderen aus dem mit Tage-
Situationsrahmen?),
buchaufzeichnungen verbundenen Aufwand.
– die in der Situation anwesenden Perso-
Bei den begrenzten Mitteln, die normalerwei-
nen,
se zur Verfügung stehen, gelten für die Vertei-
– Handlungen des Kindes oder der Partner,
lung der Beobachtungsressourcen die Regeln
die der Geste vorausgingen,
eines «Nullsummenspiels»: Was man in den
– nachfolgende Handlungen des Kindes
Beobachtungsaufwand beim einzelnen Indi-
oder der Partner; und
viduum steckt, steht für andere «Versuchsper-
– Besonderheiten.
sonen» nicht mehr zur Verfügung. Und je
mehr Personen man beobachtet, um so weni- Diese Anekdoten wurden noch am selben Tag
ger Ressourcen sind für den einzelnen «Fall» (sobald die Beobachterin die Zeit und Ruhe
verfügbar. dazu hatte) vervollständigt und in narrativer
Die geringe Größe der Personenstichprobe Form in ein Heft übertragen, in dem die Be-
ist deshalb von besonderer Bedeutung, weil obachtungen in chronologischer Folge fort-
dadurch die Frage der Generalisierbarkeit der laufend aufgezeichnet wurden. Außerdem
Resultate zusätzlich an Gewicht gewinnt, so- wurden sie, ebenfalls fortlaufend, auf einem
wohl von der Sache her als auch in der Aus- Protokollbogen notiert, auf dem die oben ge-
einandersetzung mit Kritikern der Tagebuch- nannten Informationen voneinander ge-
aufzeichnung (vgl. Abschnitt 8). trennt aufgeführt und die Gesten zusätzlich
nach Inhaltsbereichen kategorisiert wurden.
Nach Abschluß der Erhebungen hat die
Wie werden die Beobachtungen protokol- Autorin die narrativen Aufzeichnungen zu
liert und dokumentiert? einem regelrechten Tagebuch (Kirchgässner,
1993a) ausgearbeitet, das sie zwar nicht für
Wie die Beobachtungen protokolliert und do- quantitative Analysen herangezogen hat, das
kumentiert werden, ergibt sich zum einen ihr aber immer wieder half, bei der Interpre-
aus den Eigenarten des speziellen Beobach- tation der Resultate die einzelnen Beobach-
tungsverfahrens. Werden etwa, wie in Men- tungen im Gesamtkontext der Entwicklung
delsons Studie, Verhaltensbeobachtungen des Kindes zu sehen und zu verstehen.
mittels einer formellen Beurteilungsskala vor-
genommen, so ist die Protokollierung im
Rahmen des Verfahrens vorgeschrieben. Wird Ethische Fragen.
beispielsweise das Spiel eines einjährigen Kin-
des auf Video aufgezeichnet, so gelten hier- Die persönliche Beziehung zwischen Beob-
für die Regeln und Vorschläge für die Beob- achter und beobachteter Person berührt ethi-
achtungen des frühen Kinderspiels (s. McCune- sche Fragen, die nicht vernachlässigt werden
Nicolich, 1983; Hoppe-Graff & Engel, 1996). dürfen. Sie ergeben sich aus der doppelten
Deshalb beschränken wir die Überlegungen Rolle des Beobachters. Er/sie ist gleichzeitig so-
zur Protokollierung und Dokumentation auf wohl Vater/Mutter des Kindes als auch For-
Tagebücher, Gespräche und Erzählungen 277
scher/Forscherin. Oder er/sie ist ein/e mit thoden sinnvoll diskutiert werden, da sich
dem Kind eng vertrauter Babysitter/in und die Methodik weitgehend danach richtet,
zugleich um distanzierte Beobachtung welche speziellen Erhebungsverfahren ver-
bemühte/r Psychologe/in. Daraus können wendet worden sind. Mendelsons Verwen-
Konflikte erwachsen, die sowohl für den Be- dung von formellen Beurteilungsskalen legen
obachter als auch das beobachtete Kind fol- die quantitative Beschreibung der Verhal-
genreich sind. Die Rolle des Vaters oder der tensänderungen von Simon über das Beob-
Mutter verlangt meistens emotionale Nähe achtungsintervall nahe, und die Aufzeich-
und häufig spontanes, engagiertes Handeln nung verschiedener Formen kommunikativer
ohne die Gelegenheit zur vorhergehenden Gesten in der Studie von Kirchgässner erlaub-
Reflexion. Die theoriegeleitete Beobachtung te es, über den Zeitraum von drei Monaten
lädt zur Distanz und zur Reflexion ein. So- zu verfolgen, wie sich die relativen Anteile
wohl das Ehepaar Stern als auch Mendelson verschiedener Gesten verändert haben.
haben in manchen Situationen diesen Kon- Die erste strategische Frage wird häufig als
flikt erlebt und in ihren Arbeiten themati- die Entscheidung zwischen der qualitativen
siert. Die Lösung lag darin, sich eindeutig für und der quantitativen Auswertung bezeichnet.
die erste Rolle zu entscheiden und die zweite Das Begriffspaar qualitativ vs. quantitativ, das
aufzugeben (vgl. auch Abschnitt 2.1). in den Sozialwissenschaften mit sehr unter-
Zudem kann bei älteren Kindern oder Ju- schiedlichen Bedeutungen versehen wird (vgl.
gendlichen die «doppelte Beziehung» auch etwa Kirk & Miller, 1986), wird hier in einem
dann zu einem Problem werden, wenn sich die sehr spezifischen Sinne gebraucht. Mit Miles
Tatsache, daß ein Tagebuch geführt wird, nicht und Huberman (1994) sprechen wir von Daten
verheimlichen läßt. Möglicherweise ändert als dem Ergebnis von Beobachtungen. Daten
sich ihr Handeln, wenn sie wissen, daß sie be- beschreiben Menschen in wesentlichen Hand-
obachtet werden. Vor allem aber besteht die lungen, Merkmalen oder Eigenarten – in die-
Gefahr, daß sogar die persönliche Beziehung sem Sinne sind alle Daten qualitativ. Die Be-
zum Beobachter beeinflußt wird, wenn sie dar- schreibungen können aber in Zahlen (Quan-
über nachdenken. Vielleicht erleben sie sich titäten) oder Wörtern (Qualitäten) vorgenom-
als «benutzt» für wissenschaftliche Zwecke. men werden. Liegen Daten in Zahlen vor, so
Die doppelte Beziehungsqualität, auf die schließt sich an die Beobachtung eine quanti-
sich der Forscher bei derartigen Tagebuchstu- tative Datenanalyse an; anderenfalls erfolgt
dien einläßt, kann unserer Erfahrung nach eine qualitative Auswertung.
aber nicht nur in einzelnen Situationen zu Nach unserer Erfahrung sollte die Auswer-
Konflikten führen, sondern sie kann auch für tung von Tagebuchstudien in der Kombinati-
ihn selbst zu einem ständigen und grundsätz- on der beiden Auswertungsstrategien beste-
lichen Problem werden, weil sich in seinem hen, um beider Vorteile zu nutzen. Quantita-
Erleben die Elternrolle und die Beobachterrol- tive Analysen der Längsschnittsdaten ma-
le nicht mehr voneinander trennen lassen chen generelle Trends deutlich und liefern
und sich dann die Beziehung verändert. Hier dem Forscher den Rahmen, den er bei der In-
ist unseres Erachtens die Grenze erreicht, wo terpretation einzelner Beobachtungen nicht
sich der Forscher ausdrücklich überlegen außer acht lassen sollte. Weiterhin eignen
muß, ob die Studie weiterhin durchgeführt sich quantitative Daten auch häufig dazu, al-
werden kann. Seine Entscheidung sollte er im terstypische Merkmale oder Entwicklungs-
Zweifel immer nach der Maxime, daß das trends, die sich aus qualitativen Daten her-
Wohl des Kindes vor dem wissenschaftlichen auslesen lassen, zu unterstreichen. Daß die
Erkenntnisgewinn steht, treffen. Auswertung auch die qualitative Einordnung
und Interpretation von einzelnen Daten
einschließen sollte, versteht sich von selbst,
5.3 Auswertung wenn man die Bevorzugung der Tagebuch-
aufzeichnung mit dem Vorteil der Interpreta-
Auch bezüglich der Auswertung kann nur tionskompetenz begründet.
über Strategien, nicht aber über einzelne Me- Die zweite strategische Entscheidung stellt
278 Methoden und Verfahren

sich nur, wenn Daten von mehr als einer Per- sich nicht strikt von Tagebuchaufzeichnun-
son vorliegen: Sollen in diesem Falle Einzel- gen und Erzählungen abgrenzen. Die Verwo-
falldaten oder statistische Kennwerte von benheit mit der Tagebuchmethode ist in Ab-
Stichproben (Mittelwerte, Varianzen etc.) prä- schnitt 5 deutlich geworden. Tagebuchstudi-
sentiert werden? Bei den meisten Tagebuch- en enthalten häufig als geplantes oder beiläu-
studien dürfte sich aus den allgemeinen Prä- figes Element Gespräche zwischen dem Beob-
missen eine Präferenz für die Auswertung achter und dem Kind oder Jugendlichen.
und Darstellung des einzelnen Falles ergeben. Hinzu kommen Aufzeichnungen von Ge-
Statistische Kennwerte können bekanntlich sprächen zwischen der beobachteten und an-
nicht nur atypisch für manche Individualda- deren Personen, bei denen der Beobachter
ten sein. Im Extrem entsprechen sie nicht Zuhörer war. Gespräche können Erzählungen
einem einzelnen der tatsächlich vorkommen- enthalten – deshalb ist auch die Grenze zu
den Individualdaten (Hoppe-Graff, 1989a). dieser Datenquelle fließend.
Gegen die Reduktion der individuellen Infor- In den Sozialwissenschaften finden die un-
mation auf Gruppendaten spricht aber auch, terschiedlichsten Formen von Gesprächen
daß das Ziel der Tagebuchstudie meistens ge- Verwendung (vgl. die Übersicht von Fontana
rade darin besteht, Entwicklungsprozesse und & Frey, 1994). Das Spektrum reicht von Beob-
-verläufe im Individuum kennenzulernen. Die achtungen informeller Gespräche im Alltag
Interpretationskompetenz des Beobachters bis zu genau geplanten Interviews in Form
soll dazu genutzt werden, die Daten eben von strikt festgelegten Frage-Antwort-Spielen.
nicht nur «merkmalsbezogen», sondern auch Wir beschränken uns in diesem Abschnitt auf
«personbezogen» zu verstehen. einen speziellen Typus von Gesprächen, für
Sofern Daten von mehr als einem Beob- die wir in Abschnitt 2 den Begriff des partiell
achter, Ergebnisse von mehr als einem Aus- standardisierten Interviews eingeführt haben.
werter oder Interpretationen von mehr als Derartige Gespräche haben in der Entwick-
einem Forscher zur Verfügung stehen, kön- lungspsychologie eine lange Tradition, denn
nen für die quantitative Auswertung Koeffizi- sie stehen in der unmittelbaren Nachfolge
enten für die Höhe der Durchführungs-, Aus- von Piagets Methode des klinischen Interviews
wertungs- oder Interpretationsobjektivität im (vgl. abermals Abschnitt 2).
traditionellen Sinne berechnet werden. Über Mit der Bezeichnung Interview wollen wir
die entsprechenden Maßzahlen und die Ver- auf die spezifische Rollenverteilung bei die-
fahren zu ihrer Berechnung informieren z. B. sen Gesprächen verweisen. Der Forscher ist
Bakeman und Gottman (1987) und Bortz, eindeutig der Fragesteller und der Gesprächs-
Lienert und Boehnke (1990, darin: Kap. 9). partner eindeutig der Befragte. Abgesehen
Wir haben bereits deutlich gemacht, daß der von Gesprächen mit sehr jungen Kindern ist
quantitative Nachweis einer «ausreichenden» diese Struktur beiden Gesprächspartnern be-
Auswertungsobjektivität aus unserer Sicht wußt, denn das Gespräch wird in aller Regel
keine conditio sine qua non für die Wissen- in den ausdrücklichen Rahmen einer Befra-
schaftlichkeit von Ergebnissen oder Studien gung gestellt. Die Bezeichnung partiell stan-
in der Entwicklungspsychologie ist. Insbeson- dardisiert verweist auf die Besonderheit die-
dere kann er es nicht für qualitative Daten ses Interviews. Zwar wird im Interviewleitfa-
sein. Dieses Argument wird in Abschnitt 8 den festgelegt, welche Themen behandelt
vertieft. und welche Kernfragen gestellt werden müs-
sen, aber es wird ausdrücklich der Entschei-
dung des Forschers in der aktuellen Ge-
sprächssituation überlassen, in welche Fra-
6. Gespräche: Partiell genformulierungen und Nachfragen er die
Themen und Kernfragen transformiert. Statt
standardisierte Interviews von partiell standardisierten Gesprächen ist
manchmal auch von semi-strukturierten In-
Die Gewinnung von entwicklungspsycholo- terviews die Rede. Wir ziehen partiell stan-
gisch bedeutsamen Daten in Gesprächen läßt dardisiert vor, weil nach unserer Auffassung
Tagebücher, Gespräche und Erzählungen 279
derartige Gespräche unter der Perspektive der William James unterschied zwei Kompo-
Zielsetzung des Forschers vollkommen struk- nenten des Selbsterlebens, im Englischen als
turiert sind. «I» oder «The-self-as-subject» und «Me» oder
Die exemplarische Studie stammt aus der «The-self-as-object» bezeichnet. Es empfiehlt
kognitiv-strukturtheoretischen Tradition, die sich, auch im deutschen Sprachgebrauch die
von Piaget begründet worden ist. Viele der englischen Termini beizubehalten, weil sie
Theorien und Ergebnisse, von denen in an- die Bedeutungen dieser Komponenten beson-
deren Kapiteln dieses Lehrbuchs die Rede ist, ders gut veranschaulichen. «I» bezieht sich
sind in dieser Perspektive entstanden. Als Bei- auf die Subjektivität der Selbsterfahrung, mit-
spiele seien an dieser Stelle nur Kohlbergs hin auf die Kernmerkmale des Erlebens von
Theorie der Moralentwicklung, Selmans Individualität:
Theorie des sozial-kognitiven Verstehens und
– das Erleben, die eigene Lebensgeschichte
Damons und Harts Modell der Entwicklung
selbst aktiv hervorgebracht zu haben
des Selbstkonzepts genannt. Ihnen allen ist
(«awareness of one’s agency over life events»);
die Vorstellung gemeinsam, daß Strukturen
– das Gewahrsein der Einmaligkeit der eige-
Gegenstand und «Träger» der Entwicklung
nen Erfahrungen («awareness of the uni-
sind. Entwicklung zu erforschen bedeutet
queness of one’s life experience»);
mithin, Strukturen und Strukturveränderun-
– die Erfahrung der eigenen Kontinuität
gen («Transformationen von Strukturen»)
(«awareness of one’s personal continuity»);
aufzudecken. Für diese Aufgabenstellung ist
und
das partiell standardisierte Interview ein «un-
– das Gewahrsein des eigenen Bewußtseins
verzichtbares Werkzeug» (Damon & Hart,
(«awareness of one’s own awareness»).
1988, S. 78).

Im Unterschied zu diesem Kern der Subjekti-


vität und erlebten Individualität bezeichnet
6.1 Exemplarische Studie: «Me» «the sum total of all a person can call
Damon & Hart (1988) his» (James, 1961/1892, S. 44, zit. nach
Damon & Hart, 1988, S. 5). Diese Komponen-
Sich selbst zu erleben und ein Selbstkonzept te des Selbst bezieht sich etwa auf die erleb-
(ein Bild von sich selbst) zu haben, sind ele- ten eigenen körperlichen Merkmale, persönli-
mentare Erfahrungen des Menschen. Gleich- chen Besitz, soziale Beziehungen und psycho-
wohl gehören Selbsterfahrung und Selbstkon- logische Eigenheiten, die das Selbst als eine
zept zu den schwierigsten Untersuchungsge- einmalige Konfiguration persönlicher Attri-
genständen der Psychologie. Wie kann man bute erleben lassen.
das Selbst, über die subjektive Erfahrung hin- Damons und Harts Modell der Entwick-
aus, beobachtbar und dem wissenschaftli- lung des Selbst knüpft direkt an diese Defini-
chen Diskurs zugänglich machen? tion an. Mit Ausnahme des Gewahrseins des
In der Tradition von William James und eigenen Bewußtseins, für das kein methodi-
George Herbert Mead haben die amerikani- scher Zugang gefunden wurde, sind darin das
schen Psychologen William Damon und Gewahrsein des eigenen Tätigseins, der Ein-
Daniel Hart (1988, 1992) ein kognitiv-struk- maligkeit (Distinktheit) und der Kontinuität
turtheoretisches Modell des Selbstverstehens als Aspekte des «Self-as-subject» und das kör-
formuliert. Das Modell steht in Wechselbezie- perliche Selbst, das aktive Selbst, das soziale
hung zu Damons und Harts Beobachtungs- Selbst und das psychologische Selbst als
verfahren, dem Interview zum Selbstverstehen. Aspekte des «Self-as-object» berücksichtigt. Die
Einerseits ist das Modell in der vorliegenden sieben genannten Aspekte bilden die hori-
Fassung aus früheren Interviewdaten hervor- zontale Dimension des Selbst, die mit der ver-
gegangen, andererseits ist das Interview die tikalen Dimension ontogenetischer Verände-
Umsetzung des Modells. Deshalb werden wir rungen zu einem umfassenden Entwicklungs-
im folgenden zunächst kurz auf das Modell modell kombiniert wird. Auf der vertikalen
des Selbst eingehen. Dimension unterscheiden Damon und Hart
280 Methoden und Verfahren

vier qualitativ voneinander unterschiedene


Entwicklungsstufen: Item 1: Selbstdefinition
What are you like? What kind of person are you?
What are you not like?3
– Niveau 1 (frühe Kindheit): Selbstidentifika-
tion in Kategorien
Das Kind erlebt und versteht sich selbst Item 2: Selbstevaluation
durch die Zuordnung zu separaten Kate- What are you especially proud of about yourself?
What do you like most about yourself? What are
gorien, die für sich als jeweils ausreichend
you not proud of? What do you like least about
gesehen werden. yourself?
– Niveau 2 (mittlere und späte Kindheit):
Selbsteinordnung durch Vergleich
Item 3: Das Selbst in der Vergangenheit und Zukunft
Das Selbst wird in Relation zu anderen
Do you think you’ll be the same or different five
Personen und durch den Vergleich mit years from now? How about when you’re an adult?
normativen Standards gesehen. How about five years ago? How about when you
– Niveau 3 (frühes Jugendalter): Verstehen were a baby?
des Selbst durch interpersonale Implikationen
Bei der Bestimmung des Selbstkonzepts Item 4: Interessen des Selbst
liegt die Aufmerksamkeit auf dem Um- What do you want to be like? What kind of person
gang mit anderen Personen und auf Merk- do you want to be? What do you hope for in life? If
malen, die diesen Umgang bestimmen. you could have three wishes, what would they be?
What do you think is good for you?
– Niveau 4 (spätes Jugendalter): Definition des
Selbst durch eigene Überzeugungen und Pläne
Beispielsweise wird die eigene Identität Item 5: Kontinuität
durch philosophische oder moralische Do you change at all from year to year? How (how
Grundüberzeugungen oder über Ideologi- not)? If you do change from year to year, how do
you know it’s still always you?
en definiert.

Item 6: Erleben der Selbstverantwortlichkeit für Ver-


änderungen
Damons und Harts (1988, darin: Kap. 4) In-
How did you get to be the way you are? How did
terview zum Selbstkonzept ist eine unmittel- that make you the kind of person you are? How
bare Umsetzung dieses Modells. Es besteht could you become different?
aus sieben «Kernitems». Die ersten vier Fra-
gen beziehen sich auf «The-self-as-object», die Item 7: Einmaligkeit (Distinktheit)
anderen auf «The-self-as-subject». Zu jeder
Do you think there is anyone who is exactly like
Kernfrage enthält der Interviewleitfaden Vor- you? What makes you different from anyone you
schläge für Nachfragen («probe questions»), know?
die hier jedoch nicht ausgeführt werden kön-
nen.
Das Interview ist eng verknüpft mit dem
Auswertungsmanual, das ebenfalls auf der 6.2 Durchführung und Aufzeichnung
Grundlage des Entwicklungsmodells konstru-
iert worden ist. Darin ist erstens festgelegt, Das zentrale Merkmal des partiell strukturier-
wie die zu beurteilenden Einheiten («chunks») ten Interviews liegt in der Flexibilität, die es
identifiziert werden können. Zweitens wer- dem Versuchsleiter gewährt und von ihm ver-
den für jeden der oben genannten sieben langt. Ein Interviewleitfaden der im Beispiel
Aspekte des Selbst jeweils prototypische Ant- beschriebenen Art ist einerseits eine eindeuti-
worten für die vier Entwicklungsniveaus be-
schrieben. Dementsprechend verläuft die
Auswertung so, daß zunächst eine Zuord- 3 Wir behalten die Originalformulierung aus dem In-
nung der Chunks zu den Bereichen und dann terviewleitfaden bei, um deutlich zu machen, daß die
eine Einschätzung des Entwicklungsniveaus Kernfragen im konkreten Einzelfall der Abwandlung in
vorgenommen wird. eine altersgemäße Formulierung bedürfen.
Tagebücher, Gespräche und Erzählungen 281
ge Festlegung der unverzichtbaren Themen und gen im Umgang mit Kindern und sein theo-
Fragestellungen des Gesprächs auf der konzep- retisches Fachwissen über das Untersu-
tuellen Ebene. Andererseits aber soll er auch chungsthema so zu nutzen, daß er das Inter-
nicht mehr als das sein. In keiner Weise wird view im individuellen Fall so gestaltet, daß es
dadurch die Transformation von Themen und trotz Unterschieden auf der Oberfläche der
Fragenkomplexen in eine verbindliche sprach- Formulierung bei den Kindern die gleichen
liche Formulierung festgelegt. kognitiven Strukturen aktiviert. Weil identi-
In dieser Eigenart wird, je nach methodo- sche Fragen sehr unterschiedlich verstanden
logischer Orientierung, ein entscheidender werden können, führt hingegen eine strikte
Vorzug oder ein gravierender Nachteil gese- oberflächliche Standardisierung eher zu un-
hen. Damon und Hart (1988, S. 78 [Überset- terschiedlichen subjektiven Interpretationen
zung vom Autor]) betonen den Vorzug: durch die Heranwachsenden.
Der Spielraum beim partiell strukturierten
«Die Attraktivität der klinischen Methode
Interview stellt für den Forscher aber auch
liegt in ihrer Flexibilität. Obwohl das In-
eine große Herausforderung dar, denn anders
terview immer unverzichtbare Kernthe-
als bei der (idealerweise) völlig standardisier-
men und Kernfragen enthält, darf (und
ten Durchführung von Experimenten oder
muß) die Formulierung der Fragen vari-
psychometrischen Tests hat er einen weitge-
iert werden, wenn es das Verständnis
henden Handlungsspielraum, den er mehr
des Untersuchungsteilnehmers erfordert.
oder weniger gut nutzen kann – mit der weit-
Gleichermaßen dürfen (und müssen) Fra-
gehenden Konsequenz, daß er sich mehr oder
gen hinzugefügt werden, wenn nur so
weniger gut dem Untersuchungsgegenstand
seine Gedankengänge verdeutlicht wer-
annähert. Piaget selbst hat die Anforderun-
den können.»
gen an den Forscher im partiell strukturieren
Interview prägnant beschrieben (1988/1926,
Für die Befürworter liegt der Vorzug darin, S. 21):
daß beim diagnostischen Gespräch des For-
«Die klinische Untersuchung ist somit
schers mit dem Kind oder Jugendlichen – wie
experimentell, insofern der Kliniker Pro-
bei jedem Gespräch! – die Prozesse des Mei-
bleme aufwirft, Hypothesen aufstellt,
nens und Verstehens bedacht werden müs-
die Bedingungen variiert und schließlich
sen. Dieselbe Frage des Untersuchers kann
seine Hypothesen an den durch das Ge-
von verschiedenen Personen, zumal von Kin-
spräch ausgelösten Reaktionen über-
dern, völlig verschieden verstanden werden.
prüft. Die klinische Untersuchung be-
Sie kann sogar mißverstanden werden, das
steht aber auch aus direkter Beobach-
heißt, anders als vom Fragesteller intendiert.
tung, insofern der gute Kliniker sich
Dieser Gesichtspunkt gewinnt dadurch noch
selbst lenken läßt, indem er lenkt, und
an Gewicht, daß beim diagnostischen Ge-
den ganzen geistigen Kontext berück-
spräch in der kognitiven Entwicklungspsy-
sichtigt, anstatt «systematischen Feh-
chologie nicht die Antworten selbst der Ziel-
lern» zum Opfer zu fallen, was beim rei-
punkt sind, sondern kognitive Strukturen
nen Experimentieren oft der Fall ist.»
«hinter» den Antworten. Der Spielraum beim
partiell standardisierten Interview versetzt
den Beobachter in die Lage, seine alltagspsy- Aus dieser Anforderungsanalyse zieht Piaget
chologischen Kenntnisse und seine Erfahrun- die unseres Erachtens überzeugende Konse-
quenz, daß ausgiebige Erfahrungen nötig
sind, bevor jemand zu einem guten «Ver-
suchsleiter» wird («mindestens ein Jahr lang
tägliche Übungen»).4
4 Folgt man Piaget an dieser Stelle, so wirft das ein er- Von den Kritikern wird gegen die Flexibi-
schreckendes Licht auf die übliche Psychologieausbil-
dung, in der das Beobachten im Vergleich zur mathe-
lität der Methode eingewendet, daß dadurch
matisch-statistischen Datenanalyse immer noch kraß das Grundpostulat empirischer Forschung,
vernachlässigt wird! das Bemühen um Kontrollierbarkeit und Wie-
282 Methoden und Verfahren

derholbarkeit der Bedingungen, verletzt fach versucht, den Fragesteller zufrieden-


werde. Nach traditionellem Methodenver- zustellen, ohne sein eigenes Denken zu
ständnis versucht man, die Bedingungen wei- bemühen, so sprechen wir von einer sug-
testgehend zu kontrollieren (eben zu «stan- gerierten Überzeugung.»
dardisieren»), um die Objektivität und die 4. «Wenn das Kind mit Überlegung antwor-
Genauigkeit der Beobachtungen zu gewähr- tet und seine Antwort aus sich selbst her-
leisten. Wir glauben nicht, daß es an diesem ausholt, ohne daß sie ihm suggeriert
Punkt eine Einigung zwischen Befürwortern wurde, wenn aber die Frage neu für es ist,
und Kritikern des klinischen bzw. partiell so sprechen wir von ausgelöster Überzeu-
standardisierten Interviews geben kann, weil gung ....».
hinter der Kontroverse um die Standardisiert- 5. «Wenn das Kind schließlich nicht nach-
heit bzw. Kontrolliertheit von Beobachtungs- denken muß, bevor es auf die Frage ant-
verfahren fundamentale Gegensätze in der wortet, sondern eine fix und fertige, weil
Auffassung über den Gegenstand der Ent- bereits formulierte oder formulierbare
wicklungspsychologie stehen (s. Abschnitt 8). Antwort geben kann, so ist das eine spon-
Nimmt man Piagets oben zitierte Mah- tane Überzeugung.»
nung ernst, daß nur erfahrene Forscher kom-
petente Versuchsleiter in partiell strukturier-
ten Interviews sind, so könnte bei der heute Der Forscher muß sich darüber klar werden,
üblichen Praxis bei vielen Untersuchungen welche Arten von Antworten bei seiner Fra-
die unzureichende Durchführungsobjekti- gestellung relevant sind. In den meisten
vität nicht als Einwand gegen die Methode, Fällen dürften Antworten aus Desinteresse,
sondern als Hinweis auf das unzureichende Fabulieren und suggerierte Überzeugungen
Training der Beobachter verstanden werden. irrelevant sein. Ob ihn nur spontane Über-
Daß das Kind Fragen und Absichten des zeugungen oder auch ausgelöste Überzeugun-
Gesprächspartners anders verstehen kann, als gen beschäftigen, ist ebenfalls eine der Unter-
sie gemeint sind, ist nur ein Problem bei Ge- suchung selbst vorgeordnete Frage. In den
sprächen Erwachsener mit Kindern. Ein an- meisten Fällen aber wird der Forscher an den
deres besteht darin, daß der Erwachsene Kompetenzen des Kindes interessiert sein. Im
(hier: der Forscher) aus den Antworten der Sinne des «Testing-the-limits»-Gedankens
Kinder falsche Rückschlüsse zieht, weil er sie wird es ihm darum gehen, die oberen Gren-
nicht richtig einzuordnen weiß. Bereits Pia- zen des Verstehens, das maximale Denk-
get hatte fünf «Reaktionstypen» beim klini- niveau oder den höchsten Komplexitätsgrad
schen Interview unterschieden (1988/1926, S. der Strukturen aufzudecken: «Die Fragestrate-
24 – 25), je nach der «Bewußtseinsstufe» des gie des Versuchsleiters muß darauf abgestellt
Kindes: sein, daß die Versuchsperson nicht nur die
Möglichkeit hat, ihre Vorstellungen auszu-
1. «Wenn die gestellte Frage das Kind lang- drücken, sondern daß sie dazu sogar ermutigt
weilt oder ganz allgemein bei ihm kein wird» (Damon & Hart, 1988, S. 84 [Überset-
Bemühen um ein Verständnis auslöst, so zung des Autors]).
antwortet es irgend etwas und irgendwie Wie jede entwicklungspsychologische Dia-
... .» Wir schlagen vor, diesen Antwortty- gnose, so ist auch die Diagnose des Entwick-
pus als Antworten aus Desinteresse zu be- lungsstandes mittels partiell strukturiertem
zeichnen.5 Interview prinzipiell mit zwei möglichen
2. «Wenn das Kind, ohne sich dabei etwas Fehlerrisiken behaftet: dem Risiko für falsche
zu überlegen, mit einer selbst erfundenen Positive und falsche Negative (s. ausführlich
Geschichte, an die es nicht oder nur rein Flavell, 1985, darin: Kap. 9). Von falschen Po-
verbal glaubt, auf die Frage antwortet, so
nennen wir das Fabulieren.»
3. «Wenn sich das Kind Mühe gibt, auf die 5 In der deutschen Übersetzung (Piaget, 1988, S. 24)
Frage zu antworten, wenn aber die Frage wird «Mir-ist-es-Wurstismus» vorgeschlagen, ein
suggestiv ist oder aber das Kind ganz ein- sprachliches Ungetüm.
Tagebücher, Gespräche und Erzählungen 283
sitiven spricht man, wenn aufgrund der Dia- daß sowohl der Interviewleitfaden als auch
gnose angenommen wird, daß das Kind über die Antwortkategorien des Auswertungsma-
bestimmte Begriffe, Denkstrukturen etc. ver- nuals unter Bezugnahme auf eine substantiel-
fügt, obwohl es diese «in Wirklichkeit» noch le Theorie konstruiert worden sind. Im Falle
nicht hat. Falsche Negative liegen dann vor, von Damon und Hart war der Bezugspunkt
wenn fälschlicherweise deren Fehlen diagno- die in der Nachfolge von James und Mead
stiziert wird. Falsche Positive und falsche Ne- entworfene Theorie der Selbstkonzeptent-
gative stehen am Ende des diagnostischen wicklung.
Prozesses, jedoch werden die Fehlerrisiken Das Beispiel lehrt aber auch, daß der Zu-
durch Maßnahmen sowohl während des In- sammenhang von Theorie und Interview-
terviews als auch bei der Auswertung beein- durchführung und -auswertung als Prozeß ge-
flußt. Beispielsweise steigt das Risiko für sehen werden muß. Damon und Hart haben
falsche Positive, wenn der Beobachter dem der Theorie nach Maßgabe von Interviewda-
Kind oder Jugendlichen die «richtige» Ant- ten die letzte Fassung gegeben. Und anderer-
wort suggeriert, und das Risiko für falsche Ne- seits gilt: Interviewleitfaden und Auswer-
gative wächst, wenn die befragte Person die tungsmanual wurden der veränderten Theo-
Aufgabe nicht verstanden hat oder die richti- rie angepaßt. Diese fortwährende Adaption
ge Antwort aus Desinteresse verweigert. von Theorie und Untersuchungsverfahren
Die heute normalerweise verfügbaren Mit- unter wechselweiser Bezugnahme mag einem
tel der Aufzeichnung von Interviews per klassischen Forschungsideal widersprechen,
Audio oder Video eröffnen manchmal die bei dem die Phasen der theoretischen Deduk-
Möglichkeit, das Wirken dieser Risikofakto- tion, der Beobachtung und der Interpretation
ren bei der Durchführung von Interviews post strikt aufeinander folgen. Aber es entspricht
hoc aufzudecken. Wir können auf Kassette viel eher der Praxis. Häufig entwickeln wir
protokollierte Gespräche wieder und wieder ein vorläufiges Auswertungsmanual auf theo-
anhören oder ansehen. Zweifellos liegt eine retischer Grundlage, erproben es dann an-
Grenze gegenüber der Originalbeobachtung hand von einigen Beobachtungen, stellen
durch einen beim Interview anwesenden Be- fest, daß es revisionsbedürftig ist, verändern
obachter darin, daß selbst Videoaufnahmen es und wenden dann die veränderte Version
nie ein vollständiges Protokoll der Untersu- auf den Großteil der Beobachtungen an.
chung darstellen, weil zum Beispiel schon die Neben dieser theorieorientierten und sogar
Kameraperspektive eine Reduzierung dar- theorieprüfenden Anwendung mag es Fälle
stellt. Unsere eigenen Erfahrungen sprechen geben, wo das partiell strukturierte Interview
dafür, daß man gemäß dem Prinzip, daß man mit primär heuristischer Zielsetzung verwen-
«nur das sieht, was man weiß», Einflüsse und det wird, um Phänomene besser kennenzu-
Prozesse im Interview manchmal erst beim lernen oder die theoretische Analyse durch
wiederholten Anschauen entdeckt, weil sich Anregungen aus der Empirie zu vertiefen.
zwischenzeitlich die eigenen Voraussetzun- Von der Zielsetzung bei der Anwendung un-
gen und Perspektiven verändert haben. berührt ist die grundsätzliche Entscheidung,
ob die Auswertung quantitativ und / oder qua-
litativ erfolgt.
6.3 Auswertung Es ist ein verbreitetes Mißverständnis zu
glauben, wegen der Freiheitsgrade bei der
Kennzeichnend für das partiell strukturierte Durchführung sei keine «strenge» quantitati-
Interview in der exemplarischen Studie von ve Auswertung von partiell strukturierten In-
Damon und Hart war die enge Verknüpfung terviews möglich. Unsere exemplarische Stu-
zwischen der substantiellen Theorie, der die beweist das Gegenteil. Unter Anwendung
Durchführung des Interviews und der Aus- der Richtlinien des Auswertungsmanuals lie-
wertung (s.o.). Dieser theoretische Konnex ist fern Damon und Hart zunächst eine präzise
in der Tradition des genetischen Strukturalis- quantitative Beschreibung der Auswertungs-
mus bzw. des kognitiv-strukturtheoretischen objektivität bei Durchführung ihres Untersu-
Ansatzes zwingend notwendig. Er impliziert, chungsverfahrens im Querschnitt und im
284 Methoden und Verfahren

Längsschnitt. Beispielsweise berechneten sie Graff, 1984). Beispielsweise ist unter dem
in einer Querschnittstudie an 82 Mädchen Stichwort «Geschichtengrammatik» unter-
und Jungen im Alter von sechs bis 16 Jahren sucht worden, wann und wie Kinder Wissen
als Maßzahl Cohen’s Kappa. Sie beträgt für die über den prototypischen Aufbau von Ge-
Aspekte des «Self-as-object» Kappa = .79, wenn schichten erwerben. Es versteht sich von
man prüft, ob verschiedene Auswerter zu selbst, daß in diesem Zusammenhang Erzäh-
identischen Entwicklungsniveaus kommen lungen oder Nacherzählungen von Kindern
(Damon & Hart, 1988, S. 89). Damon und beobachtet worden sind. Die psychoanalyti-
Hart gehen in der Quantifizierung sogar so sche Erforschung kindlicher Phantasien hat
weit, daß sie nicht nur für jede Altersstufe an- sich ebenfalls des Mediums der Erzählung be-
geben, welcher Prozentsatz der Probanden dient. So sammelten etwa Pitcher und Prelin-
sich auf den verschiedenen Entwicklungsni- ger (1963) Geschichten von zwei- bis fünf-
veaus befindet, sondern sie berechnen sogar jährigen Kindern und analysierten sie hin-
ein (gewichtetes) durchschnittliches Entwick- sichtlich der Form und des Inhalts der Phan-
lungsniveau. tasietätigkeit.
Unabhängig davon, ob die Auswertung Das immense Interesse an Narrativa außer-
quantitativ oder qualitativ erfolgt, drohen halb der Sprachpsychologie ist nach unseren
abermals dieselben Diagnosefehler wie bei Beobachtungen ein sehr aktueller Vorgang,
der Durchführung der Interviews. Im konkre- der allenfalls die letzten zehn Jahre umfaßt.
ten Beispiel: Das tatsächlich erreichte Ent- Er ist eng gekoppelt mit zwei zusammenhän-
wicklungsniveau des Selbstkonzepts wird genden Veränderungen auf der Ebene der
überschätzt (falsche Positive), oder es wird Metatheorie, das heißt, der Perspektive, in
unterschätzt (falsche Negative). Piagets Hin- der Entwicklungspsychologie betrieben wird.
weis auf die Rolle der Erfahrung gilt auch Erstens hat sich die Analyse des Entwick-
hier: Durch aufwendiges und ausführliches lungsprozesses in manchen Bereichen – etwa
Auswertertraining kann aller Erfahrung nach bei der Entwicklung des Selbst, der Moral und
die Beurteilerübereinstimmung (Auswer- von personalen Bindungen – zunehmend
tungsobjektivität) erhöht werden. Allerdings mehr auf den Einfluß alltäglicher, kulturell
bedeutet die höhere Übereinstimmung nicht vermittelter Erfahrungen gerichtet. Beispiels-
notwendig, daß das Risiko für falsche Positive weise spielen in der Psychologie der Moral-
oder falsche Negative reduziert wird, wenn es entwicklung die Fragen, wie der soziokultu-
sich um einen systematischen Fehler handelt. relle Rahmen die moralischen Erfahrungen
eines Heranwachsenden bestimmt, wie mora-
lische Normen, Regeln und Werte in persönli-
7. Erzählungen chen Interaktionen sozial vermittelt werden
und wie diese sozialen Erfahrungen internali-
Erzählungen sind bereits in den ersten Deka- siert werden, eine immer größere Rolle (Day
den dieses Jahrhunderts eine wichtige Daten- & Tappan, 1996). Zweitens gibt es eine zu-
quelle für die Entwicklungspsychologie gewe- nehmende Akzeptanz für die Auffassung, daß
sen. Die in Abschnitt 2 erwähnten Tagebuch- jegliche Erfahrung dieselbe Grundstruktur
aufzeichnungen des Ehepaars Stern, die Ge- wie die Erzählung hat: Sie wird als eine Abfol-
spräche, die David und Rosa Katz mit ihren ge von Geschehnissen in Raum und Zeit ver-
Kindern geführt haben, und die von Charlot- standen. Das ist der Grund dafür, daß eine
te Bühler gesammelten Jugendtagebücher Person, wenn sie berichten soll, was passiert
enthalten eine Vielzahl von Erzählungen ist, eine Geschichte erzählen wird. Sarbin
(Narrativa) der unterschiedlichsten Art: Er- (1990) hat auf dieser Grundlage für die Psy-
zählungen über Erlebnisse, reine Phantasiege- chologie der Moral das «Grundprinzip der Er-
schichten, Darstellungen des Selbsterlebens zählstruktur» formuliert: Moralisches Verste-
in Erzählform. hen und Handeln müssen vom Forscher
Für die Sprachentwicklungspsychologie unter Bezug auf die Sinnstiftung, die morali-
sind Erzählungen immer eine wichtige Unter- sche Erfahrungen durch die Interpretation als
suchungsmethode gewesen (s. etwa Hoppe- Narrativa erhalten, gedeutet werden.
Tagebücher, Gespräche und Erzählungen 285
Die exemplarische Studie ist so ausgewählt Situation gewesen, in der Sie eine Entschei-
worden, daß die enge Verknüpfung zwischen dung zu fällen hatten, sich aber nicht sicher
Theorie- und Methodenwandel deutlich waren, was die richtige Wahl war?» Ergänzen-
wird. Nach Einschätzung von Day und Tap- de Nachfragen bezogen sich auf die genauere
pan (1996) gehört die Untersuchung zur mo- Beschreibung der Ausgangssituation, die Prä-
ralischen Orientierung von Gilligan und zisierung des subjektiv erlebten Konfliktes,
Attanucci (1988) zu jenen Arbeiten, die «die die Begründung für die letztlich getroffene
narrative Wende» («narrative turn») in der Wahl und die Erläuterung von Begriffen wie
Moralentwicklungspsychologie vorbereitet Verantwortlichkeit, Verpflichtung, Moral,
haben. Auch für die Entwicklung des Selbst Fairneß und Fürsorglichkeit, wenn diese von
(Engel, 1995; Nelson, 1989; Engel & Hoppe- den Versuchsteilnehmern gebraucht worden
Graff, in Druck a), des Gewissens (Kochanska, waren.
Padavich & Koenig, 1996) und von Bindun- Die Untersuchung wurde in Form von Ein-
gen (Oppenheim, Emde & Warren, 1997) zelgesprächen durchgeführt, auf Audiorecor-
scheint die großspurig anmutende Wendeme- der aufgenommen und später transkribiert.
tapher, jedenfalls als Trendbeschreibung, Die inhaltsanalytische Auswertung erfolgte
nicht überzogen zu sein. anhand eines von Lyons (1982) erstellten
Auswertungsmanuals («Manual for Coding
Real Life Dilemmas»). Sie begann mit der
Identifizierung von Analyseeinheiten, hier
7.1 Exemplarische Studie: «moralische Erwägungen» genannt. Eine mo-
Gilligan & Attanucci (1988) ralische Erwägung ist definiert als eine einzel-
ne Idee, die bei der Diskussion eines morali-
Im Rückblick ist es erstaunlich, daß Kohl- schen Problems angeführt wird. Im nächsten
bergs Stufen des moralischen Urteilens für Schritt wurde unter Nutzung von Kriterien
Jahrzehnte als umfassende, inhaltsunabhän- und Beispielen aus dem Manual beurteilt, ob
gige Entwicklungsschritte bei der Beurteilung es sich um eine «moralische Erwägung unter
der Geltung von moralischen Normen ange- dem Gesichtspunkt der Gerechtigkeit» («justice
sehen worden sind. Vornehmlich Carol Gilli- consideration») oder um eine Fürsorge-Er-
gan (1984 / 1982) ist es zu verdanken, daß seit wägung («care consideration») handelte. Für
Mitte der achtziger Jahre immer deutlicher er- die Beurteilungen unabhängiger Rater be-
kannt wurde, daß sich Kohlbergs Beschrei- rechneten Gilligan und Attanucci als Maß der
bung nur auf die Orientierung an einer Moral Auswertungsobjektivität einen Prozentsatz
der Gerechtigkeit bezieht (s. auch Engel & von 80 % übereinstimmender Kategorisierun-
Hoppe-Graff, in Druck b). Gilligan hat dieser gen.
Ausrichtung als Ergänzung die Orientierung
an einer Moral der Fürsorge zur Seite gestellt. Die wichtigsten Ergebnisse werden von den
Die Studie von Gilligan und Attanucci (1988) Autorinnen folgendermaßen zusammenge-
verfolgte die Zielsetzung, diese beiden morali- faßt:
schen Orientierungen näher zu untersuchen
und zu bestimmen, in welchem Maße Män- 1. Bei der Abwägung moralischer Fragen ori-
ner und Frauen auf Gerechtigkeit oder Fürsor- entieren sich die meisten Personen so-
ge bezug nehmen, wenn sie über moralische wohl am Gesichtspunkt der Gerechtigkeit
Konflikte in ihrem alltäglichem Leben nach- als auch am Maßstab der Fürsorge, aber in
denken. der Regel überwiegt der eine oder der an-
46 Männer und 34 Frauen im Alter von 14 dere Gesichtspunkt.
bis 77 Jahren, darunter eine Teilstichprobe 2. Es gibt einen Zusammenhang zwischen
von 14 bis 18jährigen Jugendlichen, wurden moralischer Orientierung und Geschlecht,
mit folgender Instruktion gebeten, ein mora- denn Frauen orientieren sich eher am Ge-
lisches Dilemma aus ihrem Lebensalltag zu sichtspunkt der Fürsorge, Männer ganz
erzählen: «Haben Sie jemals einen morali- überwiegend am Gesichtspunkt der Ge-
schen Konflikt erlebt? Sind sie also in einer rechtigkeit.
286 Methoden und Verfahren

7.2 Durchführung und Aufzeichnung ten, die Geschichte fortzusetzen. Wenn man
auf dieser Grundlage auf Merkmale oder Be-
Grundsätzlich hat der Forscher zwei Möglich- findlichkeiten beim Kind zurückschließt, so
keiten, um Erzählungen zu beobachten. Er geht man implizit von der einen oder ande-
sammelt entweder spontan geäußerte Erzäh- ren Version der Projektionsannahme aus. Das
lungen, oder er leitet das Kind oder den Ju- heißt, man nimmt beispielsweise an, daß das
gendlichen durch geeignete Instruktionen Kind das eigene Gewissen (Kochanska et al.,
dazu an, etwas zu erzählen. Spontane Erzäh- 1996), die selbst erfahrenen Mißhandlungen
lungen sind typisch für Tagebuchstudien. So (Buchsbaum, Toth, Clyman, Cicchetti &
notierte das Ehepaar Stern eine Vielzahl von Emde, 1992) oder die eigenen Gefühle ge-
spontanen Erzählungen des Sohnes Günther, genüber der Mutter (Oppenheim et al., 1997)
in denen er die Phantasiegestalt eines ima- in die Inhalte und / oder in die Art und Weise,
ginären Gefährten erfand. In Abschnitt 5.1 wie die Geschichte erzählt wird, projiziert
haben wir aus der Studie von Mendelson eine hat.
von Simon erfundene Geschichte zitiert, in Kochanska et al. (1996) bezeichnen jene
der Familienrollen in eine Phantasiewelt Komponente des Gewissens, die sich in hy-
transformiert werden. pothetischen Geschichten äußert, als das «de-
Verschiedene Gründe können dafür spre- klarative Wissen» bei moralischen Themen.
chen, Heranwachsende zur Äußerung von Davon sind die tatsächlichen Handlungen in
Narrativa anzuleiten. Erstens sind, wie moralischen Situationen zu unterscheiden,
Pitcher und Prelinger (1963) berichten, spon- die in Fortführung der kognitionspsychologi-
tane Erzählungen selten, wenn der Versuchs- schen Begrifflichkeit «prozedurales Wissen»
leiter, anders als in Tagebuchstudien, keine genannt werden. Das Vorgehen in dieser Stu-
vertraute Person ist. Zweitens besteht in der die eignet sich sehr gut, um zu zeigen, wie
Anleitung die Möglichkeit, die Aufmerksam- man bei Kindern im Vorschulalter mit Erfolg
keit des Kindes oder Jugendlichen in eine be- hypothetische Erzählungen auslösen kann.
stimmte Richtung zu lenken und dadurch Wir werden es deshalb ausführlicher be-
Geschichten eines bestimmten Typs hinsicht- schreiben.
lich Inhalt, Realitätsgehalt oder Struktur zu Die Präsentation von Geschichtenanfän-
provozieren. gen wird durch die Vorgabe von Spielmaterial
Die exemplarische Studie von Gilligan und unterstützt, insbesondere durch Spielpuppen,
Attanucchi (1988) veranschaulicht, wie durch die Jungen oder Mädchen abbilden. Das Kind
die Instruktion der Versuchsleiterin das Spek- gibt den Figuren Namen, die von der Ver-
trum möglicher Erzählinhalte eingegrenzt suchsleiterin dann bei der Einführung der
wird. Sie zeigt auch, wie die Methode des par- Geschichten übernommen werden. Jeder Ge-
tiell standardisierten Interviews ein geeigne- schichtenanfang wird außerdem durch die
ter Weg zur Erhebung von Erzählungen über Präsentation entsprechender Requisiten un-
real erlebte Geschehnisse sein kann. Die Au- terstützt. Einer der Anfänge behandelt das Di-
torinnen bitten die Versuchsteilnehmer aus- lemma, daß es dem (Spielzeug-)Kind von der
drücklich, reale («real life») moralische Kon- Mutter verboten worden ist, an das Regal im
flikte zu erzählen, weil sie annehmen, auf Badezimmer zu gehen, daß sich aber dort ein
diesem Wege eher etwas über die tatsächliche Verband befindet, den das Kind braucht, weil
moralische Orientierung zu erfahren, als sich ein anderes Kind beim Spielen am Knie
wenn Personen über hypothetische Konflikte verletzt hat. Als Requisit wird ein Spielzeugre-
nachdenken. gal mit entsprechendem Verbandszeug ge-
In vielen aktuellen Studien, in denen Er- zeigt. Das teilnehmende Kind wurde nun bei
zählungen gesammelt werden, richtet sich jedem der Szenarien mit einer Reihe von
das Interesse allerdings ausdrücklich auf Nar- Standardfragen gebeten, die Geschichten wei-
rativa über hypothetische Situationen. Dem terzuerzählen. Da es in der Regel die Figur,
Kind wird, meistens in einem Spielrahmen, die für den Protagonisten der Geschichte
ein fiktiver «Geschichtenbeginn» («story steht, auch die Handlung ausführen läßt, lie-
stem») vorgegeben, und es wird dann gebe- gen häufig Erzählungen in zwei Modalitäten
Tagebücher, Gespräche und Erzählungen 287
vor: verbale Erzählungen und «Erzählungen» che Informationen und Auswertungsmög-
in Handlungen. Die Versuchsdurchführung lichkeiten. Das Audio- und Videomaterial
wird vollständig auf Video aufgenommen; kann beliebig oft verwendet werden, um die
deshalb können die Informationen aus bei- Auswerter zu trainieren, um verschiedenste
den «Kanälen» bei der inhaltsanalytischen Auswertungsgesichtspunkte an die Beobach-
Auswertung berücksichtigt werden (s. u.). tungen heranzutragen, um die Auswertungs-
Bei der Konstruktion der Geschichtenan- objektivität zu bestimmen und schließlich
fänge und der Auswahl der unterstützenden um Sekundäranalysen durchzuführen.
Requisiten haben Kochanska et al. (1996) auf
die «MacArthur Story-Stem Battery» (MSSB)
zurückgegriffen, ein inzwischen in der Fachli- 7.3 Auswertung
teratur verbreitetes Verfahren zur Unterstüt-
zung der Produktion von hypothetischen Ge- Erzählungen liegen als Ergebnis der Audio-
schichten bei Vorschulkindern (abgedruckt in oder Videoaufzeichnung als Texte im auditi-
Oppenheim et al., 1997). Es besteht aus zehn ven und ggf. auch im bildlichen Modus vor.
Geschichtenanfängen zu emotional besetzten Der nächste Schritt besteht oftmals darin,
Themen (beispielsweise die von Kochanska et diese Texte von der Audiokassette abzuschrei-
al. (1996) übernommene «Badezimmerregal- ben und das Videomaterial ebenfalls in eine
Geschichte»). Dieses Material eignet sich zur schriftliche Darstellung umzusetzen. Bei
Unterstützung von Erzählungen über unter- sprachentwicklungspsychologischen Fragestel-
schiedlichste Inhaltsbereiche, wenn man den lungen können die schriftlichen Protokolle
Geschichtenanfang oder das unterstützende der Erzählungen hinsichtlich linguistischer
Material entsprechend variiert. Merkmale, zum Beispiel der grammatischen
Day (1991) hat darauf hingewiesen, daß Strukturen oder der Erzählkompetenz, analy-
die Tatsache, daß wir Geschichten in aller siert werden.
Regel für einen bestimmten Zuhörer oder ein Bei allen anderen Fragestellungen ist es er-
bestimmtes Publikum erzählen, auch bei der forderlich, die Erzählungen inhaltsanalytisch
Nutzung von Erzählungen zu diagnostischen oder strukturell zu dem Thema der Untersu-
Zwecken in der Entwicklungspsychologie be- chung in Beziehung zu setzen. Das schließt
achtet werden muß. Bei Tagebuchstudien ist in aller Regel die Nutzung oder Konstruktion
der Zuhörer eine dem Kind sehr vertraute eines entsprechenden Kategoriensystems ein.
Person, und es wird, sofern die Tagebuchauf- Gilligan und Attanucci (1988) konnten auf
zeichnung unwissentlich erfolgt, diesem das bereits erprobte inhaltsanalytische Aus-
Zuhörer die Geschichte nicht anders erzählen wertungsmanual von Lyons (1982) zurück-
als sonst. Führt hingegen ein dem Kind rela- greifen. Das Vorgehen bei der Konstruktion
tiv fremder «Versuchsleiter» die Beobachtun- eines auf die Erzählinhalte bezogenen Aus-
gen durch, so ist der Zuhörer im Erleben des wertungssystems läßt sich anhand der Studie
Kindes eine ganz andere Person als Vater oder von Oppenheim et al. (1997) demonstrieren.
Mutter, und das kann seine Erzählung grund- Ziel der Studie war es herauszufinden, wie die
legend verändern. Beispielsweise könnten Mutter in projektiven Geschichten von vier-
sich zumindest ältere Kinder und Jugendliche bis fünfjährigen Kindern repräsentiert wird.
an die Alltagsregel halten, Fremden nicht Entsprechende Kategorien lagen vor Beginn
alles zu erzählen, oder sie können daran den- der Untersuchung noch nicht vor. Die Kon-
ken, was der andere an Schlußfolgerungen struktion des Kategoriensystems begann
aus den Erzählungen zieht. damit, daß 10 % der Erzählungen auf Video
Beim heutigen Stand der technischen nach Zufall ausgewählt und transkribiert
Möglichkeiten werden Erzählungen von Kin- wurden. Die Transkription schloß neben der
dern in aller Regel per Audio- oder Videokas- Abschrift der sprachlichen Erzählungen auch
sette aufgezeichnet. Besonders wenn man, die Aufzeichnungen aller mit der Spielfigur
wie etwa in der Studie von Kochanska et al. der Mutter ausgeführten Handlungen ein.
(1946), die Kinder die Geschichten auch spie- Als nächstes wurden diese Beschreibungen
len läßt, eröffnet die Videoaufnahme zusätzli- der Mutter durch die Autoren nach Ähnlich-
288 Methoden und Verfahren

keiten gruppiert, wobei die Betonung auf der henden belastenden (oder sogar traumati-
emotionalen Ähnlichkeit lag. So wurden etwa schen) Erlebnissen durch Personen beobach-
die Handlungen des Küssens und des Umar- tet werden, die mit der Welt des jeweiligen
mens und Beschreibungen der Mutter als Kindes genauestens vertraut sind? Ernsthaft
warmherzig zu der Kategorie der Herzlichkeit belastende Erfahrungen von Kindern zu pro-
(«affectionate») zusammengefaßt. Schließlich vozieren, verbietet sich aus ethischen Grün-
ergab sich bei diesem Vorgehen ein System den. Retrospektive Elternbefragungen und
von neun Kategorien zur Beschreibung der Beobachtungen durch einen «externen» Ver-
Repräsentation von Müttern. Dieses an suchsleiter, die auf ausgewählte «standardi-
einem Teil des Beobachtungsmaterials erstell- sierte» Situationen beschränkt sind, dürften
te Kategoriensystem wurde dann von ande- auch nach klassischen Methodenmaßstäben
ren Auswertern bei der Analyse der restlichen schwerwiegende Defizite aufweisen. Also sind
90 % des Videomaterials angewendet. sie keine ernsthafte Alternative zur Tagebuch-
Werden Erzählungen im Rahmen von Ta- aufzeichnung.
gebuchstudien anekdotisch gesammelt, so ist Mendelson (1990) nennt nicht weniger als
es natürlich ohne weiteres möglich, auch die- sechs Gründe dafür, weshalb er zur Untersu-
ses Material in der beschriebenen Weise sy- chung der Frage nach der Verarbeitung der
stematisch inhaltsanalytisch auszuwerten. Geburt eines Geschwisters die Tagebuchme-
Aber darüber hinaus werden einzelne Erzäh- thode bevorzugt:
lungen auch häufig kasuistisch verwendet,
weil sie einen Entwicklungsprozeß besonders – «Ich war kein Außenstehender. Deshalb
prägnant beschreiben und veranschaulichen schuf meine Anwesenheit keinen künstli-
und die Gewichtigkeit dieser einzelnen Beob- chen Kontext, der möglicherweise die Ge-
achtung sich jenseits aller möglichen Quanti- schehnisse verändert hätte.
fizierung dem Beobachter nur erschlossen – Und ich konnte mich wesentlich intensi-
hat, weil er aufgrund seiner persönlichen ver auf die Beobachtungen Simons einlas-
Kenntnis des Kindes dessen Bedeutung er- sen, als es in einer konventionellen Studie
kannt hat. mit 30 oder 40 Kindern möglich gewesen
wäre.
– Ich hatte Zugang zu ausgewählten Infor-
mationen, weil ich als Familienmitglied
8. Stärken und Schwächen mit den Personen hinlänglich vertraut
war und weil ich sehr private Situationen,
der Verfahren wie etwa das Baden und Zubettgehen be-
obachten konnte.
Wir haben in einem früheren Aufsatz – Ich mußte mich nicht auf wenige, relativ
(Hoppe-Graff, 1989b, S. 247–250) für den kurze Beobachtungen beschränken, son-
Themenbereich des Symbolspiels (Fiktions- dern konnte Informationen aus den tag-
spiels) eine Reihe von Fragestellungen be- täglichen Begebenheiten und Begegnun-
schrieben, deren angemessene empirische Un- gen sammeln.
tersuchung nur mittels der Tagebuchstudie – Ich bekam deshalb relevante Ereignisse
möglich erscheint. Darunter fällt etwa die auch sogar dann mit, wenn sie relativ sel-
Frage, ob das spielerische Hineinschlüpfen in ten waren,
fiktive Rollen und Handlungen die Funktion – und ich konnte Entwicklungsprozesse
haben kann, zur Bewältigung von Erfahrun- über ausgedehnte Zeitabschnitte verfol-
gen beizutragen, die emotional belastend gen.» (S. xv [Übersetzung des Autors]).
sind und in der Realität nicht ausreichend be-
arbeitet werden können. Wie sollte die Funk- Führt man sich diese Notwendigkeiten und
tion des Symbolspiels für die Wirklichkeits- Vorzüge der Tagebuchaufzeichnung vor
verarbeitung anders untersucht werden als Augen, so ist zunächst kaum zu verstehen,
dadurch, daß spontane Spielhandlungen im daß sie in Lehrbüchern jahrzehntelang nur
alltäglichen Lebenskontext nach vorherge- dazu diente, zu veranschaulichen, wie ent-
Tagebücher, Gespräche und Erzählungen 289
wicklungspsychologische Forschung nicht In einer solchen Perspektive ist es völlig
auszusehen hat (nach Wright, 1960). Die Auf- konsequent, die bei Tagebuchstudien häufig
lösung des Widerspruchs liegt in der Einsicht im Vordergrund stehenden anekdotischen
in die prinzipielle Relativität von Bewertun- Beobachtungen durch nur einen Beobachter
gen empirisch-psychologischer Datenerhe- als methodisch unzureichend einzustufen, da
bungsverfahren. Ob die von Mendelson auf- deren Objektivität weder quantifiziert wird,
geführten Eigenheiten der Tagebuchaufzeich- noch mangels eines zweiten Beobachters be-
nung Stärken oder Schwächen darstellen, läßt rechnet werden könnte. Allerdings ist es ein
sich nur bei Kenntnis des Wissenschafts- und Trugschluß zu glauben, daß diese Definition
Gegenstandsverständnisses des Forschers und von Objektivität jenen Schutzwall bildet, der
seiner Zielsetzung sagen. Die Geringschät- Wissenschaft von Unwissenschaftlichkeit
zung der Tagebuchstrategie (und in Grenzen trennt! Es würde hier zu weit führen, die ent-
auch des partiell-strukturierten Interviews sprechende wissenschaftstheoretische Diskus-
und der Sammlung von Narrativa) hängt vor sion nachzuzeichnen (s. z. B. Schäfer, 1992),
allem mit speziellen Lesarten des Kriteriums aber es bleibt festzuhalten, daß zum Beispiel
der Objektivität und des Ziels der Generali- im Sinne des kritischen Rationalismus und
sierbarkeit zusammen. seines Hauptvertreters K. R. Popper nicht der
Nachweis der Objektivität in jeder einzelnen Stu-
Objektivität. Der gängigste Einwand gegen die das Objektivitätskriterium bildet, sondern
die Tagebuchbeobachtung lautet, sie liefere die Kritisierbarkeit: «Jede Annahme kann, im
keine objektiven Daten. Auch gegen das par- Prinzip, kritisiert werden. Und daß jeder-
tiell standardisierte Interview, insbesondere mann kritisieren darf, konstituiert wissen-
aber gegen seinen historischen Vorläufer, Pia- schaftliche Objektivität» (Popper, 1958,
gets klinisches Interview, wird dieser Ein- S. 221). Für Popper ist also Kritik – und mit-
wand ins Feld geführt. Die Begründungen hin: Objektivität – gekoppelt an Diskurs: «Öf-
heißen: Es werden dem Beobachter zu wenig fentlichkeit und Offenheit gehören zu dieser
Vorgaben (Standards) für das Verfahren der intersubjektiven Kooperation, und nur aus ihr
Datenerhebung gemacht; und es liegen, kann Objektivität entspringen – niemals aber
zumal bei der Tagebuchstudie durch enge Be- aus dem isolierten Bemühen eines Einzelnen,
zugspersonen des Kindes, in aller Regel keine ‹objektiv zu sein›...» (Schäfer, 1992, S. 71).
zusätzlichen Daten von einem zweiten Beob- Übernimmt man dieses Verständnis von
achter vor, die die Berechnung von Objekti- Objektivität, so haben die anekdotischen Be-
vitätskennwerten erlaubten. obachtungen aus Tagebuchaufzeichnungen
Teilweise haben wir diese Argumente be- dieselbe Chance, objektiv zu werden wie
reits in den Abschnitten 5 und 6 zurückge- «streng kontrollierte» experimentelle Beob-
wiesen (s. dort). An dieser Stelle wollen wir achtungen, und sie werden es tatsächlich,
uns lediglich mit dem impliziten Verständnis wenn sich der Forscher uneingeschränkt und
von Objektivität auseinandersetzen. Nach der offensiv der Kritik durch die «scientific com-
referierten Auffassung sind Beobachtungen munity» stellt. Dazu gehört, daß er die Verfah-
dann objektiv, wenn nachgewiesen wird, daß ren seiner Beobachtung möglichst genau be-
verschiedene Beobachter zu denselben Daten schreibt, die Beobachtungen präzise doku-
kommen (oder das Ausmaß der Übereinstim- mentiert und den Duktus seiner Argumenta-
mung wenigstens genügend groß ist). Be- tion expliziert.
schrieben wird die Höhe der Auswertungsob-
jektivität durch statistische Maßzahlen, z. B. Generalisierbarkeit. Neben der fraglichen
den Prozentsatz übereinstimmender Beob- Objektivität wird gegen die Tagebuchauf-
achtungen oder den Zusammenhangskoeffi- zeichnung häufig eingewendet, daß die Ge-
zienten Kappa. Deshalb läßt sich die Objekti- neralisierbarkeit der Resultate äußerst strittig
vität in diesem Sinne auch nie für eine einzel- sei, zumal wenn sie von nur einem Kind
ne Beobachtung, sondern immer nur für eine stammten. Mit dieser Kritik verbunden ist die
genügend große Stichprobe von Beobachtun- Vorstellung, daß Resultate um so eher verall-
gen angeben. gemeinerbar sind, je größer die Zahl der in
290 Methoden und Verfahren

die Studie einbezogenen Personen ist. Men- Verstehens ist wiederholt gezeigt worden,
delson (1990, S. xvi) weist am Beispiel seiner daß individuelle Differenzen in der Abfol-
Studie auf die Notwendigkeit hin, verschiede- ge von Entwicklungsschritten weitaus ge-
ne Aspekte von Generalisierbarkeit zu unter- ringer sind (wenn sie überhaupt auftre-
scheiden. Sein Ziel ist es, die Erfahrungen ten!) als im Erwerbszeitpunkt.
eines einzelnen Kindes bei der Geburt eines
Geschwisters zur Grundlage zu nehmen, um Die empirische Lösung des Generalisierbar-
die typischen Entwicklungsaufgaben und keitsproblems besteht immer darin, daß in
-prozesse zu identifizieren, die mit diesem Replikationsstudien mit anderen Personen
kritischen Lebensereignis verbunden sind. mit derselben oder veränderter Beobach-
Das ist ein anderes Generalisierungsproblem tungsmethodik geprüft wird, inwieweit die
als die Frage der Verallgemeinerung von Un- Resultate übereinstimmen oder divergieren.
terschieden zwischen Stichproben auf die Für den Umgang von Kindern mit der Geburt
entsprechenden Grundgesamtheiten, bei- eines Geschwisters haben wir beispielsweise
spielsweise die Extrapolation von Geschlecht- eine Replikationsstudie durchgeführt, bei
sunterschieden in Stichproben von Jungen dem sich das Geschlecht und das Alter des
und Mädchen auf Geschlechtsunterschiede Kindes von Mendelsons Originalstudie unter-
«schlechthin». Im zweiten Fall bekommt die schieden (Hoppe-Graff & Schmid, 1997).
Frage der Repräsentativität zusätzliches Ge- Es kann hier nur angedeutet werden, daß
wicht. die Generalisierbarkeit der Resultate der übli-
Es soll aber nicht bestritten werden, daß chen Experimente und der nicht-experimen-
sich Tagebuchstudien, die die Generalisier- tellen «large sample studies» ebenfalls in Frage
barkeit der Resultate über den Einzelfall hin- gestellt werden kann. Die Probleme der Ge-
aus behaupten, auch mit der Berechtigung neralisierbarkeit experimenteller Ergebnisse
dieser Annahme auseinandersetzen müssen. werden üblicherweise unter dem Stichwort
Die «Lösung» des Problems sehen wir auf der externen Validität behandelt. Externe Va-
zwei Ebenen, einer argumentativen und einer lidität ist dann gegeben, wenn die Resultate
empirischen. «Argumentativ» bedeutet, daß einer Untersuchung nicht nur unter den spe-
oftmals bei Kenntnis des Untersuchungsge- zifischen Umständen gültig sind, unter
genstandes und der individuellen Besonder- denen sie durchgeführt wurde, sondern wenn
heiten des Kindes die Generalisierbarkeit der sie darüber hinaus gelten. Für viele experi-
Resultate mehr oder weniger berechtigt er- mentelle Studien in der Entwicklungspsycho-
scheint. Im allgemeinen dürfte gelten, daß logie wird die Generalisierbarkeit entweder
nicht thematisiert oder sie wird stillschwei-
– die Gültigkeit der Ergebnisse für andere gend unterstellt, obwohl wissenschaftstheo-
Personen und Personengruppen in der retische Analysen gegen die externe Validität
frühen Kindheit höher einzuschätzen ist experimentalpsychologischer Befunde spre-
als in späteren Altersabschnitten. Spezifi- chen (Holzkamp, 1964; Gadenne, 1976). Un-
sche Lebensumstände haben beim Säug- tersuchungen an großen Stichproben mün-
ling vermutlich noch einen relativ gerin- den meistens in die Berechnung von statisti-
gen Einfluß; schen Maßzahl (Gruppenkennwerten). Die
– die Generalisierbarkeit für manche Merk- individuelle Gültigkeit für den Einzelfall wird
malsbereiche höher einzuschätzen ist als häufig unterstellt, obwohl sie aus methodi-
für andere. Vermutlich sind interindividu- scher Sicht alles andere als zwingend ist und
elle Differenzen in der Wahrnehmung im die enorme interindividuelle Varianz häufig
allgemeinen geringer als in sozialen Ein- dagegen spricht.
stellungen; Manchmal gewinnen psychologische Da-
– die Verallgemeinerbarkeit auf andere Per- tenerhebungsverfahren dadurch an Attrakti-
sonen für bestimmte Entwicklungsaspekte vität, daß sich nicht nur die methodologi-
eher gegeben ist als für andere. Sowohl für schen Maßstäbe wandeln, sondern auch der
die kognitive Entwicklung als auch für die Untersuchungsgegenstand selbst verändert!
Entwicklung der Moral und des sozialen McAdams (1996) hat in einem Sammelreferat
Tagebücher, Gespräche und Erzählungen 291
nachgezeichnet, wie sich unter den Lebens- schen will. Wie geht dieser dabei vor? Ver-
verhältnissen der Moderne im europäisch- kürzt gesagt besteht sein Tun darin, daß er
nordamerikanischen Kulturkreis das Selbst- sein Netz auswirft, es an Land zieht und den
konzept der Menschen verändert hat. Neben Fang gewissenhaft prüft. Hat er das oft genug
anderen Eigenheiten nennt er als Kernmerk- getan, so könnte er beispielsweise zu der fol-
mal des modernen Selbst die ausdrückliche genden «empirisch begründeten» Feststellung
Suche nach subjektiver zeitlicher Kohärenz. kommen: «Alle Fische sind größer als 5 cm».
Als beobachtungsmethodisches Pendant bie- Bei jedem Fang hat sich diese Aussage be-
ten sich Tagebücher («diaries») und Narrativa stätigt. Einem Skeptiker, der die grundsätzli-
geradezu an: che Bedeutung des Gesetzes mit dem Hinweis
auf die Maschenweite des Netzes (5 cm) be-
«Während der Entwicklung sucht das
streitet, wird der Fischkundler unbeeindruckt
Selbst nach Kohärenz ... .Es ist kein Zu-
entgegnen, daß ihn derartige Objekte (Fische)
fall, daß der Aufstieg der Novelle als
nicht interessieren. Er hält sich an den
einer Kunstform der westlichen Literatur
Grundsatz, daß das, was er nicht fangen
und die zunehmende Popularität von
kann, außerhalb des fischkundlichen Wissens
Journalen, Tagebüchern und anderen au-
liegt.
tobiographischen Darstellungsmitteln
Korrespondenzen zu aktuellen Grundla-
sehr eng mit dem Aufstieg der Moderne
gendiskussionen in der Psychologie sind of-
zusammenfällt. ... Das Selbst bedient
fensichtlich. Dem Netz des Ichthyologen ent-
sich der Konstruktion von Selbsterzäh-
sprechen die Beobachtungsverfahren und
lungen (self-narratives), um im Prozeß
deren konzeptuelle Voraussetzungen (Theori-
der eigenen Veränderung Sinn zu finden»
en, Begriffe, Definitionen), und dem Auswer-
(a.a.O., S. 297–298 [Übersetzung des Au-
fen und Einziehen des Netzes korrespondiert
tors]).
die wissenschaftliche Beobachtung. Der Skep-
tiker geht von der Idee aus, daß es im Meer
eine objektive, vom Beobachter unabhängige
9. Zweites Resümee und Fischwelt gebe, zu der auch Fische gehören
können, die kleiner als 5 cm sind. Aber in der
Ausblick: Das Netz des Kontroverse mit dem Ichthyologen hat er
Ichthyologen, das Beobach- Schwierigkeiten, deren «objektive» Existenz
zu beweisen, da für diesen gilt: Nur jenes Ob-
tungsideal der Naturwissen- jekt ist ein Fisch, das mit meinem Netz gefan-
schaften und Daten- gen werden kann. Der Skeptiker hingegen
erhebung in der Entwick- empfindet das Kriterium der Fangbarkeit mit
dem vorhandenen Netz als eine unzulässige
lungspsychologie subjektive Einschränkung der Wirklichkeit.
Diese Analogie beschreibt die Beziehung
Welche Rolle spielen Verfahren der Datener- des Forschers zur Wirklichkeit naturgemäß
hebung im Prozeß der psychologischen For- nur in grober Vereinfachung, aber sie läßt
schung? Die Antwort lautet: Das hängt davon eine Reihe zentraler Probleme um so deutli-
ab, wie man sich die Beziehung von Wissen- cher hervortreten.
schaft zur Realität vorstellt. Der englische Erstens zeigt sie auf, daß Psychologie nicht
Astrophysiker Sir Arthur Eddington (1939; zi- von der eigentlichen Wirklichkeit handelt, also
tiert nach Dürr, 1997) hat für die Naturwis- nicht von dem Handeln und Erleben von
senschaften eine Analogie entworfen, die sich Menschen, wie es ist, sondern zwangsläufig
unseres Erachtens auf die Psychologie über- nur von einer reduzierten Realität: von jener
tragen läßt, auch wenn die Psychologie qua Realität, die nicht durch die Netze unserer
Gegenstand keine Naturwissenschaft ist. Er Theorien, Begriffe und Beobachtungsmetho-
verdeutlicht das Vorgehen des Wissenschaft- den fällt.
lers anhand der Arbeit eines Ichthyologen Zweitens wird durch die Analogie deutlich,
(Fischkundlers), der das Leben im Meer erfor- welche Konsequenzen sich aus dieser Veren-
292 Methoden und Verfahren

gung der Realität ergeben. Die Reduktion auf Literatur


jene Aspekte, die man nach Maßgabe der an
«Kriterien empirischer Forschung» festge- Bakeman, R. & Gottman, J. M. (1987). Applying obser-
schriebenen Handlungsanweisungen beob- vational methods: a systematic view. In J. D.
achten kann, hat einerseits den Vorteil, daß Osofsky (Hrsg.), Handbook of infant development
die Gesetze des Psychologen präzise und für (2. Aufl.; S. 818–854). New York: Wiley.
Bartsch, K. & Wellman, H. M. (1995). Children talk
jeden nachvollziehbar sind, der sich seiner
about the mind. New York: Oxford University Press.
Methoden der Welterfahrung bedient. Ande- Behrens, H. & Deutsch, W. (1991). Die Tagebücher von
rerseits aber hat sie den Nachteil, daß die auf Clara und William Stern. In W. Deutsch (Hrsg.),
diese Weise erschaffene Welt der wissen- Über die verborgene Aktualität von William Stern
schaftlichen Psychologie nicht nur eine an- (S. 19–38). Frankfurt: Lang.
Bortz, J., Lienert, G. A. & Boehnke, K. (1990). Vertei-
dere Realität als die eigentliche Wirklichkeit lungsfreie Methoden in der Biostatistik. Berlin: Sprin-
ist. Sie ist zudem im Vergleich zur subjektiv ger.
erfahrbaren Welt extrem verändert: Unsere Brown, R. (1973). A first language: The early stages.
ursprüngliche, unmittelbar erlebte Welt ist Cambridge, MA: Harvard University Press.
Buchsbaum, H. K., Toth, S. L., Clyman, R. B., Cicchetti,
viel reichhaltiger als jene, die sich wissen-
D. & Emde, R. N. (1992). The use of a narrative
schaftlich fundieren läßt. story stem technique with maltreated children:
Die Analogie vernachlässigt allerdings, daß implications for theory and practice. Development
Wissenschaft ein dynamischer Prozeß ist. Um and Psychopathology, 4, 603–625.
im Bild zu bleiben: Es bleibt unberücksich- Bühler, C. (1991). Das Seelenleben des Jugendlichen: Ver-
such einer Analyse und Theorie der psychischen Puber-
tigt, daß der Fischkundler sich bemühen tät. Stuttgart: Fischer (Orig. erschienen 1921).
kann, seine Fangmethoden immer raffinier- Colby, A., Kohlberg, L., Gibbs, J. & Lieberman, M.
ter zu gestalten, um auf diesem Wege eine (1983). A longitudinal study of moral judgment.
immer komplexere Vorstellung vom Leben Monographs of the Society for Research in Child Devel-
opment, 48 (Serial No. 200).
im Meer zu gewinnen. Insbesondere wenn er
Connell, R. W. (1971). The child’s construction of politics.
sich auf den oben beschriebenen Standpunkt Carlton (AUS): Melbourne University Press.
des Skeptikers einläßt, wird er nicht bei Damon, W. (1984). Die soziale Welt des Kindes. Frank-
einem grobmaschigem Netz als einziger Fang- furt: Suhrkamp (Original erschienen 1977: The so-
methode stehenbleiben. Wir sehen die Ent- cial world of the child. San Francisco: Jossey-Bass).
Damon, W. & Hart, D. (1988). Self-understanding in
wicklungspsychologie vor einer ähnlichen childhood and adolescence. Cambridge (UK): Cam-
Aufgabe: Wir wissen aufgrund unserer unmit- bridge University Press.
telbar erlebten Realität und beim Blick über Damon, W. & Hart, D. (1992). Self-understanding and
die Fachgrenzen hinaus (etwa in die Ethnolo- its role in social and moral development. In M. H.
Bornstein & M. E. Lamb (Eds.), Developmental psy-
gie und die Pädagogik), daß die menschliche
chology: An advanced textbook (S. 421–464). Hillsda-
Entwicklung einen unvergleichlich reichhal- le, NJ: Erlbaum.
tigeren Bestand an Phänomenen enthält, als Day, J. M. (1991). The moral audience: on the narrati-
er mit den grobmaschigen Netzen der heute ve mediation of moral «judgment» and moral «ac-
präferierten Datenerhebungsverfahren (Expe- tion». In M. B. Tappan & M. J. Packer (Eds.), Narra-
tive and storytelling: Implications for understanding
riment, Fragebogen, «objektive» Verhaltens- moral development (S. 27–42). San Francisco: Jossey-
beobachtung) erfaßt werden kann. Wir sind Bass.
aufgefordert, uns verstärkt um alternative Day, J. M. & Tappan, M. B. (1996). The narrative ap-
Fangmethoden wie etwa Protokolle von Er- proach to moral development: from the epistemic
subject to dialogical selves. Human Development,
zählungen, partiell strukturierte Interviews
39, 67–82.
und Tagebuchaufzeichnungen zu kümmern. Deutsch, W. (Hrsg.). (1991). Über die verborgene Aktua-
Nur so wird es uns gelingen, ein weiteres lität von William Stern. Frankfurt: Lang.
Stück der subjektiv erfahrenen Realität auch Deutsch, W. & Hoppe-Graff, S. (1996). Eingrenzen, Be-
für die Psychologie zu erschließen. grenzen, Ausgrenzen: Anmerkungen zu Jens Asen-
dorpfs Neubestimmung der Persönlichkeitspsy-
chologie. Psychologische Rundschau, 47, 161–163.
Dürr, H. P. (1997). Ist Biologie nur Physik? Universitas,
52, 1–15.
Eddington, A. S. (1939). The philosophy of physical
science. Cambridge: Cambridge University Press.
Tagebücher, Gespräche und Erzählungen 293
Engel, I. & Hoppe-Graff, S. (in Druck a). Das Kind wird buch der Kleinkindforschung (S. 233–251). Berlin:
sich seiner selbst bewußt: Die Entwicklung des Springer.
Selbstkonzepts und des sozialen Verstehens in der Hoppe-Graff, S. & Engel, I. (1996). Entwicklungsmuster
frühen Kindheit. In W. E. Fthenakis (Hrsg.), Wenn und Erwerbsprozesse früher Symbolkompetenzen. Un-
aus Eltern Partner werden. München: Deutscher Fa- veröffentlichter Arbeitsbericht zu einem DFG-Pro-
milien Verband. jekt. Heidelberg: Psychologisches Institut der Uni-
Engel, I. & Hoppe-Graff, S. (in Druck b). Moralent- versität.
wicklung nach Kohlberg: Ein Überblick. In H. Ha- Hoppe-Graff, S. & Kirchgässner, G. (1996). Der Erwerb
nisch, P. Lehmann & H. Schmidt (Hsrg.), Auf Ande- von Gesten in der frühen Kindheit: Eine Tagebuchstu-
re achten: Ethik 9/10 (Lehrerhandbuch). Frankfurt: die. Vortrag auf dem 40. Kongreß der Deutschen
Diesterweg. Gesellschaft für Psychologie in München, 22.–26.
Engel, S. (1995). Why children tell stories. San Francisco: September 1996.
Freeman. Hoppe-Graff, S. & Schmid, M. (1997). Beconing a sister:
Flavell, J. H. (1985). Cognitive development (2. Aufl.). An application of personalistic principles to develop-
Englewood Cliffs, NJ: Prentice-Hall. mental research. Paper presented at the Conference
Fontana, A. & Frey, J. H. (1994). Interviewing: the art Psychological Development from a Personalistic
of science. In N. K. Denzin & Y. S. Lincoln (Hrsg.), Perspective, Washington, DC, October 2–5, 1997.
Handbook of qualitative research (S. 361–376). Thou- Isaacs, S. (1930). Intellectual growth in young children.
sand Oaks, CA: Sage. London: Routledge.
Furth, H. G. (1980). The world of grown-ups: Children’s Isaacs, S. (1967). Social development in young children.
conceptions of society. New York: Elsevier North London: Routledge & Kegan Paul (1. Auflage
Holland. 1933).
Gadenne, V. (1976). Die Gültigkeit psychologischer Un- James, W. (1961). Psychology: The briefer course (1. Auf-
tersuchungen. Stuttgart: Kohlhammer. lage 1892). New York: Harper & Row.
Gardner, H. (1985). The mind’s new science: A history of Katz, D. & Katz, R. (1928). Gespräche mit Kindern: Un-
the cognitive revolution. New York: Basic Books. tersuchungen zur Sozialpsychologie und Pädagogik.
Gergen, K. J. (1992). The saturated self: Dilemmas of Berlin: Springer.
identity in modern life. New York: Basic Books. Kirchgässner, G. (1993a). Zeichenproduktionen in der
Giddens, A. (1991). Modernity and self-identity: Self and frühen Kindheit: Eine Tagebuchstudie. Unveröffent-
society in the late modern age. Stanford, CA: Stan- lichte Diplomarbeit am Psychologischen Institut
ford University Press. der Universität Heidelberg.
Gilligan, C. (1984). Die andere Stimme: Lebenskonflikte Kirchgässner, G. (1993b). Tagebuch: Fabian im Alter von
und Moral der Frau. München: Piper. (Original er- 11–14 Monaten. Unveröffentlichter Zusatzband zur
schienen 1982: In a different voice: Psychological Diplomarbeit am Psychologischen Institut der
theory and women’s development. Cambridge, Universität Heidelberg.
MA: Harvard University Press). Kirk, J. & Miller, M. L. (1986). Reliability and validity in
Gilligan, C. & Attanucci, J. (1988). Two moral orienta- qualitative research. London: Sage.
tions: gender differences and similarities. Merrill- Kochanska, G., Padavich, D. L. & Koenig, A. L. (1996).
Palmer Quarterly, 34, 223–237. Children’s narratives about hypothetical moral di-
Gratch, G. & Schatz, J. A. (1987): Cognitive develop- lemmas and objective measures of their conscien-
ment: the relevance of Piaget’s infancy books. In J. ce: mutual relations and socialization antecedents.
D. Osofsky (Hrsg.), Handbook of infant development Child Development, 67, 1420–1437.
(S. 204–237). New York: Wiley. Kohlberg, L. (1996). Die Psychologie der Moralentwick-
Höhn, E. (1959). Geschichte der Entwicklungspsycho- lung. Frankfurt: Suhrkamp.
logie und ihrer wesentlichsten Ansätze. In H. Tho- Lyons, N. (1992). Conceptions of self and morality and
mae (Hrsg.). Handbuch der Psychologie. Band 3: Ent- modes of moral choice: Identifying justice and care in
wicklungspsychologie (S. 21–45). Göttingen: Hogre- judgments of actual moral dilemmas. Unveröffent-
fe. lichte Dissertation an der Harvard University,
Holzkamp, K. (1964). Theorie und Experiment in der Psy- Cambridge, MA.
chologie. Berlin: De Gruyter. MacWhinney, B. (1991). The Childes Project: Tools for
Hoppe-Graff, S. (1984). Verstehen als kognitiver Pro- analyzing talk. Hillsdale, NJ: Erlbaum.
zeß: Psychologische Ansätze und Beiträge zum McAdams, D. P. (1996). Personality, modernity, and
Textverstehen. Zeitschrift für Literaturwissenschaft the storied self: a contemporary framework for stu-
und Linguistik, 55, 10–37. dying persons. Psychological Inquiry, 7, 295–321.
Hoppe-Graff, S. (1989a). The study of transitions in de- McCune-Nicolich, L. (1983). A manual for analyzing
velopment: potentialities and limitations of the free play. Überarbeitete Auflage. New Brunswick,
longitudinal approach. In A. de Ribaupierre NJ: Rutgers University.
(Hrsg.), Transition mechanisms in child development: Mendelson, M. J. (1990). Becoming a brother. Cambrid-
The longitudinal perspective (S. 1–32). Cambridge ge, MA: MIT Press.
(UK): Cambridge University Press. Miles, M. B. & Huberman, A. M. (1994). Qualitative
Hoppe-Graff, S. (1989b). Die Tagebuchaufzeichnung: data analysis: An expanded source book. London:
Plädoyer für eine vergessene Form der Längs- Sage.
schnittbeobachtung. In H. Keller (Hrsg.), Hand-
294 Methoden und Verfahren

Nelson, K. (Hrsg.). (1989). Narratives form the crib. Preyer, W. (1882). Die Seele des Kindes. Leipzig: Grie-
Cambridge, MA: Harvard University Press. ben.
Oerter, R. (1991). Vorwort zur 7. Auflage. In C. Bühler Sarbin, T. (1990). The narrative quality of action. Theo-
(1991/1921). Das Seelenleben des Jugendlichen. Ver- retical and Philosophical Psychology, 10, 49–65.
such einer Analyse und Theorie der psychischen Puber- Schäfer, L. (1992). Karl R. Popper. München: Beck.
tät (S. 3–7). München: Fischer. Scupin, E. & Scupin, C. (1907). Bubis erste Kindheit.
Oppenheim, D., Emde, R. N. & Warren, S. (1997). Leipzig: Grieben.
Children’s narrative representation of mothers: Scupin, E. & Scupin, C. (1910). Bubi im 4.–6. Lebensjah-
their development and associations with child and re. Leipzig: Grieben.
mother adaptation. Child Development, 68, Selman, R. L. (1984). Die Entwicklung des sozialen Ver-
127–138. stehens. Frankfurt: Suhrkamp (Original erschienen
Piaget, J. (1969a). Das Erwachen der Intelligenz beim 1980: The growth of interpersonal understanding.
Kinde. Stuttgart: Klett (Original erschienen 1936: New York: Academic Press).
La naissance de l’intelligence chez l’enfant. Stern, C. & Stern, W. (1907). Die Kindersprache. Leipzig:
Neuchâtel: Delachaux et Niestlé). Barth.
Piaget, J. (1969b). Nachahmung, Spiel und Traum. Stutt- Stern, W. (1906). Ableitung und Grundlehre des kritischen
gart: Klett (Original erschienen 1945: Imitation, Personalismus (2. Auflage 1923). Leipzig: Barth.
jeu et reve: Image et représentation. Neuchâtel: Stern, W. (1914). Psychologie der frühen Kindheit (9. Auf-
Delachaux et Niestlé). lage 1967). Leipzig: Barth.
Piaget, J. (1972a). Der Aufbau der Wirklichkeit beim Stern, W. (1930). Studien zur Personwissenschaft. 1. Teil:
Kinde. Stuttgart: Klett (Original erschienen 1937: Personalistik als Wissenschaft. Leipzig: Barth.
La construction du réel chez l’enfant. Neuchâtel: Stern, W. (1967). Psychologie der frühen Kindheit (1. Auf-
Delachaux et Niestlè). lage 1914). Heidelberg: Quelle & Meyer.
Piaget, J. (1972b). Sprechen und Denken des Kindes. Düs- Turiel, E. (1983). The development of social knowledge.
seldorf: Schwann (Original erschienen 1923: Le Cambridge (UK): Cambridge University Press.
langage et al pensée chez l’enfant. Neuchâtel: De- von Wright, G. H. (1974/1971). Erklären und Verstehen.
lachaux et Niestlé). Frankfurt: Fischer-Athenäum. (Original: Explana-
Piaget, J. (1972c). Urteil und Denkprozeß des Kindes. tion and Understanding. Ithaca, NY: Cornell Univ.
Düsseldorf: Schwann (Original erschienen 1924: Press).
Le jugement et le raisonnement chez l’enfant. Watson, J. B. (1968). Psychologie, wie sie der Behavio-
Neuchâtel: Delachaux et Niestlé). rist sieht (Original erschienen 1913: Psychology as
Piaget, J. (1988). Das Weltbild des Kindes. München: dtv the behaviorist views it). In J. B. Watson (1968).
(Original erschienen 1926: La représentation du Behaviorismus (S. 13–28). Köln: Kieperheuer &
monde chez l’enfant. Paris: Presses Universitaires Witsch.
de France). Wright, H. F. (1960). Observational child study. In P.
Pitcher, E. G. & Prelinger, E. (1963). Children tell stories. H. Mussen (Hrsg.), Handbook of research methods in
New York: International University Press. child development (S. 71–139). New York: Wiley.
Popper, K. R. (1958). Die offene Gesellschaft und ihre Zimbardo, P. R. (1995). Psychologie (6. Auflage). Berlin:
Feinde. Band II: Falsche Propheten. Tübingen: Mohr. Springer.
295

Kapitel III. 3:
Aufgaben und Methoden der differen-
tiellen Entwicklungspsychologie
Marcus Hasselhorn, Göttingen & Wolfgang Schneider, Würzburg

Inhaltsverzeichnis
1. Aufgaben der differentiellen 3.3 Sequenzpläne . . . . . . . . . . . . . . . . . . . . . . . 303
Entwicklungspsychologie . . . . . . . . . . . . . . . . . 296 3.4 Mikrogenetische Methode . . . . . . . . . . . . . 304
1.1 Variabilität, Veränderung, 3.5 Trainingsstudie . . . . . . . . . . . . . . . . . . . . . . 304
individuelle Differenzen . . . . . . . . . . . . . . . 296
1.2 Was soll beschrieben und erklärt werden? . 298 4. Differenzwertproblematik . . . . . . . . . . . . . . 305

2. Forschungsstrategie: hypothesenprüfend vs. 5. Auswertungsverfahren . . . . . . . . . . . . . . . . . 306


hypothesengenerierend . . . . . . . . . . . . . . . . . . . 300 5.1 Strukturmodelle mit latenten Variablen . . . 307
5.2 Wachstumskurven-Ansatz . . . . . . . . . . . . . . 310
3. Versuchspläne der (differentiellen)
Entwicklungspsychologie . . . . . . . . . . . . . . . . . 301 6. Resümee . . . . . . . . . . . . . . . . . . . . . . . . . . . . 314
3.1 Querschnitt . . . . . . . . . . . . . . . . . . . . . . . . . 302
3.2 Längsschnitt . . . . . . . . . . . . . . . . . . . . . . . . 302 Literatur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 314
296 Methoden und Verfahren

Die Psychologie ist die Wissenschaft, die das 1. Aufgaben der


Ziel verfolgt, das Erleben und Verhalten des
Menschen zu beschreiben und zu erklären. differentiellen
Um dieses zu erreichen, hat sie verschiedene Entwicklungspsychologie
Teildisziplinen begründet, von denen eine
die Entwicklungspsychologie ist. Gegen- Allgemein läßt sich der Aufgabenkomplex der
standsbereich der Entwicklungspsychologie Entwicklungspsychologie wie folgt definie-
sind die Veränderungen des Erlebens und ren: Sie soll die tatsächlichen Veränderungen und
Verhaltens über die (Lebens-)Zeit. Die Be- die potentielle Veränderbarkeit menschlichen Er-
trachtung solcher Veränderungen erfolgte lebens und Verhaltens über die gesamte Lebens-
über Jahrzehnte hinweg vorrangig aus allge- spanne beschreiben und erklären. Der differenti-
meinpsychologischer Perspektive; d. h. im ellen Entwicklungspsychologie kommt nun
Vordergrund des Interesses standen die uni- die Aufgabe zu, sich innerhalb dieses Kom-
versellen, bei allen Menschen beobachtbaren plexes mit der Beschreibung und Erklärung
Veränderungen verschiedenster Aspekte des von Altersveränderungen in der intraindivi-
Erlebens und Verhaltens über die Lebens- duellen Variabilität und in den interindividu-
spanne. In den letzten Jahren ist ein Unbe- ellen Differenzen zu beschäftigen sowie mit
hagen an der oftmals ausschließlich allge- interindividuellen Differenzen in den intra-
meinpsychologischen Entwicklungspsycholo- individuellen Veränderungen und in der po-
gie deutlich geworden. Immer mehr besan- tentiellen Veränderbarkeit. Um verständlich
nen sich Entwicklungspsychologen auf die zu machen, was sich hinter dieser kompri-
alte Tradition (vgl. etwa Stern, 1911) einer mierten Aufgabenformulierung der differen-
differentiellen Entwicklungspsychologie, bei tiellen Entwicklungspsychologie im einzel-
der die individuellen Unterschiede in den nen verbirgt, bietet sich an, zunächst die ver-
Verhaltensänderungen über die Zeit im Vor- wendeten Begriffe der intraindividuellen Va-
dergrund der Betrachtung stehen. Dabei riabilität, der Veränderung und der interindi-
zeichneten sich immer mehr besondere Auf- viduellen Differenzen zu erläutern.
gaben einer differentiellen Entwicklungspsy-
chologie ab.
Im vorliegenden Kapitel werden zunächst 1.1 Variabilität, Veränderung,
einige Grundbegriffe erläutert, um darauf auf- individuelle Differenzen
bauend die vier wichtigsten Aufgaben der dif-
ferentiellen Entwicklungspsychologie darzu- Von Variabilität spricht man, wenn man bei
legen. Diese Aufgaben werfen sodann metho- Personen kurzfristige und situationsabhängi-
dologische wie methodische Fragen auf, ge Änderungen von Verhaltensmerkmalen
denen die restlichen vier Abschnitte des Kapi- beobachten kann (z.B. das nächtliche Einnäs-
tels gewidmet sind. Zunächst werden das Für sen jüngerer Kinder, das mal auftritt und mal
und Wider exploratorischer und hypothesen- nicht). Genau genommen spricht man in die-
prüfender Forschungsstrategien diskutiert, sem Zusammenhang von intraindividueller Va-
dann die wichtigsten Versuchspläne der Ent- riabilität, weil diese kurzfristigen und oft
wicklungspsychologie und ihre Nutzbarkeit scheinbar unsystematischen Verhaltensände-
für differentielle Fragestellungen erläutert, rungen bei einem einzelnen Individuum auf-
bevor auf die methodischen Probleme der treten (intraindividuell = sich in einem Indi-
Messung und Analyse individueller Verhal- viduum abspielend). Derartige Verhaltensva-
tensänderungen eingegangen wird. Schließ- riabilitäten sind i.d.R. relativ leicht beeinfluß-
lich werden die Prinzipien einiger in diesem bar oder umkehrbar (reversibel), indem man
Zusammenhang bedeutenden Auswertungs- einfach eine entsprechende Situationsände-
verfahren skizziert und anhand von Beispie- rung vornimmt (z.B. das Kind am späten
len veranschaulicht. Abend noch einmal zum «Wasserlassen»
weckt).
Sind die intraindividuellen Verhaltensän-
derungen stabiler, d. h. von Dauer und situa-
Aufgaben und Methoden der differentiellen Entwicklungspsychologie 297
tionsübergreifender Natur, so spricht man
nicht mehr von Variabilität, sondern von Ver-
änderung. So stellen beispielsweise die Eltern
eines der oben erwähnten Kinder fest, daß es
nachts gar nicht mehr einnäßt, selbst wenn
es abends noch reichlich getrunken hat. Im
Gegensatz zur Variabilität handelt es sich bei
Veränderungen um relativ irreversible Merk-
mals- bzw. Verhaltensänderungen, d. h., sie
sind kaum mehr umkehrbar bzw. rückgängig
zu machen.
Die meisten Verhaltensmerkmale, mit
denen sich die Psychologie beschäftigt, sind
allerdings nicht einfach dichotom, wie im
angeführten Beispiel (das Kind näßt ein oder
nicht), sondern es ist eine ganze Palette von
Verhaltensvariationen und -intensitäten
möglich. Auch in diesen Fällen lassen sich in-
traindividuelle Variabilitäten und Verände-
rungen voneinander unterscheiden.
Zur Erläuterung der Begriffe wählen wir Abbildung 1: Schematische Darstellung intraindivi-
uns ein Beispiel menschlichen Verhaltens, dueller Variabilität und Veränderung des Verhaltens
mit dem wir uns lange Zeit beschäftigt
haben: den Gebrauch von Strategien bei Ge-
dächtnisanforderungen, bei denen man sich
eine Reihe von Begriffen oder Dingen merken
muß. Dabei kann es sich um das Einprägen zelne Informationen wiederholt werden.
von Wünschen für den nächsten Geburtstag, Auch ein Jahr später zeigen sich beim glei-
um das Auswendiglernen einer Einkaufsliste chen Kind bei verschiedenen Gedächtnispro-
oder auch darum handeln, sich die Zutaten ben über den Tag verteilt unterschiedliche
eines Rezeptes zu merken. Auch für jüngere Häufigkeiten und Intensitäten beim «Rehear-
Kinder sind Anforderungen dieser Art kaum sal»-Gebrauch, obwohl die mittlere Intensität
ein Problem, wenn die Anforderung für sie im Laufe des Jahres deutlich zugenommen
interessant bzw. attraktiv ist und wenn es hat. Während diese mittlere Intensitätszu-
sich nur um ein oder zwei Dinge handelt, die nahme des strategischen Verhaltens als Folge
es sich einzuprägen gilt. Bei Fünfjährigen läßt intraindividueller Veränderungen angesehen
sich bereits der Gebrauch einer einfachen Ge- werden kann, sind die Intensitätsschwankun-
dächtnisstrategie beobachten, der es ermög- gen von Gedächtnisprobe zu Gedächtnispro-
licht, sich auch mehr als zwei Begriffe zu be an den jeweiligen Untersuchungstagen
merken: Die Kinder fangen an, jeden einzel- Ausdruck intraindividueller Variabilität. Abbil-
nen Begriff der zu lernenden Liste zu wieder- dung 1 veranschaulicht den Unterschied von
holen, was als «Rehearsal»-Strategie bezeich- intraindividueller Variabilität und Verände-
net wird. rung.
Betrachten wir ein einzelnes Kind über Bisher haben wir in unseren Beispielen
einen Zeitraum von einigen Jahren, so kön- immer nur ein Kind betrachtet. Berücksichti-
nen wir wiederum beides, intraindividuelle gen wir jedoch mehrere, etwa zum gleichen
Variabilität und intraindividuelle Verände- Zeitpunkt geborene Kinder, so ist zusätzlich
rung, beobachten. Nehmen wir beispielsweise zu den intraindividuellen Variabilitäten und
über einen Tag verteilt unterschiedliche Pro- Veränderungen mit vielfältigen Unterschie-
ben des Gedächtnisverhaltens, so können wir den zwischen den berücksichtigten Personen
von Probe zu Probe Unterschiede in der Häu- – sog. interindividuellen Differenzen (IDs) – zu
figkeit und Intensität feststellen, mit der ein- rechnen. Prinzipiell kann zwischen stati-
298 Methoden und Verfahren

Abbildung 2: Beispiel einer


möglichen Altersabhängigkeit
interindividueller Differenzen
eines Verhaltensmerkmals:
Altersspezifische Mittelwerte
und Standardabweichungen

schen und dynamischen IDs unterschieden Verhaltensmerkmal bzw. einer Variablen be-
werden. Die statischen Differenzen beziehen trachtet wurden. Nimmt man zusätzlich zu
sich auf Unterschiede in der Art und im Aus- den Personen und Zeitpunkten mehrere Varia-
maß der intraindividuellen Variabilität. So blen in das System auf, wie das z. B. Buss
schwankt z. B. die Intensität des Rehearsalver- (1974) in seinem Modell einer multivariaten
haltens von Gedächtnisanforderung zu Ge- differentiellen Entwicklungspsychologie getan
dächtnisanforderung bei manchen Neun- hat, so ergeben sich allein 15 hypothetische
jährigen sehr stark und bei manchen kaum. Fragestellungen, von denen allerdings die
Unter dynamischen interindividuellen Diffe- Mehrzahl nicht unbedingt entwicklungspsy-
renzen versteht man Unterschiede in den chologisch sind. Im folgenden wollen wir
längerfristigeren und eher irreversiblen intra- daher lediglich die wichtigsten vier Aufgaben
individuellen Veränderungen. Im Zusam- der differentiellen Entwicklungspsychologie
menhang mit der Entwicklung des Rehearsal- skizzieren:
verhaltens kann man z. B. im Verlauf des
neunten Lebensjahres bei den meisten Kin-
a) Beschreibung und Erklärung der Alters-
dern lediglich eine quantitative Zunahme der
abhängigkeit interindividueller Differenzen
Rehearsal-Intensität beobachten, bei einigen
aber zusätzlich eine qualitative Veränderung, Erfaßt man die Intensität bzw. Ausprägung
indem die Kinder plötzlich damit beginnen, eines wenigstens rangskalierten Merkmals bei
immer mehrere Informationseinheiten zu mehreren Personen, so werden i. d. R. zwei
Gruppen zusammenzufassen (sog. Rehearsal- einfache deskriptive Statistiken zur Beschrei-
Sets) und sie als Gruppen, nicht mehr jede bung der Daten verwendet: der Mittelwert
Informationseinheit für sich, zu wiederholen. und die Standardabweichung. Bei letzterer
In der Gedächtnisentwicklung nennt man handelt es sich um ein Maß der Streuung der
dieses Verhalten auch kumulatives Rehearsal. Einzeldaten um den Gruppenmittelwert (zur
Berechnung und Definition vgl. z. B. Bortz,
1993). Ist das erfaßte Merkmal normalver-
1.2 Was soll beschrieben und er- teilt, so liegen 68 % aller Individualdaten in
klärt werden? dem Bereich, der sich aus dem Mittelwert
plus / minus einer Standardabweichung er-
Wir haben uns in den bisherigen Ausführun- gibt. Die Standardabweichung ist somit ein
gen immer auf ein sehr einfaches System be- guter Beschreibungswert für das Ausmaß in-
zogen, bei dem mehrere Personen hinsicht- terindividueller Differenzen. Abbildung 2 zeigt
lich ihrer zeitlichen Veränderungen in einem nun ein Beispiel möglicher Altersabhängig-
Aufgaben und Methoden der differentiellen Entwicklungspsychologie 299
keiten dieser interindividuellen Differenzen.
Bei dem dargestellten Merkmal kommt es
zunächst mit zunehmendem Alter zu einer
Zunahme interindividueller Differenzen und
im weiteren Entwicklungsverlauf wiederum
zu einer Abnahme des Ausmaßes interindivi-
dueller Differenzen.
Solche Altersunterschiede in den interindi-
viduellen Differenzen findet man oft in Quer-
schnittstudien (s. u.), in denen keine intrain-
dividuellen Veränderungen erfaßt wurden. In
Anlehnung an Appelbaum und McCall
(1983) könnte man daher darüber streiten, ob
es sich bei der Beschreibung und Erklärung
von Altersunterschieden interindividueller
Differenzen wirklich um eine entwicklungs-
psychologische Aufgabe handelt. Mit Nessel-
roade (1991) läßt sich allerdings argumentie- Abbildung 3: Beispiele für einen Entwicklungsab-
schnitt ohne interindividuelle Differenzen in den in-
ren, daß Altersdifferenzen in den interindivi- traindividuellen Veränderungen (t1 bis t2) und mit
duellen Differenzen immer das Produkt von interindividuellen Differenzen in den intraindividuel-
interindividuellen Differenzen in den intra- len Veränderungen (t2 bis t3)
individuellen Veränderungen sind.

b) Beschreibung und Erklärung interindivi-


einer deutlich überzufälligen Beibehaltung
dueller Differenzen in den intraindividuel-
der Rangreihe (wie etwa zwischen t2 und t3
len Veränderungen
in Abbildung 3) von interindividueller Ent-
Die Beschreibung und Erklärung interindivi- wicklungsstabilität spricht. Die Beschreibung
dueller Differenzen in den intraindividuellen interindividueller Unterschiede in den intra-
Veränderungen wird von vielen Fachkollegen individuellen Veränderungen ist jedoch erst
als die eigentliche Hauptaufgabe der differen- der Ausgangspunkt für weitere Überlegungen:
tiellen Entwicklungspsychologie angesehen. Wie ist es zu den interindividuellen Differen-
Warum unterscheiden sich Personen in man- zen gekommen? Sind sie die Folge systemati-
chen Entwicklungsabschnitten nicht hin- scher Unterschiede der Umweltbedingungen,
sichtlich ihrer intraindividuellen Merkmals- denen die betrachteten Personen ausgesetzt
veränderungen, wie es in Abbildung 3 in der waren? Oder charakterisieren sie unterschied-
Zeitspanne zwischen t1 und t2 beispielhaft liche Prototypen von Entwicklungsverläufen,
dargestellt ist? Ein solches völliges Ausbleiben die aufgrund personspezifischer Merkmale
von interindividuellen Differenzen in den in- (z. B. Geschlecht) vorhersagbar sind? Fragen
traindividuellen Veränderungen ist bei Be- dieser Art sind typisch, wenn es darum geht,
trachtung größerer Gruppen sehr unwahr- beobachtete interindividuelle Differenzen in
scheinlich. Sollte es dennoch eintreten, so den intraindividuellen Veränderungen zu er-
spricht man in Anlehnung an Wohlwill klären.
(1977) von einer perfekten interindividuellen
Entwicklungsstabilität, da eine zeitliche Inva-
rianz der im Hinblick auf die individuelle c) Beschreibung und Erklärung interindivi-
Merkmalsausprägung gebildeten Rangreihe dueller Differenzen in den zeitlichen Verän-
der Personen vorliegt. derungen der intraindividuellen Variabilität
Perfekte interindividuelle Entwicklungssta-
bilitäten wird man bei der Betrachtung der In Abbildung 1 war anhand eines Merkmales
Veränderungen konkreter Verhaltensmerk- einer Person gezeigt worden, daß die intrain-
male kaum finden, so daß man schon bei dividuelle Variabilität durchaus zeitlichen
300 Methoden und Verfahren

Veränderungen unterliegen kann. Erweitern 2. Forschungsstrategie:


wir das Szenario um weitere Personen, so hypothesenprüfend vs. hypothesen-
kann es unabhängig von etwaigen interindi- generierend
viduellen Differenzen in den Merkmalsverän-
derungen auch zu interindividuellen Diffe- Welche Forschungsstrategie bietet sich nun
renzen in der intraindividuellen Variabilität an, die skizzierten Aufgaben der differentiel-
kommen. Bei der in Abbildung 1 dargestell- len Entwicklungspsychologie zu bewältigen?
ten Person kam es zu einer Altersinvarianz Grundsätzlich ist dies eine Frage der For-
der Variabilität, bei anderen Personen könnte schungsphilosophie oder auch Methodolo-
es zu einer Zunahme oder gar zu einer Varia- gie, der man sich verpflichtet fühlt. Schaut
bilitätsabnahme kommen. Die Kenntnis sol- man sich einmal in der internationalen ent-
cher interindividuellen Differenzen ist oft wicklungspsychologischen Szene um, so muß
von entscheidender Bedeutung für die ange- man feststellen, daß methodologische Fragen
wandte Entwicklungspsychologie. Die Varia- kaum thematisiert werden. Hinterfragt oder
bilität ist nämlich eine der wichtigsten Vor- rekonstruiert man jedoch die den bisherigen
aussetzungen der Plastizität des Verhaltens, Forschungsbeiträgen zu einer differentiellen
also dem «Potential, das Individuen zu ver- Entwicklungspsychologie zugrundeliegenden
schiedenen Verhaltensformen und Entwick- Forschungsstrategien, so wird deutlich, daß
lungsverläufen befähigt» (Baltes, 1990, S. 11). eine hypothesengenerierende Strategie domi-
Allerdings geht die entwicklungspsychologi- niert, nach der das primäre Ziel empirischer
sche Plastizitätsforschung über die Variabi- Forschungstätigkeit darin besteht, aus empiri-
litätsforschung insofern hinaus, als daß dabei schen Daten Theorien zu gewinnen. Diese
nicht nur die unter den gegebenen Entwick- Strategie findet ihre wissenschaftstheoreti-
lungsbedingungen beobachtbaren Variations- sche Begründung in dem vor allem von
breiten des Verhaltens betrachtet werden, Carnap (z. B. 1946) vertretenem «logischen
sondern zusätzlich die Leistungsgrenzen aus- Empirismus». Sie basiert auf einem induktivi-
getestet werden, zu denen einzelne Individu- stischen methodologischen Prinzip, das nach
en unter optimalen Kontextbedingungen in Hager (1992, S. 7) darin besteht, eine Unter-
der Lage sind. suchung so zu planen und durchzuführen,
«daß die Wahrscheinlichkeit der Entdeckung
... einer Hypothese maximal ist».
d) Spezifikation der differentiellen Beein- Ein Grundproblem des induktivistischen
flußbarkeit intraindividueller Veränderun- Prinzips ist die idealisierte Vorstellung, es
gen gäbe theoriefreie Beobachtungen. Daß dies je-
doch nicht so ist, mag ein kurzes Beispiel ver-
Dies führt uns zu der vierten Hauptaufgabe deutlichen: Gesetzt den Fall, ein Psychologe
der differentiellen Entwicklungspsychologie, möchte die interindividuellen Differenzen in
der Spezifikation differentieller Möglichkeiten den intraindividuellen Veränderungen von
einer Entwicklungsbeeinflussung. Die Beein- Gedächtnisstrategien am Ende der Grund-
flußbarkeit zukünftiger Entwicklungsverände- schuljahre erklären. Er plant eine Untersu-
rungen scheint von der aktuellen Ausprägung chung, in der er zunächst einmal von vielen
relevanter Merkmale (mittleres intraindividu- Kindern die intraindividuellen Strategiever-
elles Verhaltensniveau), vom Ausmaß der in- änderungen erfaßt und zusätzlich eine Reihe
traindividuellen Merkmalsvariabilität und von Faktoren, die möglicherweise etwas mit
vom gegenwärtigen Lebensalter abzuhängen. den interindividuellen Differenzen zu tun
Die Klärung, wie dies jedoch im einzelnen haben könnten. Doch welche Faktoren wählt
aussieht, sollte die Grundlage für Entschei- er aus? Er kann unmöglich alle potentiellen
dungen darüber sein, wo und wann Präventi- Einflußfaktoren erfassen. Also überlegt er
on, Korrektur oder Optimierung individueller sich, von welchen Faktoren er am ehesten
Entwicklungsverläufe anzusetzen sind. einen Einfluß erwarten würde. Diese Überle-
gungen haben aber bereits den Status von
Hypothesen. Sie determinieren nicht nur die
Aufgaben und Methoden der differentiellen Entwicklungspsychologie 301
Auswahl der in der Untersuchung ausgewähl- Argument, daß wir in den meisten Bereichen
ten Beobachtungsdaten, sondern zusätzlich bisher nicht genügend Kenntnisse hätten,
den Bereich der bei einer Auswertung der Un- um sinnvolle Prüfversuche anzustellen, mag
tersuchung möglicherweise zu «entdecken- teilweise berechtigt sein. Insofern haben hy-
den» Hypothesen. pothesengenerierende Forschungsstrategien
Aus gutem Grunde hat Popper (1935) nach wie vor ihre Berechtigung. Meist ist das
daher dem logischen Empirismus eine kri- Argument der fehlenden Kenntnisse aber
tisch-rationalistische Erkenntnisphilosophie kaum nachvollziehbar und oft gewinnt man
gegenübergestellt. Diese führt zu einer hypo- den Eindruck, als sollte damit eher verschlei-
thesenprüfenden Forschungsstrategie, bei der ert werden, daß die Untersuchung bereits
das primäre Ziel in der Prüfung von Theorien durchgeführt wurde, bevor hinreichende
bzw. Hypothesen liegt. Dem kritischen Ratio- theoretische Vorüberlegungen dazu angestellt
nalismus läßt sich ein deduktivistisches me- wurden.
thodologisches Prinzip zuordnen, demzufol-
ge eine wissenschaftliche Untersuchung so zu
planen und durchzuführen ist, daß die Wahr-
scheinlichkeit der Widerlegung der betrach- 3. Versuchspläne der
teten Hypothese maximiert wird (Falsifika-
tionsprinzip). (differentiellen) Entwick-
Ein striktes Falsifikationsprinzip hat sich lungspsychologie
aus unterschiedlichen Gründen in der psy-
chologischen Forschung nicht durchgesetzt, Bei der Skizze der Versuchspläne und der Aus-
wohl aber liegt mittlerweile eine ausgearbei- wertungsverfahren (s. u.) der differentiellen
tete methodologische Position für eine hypo- Entwicklungspsychologie ist eine Differenzie-
thesenprüfende Forschungsstrategie vor (vgl. rung nach hypothesengenerierenden und
Hager, 1992), die auch im Zusammenhang hypothesenprüfenden Forschungsstrategien
mit den Aufgaben der differentiellen Ent- nicht erforderlich, denn hinsichtlich des Ver-
wicklungspsychologie erfolgreich angewen- suchsaufbaus und der statistischen Datenaus-
det werden kann. Bei dieser Strategie wird wertung gibt es kaum nennenswerte Unter-
vom kritisch-rationalistischen Falsifikationis- schiede zwischen den beiden Strategien (vgl.
mus Abschied genommen und statt dessen Nesselroade & Baltes, 1986). Die in diesem
die Entscheidung über psychologische Hypo- Abschnitt dargelegten Standardversuchspläne
thesen in den Vordergrund gestellt. Dement- sind auch nicht spezifisch für eine differenti-
sprechend ist dieser Forschungsstrategie das elle Entwicklungspsychologie, sondern es
methodologische Prinzip der Reduzierung sind die Standardversuchspläne der Entwick-
von Entscheidungsfehlern zugeordnet. Nach lungspsychologie schlechthin. Sie lassen sich
diesem Prinzip sind wissenschaftliche Unter- im wesentlichen über unterschiedliche Mani-
suchungen so zu planen, durchzuführen und pulationen bzw. die Beachtung von drei Fak-
auszuwerten, daß die Wahrscheinlichkeit toren (unabhängige Variablen) charakterisie-
falscher Entscheidungen für wie auch falscher ren: erstens die Stichprobenauswahl, zwei-
Entscheidungen gegen die betrachtete Hypo- tens die Anzahl von Messungen und (bei
these minimiert wird. mehreren Messungen) der zeitliche Abstand
Es ist hier nicht der Platz, um die Umset- zwischen den Messungen sowie drittens die
zung dieser entscheidungsorientierten Vari- Einflußnahme bzw. die Entwicklungseinflüs-
ante der hypothesenprüfenden Forschungs- se, die zwischen möglichen Meßwiederho-
strategie im einzelnen zu skizzieren (vgl. dazu lungen stattfinden. Im folgenden werden die
Hager, 1992). Wir wollen an dieser Stelle nur fünf wichtigsten Standardversuchspläne der
die Überzeugung zum Ausdruck bringen, daß Entwicklungspsychologie beschrieben und
es auch für den Erkenntnisgewinn der diffe- im Hinblick auf ihre Festlegungen bezüglich
rentiellen Entwicklungspsychologie förder- dieser drei Faktoren eingeordnet. Zusätzlich
lich wäre, wenn mehr hypothesenprüfende wird dabei auf die Frage eingegangen, inwie-
Studien durchgeführt würden. Das übliche fern sie sich auch zur empirischen Bearbei-
302 Methoden und Verfahren

tung der Aufgaben der differentiellen Ent- «Developmental-Difference»-Kontroverse). In


wicklungspsychologie eignen. den letzten Jahren hat sich ein Standardver-
suchsplan zur Prüfung konkreter Hypothesen
in dieser Kontroverse durchgesetzt (vgl.
Mähler & Hasselhorn, 1990), bei dem ein
3.1 Querschnitt Querschnittplan mit drei Versuchsgruppen
Anwendung findet. Neben einer Gruppe lern-
Bei der Querschnittstudie steht die Stichpro- behinderter Kinder werden noch zwei ver-
benauswahl im Vordergrund. Untersucht schiedene Kontrollgruppen unauffälliger Kin-
werden zu einem Meßzeitpunkt Personen un- der untersucht. Die Kinder der einen Kon-
terschiedlichen Alters, die entsprechend aus trollgruppe («chronological age controls»)
unterschiedlichen Geburtsjahrgängen (einge- haben das gleiche kalendarische Lebensalter
bürgert hat sich hier der aus der Militärsozio- wie die lernbehinderten Kinder. Die Kinder
logie übernommene Begriff der «Kohorte») der zweiten Kontrollgruppe («mental age
stammen. Da nur ein Meßzeitpunkt realisiert controls») sind i. d. R. einige Jahre jünger als
wird, entfällt die Variation von Entwicklungs- die Lernbehinderten, weisen aber das gleiche
einflüssen. Die Querschnittstudie ist in der Intelligenzalter auf. Für beliebige kognitive
allgemeinen Entwicklungspsychologie der Prozesse oder Strukturkomponenten, die man
weitaus am häufigsten realisierte Standard- nun im Rahmen der Developmental-Diffe-
versuchsplan, der meist neben der Altersva- rence-Kontroverse unter Zuhilfenahme dieses
riable auch eine experimentelle (d. h. mani- Querschnittplanes untersucht, gilt: Kein
pulierte) unabhängige Variable enthält. In Unterschied zwischen Lernbehinderten und
der differentiellen Entwicklungspsychologie unauffälligen jüngeren Kindern gleichen
ist die Querschnittstudie die Methode der mentalen Alters spräche dann für die
Wahl, wenn es um die Beschreibung und Er- Entwicklungsverzögerungshypothese, wenn
klärung der Altersabhängigkeit interindividu- gleichzeitig eine Überlegenheit der Kinder
eller Differenzen geht. Darüber hinaus hat gleichen chronologischen Alters gegenüber
sich das Querschnitt-Experiment durchge- den beiden anderen Gruppen des Versuchs-
setzt bei hypothesenüberprüfenden Untersu- plans beobachtbar wäre (vgl. auch Mähler &
chungen über die Ursachen von Entwick- Hasselhorn, 1990).
lungsstörungen, wie z. B. Lernbehinderung
oder dysphasische Sprachentwicklungs-
störung (vgl. Grimm, 1995). In diesen Fällen
werden nicht nur Personen unterschiedlicher 3.2 Längsschnitt
Altersstufen, sondern auch unterschiedlicher,
meist relativ eng definierter Entwicklungs- Ist man nicht nur an Altersdifferenzen oder
stände miteinander verglichen. Gruppenunterschieden interessiert, sondern
Ein Beispiel aus dem Bereich der Lernbe- an den intraindividuellen Veränderungen
hinderung mag die Art der dabei verwende- bzw. an den interindividuellen Differenzen in
ten Querschnittpläne verdeutlichen. Unter diesen Veränderungen, so bietet sich die
Lernbehinderung versteht man eine bedeut- Längsschnittstudie als alternativer Versuchs-
same Diskrepanz zwischen dem chronologi- plan an. Im Gegensatz zum Querschnitt wer-
schen Alter und dem Intelligenzalter eines den hier nur Personen einer Kohorte unter-
Kindes, d. h., die Kinder sind erheblich älter sucht, allerdings über wenigstens zwei –
als man aufgrund ihrer intellektuellen Lei- meist relativ weit auseinanderliegende Meß-
stungen vermuten würde. Seit den sechziger zeitpunkte hinweg. Auf eine Variation mögli-
Jahren wurde nun immer wieder diskutiert, cher Entwicklungseinflüsse wird in der Regel
ob die schwachen kognitiven Leistungen verzichtet. Die Längsschnittstudie erlaubt es,
lernbehinderter Kinder eher die Folge einer interindividuelle Differenzen in den intrain-
gegenüber unauffälligen Kindern verzögerten dividuellen Veränderungen sowie in den zeit-
Entwicklung oder die einer strukturellen lichen Veränderungen der intraindividuellen
Andersartigkeit ihrer Fähigkeiten sind (sog. Variabilität (s. o.) zu beschreiben. Aber auch
Aufgaben und Methoden der differentiellen Entwicklungspsychologie 303
für die Überprüfung von Hypothesen zur Er- schaltet, um mögliche Kohorten- oder Test-
klärung solcher interindividuellen Differen- zeiteffekte zu kontrollieren. Zur Schätzung
zen im intraindividuellen Veränderungsge- von Alterseffekten stehen dabei grundsätzlich
schehen ist die Längsschnittstudie die Me- zwei Möglichkeiten der Kombination von
thode der Wahl. Die oben erwähnte interin- Querschnitt und Längsschnitt zur Verfügung.
dividuelle Entwicklungsstabilität im Sinne Bei der Kohortensequenzmethode («cross-se-
der zeitlichen Invarianz von Merkmalsunter- quential method») werden im interessieren-
schieden zwischen Personen kann z. B. nur den Altersbereich für verschiedene Kohorten
im Rahmen einer Längsschnittstudie über- Längsschnittdaten erhoben. Sind die interes-
prüft werden. Wie auch an den Auswertungs- sierenden Alterseffekte über alle Kohorten
verfahren (s. u.) noch deutlich werden wird, hinweg vergleichbar (dies wird i. d. R. über
gilt der Längsschnitt zu Recht als der wichtig- die statistische Interaktion zwischen Alter
ste Standardversuchsplan der differentiellen und Kohorte geprüft), so werden die durch-
Entwicklungspsychologie. schnittlichen (d. h. über die Kohorten hinweg
generalisierten) Altersveränderungen als adä-
quate Schätzung des interessierenden Alters-
3.3 Sequenzpläne effektes interpretiert.
Bei der Testzeitsequenzmethode («time-se-
Bereits in der zweiten Hälfte der sechziger quential method») werden Daten für die in-
Jahre haben relativ unabhängig voneinander teressierenden Altersstufen zu mehreren Test-
Schaie (1965) und Baltes (1968) darauf hinge- zeitpunkten erhoben, wobei für wenigstens
wiesen, daß es bei der Querschnitt- wie auch eine Kohorte dies längsschnittlich erfolgt. In-
bei der Längsschnittstudie zu Konfundie- teressiert man sich z. B. für die Entwicklung
rungsproblemen kommt. Bei der Querschnitt- des Wortschatzes zwischen drei und sechs
methode kommt es zur Konfundierung zwi- Jahren, so beginnt man mit einer Quer-
schen Alter und Kohorte, d. h., beobachtete schnittstudie mit Drei- und Sechsjährigen;
Altersdifferenzen sind nicht ausschließlich drei Jahre später untersucht man wieder drei-
auf das unterschiedliche Alter der untersuch- jährige und sechsjährige Kinder, wobei es
ten Personen zurückführbar, sondern könn- sich allerdings bei den Sechsjährigen um die-
ten auch eine Folge der Tatsache sein, daß die selben Kinder handelt, die bereits drei Jahre
Personen der verschiedenen Altersgruppen zuvor als Dreijährige untersucht wurden. Bei
unterschiedlichen Geburtsjahrgängen ent- der Testzeitsequenzmethode lassen sich Al-
stammen. Insbesondere in der Gerontopsy- tersdifferenzen dann im Sinne von Entwick-
chologie (vgl. Kap. IV.4) ist mitunter mit mas- lungseffekten interpretieren, wenn keine sta-
siven Kohorteneffekten zu rechnen. tistische Interaktion zwischen Alter und Test-
Eine andere Konfundierungsproblematik zeitpunkt auftritt, wenn also Kohorteneffekte
liegt beim Längsschnittplan vor. Hier kommt vernachlässigt werden können.
es zu einer Konfundierung von Alter und Für die meisten Fragen der differentiellen
Testzeitpunkt. Ein längsschnittlich dokumen- Entwicklungspsychologie lohnt es sich nicht,
tierter Altersunterschied – z. B. in der Aggres- auf die Sequenzmodelle zurückzugreifen. Er-
sivität zwischen 15 und 18 Jahren – muß stens müßte der Grundversuchsplan dann
nicht unbedingt mit dem unterschiedlichen i. d. R. um noch einen weiteren (den gerade
Alter der Personen zu den beiden realisierten interessierenden differentiellen) Faktor er-
Meßzeitpunkten (z. B. 1988 und 1991) zu tun gänzt werden (z. B. Geschlecht, Intelligenz-
haben. Er kann auch die Folge veränderter öf- status); und zweitens wird das mit ihnen ver-
fentlicher Einstellungen zur Aggressivität in bundene Ziel der Kontrolle von Kohorten-
diesen drei Jahren oder eine Funktion der und Testzeiteffekten nur bedingt erreicht.
wiederholten Messung (sog. Retesteffekte) Daran ändert auch die von Schaie (1986) vor-
darstellen. genommene Erweiterung des Sequenzplan-
Bei den Sequenzplänen werden nun meh- Ansatzes nichts. Tritt nun z. B. bei der Kohor-
rere Längsschnittstudien und mehrere Quer- tensequenzmethode eine statistisch bedeutsa-
schnittuntersuchungen hintereinander ge- me Interaktion zwischen Alter und Kohorte
304 Methoden und Verfahren

auf, so weiß man, daß im interessierenden dern während der gesamten betrachteten
Entwicklungsbereich mit bedeutsamen Ko- Entwicklungsperiode erfaßt; zweitens ist die
horteneffekten zu rechnen ist. Zu klären, wel- Anzahl der Beobachtungen hoch im Ver-
che dies sind und wodurch sie zustande kom- gleich zur Veränderungsrate des Phänomens;
men, wird dann die Aufgabe weiterer Unter- und drittens wird das beobachtete Verhalten
suchungen sein. Tritt kein Interaktionseffekt intensiven Analysen von Meßzeitpunkt zu
zwischen Alter und Kohorte auf, heißt dies le- Meßzeitpunkt unterzogen mit dem Ziel, Auf-
diglich, daß die Art des Alterseffektes prinzi- schluß über die Prozesse zu erhalten, die die
piell unabhängig ist von den untersuchten Ko- Entwicklungsveränderungen charakterisieren
horten. Eine Generalisierung auf nicht direkt bzw. auslösen.
untersuchte Kohorten ist jedoch unzulässig. Vor allem das dritte Merkmal macht deut-
Der in der einschlägigen Literatur verbreite- lich, daß auch der mikrogenetische Versuchs-
ten Einschätzung, daß durch eine zunehmen- plan vorrangig für hypothesengenerierende
de Anwendung von Sequenzplänen unsere Untersuchungen geeignet ist. Dies heißt aber
entwicklungspsychologischen Erkenntnisse nicht, daß dieser Standardversuchsplan für
relativiert werden (z. B. Trautner, 1995, S. hypothesenprüfende Zwecke unbrauchbar
165), stehen wir daher eher skeptisch gegenü- wäre. Gerade in weit entwickelten Teilgebie-
ber. ten der Entwicklungspsychologie, in denen
etwa konkurrierende Erklärungen interindivi-
dueller Differenzen in den intraindividuellen
3.4 Mikrogenetische Methode Veränderungen vorliegen, scheint uns die
Nutzung der mikrogenetischen Methode sehr
In den beiden zuletzt dargestellten Standard- vielversprechend zu sein.
versuchsplänen der Entwicklungspsychologie
wird zwar das Ziel der direkten Erfassung von
intraindividuellen Veränderungen erreicht, 3.5 Trainingsstudie
dies jedoch auf einem vergleichsweise wenig
anspruchsvollen Niveau. Beobachtet man Widmet man sich der vierten der oben aufge-
z. B. im Rahmen einer Längsschnittstudie führten Hauptaufgaben der differentiellen
eine Gruppe von Kindern im Alter von sechs, Entwicklungspsychologie, der Spezifikation
acht, zehn und zwölf Jahren, so können der differentiellen Beeinflußbarkeit intraindi-
wir den Daten zwar etwas über das Ausmaß vidueller Veränderungen, so bietet sich
der interindividuellen Entwicklungsstabilität schließlich die Trainingsstudie als Standard-
(s. o.) entnehmen, über die Entwicklungsme- versuchsplan an. Ziel der Trainingsstudie im
chanismen im interessierenden Verhaltensbe- Rahmen der differentiellen Entwicklungspsy-
reich jedoch kaum etwas. Nach Überzeugung chologie ist die Wirksamkeitsevaluation ent-
etwa von Siegler und Crowley (1991) bedarf wicklungsmanipulativer Maßnahmen. Im
es hierzu nicht nur eines Längsschnittplanes, Vordergrund steht die Prüfung der Annahme,
sondern eines längsschnittlichen Versuchs- daß bei Personen eines näher umschriebenen
planes, bei dem die Beobachtungsdichte Entwicklungsstandes durch eine Trainings-
während der interessierenden Veränderungs- maßnahme A bestimmte intraindividuelle
periode eines Verhaltens im Vergleich zur Veränderungen (z. B. Aufhebung oder Redu-
Veränderungsrate des Verhaltens hoch ist. zierung einer Retardierung) erreicht werden
Hierfür bietet sich die mikrogenetische Me- können. Für diese Prüfung werden i. d. R. sog.
thode an, die bereits Mitte der zwanziger Vortest-Nachtest-Pläne verwendet, d. h., das
Jahre von Heinz Werner genutzt wurde, um interessierende Verhalten wird vor der Trai-
die Entstehung (Aktualgenese) von Wahrneh- ningsmaßnahme und nach der Trainings-
mungseindrücken zu untersuchen. Der mi- maßnahme erfaßt. Findet man keine bedeut-
krogenetische Versuchsplan ist durch drei samen Verhaltensänderungen vom Vortest
Merkmale charakterisiert (vgl. Siegler & zum Nachtest, so hat sich die Beeinflussungs-
Crowley, 1991): Erstens werden die interessie- hypothese nicht bewährt. Findet man aller-
renden Verhaltensdaten bei einzelnen Kin- dings die vorhergesagte Verhaltensänderung,
Aufgaben und Methoden der differentiellen Entwicklungspsychologie 305
so hat sich zwar die Hypothese bestätigt, ob ningsmethode andere Kontrollgruppen als
die Prüfung bzw. die Bestätigung jedoch über- die Wartegruppe zu realisieren, um neben Re-
zeugend ist, hängt davon ab, wie gut mögli- test- und Entwicklungseffekten andere poten-
che Störfaktoren kontrolliert wurden, die tiell relevante Störfaktoren zu kontrollieren
einen Trainingseffekt vortäuschen können. (vgl. Hager, 1995).
So ist z. B. bekannt, daß bei vielen psycho-
logischen Testverfahren die erzielten Leistun-
gen zunehmen, wenn man den Test mehr- 4. Differenzwertproblematik
mals bearbeitet (sog. Retesteffekte). Die Ver-
besserung der Leistung vom Vortest zum Geht man davon aus, daß die Längsschnitt-
Nachtest könnte also auch allein durch die methode für Fragestellungen der differentiel-
Tatsache erklärt werden, daß der Test zweimal len Entwicklungspsychologie zentrale Bedeu-
– nämlich vor dem Training und nach dem tung besitzt, so scheint es für die Einordnung
Training – bearbeitet wurde. Ein anderer vor von immer wieder angesprochenen Meßpro-
allem bei Trainings mit Kindern einzukalku- blemen wichtig, die Frage der angemessenen
lierender Störfaktor sind Entwicklungseffekte. Erfassung von Veränderungen zu diskutieren.
Auch ohne Beeinflussungsmaßnahmen sind Die Debatte über die Probleme von einfachen
bei Kindern mit der Zeit Leistungssteigerun- Differenzwerten hat dabei in der psychome-
gen zu erwarten. Im Bereich der Entwick- trischen Literatur eine lange Tradition. Seit
lungsstörungen kommt es z. B. nicht selten der klassischen Arbeit von Cronbach und
vor, daß sog. Spontanremissionen auftreten, Furby (1970) sind Differenzwerte bei Längs-
d. h. daß die Entwicklungsprobleme ohne schnittforschern in Mißkredit geraten. Sie
weiteres Zutun mit der Zeit verschwinden. wurden üblicherweise als unreliabel, irre-
Dies wäre eine Art Entwicklungseffekt, dessen führend und unfair charakterisiert und soll-
Eintreten fälschlicherweise die Wirksamkeit ten nach Auffassung vieler Kritiker weitmög-
des Trainings vortäuschen könnte. Üblicher- lichst vermieden werden.
weise werden Retest- und Entwicklungseffek- In jüngerer Zeit ist diese Sichtweise wieder-
te bei der Trainingsmethode durch Berück- holt als Mythos identifiziert worden (vgl.
sichtigung einer Wartegruppe kontrolliert. Die etwa Rogosa, 1988). Es ist beispielsweise abso-
Personen der Trainingsstudie werden dabei lut unproblematisch, Veränderungswerte im
per Zufall auf zwei Gruppen aufgeteilt, die Rahmen von randomisierten Vortest-Nach-
Trainingsgruppe und die Wartegruppe. test-Designs zu verwenden (Maxwell & Ho-
Während in der Trainingsgruppe zwischen ward, 1981). Vielen Sozialwissenschaftlern ist
Vortest und Nachtest das Training durchge- nicht bekannt, daß eine Varianzanalyse
führt wird, nehmen die Personen der Warte- (ANOVA) mit den Vortest-Nachtest-Differen-
gruppe lediglich an Vortest und Nachtest teil. zen als abhängiger Variable den gleichen F-
Auch sie bearbeiten also den betrachteten Wert erzeugt wie der Test auf Vortest-Nach-
Test zweimal und auch sie entwickeln sich in test-Wechselwirkungen in einer ANOVA, in
der Zeit vom Vortest zum Nachtest weiter. Als die Vor- und Nachtestwerte als wiederholte
trainingsbedingter Leistungszuwachs wird Messungen eingehen (s. Nunally, 1982). Im
dann die Differenz des Leistungszuwachses in Rahmen von Gruppenanalysen stellt die Ver-
Trainingsgruppe und Wartegruppe gewertet. wendung von Differenzwerten also kein Pro-
Leider kontrollieren die Wartegruppen an- blem dar.
dere bedeutsame Störfaktoren nicht. So ist es Wie sieht es aber dann aus, wenn Diffe-
z. B. möglich, daß die Überlegenheit der Trai- renzwerte zur Erfassung individueller Verän-
nings- gegenüber der Wartegruppe gar nicht derungen herangezogen werden? Auch in
auf die spezifische Trainingswirkung zurück- diesem Punkt scheint die landläufige Mei-
geht, sondern auf die simple Tatsache, daß nung, daß Differenzwerte äußerst problema-
den Personen der Trainingsgruppe eine inten- tisch sind, inzwischen im wesentlichen über-
sive (meist individuelle) Zuwendung zuteil holt zu sein. Befürworter des Differenzwert-
wurde (vgl. Hager & Hasselhorn, 1995). Des- Ansatzes (z. B. Nunally, 1982; Rogosa, 1988;
halb ist es ratsam, bei Anwendung der Trai- Rogosa, Brandt & Zimowski, 1982) gehen
306 Methoden und Verfahren

davon aus, daß Differenzwerte relativ unver- blems), lassen sich Differenzwerte demnach
zerrte Schätzer der wahren Veränderung dar- auch im Rahmen von Längsschnittstudien
stellen und die in ihrem Zusammenhang dis- für die Erfassung individueller Veränderun-
kutierten Probleme allgemein überschätzt gen heranziehen.
werden. Was beispielsweise die oft konstatier- Abschließend soll noch kurz auf die po-
te Unreliabilität von Differenzwerten angeht, puläre Annahme eingegangen werden, daß
trifft dies nicht generell zu: niedrige Reliabi- anstatt einfacher Differenzwerte Residual-Ver-
litäten werden immer dann gefunden, wenn änderungswerte verwendet werden sollten,
die individuellen Wachstumsraten für die bei denen die Eingangsunterschiede (im Vor-
meisten untersuchten Personen annähernd test) kontrolliert sind. Rogosa (1988; Rogosa
gleich sind. Sie indizieren, daß die Rangord- et al., 1982) weist in diesem Zusammenhang
nung der untersuchten Personen auf der darauf hin, daß eine solche Vorgehensweise
Wachstumsfunktion auf Grundlage der Diffe- sowohl logische als auch statistische Proble-
renzwerte nur ungenau erfolgen kann. Aus me aufwirft. Was das logische Problem an-
der niedrigen Reliabilität kann nun aber geht, so schließt sich etwa im Hinblick auf
nicht zwingend auf niedrige Präzision der die Frage «Wieviel würde die Veränderung
Messung geschlossen werden. Rogosa (1988) von Person P in Merkmal M betragen, wenn
präsentiert Beispiele dafür, daß niedrige Relia- alle Personen unter gleichen Bedingungen
bilitäten der Differenzwerte die sinnvolle Er- gestartet wären» unmittelbar die Frage an:
fassung individueller Veränderung nicht aus- «‹gleich› im Hinblick auf was»? Ist damit bei-
schließt. Andererseits resultieren respektable spielsweise der «wahre» Eingangswert einer
Reliabilitäten der Differenzwerte immer Person gemeint, der beobachtete Eingangssta-
dann, wenn sich große interindividuelle Un- tus, oder der beobachtete Eingangsstatus in
terschiede in intraindividuellen Verände- Kombination mit anderen problemrelevan-
rungsraten beobachten lassen (vgl. Rogosa & ten Hintergrundmerkmalen der Person? Wir
Willett, 1983). stimmen mit Rogosa (1988) darin überein,
In ähnlicher Weise ist die Bedeutung des daß die Frage «Um wieviel hat sich Person P
«Regression-zur-Mitte»-Effekts für die Erfas- in Merkmal M verändert» im Vergleich zu der
sung individueller Veränderungen in der Ver- oben gestellten Frage sehr viel leichter zu be-
gangenheit überschätzt worden (vgl. die kriti- antworten ist.
schen Analysen bei Nesselroade, Stigler & Zusammenfassend läßt sich also festhal-
Baltes, 1980; Rogosa, 1988). Wenn es auch an ten, daß längsschnittliche Fragestellungen
expliziten Beschreibungen dieses Phänomens der differentiellen Entwicklungspsychologie
mangelt, so läßt sich seine Bedeutung allge- sehr wohl über die Verwendung einfacher
mein in folgender Weise charakterisieren: Im Differenzwerte angegangen werden können.
Durchschnitt liegen individuelle Meßwerte Im Zusammenhang mit der folgenden Dis-
zum zweiten Testzeitpunkt im Vergleich zum kussion relevanter Auswertungsverfahren soll
ersten Testzeitpunkt näher am Gruppenmit- noch genauer gezeigt werden, welche Vorteile
telwert, was im wesentlichen auf Meßfehler- damit verknüpft sind.
Effekte rückführbar ist. Obwohl dieses Pro-
blem für den Fall von Vortest-Nachtest-Ana-
lysen nicht von der Hand zu weisen ist, bie- 5. Auswertungsverfahren
ten beispielsweise Nesselroade et al. (1980)
eine Reihe von Belegen dafür, daß «Regressi- Es ist hier aus Platzgründen nicht möglich,
on-zur-Mitte»-Effekte im Fall von Mehrzeit- die gesamte Palette der für Fragestellungen
punktmessungen (n > 2) gut kontrollierbar der differentiellen Entwicklungspsychologie
sind. Da wir von der Konvention ausgehen, geeigneten statistischen Auswertungsverfah-
daß Prä-Post-Messungen keine «wahren» ren zu diskutieren. Viele Verfahren wie etwa
Längsschnittstudien darstellen, letztere also Varianz- und Kovarianzanalysen mit wieder-
zumindest drei Meßzeitpunkte aufweisen holten Messungen werden in unterschiedli-
sollten (vgl. Schneider & Edelstein, 1990, für chen Gebieten der Psychologie verwendet
eine ausführliche Diskussion dieses Pro- und sind von daher in der Methodenliteratur
Aufgaben und Methoden der differentiellen Entwicklungspsychologie 307
gut dokumentiert (vgl. etwa Bortz, 1993). (zeitlich) vorgeordnete Variable das nachge-
Gleiches gilt für multivariate Techniken der ordnete Merkmal unmittelbar beeinflußt
Faktoren-, Cluster- und Diskriminanzanalyse (z. B.: der IQ einer Person beeinflußt ihre Ge-
sowie für unterschiedliche Verfahren der dächtnisleistung). Indirekte Effekte liegen
multiplen Regressionsanalyse, die hier in dann vor, wenn der Einfluß einer vorgeord-
ihren Grundstrukturen als bekannt vorausge- neten Variablen sozusagen über Umwege er-
setzt werden. Im folgenden werden deshalb folgt (z. B.: der IQ hat keinen direkten Pfad
lediglich zwei Analyseansätze näher beschrie- zur Gedächtnisleistung, beeinflußt letztere
ben, die zum einen für Fragestellungen der jedoch indirekt über seine Beziehung zur
differentiellen Entwicklungspsychologie be- Gedächtnisstrategie, die wiederum einen
sonders interessant erscheinen, zum anderen direkten Pfad zur Gedächtnisleistung auf-
aber auch noch nicht ähnlich bekannt und weist). Ein wesentlicher Unterschied zwi-
verbreitet sind wie die oben erwähnten Aus- schen Pfadanalysen und traditionellen multi-
wertungsprozeduren. Es wird zunächst auf plen Regressionsanalysen besteht darin, daß
Strukturgleichungsmodelle eingegangen, erstere a priori formulierte Kausalhypothesen
über die sich komplexe Relationen zwischen überprüfen, während letztere eher a-theore-
Variablen besonders elegant modellieren las- tisch operieren. In der einschlägigen Litera-
sen. Daran schließt sich die Diskussion von tur werden Pfadmodelle von daher oft auch
Wachstumsmodellen an, über die mögliche als «Kausalmodelle» bezeichnet. Kontrover-
Ursachen interindividueller Unterschiede in sen um diesen Begriff hat es vor allem
intraindividuellen Veränderungen exploriert deshalb gegeben, weil «Kausalität» vielfach in
werden können. Anlehnung an klassische philosophische und
wissenschaftstheoretische Positionen deter-
ministisch konzipiert wird. Bei den Pfad-
5.1 Strukturmodelle mit latenten modellen kann es jedoch nicht um die Über-
Variablen prüfung deterministischer Kausalprinzipien,
sondern allenfalls um die Annahme zeitlicher
Unter dem Begriff «Lineares Strukturglei- Sukzessionsgesetze gehen (vgl. Bentler, 1980;
chungsmodell» wird eine Reihe unterschied- Steyer, 1983). Aufgrund seiner wissenschafts-
licher Methoden zur Analyse komplexer Rela- theoretischen Vorbelastung wird der Kausa-
tionen zwischen Variablen subsumiert, die litätsbegriff in den folgenden Ausführungen
u. a. Regressions-, Faktor- und Pfadanalyse weitmöglichst vermieden und statt dessen
einschließen (vgl. Bortz, 1993, darin: Kap. 13; von Strukturmodellen gesprochen.
Rudinger, 1995; Schneider, 1994). Pfadmodel- Was unterscheidet nun Strukturglei-
le mit manifesten Variablen stellen insofern chungsmodelle mit latenten Variablen von
Weiterentwicklungen klassischer Regressions- den oben beschriebenen Pfadmodellen? Der
verfahren dar, als eine Unterscheidung zwi- wohl wichtigste Unterschied besteht darin,
schen exogenen (unabhängigen) und endo- daß bei Strukturgleichungsmodellen zwi-
genen (abhängigen) Prädiktormerkmalen ge- schen beobachteten (gemessenen) und nicht
troffen wird. Werden bei multiplen Regressi- beobachteten (latenten) Variablen differen-
onsanalysen alle Prädiktoren in ihrer Wir- ziert werden kann. Diese Modelle stellen
kung auf ein Kriterium als unabhängig ange- Kombinationen faktoren- und regressions-
sehen, so bietet die Pfadanalyse zusätzlich die analytischer Ansätze dar: Über ein faktoren-
Möglichkeit, theoretisch angenommene Zu- analytisches Meßmodell werden die Bezie-
sammenhangsmuster zwischen Prädiktorva- hungen zwischen den gemessenen Variablen
riablen in ihrer Einwirkung auf das Kriterium und den latenten Konstrukten definiert, die
genauer zu überprüfen, indem zwischen exo- sie repräsentieren. Im Strukturmodell werden
genen und endogenen Vorhersagemerkmalen dann Abhängigkeiten zwischen den latenten
unterschieden wird. Vorhersagemerkmale Variablen analysiert. Probleme von Pfadmo-
können demnach direkte und indirekte Effek- dellen mit manifesten Variablen sind insbe-
te auf das Kriterium aufweisen. Von direkten sondere im Fall von umfangreichen Varia-
Effekten wird dann gesprochen, wenn die blen-Pools und Längsschnittdaten darin zu
308 Methoden und Verfahren

sehen, daß die Komplexität der Wechselbe- interindividuellen Unterschieden auch


ziehungen nicht mehr angemessen analysiert Aspekte der oben beschriebenen «Entwick-
und graphisch illustriert werden kann. Struk- lungsfunktion» zu analysieren, also Gruppen-
turgleichungsmodelle mit latenten Variablen unterschiede im mittleren Niveau der Mittel-
bieten hier den großen Vorteil, daß struktu- wertsveränderung von latenten Variablen zu
relle Beziehungsmuster ausschließlich auf der beschreiben.
Ebene der eigentlich interessierenden laten- Das Arbeiten mit Strukturgleichungsmo-
ten Konstrukte analysiert werden. Damit las- dellen zwingt den Anwender dazu, im ersten
sen sich auch größere Variablenmengen öko- Schritt «Kausal»-Hypothesen über die Zusam-
nomisch verarbeiten. menhänge zwischen den latenten Variablen
Ein weiterer wesentlicher Vorteil von zu formulieren. Diese werden üblicherweise
Strukturgleichungsmodellen mit latenten Va- in einer Graphik, dem sogenannten Pfaddia-
riablen kann darin gesehen werden, daß im gramm zusammengefaßt, aus dem die zur Be-
Fall von Längsschnittdaten Aspekte der Merk- schreibung des Modells erforderlichen Struk-
malsreliabilität und -stabilität separat analy- turgleichungen abgeleitet werden können.
siert und beurteilt werden können. Reliabi- Als «Input» für die Parameterschätzung die-
lität bezieht sich auf die Qualität der Mes- nen Kovarianz- oder Korrelationsmatrizen.
sung, Stabilität auf theoretische Annahmen Inzwischen stehen mehrere Computerpro-
über den Entwicklungsprozeß. Üblicherweise gramme (z. B. LISREL, EQS, LISCOMP, LVPLS)
enthalten Retest-Korrelationen in konfun- für die Parameterschätzung und Modellte-
dierter Weise sowohl Reliabilitäts- als auch stung zur Verfügung. Die Parameterschätzung
Stabilitätsinformationen. Da Merkmale der kann über unterschiedliche Prozeduren (z. B.
Reliabilität und Stabilität theoretisch unab- Methode der kleinsten Quadrate, «maxi-
hängig voneinander variieren können, stellt mum-likelihood»-Schätzung) erfolgen und
diese Konfundierung ein ernsthaftes Problem geschieht iterativ, bis die über das Schätz-
dar. Im Strukturgleichungsansatz läßt sich verfahren rekonstruierte Korrelations- oder
nun die Reliabilität der gemessenen Merkma- Kovarianzmatrix möglichst gut mit der Aus-
le im Rahmen des Meßmodells unabhängig gangsmatrix übereinstimmt. Für die Evalua-
von der Stabilität der Beziehungen zwischen tion der Modellanpassung an die Daten ste-
latenten Variablen bestimmen, wenn minde- hen mehrere sog. «goodness-of-fit»-Tests zur
stens drei Meßzeitpunkte gegeben sind. Auswahl. Der am häufigsten verwendete
Damit läßt sich beispielsweise eindeutig Chiquadrat-Test überprüft unter der Annah-
klären, ob über die Zeit hinweg geringer wer- me multivariat normalverteilter Merkmale
dende Retest-Korrelationen als Folge abfallen- die Güte der Übereinstimmung zwischen be-
der Reliabilitätskennwerte in den gemessenen obachteter und reproduzierter Datenmatrix.
Variablen oder aber als Funktion immer nied- Je kleiner der Chiquadrat-Wert, desto besser
rigerer Stabilität zu interpretieren sind (vgl. fällt die Übereinstimmung aus.
Rudinger, 1995, für eine genauere Analyse Abbildung 4 gibt ein illustratives Beispiel aus
dieser Problematik). der Längsschnittforschung mit Kindern. Die
Obwohl Strukturgleichungsmodelle mit la- Daten sind der Münchner Längsschnittstudie
tenten Variablen üblicherweise mit Korrelati- LOGIK (Längsschnittstudie zur Genese in-
ons- oder Kovarianzmatrizen operieren und dividueller Kompetenzen; siehe Weinert &
damit im Fall von Längsschnittstudien vor- Schneider, im Druck) entnommen. Ausführ-
wiegend Fragen der Stabilität interindividuel- lichere Angaben zur Modellschätzung und
ler Unterschiede in intraindividuellen Verän- -testung finden sich bei Schneider (1993).
derungen angehen, lassen sie sich auch für Inhaltlich geht es um die Frage, ob sich Merk-
die Analyse latenter Mittelwertsstrukturen male der Intelligenz und der Feinmotorik im
heranziehen. Das Basismodell hierzu wurde Vorschulalter unabhängig voneinander ver-
von McArdle und Epstein (1987) entwickelt ändern oder ob reziproke Kausalbeziehungen
und als «latentes Wachstumskurven-Modell» in dem Sinn existieren, daß zeitlich früher ge-
bezeichnet. Der Einschluß von latenten Mit- messene Intelligenz die zu einem späteren
telwertsstrukturen macht es möglich, neben Zeitpunkt erhobene Ausprägung der Feinmo-
Aufgaben und Methoden der differentiellen Entwicklungspsychologie 309

Abbildung 4a: «Unabhängigkeits-Modell», in dem Abbildung 4b: EQS-Strukturgleichungsmodell, das auf


keine Querbeziehungen zwischen Intelligenz und verteilungsfreiem Schätzverfahren basiert und die
Motorik angenommen werden (leicht modifiziert beste Anpassung an die Daten zeigt (leicht modifiziert
nach Schneider, 1993) nach Schneider, 1993)

torik (mit) beeinflußt und vice versa. Da die funden wurden. Für die in Abbildung 4b dar-
Literaturlage zu diesem Problem ziemlich un- gestellte Lösung ergab sich der insgesamt
klar erscheint, wurde in Abbildung 4a das beste «Daten-Fit». Dieses Modell stellt gewis-
sparsamste und ökonomischste Modell spezi- sermaßen eine Mischform aus den beiden an-
fiziert, das unabhängige Entwicklungsverläu- deren Konzeptionen dar. Während für die er-
fe unterstellt («Unabhängigkeits-Modell»). sten beiden Meßzeitpunkte das «Modell kau-
Die latenten Variablen sind dabei durch Krei- saler Reziprozität» gilt, scheint für die Be-
se, die gemessenen Merkmale durch Quadrate schreibung der Veränderungen innerhalb der
gekennzeichnet. Das Konstrukt der Intelli- Phase zwischen dem zweiten und dritten
genz wird zu jedem Meßzeitpunkt durch zwei Meßzeitpunkt das «Unabhängigkeitsmodell»
gemessene Variablen (verbale und nichtver- wesentlich besser geeignet zu sein. Der deutli-
bale Intelligenz), das der Motorik durch eben- che Abfall der Korrelation zwischen den la-
falls zwei gemessene Merkmale (Körperkoor- tenten Konstrukten Feinmotorik und Intelli-
dination mit und ohne Ausdauerkomponen- genz von r = .64 zu Zeitpunkt 1 auf r = .17 zu
te) repräsentiert. Die drei Messungen für die Zeitpunkt 3 illustriert, daß sich die gegenseiti-
annähernd 200 Kinder der Stichprobe fanden gen Beziehungen längsschnittlich am besten
im jährlichen Abstand statt. Bei der Ersterhe- über ein «Entwicklungstrend-Modell» charak-
bung betrug das Durchschnittsalter der Kin- terisieren lassen: Während feinmotorische
der annähernd vier Jahre. Fertigkeiten zu Beginn der Kindergartenzeit
Eine mit dem Computerprogramm EQS noch sehr stark von allgemeinen intellektuel-
(Bentler, 1985) durchgeführte Parameter- len Fähigkeiten abzuhängen scheinen (das
schätzung ergab, daß das «Unabhängigkeits- Pfadmuster deutet hier eine «kausale» Prädo-
Modell» sich nicht an die Daten anpassen minanz des IQ an), wird die Fähigkeit zur
ließ. Auch ein «Modell kausaler Reziprozität», Kontrolle komplexer Bewegungen im weite-
das alle möglichen Querbeziehungen zwi- ren Verlauf wohl zunehmend «automatisiert»
schen Intelligenz und Feinmotorik enthielt, und damit auch unabhängig von kognitiven
war mit den Daten nicht kompatibel, obwohl Faktoren.
vergleichsweise bessere Anpassungswerte ge-
310 Methoden und Verfahren

Wenn dieses Beispiel auch einige Vorteile darstellt. Damit ist eine Lösung gemeint, die
von Strukturgleichungsmodellen illustrieren speziell für die vorliegende Stichprobe paßt,
kann, soll nicht verschwiegen werden, daß jedoch kaum auf neue Zufallsstichproben aus
der Ansatz auch einige noch ungelöste Pro- der zugrundeliegenden Population zu genera-
bleme in sich birgt, die insbesondere die Mo- lisieren ist. Das Ausmaß dieses Problems kann
delltestung und -spezifikation betreffen. So über Kreuzvalidierungsansätze abgeschätzt
ist die oben beschriebene Chiquadrat-Prüf- werden, von denen es jedoch leider immer
größe beispielsweise von der Stichproben- noch viel zu wenige gibt.
größe abhängig und wird bei großen Stich- Ungeachtet dieser Probleme bleibt zusam-
proben unweigerlich mangelnde Modellan- menfassend festzuhalten, daß Strukturglei-
passung indizieren. Obwohl einige andere In- chungsmodelle mit latenten Variablen im
dizes von diesem Problem weniger betroffen Vergleich zu anderen multivariaten Metho-
sind, lassen auch sie sich lediglich als subjek- den wesentliche Vorzüge besitzen, die sie für
tive Größen ansehen und nicht im Sinne sta- Fragestellungen der differentiellen Entwick-
tistischer Signifikanz interpretieren (vgl. die lungspsychologie äußerst attraktiv machen.
Diskussion dieses Problems bei Marsh, Balla Sie lassen sich insbesondere im Kontext von
& McDonald, 1988). Bei der Einschätzung der Längsschnittstudien sinnvoll einsetzen, da
Modellanpassung sollten von daher immer hier die oft kontrovers diskutierte Frage nach
mehrere «goodness-of-fit»-Indikatoren gleich- der «kausalen» Richtung vergleichsweise ein-
zeitig betrachtet werden. Man sollte sich bei fach zu beantworten ist: Die zeitlichen Abläu-
der Bewertung eines Modells auch immer fe geben die Wirkungsrichtungen im Varia-
darüber im klaren sein, daß es der Struktur- blennetz vor.
gleichungsansatz nicht ermöglicht, das theo-
retisch am besten passende Modell zu identi-
fizieren. Unterschiedliche Modelle können 5.2 Wachtumskurven-Ansatz
mit ein und demselben Satz von Korrelatio-
nen ähnlich gut übereinstimmen. Die Mo- Im Zusammenhang mit der Debatte zur ange-
delltests sind so geartet, daß Modelle falsifi- messenen Analyse von Merkmalsveränderun-
ziert, nicht jedoch empirisch als beste «be- gen wurde schon darauf hingewiesen, daß
wiesen» oder «verifiziert» werden können. neuere Verfahren der Veränderungsmessung
Ein weiteres Problem besteht u. E. darin, auf der Analyse individueller Differenzwerte
daß der konfirmatorische Charakter der Mo- aufbauen. Im Hinblick auf Fragestellungen
dellschätzungen und Modelltests durch neue- der differentiellen Entwicklungspsychologie
re Programmentwicklungen immer mehr ver- scheint dabei das von Bryk und Raudenbush
loren geht. War es bei früheren Computer- (1987) entwickelte Verfahren «Hierarchical
programm-Versionen noch sehr wichtig, ge- Linear Modeling» (HLM) besonders vielver-
naue theoretische Vorannahmen zu machen, sprechend zu sein. Da die Prozedur in her-
um das Programm überhaupt «zum Laufen» kömmlichen Statistik-Lehrbüchern bislang
zu bringen, so sind die neueren LISREL- und noch nicht aufgenommen wurde, soll sie an
EQS-Versionen wesentlich benutzerfreundli- dieser Stelle etwas genauer dargestellt wer-
cher geworden, was exploratives Arbeiten den. Um dem Leser das Verständnis der Logik
stark begünstigt. LISREL bietet über sog. «Mo- dieses Verfahrens zu erleichtern, wird auf die
difikationsindizes» Information darüber an, zugehörige Formelsprache weitgehend ver-
über welche Modellmodifikationen sich deut- zichtet. Detaillierte Beschreibungen des An-
liche Verbesserungen der Anpassungsgüte er- satzes finden sich bei Bryk und Raudenbush
reichen lassen. Diese Möglichkeit zur Modell- (1987) und Goldstein (1979).
verbesserung sollte möglichst sparsam und Analysen mit der HLM-Prozedur bieten
theoriegeleitet verwendet werden, was in der sich immer dann an, wenn man sowohl an
Praxis leider oft nicht geschieht. Es muß der Erfassung individueller Wachstumskur-
damit vielfach offen bleiben, ob die von den ven als auch an der Erklärung der Variation
Autoren als beste Lösung propagierte Modell- in diesen Wachstumskurven interessiert ist.
variante nicht de facto ein «sample overfit» Es sollten Längsschnittdaten für Gruppen
Aufgaben und Methoden der differentiellen Entwicklungspsychologie 311
von Personen vorliegen, wobei die relevanten Schätzer zu generieren, der die verfügbare In-
Merkmale mindestens dreimal erhoben wur- formation optimal gewichtet. Lassen sich bei-
den. Wie der Name besagt, werden die Daten spielsweise die individuellen Wachstumspara-
bei HLM in einem mehrstufigen hierarchi- meter reliabel schätzen, wird der gewichtete
schen Verfahren analysiert. Während die ur- Bayes-Schätzer vor allem auf diesen Informa-
sprüngliche HLM-Version in zwei Stufen ope- tionen aufbauen. Fallen demgegenüber die
rierte, wurde neuerdings auch eine dreistufige Schätzungen der individuellen Wachstums-
Programmvariante entwickelt, die sich für die parameter unreliabel aus, basiert der gewich-
Analyse von Mehrebenendaten verwenden tete Bayes-Schätzer hauptsächlich auf der In-
läßt (vgl. Bryk, Raudenbush & Congdon, formation zu den Hintergrunddaten. Wie
1994). Im folgenden werden Anwendungs- von Bryk und Raudenbush (1987) herausge-
beispiele für beide Varianten dargestellt. stellt wird, versucht HLM die in den Daten
In einem ersten Analyseschritt und auf der liegenden Stärken maximal für die Bayes-
ersten Ebene wird das «within subject»-Mo- Schätzung zu nutzen. Von daher resultieren
dell geschätzt, das die individuelle Wachs- aus diesen Analysen in der Regel kleinere
tumsfunktion für jeden Probanden sowie die Schätzfehler, als dies bei der separaten Analy-
Varianz im Eingangsniveau der Probanden se von Individual- und Gruppendaten zu er-
(zum ersten Meßzeitpunkt) und in den indi- warten wäre.
viduellen Zuwachsraten über die Zeit ohne Die in der neueren Modellvariante (Bryk et
Einbezug irgendwelcher Erklärungsvariablen al., 1994) verfügbare dritte Analyseebene be-
schätzt. Die Wachstumsfunktion kann ein zieht sich auf die Frage, ob die nach dem
Polynom beliebigen Grades sein; sie kann zweiten Analyseschritt verbliebene unaufge-
demnach als linear, quadratisch oder kubisch klärte Parametervarianz durch den Einbezug
angenommen werden oder auch eine weni- von Gruppen-(Kontext-)Merkmalen weiter re-
ger geläufige Funktion (z. B. eine Wurzelfunk- duziert werden kann. Damit wird ein typi-
tion) darstellen. Visuelle Inspektionen der sches Problem der Mehrebenenanalyse ange-
Längsschnittdaten können dabei helfen, die gangen, das vor allem in der Soziologie und
Art des Polynoms näher einzugrenzen. Wich- der Pädagogischen Psychologie diskutiert
tig ist, daß nach diesem ersten Schritt indivi- wird, aber auch für Fragestellungen der diffe-
duelle Wachstumskurven (geschätzt über die rentiellen Entwicklungspsychologie Relevanz
Methode der kleinsten Quadrate) für die wei- besitzt. Für den Fall großer Stichproben läßt
tere Analyse verfügbar sind. sich die Varianz der Eingangsniveaus und Zu-
Im nächsten Schritt wird ein «between- wachsraten auf Gruppenebene (z. B. auf die
subjects»-Modell formuliert, bei dem es Ebene von Schulklassen) «hochaggregieren».
darum geht, die Variation im Eingangsniveau Die folgenden Analysen operieren dann mit
und in den individuellen Wachstumsparame- der neuen Fallzahl (z. B. Anzahl von Schul-
tern genauer aufzuklären. Es werden an dieser klassen in der Stichprobe) und versuchen, die
Stelle üblicherweise theoretisch relevante aggregierten unerklärten Parametervarianzen
Hintergrundmerkmale in die Gleichung ein- durch den Einbezug geeigneter Kontextmerk-
geführt, von denen man annimmt, daß sie male (im Fall von Schulklassen z. B. Instrukti-
den Anteil unerklärter Parametervarianz zwi- onsqualität oder Klassenmanagement) weiter
schen den Probanden deutlich reduzieren zu reduzieren. Über diese Form von Mehr-
können. Eine gewichtete Kleinstquadrat- ebenenanalyse läßt sich demnach der Pro-
Schätzprozedur wird zunächst dazu verwen- zentsatz an Varianz in den Eingangsniveaus
det, im «between-subject»-Modell eine zweite und Zuwachsraten des relevanten Merkmals,
Schätzung der individuellen Wachstumspara- der durch Unterschiede zwischen einzelnen
meter zu generieren, die Information über die Probanden bedingt ist, von demjenigen Vari-
Hintergrundmerkmale mit einbezieht. Über anzanteil separieren, der im wesentlichen
empirische Bayes-Schätzung wird anschlie- auf gruppenspezifischen Kontextmerkmalen
ßend versucht, in Abhängigkeit von der Re- (z. B. Schulklassen) beruht.
liabilität der individuellen Wachstumspara- Die Vorteile des HLM-Ansatzes sollen ab-
meter und der Hintergrundmerkmale einen schließend an zwei Beispielen illustriert wer-
312 Methoden und Verfahren

den, die auf Längsschnittdaten der Münch-


ner Studien LOGIK (Weinert & Schneider, im
Druck) und SCHOLASTIK (Weinert & Helmke,
1997) basieren. Das Beispiel aus der LOGIK-
Studie (vgl. Schneider, 1993) wurde schon
oben eingeführt. Im Rahmen der HLM-Analy-
sen standen die Daten zur Entwicklung der
Feinmotorik im Mittelpunkt. Im ersten Ana-
lyseschritt wurden unterschiedliche Wachs-
tumsfunktionen (linear, quadratisch, ku-
bisch) für die Beschreibung der individuellen
Zuwächse in den Motorikwerten über die drei
Meßzeitpunkte hinweg geschätzt. Für die li- Abbildung 5: Eine Konfiguration zufällig ausgewählter
individueller Wachtumskurven, für die sich wenig
neare Wachstumsfunktion ergaben sich die
interindividuelle Unterschiede in den Zuwachsraten
vergleichsweise besten Anpassungswerte. Wie ergeben
in Abbildung 5 für eine Teilstichprobe illustriert
wird, scheint das lineare Modell den Daten
angemessen. Die Reliabilitätsanalyse für Ein-
gangs- und Verlaufsdaten erbrachte unter-
schiedliche Ergebnisse. Fiel die Reliabilität der re Fortschritte als Jungen. Überprüfungen der
geschätzten Eingangsniveaus mit .74 recht Residualvarianz (nach Einbezug der Hinter-
hoch aus, so betrug sie für die geschätzten grundmerkmale) in den Parameterschätzun-
Wachstumsparameter lediglich .07. Dieser gen für Eingangsniveau und Veränderungs-
niedrige Wert indiziert, daß es zwischen den werte ergaben, daß durch den Einbezug der
Probanden wenig Variation in den geschätz- Hintergrundprädiktoren fast alle Varianz in
ten Wachstumsparametern gibt. Dies geht im den Wachstumsparametern erklärt worden
übrigen auch aus Abbildung 5 hervor. war, während dies für die Varianz in den ge-
Im zweiten Analyseschritt wurden unter- schätzten Eingangsniveaus nicht zutraf: Hier
schiedliche Hintergrundsmerkmale einbezo- resultierte auch nach Einbezug der Prädikto-
gen, um die unerklärte Varianz in den indivi- ren ein signifikanter Chiquadrat-Wert.
duellen Wachstumsparametern zu reduzie- Das zweite Illustrationsbeispiel zur dreistu-
ren. Es wurde angenommen, daß das Ge- figen HLM-Analyse ist der SCHOLASTIK-Stu-
schlecht der Kinder die Entwicklung der Fein- die entnommen, bei der mehr als 1200 Kin-
motorik in dem Sinne beeinflußt, daß sich der aus 54 Schulklassen u. a. im Hinblick auf
Mädchen im Verlauf der Kindergartenzeit ihre kognitive und motivationale Entwick-
schneller entwickeln. Weiterhin wurde das lung sowie hinsichtlich der Entwicklung von
Alter der Kinder (dichotomisiert über schulrelevanten Fertigkeiten wie Lesen,
Median-Split) berücksichtigt, da die Alters- Rechtschreiben und Rechnen innerhalb der
streuung in der Stichprobe erheblich war und vier Grundschuljahre untersucht wurden. Es
vermutet wurde, daß ältere Kinder bessere bezieht sich auf eine Studie zur Entwicklung
Werte aufweisen sollten. Schließlich wurde der Rechtschreibkompetenz, die bei Schnei-
auch der Verbal-IQ der Kinder als möglicher- der, Stefanek und Dotzler (1997) genauer be-
weise relevante Hintergrundvariable in die schrieben ist. Im Rahmen der SCHOLASTIK-
Gleichung aufgenommen. Als wichtigstes Er- Studie wurden Indikatoren der Recht-
gebnis zeigte sich, daß alle drei genannten schreibleistung zu Beginn und Ende der zwei-
Hintergrundmerkmale signifikante Effekte ten Klasse sowie gegen Ende der dritten und
(im Sinne der Erwartung) auf das geschätzte vierten Klasse erhoben. Obwohl zu den un-
Eingangsniveau aufwiesen. Demgegenüber terschiedlichen Testzeitpunkten unterschied-
erwies sich im Hinblick auf die geschätzten liche Wort- bzw. Satzdiktate eingesetzt wur-
Wachstumsparameter lediglich das Ge- den, ließ sich eine Teilstichprobe von Wör-
schlecht als bedeutsam: Mädchen machten tern identifizieren, die zu allen Zeitpunkten
im beschriebenen Zeitraum signifikant größe- vorgegeben worden waren und von daher als
Aufgaben und Methoden der differentiellen Entwicklungspsychologie 313
Grundlage für längsschnittliche Analysen
dienen konnten. Es wurde unterstellt, daß die
Zugehörigkeit zu bestimmten Schulklassen
den Schriftspracherwerb bedeutsam beein-
flussen kann. Von daher wurden neben rele-
vanten Schüler-Hintergrundmerkmalen wie
etwa der Intelligenz, der Konzentrations-
fähigkeit, dem Leistungsstand und dem
Selbstbild im Fach Deutsch sowie der Lern-
freude auch Merkmale der Unterrichtsqua-
lität wie etwa die Effektivität des Klassenma-
nagements, die wahrgenommene Adaptivität
der Instruktion sowie das Sozialklima der
Klasse in die Analyse aufgenommen.
Im ersten Schritt der dreistufigen HLM-
Analyse wurde ein allgemeines Modell spezi-
fiziert, um die Wachstumsfunktion und die
Varianz im Eingangsniveau der Schüler und
in den individuellen Zuwachsraten ohne Ein-
bezug irgendwelcher Erklärungsmerkmale zu
schätzen. Die Annahme eines linearen
Wachstumsmodells ergab eine schlechte Da-
tenanpassung. Wie sich aus Abbildung 6 ablesen
läßt, fand sich im Hinblick auf die Entwick-
lung der Rechtschreibkompetenz ein negativ Abbildung 6: Bestpassende Wachstumsfunktion
beschleunigter Kurvenverlauf. Explorative (y = y + x ** (1/3)) zur Abbildung der Rechtschreibent-
Analysen zeigten, daß sich diese Verlaufsform wicklung
am besten über eine kubische Wurzelfunkti-
on modellieren ließ, die dann den weiteren
Auswertungen zugrunde gelegt wurde. Die
Modellprüfung ergab weiterhin, daß zwi-
schen den Schülern signifikante individuelle deutlich, daß Schulklassenunterschiede ca.
Unterschiede im Eingangsstatus und im wei- 16 % der Varianz in den Eingangswerten und
teren Verlauf der Lernzuwächse beobachtbar immerhin 22 % der Varianz in den Lernzu-
waren: Die Schüler unterschieden sich nicht wächsen erklären konnten. Unterschiede in
nur von Anfang an in ihren Rechtschreib- den individuellen Rechtschreib-Eingangsni-
kompetenzen, sondern entwickelten sich veaus ließen sich über die mittleren Recht-
auch unterschiedlich schnell weiter. schreibniveaus der einzelnen Klassen signifi-
Im zweiten Analyseschritt wurden die er- kant vorhersagen. Es zeigte sich weiterhin,
wähnten Hintergrundmerkmale der Schüler daß die Bedeutsamkeit von Aufmerksamkeits-
als Prädiktoren einbezogen, um die Varianz und Selbstkonzeptunterschieden der Schüler
der Schätzparameter für das Eingangsniveau für das Eingangsniveau der Rechtschreibkom-
und die Zuwachsraten aufklären zu können. petenz durch Klassenunterschiede im Recht-
Durch den Prädiktorsatz ließen sich ca. 65 % schreibniveau zumindest teilweise moderiert
der Varianz im Eingangsniveau und etwa wurde. Was die Vorhersage der Zuwachsraten
36 % der Varianz in den Lernzuwächsen be- in den Rechtschreibkompetenzen angeht, so
stimmen. Besonders interessant schien dann fiel auf, daß individuelle Zuwachsraten signi-
die Analyse des vollständigen Modells auf der fikant durch klassenspezifische Zuwachsraten
dritten Hierarchiestufe, in dem simultan Prä- prognostiziert werden konnten und weiter-
diktoren der Schüler- und Klassenebene hin durch mittlere Aufmerksamkeitsniveaus
berücksichtigt wurden. Der Einbezug von der Schulklassen vorhersagbar waren. Die
klassenspezifischen Informationen machte Analysen lieferten demnach überzeugende
314 Methoden und Verfahren

Belege für die Grundannahme der Studie, daß individuellen Veränderungen und (c) von in-
Unterschiede zwischen Schulklassen im terindividuellen Differenzen in den zeitli-
Sinne von Kontexteffekten für interindividu- chen Veränderungen der intraindividuellen
elle Unterschiede in den intraindividuellen Variabilität sowie (d) die Spezifikation der in-
Veränderungen von schriftsprachlichen Kom- terindividuell unterschiedlichen Beeinfluß-
petenzen bedeutsam sind und in Erklärungs- barkeit intraindividueller Veränderungen her-
modellen unbedingt berücksichtigt werden ausgestellt.
sollten. In der aktuellen Forschungsliteratur findet
Die beiden Anwendungsbeispiele sollten sich eine klare Dominanz hypothesengenerie-
deutlich gemacht haben, daß der HLM-An- render Forschungsstrategien. Demgegenüber
satz für Fragestellungen der differentiellen vertreten wir die Auffassung, daß gerade für
Entwicklungspsychologie gut geeignet ist. Er die Bewältigung der Erklärungsaufgaben der
bietet die Möglichkeit, Schätzungen der all- differentiellen Entwicklungspsychologie ein
gemeinen Entwicklungsfunktion sensu Wohl- vermehrter Rückgriff auf hypothesenprüfende
will mit Analysen zu kombinieren, die sich Forschungsstrategien wünschenswert wäre.
auf die Aufklärung interindividueller Unter- Eine solche Umorientierung sollte problem-
schiede in der Ausprägung dieser Entwick- los möglich sein, zumal die bekannten Stan-
lungsfunktion beziehen. HLM kann weiter- dardversuchspläne der Entwicklungspsycho-
hin dafür genutzt werden, die Reliabilität der logie auch für hypothesenprüfendes Vorge-
Schätzer von Eingangsniveaus und Zuwachs- hen geeignet sind; dies gilt prinzipiell auch
raten festzustellen sowie die Korrelation zwi- für die erst in jüngerer Zeit vermehrt berück-
schen Eingangsstatus und Veränderung zu sichtigten Versuchspläne der mikrogeneti-
bestimmen, und um Hypothesen im Hinblick schen Methode und der Trainingsstudie.
auf die Relevanz bestimmter Hintergrund- Da die empirische Erfassung intraindividu-
merkmale zu testen (vgl. Renkl & Gruber, eller Veränderungen von Verhaltensmerkma-
1995, für eine Darstellung weiterer Vorzüge). len auch für die differentielle Entwicklungs-
Obwohl dieser methodische Ansatz noch re- psychologie von zentraler Bedeutung ist, bot
lativ neu und damit bislang noch recht unbe- es sich an, zur sogenannten Differenzwert-
kannt geblieben ist, sollte er schon in naher problematik Stellung zu nehmen. Entgegen
Zukunft einen festen Platz im Arsenal ent- der verbreiteten Auffassung, Differenzwerte
wicklungspsychologischer Auswertungsver- in empirischen Analysen tunlichst zu umge-
fahren einnehmen. hen, haben wir begründet, warum und wie in
den bevorzugt längsschnittlich angelegten
Forschungsprojekten der differentiellen Ent-
wicklungspsychologie die Verwendung von
6. Resümee Differenzwerten angemessen ist. Als Beispiele
für die unter differentiellem Gesichtspunkt in
Die zunehmende Hinwendung zu differenti- der Entwicklungspsychologie verwendeten
ellen Fragestellungen in der Entwicklungs- Auswertungsverfahren werden schließlich die
psychologie haben wir zum Anlaß genom- Strukturmodelle mit latenten Variablen und
men, die wichtigsten Aufgaben der differenti- der Wachstumskurven-Ansatz kursorisch be-
ellen Entwicklungspsychologie zu skizzieren, schrieben.
einige ihrer methodischen Grundlagen zu
diskutieren und schließlich zwei komplexe
Auswertungsverfahren vorzustellen, auf die
in aktuellen einschlägigen Studien in zuneh-
mendem Maße zurückgegriffen wird. Als Literatur
wichtigste Aufgaben der differentiellen Ent-
wicklungspsychologie wurden die Beschrei- Appelbaum, M. L. & McCall, R. B. (1983). Design and
analysis in developmental psychology. In P. H.
bung und Erklärung (a) von Altersabhängig- Mussen (Hrsg.), Handbook of child psychology: Vol.1:
keiten interindividueller Differenzen, (b) von History, theory, and methods (S. 415–476). New York:
interindividuellen Differenzen in den intra- Wiley.
Aufgaben und Methoden der differentiellen Entwicklungspsychologie 315
Baltes, P. B. (1968). Longitudinal and cross-sectional Nesselroade, J. R. (1991). Interindividual differences in
sequences in the study of age and generation ef- intraindividual change. In L. M. Collins & J. L.
fects. Human Development, 11, 145–171. Horn (Hrsg.), Best methods for the analysis of change.
Baltes, P. B. (1990). Entwicklungspsychologie der Le- Recent advances, unanswered questions future direc-
bensspanne: Theoretische Leitsätze. Psychologische tions (S. 92–105). Washington, DC: American Psy-
Rundschau, 41, 1–24. chological Association.
Bentler, P. M. (1980). Multivariate analysis with latent Nesselroade, J. R. & Baltes, P. B. (1986). Von der tradi-
variables: Causal modeling. Annual Review of Psy- tionellen Faktoranalyse zur strukturkausalen Mo-
chology, 31, 419–456. dellierung in der entwicklungspsychologischen
Bentler, P. M. (1985). Theory and implementation of EQS: Forschung. In V. Sarris & A. Parducci (Hrsg.), Die
A structural equations program. Los Angeles: BMDP Zukunft der experimentellen Psychologie (2. Aufl.,
Statistical Software Corp. S. 259–278). Weinheim: Beltz.
Bortz, J. (1993). Lehrbuch der Statistik: Für Sozialwissen- Nesselroade, J. R., Stigler, S. M. & Baltes, P. B. (1980).
schaftler (4. Aufl.). Berlin: Springer. Regression toward the mean and the study of
Bryk, A. S., & Raudenbush, S. W. (1987). Application of change. Psychological Bulletin, 88, 622–637.
hierarchical linear models to assessing change. Nunally, J. C. (1982). The study of human change:
Psychological Bulletin, 101, 147–158. Measurement, research strategies, and methods of
Bryk, A. S., Raudenbush, S. W., & Congdon, R. T. analysis. In B. B. Wolman (Hrsg.) Handbook of deve-
(1994). Hierarchical linear modeling with the HLM/2L lopmental psychology (S. 133–148). Englewood
and HLM/3L programs. Chicago: Scientific Software Cliffs, N.J.: Prentice Hall.
International. Popper, K. R. (1935). Logik der Forschung. Wien: Sprin-
Buss, A. R. (1974). A general developmental model for ger.
interindividual differences, intraindividual diffe- Renkl, A. & Gruber, H. (1995). Erfassung von Verände-
rences, and intraindividual changes. Developmental rung: wie und wieso? Zeitschrift für Entwicklungs-
Psychology, 10, 70–78. psychologie und Pädagogische Psychologie, 27,
Carnap, R. (1946). Theory and prediction in science. 173–190.
Science, 104, 520–521. Rogosa, D. (1988). Myths about longitudinal research.
Cronbach, L. J., & Furby, L. (1970). How should we In K. W. Schaie, R. T. Campbell, W. M. Meredith, &
measure «change» – Or should we? Psychological C. E. Rawlings (Hrsg.), Methodological problems in
Bulletin, 74, 68–80. aging research (S. 171–209). New York: Springer.
Goldstein, H. (1979). The design and analysis of longitu- Rogosa, D. & Willett, J. B. (1983). Demonstrating the
dinal studies. London: Academic Press. reliability of difference scores in the measurement
Grimm, H. (1995). Spezifische Störung der Sprachent- of change. Journal of Educational Measurement, 20,
wicklung. In R. Oerter & L. Montada (Hrsg.), Ent- 333–343.
wicklungspsychologie (3. Aufl., S. 943–953). Wein- Rogosa, D., Brandt, D. & Zimowski, M. (1982). A gro-
heim: Psychologie Verlags Union. wth curve approach to the measurement of chan-
Hager, W. (1992). Jenseits von Experiment und Quasi-Ex- ge. Psychological Bulletin, 90, 726–748.
periment. Zur Struktur psychologischer Versuche und Rudinger, G. (1995). Strukturgleichungsmodelle in der
zur Ableitung von Vorhersagen. Göttingen: Hogrefe. Entwicklungspsychologie. In R. Oerter & L. Mon-
Hager, W. (1995). Planung und Durchführung der Eva- tada (Hrsg.), Entwicklungspsychologie (3. Aufl.,
luation von kognitiven Förderprogrammen. In W. S. 1177–1190). München: Psychologie Verlags
Hager (Hrsg.), Programme zur Förderung des Denkens Union.
bei Kindern. Konstruktion, Evaluation und Metaeva- Schaie, K. W. (1965). A general developmental model
luation (S. 100–206). Göttingen: Hogrefe. for the study of developmental problems. Psycho-
Hager, W. & Hasselhorn, M. (1995). Zuwendung als logical Bulletin, 64, 92–107.
Faktor der Wirksamkeit kognitiver Trainings für Schaie, K. W. (1986). Beyond calendar definitions of
Kinder. Zeitschrift für Pädagogische Psychologie, 9, age, time, and cohort: The general developmental
163–179. model revisited. Developmental Review, 6, 252–277.
Mähler, C. & Hasselhorn, M. (1990). Gedächtnisdefizi- Schneider, W. (1993). The longitudinal study of motor
te bei lernbehinderten Kindern: Entwicklungsver- development: Methodological issues. In A. F. Kal-
zögerung oder Strukturdifferenz? Zeitschrift für Ent- verboer, B. Hopkins, & R. Geuze (Hrsg.), Motor de-
wicklungspsychologie und Pädagogische Psychologie, velopment in early and late childhood: Longitudinal
22, 354–366. approaches (S. 317–342). London: Cambridge Uni-
Marsh, H. W., Balla, J. R., & McDonald, R. P. (1988). versity Press.
Goodness-of-fit indices in confirmatory factor Schneider, W. (1994). Methodische Ansätze der empiri-
analysis: The effect of sample size. Psychological schen Erziehungs- und Sozialisationsforschung. In
Bulletin, 102, 391–410. K. Schneewind (Hrsg.), Enzyklopädie der Psycholo-
Maxwell, S. E. & Howard, G. S. (1981). Change scores – gie. Pädagogische Psychologie, Bd. 1: Psychologie der
necessarily anathema? Educational and Psychologi- Erziehung und Sozialisation (S. 73–103). Göttingen:
cal Measurement, 41, 747–756. Hogrefe.
McArdle, J. J. & Epstein, D. (1987). Latent growth cur- Schneider, W. & Edelstein, W. (Hrsg.) (1990). Inventory
ves within developmental structural equation mo- of European longitudinal studies in the Behavioral
dels. Child Development, 58, 110–133. Sciences. Berlin: Max-Planck-Institut für Bildungs-
forschung.
316 Methoden und Verfahren

Schneider, W., Stefanek, J. & Dotzler, H. (1997). Erwerb Daten, Enzyklopädie der Psychologie, Bd. I/4
des Lesens und des Rechtschreibens. Ergebnisse (S. 59–153). Göttingen: Hogrefe.
aus dem SCHOLASTIK-Projekt. In F. E. Weinert & Trautner, H. M. (1995). Allgemeine Entwicklungspsycho-
A. Helmke (Hrsg.), Entwicklung im Grundschulalter logie. Stuttgart: Kohlhammer.
(S. 113–129). München: Psychologie Verlags Union. Weinert, F. E. & Helmke, A. (Hrsg.) (1997). Entwicklung
Siegler, R. S. & Crowley, K. (1991). The microgenetic im Grundschulalter. München: Psychologie Verlags
method. A direct means for studying cognitive de- Union.
velopment. American Psychologist, 46, 606–620. Weinert, F. E. & Schneider, W. (Hrsg.) (im Druck). Indi-
Stern, W. (1911). Die differentielle Psychologie in ihren vidual development between 3 and 12: Findings from
methodischen Grundlagen. Leipzig: Barth. the Munich longitudinal study. New York: Cambrid-
Steyer, R. (1983). Modelle zur kausalen Erklärung stati- ge University Press.
stischer Zusammenhänge. In J. Bredenkamp & H. Wohlwill, J. F. (1977). Strategien entwicklungspsychologi-
Feger (Hrsg.), Strukturierung und Reduzierung von scher Forschung. Stuttgart: Klett-Cotta.

Das könnte Ihnen auch gefallen