Sie sind auf Seite 1von 179

Heinrich Wottawa

Heike Thierau

Evaluation
Lehrbuch
Evaluation

H.Wottawa / H.Thierau
Das Lehrbuch vermittelt ein fundiertes
Verstndnis fr die Mglichkeiten und
Grenzen sozialwissenschaftlich gesttzter
Evaluation bei den Betroffenen, den
Entscheidungstrgern und den potentiel-
len Evaluatoren. In der zweiten Auflage 2., vollstndig 2., vollstndig
werden ergnzend dazu auch die Grund-
stze des Qualittsmanagements nach
berarbeitete berarbeitete
DIN ISO 9000 dargestellt. Auflage Auflage

2. Aufl.
Verlag Hans Huber
Bern Gttingen Toronto Seattle Verlag
Hans Huber
Aus dem Programm Huber: Psychologie Lehrbuch

Wissenschaftlicher Beirat:
Prof. Dr. Dieter Frey, Mnchen
Prof. Dr. Kurt Pawlik, Hamburg
Prof. Dr. Meinrad Perrez, Freiburg (Schweiz)
Prof. Dr. Hans Spada, Freiburg i.Br.
Heinrich Wottawa
Heike Thierau

Lehrbuch Evaluation
Zweite, vollstndig berarbeitete Auflage

Verlag Hans Huber


Bern Gttingen Toronto Seattle
Umschlagbild: Ausschnitt aus dem Triptychon Das jngste Gericht (1443) von Roger van der
Weyden (Muse Htel-Dieu, Beaune, Burgund). Der Erzengel Michael bei der Durchfhrung der
ultimativen Evaluation.

Adresse des Erstautors:

Prof. Dr. Heinrich Wottawa


Ruhr-Universitt Bochum
Fakultt fr Psychologie/Methodenlehre, Diagnostik und Evaluation
D-44780 Bochum
E-mail: Heinrich.Wottawa@rz.ruhr-uni-bochum.de

Die Deutsche Bibliothek CIP-Einheitsaufnahme

Wottawa, Heinrich:
Lehrbuch Evaluation/Heinrich Wottawa und Heike Thierau.
2., vollst. berarb. Aufl. Bern ; Gttingen ; Toronto ; Seattle: Huber, 1998
(Aus dem Programm Huber: Psychologie-Lehrbuch)
ISBN 3-456-82989-2

2., vollstndig berarbeitete Auflage 1998


Verlag Hans Huber, Bern 1998
Satz und Druck: Konkordia Druck GmbH, Bhl
Printed in Germany
5

Inhaltsverzeichnis

Vorwort zur zweiten Auflage . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9

Vorwort zur ersten Auflage . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11

1. Wissenschaft, Moral und die Grenzen der Planbarkeit . . . . . . . . . . . . . 13

1.1 Definitionsversuche von Evaluation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13


1.2 Wissenschaft und moralische Verantwortung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
1.3 Handlungsoptimierung durch Evaluation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18

2. Grundlagen sozialwissenschaftlich gesttzer Evaluation . . . . . . . . . . . . . . . . 23

2.1 Zielsetzungen bei Evaluationsvorhaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23


2.1.1 Grundlagen fr die Akzeptanz von Evaluation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
2.1.2 Nutzenerwartung des Auftraggebers . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
2.1.3 Schwerpunkte konkreter Evaluationsprojekte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31

2.2. Wissenschaft als mgliche Grundlage von Evaluation . . . . . . . . . . . . . . . . . . . . . . . . . 36


2.2.1 Evaluation als wissenschaftsgesttztes Handeln . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
2.2.2 Nutzen der Wissenschafts-Beitrge . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
2.2.3 Alternativen zur wissenschaftsgesttzten Evaluation . . . . . . . . . . . . . . . . . . . . . . . . 42
2.2.4 Qualittsmanagement nach DIN-EN-ISO -9000 ff. . . . . . . . . . . . . . . . . . . . . . . . . . . 43

2.3 Verfgbarkeit von Evaluatoren . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45


2.3.1 Rollenvielfalt des Evaluators . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46
2.3.2 Rechtliche Rahmenbedingungen von evaluatorischer Ttigkeit . . . . . . . . . . . . . . . . 46
2.3.3 Persnliche Voraussetzungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51

3. Einsatzgebiete psychologischer Evaluation . . . . . . . . . . . . . . . . . . . . . . . . . 55

3.1 Gestaltungsaspekte von Evaluationsstudien . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55


3.1.1 Evaluationsziele . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
3.1.2 Evaluationsbereich . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
3.1.3 Evaluationsobjekt . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
3.1.4 Ort der Evaluierung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
3.1.5 Evaluationsmodell . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
3.1.6 Evaluationsnutzung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63
6 Inhaltsverzeichnis

3.2 Evaluation als interdisziplinres Feld . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66


3.2.1 Notwendigkeit einer einzelne Evaluationsbereiche
berschreitenden Vorgehensweise . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66
3.2.2 Vergleich BRD/USA: Stand der Evaluationsforschung . . . . . . . . . . . . . . . . . . . . . . . . 67
3.2.3 Strukturelle Gemeinsamkeiten idealer Evaluationsstudien . . . . . . . . . . . . . . . . . . 68

3.3 Grundlagen und Probleme der Evaluationsforschung


dargestellt am Beispiel konkreter Evaluationsprojekte . . . . . . . . . . . . . . . . . . . . . . . . . 70
3.3.1 Evaluation in der Wirtschaft . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70
3.3.2 Evaluation im Schul- und Bildungswesen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74
3.3.3 Evaluation im forensischen Bereich . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79

4. Zielexplikation und Bewertungskriterien . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83

4.1 Zielexplikation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83
4.1.1 Zielgruppenbestimmung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85
4.1.2 Konkretisierung des Evaluationsobjektes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87
4.1.3 Antizipatorische Ergebnisverwertung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89

4.2 Bewertungsproze . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89
4.2.1 Auswahl der Bewertungskriterien . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91
4.2.2 Nebenfolgenabschtzung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92
4.2.3 Operationalisierungfragen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94

4.3 Bewertungs- und Entscheidungshilfen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 102


4.3.1 Explizite Verfahren der Nutzenbestimmung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 102
4.3.2 Expertengesttzte Entscheidungsfindung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107
4.3.3 Entscheidungsfindung durch Betroffene . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108
4.3.4 Grenzen objektiver Nutzenbewertung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110

5. Planung von Evaluationsprojekten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113

5.1 Projektmanagement . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 114


5.1.1 Informationen zu Projektdetails und Rahmenbedingungen . . . . . . . . . . . . . . . . . . . 114
5.1.2 Vorlufiger Arbeitsplan . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 116
5.1.3 Zeit- und Kostenabschtzung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117

5.2 Designfragen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 124


5.2.1 Fehlerquellen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 125
5.2.2 Untersuchungsplne . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 126
5.2.3 Datenerhebungsverfahren . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 131

5.3 Auswertungsverfahren . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 134


5.3.1 Beurteilung der Effektstrke . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 135
5.3.2 Auswertungsverfahren auf der Basis allgemeiner linearer Modellanstze . . . . . . . . . 138
5.3.3 Qualitative Auswertungsverfahren . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 140
Inhaltsverzeichnis 7
6. Durchfhrung von Evaluationsstudien . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 145

6.1 Organisatorische Fragen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 145


6.1.1 Fragen der Personalfhrung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 146
6.1.2 Kontrolltechniken des Projektverlaufes und des Konfliktmanagements . . . . . . . . . . 148
6.1.3 Unerwartete Strflle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 149

6.2 Auswertungsarbeiten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 150


6.2.1 Kontrolle der Datenqualitt . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 150
6.2.2 Datenschutz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 154
6.2.3 Auswertungsplne . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 158

6.3 Berichtlegung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 159


6.3.1 Zielgruppenanalyse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 160
6.3.2 Informationsverdichtung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 161
6.3.3 Mndliche Prsentation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 162

7. Ausblick: Bewertung sozialwissenschaftlicher


Evaluation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 165

7.1 Bewertungskriterien einzelner Evaluationsvorhaben . . . . . . . . . . . . . . . . . . . . . . . . . . 165

7.2 Evaluation als gesellschaftliches Gestaltungsprinzip . . . . . . . . . . . . . . . . . . . . . . . . . . 166

7.3 Zukunftsperspektiven . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 167

8. Literaturverzeichnis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 169

9. Stichwortverzeichnis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 175
9

Vorwort zur zweiten Auflage

Seit der ersten Auflage vor acht Jahren haben stungsbereich naturgem eine erhebliche
sich einige fr den Evaluationsbereich sehr Herausforderung an psychologische bzw. so-
relevante Vernderungen ergeben, die wir zialwissenschaftliche Methodik zur Messung
jetzt durch eine entsprechende Textnderung der relevanten Variablen und der sachgerech-
bercksichtigt haben. Die neue Situation in ten Interpretation der Ergebnisse. Auch wenn
der Evaluation betrifft zum einen die Vern- die historischen Ursprnge der beiden Denk-
derung des Betrachtungsschwerpunktes. War richtungen Evaluation und Qualitts-
1987 noch eine interne Sichtweise domi- management vllig verschieden sind, und
nierend, etwas die begrifflich Abgrenzung sich auch sehr unterschiedliche Forderungen
von Evaluation, die Unterschiede und Ge- zum Beispiel bei Untersuchungsdesigns erge-
meinsamkeiten von Evaluation und Wissen- ben, erschien es als doch zweckmig, im
schaft oder die Bemhungen, die Vielzahl der Rahmen dieses Buches zumindest auf die
unter dem Evaluationsbegriff laufenden Ar- Grundzge dieses neuen und fr einschlgig
beiten in ein logisch-systematisches Begriffs- vorgebildete Personen potentiell interessan-
feld zu strukturieren, so nehmen heute, in ten Arbeitsfeldes einzugehen. Diese neuen
Gleichklang mit der zunehmenden Tendenz Entwicklungen machten grere Vernderun-
zur verstrkten Outputsteuerung in unserer gen des Textes in den Kapiteln 1, 2, 3 und 5
Gesellschaft, die pragmatischen Aspekte (Was erforderlich. Darber hinaus haben wir uns
bringen Evaluationsstudien? Wie kann man insgesamt bemht, die Klarheit und didak-
sie so anlegen, da sie den optimalen Nutzen tische Aufbereitung der Formulierungen zu
erbringen?) greren Raum ein. Eine andere verbessern, zumindest einen kleinen Teil der
wichtige Vernderung erfolgt im Zusammen- zwischenzeitlich neu erschienenen Evalua-
hang mit der inzwischen auch in Deutsch- tionsliteratur zu bercksichtigen und die
land groen Verbreitung der Zertifizierung technische Gestaltung der Diagramme, die
nach DIN EU ISO 9000 ff/2. Diese Norm fr stark unter den vor acht Jahren noch bli-
das Qualittsmanagement in Dienstleistungs- chen technischen Mglichkeiten der Textver-
organisationen erfordert, neben einer Viel- arbeitung gelitten hat, zu verbessern. Die Ar-
zahl von brokratisch-organisatorischen Re- beit an dieser Neuauflage wurde wesentlich
gelungen, die systematische berprfung der untersttzt von Frau Eva-Maria Oenning und
erbrachten Qualitt auch durch bereichs- Herrn Stefan Mller. Wir danken ihnen und
unabhngiges Personal und die Abhaltung allen Kolleginnen und Kollegen sowie allen
regelmiger Qualittsaudits. Im Gegensatz Studenten, die uns durch Hinweise auf
zu dem Qualittsmanagement von Produk- Schwachstellen der 1. Auflage geholfen ha-
tionsunternehmen, bei denen die damit ben.
verbundenen Me-, Design- und Interpreta-
tionsfragen eher auf einer physikalisch-
technischen Ebene liegen, bedeutet dieses Bochum, im Mai 1998 Heike Thierau
Konzept der Qualittskontrolle im Dienstlei- Heinrich Wottawa

9
11

Vorwort zur ersten Auflage

Es gibt viele Mglichkeiten, sich dem weiten bildungsphase zu erarbeiten. Dabei wollten wir
Feld Evaluation zu nhern. Unser Zugang war in Abgrenzung zu den blichen Lehrbchern
die Praxis: Die Verbesserung des Wohnungs- der Evaluation unser Schwergewicht nicht auf
baus durch die Stadt Wien, die Festlegung der methodische oder wissenschaftstheoretische
zweckmigsten Reihenfolge des Baus von Aspekte legen, sondern auf jene Punkte, die
Autobahnabschnitten, die Bewertung integrier- man in der Praxis besonders bentigt. Dazu ge-
ter Studiengnge durch Studierende und Arbeit- hrt natrlich auch ein Konzept ber die wis-
geber an der GHS Kassel, die Diskussion ber senschaftlich-theoretischen Grundlagen von
Gesamtschulen, die Evaluation der Weiter- Evaluation; ein solches htte, rckblickend ge-
bildungsarbeit einer groen Versicherung fr sehen, vielleicht den einen oder anderen Feh-
alle solche Fragen ist es selbstverstndlich, da ler unserer praktischen Evaluationsarbeit weni-
man sich bemht, die Realitt durch den Ein- ger krass ausfallen lassen. Die Arbeit wurde von
satz von Forschungsmethodik und Befunden vielen Kollegen gefrdert, denen wir herzlich
aus der Psychologie bzw. den Sozialwissenschaf- danken wollen. Ganz besonders verpflichtet
ten positiv zu beeinflussen. Man mu dabei sind wir den vom Verlag zu Stellungnahmen
nicht unbedingt darber nachdenken, in wel- gebetenen Gutachtern, die uns sowohl fr das
ches Kstchen der wissenschaftlichen Syste- Ausgangskonzept als auch bei der Realisierung
matik das jeweilige Projekt pat. Wichtig ist der im Detail viele wertvolle Anregungen gegeben
Effekt, zumindest ein wenig zur Verbesserung haben. Der Einstieg in die geistesgeschichtli-
realer Bedingungen beigetragen zu haben. Die chen Grundlagen wurde wesentlich durch die
Beschftigung mit Meta- berlegungen zur Eva- freundliche Untersttzung von Herrn Prof. Dr.
luation folgte erst danach. Ein wichtiger Anla Knig und Frau Dr. Engels von der philosophi-
dafr war das von den Herren Krapp, Will und schen Fakultt an der Ruhr-Universitt Bochum
Winteler in Mnchen veranstaltete Symposium erleichtert. Auch Herrn Prof. Wittmann, Erlan-
zur Evaluation in der beruflichen Aus- und Wei- gen, Autor eines bekannten Evaluationsbuches,
terbildung. Es war faszinierend zu erleben, wie mchten wir fr den direkten und indirekten
manche (gar nicht wenige) Teilnehmer mit ho- Zugang zu wertvollen Detailinformationen
hem emotionalem Engagement stundenlang danken. Zustzliches erhielten wir durch Kolle-
ber die Frage diskutierten, ob Evaluation gen und Kolleginnen auf dem im Dezember im
nun Wissenschaft sei oder etwas anderes eine Bochum durchgefhrten und von der DfG un-
Frage, die sich in der bisher erlebten Evalua- tersttzten Rundgesprch zum Thema Evalua-
tionsarbeit eigentlich nie gestellt hatte. Dieses tion wertvolle Anregungen. Die vorliegende
einschneidende Erlebnis fhrte zur Reflexion Ausarbeitung wre ohne die tatkrftige Unter-
der bisherigen Gewohnheiten. Nach einer Lite- sttzung studentischer Mitarbeiter und Mitar-
raturdurchsicht entschlossen wir uns dann zu beiterinnen nicht mglich gewesen. Hervorzu-
dem Versuch, den Studierenden dabei zu hel- heben ist der Beitrag von Frau Martina Stangel,
fen, die Grundlagen fr eine praktische, profes- die nicht nur bei der Literaturaufarbeitung, son-
sionelle Evaluationsttigkeit whrend ihrer Aus- dern auch bei der selbststndigen Erarbeitung
12 Vorwort zur ersten Auflage

von bersichten, insbesondere zu Rechts- ein ber zwei Jahre andauerndes angenehmes
fragen, wertvolle Hilfe geleistet hat. Ebenso und gutes Arbeitsklima. Unsere Leser mchten
wollen wir den Beitrag von Frau Iris Gluminski, wir bitten, uns eine Evaluation dieses Buches
die besonders fr den Bereich des Projekt- zu ermglichen, indem sie uns mglichst viel
managments eine groe Untersttzung fr uns Rckmeldung ber didaktische Schwachstellen,
war, hervorheben. Die teilweise sehr mhsa- fachliche Lcken und evtl. auch Irrtmer zu-
men technischen Arbeiten wurden von Frau kommen lassen. Wir werden uns gerne bem-
Andrea Ludwig und Herrn Markus Saxen in ko- hen, alle diese Hinweise in einer spteren Auf-
operativer und sehr effizienter Weise durchge- lage zu bercksichtigen.
fhrt. Allen gilt unser Dank, insbesondere fr

Bochum, im August 1989 Heike Thierau


Heinrich Wottawa
13

1. Wissenschaft, Moral und die Grenzen


der Planbarkeit

1.1 Definitionsversuche von begrifflichen Diskussion schlug Suchman


(1967) die Unterscheidung von Evaluation und
Evaluation Evaluationsforschung vor. Dabei kommt den
einzelnen Begriffen die folgende Bedeutung zu:
Evaluation ist ein auerordentlich vielfltiger
Begriff. Er umfat eine Menge mglicher Ver- Evaluation (Bewertung): Proze der Beur-
haltensweisen und entzieht sich somit prinzi- teilung des Wertes eines Produktes, Pro-
piell einer abstrakten, die Wirklichkeit gleich- zesses oder eines Programmes, was nicht
zeitig voll umfassenden Definition. Trotzdem notwendigerweise systematische Verfah-
hat sich in der Literatur, wohl vorwiegend zur ren oder datengesttzte Beweise zur Un-
Ausdifferenzierung des Begriffes und zu didak- termauerung einer Beurteilung erfordert.
tischen Zwecken, eine groe Zahl von Defini-
tionen bzw. (besser) beschreibenden Begriffser- Evaluation research (Evaluationsforschung):
luterungen etabliert (vgl. dazu Rossi und explizite Verwendung wissenschaftlicher
Freeman (1993); Rutman (1977); Wittmann Forschungsmethoden und -techniken fr
(1985); Wulf (1972)). Nicht zu unrecht behaup- den Zweck der Durchfhrung einer Bewer-
ten Franklin und Trasher (1976, S. 20): tung. Evaluationsforschung betont die Mg-
lichkeit des Beweises anstelle der reinen
To say that there are as many definitons Behauptung bzgl. des Wertes und Nutzens
as there are evaluators is not to far from einer bestimmten sozialen Aktivitt.
accurate.
Abramson (1979) nimmt spter eine verfeiner-
Die schillernde Vielfalt der mit dem Begriff te Unterscheidung in Evaluation, Programm-
Evaluation assoziierten Vorstellungen evaluation und Evaluationsforschung vor.
reicht dabei in der Wissenschaft noch immer Sowohl Suchmans als auch Abramsons
von der Auffassung, unter Evaluation sei jeg- Systematisierungsversuche konnten sich jedoch
liche Art der Festsetzung des Wertes einer Sa- bislang nicht durchsetzen.
che zu verstehen (vgl. Scriven, 1980) bis hin Zum Wortfeld Evaluation gehrt auch eine
zu der Ansicht: Reihe verwandter Begriffe, die in verschiede-
nen sozialen Kontexten teilweise synonym, teil-
Evaluation research is the systematic weise im Sinne einer spezialisierten Form von
application of social research procedures Evaluation verwendet werden. So spricht man
in assessing the conceptualization and etwa von Erfolgskontrolle, Effizienzforschung,
design, implementation, and utility of Begleitforschung, Bewertungsforschung, Wir-
social intervention programms (Rossi & kungskontrolle, Qualittskontrolle usw. Der
Freemann, 1993, S. 5). Schwerpunkt des folgenden Textes liegt auf der
wissenschaftlich gesttzten Evaluation, andere
Zur Vereinheitlichung der gesamten Defini- Vorgehensweisen kommen nur in Grenzberei-
tionsthematik und zur Systematisierung der chen zur Sprache.
14 Wissenschaft, Moral und die Grenzen der Planbarkeit

Allgemeine Kennzeichen wissenschaftlicher gen, und damit praktische Manahmen, fol-


Evaluation gen.
Es sollte natrlich fr jeden mndigen Brger
In Anbetracht der bestehenden Definitions- einer demokratischen Gesellschaft (und damit
vielfalt ist es zweckmiger, statt einem wei- auch fr jeden in einer solchen Gesellschaft ar-
teren Definitionsversuch die allgemeinen beitenden Wissenschaftler) selbstverstndlich
Kennzeichen wissenschaftlicher Evaluation sein, nicht nur die Funktionalitt, sondern auch
herauszuarbeiten. die Moral seiner Arbeit und die Zielsetzung zu
berdenken. Dieser allgemeinen Forderung
Ein allgemeiner Konsens, der hier auch kommt wegen des unmittelbaren Praxisbezugs
schon durch die Wortwurzel von Evaluati-
von Evaluationsprojekten in diesem Feld eine be-
on vorgezeichnet ist, liegt darin, da alle
sondere Bedeutung zu. Evaluatoren verndern
solche Ttigkeiten etwas mit Bewerten zu
durch ihre Arbeit beratend (manchmal sogar auch
tun haben. Evaluation dient als Planungs-
als Entscheider) die Lebensumstnde anderer
und Entscheidungshilfe und hat somit etwas
Menschen gezielt und erheben dabei den An-
mit der Bewertung von Handlungsalter-
spruch, aufgrund ihrer Wissenschaftlichkeit
nativen zu tun (vgl. Wottawa, 1986)
ber Kompetenzen zu verfgen, die dem Laien
Evaluation ist ziel- und zweckorientiert. Sie fehlen; gerade diese, die Glaubwrdigkeit und
hat primr das Ziel, praktische Manahmen
berzeugungskraft erhhende wissenschaftliche
zu berprfen, zu verbessern oder ber sie zu
Basis ist ja hufig der Grund fr die Einschaltung
entscheiden.
speziell ausgebildeter Evaluatoren.
Es besteht im wissenschaftlichen Sprachge- Es ist manchmal nicht ganz einfach, Evalua-
brauch ebenfalls ein Konsens darber, da
tionsprojekte ohne unsachgeme Beeinflussung
Evaluationsmanahmen dem aktuellen Stand
durch die Werthaltung des Evaluators durchzu-
wissenschaftlicher Techniken und For-
fhren. Die Komplexitt von Evaluationsvor-
schungsmethoden angepat sein sollten.
haben erfordert vom Untersucher eine Vielzahl
von Festlegungen (zum Beispiel die Auswahl der
Weitere Definitions- bzw. Beschreibungsver- erhobenen Variablen, die genaue Definition der
suche hierzu geben etwa Biefang (1980), Bortz zu untersuchenden Alternativen, die interpreta-
& Dring (1995), Bromer/Schrder (1992), tive Bewertung der Ergebnisse und deren Aussa-
Cronbach (1972), Hellstern & Wollmann gekraft), bei denen natrlich die persnliche
(1984), Pollard (1986), Rossi & Freeman (1985, Werthaltung eine Rolle spielen kann. Die dadurch
1993), Scriven (1972), Stufflebeam (1972), mgliche Verzerrung kann manchmal auf
Weiss (1974), Will, Winteler & Krapp (1987), ethisch-moralischen berzeugungen beruhen
Wittmann (1985). (man denke etwa an Projekte zur Feststellung der
Folgen von Abtreibungen oder von Sterbehilfe),
oft aber auch von persnlichen Vorlieben des
Ethisch-moralische Verantwortung Evaluators (zum Beispiel berzeugung von der
Richtigkeit einer bestimmten therapeutischen
Bezieht man den Begriff der (psychologie- oder Vorgehensweise oder einer verkehrstechnischen
sozialwissenschaftlich gesttzten) Evaluation Manahme) abhngen. Hilfreich ist, neben der
auf die Bewertung von Manahmen zur Beein- besonderen Sorgfalt bei der Projektplanung und
flussung relevanter menschlicher Verhaltens- Explikation aller durchgefhrten Festlegungen,
weisen, so stellt sich unabhngig von der die Offenlegung der eigenen Position durch den
technologischen Machbarkeit dieser Zielset- Evaluator (s. dazu auch Kap. 6).
zung die Frage nach der ethisch-moralischen Trotz dieser Probleme liegt der groe Vorteil
Bewertung. Im Gegensatz zur Grundlagenfor- empirisch-wissenschaftlich begrndeter Evaluati-
schung, in der Erkenntnisgewinn ohne oder on gerade darin, eben nicht bei den Meinun-
zumindest ohne unmittelbaren Verwertungs- gen von Experten stehenzubleiben, sondern auf
bezug nach theorieinternen Aspekten erarbei- der Basis von Fakten, deren Zustandekommen
tet wird, hat die Bewertung von Sachverhalten zumindest kritisch nachvollzogen werden kann,
ja nur dann Sinn, wenn darauf Entscheidun- zu entscheiden. Anzustreben ist natrlich, da
Wissenschaft, Moral und die Grenzen der Planbarkeit 15
der Evaluator zwar ein hohes Interesse an der un- antwortung des Forschers etwas auszusagen, wie
tersuchten Frage hat (zum Beispiel Verbesserung Karl-Friedrich von Weizscker (zuerst Professor
der Pflegesituation in psychiatrischen Kliniken), der Theoretischen Physik in Straburg, spter
aber den vergleichend evaluierten Alternativen Abteilungsleiter am Max-Planck-Institut fr Phy-
(zum Beispiel verschiedenen konkurrierenden sik in Gttingen, 1957 zum ordentlichen Profes-
Pflegekonzepten) neutral gegenbersteht. Aller- sor der Philosophie an der Universitt Hamburg
dings stellt sich auch dann eine Reihe von ethi- ernannt). Eine kurze und bersichtliche Stel-
schen Fragen, in diesem Beispiel etwa nach der lungnahme von ihm, die gleichzeitig einige
Rechtfertigung der Optimierung von psychiatri- hochinteressante Aspekte fr den Bereich der
schen Kliniken (wahrscheinlich fr viele unpro- Evaluation aufweist, ist in leicht gekrzter Form
blematisch, man denke aber an die heftigen Dis- im Diagramm I/1 wiedergegeben.
kussionen um zum Beispiel Sterbe- oder Bei nherer Betrachtung fallen einige Beson-
Abtreibungskliniken) oder die Verantwortbarkeit derheiten auf, die auch typisch fr das Verhal-
der Nutzung der Untersuchungsergebnisse zur ten vieler Evaluatoren im Praxisfeld sein drf-
landesweiten Durchsetzung eines der Pflege- ten:
konzepte, obwohl evtl. die Aussagekraft der Da-
ten eine so weitreichende Entscheidung nicht Die Begriffe bleiben etwas unklar, zum Bei-
ausreichend fundiert. spiel Wissenschaft (als abstraktes System
Da Evaluation in dem hier verwendeten Sinn im Sinne eines Gegenstandsbereiches, Aus-
im Regelfall unter der Beteiligung wissenschaft- sagen ber diesen und berprfungsmetho-
lich vorgebildeter Personen erfolgt, wird im 1. den? Als Synonym fr alle Forscher? Oder ist
Abschnitt dieses Kapitels das Problem von Wis- vielleicht das soziale System Wissenschaft
senschaft und moralischer Verantwortung an- mit den dazugehrenden Rollenerwartungen
gerissen. Hat man (persnlich) zufriedenstellen- und Sanktionen gemeint?) oder produktive
de Zielsetzungen seines Handelns festgelegt, Verantwortung (im Sinne eines Appells?
kann man Evaluationsvorhaben dazu benut- oder wer ist wem bei Beachtung welcher
zen, die Erreichung der angestrebten Ziele zu Sanktionen verantwortlich?) und ermgli-
optimieren. Im nchsten Abschnitt wird daher chen dadurch eine auch in den einzelnen
auf der Basis von allgemeinen Vorstellungen Abstzen wechselnde Perspektive (Gleiches
ber menschliches Handeln gezeigt, welche findet man, nur weniger elegant, in vielen
unter den weiten Bereich der Evaluation fallen- Evaluationsberichten, wenn vorher keine
den Beitrge von seiten der Wissenschaft zur ausreichende Explikation erfolgte; vgl. dazu
Verbesserung der Praxissituation eingebracht Abschnitt 4.1.2).
werden knnen, was gleichzeitig eine feinere Das Gleichnis des dreijhrigen Kindes mit
Strukturierung des Evaluationsbegriffes ermg- seinen Eltern und dem Streichholz mu man
licht. Im letzten Abschnitt dieses Kapitels wird unter dem Gesichtspunkt des Perspektiven-
versucht, ein wenig auf die Unterschiede und wechsels betrachten; es mag dem Wissen-
Beziehungen zwischen Evaluation und Wis- schaftler oder doch zumindest den wissen-
senschaft einzugehen, da die Erfahrung in schaftlich Ausgebildeten erbauen, sich in die
mehreren und zum Teil sehr intensiven Gespr- Rolle der Eltern versetzt zu sehen und im
chen gezeigt hat, da dieser Punkt fr viele wis- Hinblick auf Fachwissen und Verantwor-
senschaftlich Ausgebildete nicht nur ein sachli- tungsgefhl den Entscheidungstrgern unserer
ches, sondern offensichtlich auch ein stark Gesellschaft (zum Beispiel Politikern, Leiten-
emotionsbehaftetes Problem ist. den Beamten, Wirtschaftsfhrern, Jour-
nalisten) ebenso berlegen zu sein, wie es
Eltern blicherweise gegenber einem drei-
jhrigen Kind sind. Es ist aber zu bezweifeln,
1.2 Wissenschaft und ob dieser Vergleich von den mit dem Kind
moralische Verantwortung identifizierten Gruppen in gleicher Weise ak-
zeptiert werden knnte, und auch, ob er
Im deutschen Sprachraum drfte kaum ein an- berhaupt sachlich angemessen ist. Die
derer so qualifiziert sein, ber die moralische Ver- damit leicht zu assoziierende Selbstber-
16 Wissenschaft, Moral und die Grenzen der Planbarkeit

Diagramm I/1
ber die moralische Verantwortung des Forschers (gekrzt aus Weizscker, 1983)

Im Jahre 1939 hatte Otto Hahn die Uran- Der Begriff der legalen Verantwortung ent-
spaltung entdeckt. Den Vlkern wurde die lastet uns von der unlsbaren Aufgabe, unse-
Atombombe 1945 sichtbar. Ihr verdanken wir rem Mitmenschen moralisch ins Herz zu se-
einen nun schon ber 25 Jahre dauernden hen. Vor dem Gesetz ist der Unternehmer, der
Waffenstillstand der Weltmchte (). Techniker, unter Umstnden auch der For-
Die Illusion der sechziger und siebziger Jah- scher, fr diejenigen Folgen des Handelns
re, wir lebten schon im gesicherten Frie- verantwortlich, die in einer vom Gesetz zu
den, schwindet rapide dahin. Ich habe sie nie definierenden Weise von seiner eigenen Ent-
geteilt. Die Frage nun lautet: Wie mu man scheidung abhngen. Die Wissenschaft, glo-
die Naturwissenschaft treiben, wenn Natur- bal gesehen, ist fr ihre Folgen nicht legal
wissenschaft solche politischen Folgen hat? verantwortlich. Moralische Verantwortung
hingegen betrifft in ihrem Kern Vorwrfe, die
Es ist evident, da es sich hier nicht nur um
ich nicht anderen Menschen zu machen habe
die spezielle Frage der Atombombe und ber-
und die anderen nicht mir, es sei denn als
haupt nicht um das Problem des Krieges han-
Freunde, als echte Pdagogen, sondern ich mir
delt. Da die moderne Technik, die erst durch
selbst.
die Naturwissenschaft mglich wird, die Welt
verndert, das wei man sptestens seit dem Wird die Wissenschaft angegriffen, dann ste-
19. Jahrhundert (). he ich zu ihr. Aber als Wissenschaftler unter
Wissenschaftlern kann ich uns von keiner der
Es gibt eine moralische Einsicht, der ich mich
guten und schlechten Folgen, die wir ausge-
nicht habe entziehen knnen. Sie heit, in
lst haben, freisprechen. Der Grad mora-
einem Satz zusammengedrngt: Die Wissen-
lischer Reife der sozialen Gruppe der Wissen-
schaft ist fr ihre Folgen verantwortlich.
schaftler bemit sich nach der produktiven
Der Satz sei zunchst gegen ein paar mg-
Verantwortung fr die Folgen ihrer Erkennt-
liche Miverstndnisse abgesichert.
nisse, die sie praktisch bernimmt.
Erstens: Der Satz meint nicht, die Wissen-
Drittens: Produktive Verantwortung der Wis-
schaft sei um ihrer weltverndernden Folgen
senschaft bedeutet also offenbar nicht den
willen betrieben worden. Aber Wissen ist
Verzicht auf Wissenschaft. Nicht den Verzicht
Macht, auch wenn man es nicht um der
auf Wahrheitssuche; das hiee unserer Kultur
Macht willen gesucht hat ().
das Herz herausoperieren. Auch nicht den Ver-
Jedenfalls aber ist moralische Reife einem zicht auf ihre ffentlichkeitsform. Drren-
Menschen nicht erreichbar, der sich fr die matts Physiker ironisieren vortrefflich die
faktischen Folgen seines Handelns nicht ver- Sinnlosigkeit dieses Weges. Geh ins Irrenhaus,
antwortlich wei. Wenn die Eltern dem drei- um deine Erkenntnisse zu verbergen, und der
jhrigen Kind zeigen, wie man ein Streich- Irrenarzt wird sie dir entlocken und verwen-
holz anzndet, und bei der Rckkehr vom den. Die heutige Gesellschaft mit der Privati-
Spaziergang ihr Haus im Flammen finden, so sierung der Kultur ist eine Spielart dieses Ir-
hat nicht das Kind die Streichhlzer mi- renhauses. Die Aufgabe ist schwerer und
braucht. Das fllt mir immer ein, wenn ich schner als der Verzicht es wre. Der Wissen-
die Rede von Mibrauch der Wissenschaft schaftler als Staatsbrger und Weltbrger hat,
durch die Inhaber der Macht hre. mit den Gaben, die er als Person jeweils in
sich vorfindet, an der Gestaltung der unver-
Zweitens: Der Wissenschaftler ist fr die Fol- meidlichen Gesellschafts- und Weltvernde-
gen seiner Erkenntnis nicht legal, sondern rungen mitzuwirken. Diese Gaben sind ver-
moralisch verantwortlich (). schieden. Nicht jeder Wissenschaftler hat den
Wissenschaft, Moral und die Grenzen der Planbarkeit 17

Mut, die Einsicht, die Schlauheit und die wortung kann sie sich nicht freisprechen bei
Nchternheit, ohne die man nicht erfolgreich Strafe des Untergangs.
politisch handeln kann. Aber jeder Wissen-
Es ist zu frchten, da wir Menschen dieser
schaftler hat den Verstand, die Wichtigkeit
Zeit das, was wir tun mssen, erst in einer
dieser Aufgabe sehen zu knnen. Die Han-
ungeheuren Leidenserfahrung lernen werden
delnden bedrfen stets des Chores derer, die
().
mitdenken, vernehmlich kritisieren und ver-
nehmlich zustimmen. Die Wissenschaft hat Die Wissenschaft selbst ist nicht erwachsen:
insbesondere die spezifische Verantwortung, Ihre Denkmittel, ihre Verhaltensregeln sind
ihre eigenen Folgen und Verstrickungen selbst dem Leben in der von ihr selbst erzeugten
rational zu durchdenken. Von dieser Verant- Welt nicht angemessen ().

schtzung von Wissenschaftlern gegenber punktes ist, was eigentlich einen Fachwissen-
anderen Berufsgruppen ist eine ganz ent- schaftler befhigen soll, in besonderer Weise
scheidende Grundlage fr erhebliche Komm- (man denke an den Vergleich von Eltern, Kin-
unikations- und Kooperationsprobleme bei dern, Wissenschaftlern und Entscheidungstr-
Evaluationsprojekten (vgl. Abschnitt 2.2.1 gern) die Fallen und Verstrickungen der diszi-
und 5.1.1). plinbezogenen Forschung bzw. Technologie zu
Die praktische Konsequenz der Weizscker- durchdenken. Wissenschaftlicher Fortschritt ent-
Ausfhrungen ist letztlich fr die Wissen- steht heute (man mag dies bedauern) nahezu
schaftler auerordentlich erfreulich. Sie ausschlielich auf der Basis hoher Spezia-
knnen im Prinzip alles so tun wie bisher. lisierung der Forscher, und ein etwa in der Fein-
Da sowohl der Verzicht auf Forschung als struktur der Materie hervorragend ausgewie-
auch eine Geheimwissenschaft abgelehnt sener Kollege verfgt im allgemeinen nicht
wird (zurecht!), verbleibt neben einigen einmal ber elementare Kenntnisse sozialwis-
kaum verhaltensrelevanten Appellen nur senschaftlicher Theorien oder Methodik. Wo-
die Forderung, da die Wissenschaft aus her sollte er die Kompetenz nehmen, ber das
einer (etwas unklaren) spezifischen Ver- normale Niveau eines gebildeten, politisch
antwortung heraus ihre eigenen Folgen und gesellschaftlich interessierten Menschen
rational durchdenken soll. Dies wre eine (etwa eines Verwaltungsbeamten) hinausge-
zustzliche Arbeitsaufgabe fr die Wissen- hende Ma die gesellschaftlichen Konsequen-
schaftsgemeinschaft, die heute zweifellos zen der Entdeckung eines neuen Materie-
noch nicht konsensmig als legitimer Be- teilchens abzuschtzen? Und warum sollte ein
standteil aller Teildisziplinen gesehen wird tierexperimentell arbeitender Psychologe, dem
(und die nderung dieses Zustandes drfte ein entscheidender Durchbruch in der Psycho-
das Kernziel der Ausfhrungen von Weiz- immunologie gelingt, die mglichen Konse-
scker sein). Zustzliche Arbeit kann aber quenzen aus einer weiter zunehmenden ber-
nur entweder auf Kosten der bisherigen Lei- alterung der Industriegesellschaften als Experte
stungen (was eine Reduzierung des wissen- abschtzen knnen?
schaftlich-technischen Fortschrittes wre)
erbracht werden, oder man verwendet dazu Wie umstritten die moralische Bewertung von
zustzliche Ressourcen (was heit, da mit Fortschritten in der wissenschaftlichen Erfas-
der Begrndung der moralischen Verant- sung von evaluationsrelevanten Aspekten
wortung des Forschers die Anteile der ge- sein kann, zeigt sich zum Beispiel in den einfa-
sellschaftlichen Mittel fr diese Berufsgrup- chen, billig gewordenen Mglichkeiten der
pe zu steigern wren). Eigentlich eine fr Ultraschalldiagnostik, die es auch in einem
viele wissenschaftlich Ttige sehr befriedi- Land wie Indien ermglicht, das Geschlecht
gende Konklusion. des Kindes schon in einer frhen Phase der
Schwangerschaft zuverlssig zu bestimmen-
Der fr den Evaluationsbereich besonders und dort zum gezielten Abbruch von Schwan-
interessante Aspekt des letzten Diskussions- gerschaften mit weiblichen Ften fhrt. hnli-
18 Wissenschaft, Moral und die Grenzen der Planbarkeit

che Diskussionen finden sich auch in Europa, auen gesteuerten, kausal determinierten Indi-
etwa im Zusammenhang mit den verbesserten viduums gesehen. Sicher gibt es auch solche
gentechnischen Mglichkeiten der frhzeitigen erlernten Stimulus-Response Verhaltensketten.
Feststellung von Behinderungen. Hier ist unab- In vielen Fllen ist menschliches Verhalten aber
hngig von der eigenen Werthaltung des Fach- zielorientiert geplant. Man mchte ein be-
Wissenschaftlers die Mglichkeit zu dieser Art stimmtes Ergebnis erreichen und whlt unter
von Evaluation an sich gesellschaftlich um- oft vielen mglichen Aktionen jene aus, die
stritten, man kann sich aber kaum vorstellen, subjektiv am gnstigsten erscheint. Der damit
da die richtige Vorgehensweise ein Verzicht erreichte Erfolg, der bentigte Aufwand und
auf diese medizinisch-diagnostischen Mglich- evtl. aufgetretene unbeabsichtigte Nebenwir-
keiten wre oder deren Entdecker moralisch kungen werden rckgemeldet, subjektiv bewer-
negativ zu bewerten wren. Nicht Erkennt- tet und fhren gegebenenfalls zu einer Opti-
nisverzicht, sondern der berlegte Umgang mit mierung des Verhaltens. Dies gilt sowohl fr
den dadurch gewonnen Handlungsmglich- die stndige Kontrolle des Verhaltens und sei-
keiten mu die Lsung sein. ner Ergebnisse mit der Mglichkeit, die Pro-
Diese berlegung spricht dafr, da man die blemlsung sofort zu verbessern (vgl. forma-
Verantwortung der Wissenschaft fr das tive Evaluation im Diagramm II/2) als auch fr
Durchdenken ihrer Konsequenzen eher so ver- eine nachtrgliche Bewertung des Vorgehens
steht, da zu diesem sozialen System auch (ver- (summative Evaluation) als Grundlage eines
strkt) Subsysteme hinzutreten sollten, die die- gnstigeren Verhaltens in einer spter auftre-
se spezialisierte Aufgabe auf entsprechendem tenden, vergleichbaren Situation. In diesem
Expertenniveau bernehmen. Da man solche Sinne reagiert der Mensch (in manchen Situa-
Spezialisten in den einleitend ausgefhrten tionen) nicht, sondern er handelt.
Teilbereichen als Evaluatoren bezeichnet,
lt sich die Forderung nach mehr Stellen fr
diese Berufsgruppe offensichtlich stringent aus Handlungsmodell
einer akzeptierten moralischen Forderung
ableiten. Diese Ableitung gilt aber nur dann, Ein einfaches Handlungsmodell ist in Diagramm
wenn tatschlich spezialisierte Wissenschaftler I/2 dargestellt (vgl. Heckhausen, (1989); Lan-
solche Bewertungsprobleme strukturell besser termann, (1980), Werbik, 1978). Betrachtet
lsen knnen als andere Berufsgruppen, was man nur so einen einfachen Fall, ist das
nur fr Teilbereiche dieser Aufgabe plausibel Optimierungsproblem relativ leicht zu lsen
begrndet werden kann (siehe dazu Abschnitt aus der Menge der zur Verfgung stehenden
1.3). Da selbst bei grtem Aufwand fr solche Verhaltensweisen ist jene auszuwhlen, die bei
Ethikspezialisten nicht bei jedem Projekt geringsten Kosten (u. a. im Sinne von Neben-
oder bei jeder Projektplanung ein solcher mit wirkungen) das gewnschte Ziel in besonders
hinzugezogen werden knnte, bleibt ein erheb- effektiver Weise zu erreichen gestattet. Leider
liches Ma an Eigenverantwortung bei jedem ist die faktische Situation um vieles komplizier-
Wissenschaftler bzw. Evaluator selbst. ter.

Handlungsoptimierung in komplexen
1.3 Handlungsoptimierung Situationen
durch Evaluation
Einfache bersichten wie im Diagramm I/2 ver-
Der Mensch als planendes und handelndes nachlssigen vieles, was fr menschliches Han-
Subjekt deln in realen Situationen bestimmend ist.
Einerseits sind die einzelnen Ziele in berge-
In weiten Bereichen der Psychologie wird aus ordnete Zielhierarchien eingebettet, anderer-
sachlichen, den Gegenstandsbereich angemes- seits schafft die Zielerreichung (und die dazu
senen Grnden heraus der Mensch nicht als eingeschlagenen Wege) selbst Bedingungen, die
eine abhngige Variable im Sinne eines von das System ihrerseits wiederum beeinflussen.
Wissenschaft, Moral und die Grenzen der Planbarkeit 19
Die Einbettung jeder Teilzielerreichung inner- tende) Folgen eine bestimmte Manahme tat-
halb eines Ursache-Wirkungssystems hat zur schlich auf sein ganzes Leben bezogen hatte.
Folge, da die Bewertung der Zielerreichung Fr die Gesamtgesellschaft mte man sogar
(bzw. der dafr eingesetzten Manahmen) bis zum Aussterben der Menschheit auf eine
nicht am jeweiligen Teilziel allein, sondern nur endgltige Bewertung warten (siehe dazu das
innerhalb des Gesamtbeziehungsnetzes erfol- Ultimate Criterion, Thorndike, 1949). Schon
gen kann. Diese Vernetzung von Kausalbezie- aus diesem Grund ist es unmglich, mit empi-
hungen lt eine endgltige Bewertung ei- rischer Fundierung letztendlich gltig den Ef-
ner Manahme erst dann zu, wenn das System, fekt einer Manahme zu bewerten. Durch die
auf das diese Manahme einwirkt, nicht mehr prinzipielle Offenheit des Systems (sei es der
besteht. Konzentriert man sich etwa auf einen Einzelmensch mit den vielen nicht vorhersag-
Einzelmenschen, so kann man erst nach des- baren Einflssen, denen er ausgesetzt ist, sei es
sen Tode feststellen, welche (und wie zu bewer- die Gesamtgesellschaft mit den nicht berblick-

Diagramm I/2
Struktur des Handlungsablaufes

Situation

Person

ZIELE

Ist Soll

Diskrepanz

Handlungsplne hierarchisch organisiert

H1 H2 H3

H1.1 H1.2 H2.1 H2.2 H3.1 H3.2

Bewertung der Handlungsalternativen z.B. unter dem Kosten Nutzen Aspekt!

Handlungsausfhrung

Ausfhrungskontrolle

Ergebnis

Folgen und Bewertung der Folgen

Anmerkung: Fr weiterfhrende Literatur vgl. Werbik, 1978; Lantermann, 1980


20 Wissenschaft, Moral und die Grenzen der Planbarkeit

baren wechselseitigen Verbindungen) ist es sierbare Kausalketten zurckfhren lt, ist


auch nicht mglich, mittels Optimierung von eine zustzliche, wertende Festlegung erfor-
Zwischenschritten sequentiell ein optimales derlich.
Gesamtergebnis zu erreichen. Man vergleiche
dazu etwa das Schachspiel: Das Erreichen eines
an sich positiv zu bewertenden Zwischenzieles Rolle des Auftraggebers fr die Evaluation
in Form eines bestimmten Figurengewinns oder
einer bestimmten Position kann, bei entspre- Die Konsequenz fr Evaluatoren ist, da sie in
chend nicht vorhergesehener Reaktion des ihrer Rolle als wissenschaftliche Experten viele
Spielpartners, sich insgesamt gesehen als nega- wichtige Fragen in Evaluationsprojekten nicht
tiv spielentscheidend auswirken. in eigener Verantwortung entscheiden knnen
(bzw. sollten). Sie sind auf die Kooperation mit
Die Konsequenz aus dieser nicht vermeidbaren einer im folgenden als Auftraggeber bezeich-
Tatsache ist, da man Spielregeln fr die neten Instanz angewiesen, die sowohl die Zeit-
Bewertung von Zwischenzielen bzw. Zwischen- perspektive festlegt als auch bestimmt, welche
ergebnissen bentigt, in gleicher Weise, wie Folgen wie zu bewerten sind. Es besteht natr-
beim Schachspielen durch persnliche Erfah- lich eine groe Versuchung, vor allem bei ent-
rung, Lehrbcher oder Computerprogramme sprechend hoher Einschtzung der eigenen
die Spielsituationen vorlufig bewertet werden, Kompetenz (vgl. das Kind/Eltern-Gleichnis im
ohne den Anspruch einer endgltigen Prognose Diagramm I/1), in Evaluationsprojekten auch
des Spielausgangs zu erheben. Vieles, wenn diese Funktionen zu bernehmen. Eine solche
auch nicht alles von dem, was man als mo- Kompetenzanmaung beinhaltet aber die
ralisch angemessen bezeichnet, drfte sich auf Gefahr, da ein wissenschaftlich vergleichbar
solche Bewertungen von Zwischenstufen zu- kompetenter Kollege mit der gleichen inne-
rckfhren lassen. ren berzeugung eine andere Bewertung
vornimmt, die natrlich ebensowenig fachwis-
senschaftlich abgesttzt werden kann wie die
Konsequenzen fr die Evaluation eigene Position. Die darauf folgenden Ausein-
andersetzungen erwecken leicht negative Ein-
Fr die Arbeit an Evaluationsfragestellungen er- drcke ber wissenschaftliche Evaluation (zum
geben sich aus diesen berlegungen zwei Kon- Beispiel die Unterstellung der Kaufbarkeit
sequenzen: von Wissenschaftlern, explizit bei Frister, 1972;
oder die Vermutung auch fachwissenschaft-
Kein Evaluationsprojekt kann die endglti- licher Inkompetenz ganzer Fachbereiche; Kritik
gen Folgen einer Manahme bewerten; es an den Kosten der Evaluationsprojekte, da diese
ist immer notwendig, Zwischenziele festzu- ja doch nichts Eindeutiges erbracht haben
legen und die Optimierung des Verhaltens u. .).
an einem solchen, letztlich willkrlich ge-
setzten Zwischenstadium auszurichten
Mit naturwissenschaftlichen Methoden al- Evaluation als unverzichtbare Form
lein lt sich das Bewertungsproblem nicht wissenschaftsgesttzten Lernens
lsen; zwar vermag der Wissenschaftler auf-
grund seiner Theorie- und Methodenkompe- Es wre falsch, vor dem Hintergrund der nicht
tenz in vielen Fllen bessere Aussagen ber lsbaren Problematik des Ultimate Criterion
die Zusammenhangsstruktur innerhalb des und die notwendigen Setzungen durch den
Netzwerkes der Kausalketten zu machen Auftraggeber den Beitrag systematischer
und damit die Zeitperspektive gegenber Rckmeldung bzw. Evaluation zur Verhaltens-
dem Laien ein wenig nach vorne zu verschie- optimierung gering einzuschtzen. Es gibt
ben, vielleicht auch umfassender darzustel- letztlich keine andere Mglichkeit des Ler-
len. Da sich aber das Bewertungsproblem ei- nens, als gesttzt auf (eigener oder ber-
ner guten oder schlechten Zwischenstufe mittelter) Erfahrung sein Verhalten an die
aus den genannte Grnden nicht auf analy- konkrete Situation anzupassen und jene Ma-
Wissenschaft, Moral und die Grenzen der Planbarkeit 21
nahme auszuwhlen, die am ehesten erfolg- bei allen Evaluationsprojekten immer Kritik-
versprechend ist. Selbstverstndlich verarbei- punkte finden wird, da die ideale Konzeption
tet dann auch jeder Mensch die damit erziel- eines solchen Vorhabens selbst bei unbegrenz-
ten (und bewerteten) Resultate zu einer ten Ressourcen aufgrund der geschilderten Pro-
Verbesserung seiner Handlungssteuerung, und blemlage niemals realisierbar ist und einschrn-
da dieser Proze faktisch funktionieren mu, kende Setzungen durch den Verantwortlichen
zeigt die enorme Steigerung der Fhigkeit des eines solchen Projektes erfordert. Es sollten da-
Menschen, seine Lebensbedingungen gem her nur jene Personen in diesem Feld berufst-
seinen Vorstellungen zu gestalten. Vermutlich tig werden, die mit der belminimierung an-
wurde dieser Proze durch das zumindest statt Ideallsung leben knnen und auch mit
beim Menschen nachgewiesene Motiv einer den nicht selten auftretenden Konflikten mit
Kontrollkompetenz (vgl. dazu Langer, 1983; Kollegen bei entsprechend anderer Wertsetzung
Osnabrgge et al. 1985) wesentlich gefrdert. umgehen knnen (vgl. dazu die Abschnitte
Werden die zu bewertenden Verhaltenswei- 2.1.1, 6.1.2 und 6.1.3). Evaluationsvorhaben
sen, Programme oder Interventionsmanah- rechtfertigen sich nicht aufgrund des Findens
men in ihrer Gestaltung und ihren vielflti- von absoluten Wahrheiten, sondern aufgrund
gen Auswirkungen so komplex, da der ihres Beitrages zu einem Entscheidungsproze
Einzelne ohne entsprechende wissenschafts- bzgl. der Auswahl von Verhaltensalternativen,
gesttzte Erhebungen nicht mehr die Zusam- der in jedem Fall ein Ergebnis (in Form der
menhnge zu erkennen vermag (und dies Auswahl einer bestimmten Verhaltensweise) er-
trifft sicher fr viele Steuerungs- und Gestal- bringen mu. Selbst relativ gering verbesserte
tungsmanahmen in modernen Gesellschaf- Prognosequoten ber die Gte der einzelnen
ten zu) mu die Rckmeldung ber entspre- Alternativen sind bei tatschlich bestehendem
chende Evaluationsprojekte gesichert werden. Entscheidungszwang ein Fortschritt.

belminimierung statt Ideallsung Vorschau auf die folgenden Kapitel

Bei oberflchlicher Betrachtung knnte man Im Sinne der in diesem Abschnitt besonders
meinen, da zwischen der Unmglichkeit ei- betonten Praxisbezogenheit der Evaluations-
ner idealen, ohne letztlich willkrliche Set- arbeit werden in den folgenden Kapiteln die
zungen von Ziel-Zeitpunkten und Teilbewer- grundlagenwissenschaftlichen Aspekte, die fr
tungen auskommenden Evaluation einerseits die Projektarbeit von hoher Bedeutung sind,
und dem Nutzen, ja der Unverzichtbarkeit sol- nur relativ kurz aufgenommen und zur Vertie-
cher Projekte fr moderne Gesellschaften an- fung auf die vorhandene Literatur verwiesen.
dererseits ein Widerspruch bestnde. Dieser Statt dessen wird:
lt sich aber dadurch lsen, da man auf ab-
solute Bewertungsmastbe, die Suche nach
der Bereich Evaluation ausfhrlicher struk-
turiert (Kap. 2)
Wahrheiten oder allgemein zwingend verbind-
liche Problemlsungsvorschlge verzichtet. Die
Anwendungsaspekte und Fallstudien disku-
tiert (Kap. 3)
Evaluation kann dazu dienen, innerhalb eines
wissenschaftsexternen, vorlufigen und in ge-
eine bersicht ber die wichtigsten Techniken
zur rationalen Erfassung von Zielsetzung, Pla-
wissen Grenzen willkrlichen Rahmens die
nung und Durchfhrung von Evaluations-
Wahrscheinlichkeit fr die Auswahl einer be-
studien gegeben (Kap. 4, 5 und 6)
sonders guten Verhaltensalternative zu erh-
hen und analog dazu die Wahl einer besonders
eine subjektiv gefrbte allgemeine Bewertung
von wissenschaftsgesttzter Evaluation und
schlechten Alternative zu verringern. Eine letzt-
den bisher gewonnenen Erfahrungen im 7.
lich absolut sichere Aussage, wie sie eigentlich
Kapitel dargestellt
nur in den Formalwissenschaften und man-
chen anderen Geisteswissenschaften mglich
ist, ist bei Evaluationsprojekten keine sinnvolle Diese Ausfhrungen sollen insgesamt einen
Zielsetzung. Daraus folgt zwingend, da man Rahmen bieten, innerhalb dessen die spezifi-
22 Wissenschaft, Moral und die Grenzen der Planbarkeit

schen substanzwissenschaftlichen Befunde ein Lehrbuch zu diesem Thema kein rein wis-
und methodischen Instrumente, deren Ver- senschaftliches Werk sein. Es wird daher gebe-
mittlung ja einen groen Teil der Studienan- ten, den teilweise wissenschaftsfernen Aus-
gebote ausmacht, fr die spezifischen Bedin- fhrungen in Anbetracht der besonderen
gungen der Arbeit in Evaluationsprojekten Bedingungen des Bereiches Evaluation Ver-
nutzbar gemacht werden knnen. stndnis entgegenzubringen.
Wenn Evaluation an sich nicht ein Bestand-
teil von Wissenschaft ist, kann eigentlich auch

bersicht Kapitel 1:
Wissenschaft, Moral und die Grenzen der Planbarkeit
Definitionsversuche von Evaluation

Evaluation

jegliche Art der Festsetzung systematische Anwendung sozial- Verwandte Begriffe :


des Wertes einer Sache wissenschaftlicher Methoden Erfolgskontrolle
Qualittskontrolle
Controlling

Allgemeine Kennzeichen wissenschaftlicher Evaluation


dient der Planungs- und Entscheidungshilfe
ist ziel- und zweckorientiert
soll dem aktuellen Stand wissenschaftlicher Forschung angepat sein

Wissenschaft und die moralische Verantwortung der Forscher


fr die Konsequenzen ihrer Forschung
Stellungnahme von WEIZSCKER
Forderung nach Evaluation
Aufgaben und Grenzen der Evaluation

Optimierung von Handlungsmodellen durch Evaluation


unverzichtbare Form wissenschaftsgesttzten Lernens

Ziel der Evaluation


belminimierung statt unrealistischer Ideallsung
23

2. Grundlagen sozialwissenschaftlich
gesttzter Evaluation

Wenn Evaluation nicht ausschlielich wegen des ben geplant werden. Daher ist es zweckmig,
wissenschaftlichen Interesses, als Folge freier und zwischen den typischen Nutzenerwartungen
selbstbestimmter Forschung erfolgt (auf die Pro- potentieller Auftraggeber (2.1.2) und der De-
bleme und die Seltenheit einer solchen Evalua- tail-Zielsetzung innerhalb konkreter Projekte zu
tionsgrundlage wurde im Abschnitt 1.3 einge- unterscheiden.
gangen) wird sie nur dann stattfinden, wenn der
Auftraggeber einen Bedarf nach Evaluations-
projekten hat. Dies setzt voraus, da es: 2.1.1 Grundlagen fr die Akzeptanz
von Evaluation
Ziele gibt, die mit psychologischen bzw. sozi-
alwissenschaftlichen Evaluationsvorhaben
Evaluationsvorhaben knnen erst dann einen
erreicht werden knnen (2.1)
sinnvollen Beitrag zur Zielerreichung bzw. Pro-
Beitrge der Wissenschaft fr solche Frage-
blemlsung bieten, wenn die notwendigen psy-
stellungen aus der Sicht des Auftraggebers ei-
chologischen Bedingungen fr eine empirische,
nen Nutzen haben, der die erwarteten Ko-
erfahrungsgesttzte Vorgehensweise geschaffen
sten bersteigt (2.2).
sind. Sie knnen auch nicht unabhngig vom
Die Verfgbarkeit kompetenter Evaluatoren
erreichten historischen Entwicklungsstand ei-
und anderer Ressourcen das Evaluations-
ner Gesellschaft gesehen werden.
projekt berhaupt durchfhrbar macht (2.3).

Auf diese 3 Gesichtspunkte wird in den folgen-


Psychologische Voraussetzungen
den Abschnitten dieses Kapitels nher einge-
gangen. Fr ausfhrlichere Diskussionen bzw.
Die Grundlage von Evaluation ist die Akzep-
andere Auffassungen vgl. Hellstern und Woll-
tanz der Vernderbarkeit und Vernderungs-
man, 1984; Rossi et al., 1985; Weiss, 1974; Witt-
bedrftigkeit relevanter gesellschaftlicher Ein-
mann, 1985.
richtungen, Manahmen oder Techniken , was
eine erhebliche Loslsung von Gewohnheiten,
von Autoritten und von den durch simple
Wiederholung von Verhalten ausgelsten Lern-
2.1 Zielsetzungen bei effekten erfordert. Eine entsprechende Denk-
Evaluationsvorhaben weise ist keineswegs selbstverstndlich. Warum
sollte ein Vertreter einer therapeutischen Rich-
Fr eine Analyse der Zielsetzungen bei tung, der jahrelang und (subjektiv) erfolgreich
Evaluationsprojekten ist zu beachten, da erst eine bestimmte Technik nutzte, diese pltzlich
dann konkrete Ziele angestrebt werden knnen, in Frage stellen? Ein starker Vorstand eines
wenn der Evaluationsgedanke aufgrund der hi- Unternehmens die Optimalitt seines erfolg-
storischen und psychologischen Bedingungen reichen Fhrungsverhaltens anzweifeln (und
berhaupt akzeptabel ist (2.2.1). Auf dieser evaluieren)? Ein Universittsprofessor seine
Grundlage knnen erst entsprechende Vorha- Vorlesung, die doch schon seit zwanzig Jahren
24 Grundlagen sozialwissenschaftlich gesttzter Evaluation

ausgereift ist und von hunderten Studenten er- folges, das heit der Glaube an einen vom Men-
folgreich besucht wurde, berdenken? Ein schen rational beeinflubaren Fortschritt, tre-
Bildungsanbieter sich die Frage stellen, ob ein ten.
dort ttiger Dozent wirklich noch der beste ist,
oder vielleicht doch durch einen mit mehr Ak- Aber selbst Fortschrittserwartung wird in der
zeptanz bei den Kursteilnehmern ausgetauscht Regel nur dann zu Innovationen fhren, wenn
werden sollte, obwohl man ihn schon seit vie- sich fr den Entscheidungstrger dadurch ein
len Jahren persnlich kennt? das Versagensrisiko wettmachender Nutzen er-
Der fr evaluationsgesttzte Optimierung geben kann. Ein schnes Beispiel fr die Folgen
ntige affektive Entwicklungsstand der Betei- des Fehlens einer solchen Nutzenerwartung ist
ligten mu gelegentlich erst geschaffen werden, der Vergleich der Entdeckungsreisen im 15.
etwa durch Personal- oder Organisationsent- Jahrhundert zwischen Europern und Chine-
wicklungsmanahmen in Wirtschaft und Ver- sen. Beide Kulturen erforschten etwa zur glei-
waltungen oder massive Aufklrung der ffent- chen Zeit die Seewege nach Indien und Afrika,
lichkeit ber die Nachteile lang eingefhrter China mit in groem Stil staatlich untersttzen
Mechanismen, zum Beispiel im Gesundheits- Forschungsexpeditionen unter militrischer
oder Sozialwesen, falls in diesen Bereichen In- Fhrung, die Europer anfnglich im wesent-
novationen angestrebt werden. lich kleineren Rahmen. Fr die Chinesen war,
Eine weitere wichtige psychologische Voraus- neben dem allgemeinen wissenschaftlichen
setzung ist die Bereitschaft, sich zu Zwecken Erkenntnisdrang, ein praktischer Nutzen aus
der Verbesserung des bestehenden Verhaltens neuen, auf diese Ergebnisse gesttzten Verhal-
(Hoffnung auf Erfolg) dem Risiko des Schei- tensweisen nicht erkennbar (ausreichende Ver-
terns (Furcht vor Mierfolg) auszusetzen. Je- sorgung mit allen in den neu entdeckten Ge-
der in der Vergangenheit relativ erfolgreiche bieten verfgbaren wichtigen Handelsgtern
Lsungsweg (Erzeugung von Nahrungsmitteln, im eigenen Herrschaftsbereich war gegeben),
Disposition von Gtern, Regelungen des sozia- whrenddem fr die Europer als Folge der po-
len Umganges miteinander) hat sich in gewis- litischen Vernderungen durch das Erstarken ei-
sem Sinne bewhrt und ist hinsichtlich sei- nes feindlich eingestellten osmanischen Rei-
ner Nebenaspekte (Aufwendungen, Kosten und ches und den Niedergang von Byzanz die
dgl.) annhernd durchschaubar. Er wird daher bisherigen Handelswege ber Land verlorengin-
nach den Lerngesetzen Lernen am Erfolg, gen bzw. aufgrund hoher Abgaben nicht mehr
Lernen durch Wiederholung und Lernen am rentabel waren (siehe ausfhrlicher bei Atiya,
Modell (der Vorgnger, Kollegen und andere, 1964). Die Folgen der darauf eingeleiteten, und
die es ja ebenso machen bzw. machten) ver- natrlich in keiner Weise vorher sozialwissen-
strkt (zu Lerngesetze siehe Bolles, 1975; schaftlich evaluierten Entwicklungen sind be-
Hilgard und Bower, 1981; Mayer, 1979; Torpy, kannt und zeigen gleichzeitig, wie verschieden
1966, sozial-kognitive Lerntheorie, Bandura die Nutzen-Bewertung bei wechselndem Zeit-
1986). Das Beibehalten kommt auch der Ten- horizont (vgl. dazu Abschnitt 1.2) sein kann.
denz zur Vermeidung von Verantwortung sehr
entgegen, da bliche Verhaltensweisen nicht Eine dritte psychologische Grundlage, ohne die
nur hufig einen (relativen) Erfolg bringen, son- sinnvolle Evaluation nicht denkbar ist, ist die
dern auch im Falle des Mierfolges eine exter- Bereitschaft der Entscheidungstrger zur Akzep-
nale Attribuierung nahelegen wenn ich alles tanz von Fakten. Gerade wenn Neuerungen
nach den herrschenden Vorstellungen richtig von einer bestimmten Sollvorstellung ber den
gemacht habe, ist der Mierfolg auf uere Menschen ausgehen, wenn sie das Ziel haben,
Umstnde und nicht auf meine Entscheidung die Verhltnisse nicht so zu lassen wie sie sind,
zurckzufhren (zu den motivationspsycho- sondern einen besseren Zustand anstreben,
logischen und attributionstheoretischen ber- sind die Innovatoren empirisch fundierten Ar-
legungen siehe etwa Heckhausen, 1989; Heider, gumenten strukturell wenig zugnglich, da sie
1958; Meyer und Schmalt, 1984; Weiner, 1984). ja gerade die derzeit aufzeigbare Faktenlage ver-
Zustzlich zur theoretischen Erkenntnis der ndern wollen. Als Konsequenz davon wird ge-
Vernderbarkeit mu also die Erwartung des Er- sellschaftlich relevante sozialwissenschafliche
Grundlagen sozialwissenschaftlich gesttzter Evaluation 25
Forschung immer dann unterdrckt, wenn bestimmten Zeiten bestimmte Evaluations-
die Ergebnisse Schwchen der herrschenden projekte nicht finanzieren, Experten aller
Ideologie aufzeigen knnten (ein Beispiel aus Richtungen (Therapeuten, Pdagogen, Fh-
jngster Zeit dafr ist die Bewertung psycholo- rungskrfte, Professoren ) die trotz der Be-
gischer Diagnostik und damit zusammenhn- fundlage ihr Verhalten nderungsresistent
gender Persnlichkeitsforschung unter Hitler, beibehalten, Studenten, die entgegen den
Stalin, radikalen Teilen der 68er Bewegung und aufgezeigten Fakten tradierte Vorurteile ge-
Teilen der extremen Rechten in den USA, siehe genber einem bestimmten Dozenten weiter
dazu etwa Wottawa und Hossiep, 1987, S. 97 ff., pflegen alle solche Beispiele zeigen, da von
ausfhrlicher bei Drenth, 1969). einer zwingenden Akzeptanz von Fakten
Es ist aber keineswegs nur eine solche massi- auch heute keineswegs ausgegangen werden
ve, mit gesellschaftlicher Macht verbundene kann.
Unterdrckung von Fakten, die empirisch-wis-
senschaftliche Evaluationen in bestimmten Be- Die anspruchsvollen psychologischen Erfor-
reichen unmglich macht. Die praktische Er- dernisse fr die Akzeptanz sozialwissenschaft-
fahrung mit Evaluationsprojekten zeigt, da licher Evaluationen machen es verstndlich,
auch in kleinerem und strker konkretisiertem da die heute relativ gnstige Situation erst
Rahmen immer wieder Argumente zu hren im Laufe eines langen Entwicklungsprozesses
sind, die auf zumindest teilweise fehlende Aus- mit teilweise sehr schmerzhaften Rckschl-
prgung der diskutierten psychologischen gen erreicht wurde. Es ist sicher noch viel
Grundlagen hinweisen: Entscheidungstrger, Aufklrungsarbeit ntig, um die Akzeptanz
die unerwnschte Berichte ablegen statt dieses Optimierungsinstrumentes dauerhaft
nutzen, Geldgeber (auch ffentliche), die zu zu sichern.

Diagramm II/1
Grobe bersicht ber die geschichtliche Entwicklung von Evaluation
Urgesellschaft lich relevanter Manahmen, insbesondere zur
berprfung von Staatsformen damit wird
Erste Evaluationsversuche technischer Art die Gestaltung der Gesellschaft zu einer auf
durch die Bercksichtigung empirisch erwor- Evaluationsbasis aufbauenden Optimierungs-
bener Kenntnisse ber Materialeigenschaften aufgabe. Zunchst bleibt es aber bei der
bei der Herstellung von Gertschaften und theoretischen Forderung ohne praktische
Waffen. Konsequenzen. Bei den Rmern erfahrungs-
Spter Umsetzung von erkannten biologi- bedingter Wechsel zwischen Demokratie und
schen Gesetzmigkeiten in Ackerbau und (in Krisenzeiten) befristeter Diktatur, was als
Viehzucht (z. B.: Mnnliche Schafe bekom- Anwendung dieser Optimierungsidee gedeu-
men keine Junge und geben keine Milch; ent- tet werden kann.
fernt man aber alle unntzen Tiere dieser
Art aus der Herde, entfllt bald die gesamte
Fleisch- und Milchproduktion). Erste gesell- Europisch-lateinisches Mittelalter
schaftliche Arbeitsteilung (Ackerbau, Vieh-
zchter) berlagert aufgrund nutzenorien- Die Nutzen-berlegungen aus der Antike blei-
tierter (bewerteter) Erfahrungen die frhere ben erhalten, aber ohne Umsetzung solcher
Arbeitsteilung nach Alter und Geschlecht. theoretischer Forderungen. Die umfassendste
weiterfhrende Systematisierung des aristote-
lischen Verstndnisses von Nutzen erfolgt
Griechisch-rmische Antike durch Thomas von Aquin. Generell gilt aber,
da im Mittelalter die Handlungsorientierung
Bereits Aristoteles fordert die empirische Nut- auf einem religis fundierten Gut/Bse-Prin-
zenbestimmung zur Bewertung gesellschaft- zip beruht und die empirische berprfung
26 Grundlagen sozialwissenschaftlich gesttzter Evaluation

des Nutzens einer Sache oder Manahme weit einer empirisch verifizierbaren und rational
hinter die spekulative, religis-moralische Be- kalkulierbaren Wissenschaft zu machen. Als
wertung zurcktritt. Dies bedingt auch eine einziges und hchstes Beurteilungskriterium
erhebliche Innovationsschwche und die Un- von Moral und Recht gilt das Prinzip des Nut-
terbrechung der in der Antike begonnenen zens.
empirischen Wissenschaftsanstze.

Zeitalter der industriellen Revolution


Renaissance
Zur Mitte des 18. Jahrhunderts entwickelt sich
Weitreichende geistige Umwlzungen. Die auf der Grundlage technischer Innovationen
Unterbrechung der Handelswege nach Asien (Werkzeugmaschinen, Dampfmaschine) das
durch die Osmanen bedingt hohes Interesse Fabriksystem und damit die kapitalistische
an neuen geographischen Entdeckungen Produktionsweise. Die empirischen Wissen-
(Vasco da Gama, Columbus); eine Vielzahl schaften werden immer zielgerichteter nut-
neuer wissenschaftlicher Erkenntnisse wie zenorientiert zur Lsung gesellschaftlicher
geozentrisches Weltbild (Kopernikus, Galilei), Probleme eingesetzt (soziale Evaluation). Auf
in der Mechanik (Leonardo da Vinci), Medi- dieser Grundlage erwchst schlielich die br-
zin, Bergbau, Botanik und Zoologie prgen die gerliche Gesellschaftsordnung und die Durch-
Zeit. Der starke Aufschwung der empirischen setzung demokratischer Staatsformen. Durch
Wissenschaft (die Erfahrung wird zuneh- die damit einhergehende Flexibilisierung ge-
mend ber Schriften und berlieferte Tradi- sellschaftlicher Systeme und Institutionen er-
tion gestellt) geht mit Innovations- und starkt das utilitaristische Gedankengut.
Evaluationsversuchen in den verschiedensten
Gebieten einher.
20. Jahrhundert

Das Manufakturzeitalter Explosionsartige Vermehrung des Wissens


in den empirischen Wissenschaften, all-
Der enorme Aufschwung der Naturwissenschaf- mhlicher Aufbau eigenstndiger, empiri-
ten im 17. Jahrhundert bringt eine gezielt scher Gesellschaftswissenschafen (Soziolo-
nutzenorientierte Vernderung der technischen gie, konomie). Entwicklung spezifischer
und konomischen Entwicklung mit sich. Die Evaluationsforschung als stark expandieren-
Festigung und Institutionalisierung der empiri- de Arbeitsrichtung in den empirischen Ver-
schen Forschung steht im engen Zusammen- haltens- und Sozialwissenschaften, die vor
hang mit der europischen Aufklrung. allem in den besonders wenig traditionsge-
bundenen Gesellschaften (USA!) in nahezu
In der Philosophie breitet sich mit dem Utili- allen gesellschaftlichen Bereichen (Bildung,
tarismus eine Denkweise aus, die versucht, Wirtschaft, Politik und Verwaltung, Um-
allgemein verbindliche Normen mit wis- welt, Gesundheit, Wohnungsbau, Militr)
senschaftlichen Mitteln (also evaluations- eine wesentliche Gestaltungshilfe wird.
gesttzt) zu begrnden (eingeleitet durch J.
Bentham und spter verfeinert durch J. S. Fr weiterfhrende Literatur vgl. Mittelstra,
Mill). In der utilitaristischen Ethik liegt eine 1983; Wuing, 1983; Lange, 1983; Ritter und
wesentliche geistige Wurzel der modernen Grnder, 1982; Aristoteles, 1981; Hoffe,
Evaluation. Gerade Bentham versucht, Ethik 1975a, 1975b; Birnbacher und Hoerster, 1976;
und Politik, Gesetzgebung und Verwaltung zu Hoerster, 1971; Mason, 1961.

Ein wichtiger Einflufaktor ist die Unter- innovationsuntersttzend sein mu (vgl. dazu
nehmenskultur bzw. der Fhrungsstil der jewei- Briam, 1996, Osterhold, 1996, Schein, 1995,
ligen Institution, die fehlerfreundlich und Zink, 1994).
Grundlagen sozialwissenschaftlich gesttzter Evaluation 27
Geschichtliche Entwicklung des Auswahlverfahrens (zum Beispiel das Ausma
Evaluationsgedankens der Bercksichtigung von Forschungs- oder
Lehrleistungen in der Vergangenheit, Zusam-
Fr die Idee einer empirischen, sozialwissen- mensetzung der Entscheidungsgremien, Zu-
schaftlich gesttzten Evaluation wurden erst im gangsberechtigungen zum Auswahlverfahren)
Laufe einer langen geistesgeschichtlichen Ent- befassen. Ist ein System primr verhaltens-
wicklung die erforderlichen Grundlagen ge- kontrolliert (wie typischerweise die ffentliche
schaffen. Eine grobe bersicht ist im Diagramm Verwaltung, aber im Prinzip der gesamte f-
II/1 enthalten. fentliche Dienst und viele Innendienstbereiche
Versucht man, diese Entwicklung unter psy- der Wirtschaft), dann konzentrieren sich Eva-
chologischem Gesichtswinkel nachzuvollzie- luationsvorhaben auf die Compliance gegen-
hen, so drfte der entscheidende Schritt gewe- ber den Vorschriften und Manahmen zu
sen sein, da den Menschen bewut wurde, deren Erhhung (zum Beispiel durch entspre-
auch gesellschaftlich relevantes Handeln unter chende Motivationsanreize oder Leistungs-
Optimierungsaspekten selbst rational gestalten beurteilungen fr die Systemangehrigen),
zu knnen. Ein solches zielorientiertes, bewu- auch auf eine mglichst effiziente und schnelle
tes Handeln ist in keiner Weise selbstverstnd- Umsetzung von Vernderungen im Vorschrif-
lich, auch heute nicht. Zumindest im christli- tensystem. Es wre in einem solchen Denk-
chen Europa drfte die als frei erlebte system aber vllig unangemessen, zum Beispiel
Konzeption gesellschaftlicher Strukturen erst eine neue Bestimmung im Rahmen eines
mglich gewesen sein, nachdem das geozentri- Evaluationsprojektes hinsichtlich ihres Nutzens
sche Weltbild und die damit verknpfte ber- (Outputs) zu bewerten ein Gesetz ist dann
schaubarkeit des von Gott beobachteten Uni- richtig, wenn es ordnungsgem beschlossen
versums, die Einzigartigkeit der von Menschen wurde, nicht, wenn seine Auswirkungen einen
bewohnten Erde in Frage gestellt wurde. Die konkreten Nutzen fr die Brger zeigen (zu-
Reaktion der damals Mchtigen, vielleicht so- mindest gilt dies in klassischen, verhaltens-
gar ohne eine bewute, rationale Durchdrin- kontrolliert denkenden Brokratien). Innerhalb
gung der durch solche Denkprozesse ausgel- dieser Systeme ist eine solche Art von Bewer-
sten potentiellen Vernderungen, war tung auch sinnvoll, man knnte zum Beispiel
entsprechend heftig. Man vergleiche dazu etwa die Bestimmungen einer Prfungsordnung
Leben und Werk von Giordano Bruno (siehe nicht danach optimieren, ob einzelne Studen-
etwa Brockmeier, 1980; Huber, 1965) oder die ten durch deren Anwendung (zum Beispiel
bekannteren Vorgnge im Zusammenhang mit Verbot von allzu vielen Prfungswieder-
Galilei (Mason, 1961; Wuing, 1983; s. auch holungen) in irgendeiner Weise glcklich
Brecht, 1963) werden.
Im Gegensatz dazu wrden sich in output-
Die dominierenden Steuerungsformen gesell- bzw. ergebnisorientierten Systemen die Evalua-
schaftlicher Systeme sind aber nicht nur fr die tionsvorhaben schwergewichtig mit der Opti-
ferne Vergangenheit relevant, sondern prgen mierung des erlebbaren Nutzens beschftigen,
auch die Durchfhrungsbedingungen aktueller also zum Beispiel verschiedene Verhaltens-
Evaluationsprojekte. Eine wesentliche Unter- vorschriften nach solchen nutzenbezogenen
scheidung unterschiedlicher Formen der Kriterien vergleichend bewerten. Wichtig fr
Systemsteuerung ist dabei die Trennung zwi- Evaluationsprojekte ist, da es vielen Ge-
schen Input-, Verhaltens- und Output-Steue- sprchspartnern auerordentlich schwer fllt,
rung (siehe dazu Diagramm II/2). Evaluationsvorhaben auf der Basis einer ande-
Wenn ein System (wenn auch sicher nicht ren prinzipiellen Form der Systemsteuerung als
ausschlielich) durch Input-Kontrolle gesteuert der selbst erlebten berhaupt akzeptieren zu
wird, wie es zum Beispiel hinsichtlich der knnen. Manchmal werden solche Vorschlge
Professoren an Universitten in Deutschland als ausgesprochen unsinnig, vielleicht auch
der Fall ist, dann werden sich entscheidungs- tabuverletztend erlebt. Wer kme zum Beispiel
relevante Evaluationsprojekte vorwiegend mit ernsthaft auf die Idee, selbst in der derzeitigen
verschiedenen Formen der Gestaltung dieses gesellschaftlichen Situation Deutschlands , die
28 Grundlagen sozialwissenschaftlich gesttzter Evaluation

Diagramm II/2
Unterschiedliche Formen der Systemsteuerung

Systemsteuerung
Inputkontrolle Verhaltenskontrolle Ergebniskontrolle
Mchtiger Mchtiger Mchtiger
Input- Handlungs- Ziele
Ziele Ziele Ziele
vorgaben Mittel vorgaben Mittel Mittel

FILTER

Kontrolle
INPUT INPUT INPUT

SYSTEM SYSTEM SYSTEM

Kontrolle Optimierung
VERHALTEN der Verhaltens-
VERHALTEN VERHALTEN
steuerung

Kontrolle
OUTPUT OUTPUT OUTPUT

im Selbstverstndnis vor allem der Wirtschaft flsse. Es macht fr die Projektgestaltung


stark ergebnisorientiert geprgt ist, die Ma- einen groen Unterschied, ob man etwa die
nahme Verteilung eines groen Teiles wirt- Bildungsabteilung eines Unternehmens mit
schaftlicher Macht durch das Vererben des der heute etwas altmodisch erscheinenden In-
Besitzes von kleinen und mittelstndischen put-Kontrolle (Auswahl guter Dozenten und
Unternehmen (eine klassische Form der von gutem didaktischen Material, der Rest
Input-Kontrolle durch die Regelungen zur wird schon laufen!) als Auftraggeber hat, ob
Erbberechtigung) hinsichtlich ihres gesamt- die Bildungsabteilung stark verhaltenskon-
gesellschaftlichen Nutzens mit anderen Ver- trolliert (bis hin zu detailliertesten Einzelan-
teilungsmglichkeiten (zum Beispiel auf der weisungen fr das Trainerverhalten) gesteuert
Basis psychologischer Eignungsdiagnostik in wird, oder ob es sich bereits um ein modernes
Form der Feststellung des unternehmerischen Profit-Center mit eindeutigem Streben nach
Potentials) zu bewerten und ggf. darauf eine (auch wirtschaftlicher) Optimierung des Out-
Vernderung der bestehenden Regelungen auf- puts handelt. Der in den letzten Jahren deut-
zubauen? Man mu wirklich nicht in das lich gewordene gesellschaftliche Wandel hin
Mittelalter zurckgehen, um klare Grenzen zu mehr Output-Kontrolle, gerade in den fr-
mglicher bzw. sinnvoller evaluativer Vorhaben her stark brokratisierten Bereichen, bringt
in Abhngigkeit von Grundlagen der System- auch entsprechende Vernderungen in der
steuerung zu finden. Schwerpunktsetzung von Evaluationspro-
Auch im alltglichen Rahmen der Eva- jekten mit sich (vergleiche dazu auch Diagramm
luationsarbeit zeigen sich entsprechende Ein- II/3).
Grundlagen sozialwissenschaftlich gesttzter Evaluation 29
2.1.2 Nutzenerwartungen Verantwortungsdelegation
des Auftraggebers
Vor allem bei unter groer Unsicherheit ge-
troffenen Innovationsentscheidungen (Einrich-
Da die sozialwissenschaftlich gesttzte Eva- tung eines Modellversuchs mit ffentlichen
luation in praktisch allen gesellschaftlich re- Mitteln, nderung eines Ausbildungskon-
levanten Bereichen des menschlichen Ver- zeptes, Schaffung einer neuen Abteilung oder
haltens eingesetzt werden kann, gibt es eine gravierende Organisationsnderungen im Per-
sehr groe Vielfalt von Zielen bei den poten- sonalwesen) gibt es eine gewisse Tendenz,
tiellen Auftraggebern. die Verantwortung fr die eingefhrte Manah-
Eine erschpfende Darstellung ist daher me wenigstens zum Teil auf andere zu verla-
nicht mglich, die hufigsten drften die gern. Es bietet sich an, selbst ohne sinnvoll er-
folgenden sein: scheinende und ausgearbeitete Alternativen,
also ohne eine explizite Entscheidungssitua-
Bewertung ohne detaillierte Zielsetzung tion, eine begleitende Evaluation durchfhren
Verantwortungsdelegation zu lassen. Man bekundet damit Vorsicht und
Durchsetzungshilfe hofft vielleicht darauf, da die Tatsache der Eva-
Entscheidungshilfe luation als solche schon ein wenig zur Verbes-
Optimierungsgrundlagen serung beitrgt (vgl. dazu die Wissenschaftli-
Kontrolle der Zielerreichung che Begleitung von Modellprojekten).

Sie werden im folgenden kurz skizziert.


Durchsetzungshilfe

Bewertung ohne detaillierte Zielsetzung Bei diesem Ziel des Auftraggebers sind zwei, fr
die Durchfhrung und emotionale Akzeptanz
Hufig spricht man hier nicht von Evaluation, von Evaluationen sehr verschiedene Teilziele zu
sondern von berprfung oder Kontrolle. unterscheiden:
Ausgang ist wohl meist ein diffuses Unbeha-
Die Durchfhrung der Evaluation selbst, un-
gen, wie zum Beispiel Was leistet eigentlich
abhngig von den Resultaten, soll die ge-
unsere Bildungsabteilung? Oder Hat diese
wnschte Manahme erleichtern oder die
Verordnung auch nur annhernd das erbracht,
unerwnschte Manahme verhindern;
was wir damit wollten?.
Die Ergebnisse sollen so beschaffen sein, da
Gesucht wird eine mglichst umfassende In-
es der eigenen Zielsetzung entspricht;
formationen ber die ausgelsten bzw. von der
jeweiligen Institution zu verantwortenden Ef-
fekte, meist auch mit dem Hintergedanken, da Der erstgenannte Aspekt ist meist, wenn auch
die Evaluatoren im Sinne eines normen- vielleicht ungewollt, eine notwendige Folge
bezogenen Vergleiches mit den durchschnitt- wissenschaftlich sinnvoll gestalteter Evalua-
lichen Resultaten hnlicher Manahmen auch tionsprojekte. Mchte man zum Beispiel eine
eine Bewertung ermglichen. politisch umstrittene Schulform einfhren, ist
ein probeweises Einrichten einiger Schulen
Da ein solcher Auftrag zwangslufig ein ge- dieser Art um vieles leichter mglich als eine
wisses Mitrauen gegenber den Verantwort- globale Systemnderung, es gibt weniger un-
lichen, Befrwortern oder Nutznieern der mittelbar Betroffene, und es ist auch aueror-
zu evaluierenden Einrichtung bzw. Manah- dentlich schwer, rational gegen den Vorschlag
me zum Ausdruck bringt (ansonsten bruch- Sehen wir nach, was herauskommt zu argu-
te man die Evaluation ja nicht), mu der mentieren. Durch das Schaffen von Fakten set-
Evaluator mit emotionalen Problemen, ver- zen Gewhnungsprozesse ein, die Neuerung
deckten oder offenen Widerstnden und der wird nach einiger Zeit nicht mehr als neuartig
Gefahr von Fehlinformation durch die Betei- erlebt und ist damit leichter einrichtbar (fr sol-
ligten rechnen (vgl. Abschnitt 4.1). che Vorgehensweisen wird hufig auch der Be-
30 Grundlagen sozialwissenschaftlich gesttzter Evaluation

griff Salami-Taktik, die Vernderung in klei- Entscheidungshilfe


nen Portionen, gebraucht). Andererseits haben
die Gegner der Innovation dadurch die Mg- Diese Zielvorstellung drfte dem Selbstver-
lichkeit, Zeit zu gewinnen. Fr grere Evalua- stndnis der meisten Evaluatoren entgegen-
tionsprojekte mu man mit mehreren Jahren kommen. Im Idealfall gibt es zwei oder mehr
Laufzeit rechnen, in dieser Zeit mag der Elan ausgearbeitete Alternativen (etwa verschiedene
der Befrworter der Neuerung nachlassen, an- Varianten einer Umgehungsstrae, von Marke-
dere politische Inhalte werden dominierend. tingkonzeptionen, von stationren Altenein-
Fr beide Seiten bildet die (auch aus wissen- richtungen); auerdem einen (umfassenden)
schaftlichen Gesichtspunkten vllig berech- Katalog der fr wichtig gehaltenen Auswirkun-
tigte) probeweise Einfhrung von Neuerungen gen, inklusive einer konsensmig festgelegten
auch eine bessere Chance, glaubwrdige Zeu- Bewertung der Ausprgungsgrade des Nut-
gen fr die eigene Auffassung aus den Reihen zens der einzelnen Effekte und deren Kom-
der Personen zu finden, die mit der Innovation pensationsmglichkeiten (also etwa die Anga-
persnliche Erfahrung gesammelt haben und be, wie man die Aspekte hhere Eigenaktivitt
diese positiv oder negativ bewerten. Ein inter- der Bewohner eines Altenheimes , geringere
essantes Beispiel im Zusammenhang mit dieser Mglichkeit zur Machtausbung durch Pfle-
Zielsetzung von Evaluationen sind brigens ger, geringere Kosten durch Rckgang der
die ffentlichen Diskussionen und die in Auf- Pflegebedrftigkeit und weniger Bedarf/weni-
trag gegebenen Versuche zum Themenbereich ger Arbeitspltze fr Pflegepersonal zu einem
Tempo 100 auf Autobahnen (siehe dazu auch Gesamtnutzen verrechnen kann). Die Aufgabe
Will et al. 1987, S. 25 ff.). des Evaluators wre es dann nur, die entspre-
In Anbetracht dieses spezifischen Nutzens, chenden empirischen Resultate zu erheben und
den sowohl Gegner als auch Befrworter von gem der bereits feststehenden Verrechnungs-
Innovationen bei (nicht unbedingt nur poli- form zu verknpfen.
tisch) umstrittenen Vorhaben aus Evaluations- Leider sind Projekte dieser Art selten, auch
projekten ziehen knnen, berrascht es, da wenn es hufig zum Selbstverstndnis des
nicht wesentlich mehr Auftrge vergeben wer- Evaluators gehrt, einen solchen Zustand zu-
den. mindest nach Durchfhrung des Projektes an-
Der zweite Durchsetzungsaspekt, der Drang nhernd zu erreichen (vgl. dazu insbesondere
nach erwnschten Ergebnissen, ist leichter Kapitel 4). Es gibt im Gegensatz zum ersten An-
offen zu diskutieren. Die Hoffnung des Auftrag- schein nur wenige Entscheidungssituationen,
gebers, mit dem Resultat des Evaluations- in denen alternative Mglichkeiten sowie die
projektes seine vorgefate Meinung sttzen zu Kosten/Nutzen-Bewertungen explizite ausgear-
knnen, ist wohl menschlich verstndlich und beitet sind. Meist wird man sich schon freuen
hufig die eigentlich relevante Entscheidungs- mssen, wenn die Ergebnisse von Evaluations-
grundlage fr die Vergabe des Projektes. Proble- studien wenigstens indirekt, in diffuser, viel-
matisch kann es sein, wenn der Auftraggeber fach vermittelter und kaum nachvollziehbarer
ergebnisorientierten Einflu auf Durch- Weise in die tatschliche Entscheidung mit ein-
fhrungsbedingungen, Personalauswahl oder gehen.
Berichtlegung nimmt. Hier sind die Durch-
setzungsstrke und die professionelle Verant-
wortungsbereitschaft der Evaluatoren (vgl. dazu Optimierungsgrundlage
Abschnitt 2.3.3) manchmal massiv gefordert,
was natrlich Probleme bereitet, wenn diese Eine ebenfalls sehr positiv zu bewertende Ziel-
rechtlich (Unterstellungsverhltnis, Anwei- setzung des Auftraggebers ist der Versuch, die
sungsbefugnisse) oder faktisch (finanzielle Ab- fragliche Manahme durch systematische
hngigkeit, Drang nach Folgeauftrgen) vom Rckmeldung zu verbessern (zum Beispiel bei
Auftraggeber abhngen. Aus diesem Grund wer- Mitarbeitern festgestellte Defizite oder fr-
den zumindest bei wichtigen und umstrittenen derungswrdige Bereiche durch Bildungs-
Vorhaben bevorzugt unabhngige Evaluatoren manahmen zu beheben, Schwchen eines Ge-
herangezogen, soweit dies mglich ist. setzestextes durch Novellierung zu verbessern,
Grundlagen sozialwissenschaftlich gesttzter Evaluation 31
eine Didaktikkonzeption und die dazu verwen- Es soll nochmals betont werden, da die hier
deten Lehrmaterialien vor weiterer Anwendung versuchte Darstellung einiger wichtiger Ziele
aufgrund der bisherigen Erfahrungen zu opti- des Auftraggebers im Regelfall keine eindeutige
mieren). Der Evaluator wird bei Wahrnehmung Zuweisung eines Evaluationsprojektes zu einer
dieser Rolle nicht zu einer Selektion zwischen dieser Zielsetzungen erlauben, schon gar nicht
verschiedenen Alternativen veranlat, sondern auf der Basis des publizierten Berichtes. Ob zum
er soll Hinweise geben, welche Aspekte einer Beispiel ein Personalchef die Weiterbildungsan-
Manahme verbesserungsbedrftig erscheinen gebote externer Trainer evaluieren lt, ohne
(und womglich auch sagen, in welcher Form eine genaue Zielsetzung zu haben (vielleicht,
man dies erreichen knnte). Die damit verbun- weil sein Kollege in einem anderen Unter-
dene Interventions- bzw. Gestaltungsaufgabe nehmen dies auch tut), oder damit seine Ver-
drfte von vielen in diesem Bereich Ttigen als antwortung fr die Auswahl der Anbieter de-
befriedigender erlebt werden als die reine Se- legieren mchte, vielleicht auch nur eine
lektion von Alternativen, setzt aber auch in Mglichkeit sucht, unauffllig einem Bekann-
strkerem Mae Fachkenntnisse aus dem eva- ten einen Auftrag zu verschaffen (da dieser ja
luierten Bereich (und nicht nur zur Durchfh- die Voraussetzung ist, um auch dieses Angebot
rung von Evaluationen als solchen) sowie hu- evaluieren zu knnen), wirklich ohne vorge-
fig auch eine intensive Kooperation und fate Meinung eine rationale Entscheidungs-
Konsensbildung mit den Betroffenen voraus. hilfe erhofft, oder ob er sogar bestrebt ist, durch
eine entsprechende Auswertung der Ergebnisse
den schwcheren Anbietern bei der Optimie-
Kontrolle der Zielerreichung rung ihrer Seminargestaltung zu helfen, ist aus
dem Auftrag als solchem in keiner Weise er-
Gerade im Zusammenhang mit Manahmen sichtlich. Oft wird man mit Mischformen rech-
des Qualittsmanagements werden Evalua- nen mssen, und die allgemeine multifak-
tionsprojekte immer wichtiger, bei denen man torielle Bestimmtheit von menschlichem
sich bemht, das Erreichen eines vom Ma- Verhalten findet sich eben auch bei der Ver-
nahmentrger zugesagten Ergebnisprofils zu gabe von Evaluationsprojekten.
berprfen. Grundlage der Bewertung ist dann
nicht wie bei der summativen Evaluation als
Entscheidungshilfe der Vergleich zwischen ver- 2.1.3 Schwerpunkte konkreter
schiedenen Manahmen, sondern der Ver- Evaluationsprojekte
gleich zwischen erzieltem Ergebnis und erwar-
tetem Profil. So kann etwa der nach den Ausgehend von einer relativ einfachen Auffas-
Grundstzen des Qualittsmanagements (vgl. sung des Begriffes Evaluation bzw. Bewer-
dazu insbesondere die DIN EN ISO Norm tung wurden immer mehr Erfahrungen mit
9000 ff.) an einen Bildungstrger vergebene Evaluationsprojekten gesammelt. Dabei zeigte
Auftrag lauten Die Kosten des Trainings ms- sich, da es eine Flle von Detail-Zielen gibt, die
sen geringer sein als die durch die im Training innerhalb des jeweiligen Vorhabens angestrebt
vereinbarten Projekte im Laufe eines Jahres ein- wurden. Es verbessert das eigene Planen, sich
gesparten Kosten, gleichzeitig ist die durch- anhand der inzwischen ausgearbeiteten umfang-
schnittliche Zufriedenheit der Teilnehmer mit reichen Begriffsbildungen klar zu machen, wel-
dem Training mit mindestens 1,5 auf einer che Fragen im Vordergrund stehen. Auerdem
Schulnotenskala zu erreichen. Wenn eine sol- wird deutlich, in welch vielfltiger Weise Evalua-
che (in der Praxis noch wesentlich przisere) tionen zur Zielerreichung des Auftraggebers (und
Festlegung des zu erreichenden Zieles im vor- anderer Gruppen) beitragen knnen.
hinein feststeht, braucht von Seiten des Es gibt heute kaum einen Bereich der ange-
Evaluators nur die entsprechende Messung wandt-sozialwissenschaflichen Projektarbeit,
durchgefhrt und aufbereitet werden. Damit dem nicht irgendein vorhandener Evaluations-
werden viele Schwierigkeiten vermieden, die sich begriff zugeordnet werden knnte. Eine die
bei vergleichender Evaluation stellen (siehe wichtigsten begrifflichen Ausdifferenzierungen
dazu Abschnitt 2.2.4). umfassende Darstellung ist im Diagramm II/3 ge-
32 Grundlagen sozialwissenschaftlich gesttzter Evaluation

geben, wobei sich die Gliederung an den ein- nung einer spter zu evaluierenden Manah-
zelnen Arbeitsschritten eines typischen Evalua- me durchgefhrt werden soll. Hierzu gehrt
tionsprojektes orientiert. die Erarbeitung der (tatschlichen, nicht evtl.
vorgeschobenen) Ziele des Projektes, die auch
ethische Bewertung der durchzufhrenden
Rahmenbedingungen Interventionen und der geplanten Verwen-
dung der Evaluationsergebnisse sowie deren
Zum Bereich der Kontextevaluation gehrt absehbaren, kontextbedingten Nebenfolgen.
die bewertende Untersuchung der Vorausset- Evaluierungen dieser Art bilden hufig die
zungen, die schon vor der sachgerechten Pla- Grundlage fr die Bereitschaft des Evaluators,

Diagramm II/3
Wichtige Evaluationsbegriffe, strukturiert nach typischem Projektablauf

Rahmenbedingungen
(Kontextevaluation)

parteiliche versus berparteiliche Evaluation offene versus geschlossene Evaluation

Grundstzliche Ziele

praxisorientierte Evaluation entwicklungsorientierte Evaluation theorieorientierte Evaluation

Gerichtetheit der Fragstellung


Input-Evaluation Mikro-Evaluation Makro-Evaluation
z.B. Personal, Medien, Material,
Unterweisung

Zeitpunkt
vor einer Manahme whrend einer Manahme nach erfolgter Manahme
antizipatorisch prognostisch Proze- oder Ergebnis- Output- oder
prospektiv dynamische Evaluation Produktevaluation

Kosten-Nutzen-berlegung
strategische Evaluation Management-Evaluation

Bearbeitungsform
intrinsische vs. extrinsische Evaluation Compliance- vs. Program-Impact innere (Selbst-) vs. uere
-Evaluation (Fremd-) Evaluation

summative vs. formative Evaluation vergleichende vs. nicht-vergleichende Evaluation

Meta-Evaluation
Programm-Design-Evaluation ergebniszusammenfassende Meta-Evaluation
Grundlagen sozialwissenschaftlich gesttzter Evaluation 33
das Projekt berhaupt durchzufhren. So hat eine definierte Personengruppe), sie kann aber
es keinen Sinn, bestimmte Manahmen zur auch eher entwicklungsorientiert sein (die Ziel-
Verbesserung der Situation einer Schule pro- setzung wre dann die Verbesserung der
spektiv zu untersuchen, wenn von Seiten der Interventionsmanahmen fr sptere Anwen-
Leitung keine Bereitschaft besteht, wirklich dungen) oder besonders theoriefrdernde
eine Vernderung durchzufhren oder die Aspekte betonen (zum Beispiel eine Prfung
Motivationsstruktur des Kollegiums offen- theoretischer berlegungen auf der Basis des
sichtlich jede mit zustzlicher Arbeit fr die Erfolges bestimmter therapeutischer Vorge-
Lehrer verbundene Neuerung unmglich hensweisen). Da bei wissenschaftlich vorgebil-
macht. Nicht selten findet man das offene deten Evaluatoren hufig eine strkere Tendenz
oder latente Ansinnen parteilicher Evaluation zum theorieorientierten Vorgehen besteht, als
(die Studie ist so anzulegen, da unabhngig dies vom Auftraggeber aus naheliegenden
von der empirischen Faktenlage ein bestimm- Grnden gewnscht wird, sollte ber die
tes, gewnschtes Ergebnis auftritt), was leider Hauptrichtung des Vorhabens ein Einverneh-
mit dazu fhren kann, da es fast schon zu men erreicht werden.
den blichen gesellschaftlichen Ritualen ge- Ebenso wichtig fr die Ausarbeitung der Pro-
hrt, da sich bei manchen Themen Gut- jektdetails ist, ob der Schwerpunkt der Frage-
achter und Gegengutachter widersprechen stellung im Micro- oder im Macro-Bereich zu
(etwa Studien zu Mllverbrennungsanlagen, sehen ist. Von Micro-Evaluation spricht man
Autobahnerweiterungen oder anderen gro- blicherweise dann, wenn nur Details (etwa die
en Bauvorhaben, Standorte Forensischer Kli- didaktische Aufbereitungen eines Unterrichts-
niken etc.). textes) interessieren, Macro-Evaluation liegt
Grundlage fr solche vom Auftraggeber ge- vor, wenn komplexere Einheiten (zum Beispiel
wnschte Parteilichkeit kann etwa die Bekrfti- Fragen der Schulorganisation) untersucht wer-
gung einer bestimmten politisch-ideologischen den.
Position bei ffentlichen Projekten, der Nach-
weis der eigenen Tchtigkeit im Unterneh-
men (etwa bei Marketingmanahmen) oder Zeitperspektive
massive finanzielle Interessen von Systemteil-
gruppen (etwa im Gesundheitswesen) sein. Auch hinsichtlich des Zeitpunktes der Evaluati-
Mibrauchsmglichkeiten sind insbesondere on im Rahmen des Gesamtablaufes der Ma-
bei geschlossener Evaluation (die Ergebnisse nahme wurden verschiedene Konzepte ausdif-
werden nur der auftraggebenden Stelle, zum ferenziert. An zeitlich erster Stelle steht die
Beispiel einer bestimmten Behrde oder Insti- sogenannte strategische Evaluation, bei der es
tution bekannt) naheliegen, so da man grund- darum geht, zu beurteilen, ob die Ursachen des
stzlich auf eine Publikation der Ergebnisse in Frage stehenden Problems richtig erkannt
wert legen sollte. Einer solchen sinnvollen und und die vorgesehene Problemlsungen bzw.
der wissenschaftlichen Ethik entsprechenden Manahmen vorausssichtlich angemessen
Forderung knnen aber auch sehr berechtigte sind. Damit verwandt ist der Begriff der pro-
Interessen des Auftraggebers entgegenstehen, spektiven bzw. antizipatorischen Evaluation,
etwa die Konkurrenzsituation zwischen ver- bei der es darum geht, eine Manahme vor de-
schiedenen Firmen. ren Realisierung auf der Basis geeigneter Sozial-
techniken zu bewerten. Ein typischer Fall dafr
ist etwa die Auswahl einer bestimmten unter
Grundstzliche Ziele verschiedenen mglichen Baumanahmen
(durch Experten oder Betroffene). Es htte ja
Setzt man das Projekt fort, ist (schon zur Ver- keinen Sinn, die Manahme (zum Beispiel eine
meidung spterer Diskordanzen) die grundstz- bestimmte Straenfhrung) zuerst konkret
liche Orientierung des Projektes zu bestimmen. durchzufhren und erst im Nachhinein bewer-
Diese kann sich ausschlielich auf das Bewer- ten zu lassen. Von prognostischer Evaluation
ten konkreter Praxiseffekte konzentrieren (etwa spricht man, wenn die Untersuchung dazu die-
den Erfolg einer psychologischen Therapie fr nen soll, eine empiriegesttzte Prognose ber
34 Grundlagen sozialwissenschaftlich gesttzter Evaluation

den Erfolg einer spter durchzufhrenden Ma- den Folgeauftrag fr das nchste (Teil-)Projekt
nahme abzugeben. Dafr typisch sind etwa Un- erst dann zu vereinbaren, wenn auf der Basis
tersuchungen auf der Basis von Testmrkten der zunchst vorliegenden Ergebnisse eine kon-
(ein neues Marketingkonzept wird zunchst krete Planung mglich ist.
nur in einem relativ kleinen Gebiet in der Bun-
desrepublik, meist Berlin oder das Saarland, Nach endgltig abgeschlossener Manahme ist
eingefhrt und von den Ergebnissen dort das im wesentlichen nur noch eine Bewertung des
vermutliche Resultat bei Einfhrung im Bun- Ergebnisses (auch Output- oder Produkt-
desgebiet prognostiziert) oder Versuche im evaluation) mglich. Der Schwerpunkt kann
Schulbereich, die zunchst nur mit ausgewhl- hierbei auf einer statischen bzw. vergangen-
ten Modellschulen durchgefhrt werden. heitsorientierten Bewertung der gefundenen
Bei der sogenannten Input-Evaluation geht Ergebnisse oder auf einer eher vernderungs-
es darum, die fr eine bestimmte Manahme orientierten, die Durchfhrung neuer und ver-
eingesetzten Ressourcen (im weitesten Sinne) besserter Manahmen anregenden Interpreta-
zu bewerten. Sie kann sich sowohl auf die ma- tion liegen.
terielle Ausstattung beziehen (wenn diese zum
Beispiel qualitativ oder quantitativ unzurei-
chend fr das Erreichen des angestrebten Zieles Nutzenberlegungen
ist), aber auch auf beteiligte Personen, zum Bei-
spiel die Motivation von Teilnehmern an einer Soweit sich die Bewertung einer Manahme
Weiterbildungsmanahme oder die emotionale und eines Programms auch auf Kosten-Nut-
und kognitive Vorbereitung von Lehrern inner- zen-berlegungen sttzt, sollte man von An-
halb eines Schulversuches. fang an klren, ob ausschlielich die Fest-
Zumindest bei lngerfristigen Interventions- stellung der Kosten und des damit erzielten
programmen empfiehlt es sich, auch whrend Nutzens oder auch die (relative) Effektivitt
der laufenden Manahme dynamisch vorzuge- der Manahme von Bedeutung ist. Die erste
hen, also den Proze fortlaufend zu evaluieren Vorgehensweise stellt fr sozialwissenschaft-
und ggf. bei dem Auftreten von Strungen, un- lich gesttzte Interventionen meist eine be-
vorhergesehenen und unerwnschten Ergeb- scheidenere Forderung dar, da bei halbwegs
nissen oder einer nderung der Rahmenbedin- sinnvoller Planung und nicht allzu ungnsti-
gungen und Zielsetzungen sofort korrigierend gen Rahmenbedingungen die gettigten Auf-
einzugreifen. Besonders wichtig ist hier die fort- wendungen meist geringer sind als der damit
laufende berprfung der (Lern-)Ziele, die Kon- erzielte Nutzen, soweit sich dieser ausreichend
trolle und ggf. Optimierung des fr die Ma- quantitativ erfassen lt. Schwieriger ist die
nahme eingesetzten Materials bzw. Techniken, Erzielung zufriedenstellender Effektivitt, da
sowie die erfahrungsgesttzte Bewertung der hier durch die Bercksichtigung des Nutzens
zur Prfung der Ergebnisse eingesetzten Instru- pro Aufwandseinheit ein Vergleich mit alter-
mente (etwa Skalen fr den Therapieerfolg, nativen Manahmen naheliegt und vor allem
Tests zum Feststellen des Lernergebnisses oder grere (und damit auch entsprechend auf-
Methoden zur Effektivittsprfung einer Ma- wendige) Projekte dabei schlechter abschnei-
nahme). den knnen als einfache, schnell und billig
Eine dynamische Konzeption des Evalua- durchzufhrende praxeologische Manah-
tionsprojektes ist vor allem bei stark praxisbe- men, die zwar vom absoluten Betrag her gese-
zogener Fragestellung von erheblichem Vorteil hen auch weniger Nutzen erbringen, aber be-
und manchmal auch aus ethischen Grnden zogen auf den Aufwand die hhere Rendite
(unerwnschte Nebenfolgen!) unverzichtbar, zeigen.
hat aber den erheblichen Nachteil, da Dauer
und Kosten zu Beginn des Projektes nicht zu-
verlssig kalkuliert werden knnen. Es kann da- Bearbeitungsformen
her zweckmig sein, die begleitende Evalua-
tion lngerer Vorhaben in mehrere kleine Hinsichtlich der verschiedenen Bearbeitungs-
verbundene Einzelprojekte aufzuteilen, und formen innerhalb eines Evaluationsprojektes
Grundlagen sozialwissenschaftlich gesttzter Evaluation 35
knnen hier nur einige besonders wichtige Be- tives Vorgehen ist meist befriedigender, da man
griffe skizziert werden. Von extrinsischer Eva- dabei mehr Gelegenheiten hat, auf der Basis
luation spricht man, wenn (wie hufig) eine entsprechender Fachkenntnisse gestaltend t-
Manahme aufgrund ihrer Auswirkung bei den tig zu werden. Manche Auftraggeber sind aber
jeweiligen Adressaten berprft wird, von an klaren Entscheidungen interessiert, sei es
intrinsischer, wenn die Bewertung unabhngig an der Auswahl der besten aus mehreren Alter-
von konkreten Auswirkungen dieser Art erfolgt nativen (vergleichende Evaluation) oder der Be-
(zum Beispiel bei der ideologiekritischen Un- wertung einer Manahme an normativer
tersuchung eines Curriculums oder bei der Be- Standards oder vorgegebenen Zielsetzungen
wertung eines Personalentwicklungssystems (nicht-vergleichendes Vorgehen).
hinsichtlich seiner Passung zur jeweiligen
Unternehmenskultur durch die Befragung der
dortigen Fhrungskrfte). Eine andere Unter-
Erfahrungsaufbereitung
scheidung ist die Trennung der Bewertung der
Programmauswirkungen (Program Impact) im
Nach Abschlu von Evaluationsprojekten soll-
Gegensatz zur Compliance-Evaluation, bei der
ten die dabei gemachten Erfahrungen nach
es darum geht, wie weit eine Manahme ber-
Mglichkeit aufbereitet und zusammengefat
haupt befolgt wurde. Besonders wichtig ist dies
werden, was man allgemein als Meta-Evalua-
etwa bei medikamentser Behandlung (fehlen-
tion bezeichnet. Dabei ist zu unterscheiden,
de Compliance liegt vor, wenn die Patienten
ob diese Zusammenfassung die ber eine be-
die vorgeschriebenen Medikamente nicht ein-
stimmte Manahme erzielten Ergebnisse inte-
nehmen, was hufig der Fall ist) oder bei der
grierend darstellen soll, also etwa globale Aus-
Erprobung neuer Curricula oder Lehrformen
sagen ber die Effektivitt einer bestimmten
(haben sich die Lehrer berhaupt an die
Therapie oder einer bestimmten Organisations-
Programmvorgaben gehalten?). Fr die Bewer-
form gewnscht werden; in diesem Fall spricht
tung einer Manahme spielt es natrlich eine
man von summierender Meta-Evaluation, da-
groe Rolle, ob ein negatives Resultat auf feh-
fr wurden auch eine Reihe spezieller stati-
lende Compliance oder fehlende Programm-
stischer Techniken entwickelt (Smith & Glass,
effektivitt zurckzufhren ist.
1981). Eine andere Art der zusammenfassen-
den Auswertung besteht darin, Hinweise fr die
Unter innerer (oder Selbst-)Evaluation versteht verbesserte Gestaltung neuer Evaluations-
man Vorhaben, bei denen die Mitarbeiter einer projekte zu erhalten, sei es fr das verwendete
Institution (im Extremfall sogar der Planer und Instrumentarium, Techniken zur Feststellung
Durchfhrer der jeweiligen Interventionsma- der Ziele und Konsequenzen oder fr die je-
nahme) auch fr die Bewertung verantwortlich weils gewhlten Untersuchungsdesigns (Pro-
sind, von uerer, wenn eine entsprechende gram-Design Evaluation). Erfahrungsaufberei-
personelle Trennung erfolgt. Zur Vermeidung tungen dieser Art sind die Grundlage, auf der
massiver Beurteilungsfehler sollte eigentlich sich allmhlich die Leistungsfhigkeit profes-
stets bei wissenschaftsgesttzten Projekten (im sioneller Evaluation weiter optimieren lt.
Gegensatz zum subjektiven Lernen whrend
der persnlichen Berufspraxis) von einer ue-
Die hier am Ablauf eines Evaluationsprogram-
ren Evaluation ausgegangen werden, doch
mes strukturierte Begriffsbildung ist in keiner
scheitert dies gelegentlich an den dafr erfor-
Weise erschpfend, leider finden sich in der
derlichen finanziellen Mitteln.
Literatur gelegentlich auch widersprchliche
Auslegungen des gleichen Begriffes. Fr eine
Eine weitere wichtige Unterscheidung, die hn- weitergehende Vertiefung in die spezielle Be-
lich schon weiter oben angesprochen wurde, griffswelt der Evaluation empfiehlt sich etwa
ist die Trennung von summativer (eine globale, Gell und Pehl 1970, Wittrock und Wiley 1970,
zusammenfassende Bewertung abgebender) Wulf 1972, Attkisson und Broskowski 1978,
und formativer (vorwiegend zur Gestaltungs- Biefang 1980, Hellstern und Wollmann 1984,
verbesserung angelegter) Evaluation. Ein forma- Wittmann 1985.
36 Grundlagen sozialwissenschaftlich gesttzter Evaluation

2.2 Wissenschaft als Forschung oder ein eigenstndiges Anwen-


dungsgebiet handelt, wre es an sich erforder-
mgliche Grundlage lich, den Begriff Wissenschaft eindeutig zu
von Evaluation klren. Allerdings stellt sich hier ebenso wie im
Abschnitt 1.1 das Problem, da sich real exi-
Die im vorhergehenden Abschnitt dargestell- stierende Systeme einer letztlich befriedigenden
ten gesellschaftlichen Bedrfnisse erfordern in Formaldefinition entziehen.
gewissem Umfang die Durchfhrung empirisch
gesttzter Evaluation. Diese mu aber nicht Fat man wissenschaftliche Forschung als ab-
unbedingt wissenschaftlich sein. Es gibt zahl- straktes System von Gegenstandsbereich, dar-
reiche Kontrolleinrichtungen, denen man die- ber getroffenen Aussagen und vereinbarten
ses Prdikat sicher nicht zuordnen wrde (Rech- berprfungsmethoden auf, so knnen Evalua-
nungshfe, Controlling-Abteilungen, Jahres- tionsprojekte innerhalb dieses Rahmen dazu
bzw. Rechenschaftsberichte von Firmen, Insti- dienen, ebenso wie andere empirische Studien
tuten oder Bildungseinrichtungen, die Zusam- Grundlagen fr die Gewinnung oder berpr-
menfassung von empirisch belegbaren Vor- fung von Hypothesen zu erhalten. Als Beispiel:
kommnissen als Grundlage einer Kritik durch Folgt aus einer wissenschaftlich-theoretischen
Vorgesetzte u.s.w.), die aber den grten Teil berlegung, da die Arbeitszufriedenheit von
empirisch fundierter Evaluation in unserer Ge- Montagearbeitern bei Einrumung eines gre-
sellschaft berhaupt bestreiten. Dies wirft die ren persnlichen Handlungsspielraumes stei-
Frage auf, was eigentlich Wissenschaft im be- gen sollte, wre die Evaluation einer darauf auf-
sonderen fr dieses Problemfeld leisten kann. bauenden Manahme im Prinzip geeignet,
Grundvoraussetzung fr einen sinnvollen Rckschlsse auf die Gltigkeit bzw. erforderli-
Beitrag ist, da das soziale System Wissen- che Detailsspezifikationen dieser These zu erar-
schaft bereit ist, an (praxisbezogenen) Evalua- beiten. Evaluationsprojekte wren bei diesem
tionen teilzuhaben. Hier wre zu berprfen, Verstndnis nur eine besondere Form des wis-
ob es sich bei der Evaluation berhaupt um senschaftlich-empirischen Arbeitens, die sich
wissenschaftliche Forschung, oder ein eigen- durch eine eher anwendungsorientierte Hypo-
stndiges Anwendungsgebiet, mit eigenen Nor- thesenformulierung auszeichnet. Ansonsten
men und Werthaltungen handelt (2.2.1). Au- wren sie ein integraler Bestandteil des Kreis-
erdem mu der wissenschaftliche Beitrag laufes empirischer Forschung (vgl. dazu
einen die Kosten bersteigenden Nutzen ha- Wottawa, 1988, S. 22). Evaluation in dieser Be-
ben und zumindest partiell den nicht-wissen- trachtung wre nur ein Teilgebiet von Wissen-
schaftlichen Alternativen berlegen sein schaft, allerdings bei Ausklammerung der spe-
(2.2.2). Schlielich sollten auch die Alternati- zifisch wertenden Aspekte.
ven zur wissenschaftsgesttzten Evaluation be- Hilfreicher ist die Unterscheidung von Cron-
dacht und gegeneinander abgewogen werden bach und Suppes (1969, S. 20f.) in entschei-
(2.2.3). Ein Sonderfall, mit zunehmender Be- dungsorientierte (decision-orientated) und
deutung fr Bildungs- und Gesundheitswesen, schlufolgeorientierte (conclusion-orientated)
aber auch die Arbeit in der Wirtschaft, ist dabei Forschung.
das Qualittsmanagement auf der Basis der DIN
EN ISO-9000 ff., (s. 2.2.4). Von entscheidungsorientierter Forschung spre-
chen Cronbach und Suppes dann, wenn es die
Aufgabe des Forschers ist, im Rahmen einer
2.2.1 Evaluation als Auftragsuntersuchung, die von den Entschei-
wissenschaftsgesttztes Handeln dungstrgern gewnschten Informationen zu
liefern.
Beziehung zwischen Wissenschaft und Im Rahmen der schlufolgernden Forschung
Evaluation formuliert der Forscher selbst die ihn interessie-
renden Hypothesen, ohne nennenswerten Ein-
Vor einer nheren Diskussion des Problems, ob flu eines externen Entscheidungstrgers. Ober-
es sich bei der Evaluation um wissenschaftliche stes Ziel ist dabei nicht die konkrete Umsetzung
Grundlagen sozialwissenschaftlich gesttzter Evaluation 37
der Ergebnisse zum Beispiel in einer Institution, rungen von Weizscker im Diagramm I/1 ver-
sondern die begriffliche Erfassung und Erkl- stndlich). Auch heute noch drften nur we-
rung des ausgewhlten Problems. nige Kollegen innerhalb ihrer relevanten
Die Parallelen zwischen entscheidungsorien- Wissenschaftssubgruppe voll akzeptiert sein,
tierter Forschung und der Evaluation sowie zwi- wenn sie ausschlielich Evaluationsprojekte
schen schlufolgeorientierter Forschung und durchfhren und nicht wenigstens zustzlich
der wissenschaftlichen Forschung im blichen auch echte Forschung betreiben. Es ist nahe-
Sinne sind hier unbersehbar. liegend, da manche mit Evaluationsprojekten
Dabei handelt es sich natrlich nicht um beschftigte Forscher versuchen, auch in die-
zwei scharf abgegrenzte Bereiche. In der ber- sen Studien mglichst nach wissenschafts-
gangszone zwischen Evaluation und wissen- internen Gepflogenheiten vorzugehen. Eine
schaftlicher Forschung drften sogar eher die professionelle Arbeit setzt aber voraus, da man
meisten Untersuchungen angesiedelt sein. auch als Wissenschaftler die notwendigen,
Glass (1972, S. 169 f.) fhrt die Unterschei- sachgerechten Besonderheiten der Evaluation
dung zwischen Evaluation und Forschung kon- emotional akzeptiert.
sequent weiter, indem er definiert, da Evalua- Der Evaluator mu, soweit er seine eigene Rol-
tion den Wert, Forschung dagegen die le und die Interessen des (meistens finanzieren-
wissenschaftliche Wahrheit einer Sache einzu- den) Auftraggebers auch wirklich ernst nimmt:
schtzen versuche. Dabei setzt er Wert gleich
gesellschaftlichem Nutzen und identifiziert Die Rahmenbedingungen und Zielvorgaben
Wahrheit an Hand der beiden Kriterien em- des Auftraggebers akzeptieren, was der Selbst-
pirische berprfbarkeit eines allgemeinen bestimmung von Forschung widerspricht;
Phnomens mit allgemeinverbindlichen For- bei ethisch nicht akzeptablen Zielen oder un-
schungsmethoden sowie logische Konsi- sachgemen Bedingungen ist ein Projekt-
stenz. angebot natrlich abzulehnen;
Im Sinne der Wahrung der Auftraggeberinter-
essen Einschrnkungen der zu untersuchen-
Rolle des Evaluators den Fragestellungen, ja sogar der Publikation
der nach Konsensfindung gewonnenen Er-
Sieht man wissenschaftliche Forschung in dem gebnisse akzeptieren (man denke etwa an ei-
von Glass beschriebenen Sinne, so wird die Un- nen wissenschaftlichen Bericht, in dem steht,
terschiedlichkeit der Berufsrolle des Wissen- da die Schule unter Leitung des Direktors Y
schaftlers und des Evaluators deutlich. Auf der ein besonders schlechtes Organisationsklima
einen (extrem gezeichneten) Seite steht der un- aufweist), was vllig der fundamentalen Norm
abhngige, frei nach Wahrheit suchende For- von Freiheit der Wissenschaft, die sogar ver-
scher, der nur sich und der Wissenschaft ver- fassungsrechtlich geschtzt ist, widerspricht;
pflichtet ist; auf der anderen Seite steht der Im Interesse seiner Kooperationsfhigkeit mit
auftragsabhngige, von den Interessen und Vor- der Praxis Werthaltungen, Verhaltensweisen
lieben der Auftraggeber determinierte Evalua- und soziale Kompetenzen bernehmen, die
tor, der zwar fachlich und organisatorisch kom- rein wissenschaftsintern zumindest selten
petent sein mag, aber in einem vllig anderen, sind und dazu fhren knnen, da sich der
wissenschaftsextern geprgten Normensystem Evaluator dieser sozialen Bezugsgruppe ent-
lebt (bzw. leben mu, um akzeptiert zu werden fremdet;
und weitere Auftrge zu erhalten). Das Problem der unwissenschaftlichen Be-
Da fr viele, gerade an Universitten ttige wertung und die damit zusammenhngende
Forscher die (relative) Unabhngigkeit ihrer Be- Maximierung von Nutzen-Aspekten in sei-
rufsgruppe ein ganz entscheidendes Merkmal ner Arbeit unmittelbar aufgreifen; dies steht
fr ihr Selbstverstndnis und Selbstwertgefhl im Gegensatz zur oft im Grundlagenbereich
ist, war die Bewertung der Rolle des eben nicht angestrebten Wertfreiheit der Wissenschaft,
nur rein wissenschaftlich agierenden die das Problem der Anwendung und alle da-
Evaluators zunchst mehr als zurckhaltend mit verbundenen Bewertungsfragen auf Ent-
(vor diesem Hintergrund sind auch die Ausfh- scheider oder andere Subgruppen verlagert.
38 Grundlagen sozialwissenschaftlich gesttzter Evaluation

Jeder, der eine berufliche Ttigkeit im Bereich vertretbar nach vorne zu verlegen und die Ver-
der Evaluation anstrebt, sollte sich bewut sein, netzungen der verschiedenen Handlungsergeb-
da er damit eben nicht im engeren Sinne wis- nisse zu explizieren. Nur die mit wissenschaftli-
senschaftlich ttig ist. Er ist weniger frei, strker chen Methoden und auf langen Erfahrungen
an die Bercksichtigung von Interessen gebun- aufbauenden Meinstrumente gestatten eine
den und gleichzeitig weniger folgenlos als viele fundierte Erfassung komplexer psychologischer
Mitarbeiter im Grundlagenbereich. Er sucht oder sozialwissenschaftlicher Konstrukte, und
nicht Wahrheiten, sondern hilft mit, die Ge- nur die fortgeschrittenen Datenauswertungs-
sellschaft innerhalb der jeweils mglichen methoden ermglichen es, die bei den meisten
Grenzen ein klein wenig besser zu gestalten, als Evaluationsprojekten anfallenden hohen Da-
sie ohne seine Ttigkeit beschaffen wre, falls tenmengen bersichtlich und interpretierbar zu
er so kompetent ist, da seine Befunde tatsch- analysieren. Vielleicht mag auch die Erwartung
lich von den Entscheidungstrgern aufgegrif- zutreffen, da Wissenschaftler in entsprechen-
fen und bercksichtigt werden. Wenn man der beruflicher und gesellschaftlicher Position
diese Bedingungen akzeptiert, ist der Bereich aufgrund ihrer relativen Unabhngigkeit gegen-
Evaluation sicher ein sehr interessantes, aus- ber den Auftraggebern weniger von externen
sichtsreiches und gesellschaftlich relevantes Interessen beeinflubar sind und damit objek-
Gebiet; sieht man sich aber emotional und vom tiver ber die Ergebnisse von Manahmen be-
persnlichen Selbstverstndnis her eher als richten. Zumindest sollte man erwarten, da
Wissenschaftler im klassischen Sinne, sollte der Wissenschaftler gelernt hat, und auch in
man sich nicht durch externe Anreize dazu ver- praktischen Situationen bereit ist, sich an die
fhren lassen, Evaluation als Berufsfeld zu wh- prinzipielle wissenschaftliche Regel zu halten,
len. alle in eine Aussage einflieenden Argumente
zu explizieren, sie hinsichtlich ihrer Fundierung
zu diskutieren und die getroffenen Bewertun-
Wissenschaft als Hilfe fr die gen und Verknpfungen deutlich zu machen.
Evaluationsarbeit Ein solcher typisch wissenschaftlicher Darstel-
lungs- bzw. Argumentationsstil garantiert mit
Beachtet man die Besonderheiten der Anforde- gewissen Einschrnkungen die Seriositt einer
rungen an Evaluatoren und die sachlichen wissenschaftlichen Evaluation, ist aber
Strukturen, die diese Unterschiede zur reinen gleichzeitig leider oft dem Bedrfnis der Praxis
wissenschaftlichen Forschung bedingen, so nach klaren Handlungsanweisungen entgegen-
wird klar, da zumindest die auftragsgebun- gesetzt.
dene, in einem praktischen Verwertungs-
zusammenhang stehende Evaluationsfor-
schung nicht Wissenschaftliche Forschung 2.2.2 Nutzen der
im blichen, zumindest an Universitten do- Wissenschafts-Beitrge
minierenden Sinne sein kann. Eine Ausnahme
wre denkbar, wenn in Einzelfllen auch die In den meisten Fllen wird von Seiten der
Zielsetzung von Evaluationsprojekten von Wis- Wissenschaft ein echter Sachbeitrag erwartet
senschaftlern selbst vorgenommen wrde, (Theorie- und Methodenkenntnisse allgemein,
wenn also der (Grundlagen-)Forscher mit dem Erfahrung in der Durchfhrung empirischer
von ihm selbst gesetzten Ziel von Evaluation in Projekte). Es kommt aber durchaus vor, da zu-
das Praxisfeld geht. Solche Vorhaben sind aber mindest zustzlich zu diesem Aspekt auch der
auerordentlich selten. Zusatznutzen von Wissenschaft bzw. Wissen-
schaftlern wichtig ist, etwa die Aufwertung von
Wenn Evaluation auch nicht Wissenschaft ist, Projekten, die hhere Glaubwrdigkeit einer
so kann und mu sie doch wissenschafts- fachlichen Autoritt auch bei Fragen, bei de-
gesttzt erfolgen. Die Kenntnis der entspre- nen keine besondere Kompetenz besteht u..
chenden Theorien und Befunde ist eine wesent-
liche Grundlage, um die im Abschnitt 1.3 Die Beachtung beider Aspekte (Sachleistung
diskutierte Zielperspektive soweit wie seris und Zusatznutzen) kann die Kooperation mit
Grundlagen sozialwissenschaftlich gesttzter Evaluation 39
Auftraggebern erleichtern und eine zweckm- Organisationsstrukturen und Kostenaspekte den-
ige, sptere Enttuschungen vermeidende Pro- ken, ein Psychologe wird das Verhalten (Ziele,
jektplanung untersttzen. Motive, Emotionen etc.) des einzelnen Men-
schen in den Mittelpunkt stellen und einem
Sozialwissenschaftler drfte es schwerfallen,
Potentielle Sachbeitrge von Wissenschaft nicht automatisch gesellschaftliche Aspekte zu
bercksichtigen. Fr jede Disziplin liegen an-
Nur ein dem jeweiligen wissenschaftlichen Ent- dere Variablen fr Intervention und Erfolgskon-
wicklungsstand annhernd entsprechendes trolle nahe, sie verfgen ber verschiedene
Vorgehen bei der Auswahl und Messung der Mengen von als bewhrt angesehenen Hypo-
Kriterien, der Designplanung und Datenaus- thesen, Memethoden und berprfungs-
wertung verhindert unntige Schwchen des verfahren, ohne da von einer neutralen Stelle
Projektes. Die Flle psychologischer bzw. sozi- aus gesagt werden knnte, welcher Standpunkt
alwissenschaftlicher Theorien, Methoden und richtig oder besonders richtig wre. Die
Interventionstechniken, die fr Evaluations- Hinzuziehung eines in einem anderen Paradig-
projekte unmittelbar genutzt werden knnen, ma lebenden Kollegen, wie es etwa in der Ko-
ist unbersehbar. Diese Vielfalt hat zur Folge, operation zwischen Praktikern und Wissen-
da fr eine Berufsttigkeit im Feld Evaluation schaftlern die Regel ist, bietet schon an sich,
eine sehr breite Kenntnis der eigenen Wissen- selbst ohne eine spezifisch ausgeprgte Sach-
schaft wichtiger ist als ein sehr tiefes Wissen in kompetenz in Detailfragen, eine gute Chance,
wenigen Spezialgebieten. das Problem von einem neuen Gesichtswinkel
aus umzustrukturieren und damit einen
Die Verbindung der Evaluation mit meist sehr vielleicht bisher bersehenen Bearbeitungs-
vielschichtigen Praxisproblemen bedingt, da vorschlag zu entdecken. Voraussetzung ist al-
in den meisten Fllen nicht gesagt werden lerdings eine (leider) ungewhnliche Kom-
kann, ob der gerade ausgewhlte theoretische munikationsfhigkeit aller Beteiligten, deren
Ansatz bzw. Methode oder Sozialtechnik die Fehlen erhebliche sachliche und emotionale
beste oder gar die einzige mgliche Wahl ist. Schwierigkeiten machen kann (vgl. dazu die
Eine nachtrgliche berprfung ist wegen der Inkommensurabilitt verschiedener Paradig-
meist gegebenen Einmaligkeit von Evaluations- men, Kuhn, 1967).
projekten kaum mglich, so da eine Evalua-
tion der fr ein konkretes Projekt herangezo-
genen wissenschaftlichen Grundlage meist Zusatznutzen wissenschaftlicher
entfllt. Fr den Auftraggeber bzw. den Koope- Evaluation
rationspartner aus der Praxis bedeutet dies, da
er der fachlichen Kompetenz des wissenschaft- Ein gerade unter wissenschaftlich ausgebildeten
lichen Evaluators mit nur wenigen nachtrg- Personen nicht seltener Denkfehler ist es, die von
lichen Kontrollmglichkeiten vertrauen mu. Verantwortungstrgern (zum Beispiel Auftragge-
Die Verantwortung des Wissenschaftlers, auch bern fr Evaluationsvorhaben) getroffenen Ent-
bezglich der eigenen Informiertheit ber den scheidungen als ausschlielich oder zumindest
aktuellen Sachstand, ist entsprechend hoch. weit berwiegend rational-logisch abgesttzt auf-
zufassen. Da die Steuerung eines komplizierten
Ein ber die Fachkompetenz in Einzelfragen sozialen Systems, ja auch nur die Aufrechterhal-
hinausgehender Kompetenzaspekt ist die Ver- tung seiner Funktionsfhigkeit, nicht so einfach
trautheit mit einem bestimmten wissenschafts- als rationaler, leicht durchschaubarer und aus-
spezifischen Paradigma, das fr Absolventen ei- schlielich auf Sachrckmeldung begrndeter
nes Studiums meist so selbstverstndlich wird, Proze aufzufassen ist, zeigen die Untersuchun-
da man den spezifischen Beitrag der so ge- gen zum komplexen Denken (vgl. dazu Drner,
prgten Denkweise oft bersieht. Ein Ingenieur 1979, 1983 ).Es fllt dabei auf, da aus rein intel-
orientiert sich ganz natrlich an technischen lektueller Sicht vermutlich ein erheblicher Teil der
Gegebenheiten, ein klassisch ausgebildeter in solchen psychologischen Experimenten teil-
Wirtschaftswissenschaftler wird vor allem an nehmenden Versuchspersonen im realen Le-
40 Grundlagen sozialwissenschaftlich gesttzter Evaluation

ben in der Lage wre, etwa eine Schneiderwerk- im Abschnitt 2.1.3). Auch der Wissenschaft-
statt oder ein hnlich berschaubares System in- ler ist ein normaler Mensch, der gerade zu
tellektuell zu steuern. Da diese Aufgabe aber bei gesellschaftlich relevanten Vorhaben (zum
Reduktionen auf sachliche Rckmeldung und Beispiel im Bildungsbereich) oder bei Ma-
ohne die Einbettung in Erfahrung oder anderes nahmen, die seine eigene Ttigkeit unmit-
gewohnheitsmiges Verhalten nicht so leicht ist, telbar berhren (zum Beispiel die Effekte
zeigen die erstaunlich hohen Versagerquoten bei verschiedener Therapieformen fr einen Kli-
entsprechenden Simulationsexperimenten (vgl. nischen Psychologen) durchaus fest etablierte
dazu Putz-Osterloh 1981). Vorurteile haben kann. Zur Vermeidung sol-
Die psychologischen Mechanismen, die einen cher Effekte ist der in manchen Programmen
Zusatznutzen der Einschaltung von Wissenschaft in den USA bliche Lsungsweg interessant,
ber Fachwissen hinaus bedingen, sind vor allem besonders kontroverse Vorhaben parallel von
im Bereich der Sozialpsychologie (Vorurteils- und zwei Wissenschaftlern mit stark unterschied-
Kleingruppenforschung, Battegay 1973; Sbandi, lichen Vormeinungen evaluieren zu lassen.
1973; Schfers, 1980; Schneider, 1985) ausfhr- Dies fhrt nicht nur zu einer besonders brei-
lich untersucht. Eine Darstellung einiger beson- ten Vorgehensweise unter Beachtung fast al-
ders wichtiger dort aufgezeigter Effekte findet sich ler denkbarer Vor- bzw. Nachteile der evalu-
in Diagramm II/4. ierten Manahme, sondern stellt auch ein
gewisses Regulativ fr die einzelnen Wissen-
schaftler dar, zur Aufrechterhaltung der eige-
Fr die praktische Arbeit besonders wichtig sind
nen Reputation eine mgliche Verzerrung
folgende Zuschreibungen:
der Studie aufgrund ihrer Vormeinung so ge-
Neutralitt der Wissenschaft; man erwartet, ring wie mglich zu halten. Dies ist beson-
da aufgrund des Selbstverstndnisses einer ders vor dem Hintergrund der Einmaligkeit
wertfreien Forschung (ob dies gerechtfer- der meisten Evaluationsprojekte wichtig, die
tigt ist, mag dahin gestellt bleiben), da der eine Kontrolle der Angemessenheit des Pro-
Wissenschaftler in besonderem Mae in der jektes bzw. die Fundiertheit der Ergebnisse
Lage ist, nur objektive Fakten zu beachten durch Replikationsstudien nicht mglich
und sie nicht gem einer vorgefaten Mei- macht.
nung gefrbt zu interpretieren. Im Prinzip
drfte dies auch richtig sein, doch gibt es Fachbergreifende Kompetenzzuschreibung; da
zweifellos auch das Phnomen der advo- der Fachwissenschaftler einem Laien in dem
katorischen Evaluation (siehe Diagramm II/3 jeweiligen wissenschaftlichen Teilgebiet zwei-
Diagramm II/4
Psychologische Grnde fr den Zusatznutzen wissenschaftlich ausgewiesener, externer
Evaluatoren (Auswahl)
Image des Wissenschaftlers Nonkonformitt mit informellen
Gruppennormen
Expert power
Objektivitt
Information power
Besserer Einblick in und besserer Umgang
Credibility/Glaunwrdigkeit mit gruppendynamischen Prozessen
Persuasibility/berzeugungskraft
Vermeidung negativer Gruppeneffekte wie
Geringerer Gesichtsverlust in Konflikt- group thinking oder group polarisation
situation
Unabhngigkeit von hierarchischen
Besserers Konfliktmanagement durch Strukturen auf der Seite der Auftraggeber
den Einsatz von Sozialtechniken
Idiosyncrasy Credit aufgrund des Status
Objektive Vermittlung bei Konflikten des Wissenschaftlers
innerhalb der Institution des Auftraggebers
Grundlagen sozialwissenschaftlich gesttzter Evaluation 41
fellos kompetenzmig weit berlegen ist, fin- Aufwertung von Projekten; ein Vorhaben in
det sich das Phnomen, ihm eine entspre- der Schule, im Betrieb und einer Kurklinik
chende berlegenheit und Autoritt auch mu etwas Besonderes sein, wenn sich da-
auerhalb des Fachgebietes zuzuschreiben. So mit ein Wissenschaftler beschftigt. Es wird
fragwrdig manche Auswchse der Benut- damit gegenber alltglichen Kontroll- bzw.
zung dieser speziellen Art des Halo-Effektes Evaluationsvorgngen auf eine hhere Stufe
auch sind (man denke etwa an die Wahlauf- gehoben, von der Verantwortlichkeit bzw. Be-
rufe von Wissenschaftlern oder Knstlern fr treuung her meist auch hierarchisch hher
politische Parteien oder die Darstellung von zugeordnet und damit bzgl. der Durch-
Spitzensportlern in der Produktwerbung), so fhrungsmglichkeit und der Beachtung der
ntzlich kann dieses Phnomen in Evalua- Ergebnisse aufgewertet. Als Beispiel: An einer
tionsprojekten sein. Dies gilt zum Beispiel fr Schule wird das Problem alkoholabhngiger
die Konfliktbereinigung zwischen verschie- Schler virulent. Die mit der Beratung dieser
denen Mitarbeitern oder Instanzen des Auf- Problemgruppe besonders beauftragten Leh-
traggebers, da diese im Regelfall die Empfeh- rer berlegen drei verschiedene Vorgehens-
lung einer externen Autoritt mit weisen. Wenn sie diese Varianten schulintern
besonderer Kompetenz leichter und ohne mit dem Einsatz ihrer eigenen Arbeitszeit
Gesichtsverlust akzeptieren knnen als eine evaluieren, kann dies leicht von der Schul-
interne Regelung. In gleicher Weise knnen leitung als Hobby dieser Kollegen interpre-
Wissenschaftler dazu beitragen, die (gerade bei tiert werden. Gelingt es, etwa einen Diplom-
politisch interessanten Evaluationsvorhaben) Psychologen einer benachbarten Erziehungs-
oft irrational heftigen Kontroversen ein we- beratungsstelle dafr zu interessieren, wird
nig zu versachlichen, da sich normalerweise mit Sicherheit der Schulleiter eingeschaltet,
die Kontrahenten nicht auf Dauer dem Vor- das Vorhaben ausfhrlich auf einer Konferenz
wurf aussetzen wollen, gegen den wissen- diskutiert und vielleicht sogar zur Profilierung
schaftlichen Sachverstand zu argumentieren. der Schule in der ffentlichkeit oder gegen-
ber der Stadtverwaltung (da jetzt Dienst-
Weitgehende Explikationen der Begrndungen; es stellen kooperieren mssen) genutzt. Gelingt
ist fr einen wissenschaftlich gut ausgebil- es sogar, einen angesehenen Universitts-
deten Akademiker selbstverstndlich, die Be- professor fr dieses Projekt zu interessieren,
grndung fr eine Bewertung in expliziter, besteht eine gute Chance, da sich daraus ein
logisch nachvollziehbarer Form zu erwarten. mit zustzlichen Finanzmitteln gefrdertes
Bei vielen Kontroversen liegt ein Kernpunkt Projekt ergibt, vielleicht sogar ein Modell-
des Konfliktes aber gerade darin, da wichtige versuch des entsprechenden Landes, vielleicht
Bewertungsaspekte nicht genannt werden mit bundesweiter Verbreitung der aufgrund
(Wer sagt schon, da er bei dem Vergleich der Evaluationsergebnisse abgegebenen Emp-
verschiedener Weiterbildungsseminare in sei- fehlungen. Eine solche Entwicklung kann
nem Unternehmen auf der Bewertungs- selbst dann eintreten, wenn sich gegenber
variable persnliche Beliebtheit des Referen- dem ursprnglichen Vorhaben der Lehrer vor
ten bei den Teilnehmern vor allem deshalb Ort weder in den Manahmen noch in den
besteht, weil er meint, da dabei sein Lieb- Evaluationsgesichtspunkten eine wesentliche
ling besondere Vorteile hat? Oder wer for- Vernderung ergeben htte.
muliert explizit, da er gegen eine Geschwin-
digkeitsbegrenzung auf Autobahnen ist, weil Man sollte solche an sich unsachlichen, sozial-
er selbst es geniet, seinen starken Wagen voll psychologisch begrndeten Effekte nicht ber-
ausfahren zu knnen?). Die durch einen Wis- bewerten, aber auch nicht gering achten
senschaftler angestrebte Explikation erzeugt wahrscheinlich war es in vielen Fllen der
in solchen Fllen erhebliche Dissonanzen zwi- Evaluationsvorhaben nur durch die von den
schen dem Ist-Stand der Ziele und dem Selbst- Auftraggebern gewnschte Aufwertung des Pro-
bild des sich selbst als verantwortlich han- jektes mittels des Einsatzes von Wissenschaft-
delnd sehenden Praktiker, was die Konsens- lern mglich, auch sachlich eine wesentlich
bzw. Kompromifhigkeit frdert. Qualittssteigerung zu erzielen.
42 Grundlagen sozialwissenschaftlich gesttzter Evaluation

2.2.3 Alternativen zur geltenden brokratischen und nicht immer ra-


wissenschaftsgesttzten Evaluation tionalen Regeln anzunehmen und fr sich zu
nutzen; ein wichtiger Aspekt bei der Koopera-
Auf wissenschaftliche Evaluation wird immer tion mit Auftraggebern aus Groorganisatio-
verzichtet werden, wenn entweder berhaupt nen, nicht nur der ffentlichen Hand.
die Mglichkeit dazu nicht gesehen oder
akzeptiert wird (vgl. die Ausfhrungen zu den Auf den ersten Blick mag die hier verkrzt dar-
psychologischen Erfordernissen) oder der er- gestellte legalistische Position unsinnig wirken.
wartete Nutzen aus den damit erzielten Infor- Man mu sich aber vor Augen halten, da sie
mationen geringer ist als die durch das Projekt eine fr das Funktionieren grerer mensch-
verursachten Kosten. Eine solche Situation licher Gesellschaften vllig unverzichtbare
kann zum Beispiel entstehen, wenn sich die Grundlage ist und von der abstrakten Struktur
verschiedenen Verhaltensalternativen nur ge- her gesehen eine Mglichkeit ist, das Problem
ringfgig unterscheiden, das Evaluationsprojekt der Zeitperspektive der Wirkungsketten von
aber auerordentlich aufwendig wre. Bei sozi- Manahmen (vgl. dazu die Diskussion zum
alwissenschaftlich relevanten Problemstellun- ultimate criterion im Abschnitt 1.3) in sozial
gen ist es hufig der Zeitdruck, durch sich vertrglicher, berwiegend konsensmiger
schnell ndernde Rahmenbedingungen, der Weise zu lsen. In vielen Organisationen
unter Nutzenaspekten eine wissenschaftliche (Rechtsprechung, ffentliche Verwaltung, Mi-
(und damit meit lnger andauernde) Evaluati- litr, nicht mehr persnlich berschaubare
on nicht zweckmig erscheinen lt. Industrieunternehmen) sind Spielregeln erfor-
derlich, deren Gltigkeit zum Zeitpunkt ihrer
Die Hauptursachen fr den Verzicht auf Wis- Anwendung hinzunehmen ist. Nur so ist eine
senschaft auch in Situationen, in denen diese Vermeidung von Willkr (etwa bei der Recht-
sachlich durchaus angemessen wre, sind ver- sprechung), irrationaler Machtausbung (zum
mutlich in einer besonderen Betonung von le- Beispiel im Verwaltungsbereich) oder subjektiv
galistischen (oder brokratischen) Positionen ungleiche Behandlung von Betroffenen (etwa
und einer berschtzung nicht-wissenschaftli- bei Gehaltsfindungen in der Wirtschaft) mg-
cher Evaluationsanstze zu sehen. lich. Durch ein fortlaufendes Infragestellen ei-
ner ordnungsgem zustandegekommenen
Anordnung wre nicht nur die Effektivitt der
Legalistische Position Gesamtorganisation gefhrdet, sondern auch
die psychologische Akzeptanz von Manah-
Diese Auffassung knnte man verkrzt mit men erschwert. Man kann kaum von einem
eine rechtmig zustandegekommene Rege- Betroffenen erwarten, da er eine Gefngnis-
lung hat befolgt und nicht in Zweifel gezogen strafe fr ein kriminelles Delikt innerlich an-
zu werden charakterisieren. Geht man davon nimmt, wenn dieses als Folge einer schnell
aus, mu sich Evaluation (wenn berhaupt) auf wechselnden Rechtslage manchmal strafbar, in
das Feststellen des ordnungsgemen Zustan- anderen Zeitrumen aber straffrei ist. Beispiele
dekommens beschrnken, wozu man kaum dafr ist etwa die zu verschiedenen Zeiten oder
wissenschaftliche Methoden bentigt. Diese bei verschiedenen Staaten der europischen
Auffassung ist selbstverstndlich dem empi- Kulturgemeinschaft stark unterschiedliche
risch-rational geprgten Denken fundamental rechtliche Bewertung von Wirtschaftsdelikten,
entgegengesetzt, da es in der Wissenschaft ja Ehebruch, Gotteslsterung, Abtreibung oder
gerade darauf ankommt, jede, auch noch so Pornographie. Das Nichthinterfragen von Re-
plausibel klingende, von Autoritten verkn- geln, und damit automatisch der Verzicht auf
dete und von der Wissenschaftsgemeinschaft eine Evaluation, kann ein gesellschaftlich rele-
konsensmig akzeptierte Hypothesen beim vanter Wert an sich sein. Die Abwgung zwi-
Auftreten von Zweifeln doch immer wieder aufs schen jeweils bertriebener und dadurch dys-
Neue zu berprfen. Dies mag mit ein Grund funktionaler Starrheit versus Vernderbarkeit
sein, warum mache Wissenschaftler (und und Unsicherheit ist eine schwierige gesell-
Evaluatoren) Schwierigkeiten haben, die jeweils schaftliche Aufgabe. Man sollte sich davor h-
Grundlagen sozialwissenschaftlich gesttzter Evaluation 43
ten, aus einer verkrzten, rein naturwissen- meldung sich im allgemeinen auf jene Varia-
schaftlich geprgten Sicht heraus die positiven blen konzentriert, die fr den fr die Innova-
Aspekte legalistischer Positionen vllig zu ne- tion Verantwortlichen persnlich besonders
gieren. wichtig sind, werden diese Aspekte berbe-
tont. Wissenschaftlich gesttzte Evaluation
vermag es, strker die Vielfalt der Betroffen-
Nicht-sozialwissenschaftliche Evaluation heit deutlich zu machen und damit auf die
Interessen zum Beispiel sozial wenig einflu-
Die zweifellos hufigste Bewertung von Verhal- reicher Gruppen hinzuweisen (was die fakti-
tensweisen erfolgt durch von selbst anfallen- sche Bercksichtigung auch dieser Punkte
de, nicht zum Zwecke des gezielten Evalua- zumindest in demokratischen Gesellschaften
tionsprojektes erhobene Rckmeldungen. Dies als Folge der dadurch erleichterten bzw. erst
gilt sowohl fr den Einzelnen (es gibt wohl nur ermglichten ffentlichen Diskussion er-
wenige Psychologen, die zur persnlichen hht).
Partnerauswahl wissenschaftliche Techniken,
etwa Diagnose-Instrumente wie zum Beispiel Die Grnde fr den Verzicht auf wissenschafts-
Tests, einsetzen) als auch im gesellschaftlichen gesttzte Evaluation sind oft rational ber-
Bereich. Fr Politiker sind, global gesehen, zeugend, und manchmal zumindest faktisch
Rckmeldungen ber die Presse, die Argumen- zwingend. Ebenso wie es unsinnig wre, diese
tation des Gegners oder der Besuch von Wahl- spezielle Art der Rckmeldung ber Handlungs-
kampf-Veranstaltungen viel entscheidendere folgen vllig auszuschlieen, wre es auch
Informationen als wissenschaftliche Evalua- falsch, die Forderung nach der wissenschaftli-
tionsprojekte; Manager merken schnell die Re- chen Evaluation aller Manahmen durchsetzen
aktion des Betriebsrates, des Marktes oder der zu wollen. Allerdings drfte derzeit eine we-
Konkurrenten. sentliche Erweiterung des Einsatzes von Wis-
senschaft auch im Interesse der Gesamt-
Der Vorteil dieser Art von Rckmeldung ist, ne- gesellschaft zu begren sein.
ben der Gewhnung, der geringe Kostenauf-
wand und die subjektiv erlebte, manchesmal
aber nur scheinbare Plausibilitt. 2.2.4 Qualittsmanagement nach
DIN-EN-ISO-9000 ff.
Besonders wichtige Nachteile sind:
Einen vllig anderen Ursprung als die sozial-
Verzerrung der Rckmeldung durch unsyste- wissenschaftlich orientierte Evaluation hat das
matische Auswahl (Presseberichte geben in vor allem aus der industriellen Produktion
keiner Weise immer ein reprsentatives Bild stammende Qualittsmanagement. Zwar sind
der ffentlichen Meinung, Umsatzsteigerun- die Zielsetzungen identisch, es geht immer dar-
gen knnen andere Ursachen haben als die um, auf der Basis von empirisch feststellbaren
spezielle Gestaltung einer Marketingma- Sachverhalten einen Vorgang zu bewerten
nahme) (summativ) oder optimaler zu gestalten (forma-
Relativierung, im Extremfall sogar die Erset- tiv); als Folge der unterschiedlichen Wurzeln
zung gestaltender Ziele durch kurzfristige haben sich aber vllig verschiedene terminolo-
Rckmeldung (Phnomen der vorbeugen- gische Gewohnheiten eingebrgert. So wrde
den Selbstzensur bei Berichten oder Vor- es zum Beispiel die Qualittskontrolle eines Pro-
schlgen, Verzicht auf langfristig sinnvolle duktionsbetriebes sehr merkwrdig empfinden,
Manahmen bei zunchst negativer Reak- wenn man ihre Ttigkeit als Ergebnis-
tion der ffentlichkeit). evaluation bezeichnen wrde.
Vernachlssigung von Nebenwirkungen, die Fr die psychologisch bzw. sozialwissenschaft-
ohne vorhergehende Studien erst zu spt er- lich begrndete Evaluation wird das Qualitts-
kennbar werden. management in den letzten Jahren dadurch be-
Unklare Definition des Gesamtnutzens einer sonders interessant, da die ursprnglich fr
Manahme; da die unsystematische Rck- die Produktion konzipierten Systeme auch auf
44 Grundlagen sozialwissenschaftlich gesttzter Evaluation

den Dienstleistungsbereich bertragen werden (zum Beispiel hohe Erreichbarkeit unserer


(DIN-EN-ISO 9000ff./2 Deutsches Institut fr Hotline) sondern mssen mit exakten
Normung e.V. 1997; Gumpp, 1996, Hering, Mindestgrenzwerten versehen werden,
1996, Brauer, 1997). zum Beispiel maximale Wartezeit 5 Minu-
Fr die Messung der im Dienstleistungsbereich ten).
erforderlichen empirischen Indikatoren sind im Die Verbindung zwischen dem eigenen Ver-
Gegensatz zur technischen Qualittsprfung na- halten und dem fr den Kunden zugesagten
trlich weiche Aspekte, fr deren Messung Leistungen mssen allen an der Leistungs-
und sachgerechte Interpretation entsprechend erbringung Beteiligten bekannt sein (was
psychologisch oder sozialwissenschaftlich be- insbesondere bei weichen Faktoren wie
grndete Meinstrumente erforderlich sind, un- freundliches Verhalten, Akzeptanz von Kun-
verzichtbar. Es zeichnet sich daher ab, da ein denwnschen oder anregende Kaufatmo-
erheblicher Teil der praktischen Evaluations- sphre eine erhebliche Leistung bei der
arbeit (wenn auch vermutlich nicht mit dieser psychologischen Analyse der Bedingungs-
Bezeichnung!) nach den Grundstzen des Qua- faktoren der vom Kunden erlebten Leistungs-
littsmanagements fr Dienstleistungsorgani- erbringung erfordert).
sationen strukturiert werden wird. Tatschlich Die berprfung der erbrachten Leistung
drfte dies in Anbetracht der Vielzahl der damit mu unmittelbar durch den Leistungs-
verbundenen Fragestellungen im Wirtschafts- erbringer, aber auch zustzlich durch un-
leben der quantitativ wichtigste Bereich von abhngiges (damit ist gemeint, da keine
Evaluationsabeit werden, dies auch gerade vor unmittelbare Abhngigkeit vom Leistungs-
dem Hintergrund des aktuell nicht sehr starken erbringer oder Leistungsempfnger vorliegt)
Strebens nach Reformprojekten mit der Notwen- Personal festgestellt werden.
digkeit entsprechend groer Evaluationsvor- In regelmigen Abstnden (zum Beispiel
haben im ffentlichen Bereich. einmal jhrlich) ist ein Qualittsaudit
Die genauen Inhalte der ursprnglich von durchzufhren, bei dem die festgestellten Er-
der International Standard Organization (ISO) gebnisse, ihre Ursachen und darauf aufbau-
entwickelten und dann von dem Deutschen In- ende Optimierungsmglichkeiten zu disku-
stitut fr Normung (DIN) und in vielen ande- tieren sind.
ren Staaten bernommenen Norm drfen aus
rechtlichen Grnden, im Gegensatz zu den Ge- Ein solches Qualittsaudit ist natrlich von der
wohnheiten im wissenschaftlichen Bereich, Struktur her vllig identisch mit der Diskussion
nicht ausfhrlich zitiert werden. Vieles an die- von Evaluationsberichten, wenn man von eini-
sem Regelwerk, da die Arbeit einer (Dienst- gen spezifischen (und durchaus fr eine
leistungs-) Organisation optimieren soll, betrifft Dienstleistungsorganisation sehr sinnvollen)
auch Aspekte, die mit der Evaluation im enge- Bestimmungen der hier nur sehr oberflchlich
ren Sinne nichts zu tun haben (zum Beispiel skizzierten ISO-Norm absieht.
Prinzipien der Verantwortungsdelegation, teil- Richtig angewendet kann die Befolgung die-
weise auch sehr stark an Verhaltenskontrolle ser Norm fr Dienstleistungsorganisationen
orientierte, von vielen Nutzern als brokra- eine erhebliche und systematisch von Jahr zu
tisch erlebte Regelungen von Verfahrensab- Jahr gesteigerte Qualittsoptimierung mit sich
lufen). Fr den potentiellen Beitrag von Eva- bringen. Bedauerlich ist, da es einer greren
luation im Sinne der Sozialwissenschaften sind Zahl von Unternehmen offensichtlich weniger
folgende Aspekte besonders wichtig: darum geht, wirklich ihre Organisation zu op-
timieren, sondern eher, das fr die Auen-
Es mu eine klare Definition des in der darstellung immer wichtiger werdende Zertifi-
Dienstleistung fr den Kunden zu erbringen- kat (zertifiziert nach ISO 9000!) zu erwerben,
den Outputs geben (siehe dazu die Ausfh- ohne wirklich relevante Vernderungen durch-
rungen im Abschnitt 2.1), die sich auf me- zufhren. Die Grnde fr diese immer wieder
bzw. beobachtbare Indikatoren sttzen mu. festzustellende Barriere gegenber einer echten
Die Aussagen fr diese angestrebte Leistung Struktur- oder Verhaltensnderung drften
drfen nicht unbestimmt offen bleiben hnlich strukturiert sein wie die Widerstnde
Grundlagen sozialwissenschaftlich gesttzter Evaluation 45
gegen Evaluation generell (siehe Abschnitt diesem Feld nur bedingt Interesse (siehe dazu
2.1.1). Es ist selbstverstndlich auch bei dieser auch Abschnitt 5.2.2).
Norm mglich, wie bei jedem auf dem Prinzip
der Verhaltenskontrolle aufbauenden Regel-
system, eine durchaus auch nachprfbare Ein-
haltung der Vorschriften zu sichern, ohne den 2.3. Verfgbarkeit von
Output des Systems wirklich zu optimieren. Evaluatoren
Diese Gebrauchs- bzw. Mibrauchsmglichkeit
drfte die wichtigste Grundlage fr die auch Das gesellschaftliche Bedrfnis nach sozialwis-
starke Kritik an dieser Neuerung sein, bei der senschaftlich gesttzter Evaluation kann trotz
meist besonders der brokratische Aufwand gegebener Sachkompetenz der Wissenschaft
hervorgehoben wird. nur erfllt werden, wenn ausreichend viele und
Eine Reihe sehr interessanter Beispiele fr die ausreichend qualifizierte Personen als Evalua-
Anwendung der DIN EN ISO 9000 Norm fin- toren zur Verfgung stehen. In anderen Ln-
den sich im Bereich der Personalentwicklung dern, insbesondere den USA, ist dies in groem
(vgl. Dembski und Lorenz, 19969; Thombarsen, Ausmae der Fall. So schtzt man etwa, da in
Laske Possler und Rasmussen, 1994; Albrecht, den USA im Rechnungsjahr 1977 39 Ministe-
Pfitzinger und Vogel, 1995). rien und Behrden sowie unabhngige Insti-
Trotz der unterschiedlichen Herkunft der bei- tutionen 243 Mio. Dollar fr die Evaluation von
den Konzepte (Evaluation im sozialwissen- Sozialprogrammen ausgaben. Davon wurden
schaftlichen Verstndnis einerseits und Qua- 61 Mio. Dollar zur Bezahlung von etwa 2200
littsmanagement andererseits) ist zu erwarten, vollberuflichen Mitarbeitern bei den Bundes-
da es aufgrund der objektiven hnlichkeiten behrden verwendet, deren wesentliche Auf-
bzw. nahezu Identitten zu einer Konvergenz gabe in Evaluationsarbeiten zu sehen ist. Ins-
dieser beiden Denkschienen, zumindest im gesamt wurden aus den oben genannten
Bereich der Dienstleistungsorganisationen, Mitteln ca. 1300 Auftragsarbeiten finanziert
kommt. Bedauerlich ist, da sich auch hier eine (vgl. Freeman & Solomon, 1984, S. 134ff).
gewisse Tendenz abzeichnet, das die dabei ent- Bercksichtigt man die unterschiedlichen
stehenden neuen Aufgaben vorwiegend durch Bevlkerungszahlen, so mte in der Bundes-
Personen abgedeckt werden, die keine im enge- republik Deutschland fr den vergleichbaren
ren Sinn psychologisch-sozialwissenschaftliche Ausbau von Evaluation etwa ein Viertel der in
Ausbildung haben. Zumindest in der Anfangs- den USA beschftigten Evaluatoren bentigt
phase der Durchsetzung der ISO 9000 in werden, eine Zahl, von der die derzeitigen
Dienstleistungsorganisationen entstand der Verhltnisse (Details dazu sind leider nicht
Eindruck, da diese Form von Evaluation bekannt) sicher bei weitem abweichen. Man
eher von Ingenieuren, Juristen oder Betriebs- sieht daran, welcher groe potentielle Bedarf
wirten gestaltet wird, als von den zumindest an Evaluatoren in einer modernen Industrie-
unter dem Aspekt der Ausbildung her dafr be- gesellschaft bestehen kann. Allerdings mu
sonders qualifizierten Absolventen einschlgi- man bercksichtigen, da die USA im Gegen-
ger Studiengnge. Voraussetzung fr die Nut- satz zu den meisten europischen Lndern
zung des spezifisch sozialwissenschaftlichen keine ausgeprgte Tradition mit Herrschafts-
Know-hows in diesem Feld ist allerdings, da formen des aufgeklrten Absolutismus oder an-
man sich von in der humanwissenschaftlichen derer autoritrer Staatsformen hat, so da eine
Grundlagenforschung idealen, aber fr die wesentliche Grundlage fr das Dominieren der
praktische Arbeit der Qualittsoptimierung legalistischen Position (vgl. Abschnitt 2.2.3)
nicht brauchbaren Vorstellungen, insbesonde- fr die Rechtfertigung bzw. Bewertung ffent-
re im Zusammenhang mit der Design- licher Manahmen fehlt. Ein weiterer Grund
konstruktion, lst. Im Qualittsmanagement fr den Unterschied mag darin liegen, da die
werden praktische Lsungsvorschlge gesucht, groen politischen Parteien in den USA weni-
Bemhungen zum elaborierten Aufzeigen von ger Unterschiede zueinander zeigen als in Eu-
Kausalitten, die zweifellos nur durch entspre- ropa. Ideologische Wurzeln fr Parteiprferen-
chende Designs zu erreichen sind, finden in zen fehlen fast vllig, und auch die zum
46 Grundlagen sozialwissenschaftlich gesttzter Evaluation

Beispiel in der Bundesrepublik Deutschland len des Evaluators gegeben, die Rahmenbedin-
nicht unerhebliche Tendenz von Politikern, gungen (auch in rechtlicher Hinsicht) von
zumindest die ffentlich geuerte persnli- evaluatorischer Ttigkeit skizziert und abschlie-
che Meinung mit der offiziellen Partei- end darauf aufbauend versucht, die fr eine
meinung abzustimmen, ist in den USA zumin- erfolgreiche und zufriedenstellende Berufsttig-
dest wesentlich schwcher. Dieser strker keit in diesem Bereich erforderlichen Kompe-
pragmatische, weniger parteibezogene Umgang tenzen und Persnlichkeitseigenschaften zu
mit Problemen frdert das Interesse an empi- skizzieren. Dieser letzte Abschnitt verfolgt das
rischer Evaluation und die praktische Anwen- Ziel, die persnliche Entscheidung fr eine
dung der Ergebnisse. Trotzdem drfte in der eventuelle Ttigkeit in diesem Bereich ein we-
Bundesrepublik ein quantitativ erhebliches nig zu versachlichen.
Defizit an Evaluatoren bestehen, worauf sich
zumindest mittel- bzw. langfristig eine gn-
stige Prognose fr diesen Teilarbeitsmarkt grn- 2.3.1. Rollenvielfalt des Evaluators
det. Diese Hoffnung wird verstrkt durch die
in den letzten Jahren deutlich gewordene Ten- Die wichtigsten abgrenzbaren Funktionen ei-
denz einer Entideologisierung der Politik nes Evaluators sind auf der Basis des allgemei-
auch in Deutschland und der zunehmenden nen Handlungsmodells aus Diagramm I/2 in Dia-
Betonung der Outputkontrolle als Grundlage gramm II/5 strukturiert zusammengefat. Die
der Systemsteuerung auch im ffentlichen Darstellung macht vielleicht deutlich, da die-
Bereich. ses Berufsfeld sicher eine sehr abwechslungsrei-
Die Nachfrage nach Evaluation ist aber auch che Ttigkeit bietet, gleichzeitig aber auch hohe
abhngig von der Verfgbarkeit ausreichend und zum Teil kontrre Anforderungen stellt. So
kompetenter Evaluatoren. Entsprechend gezielte mu etwa der Evaluator als summativer
Aus- und Weiterbildungsprogramme fehlen (im Bewerter seine eigene Meinung und Persn-
Gegensatz zu den USA) in der Bundesrepublik lichkeit gegenber dem Auftrag und der Sach-
Deutschland so gut wie vllig, selbst Spezia- lage soweit wie nur irgend mglich zurck-
lisierungen innerhalb des normalen Diplom- nehmen. Als Informationsbeschaffer das
Studienganges werden kaum angeboten und Instrumentarium gem seiner eigenen Auffas-
die Arbeitsbedingungen der meisten Evalua- sung gestalten und seine mglichst optimale
toren sind zumindest in Anbetracht der derzei- Anwendung im Feld auch gegen Widerstnde
tigen Marktlage mit so vielen Unsicherheiten durchsetzen. Als formativ Helfender ist er der
behaftet, da sie fr besonders kompetente, Ratgeber, der unterschiedliche Gestaltungsvor-
Eigeninitiative entwickelnde Absolventen in schlge und Interessen vermittelnd zu einem
Anbetracht der fr diese Personengruppe be- Konsens fhrt. Da sich alle drei Rollen im Rah-
stehenden anderweitigen Berufsmglichkeiten men desselben Projektes ergeben knnen, mu
nur wenig attraktiv sind. Die mangelnde Ver- man i. A. Langeweile nicht befrchten. Aller-
fgbarkeit besonders qualifizierter Bewerber re- dings stellt sich die Frage, wie man eine ent-
duziert ihrerseits wiederum die fr Evaluatoren sprechende Rollenflexibilitt erwerben soll,
geschaffenen Arbeitsmglichkeiten. Es bleibt solange eine entsprechende Persnlichkeits-
zu hoffen, da nderungen der Studien- entwicklung etwa im Rahmen von post-
ordnungen (vgl. etwa die Rahmenprfungs- gradualen Bildungsgngen oder sorgfltig
ordnung fr das Diplomstudium Psychologie supervisierter Berufserfahrung kaum unter-
vom 20. Mai 1983 mit der Einrichtung eines sttzt wird.
Pflichtfaches Evaluation und Forschungs-
methodik im Hauptdiplom), Verlagerung der
Studenteninteressen und eine gleichzeitig hof- 2.3.2 Rechtliche Rahmenbedingun-
fentlich zunehmende Nachfrage nach Eva- gen von evaluatorischer Ttigkeit
luationskompetenz hier eine Verbesserung be-
wirken. Vorweg mu erklrt werden, welche Rechts-
In den nchsten drei Abschnitten wird zu- beziehungen in dem Feld evaluatorischer T-
nchst ein berblick ber die Vielfalt der Rol- tigkeit berhaupt relevant sein knne. Eine
Grundlagen sozialwissenschaftlich gesttzter Evaluation 47
bersicht ber hufige Beschftigungsverhlt- gericht) und BGH (Bundesgerichtshof) ist dabei
nisse fr Evaluatoren stellt Diagramm II/6 dar. auf bestimmte Indizien abzustellen wie Wei-
Innerhalb der Dienstleitungen im Sinne des sungsgebundenheit, Art der Entlohnung, Ab-
611 BGB (Brgerliches Gesetzbuch) sind zwei fhrung von Lohnsteuer und Sozialversiche-
Flle zu unterscheiden: rungsbeitrgen. Der Evaluator als Arbeitnehmer
schuldet dem Dienstberechtigten seine ganze
Dienstleistungen des selbstndig Ttigen;
Arbeitskraft.
Arbeitsleistungen des (unselbstndigen) Ar-
beitnehmers.
Vertragsmglichkeiten
Im ersten Fall ist der Evaluator selbstndig, lei-
tet zum Beispiel ein eigenes Institut. Im zwei- Bezglich der rechtlichen Beziehungen zwi-
ten Fall ist der Evaluator abhngig beschftigt. schen Auftraggeber und Evaluatoren sind fol-
Laut Rechtsprechung des BAG (Bundesarbeits- gende Bedingungen typisch:

Diagramm II/5
Funktion des Evaluators auf der Basis des Handlungsmodells

Handlungsmodell Funktionen des Evaluators Besondere Aspekte fr


den Berufsanfnger
Situation

Person

Gute Fachkenntnisse, spezielle


ZIELE Evaluator hilft bei der Ziel-
Kenntnisse ber das Evaluations-
explikation
objekt und dessen Kontext-
Bestandteile einer Zielhierarchie
bedingungen
IST SOLL Verwaltungstechnische/organisa-
Evaluator bert hinsichtlich der torische Kenntnisse, praktische
Realittsnhe der Manahmen erfahrungen auerhalb der
DISKREPANZ und gibt Anregungen fr den Wissenschaftsgemeinde, soziale
Handlungsbedarf Kompetenz

Erfahrungen hinsichtlich der


Handlungsplne Instrumente aus der Grundlagen-
hierarchisch organisiert Evaluator untersttzt bei der forschung, Kenntnisse aus dem
Erweiterung der gesehenen Projektmanagement, umfassende
H1 H2 H3 H4 etc. Handlungsmglichkeiten Methodenkenntnisse, praktische
Erfahrung

Bewertung der Handlungs- Fertigkeiten in Prsentation,


alternativen (z.B. unter dem Evaluator setzt Kommunika- Moderation, Berichtlegung,
Kosten-Nutzen-Aspekt tionstechniken ein sozialpsychologischen Techniken

Handlungsausfhrung Evaluator hilft und bert bei der Praktische Erfahrungen, gute
Ausfhrung der Manahmen fachspezifische Kenntnisse,
Ausfhrungskontrolle organisatorische Kompetenzen

Ergebnisse umfassende Methodenkenntnisse,


Evaluator ist zustndig fr die
gute fachspezifische Kenntnisse,
applizierte Methodik, fr die
spezifisches Wissen ber das
Auswertung und die Nutzen-
Folgen Evaluationsobjekt und dessen
messung
Kontextbedingungen

Soziale Kompetenz, Kenntnisse


Evaluator wendet sozial-
Folgenbewertung ber sozialpsychologische
technische Methoden an
Techniken
48 Grundlagen sozialwissenschaftlich gesttzter Evaluation

Der Dienstvertrag: pflichtung zur objektiven Information nach


auen knnen sich zu diesem Punkt aber
Fr den Evaluator als unselbstndigen Arbeit-
durchaus erhebliche Konflikte zwischen Arbeit-
nehmer gelten die Pflichten, die sich aus einem
geber und Evaluator ergeben). Ebenso wie in
abgeschlossenen Dienstvertrag ergeben (vgl.
anderen Feldern mit entscheidungsvorbereiten-
Diagramm II/7).
den Arbeiten (zum Beispiel in der psycholo-
gischen Diagnostik) kann sich auch in
Probleme aus den Verpflichtungen als abhn-
Evaluationsmanahmen das Problem des An-
gig Beschftigte knnen sich in einer Vielzahl
gebots von Schmiergeldern ergeben, zum Bei-
von Punkten der praktischen Evaluationsarbeit
spiel dann, wenn aufgrund der Evaluations-
ergeben. Besonders naheliegend sind solche
ergebnisse zwischen verschiedenen Anbietern,
Schwierigkeiten bei innerer bzw. Selbst-Evalua-
Bildungstrgern oder auch einzelnen Dozenten,
tion, wenn also der Arbeitgeber gleichzeitig jene
projektdurchfhrende Institutionen im Ge-
Institution ist, deren Leistung evaluiert werden
sundheitswesen etc.) ausgewhlt werden sollen
soll. In einem solchen Fall kann es etwa sein,
und die Betroffenen ein hohes Interesse haben,
da der Arbeitgeber sein Weisungsrecht dahin-
die fraglichen Auftrge (weiter) zu erhalten.
gehend ausbt, da bestimmte Aspekte (von
denen zum Beispiel negative Bewertungen aus-
Der Werkvertrag:
gehen knnten) im Rahmen der Evaluation
ganz einfach nicht bercksichtigt werden dr- Die Evaluation kann auch in Form eines Werk-
fen, obwohl der Evaluator dies aus seiner Sicht vertrages erfolgen. Damit wird kein Arbeits-
heraus fr erforderlich hlt. Geschieht dies verhltnis zwischen einer Institution (sog.
trotzdem, zum Beispiel unter Ausnutzung einer Werkvertragsgeber) und dem Evaluator (sog.
nicht zu starken Kontrolle der Evaluationsarbeit Werkvertragsnehmer) begrndet, sondern im
durch den Vorgesetzten und werden dazu auch wechselseitigen Einvernehmen die Erbringung
Mitarbeiter durch den Evaluator motiviert, liegt einer nher zu beschreibenden Leistung fr
eine Verleitung zum Vertragsbruch vor. Auch eine bestimmte Vergtung vereinbart (631,
die Verschwiegenheitspflicht kann Konflikte 63 BGB). ber diese Leistung hinaus knnen
auslsen, zum Beispiel dann, wenn die Auftrag- weitere Vereinbarungen (vgl. Diagramm II/8) ge-
geber der Institution bestimmte Ergebnisse troffen werden.
nicht berichtet oder gar publiziert haben mch-
ten (bei privaten Unternehmen wre dies wohl Der Werkvertrag ist die hufigste rechtliche
im Regelfall vllig unproblematisch, bei ffent- Grundlage fr selbstndig arbeitende Evalua-
lichen Arbeitgebern mit einer anderen Ver- toren. Fr grere Projekte werden diese fr die

Diagramm II/6
Hufige Beschftigungsverhltnisse fr Evaluatoren unter rechtlichen Aspekten
Dienstleistung

zivilrechtlich ffentlich-rechtlich

Dienstvertrag Werkvertrag Auftrag


611 BGB 631 BGB 662 BGB

Selbstndiger unselbstndiger Arbeitnehmer


Grundlagen sozialwissenschaftlich gesttzter Evaluation 49

Diagramm II/7
Der Dienstvertrag

Grundlagen
Der Evaluator ist unselbstndiger Arbeitnehmer einer Institution (z.B. Institut, Beratungsgesell-
schaft etc. ). Mglich ist auch, da er jener Institution angehrt, deren Arbeit zu evaluieren ist
(z.B. Klinik, Schule, Staatsinstitut, Unternehmen )
Aus der Eigenschaft als Arbeitnehmer ergeben sich u. a. folgende Pflichten

Hautpflichten Nebenpflichten

Leistung der versprochenen Dienste Gehorsamspflicht 121 GO.


611 BGB Treuepflicht 242 BGB
Die Arbeitsleistung ist persnlich zu kein Wettbewerb
erfllen
keine Verleitung anderer Arbeitnehmer
Es besteht ein Direktionsrecht durch den zum Vertragsbruch
Arbeitgeber mit Befolgungspflicht des
keine Annahme von Bestechungsgeldern
Arbeitnehmers 315 BGB
Anzeige drohender Schden
Verschwiegenheit

Durchfhrung der anfallenden Arbeiten entwe- werden braucht (zum Beispiel Aushilfsttig-
der selbst als Arbeitgeber Mitarbeiter in ein Ar- keiten, Saisonarbeit).
beitsverhltnis nehmen, oder wiederum nach- Eine flexiblere Gestaltung dieser Arbeitsver-
geordnete Werkvertrge abschlieen. hltnisse erfolgte durch das Beschftigungs-
Ein besonderes Problem kann sich auch aus frderungsgesetz (BeschFG 1985) und den sp-
der Tatsache ergeben, da viele Evaluationsvor- ter aktuellen Bestimmungen, die es leichter
haben zeitlich befristet sind. Binnen eines vor- machen, befristete Vertrge auszustellen.
her festgelegten Zeitraumes mu eine bestimm- Nach Rechtsprechung des BAG knnen auch
te Leistung erbracht werden, danach gibt es mehrere hintereinandergeschaltete befristete
(eventuell weder fr den selbstndigen Eva- Arbeitsvertrge, sog. Kettenarbeitsvertrge, zu-
luator noch fr die von ihm beschftigten Mit- lssig sein. In der Praxis hat sich gezeigt, da je
arbeiter) weitere Auftrge und damit auch kei- fter das Arbeitsverhltnis verlngert wird, um
ne weiteren Einnahmen. Aus diesem Grund so deutlicher wird, da die Befristung sachlich
wird hufig gerade von selbstndig ttigen nicht gerechtfertigt war.
Evaluatoren versucht, nur befristete Arbeitsver- Wurde ein Arbeitnehmer (Evaluator) zu einer
trge mit Mitarbeitern abzuschlieen, wobei ei- ganz bestimmten Aufgabe eingestellt, dies aber
nige rechtliche Besonderheiten zu beachten innerhalb der vereinbarten Frist nicht erledigt
sind. werden konnte, so ist eine neue Befristung zu-
lssig.
Der befristete Arbeitsvertrag Ein anderer Fall liegt vor. wenn vorhersehbar,
Normalerweise sind Arbeitsvertrge unbefristet war, wie lange Zeit die Arbeit in Anspruch neh-
und unterliegen den normalen Kndigungsvor- men wird. Der Arbeitgeber mu bei Ablauf des
schriften. Sie knnen mit Ausnahmen formlos ersten befristeten Arbeitsverhltnisses, wenn er
und mndlich abgeschlossen werden. Der be- sich getuscht hat und den Arbeitnehmer wei-
fristete Arbeitsvertrag stellt ein Arbeitsverhlt- ter beschftigen will, ein den normalen Kn-
nis auf Zeit dar. Dieses Arbeitsverhltnis endet digungsvorschriften unterliegendes Arbeitsver-
durch Zeitablauf, ohne da es gekndigt zu hltnis abschlieen.
50 Grundlagen sozialwissenschaftlich gesttzter Evaluation

Diagramm II/8
Der Werkvertrag

Grundlagen
Eine Institution (Werkvertraggeber) schliet mit einem Evaluator (Werkvertragnehmer) einen
Vertrag.

Bedingungen der Vertragsgestaltung Verfahren bei auftgetretenen Mngeln

konsensmige Vereinbarung zwischen den Haftung des Werkvertragsnehmers


Parteien
Verpflichtung zur Nachbesserung (Neuerstel-
Beschreibung des zu erstellenden Werkes lung oder Beseitung des Fehlers)
(z.B. Herstellung einer Sache, eines Berichtes,
Bei Verzug oder vlliger Zerstrung des Ver-
die Durchfhrung einer Veranstaltung )
trauensverhltnis ist die Mngelbeseitigung
Verpflichtung des Werkvertragnehmers, ein durch Dritte (z.B. anderer Evaluator) auf Ko-
bestimmtes Ergebnis (i.w. Sinn) zu erbringen sten des Werkvertragnehmers mglich
Zusatzvereinbarungen sind mglich, z.B. Die Verpflichtung zur Neuerstellung erlischt
Leistungsmodalitten mit der offiziellen Abnahme des Werkes durch
Vertraulichkeitsregelungen den Wervertraggeber
Folgen von Vertragsverletzungen (z.B. Kon-
ventionalstrafen bei Terminberschreitun-
gen etc.)

Jedes Beschftigungs- bzw. Auftragsverhltnis chend durch Auftrge finanzierenden Instituts)


begrndet naturgem eine gewisse Abhngig- nicht mindestens ebenso groe Einflumg-
keit des Evaluators vom Auftraggeber. Es ist lichkeiten schafft schlielich ist es (besonders
schwer zu sagen, welche Variante in besonde- fr Arbeitgeber des ffentlichen Dienstes) um
rer Weise dazu fhren kann, die Evaluations- vieles leichter, einen neuen Auftrag an einen
ergebnisse im gewnschten Sinne zu beein- Konkurrenten der Partner zu vergeben, als ei-
flussen. Ist der Arbeitgeber selbst gleichzeitig nen unbequemen Mitarbeiter zu kndigen.
der Adressat der Evaluationsergebnisse, hat er Bei den an einem Evaluation betreibenden (So-
natrlich die Mglichkeit, die Verbreitung der zial-) Forschungsinstitut abhngig Beschftig-
Resultate in einem greren Rahmen zu ver- ten kumulieren mglicherweise beide Kompo-
bieten oder bestimmte Gestaltungsvorschlge nenten. Am geringsten ist vielleicht die Gefahr
des Evaluators fr sein Projekt zu untersagen einer unsachgerechten Einflunahme durch
(so hlt sich in manchen Wissenschaftler- den Auftraggeber in den Fllen, in denen
kreisen etwa hartnckig des Gercht, da die Evaluatoren ohne starke finanzielle Abhngig-
unmittelbar der Hierarchie der staatlichen Ad- keit (etwa in Form einer Nebenttigkeit neben
ministration unterstellten Staatsinstitute in einem Hauptamt) arbeiten, doch kann man na-
manchen Flle dazu neigen, ihre Mitarbeiter trlich gerade in diesen Fllen kaum von ei-
daran zu hindern, alles zu publizieren, was nem Berufsfeld Evaluation sprechen.
diese gerne verffentlichen wrden). Dies mag
sein, doch sollte man sich berlegen, ob die Die Ausfhrungen bzw. Zitate in den Diagram-
finanzielle Abhngigkeit eines freiberuflich t- men II/7 und II/8 drfen nur als ein Hinweis auf
tigen Auftragnehmers (oder eines sich entspre- bestehende Regelungen aufgefat werden, sie
Grundlagen sozialwissenschaftlich gesttzter Evaluation 51
gengen in keiner Weise, um sich selbst ein Persnlichkeit, Interessen, Motivation
gerichtsfestes Bild ber die Rechtslage in ei-
nem konkreten Fall zu machen. Sofern der Ar- Viel schwieriger ist es, zu berlegen, ob ein be-
beit- bzw. Auftraggeber dem ffentlichen Dienst stimmter Berufsanfnger auch in dieses Feld ge-
zuzuordnen ist, werden im Normalfall die hen sollte, also ob seine Motivation, sein
Rechtsfragen standardmig und in einer fr Interessensprofil und die persnliche Ent-
beide Seiten halbwegs fairen Weise geregelt. Bei wicklungserwartung besonders gut zu einer sol-
privaten Arbeitgebern und ganz besonders bei chen Ttigkeit pat. Meist wird der sptere be-
der bernahme von Projekten in Form von rufliche Werdegang zu einer Spezialisierung
Werkvertrgen empfiehlt es sich fr den Berufs- auf eine oder einige wenige der typischen Rol-
anfnger dringend, sich durch einen Fachmann len des Evaluators (vgl. Diagramm II/5) fhren,
in den Rechtsfragen beraten zu lassen. Aller- die natrlich jeweils andere berfachliche Kom-
dings sind gerade fr diese Personengruppe die petenzen erfordern. Gemeinsam sind aber zu-
Mglichkeiten, eine fr sie persnlich eher mindest den meisten dieser Entwicklungs-
ungnstige Vertragsregelung zu ndern, relativ mglichkeiten hohe Anforderungen in
beschrnkt, da die Alternative u. U. nur die Ab- folgenden Dimensionen:
lehnung des Arbeitsverhltnisses bzw. des Auf-
trages sein kann. Man sollte aber zumindest
Leistungsmotivation; der Evaluator hat kaum
unmittelbare Macht, und auch seine An-
wissen, welche Sicherheiten, Verpflichtungen
schlumotivation sollte (wegen der Neutrali-
und mglich Folgeprobleme mit einem entspre-
tt gegenber konkurrierenden Gruppen)
chenden Vertragsabschlu verbunden sind.
nicht allzu stark ausgeprgt sein.
Im brigen geben die sehr umfassenden
Schriften des Bundesministers fr Arbeit und
Kommunikationsfhigkeit; dies betrifft sowohl
eine schwer vernderbare persnliche Dispo-
Sozialordnung einen ersten berblick ber die
sition, am Kontakt mit anderen Menschen
verschiedenen Rechtsverhltnisse im Arbeitsle-
Spa zu haben, als auch die Beherrschung
ben (vgl. Halbach u. a., 1987).
entsprechender Gesprchs- und Gruppen-
moderationstechniken.
2.3.3 Persnliche Voraussetzungen Fhigkeit zum role-taking; die gedankliche
bernahme der Welt- und Problemsicht
verschiedenster Gruppen ist oft die Voraus-
Fachliches Knnen
setzung, um eine allen Beteiligten bzw. Be-
troffenen annhernd gerecht werdende Pro-
Am einfachsten lt sich diese Frage fr die
jektplanung durchfhren zu knnen und
erforderlichen fachlichen Kenntnisse eines Be-
(unbewute) Einseitigkeiten, etwa bei der
rufsanfngers klren, der unter der Verantwor-
Auswahl von Bewertungskriterien, zu ver-
tung einer erfahrenen Kraft an Evaluations-
meiden.
projekten mitarbeitet. Im allgemeinen wird es
gengen, wenn
Fr die eigene Lebensplanung sollte man be-
ein abgeschlossenes empirisch orientiertes achten, da besondere Detailkenntnisse oder
psychologisches bzw. sozialwissenschaftli-
die Beherrschung von Techniken (zum Beispiel
ches Studium
bei der Konstruktion von Meinstrumenten,
gute Methodenkenntnisse (auch, aber nicht der Designplanung oder der Datenauswertung)
nur Statistik und EDV)
nur in den ersten Berufsjahren im Mittelpunkt
eine gute Allgemeinbildung im jeweiligen der Evaluationsttigkeit stehen, zumindest im
Evaluationsfeld (etwa Wirtschaft, Schule, Ge-
Allgemeinen.
sundheitswesen etc.)
Mit zunehmender Erfahrung und damit ver-
gegeben sind. Alle jeweils erforderlichen, spezi- bundenem hierarchischen Aufstieg verschiebt
fischen Fachkenntnisse lassen sich, entspre- sich das Anforderungsspektrum eher weg vom
chendes Verstndnis und Untersttzung durch engen fachlichen Bereich hin zu auerfachlichen
den Arbeitgeber vorausgesetzt, on the job er- Kompetenzen wie Strategienentwicklung, Fh-
werben. rung und andere Sozialkompetenzen. Allerdings
52 Grundlagen sozialwissenschaftlich gesttzter Evaluation

gibt es derzeit fr Evaluatoren in dieser Rolle Haushalte; in den USA zeigte sich eine hnliche
kaum berufliche Aufstiegsmglichkeiten, am ehe- Entwicklung). Der Normalfall ist, da Evaluatoren
sten noch durch bernahme der Geschftsfh- in ihrem Karriereverlauf Fhrungspositionen in
rung eines mit Evaluationsprojekten befaten In- Wirtschaft, Verwaltung oder Wissenschaft anstre-
stituts (solche selbstndigen Existenzen oder ben und dem engeren Berufsfeld verlorengehen.
kleinen Institute gab es Anfang der siebziger Jahre Darin liegt einerseits eine Chance fr interessier-
sehr viele, als Folge der massiv zunehmenden Auf- ten Nachwuchs durch das Freiwerden entspre-
trge der ffentlichen Hand fr Evaluations- chender Positionen, andererseits ein nicht uner-
vorhaben, die meisten davon berlebten aber heblicher Verlust an gewonnener Erfahrung und
nicht die Konsolidierungsphase der ffentlichen berufsfeldspezifischer Kompetenz.

bersicht Kapitel 2:
Grundlagen sozialwissenschaftlich gesttzter Evaluation

Voraussetzungen fr Evaluationsprojekte
Ziele, die mit psychologischen oder Nutzen des Evaluationsprojektes Vorhandensein von Evaluatoren
sozialwissenschaftlichen mu erwartete Kosten bersteigen und anderen notwendigen
Evaluationsmethoden erreicht Ressourcen
werden knnen

2.1
Zielsetzungen bei Evaluationsvorhaben
Grundlagen der Akzeptanz von Evaluation
Psychologische Voraussetzungen fr die Entwicklung von Evaluation

Akzeptanz der Vernderbarkeit Bereitschaft, sich zu Zwecken der Bereitschaft der Entscheidungs-
relevanter gesellschaftlicher Verbesserung des bestehenden trger zur Akzeptanz von Fakten
Strukturen u. Gestaltung gesell- Verhaltens (Hoffen auf Erfolg)
schaftlicher Verhltnisse unter dem Risiko des Scheiterns (Furcht Mgliche Nutzenerwartungendes
rationalen Optimierungsaspekten vor Mierfolg) auszusetzen Auftraggebers
Bewertung ohne detaillierte
Einteilung der Evaluationsformen Zielsetzung
nach Verantwortungsdelegation
Rahmenbedingungen Durchsetzungs-/Entscheidungs-
Grundstzliche Zielorientierung hilfe
Zeitperspektive Optimierungsgrundlage
Nutzenberlegung
Bearbeitungsformen
Erfahrungsaufbereitung
Grundlagen sozialwissenschaftlich gesttzter Evaluation 53
2.2
Wissenschaft als mgliche Grundlage von Evaluation
Grundvoraussetzungen

Bereitschaft, an praxisorientierten Wissenschaftlicher Beitrag mu Wissenschaftliche Evaluation sollte


Evaluationen teilzuhaben mehr Nutzen als Kosten bringen den nicht-wissenschaftlichen
Alternativen berlegen sein

Evaluation als besondere Form des Entscheidungsorientierte Forschung Schlufolgeorientierte Forschung


wissenschaftlich-empirischen = =
Arbeitens Evaluation Wissenschaftliche Forschung

Konsequenz
Rollenverstndnis des Evaluators steht teilweise im Widerspruch zu den
Ansprchen der Wissenschaftlichen Forschung

Wissenschaft als Basis und Hilfe fr die Evaluationsarbeit

Potentielle Sachbeitrge der Zusatznutzen wissenschaftlicher


Wissenschaft Evaluation
Psychologische u. sozialwissen- Neutralitt der Wissenschaft
schaftliche Theorien, Methoden, Fachbergreifende Kompetenzzu-
Interventionstechniken schreibung, weitgehende Explikati-
Vertrautheit mit wissenschaftlichen on von Begrndungen, Aufwertung
Paradigmen von Projekten

Mgliche Alternativen zu Qualittsmanagement als Evaluation


wissenschaftsgesttzter Evaluation mit Wurzel aus der industriellen
Verzicht auf Evaluation Produktion
Legalistische Position Zielsetzung der beiden Formen
Nicht-sozialwissenschaftliche identisch siehe DIN EN ISO 9000ff.
Evaluation

2.3
Verfgbarkeit von Evaluatoren
Problem
Groer potentieller Bedarf an Evaluatoren sowie an Aus- und Weiterbildungsprogrammen konnte bisher
noch nicht gedeckt werden

Rollenvielfalt des Evaluators ergibt sich aus dem Rechtliche Rahmenbedingungen


groen Aufgabenfeld vgl. Diagr. II/5 Hufige Beschftigungsverhltnisse bei
Rollenkonflikte entstehen aus den zum Teil Evaluatoren siehe Diagr. II/6
kontrren Anforderungen

Persnliche Voraussetzungen
abgeschlossenes empirisch-sozialwissenschaftliches Studium
gute Methodenkenntnisse
gute Allgemeinbildung im jeweiligen Evaluationsfeld
hohe Leistungsmotivation und Kommunikationsbereitschaft
Fhigkeit zum Role-Taking
soziale Kompetenz
Strategieentwicklung
Fhrungsfhigkeit
55

3. Einsatzgebiete psychologischer
Evaluation

Im vorangehenden Kapitel wurden einige wichti- 3.1 Gestaltungsaspekte von


ge Grundlagen sozialwissenschaftlich gesttzter Evaluationsstudien
Evaluation erlutert. Im folgenden sollen die prak-
tischen Aspekte der Evaluationsforschung be- Ebenso wie bei dem Versuch einer allumfassen-
leuchtet werden. Zu diesem Zweck werden die den Definition des Begriffs Evaluation (vgl.
Einsatzgebiete und Probleme der Evaluationsfor- Abschnitte 1.1 bzw. 2.1.1) wird man auch bei
schung am Beispiel konkreter Projekte dargestellt. der Erstellung eines idealtypischen Klassifika-
Im ersten Abschnitt des Kapitels werden zu- tionsrasters zur Unterscheidung von unter-
nchst einige Einteilungsgesichtspunkte fr schiedlich gestalteten Evaluationsstudien kei-
Evaluationsstudien diskutiert und am Beispiel nen Erfolg haben. Die Heterogenitt ist gerade
verschiedener praktischer Arbeiten verdeut- im Bereich der Evaluation auerordentlich
licht. Aus der Flle mglicher Differenzierungs- gro.
merkmale fr Evaluationsstudien wird bereits Statt dessen kann man jedoch versuchen,
der interdisziplinre Charakter der Evaluation Aspekte zu erarbeiten, die eine erste grobe Be-
deutlich. Ziel des zweiten Abschnitts ist es, die- schreibung von Projekten erlauben. Wichtige
sen Aspekt weiter auszuarbeiten. Ein Vergleich Gesichtspunkte siehe Diagramm III/1.
des Entwicklungsstandes der Evaluationsfor- Diese die Arbeit in Evaluationstudien steu-
schung zwischen den USA und der BRD bringt ernden Einteilungsgesichtspunkte werden im
einige zustzliche interessante Aspekte in die- folgenden genauer erlutert.
sem Zusammenhang mit sich.
Trotz des fachbergreifenden Einsatzes der
Evaluation sind durchaus strukturelle Gemein- 3.1.1 Evaluationsziele
samkeiten der meisten Evaluationsprojekte er-
kennbar. Diese gemeinsamen Elemente werden In der Regel ist der in der Wissenschaft ttige
abschlieend herausgestellt. Psychologe bzw. Sozialwissenschaftler daran ge-
Im dritten Abschnitt soll die ausfhrliche Dar- whnt, die Ziele seiner Forschungsarbeiten
stellung jeweils eines Projektes aus den Berei- selbst zu bestimmen.
chen: Als wesentlicher Aspekt bei der Definition des
Begriffes Evaluation wurde zu Anfang die Be-
Wirtschaft wertung von Handlungsalternativen herausge-
Schul- und Bildungswesen stellt, die auf eine konkrete Verbesserung des
Strafvollzug Handelns abzielt. Eine solche Bewertung kann
nie losgelst von den eigentlich Betroffenen,
den Einblick in die Anwendungsbereiche und nur nach wissenschaftsorientierten Kriterien
Probleme der Evaluationsforschung vertiefen. stattfinden. Da der Evaluator gewhnlich die
Die Basis fr die Darstellung der Studien bilden Rolle des Auftragnehmers bernimmt, sind ins-
dabei die im vorhergehenden Abschnitt expli- besondere auch die Vorstellungen und Interes-
zierten strukturellen Gemeinsamkeiten von sen des Auftraggebers zu beachten (vgl. Ab-
Evaluationsstudien. schnitt 2.1).
56 Einsatzgebiete psychologischer Evaluation

Diagramm III/1
Wichtige Aspekte von Evaluationsstudien

Evaluationsziel(e): Warum wird evaluiert?

Evaluationsbereich(e): In welchem gesellschaftlichen Bereich wird evaluiert?

Evaluationsobjekt(e): Wer/was wird evaluiert?

Evaluationsort(e): Wo wird evaluiert?

Evaluationsmodell(e): Wie wird evaluiert?

Evaluationsnutzung: Wie werden die Ergebnisse aufbereitet und entscheidungsrelevant


verwendet?

Dies bedeutet fr den Evaluator, da er die werden. Dazu kann man sich einer Reihe von
zugrunde liegenden Ziele des Projektes erst zu- Zielbildungs- und Konsensfindungstechniken
sammen mit dem Auftraggeber erarbeiten mu. bedienen, die im vierten Kapitel ausfhrlich
In den seltensten Fllen kann man dabei von beschrieben werden. Der Einflu der Macht-
expliziten Zielstrukturen des Auftraggebers aus- strukturen innerhalb der Betroffenengruppe ist
gehen. Auch ist grundstzlich damit zu rech- dabei als Problem nicht auszuklammern. Ge-
nen, da dem Evaluator nicht alle wirklich re- rade hier wird deutlich, da Evaluation eben
levanten Ziele mitgeteilt werden. Oft werden nicht (nur) in der Anwendung von Wissen-
Interessen und Vorstellungen mit in die Ziel- schaft und Datenverarbeitungstechniken be-
struktur des Auftraggebers eingehen, die dieser steht, sondern auch erhebliche sozialtechnische
dem Evaluator zumindest zunchst nicht mit- Kompetenzen erfordert. Ntzlich fr das gezielte
teilen mchte, aber trotzdem erwartet, da sich Nachfragen nach den eigentlichen Evaluations-
Antworten darauf in den Ergebnissen finden. zielen knnen die im Abschnitt 2.1.2 dargeleg-
Diese unzureichende Zielklrung findet sich ten allgemeinen Zielsetzungen (zum Beispiel
nicht nur bei typisch affirmativ gewollten Stu- Verantwortungsdelegation, Entscheidungshilfe,
dien, sondern auch bei tabuisierten Bereichen berprfung der Erreichung vereinbarter Ziele)
(etwa Konflikte innerhalb der auftraggebenden sein. Oft zeigen sich auch unvollstndige Ziel-
Institution, starke Heterogenitt der Ziele selbst klrungen in der berraschenden Ablehnung
innerhalb eines Auftragsverantwortlichen und von Projektdetails, die fr das zunchst an-
die Vernderung der Ziele ber die Zeit als Fol- genommene Ziel adquat sind, aber eben nicht
ge wechselnder uerer Bedingungen. die eigentlichen Ziele erreichen wrden (zum
Beispiel Vorschlge fr die zu erhebenden em-
Da gewhnlich mehrere Personengruppen von pirischen Indikatoren, fr die Berichtlegung,
den Ergebnissen einer Evaluationsstudie betrof- Vertraulichkeitsregelungen etc.)
fen sind existieren zwischen diesen oft unter- Ein ebenso groes Problem wie die Heteroge-
schiedliche, zum Teil sogar einander widerspre- nitt der Zielstrukturen liegt in der mglichen
chende Ziele. Diagramm III/2 gibt beispielhaft fr Vernderung anfangs vorgegebener Ziele. Sind
die Evaluation der betrieblichen Weiterbildung solche Entwicklungen abschtzbar, wird der
unterschiedliche Betroffenengruppen und ihre Evaluator sich vor solchen pltzlichen Vern-
mglichen Motive einer Erfolgskontrolle an. derung durch ein gutes, flexibles Repertoire an
Evaluationstechniken und durch Bildung von
Die verschiedenen Zielbndel mssen soweit Szenarien zu Anfang seiner Untersuchung
wie mglich in bereinstimmung gebracht schtzen knnen (vgl. Abschnitt 4.1.3).
Einsatzgebiete psychologischer Evaluation 57

Diagramm III/2
Betroffenengruppen bei der Evaluation betrieblicher Weiterbildungsmanahmen, ihre
Ziele und Motive fr eine Erfolgskontrolle (Beispiele)

Seminarteilnehmer Trainer
Lernerfolgsnachweis Lehrerfolgsnachweis
Karrierefrderung Bildungsbedarfshinweis
Individuelles Feed-back Feed-back durch Teilnehmer
Lernmotivation Ressourcen-Gewinnung

Vorgesetzte Unternehmensleitung
Berichterstattung ber persnliche Eindrcke Beurteilung des Trainers
Entscheidungshilfen bei Personalfragen Beurteilung der Teilnehmer
Beurteilung der Trainingsaktivitten Ressourcen-Bemessung
Rechenschaftslegung
Effizienz-Nachweis

Die nachtrgliche Analyse der echten Ziele Familien- und Sozialpolitik


von Evaluationsstudien auf der Basis publizier- Justizvollzug
ter Unterlagen fllt oft schwer, da bei der Arbeitsmarkt- und Beschftigungspolitik
Berichterstattung die Darstellung einer erst all- Umweltpolitik
mhlich entwickelten oder gegenber der Aus- Gesundheitswesen
gangslage genderten Zielsetzung hufig unter- Stdtebau- und Wohnungspolitik
bleibt. Meistens ist daher fr den Leser im Militrischer Bereich
nachhinein nur eine Spekulation ber die ver-
mutlichen Ziele mglich. Diagramm III/3 gibt fr jeden der hier genannten
Bereiche ein Beispiel einer empirischen Eva-
luationsstudie aus dem deutschsprachigen
3.1.2 Evaluationsbereich Raum an.

Nach Feststellung der Ziele wird die konkrete Hinzuweisen ist vor allem auf die umfassenden
Projektarbeit wesentlich durch das Praxisfeld, Diskussionen im Bildungssektor. Nach Hell-
in dem die Evaluation stattfinden soll, be- stern und Wollmann (1984, S. 36) hat die Bund-
stimmt. Je nach Bereich gelten andere Spielre- Lnder-Kommission fr Bildungsplanung und
geln, Arbeitsmglichkeiten und rechtliche Rah- Forschungsfrderung (BLK) ber 800 Evaluie-
menbedingungen. rungsstudien und Begleitforschungsvorhaben
Die Evaluationsforschung hat mittlerweile untersttzt. Besonders bekannt geworden sind
Einzug in viele gesellschaftliche Bereiche gehal- die Diskussionen um den Vergleich des Gesamt-
ten, was sicher damit zusammenhngt, da ein schulwesens mit dem traditionellen, dreiglied-
wachsendes Bedrfnis besteht, rational vertret- rigen Schulsystem.
bare Grundlagen fr Urteile und Entscheidun- Die Reformprogramme im pdagogischen Be-
gen zu erhalten. Die reichhaltigsten, vielleicht reich drften fr die Entwicklung der Evalua-
auch umfassendsten Diskussionen innerhalb tionsforschung im deutschen Raum eine hn-
der Evaluationsforschung erfolgten dabei in fol- lich bahnbrechende Funktion gehabt haben,
genden Bereichen (vgl. Hellstern und Woll- wie die sozialpolitischen Reformprogramme in
mann, 1984, Lange, 1983): den USA whrend der sechziger Jahre.
Weniger im Licht der ffentlichkeit stehend,
Bildungssektor aber mit einer lngeren Vorgeschichte behaftet
Wirtschaft sind Evaluationsvorhaben im Wirtschafts- und
Agrar- und Verkehrspolitik Militrbereich. Gerade hier haben sich durch
58 Einsatzgebiete psychologischer Evaluation

Diagramm III/3
Beispiele empirischer Evaluationsstudien aus den unterschiedlichsten Anwendungs-
gebieten

Anwendungsgebiet Studie

Bildungssektor Seiffge-Krenke, 1981


Handbuch Psychologieunterricht Bd. 1 u. 2
Entwicklung und Erprobung eines Psychologiecurriculums
Wirtschaft Luckie, 1987
Evaluation innerbetrieblicher Trainerprogramme
Agrar- und Verkehrspolitik Echterhoff, 1981
Erfolgskontrolle zur Verhaltensbeeinflussung von Ver-
kehrsteilnehmern: Grundlagen und Empfehlungen
Halbach, 1972
Theorie und Praxis der Evaluation von Projekten in Ent-
wicklungslndern aus den Bereichen Land- und Forst-
wirtschaft, Fischerei und Bergbau
Familien- und Sozialpolitik Frassine, 1980
Evaluation von Modellen auf Klientenebene
Justizvollzug Waxweiler, 1980
Psychotherapie im Strafvollzug. Eine Empirische Erfolgs-
untersuchung am Beispiel der sozialtherapeutischen Ab-
teilung einer Justizvollzugsanstalt
Ortmann, 1990
Zum Resozialisierungseffekt der Sozialtherapie anhand
einer experimentellen Lngsschnittstudie zu Justizvoll-
zugsanstalten des Landes NRW
Arbeitsmarkt und C. Offe & K. Hinrichs, 1977
Beschftigungspolitik Untersuchung einzelner Beschftigungsgruppen hin-
sichtlich Ausma und Dauer der Arbeitslosigkeit
Umweltpolitik Umweltbundesamt, 1980
Einflu von Verkehrslrm auf die Gehrerholung wh-
rend der Freizeit
Gesundheitswesen Wittmann, 1979
Mglichkeit der Evaluationsforschung im Rahmen des
Verbandes Deutscher Rentenversicherungstrger, darge-
stellt an einem empirischen Projekt zur Diagnostik und
Schweregradeinteilung bei chronischen nichtspezi-
fischen Atemwegserkrankungen (CNSRD)
Stdtebau- und Wohnungspolitik Amt fr Statistik und Stdteforschung der Stadt Bochum,
Das rumliche Ordnungskonzept Bochums. Evaluation
der Siedlungsentwicklung in Verdichtungsgebieten
Militrischer Bereich Rausch, 1985
Vergleichende Betrachtungen psychologischer Arbeits-
analyseverfahren vor dem Hintergrund ihrer Anwend-
barkeit zur Untersuchung komplexer militrischer
Mensch-Maschinen-Systeme
Einsatzgebiete psychologischer Evaluation 59
intensive Bemhungen die effektivsten Formen 3.1.3 Evaluationsobjekt
der Erfolgs- und Wirkungskontrolle entwickelt
(vgl. Stufflebeam, 1972). Diese Formen der Eva- Das Evaluationsobjekt ist jeweils als Oberbegriff
luation wurden schnell und mit groem Auf- fr die zu bewertenden Alternativen zu sehen
wand entwickelt, da ein groes Bedrfnis nach (s. Diagramm III/4). Grundstzlich sind mehrere,
rational begrndeten Entscheidungen bestand. verschiedene Gruppen von Evaluationsobjek-
ten denkbar:
hnlich starke Aktivitten sind derzeit leider in
keinem der anderen genannten Bereiche er-
Personen
kennbar, obwohl auch dort hnlich weit-
Umwelt-/Umgebungsfaktoren
reichende Konsequenzen bei gleichem Evalua-
Produkte
tionsaufwand zu erwarten wren; man denke
Techniken/Methoden
etwa an Bemhungen zur Verbesserungen im
Zielvorgaben
Umweltschutz oder im Gesundheitswesen. Hier
Programme
wren ebenso effektive Kontrollmethoden wie
Projekte
im Militr- und Wirtschaftsbereich uerst
Systeme/Strukturen
wnschenswert.
Forschungsergebnisse/Evaluationsstudien

Fr den in verschiedenen Bereichen ttigen Diagramm III/5 gibt fr jede der genannten Grup-
Evaluator stellt sich das Problem, insbesondere pen ein Beispiel eines konkreten Evaluations-
die rechtlichen Bedingungen wenigstens unge- projektes aus dem deutschsprachigen Raum an.
fhr zu kennen. So erfordert etwa die Arbeit in
Schulen besondere Genehmigungen des zu- Eine wichtige Unterscheidung innerhalb der
stndigen Ministeriums, in Betrieben sind die Gruppe Personen als Evaluationsobjekt ist
Mitbestimmungsrechte des Betriebsrates mit noch in der Beantwortung der Frage zu sehen,
grter Sorgfalt schon im Vorfeld zu beachten, ob sich die Evaluation auf Einzelpersonen, oder
und im Gesundheitswesen kann es eine wich- aber auf ganze Personengruppen bezieht. Diese
tige Frage sein, welche Variablen an Patienten Differenzierung drfte vor allem fr den kli-
nur von rzten (bzw. unter deren unmittelba- nisch-therapeutischen Bereich, insbesondere fr
rer Aufsicht) erhoben werden drfen. Neben die Diskussion im Zusammenhang mit Einzel-
diesen Aspekten spielt auch die emotionale fallanalysen, von Bedeutung sein (vgl. Bommert
Passung des Evaluators eine erfolgsentschei- & Petermann, 1982; Petermann & Henl, 1979).
dende Rolle. Ein Untersucher, der in einer
Schule in freier Trgerschaft und besonders Fr die Gestaltung der Projektarbeit ist zu un-
fortschrittlichem pdagogischem Konzept her- terscheiden, was die eigentlichen Evalua-
vorragende Akzeptanz findet, hat u. U. Pro- tionsobjekte sind, also jene Einheiten, die wirk-
bleme, auch mit traditionell eingestellten lich bewertet (evaluiert) werden sollen, und
Kulturbrokraten eine gute emotionale Ge- welche anderen Objekte nur als Hilfsmittel,
sprchsgrundlage zu finden, und ein berzeug- sozusagen als Datentrger, untersucht werden.
ter Gegner der Bundeswehr ist vielleicht nicht So ist etwa die Bewertung der vier Techniken zu
der optimale Gesprchspartner fr die Ausar- Verbesserung der Lese- und Mathematik-
beitung der Details eines Auftrages im militri- leistungen (die eigentlichen Evaluationsobjek-
schen Bereich. Fr den Berufsanfnger ist schon te) in der von Levin et. al., 1986, genannten
viel gewonnen, wenn er sich der Heterogenitt Untersuchung zwangslufig mit einer Erhe-
der Verhaltenserwartungen in den unterschied- bung der Leistungen bestimmter Schler ver-
lichen Feldern bewut wird und ein Sensorium bunden. Die Schlerdaten werden aber nicht
dafr entwickelt, welche Verhaltensweisen an- mit dem Ziel einer personenbezogenen Bewer-
gemessen bzw. erfolgsbeeintrchtigend sind. Im tung erhoben (und verrechnet!), da es in die-
brigen sollte niemand in einem Feld arbeiten, sem Projekt berhaupt nicht darauf ankommt,
auch nicht als Evaluator, da seinen persnli- ob Schler A oder B bessere Ergebnisse erzielte.
chen Werthaltungen nach stark negativ einge- Die klare Trennung zwischen Evaluations-
schtzt wird. objekt und Datentrger kann, bei passender
60 Einsatzgebiete psychologischer Evaluation

Diagramm III/4
Gruppen von Evaluationsprojekten

Personen Umwelt-/Umgebungsfaktoren
(Verhalten, Leistung, Fhigkeiten,
Einstellungen etc.)
Lernerfolg der Teilnehmer eines Weiter- Wirkung von Straenlrm auf den ncht-
bildungsseminars, Verhaltensnderungen von lichen Ruheschlaf, Wirkungen bestimmter
Rauchern nach einer Anti-Raucher-Kampagne architektonischer Strukturen auf das subjek-
tive Wohlbefinden

Produkte Techniken und Methoden


Wirkung verschiedener Psychopharmaka auf Vergleich verschiedener Lesetechniken hin-
die psychische Gesundheit, Vergleich der Ver- sichtlich der Lesegeschwindigkeit, Vergleich
kaufswirksamkeit verschiedener Krperpflege- verschiedener Prsentationstechniken im Hin-
linien blick auf die Behaltensleistung des Auditori-
ums

Zielvorgaben Projekte/Programme
Auswirkungen der Konzentration der Lehr- Wirksamkeit einer Aufklrungskampagne zu
ziele auf soziales Lernen und/oder fachliches Aids, Auswirkungen eines psychotherapeu-
Lernen, Auswirkungen der Betriebsziele Mit- tischen Behandlungsprogramms im Strafvoll-
arbeiterorientierter Fhrungsstil versus Auf- zug
gabenorientierter Fhrungsstil auf das
Arbeits- und Betriebsklima

Systeme/Strukturen Forschungsergebnisse/Evaluationsstudien
Vergleich von Privathochschulen versus staat- Bewertung der methodischen Vorgehenswei-
lichen Hochschulen im Hinblick auf die be- se in einer Evaluationsstudie, Zusammenfas-
rufliche Qualifikation, Wirkung einer flachen sende Bewertung der Forschungsergebnisse
versus einer steilen Hierarchiestruktur in ei- auf einem bestimmten Fachgebiet (Meta-Eva-
nem Unternehmen auf den Kontrollspielraum luation, vgl. Abs. 2.1.3)
der Mitarbeiter

Darstellung, gelegentlich zur berwindung von tionsprojektes zur Klrung der Frage der Ver-
Bedenken bei Zustimmungen (hier zum Bei- allgemeinerbarkeit bzw. der sachgerechten
spiel der Eltern) ntzlich sein. Indikationsstellung (Wer soll welche Vorge-
Eine weitere Gruppe von Objekten hngt hensweise whlen?) erhoben werden. Entsteht
mit Erhebungen zusammen, die fr die Ein- dabei aber der Eindruck, da die im Feld han-
schtzung der Evaluationsergebnisse wichtig delnden Personen, und nicht die Techniken,
sind, aber weder Datentrger sind noch selbst bewertet werden, ergeben sich leicht Wider-
bewertet werden sollen. stnde oder Ergebnisverzerrungen (so kann sich
So kann etwa der Einflu verschiedener zum Beispiel ein Lehrer, der sich indirekt
Lehrerpersnlichkeiten fr den relativen Erfolg evaluiert fhlt, trotz einer nicht gnstigen
von Didaktikformen (oder die Therapeuten- technischen Vorgabe fr seinen Unterrichts so
persnlichkeit fr die Resultate therapeutischer anstrengen, da aber nur fr die Unter-
Techniken) von entscheidender Bedeutung suchungssituation! Mngel der didaktischen
sein, und mu daher im Rahmen des Evalua- Konzeption berdeckt werden).
Einsatzgebiete psychologischer Evaluation 61

Diagramm III/5
Beispiele fr Evaluationsobjekte in konkreten Evaluationsstudien

Studie Evaluationsobjekt

Berthold, Gebert, Rehmann, von Rosenstil, 1980 Personen: Teilnehmer der Weiterbildungs-
Schulung von Fhrungskrften eine empi- seminare wurden hinsichtlich einer Verhal-
rische Untersuchung ber Bedingungen und tensvernderung whrend und nach den Se-
Effizienz minaren bewertet
Scharnberg, Whler, Fink, Guski, 1982 Umgebungsfaktoren: Wirkung von Straenlrm
Beeintrchtigung des Nachtschlafes durch auf den Nachtschlaf wurde in mehreren Stra-
Lrm en einer Grostadt (Berlin) bewertet

Witt, 1985 Produkt: Bewertung des Images von No-name


No-name Produkte und Anbieterpolitik im Produkten durch den potentiellen Verbrau-
Spiegel einer empirischen Analyse des Ver- cher
braucherverhaltens
Levin, Glass, Meister, 1986 Techniken/Methoden: Vergleich von vier ver-
Different Approaches to Improving Perform- schiedenen Techniken zur Verbesserung der
ance at School: A Coast-Effectiveness Com- Mathematik- und Leseleistung von Grund-
parison schlern
Seiffge-Krenke, 1981 Zielvorgaben: Entwicklung und Erprobung
Handbuch Psychologieunterricht neuer Lehr- und Lernziele fr den Psycho-
logieunterricht in der Sekundarstufe II in
Form eines Psychologiecurriculums
Waxweiler, 1980 Projekte/Programme: Untersuchung der Wir-
Psychotherapie im Strafvollzug. Eine empiri- kung einer psychotherapeutischen Behand-
sche Erfolgsuntersuchung am Beispiel der lung auf Straffllige in einer Justizvollzugs-
sozialtherapeutischen Abteilung einer Justiz- anstalt
vollzugsanstalt
Ortmann, 1990 Untersuchung der Wirkung der Sozialthera-
Zum Resozialisierungseffekt der Sozialtherapie pie auf das Legalverhalten
anhand einer experimentellen Lngsschnitt-
studie zu Justizvollzugsanstalten des Landes
NRW
Haenisch, Lukesch, Klaghofer, Krger-Haenisch, Systeme/Strukturen: Vergleich der Schulleistun-
1979 gen von Schlern des traditionellen und des
Gesamtschule und dreigliedriges Schulsystem Gesamtschulwesens in ausgewhlten Fchern
in NRW. Schulleistungsvergleich in Deutsch,
Mathematik, Englisch und Physik
Matt, 1982 Forschungsergebnisse/Evaluationen: In den Stu-
Meta-Analyse deutschsprachiger Psychothera- dien wurden Psychotherapieeffektstudien ei-
pieeffektforschung der Jahre 19711982 ner bewhrten Meta-Analyse unterzogen
Grawe, Donati, Bernauer, 1995
Meta-Analyse zur Psychotherapieeffektfor-
schung
62 Einsatzgebiete psychologischer Evaluation

Hier wird ein methodisches Problem deut- sie), kann das Setting als annhernd natr-
lich, da besonderer Bercksichtigung bedarf: lich gelten.
Die mgliche Konfundierung von Effekten. Bei
der Designerstellung und der anschlieenden Das Wissen der Probanden darber, da
Auswertung sollten deshalb ausreichende Ma- eine Untersuchung stattfindet, welche Hy-
nahmen zur Verhinderung von Effektkonfun- pothese der Untersuchung zugrunde liegt
dierungen getroffen werden, soweit dies im Feld und durch Tuschung herbeigefhrte falsche
tatschlich mglich ist (s. dazu 5.2). Vermutungen ber die Hypothese, spielen
ebenfalls eine Rolle.

3.1.4 Ort der Evaluierung Das Labor wird meist synonym mit grerer
Kontrollierbarkeit, weniger Strvariablen und
Betrachtet man das Spektrum mglicher Eva- grerer innerer Validitt zusammengebracht.
luationsobjekte, wird bereits deutlich, da eine Die bergnge zwischen Labor und Feld sind
Evaluation prinzipiell an den verschiedensten oft flieend. Die erluterten Eigenschaften von
Orten durchfhrbar ist. Labor und Feld sind auch durchaus nicht zwin-
So knnte etwa die Kontrolle des Lernerfolges gend an den Ort als solchen gebunden, hngen
der Teilnehmer eines Weiterbildungsseminares jedoch stark mit ihm zusammen, was eine
durch einen Fragebogen am Ende des Semina- Rechtfertigung der Unterteilung in Feld- und
res im Schulungsraum des Betriebes durch- Laborforschung zult. Im sozialwissenschaft-
gefhrt werden, die Messung von Straenlrm lichen Bereich berwiegen feldnahe Studien,
knnte durch ein Schallpegelmegert in auch alle im Diagramm III/5 gehren dazu. Ein
den Wohnrumen der Betroffenen erfolgen, die Beispiel fr eine strker an den Prinzipien der
Wirksamkeit einer Aufklrungskampagne Laborforschung orientierten Arbeit im pdago-
knnte durch eine Befragung in der Fugnger- gischen Bereich gibt Thiele (1981).
zone einer Innenstadt getestet werden, die Wir- Beide Untersuchungsarten bringen spezifi-
kung eines Psychopharmakons wird man dage- sche Probleme mit sich, wie sie vor allem aus der
gen wohl eher im Labor berprfen. generellen Diskussion um Labor- bzw. Feldfor-
Grundstzlich kann man die Evaluation im schung bekannt sind. Weiterfhrende Literatur
Labor und im Feld unterscheiden, wobei die im Zusammenhang mit Evaluationsfragestel-
erste Mglichkeit sicher die weniger praktizier- lungen geben Gniech (1976) und Patry (1982).
te darstellt. Nach Patry (1982, S. 18ff.) sind fol-
gende vier Grundprinzipien der Feld-Definition
von Bedeutung: 3.1.5. Evaluationsmodell
Das Verhalten (abhngige Variable) kann Die Vielzahl der Varianten von Evaluationen
mehr oder weniger natrlich sein. Unter na-
hat dazu gefhrt, da je nach Schwerpunkt der
trlichem Verhalten wird dabei jenes Verhal-
Zielsetzung und Realisationsmglichkeiten unter-
ten verstanden, das in keiner Weise instru-
schiedliche Evaluationskonzepte, sogenannte
iert wurde.
Evaluationsmodelle entwickelt wurden. Glass
und Ellet (1980) schtzen, da es mehr als 20
Das Treatment (unabhngige Variable) solcher Anstze und Modelle in der Literatur
kann mehr oder weniger natrlich sein, je
gibt. Nach eigenen Schtzungen drfte diese
nachdem wie stark durch den Versuchsleiter
Zahl inzwischen noch weit hher liegen.
manipuliert wird
Die unterschiedlichen Modelle lassen sich vor
Das Setting (Ort der Untersuchung) kann allem nach
mehr oder weniger natrlich sein. Dabei ent-
scheidet die subjektive Wahrnehmung der Entscheidungssituation,
Probanden darber, ob ein Setting natrlich Entscheidungsbedingungen,
ist oder nicht. Bemerken die Probanden ein- Art der verwendeten Instrumente und Ver-
gefhrten nderungen nicht (oder vergessen fahren,
Einsatzgebiete psychologischer Evaluation 63
Ausma der Przision bei der Sammlung und Manchmal werden summative und formative
Analyse von Informationen, Evaluation gleichzeitig durchgefhrt. Dies ist
methodischen Fhigkeiten der Evaluatoren zweckmig, wenn ein Projekt von der Pla-
und ihrer Adressaten nung- bis zur Transferphase begleitet werden
kann (vgl. etwa Seiffge-Krenke, 1981).
unterscheiden (vgl. Stufflebeam, 1972, S. 125).
Diagramm III/6 stellt die formative und die
summative Evaluation mit ihren wesentlich-
Vielfach sind diese Modelle im Bereich der pd- sten Kennzeichen vergleichend gegenber.
agogischen Psychologie und in den Sozialwis-
senschaften entstanden. Einige Anstze wurden
bereits im zweiten Kapitel (vgl. Diagramm II/3) 3.1.6. Evaluationsnutzung
dargelegt. Weitere bersichten, die die meisten
Modelle in der Evaluationsforschung einander Fr die Gestaltung des Evaluationsprojektes ist
gegenberstellen, finden sich etwa bei Worthen es auch entscheidend zu wissen, in welcher
und Sanders (1973), Glass und Ellet (1980) so- Weise die Ergebnisse in praktisches Handeln
wie Hermann et al. (1988). umgesetzt werden sollen. In der Praxis treten
dabei vor allem folgende Varianten auf:
Innerhalb der zahlreichen unterschiedlichen
Modellanstze drfte fr die Projektgestaltung Die Ergebnisse erfhrt nur der fr die evalu-
vor allem Scrivens Unterscheidung zwischen ierte Handlung Verantwortliche, und es
formativer und summativer Evaluation die bleibt in seinem Ermessen, wie er diese zur
grte Bedeutung haben. Optimierung seines eigenen Verhaltens her-
Die formative Evaluation stellt vor allem In- anzieht (hier liegt dann in gewissem Sinne
formationen fr noch in der Vorbereitungs- eine, wenn auch eventuell mit fremder Hilfe
oder Implementierungsphase befindliche, oder erarbeitete, geschlossene Selbstevaluation
laufende Programme bereit, die verbessert wer- vor).
den sollen. Beispiel: Das Fhrungsverhalten des Vorge-
Ein Beispiel fr eine formative Evaluation setzten wird anhand einer Befragung seiner
gibt etwa die bereits erwhnte Studie von unmittelbar unterstellten Mitarbeiter evalu-
Seiffge-Krenke (1981): Bei der Entwicklung und iert, die Ergebnisse aber nur dem Vorgesetz-
Implementierung eines neuen Psychologie- ten selbst mitgeteilt.
curriculums wurde sinnvollerweise eine forma- Die Entscheidung bleibt voll im Ermessen
tive Evaluation zur stndigen Verbesserung des des evaluierten Verantwortlichen, die Ergeb-
Curriculums durchgefhrt. nisse werden aber offengelegt; daraus ergibt
Eine summative Evaluation dagegen soll die sich ein hherer Druck auf Verhaltensn-
Qualitt und den Einflu bereits stattgefunde- derung, gegebenenfalls aber auch eine ver-
ner Programme feststellen und abschlieend strkte Tendenz zur kognitiven Abwehr der
bewerten. Sie ist dann sinnvoll, wenn mehrere Evaluationsergebnisse.
disjunkte Handlungsformen vorliegen, deren Beispiel: Die Lehrveranstaltungen von Do-
Konsequenzen miteinander verglichen und so zenten werden von den Studenten anhand
bewertet werden knnen. eines Fragebogens bewertet, die Nutzung der
Ein Beispiel fr eine summative Evaluation Ergebnisse bleibt in der Eigenverantwortung
stellt die erwhnte Untersuchung von Levin et des Dozenten, werden aber zur Information
al. (1986) dar: Als Entscheidungshilfe bei der der Fakultt am schwarzen Brett ausgehngt.
Wahl geeigneter Manahmen zur Verbesserung Die Ergebnisse werden auch arbeitsrechtlich
der Mathematik- und Leseleistungen von bergeordneten Personen mitgeteilt, die sie
Grundschlern werden vier verschiedene Tech- aber nur zu einer Beratung der evaluierten
niken (Senkung der Klassenfrequenz, Verlnge- Personen nutzen und keine Machtentschei-
rung des Schulalltags, Computeruntersttzter dungen darauf aufbauen.
Unterricht und Einsatz von Gleichaltrigen und Beispiel: Die Arbeit der Psychologen in einer
Erwachsenen als Tutoren) in einer Kosten-Wirk- Erziehungsberatungsstelle wird umfassend
samkeitsanalyse einem Vergleich unterzogen. evaluiert (zum Beispiel unter Hinzunahme
64 Einsatzgebiete psychologischer Evaluation

Diagramm III/6
Vergleich der wesentlichen Kennzeichen von formativer und summativer Evaluation
(nach Herman, Morris & Taylor Fitz-Gibbon, 1988, S. 26)

Merkmal Formativ Summativ

primre Zielgruppe Programm-Entwickler Politiker


Programm-Manager interessierte ffentlichkeit
Programm-Durchfhrende Geldgeber

primre Betonung bei der Klrung der Ziele Dokumentation der Ergebnisse
Datensammlung Art des Programm-Prozesses bzw. Dokumentation der Durchfh-
der Programmdurchfhrung rung
Klrung der Probleme bei der
Durchfhrung und der Annhe-
rung an Ergebnisse
Analyse zur Durchfhrung und Analyse zur Durchfhrung und
Ergebnisse auf Mikroebene Ergebnisse auf Makroebene

primre Rolle des Programment- Mitarbeiter Datenbeschaffer


wicklers und Programm-Ausfh-
renden

primre Rolle des Evaluators interaktiv unabhngig

typische Methodologie qualitative und quantitative, mit quantitative, manchmal durch


grerer Betonung der ersteren die qualitative bereichert

Hufigkeit der Datensammlung fortlaufende berwachung begrenzt

primre Mechanismen der Diskussion/Treffen, informelle formale Berichte


Berichtlegung Interaktion

Hufigkeit der Berichtlegung hufig whrend der ganzen Zeit zum Schlu

Schwerpunkt des Berichts Beziehung zwischen den


Prozeelementen (Mikro-Niveau)

Beziehung zwischen Kontext


und Proze
Beziehung zwischen Proze und
Ergebnis
Implikationen fr Programm- Implikationen fr Politik,
praktiken und spezifische administrative Kontrollen und
Vernderungen bei den Management
Operationen

Anforderungen fr Glaubwrdig- bereinkunft mit Entwicklern/ wissenschaftliche Strenge


keit Durchfhrenden hinsichtlich der Unparteilichkeit
Berichtlegung
Befrwortung/Vertrauen
Einsatzgebiete psychologischer Evaluation 65
von objektiven Daten wie Wartezeiten, sub- keit der in der Evaluationsstudie erhobenen In-
jektiven Einschtzungen der ratsuchenden formation nur fr die evaluierte Person selbst
Kinder und Eltern, Angaben von Lehrern gegeben ist, sehr zweckmig sein, auch nur
ber die erlebten Vernderungen), die Ergeb- schwach fundierte Aspekte empirisch zu erhe-
nisse innerhalb der Erziehungsberatungs- ben und als Hinweise in den Projektbericht
stelle diskutiert und gemeinsam versucht, aufzunehmen. So kann man in dem hier ge-
weitere Optimierungen durchzufhren. nannten Beispiel durchaus der Meinung sein,
Die Ergebnisse dienen zu Machtentschei- da die Vergabe von Schulnoten bezglich
dungen von weder direkt noch indirekt der Fhrungsleistung durch Mitarbeiter in vie-
selbst evaluierten Entscheidungstrgern. len Fllen nicht fundiert sein kann, da viele
Beispiele: Auswahl von Bildungsanbietern Mitarbeiter (insbesondere Berufsanfnger) kei-
auf der Basis von Evaluationsergebnissen ne ausreichende Erfahrung mit Fhrungskrf-
durch auftragvergebende Stellen, Entschei- ten als Vergleichsgrundlage sammeln konnten,
dungen ber die Einfhrung bestimmter um eine wirklich fundierte Einschtzung ihres
didaktischer Hilfsmittel wie zum Beispiel Vorgesetzten abzugeben. Es wre in einer sol-
Lehrbcher oder didaktischer Konzeptionen chen Situation dann unverantwortlich, im Rah-
im ffentlichen Schulwesen, Entscheidung men eines Evaluationsprojektes zum Beispiel
ber die eventuelle Fortsetzung einer Reform- eine Fhrungskraft von den Mitarbeitern be-
manahme im forensischen Bereich etc. werten zu lassen und durch dessen Vorgesetz-
Die Ergebnisse werden offengelegt und sol- ten aufgrund nur dieser Schulnoten weitrei-
len Bestandteil einer auf konkrete (politische) chende persnliche Entscheidungen wie zum
Entscheidungen bezogenen allgemeine Dis- Beispiel Kndigung treffen zu lassen. Bleibt die
kussion sein. Information und die Entscheidungsberech-
Beispiele: Kontrovers diskutierte Bauvorha- tigung bei der evaluierten Fhrungskraft selbst,
ben, gesetzliche Bestimmungen oder organi- kann es fr diese natrlich von erheblichem
satorische Regelungen im ffentlichen Be- Interesse sein, zu erfahren, da sie gut oder we-
reich. niger gut von ihren Mitarbeitern gesehen wird,
Die Ergebnisse werden einer (fach-) ffentli- unabhngig von der harten Fundierung ei-
chen Diskussion zugefhrt, die aber keine ner solchen Einschtzung. In gleicher Weise ist
konkreten, zu einem bestimmten Zeitpunkt es im letztgenannten Fall oft sinnvoll, auch
erforderlichen Entscheidungen herbeifhren anonymisierte Einzelmeinungen und sehr kri-
soll. tische persnliche Bemerkungen als Hinweise
Beispiele: Metaanalysen zur Bewertung un- auf Probleme weiterzuleiten, whrenddessen es
terschiedlicher Therapieformen, Studien zur bei Offenlegung der Ergebnisse im Regelfall vl-
fachwissenschaftlichen Bewertung verschie- lig unangemessen wre, solche vielleicht sehr
dener eignungsdiagnostischer Instrumente, persnlichen und evtl. ungerechtfertigten in-
Evaluationen von Manahmen zur Verkehrs- kriminierenden Einzelaussagen ungefiltert
beruhigung etc. darzustellen. In gleicher Weise mu mit zuneh-
mender Fremdbestimmung oder ffentlich-
Auch wenn natrlich, wie jedes Evaluations- keitswirkung in der Evaluationsarbeit versucht
projekt, alle Studien dieser Art einen direkten werden, Streffekte und intervenierende Varia-
oder zumindest indirekten Entscheidungsbezug blen herauszuarbeiten. So kann bei selbst-
haben, mu nicht nur die Form der Bericht- verantworteter Nutzung fr die persnliche
legung und die Bercksichtigung der dabei Verhaltensoptimierung eine auf Streffekten
mglicherweise auftretenden Fettnpfchen aufbauende Exhaustion gegebenenfalls auch
vor dem Hintergrund der spezifisch vorgesehe- vom Verantwortlichen selbst vorgenommen
nen Verwendung berlegt werden. Praktisch werden, ohne da unbedingt im Projekt die da-
alle Details des jeweiligen Evaluationsprojektes fr erforderlichen Datengrundlagen geschaffen
werden durch den konkreten Verwertungs- werden mssen. Hngt aber zum Beispiel die
zusammenhang beeinflut. So kann es bei dem Entscheidung ber die weitere Vergabe von
ersten hier genannten Fall, bei dem die Ent- Geldmitteln an einen Bildungstrger davon ab,
scheidungsberechtigung und die Zugnglich- wie die dort erzielten Bildungsmanahmen be-
66 Einsatzgebiete psychologischer Evaluation

wertet werden, sollte die Analyse zumindest der dem Militr bei der Entscheidung ber die Ent-
wichtigsten intervenierenden Variablen (liegt es wicklung komplexer Waffensysteme zu helfen,
am Bildungsangebot, der evtl. vom Auftragge- Budgeting Systeme ermglichen in der Wirt-
ber erzwungenen schlechten oder fehlenden schaft eine genaue Kontrolle der Kosten, die
Vorselektion der Teilnehmer, den unzureichen- Wertanalyse ist bei der Produktplanung und
den Ressourcen oder der fehlenden Transfer- -gestaltung eine groe Hilfe zur Wertgestaltung
untersttzung der Bildungsinhalte in die Praxis und Wertverbesserung, die Schulbegleitforschung
durch den Auftraggeber?) gesichert sein, um gibt u. a. wesentliche Anste fr die Entwick-
Fehlentscheidungen soweit wie mglich zu ver- lung neuer Lehrplne.
meiden. Leider fanden derartige Entwicklungen oft in-
nerhalb des jeweiligen Fachbereiches ohne Be-
zug zu anderen Feldern statt. So ist es denn
auch nicht verwunderlich, da viele sich stark
3.2 Evaluation als hnelnde Techniken und Methoden vllig un-
interdisziplinres Feld abhngig voneinander, zu verschiedenen Zeit-
punkten und in vllig unterschiedlichen Diszi-
Evaluation als problemorientiertes Handeln plinen entwickelt wurden.
kann nicht nur auf Erkenntnissen einer Einzel- Die mangelnde Zusammenarbeit zwischen
wissenschaft aufbauen, sondern mu neben verschiedenen Fachdisziplinen gerade im Bun-
vielen wissenschaftlichen Aspekten (aus den desdeutschen Raum beklagen auch Hellstern
unterschiedlichsten Bereichen) auch Praxis- und Wollmann (1984, S. 34): Es fehlt vor al-
wissen integrieren. Leider bestehen hier Defizi- lem ein sektorale Politikfelder berschreitender
te (3.2.1), ohne deren Behebung der enorme und verschiedene Fachdisziplinen integrieren-
Aufschwung, den die Evaluationsarbeit in den der Fokus, wie er sich in den USA, aber auch in
USA genommen hat (3.2.2) nicht wiederholbar Kanada und anderen Lndern durch die Grn-
ist. dung eigener berufsstndischer Organisationen
Zur Strukturierung der Fallbeispiele im Ab- auf der regionalen und nationalen Ebene ma-
schnitt 3.3 werden hier zunchst einige Punkte nifestiert.
skizziert, die allen Projekten trotz ihrer fachli- Der Einflu der Evaluationsforschung im ge-
chen und aufgabenbezogenen Heterogenitt sellschaftlichen und technologischen Wandel
gemeinsam sind und damit einen gewissen ist abhngig von der Reichweite ihres Wir-
bersichtsrahmen bieten (3.2.3). kungsspektrums. Dieses liee sich durch eine
integrative Zusammenarbeit enorm erweitern
und wesentlich effektiver gestalten. Anzustre-
3.2.1 Notwendigkeit einer einzelne ben wre hier die Intensitt und das Ausma
Evaluationsbereiche berschreiten- einer anwendungsorientierten Forschung, wie
den Vorgehensweise sie in den USA bereits erreicht wurde.
Eine besondere Ursache fr das Problem ei-
Es herrscht Einigkeit hinsichtlich der Tatsache, nes nur mangelhaften Erfahrungsaustausches
da es sich bei der Evaluationsforschung um von Evaluations-Knowhow ber die verschie-
ein interdisziplinres Feld handelt, das weit denen Anwendungsfelder hinweg liegt in der
ber die Grenzen einzelner sozialwissenschaft- sehr starken Einbettung der meisten im Eva-
licher Disziplinen hinausgeht (vgl. Wittmann, luationsbereich berufsttigen Personen in ein
1985). bereichsspezifisches Setting. Dies ergibt sich
Wie bereits im Abschnitt 3.1.5 deutlich wurde, zum Teil durch die Beschftigungsverhltnisse
hat die Evaluationsforschung mittlerweile Ein- (so kann ein auch mit Evaluationsfragen beauf-
zug in viele unterschiedliche gesellschaftliche tragter Mitarbeiter einer psychiatrischen Klinik,
Bereiche gehalten. Die vielen verschiedenen der dort ein festes Angestelltenverhltnis hat,
Formen und Modelle der Evaluation wurden natrlich nicht ohne weiteres gleichzeitig Eva-
dabei alle fr spezifische Anwendungsbereiche luationsstudien im Bildungsbereich und in der
entwickelt: So entstand etwa die Program Eva- Wirtschaft durchfhren), bei den selbstndig
luation and Review Technique (PERT), um arbeitenden Evaluatoren folgt es oft aus den
Einsatzgebiete psychologischer Evaluation 67
Mglichkeiten erfolgreicher Projektaquisition. Verbindung mit den Reformprogrammen der
Es fllt natrlich leichter, auch vor dem Hinter- Regierung unter Prsident Johnson.
grund der im Abschnitt 3.1.2 beschriebenen Mit diesen und spter folgenden sozial-po-
persnlichen Passung, Folgeauftrge dann zu litischen Programmen war von Anfang an der
halten, wenn man auf in einem gleichen oder Auftrag verbunden, die Wirkung dieser Ma-
doch sehr hnlichem Feld erfolgreiche Evalua- nahmen zu berprfen. Die Evaluations-
tionsprojekte verweisen kann. Dies fhrt in der studien wurden dabei in der Regel sogar ge-
Folge aber auch zu gerade aus der Sicht potenti- setzlich vorgeschrieben, sowie eigens Mittel
eller Auftraggeber verstndlichen Labelling- fr sie bereitgestellt (vgl. Lange, 1983).
Effekten (Frau X ist Spezialistin fr den fo-
rensischen Bereich, was soll uns die bei einer Heute ist die Evaluationsforschung in den USA
verkehrspolitischen Frage helfen?), die eine zu einem festen Bestandteil bei der Implemen-
bernahme von Evaluationsprojekten in bisher tierung neuer, innovativer Programme und zur
fremden Bereichen mit zunehmender Dauer berprfung der Wirksamkeit laufender Pro-
der Berufsttigkeit eher erschweren. gramme geworden:
Die vermutlich beste Lsung wrde in einem
intensiven Erfahrungsaustausch zwischen den the use of evaluation procedures has
Evaluatoren aus unterschiedlichen Bereichen been diffused during the past few years,
liegen, doch fehlt zumindest derzeit dafr ein and such procedures are now common-
geeigneter organisatorischer Rahmen. Die place at all levels of government, among
Grnde dafr liegen sicher zum Teil in dem private foundations, and among commer-
starken Denken in Kategorien (Spezialisten- cial and industrial organisations. (Rossi
tum), der zumindest im Vergleich mit der USA and Freeman, 1985)
geringen Anzahl von Evaluatoren, die berdies
Evaluationsarbeiten nur als einen relativen klei- Das Feld der Evaluationsforschung war Ende
nen Teil ihrer beruflichen Ttigkeit wahrneh- der achtziger Jahre der strkste Wachstums-
men, und vielleicht noch immer in wechsel- sektor innerhalb der amerikanischen Sozialwis-
seitigen emotionalen Vorbehalten zwischen senschaften. Die sich hieraus ergebenden un-
Evaluatoren mit unterschiedlicher Ausbildung ternehmerischen Mglichkeiten fhrten dabei
und unterschiedlichen beruflichen Ttigkeiten zur Entwicklung eines neuen Dienstleistungs-
(Wir arbeiten in einem Gefngnis, nicht in ei- bereiches, in dem sich fr Sozialwissenschaftler
ner Bank!, Was sollen wir in der Wirtschaft und Psychologen in einem bisher nicht be-
aus Erfahrungen in Kliniken lernen? Wir haben kannten Ausma Handlungschancen und be-
Fhrungskrfte und Mitarbeiter, aber doch kei- rufliche Entwicklungsmglichkeiten bieten.
ne Verrckten!, Wir sind eine psychiatrische Eine Reihe neuer Unternehmen wurde ge-
Klinik, aber doch kein Gefngnis!). Im Prinzip grndet, die sich der Evaluationsforschung wid-
mte es mglich sein, die hier genannten Ur- men. Andere Organisationen, die zuvor in der
sachen zu berwinden oder doch zumindest Marktforschung und Testentwicklung fest ver-
stark zu reduzieren, doch drfte es noch eine ankert waren, erweiterten ihren Aufgabenbe-
lngere Zeit dauern, bis annhernd die Bedin- reich durch die Erfolgskontrolle von Manah-
gungen in den USA auch hier geschaffen wer- men und Programmen.
den. Es zeichnet sich bereits die Entwicklung ei-
ner neuen Profession des Evaluators ab, was
sich u.a. in der Grndung mehrerer Berufsorgani-
3.2.2 Vergleich BRD/USA: Stand sationen manifestiert, die sich ausschlielich
der Evaluationsforschung mit Evaluationsforschung beschftigen (vgl.
Rossi, 1984) Auch an den Universitten besitzt
Die Evaluationsforschung ist eine noch junge der Anteil der Evaluationsforschung inzwischen
Wissenschaftsdisziplin. Wenn man von eini- einen betrchtlichen Umfang.
gen Vorlufern in den dreiiger und vierziger Es wurde bereits mit speziellen Trainingspro-
Jahren absieht, entstand sie Anfang bis Mitte grammen sowohl innerhalb von Ausbildungs-
der sechziger Jahre in den USA vor allem in gngen als auch fr Graduierte begonnen. Die
68 Einsatzgebiete psychologischer Evaluation

Nachfrage nach ausgebildetem Personal fr wiegend entweder durch sich anders definie-
Evaluationsttigkeiten wchst. rende Berufsgruppen (zum Beispiel Markt- und
Dabei hat sich im Laufe der Jahre bereits ein Meinungsforscher, Mitarbeiter des betriebli-
neues Verstndnis des Evaluationsvorgehens chen Bildungswesens, Controller) oder von uni-
entwickelt. Beywl und Geiter ( 1997, S.75) spre- versittsnahen Arbeitsgruppen durchgefhrt.
chen auch von einem paradigmatischen Wan-
del in der Evaluationsdisziplin:
Die technische Perfektion der eingesetzten 3.2.3 Strukturelle Gemeinsam-
Untersuchungsinstrumente und -designs, wie keiten idealer Evaluationsstudien
sie in der allein akademisch geprgten Eva-
luationspraxis bis in die siebziger Jahre vorherr- Durch den berblick in den vorangegangenen
schend war, reicht heute als Qualittsausweis Abschnitten wurde deutlich, da es im Bereich
nicht mehr hin. Dazukommen mu von Be- der Evaluationsforschung eine Reihe zum Teil
ginn an eine klare Dienstleistungsorientierung stark divergierender Anstze gibt. Der Grund
an den Informationsinteressen der Evaluations- hierfr liegt darin, da die vielen verschiede-
benutzer, zu denen nicht nur Auftraggeber und nen Formen und Modelle der Evaluation alle
Finanziers, sondern auch andere wichtige Betei- fr spezifische Anwendungsbereiche entwickelt
ligtengruppen zhlen. Die Verantwortung des wurden.
Evaluators/der Evaluatorin wird ber techni- Auf der Grundlage der Ausfhrungen in Ab-
sche Fragen hinaus auf soziale und politische schnitt 3.1 lassen sich jedoch die strukturellen
Aspekte ausgeweitet, bis hin zur Bercksich- Gemeinsamkeiten von idealen empirischen
tigung des allgemeinen und ffentlichen Evaluationsstudien herausarbeiten, die sich
Wohls. (Beywl und Geiter, 1997, S.75) zwar kaum je vollstndig in konkreten Projek-
Diese neue Evaluationssichtweise wird auch ten identifizieren lassen (s. dazu 3.3), die aber
in einem wichtigen Dokument des Joint in gewissem Sinn ein gemeinsames Leitbild des-
Commitee on Standards for Educational Eva- sen, darstellen, was Evaluatoren bei ent-
luation verdeutlicht (vgl. Joint Committee on scheidungsbezogenen Evaluationen erreichen
Standards in Educational Evaluation, 1994) das sollten und auch knnten, sofern man fr sie
erstmals anerkannte Standards fr die Evaluati- von Seiten der Auftraggeber wirklich optimale
on von Programmen in den USA aufzeigt. Bedingungen schaffen wrde.

In der Bundesrepublik setzte die Evaluations- Strukturelle Kennzeichen von Evaluations-


forschung erst spter, Ende der sechziger, An- studien:
fang der siebziger Jahre ein.
Als Ursache sind auch hier politische Reform- 1. Umfassende, explizite Klrung der wirkli-
programme zu sehen, vor allem im Bereich der chen Zielsetzungen des Auftraggebers; fr
Schul- und Bildungsplanung. In Verbindung die damit verbundenen erheblichen Proble-
mit diesen politischen Reformmanahmen hat me s. Abschnitt 3.1.1
die Evaluationsforschung in den letzten beiden 2. Exakte konsensfhige Beschreibung der zu
Jahrzehnten eine strmische Entwicklung evaluierenden Alternativen; dies ist vor al-
durchlaufen, die allerdings gegenber der ame- lem schwierig, wenn entweder relativ vage
rikanischen Evaluationsforschung nicht nur Oberbegriffe die Grundlage der Alternati-
verzgert, sondern auch sehr viel unstetiger ver- venbeschreibung sind (Was ist wirklich, im
lief und sich in ihrer inhaltlichen Ausrichtung Detail empirisch-konkret, Gesamtschule,
und kommerziellen Form unterscheidet. Eine offener Vollzug oder verkehrsberuhigte
echte Professionalisierung speziell der Evalua- Zone?) oder gerade bei formativer Evalua-
toren beginnt mit einzelnen Angeboten von tion zu Beginn des Projektes noch gar ab-
Weiterbildungs- und Postgraduiertenprogram- schlieend feststeht, welche Modifikatio-
men nur sehr langsam, einschlgige Berufsver- nen der Ausgangssituation mglich bzw.
bnde o.. fehlen (derzeit noch). Allerdings ge- wnschenswert sind.
wann die Evaluationsttigkeit selbst erheblich 3. Explizite und zeitberdauernde Festlegung
an Umfang, doch werden diese Arbeiten ber- der Bewertungskriterien, einschlielich der
Einsatzgebiete psychologischer Evaluation 69
zu verwendenden Mae bzw. Erhebungs- sollen (Wir wollen, da die forensische
instrumente, vor Beginn des Projektes; hier Klinik bei uns geschlossen wird und fl-
ist immer wieder festzustellen, da nach len die Fragebgen zu Belstigungen etc.
Vorliegen der Ergebnisse doch, trotz allem daher so aus, da die Ergebnisse unserem
Bemhen des Evaluators, ergnzende As- Wunsch zur Durchsetzung verhelfen!).
pekte nachgeschoben oder zuerst fr Darber hinaus sind wegen der oft nicht
wichtig erachtete abgewertet werden, wenn vermeidbaren Freiwilligkeit der Datenerhe-
die Resultate nicht den (offenen oder impli- bung Verzerrungen der Stichprobe (zum
ziten) Erwartungen entsprechen, zumindest Beispiel hundertprozentige Beteiligung der
von Teilgruppen der von den Ergebnissen Minderheit von Aktivisten, extrem gerin-
Betroffenen. ge Beteiligung der groen Zahl von Unin-
4. Aufstellung konsensfhiger Entscheidungs- teressierten) kaum zu vermeiden (fr eine
regeln, die fr alle mglichen Ergebnisse interessanten Lsungsansatz s. 4.3.3).
eine eindeutige Handlung der Evaluatoren 7. Ausschaltung aller Str- und Beeinflussungs-
bzw. Auftraggeber ermglichen; dies ist eine versuche von Auen whrend der gesam-
wichtige, aber aus den zu Ziffer 3 genann- ten Dauer der Datenerhebungen; bei Labor-
ten Grnden nur in wenigen Projekten untersuchungen durchaus weitgehend
wirklich realisierbare Forderung. Die man- realisierbar, aber sehr schwierig bei Feld-
gelnde Beachtung dieser idealen Regel hat studien mit hohem politischem Interesse
leider wesentlich zu einer Abwertung der und einer entsprechenden Berichterstat-
Evaluationsarbeit (vor allem in der Form tung, zum Beispiel in Massenmedien oder
von Gutachten) in der ffentlichen Mei- bei Versammlungen der Betroffenen. Auch
nung gefhrt. treten immer wieder Fehlattributionen auf
5. Eine der Beschreibung vollstndig entspre- (Gerchte ber die Projektziele, personelle
chende Realisierung der zu evaluierenden Vernderungen, die zu unrecht als Projekt-
Alternativen bzw. Auswahl geeigneter Rea- folge interpretiert werden, Verquickung mit
lisierungsformen; hier entstehen Probleme zum Beispiel politischen Vorgngen wie
weniger aus den antizipierten Folgen prak- Kommunalwahlen etc.), die vorher schwer
tisch wichtiger Entscheidungen, sondern kalkulierbar und auch bei grter Mhe
aus Ressourcenbegrenzungen und rechtli- nicht zuverlssig vermeidbar sind.
chen Vorgaben, zum Beispiel Beschrnkung 8. Zustzliche Aufnahme aller zunchst ber-
von Personen in Experimentalbedingun- sehenen, aber vernnftiger Weise zu beach-
gen (zum Beispiel neue Schulformen, The- tenden Aspekte in die Entscheidungsregeln
rapien, Wohnbedingungen ) auf Freiwilli- gem Ziffer 3; da auch bei guter Planung
ge, und zwar sowohl als Akteure (Lehrer, solche Ergnzungen oft notwendig wer-
Therapeuten) als auch als Datentrger den, stellt sich dann die Frage, was ver-
(Schler, Patienten, Haushalte ). nnftig, und was interessensgeleitet ist
6. Reprsentative Beteiligung aller Betroffenen (vgl. Ziffer 3).
an der Planung und Durchfhrung der Er- 9. Bei vernderten Rahmenbedingungen und
hebungen; dieser sehr wichtigen Ideal- beim Auftreten neuer Alternativen konsens-
forderung stehen manchmal inhaltliche mige nderung der Entscheidungsregeln,
Bedenken entgegen. So kann die Aufkl- die Probleme sind hier analog zu Ziffer 8.
rung ber die Ziele der Evaluation selbst 10. Beibehalten des Konsens ber die Vorge-
eine sehr wichtige Intervention sein und hensweise im Projekt auch nach Vorliegen
entsprechende Verzerrungen auslsen (zum der evaluationsgesttzten Entscheidung;
Beispiel besonderes Engagement von Um- dies ist unter sehr gnstigen Bedingungen
schulungsteilnehmern, wenn Sie wissen, mit harten Messungen (zum Beispiel im
da von ihren Ergebnisse die weitere Fi- Rahmen des Qualittsmanagements nach
nanzierung der Manahme abhngt ) oder ISO 9000, s. Abschnitt 2.2.4) durchaus mg-
eine zielorientierte Verzerrung der Datener- lich, auch bei der evaluationsgesttzten
hebung, wenn bekannt ist, welche Er- Entwicklung von Instrumenten und Tech-
gebnisse zu welcher Entscheidung fhren niken. Je politischer und weicher die
70 Einsatzgebiete psychologischer Evaluation

Studie aber ist, um so seltener ist diese For- Mit dem Aufkommen informationstheore-
derung zu realisieren. tischer und systemorientierter Anstze vergr-
11. Strungsfreie Realisierung der Entscheidung erte sich der Stellenwert der Kontrollfunktion
(s. dazu Ziffer 10). erheblich. Kontrolle wurde als Voraussetzung
dafr erkannt, Fehler in der Planung oder Feh-
Es ist selbstverstndlich, da dieses ideale Mo- ler in der Realisation zu erkennen und entspre-
dell nie vollstndig erreichbar ist, und da die chende Manahmen zu deren Beseitigung zu
Wissenschaft nur Beitrge zu einer relativen ergreifen. Diese Auffassung hebt bewut vom
Verbesserung beitragen kann. Dies sollte bei Kontrollieren alter Prgung ab, indem das stati-
den im folgenden Abschnitt dargestellten drei sche Moment des Soll-Ist-Vergleiches sich in ei-
konkreten Studien bedacht werden. Die in die- nem dynamischen control-Proze auflst.
sen Ausfhrungen auch aufgezeigten relativen Heute ist Kontrolle deshalb als wesentliche
Schwachpunkte sind in keiner Weise als Kritik Managementfunktion in der Wirtschaft unbe-
an der Kompetenz der Evaluatoren gedacht, stritten (vgl. Siegwart und Menzel, 1978, Prohl,
sondern sollen nur die echten Schwierigkeiten 1981, Ziegenbein, 1984). Controlling lt sich
von Evaluationsprojekten verdeutlichen. ... als ein Konzept der Unternehmensfhrung
durch Planung, Information, Organisation und
Kontrolle bezeichnen. Ihren konkreten Bezug
findet diese Art der Unternehmensfhrung
durch Zielvorgabe, Abweichungsanalyse und
3.3 Grundlagen und Einleitung von Gegensteuerungsmanahmen
Probleme der Evaluations- in der Person und Stelle des Controllers.
forschung dargestellt am (Bramsemann, 1978, S. 31). Pfohl (1981, S. 17)
unterscheidet innerhalb des Managements ei-
Beispiel konkreter ner Unternehmung sechs Managementsub-
Evaluationsprojekte systeme:

In den folgenden drei Abschnitten wird ver-


Politik
sucht, einen Eindruck von der konkreten Pro-
Planung
jektarbeit zu geben. Die Darstellung kann nur
Kontrolle
auszugsweise, mit notwendigerweise subjekti-
Organisation
ver Schwerpunktsetzung, erfolgen; fr eine aus-
Fhrung
fhrliche Auseinandersetzung mit den bespro-
Managemententwicklung
chenen Arbeiten sollte daher unbedingt auf die
jeweils angegebene Originalliteratur zurckge- Die Gestaltung effizienter Kontrollsysteme ist
griffen werden. in allen betrieblichen Funktionsbereichen wie
Produktion, Finanzierung oder Beschaffung fe-
ster Bestandteil.
3.3.1 Evaluation in der Wirtschaft Besonders effiziente Kontrollsysteme findet
man in den Bereichen der Kosten und
Die Evaluation hat in der Wirtschaft lngst ei- Investitionskontrolle. Diagramm III/7 gibt einige
nen festen Platz. Hier finden jedoch blicher- Beispiele solcher Kontrollinstrumente (nach
weise die Begriffe Kontrolle oder Controll- Whl, 1986).
ing Verwendung. Grere Schwierigkeiten bringt die Gestal-
In den fnfziger Jahren wurde der Kontroll- tung effizienter Kontrollsysteme im betriebli-
begriff in der wirtschaftswissenschaftlichen Li- chen Bildungswesen, im Marketing und Orga-
teratur noch recht eng ausgelegt. Kontrolle um- nisationsbereich mit sich (vgl. Bronner und
fat vorwiegend die nachtrgliche berprfung Schrder, 1983).
der Ausfhrung, sowie den Vergleich der Ergeb- Die Hauptproblematik ergibt sich hier aus der
nisse mit den geplanten Zielen und war organi- Nichtanwendbarkeit herkmmlicher betriebs-
satorisch eng mit dem Rechnungswesen ver- wirtschaftlicher Kontrollsysteme auf diese Be-
knpft. reich. Weitere Probleme liegen
Einsatzgebiete psychologischer Evaluation 71
im mangelnden Kontrollbewutsein seitens Untersuchung von Berthold et al. (1980) darge-
der Verantwortlichen, stellt. Dabei ist hervorzuheben, da es sich um
in mangelnder Akzeptanz von Evaluations- eine der wenigen Arbeiten im deutschsprachi-
versuchen bei den Beteiligten, gen Raum handelt, die versucht, den Wei-
in fehlenden Kontrollinstrumenten, terbildungserfolg in systematischer Form mit
in Zeit und Personalmangel, Hilfe psychologischer Meinstrumente zu er-
in einem Mangel an allgemein anerkannten mitteln.
Kriterien zur Erfassung des Erfolges,
in der mangelnden Qualifizierbarkeit der Er- 1. Problemstellung
folge,
in der Tatsache, da alle genannten Bereiche Systematische Versuche einer Erfolgskontrolle
kein sichtbares Investitionsobjekt verkrpern. in der betrieblichen Weiterbildung sind recht
selten. In der vorliegenden Untersuchung wurde
Zwar gibt es sowohl im Marketing und Bil- festgestellt, ob die Durchfhrung von drei
dungsbereich, als auch im Organisationsbe- Kommunikations und Kooperationstrainings
reich gengend Evaluierungsversuche, doch fr Fhrungskrfte des unteren und mittleren
sind diese oft durch recht einfache Kontroll- Managements auf das Verhalten der zwischen-
techniken ausgezeichnet, deren Aussage- menschlichen Interaktion im beruflichen All-
fhigkeit stark begrenzt ist (vgl. Will, Winteler, tag Auswirkungen zeigt.
Krapp, 1987).
2. Evaluationsobjekt

Fallbeispiel 1: Weiterbildungserfolg Evaluationsobjekte sind zum einen die Teilneh-


mer der Verhaltenstrainings (68 Fhrungskrfte
Im folgenden wird auf der Grundlage der in des unteren und mittleren Managements), zum
Abschnitt 3.2.3 dargelegten Beschreibungs- anderen erfolgte eine Bewertung der drei
merkmale eine kurze Zusammenfassung einer Kommunikations und Kooperationstrainings.

Diagramm III/7
Beispiele fr Kontrollinstrumente in der Kosten- und Investitionskontrolle (Der Bundes-
minister fr Bildung, Wissenschaft, Forschung und Technologie, 1977)

Methoden der Informationserarbeitung Grundlagenanalyse


und -verarbeitung ABC-Analyse
Kennzahlensysteme, z.B. Return in investment, cash-flow-Rate,
Deckungsbeitrags-Intensitt
Checklisten-Technik
Technizittsanalysen
Wertanalysen
Nutzwertanalysen
Zero-Base-Budgeting
Gewinnschwellenanalyse
Plankostenabrechnung
Methoden der Gemeinkostenplanung
Budget-Handbuch

Planungsmethoden Kennzahlensysteme zur Zielplanung


Netzplantechnik
Management by Objektives

Kontrolltechniken Indirekte Korntrolle


Prfmatrix
Kostenkontrolle durch Festlegung von Preisabweichungen,
Mengenabweichungen, Beschftigungsabweichungen
72 Einsatzgebiete psychologischer Evaluation

3. Ort der Evaluierung An den Trainings nahmen 68 Fhrungskrfte


des unteren und mittleren Managements eines
Es handelt sich bei der Untersuchung um eine groen Mnchener metallverarbeitenden Un-
Evaluations im Feld. Der Einsatz der Evalua- ternehmens teil. Es gab zwei Trainingsgruppen
tionsinstrumente erfolgte vor, whrend und (T1 und T2) und eine Kontrollgruppe. Die Zu-
nach dem Seminar im Betrieb bzw. im Schu- teilung zu den einzelnen Gruppen erfolgte
lungsraum. nicht durch Randomosierung. Es wurde jedoch
versucht, die Gruppen, zu parallelisieren.
4. Zielsetzung Die Fhrungskrftetrainings wurden jeweils
von einer externen Psychologin und einer fir-
Ziel der Untersuchung war es, festzustellen, ob meninternen Fhrungskraft durchgefhrt.
eventuelle Verhaltensnderungen der Seminar-
teilnehmer auf Einflsse des Trainings zurck- Das Design der Untersuchung hat aufgrund
zufhren sind. Damit einher geht die Zielvor- der zahlreichen unterschiedlichen Meinstru-
stellung zu beweisen, da ein gut konzipiertes, mente eine relativ komplexe Struktur (s.u.).
lernorientiertes Verhaltenstraining tatschlich
Vernderungen bei den Teilnehmern bewirkt. Grundlegend orientiert sich die Mekonzep-
tion an einem Vergleich der Trainingsgruppe
Ein zustzliches Ziel der Autoren drfte die T1 mit der Trainingsgruppe T2, sowie einem
Aquisation von Auftrgen in der Wirtschaft ge- Vergleich der beiden Trainingsgruppen mit der
wesen sein. Kontrollgruppe. Nach vollzogenen Vergleichs-
messungen erhielt die Kontrollgruppe das glei-
5. Design und Untersuchungsmethodik che Training wie die beiden Trainingsgruppen.
In Diagramm III/8 ist der Untersuchungsplan der
Zur Erfassung des Seminarerfolges wurden acht Studie wiedergegeben.
verschiedene Erhebungsinstrumente eingesetzt: Auf die im Rahmen der Auswertung verwen-
deten Verfahren gehen die Autoren nicht ein.
Vorgesprch mit Fragebogen
Der Text enthlt lediglich eine deskriptive Aus-
Ratingskala zum Selbst und Fremdbild
wertung des Datenmaterials.
Seminarabschlufragebogen
Fragebogen an die Teilnehmer (Zweit und
6. Evaluationsmodell
Drittbefragung)
Fragebogen zur Selbstaussage der Seminar-
Die Untersuchung von Berthold et. al. enthlt
teilnehmer
sowohl Elemente einer summativen, als auch
Kurzseminar und Fragebogen zur Endaus-
einer formativen Evaluation.
wertung
Von der Seminarplanung bis zur Transferphase
Fragebogen zur VorgesetztenVerhaltensBe-
unterliegt die Untersuchung einer fortlaufen-
schreibung
den formativen Evaluation (zum Beispiel durch
Interviews von Kollegen, Mitarbeitern und
Anpassung der Lernziele an die Gegebenheit
Vorgesetzten durch Trainer oder Interviewer.
am Arbeitsplatz, die Operationalisierung der
Lernziele auf bestimmte Trainingsinhalte, usw.).
Durch die Erfassungsinstrumente sollten vor
allem Aussagen der Seminarteilnehmer ber ei- Im Rahmen des Vergleichs der beiden Trai-
nen Wandel im eigenen Verhalten den Beob- ningsgruppen untereinander bzw. der Trai-
achtungen ihrer Kollegen und Mitarbeiter ge- ningsgruppen mit der Kontrollgruppe kann
genbergestellt werden. man von einer summativen Evaluation spre-
chen.
Die drei sechstgigen Trainings erstreckten sich
ber jeweils drei Wochen (im Juni, September 7. Wichtige Ergebnisse
und Februar) und dauerten in der Woche zwei
Halbtage jeweils von 13 Uhr bis 19 Uhr (50% Als wesentliche Ergebnisse der Untersuchung
Arbeitszeit, 50% Freizeit). halten die Autoren fest:
Einsatzgebiete psychologischer Evaluation 73
Die Teilnehmer an den Fhrungskrfte-Schu- 8. Abschlieende Kritik
lungen meinen zu einem groen Prozentsatz,
sie htten sich durch das Seminar verndert. Vorteile der Untersuchung:
Diese Vernderung wird auch von Kollegen
und Mitarbeitern wahrgenommen, jedoch
Es handelt sich um eine der wenigen Unter-
suchungen, im deutschen Sprachraum, die
von einem geringeren Prozentsatz.
in systematischer Form versucht, den Wei-
Die Anzahl der berichteten Vernderungen
terbildungserfolg zu erfassen.
verringert sich, je grer der zeitliche Ab-
stand zum Training wird.
Es wurden eine Kontrollgruppe und zwei
Trainingsgruppen = Experimentalgruppen
Ein gewisser Interviewer-Effekt im Sinne ei-
benutzt, was strkere Aussagen zult.
ner unbewuten Beeinflussung durch eine
Erwartungshaltung besteht.
Die Gruppe T1, T2 und K wurden vorher
parallelisiert, um Selektionseffekte auszu-
Ein Teil der Vernderungen mu durch das
schlieen.
Training entstanden sein, da Mitglieder der
Kontrollgruppe, die also kein Training mit-
Multivariater Ansatz: Der Weiterbildungser-
folg wurde mit vielen unterschiedlichen Er-
gemacht haben, als nicht verndert einge-
hebungsinstrumenten berprft.
stuft werden.

Diagramm III/8
Untersuchungsplan der Studie von Berthold et. al., 1980

Trainings- Ideensamm- Vorge- Semi- ? u & z


gruppe T1 lung, IST- sprch nar & &
Analyse mit mit
Firmenan- Frage-
gehrigen bo-
gen

Trainings- dito dito Semi- & z


gruppe T2 nar & &

Trainings- dito dito ? Semi- z


gruppe K nar &

&
?

Mrz April Mai Juni Juli Aug. Sept. Okt. Nov. Dez. Jan. Febr. Mrz April Mai

Seminarabschlubogen Interview Kollegen & Mitarbeiter


Trainer/Interviewer

Zweitbefragung der Seminarteilnehmer u Drittbefragung der Seminarteilnehmer

? FVVB Fragebogen Fragebogen Selbstaussage der


durch Kollegen und Mitarbeiter Seminarteilnehmer

Interview Kollegen & Mitarbeiter z Kurzseminar & Fragebogen zur


Trainer = Interviewer Endauswertung

Interview Kollegen, Mitarbeiter, Chef


Trainer = Interviewer
74 Einsatzgebiete psychologischer Evaluation

Die mehrmalige Erhebung von Mewerten versuchen nach 1945 ber Schulbegleitfor-
zu verschiedenen Zeitpunkten erlaubt Aussa- schung diskutiert.
gen ber die Stabilitt von Effekten. In den folgenden Jahren nahm das Interesse
Es wurden nicht nur verschiedene Mein- an der wissenschaftlichen Begleitung der Schul-
strumente benutzt, sondern auch Aussagen versuche immer mehr zu. Die deutlich erkenn-
von verschiedenen Personengruppen gesam- baren Mngel des Bildungssystems waren nur
melt (Kollegen, Mitarbeiter, Vorgesetzte, durch Reformprogramme zu beheben. Diese
Eigenaussagen). machten eine gleichzeitig dazu stattfindende
Die Interviews wurden sowohl von einem Schulbegleitforschung im Sinne einer Kontroll-
Trainer als auch einem externen Psycholo- funktion notwendig. So war die Schulbegleit-
gen durchgefhrt, um Interviewereffekte auf- forschung von Anfang an eng mit der Bildungs-
zudecken. politik verzahnt.
Bund und Lnder fhren bereits seit 1971
Nachteile der Untersuchung: gemeinsam ein umfangreiches Programm mit
Modellversuchen durch, das Entscheidungshil-
Die Kontrollgruppe wurde nur in zwei Fllen fen fr die Entwicklung des Bildungswesens lie-
benutzt, um Vergleichswerte zu erzielen
fern soll. Grundlage hierzu war eine Grundge-
(FVVB, Interview). Warum wurden mit den
setznderung (Art 91b) auf Grund derer die
anderen Erhebungsinstrumenten keine Kon-
Bund-Lnder-Kommission fr Bildungsplanung
trollwerte erhoben?
(BLK) 1971 eine Rahmenvereinbarung zur ko-
Es wurden generell keine Vortestwerte erho-
ordinierten Vorbereitung, Durchfhrung und
ben. Dies schrnkt die Aussagekraft der Er-
wissenschaftlichen Begleitung von Modellver-
gebnisse stark ein.
suchen im Bildungswesen beschlo (BLK,
Es wurden relativ schwache (quasi-experi-
1978, S. 13 ff.).
mentelle) Designs benutzt. Wenn die Unter-
Die Flle der Aktivitten und Verffentlich-
sucher die Mglichkeit fr so viele Messun-
ungen im Rahmen der Schulbegleitforschung ist
gen hatten, warum benutzten sie dann nicht
heute kaum noch zu durchschauen. Einen ber-
aussagekrftigere Designs?
blick ber verschiedene Problembereiche geben
Die Interviewereffekte (Vergleich Trainer/ex-
etwa Mitter und Weishaupt (1977), Hellstern und
terner Psychologe) sind betrchtlich. Hierauf
Wollmann (1984) oder Wottawa (1982).
wird jedoch nicht eingegangen.
Eine Vielzahl der bereits erwhnten Evalua-
Die verwendeten Meinstrumente sind bis auf
tionsmodelle stammt ebenfalls aus dem pd-
FVVB nicht standardisiert. Versuchsleiter-
agogischen Bereich (vgl. etwa die Modelle von
effekte knnten hier verstrkt gewirkt haben.
Wulf 1972, Scriven 1972, Stufflebeam 1972,
Ein Vergleich der Ergebnisse von T1 und T2
Alkin 1972). Baumert (1981, S. 1) definiert heu-
untereinander findet nicht statt.
tige Schulbegleitforschung folgendermaen:
Weitere interessante Beispiele zur Evaluations-
Pdagogische Begleitforschung lt sich
arbeit in der Wirtschaft geben Gulden (1996)
als spezielle Form empirischer Bildungs-
und Glper (1996).
forschung auffassen. Sie ist eine in sich
variable Form von Feldforschung, die an
pdagogische Innovationen, berwiegend
3.3.2 Evaluation im Schul- und Schulversuche, gebunden ist.
Bildungswesen
Die wesentlichen Aufgaben wissenschaftlicher
Wie bereits in Abschnitt 3.2.2 erwhnt, kommt Schulbegleitforschung lassen sich nach Prell
der Evaluation im Bereich der Schul- und (1984, S. 21ff.) wie folgt beschreiben:
Bildungsplanung eine besondere Bedeutung im
Zusammenhang mit der Entwicklung der Auf die Planung und Durchfhrung des
Evaluationsforschung in der BRD zu. Schulversuches gerichtete Beratung
Nach Prell (1984) wurde bereits in den fnf- Mitwirkung im Sinne von innovatorischer,
ziger Jahren parallel zu den einsetzenden Schul- erziehungstechnologischer Forschung
Einsatzgebiete psychologischer Evaluation 75
Bewhrungs- und Effizienzkontrolle oder Sachkompetenz
Evaluation auf drei Vergleichsebenen: dem Fragehaltung
Intersystemvergleich, dem Intrasystemver- Kritisches Denken
gleich, dem systemimmanenten Vergleich; Komplexes Denken
Mitbeteiligung der eigentlichen Trger des Wissenschaftliche Einstellung
Modellversuches, nmlich der Lehrer, Sch- Kompetenzmotivation
ler und Eltern, am Schulversuch Transfer
Abschtzung der Wirkung der verffentlich-
ten Ergebnisse und der daraus gezogenen Er- Eben diese Faktoren sollten bei den Schlern
kenntnisse auf die ffentlichkeit und die Bil- durch das neue Psychologiecurriculum gefr-
dungspolitik. dert werden.

5. Design und Untersuchungsmethodik


Fallbeispiel 2: Curriculumsentwicklung
Der Proze der Entwicklung und Erprobung des
Die Grundlagen und Probleme der Evaluation Psychologiecurriculums erstreckte sich ber
im Schul- und Bildungswesen sollen hier am fnf Jahre und war in folgende Phasen abgrenz-
Beispiel einer Curriculumevaluation von bar:
Seiffge-Krenke, 1981 dargestellt werden:
1. Analyse des Bedingungsfeldes
2. Entwicklung eines Psychologiecurriculums
1. Problemstellung
3. Erprobung des Psychologie-Curriculums
3a) Prototypphase
Im Gegensatz zum Pdagogikunterricht ist der
3b) Phase der Institutionalisierung
Psychologieunterricht in der Sekundarstufe II
seit seiner Einfhrung kaum Gegenstand fach-
Zu 1: Analyse des Bedingungsfeldes
wissenschaftlicher Diskussionen gewesen. Die
Die Untersuchungen im Rahmen der Bedin-
sich ber fnf Jahre erstreckende Untersuchung
gungsanalyse bezogen sich auf folgende Pro-
von Seiffge-Krenke schildert den Proze der
blembereiche:
Entwicklung und Erprobung eine Psychologie-
curriculums fr die Sekundarstufe II. Die Schule als sozialer Ort;
Die psychische Struktur von Oberstufen-
2. Evaluationsobjekt schlern und ihre Erwartungen an den
Psychologieunterricht;
Das eigentliche, auch explizit genannte, Eva- Die Entwicklung des Psychologieunterrichts
luationsobjekt ist das Psychologiecurriculum und affiner Fcher;
von Seiffge-Krenke. Dies wird im Vergleich zum Der Stand der Curriculumsforschung.
traditionellen Psychologieunterricht getestet.
(Problem der Selbst-Evaluation). Schler, Lehrer Die Funktion der Bedingungsanalyse bestand
und Unterrichtsmethoden drfen jedoch als Eva- darin, Akzente und Perspektiven des Problems
luationsobjekte nicht ausgeschlossen werden. zu beleuchten und mglichst frh Defizite und
Probleme zu identifizieren, die fr die Entwick-
3. Ort der Evaluierung lung eines Psychologiecurriculums relevant
sein knne. am Ende der Analysen im Vorfeld
Die einzelnen Untersuchungen wurden an zwei wurde ein Problemkatalog formuliert.
Gieener Gesamtschulen durchgefhrt. Es handelt
sich offensichtlich um eine Evaluation im Feld. Zu 2: Entwicklung eines Psychologiecurriculums
Die Entwicklung des Psychologiecurriculums
4. Zielsetzung baute auf den Ergebnissen der Bedingungs-
analyse auf. Dabei wurde davon ausgegangen,
Die Zielsetzung der Untersuchung lag in der Ent- da wissenschaftliches Denken und Denken im
wicklung und Erprobung eines Psychologie- Alltag keine grundstzlich verschiedenen For-
curriculums. Dies baute auf sieben Lernzielen auf: men des Denkens sind, sondern, da Unter-
76 Einsatzgebiete psychologischer Evaluation

schiede lediglich im Niveau, nicht aber in der Stabilittsmessung


Art des Denkens bestehen. Expertenstudie

Die Entwicklung des Psychologiecurriculums ist An den Studien nahmen insgesamt 240 Sch-
zu unterteilen in ler der Sekundarstufe II zweier Gieener Ge-
samtschulen, sieben Psychologielehrer und 21
den Proze der Lernzielgewinnung Psychologiedozenten teil.
die Neukonstruktion der Inhaltsstruktur Das Diagramm III/9 gibt das Design der Unter-
und die Entwicklung einer didaktisch-me- suchung und die verwendeten Evaluations-
thodischen Unterrichtskonzeption.
instrumente der summativen und formativen
Evaluation wieder.
Zu 3: Erprobung des Psychologiecurriculums
Die Daten aus der formativen und summa-
Die eigentliche Evaluation des Curriculums, die
tiven Evaluation des Psychologiecurriculums
die Prototypphase und die Phase der Institutio-
wurden durch parametrische und deskriptive
nalisierung umfate, erstreckte sich ber einen
Verfahren ausgewertet.
Zeitraum von fnf Jahren (von 1974 bis 1979).
Sie umfate die folgenden Teilstudien:
6. Evaluationsmodell
Experimental-Kontrollgruppenstudie (Ver-
gleichende Evaluation) Es wurde von der Autorin eine Evaluationsstrategie
Replikationsstudie (Kreuzvalidierung) entwickelt, die die Vorteile des experimentellen

Diagramm III/9
Untersuchungsplan der Studie von Seiffge-Krenke, 1981
Zeitlicher E1 E2 K1 K2
Ablauf
1974 Pre-Test Pre-Test Pre-Test Pre-Test

Einfhrung in die Einfhrung in die


Psychologie Psychologie


UE 1 Wahrnehmung UE 1 Wahrnehmung
Psychologieunterricht Psychologieunterricht
UE-Test nach anderer Konzeption nach anderer Konzeption
UE-Test
Wahrnehmung
Wahrnehmung

Schlerevaluation der UE Schlerevaluation der UE


Wahrnehmung Wahrnehmung

1975 UE 2 Gedchtnis UE 2 Gedchtnis

Gesamtevaluation des
UE Test Gedchtnis
Curriculums (Schler)

Schlerevaluation der UE
Post-Test Post-Test
Gedchtnis

UE 3 Sprache
UE Test Sprache

1976 Gesamtevaluation des


Curriculums durch
Schler

Post-Test Post-Test

E1 E2 K1 K2

Nachbefragung Nachbefragung Nachbefragung


Pre-Post-Test Pre-Post-Test Pre-Post-Test
Einsatzgebiete psychologischer Evaluation 77

E3 E4 E5 E6

Pre-Test
Einfhrung in die Pre-Test
Psychologie

UE 1 Wahrnehmung Einfhrung in die Pre-Test


Psychologie

Einfhrung in die
UE-Test Wahrnehmung UE 1 Wahrnehmung Pre-Test
Psychologie

Schlerevaluation der UE UE 1 Wahrnehmung Einfhrung in die


Wahrnehmung UE-Test Wahrnehmung Psychologie

Schlerevaluation der UE
1977 UE 2 Gedchtnis
Wahrnehmung
UE-Test Wahrnehmung UE 1 Wahrnehmung

Gesamtevaluation der
Curriculums durch die UE 2 Gedchtnis Schlerevaluation der UE UE-Test Wahrnehmung
Schler Wahrnehmung

Post-Test UE-Test Gedchtnis UE 2 Gedchtnis Schlerevaluation der UE


Wahrnehmung

Gesamtevaluation der
Schlerevaluation der UE UE 2 Gedchtnis
Curriculums durch die
Gedchtnis
Schler

Experten UE Sprache Post-Test UE-Test Gedchtnis

1978 Expertenstudie UE-Test Sprache Schlerevaluation der UE


Pre-Post-Test Gedchtnis

Gesamtevaluation der
Curriculums durch die UE 3 Sprache
Schler

Post-Test UE-Test Sprache

Gesamtevaluation der
1979 Post-Test Curriculums durch die
Schler
Post-Test

Vorgehens mit einer detaillierten Analyse Verwendung quasi-experimenteller Lngs-


schulischer Praxis verbinden sollte und zu ei- schnittdesigns
nem vernderten Rollenverstndnis des Eva- Erfassung der Langzeitwirkung des Psycho-
luators und der Funktion von Schlern bei der logieunterrichtes
Evaluation des Psychologiecurriculums fhren Validierung der Effekte
sollte. Multivariater Ansatz bzgl. der abhngigen
Variablen
Entwicklung und Revision von Unterrichts-
Die Strategie ist durch folgende Merkmale ge-
materialien und Tests
kennzeichnet:
Kombination von formativer und summa-
Erprobung des Psychologieunterrichtes un- tiver Evaluation
ter praxisnahen Bedingungen
Aufgabe der Rollentrennung zwischen Eva- Bezglich der Unterscheidung von formativer
luator und Unterrichtendem und summativer Evaluation unterscheidet
Einbezug der Schler in den Evaluations- Seiffge-Krenke (1981, S. 60 und S. 241) zwischen
proze formativer und summativer Fragestellungen :
78 Einsatzgebiete psychologischer Evaluation

Die Fragestellungen der formativen Evaluation Stabilitt der erzielten Vernderungen und
betreffen vor allem: zeitverzgerter Abbau negativer Einstellungs-
komponenten;
Erprobung von Unterrichtsmaterial und lern-
Wiederholbarkeit und Personenunabhngig-
zielorientierten Testverfahren: Die im theo-
keit der erzielten Vernderungen
retischen Entwurf vorliegenden Unterrichts-
Vernderungen des Bildes von der Psycholo-
materialien und Testverfahren wurden im
gie
Psychologieunterricht endgltig ausformu-
Abhngigkeit der erzielten Wirkungen von
liert und adaptiert.
der Lnge des Psychologieunterrichtes: Bei
Bedingungskontrolle des Unterrichtsverlau- Schlern, die am krzeren Psychologieun-
fes: Untersuchung hemmender und frdern-
terricht teilnahmen, zeigten sich weniger
der Unterrichtsbedingungen, Kontrolle der
umfassende und qualitativ weniger tief-
Realisierung der Curriculumintentionen.
gehende kognitive und affektive Umstruktu-
Wirkung des Psychologiecurriculums: Ermitt- rierungen, als bei den Schlern, die am ln-
lung der kognitiven und affektiven lern-
geren Unterricht teilnahmen.
zielbezogenen Auswirkungen des Psycho-
Der Lehrereinflu ist zwar relativ gering, hat
logiecurriculums
aber eine bedeutende Funktion bei der Fr-
Beurteilung des Psychologiecurriculums: Ein- derung affektiver Engagements der Schler.
schtzung bestimmter curricularer Merkmale
Konsistente Einschtzung des Psychologie-
durch unmittelbar Beteiligte.
curriculums durch Schler aus verschiedenen
Experimentalgruppen und Vernderungen in
Die Fragestellungen mit summativer Zielrich-
der Beurteilung im Verlauf des Curriculums;
tung sind im folgenden dargestellt (Seiffge-
Besttigung curricularer Intentionen durch
Krenke, 1981. S. 241 f.):
die Analyse von Anschauungsmaterial aus
den Unterrichtsstunden der Experimental-
Studie 1: Vergleichende Evaluation
gruppen
Fragestellung: Ermittlung der Gte des Psycho-
Schler der Experimentalgruppen sind nach
logiecurriculums im Vergleich zu herkmmli-
der Teilnahme am Psychologieunterricht
chem Psychologieunterricht (90 Schler).
durch das neue Psychologiecurriculum den
Wissenschaftler hnlicher als ihrer eigenen
Studie 2: Kreuzvalidierung
Bezugsgruppe, die whrend des gleichen Zeit-
Fragestellung: Replikation von Studie 1: Ermitt-
raumes an einem gewhnlichen Psycholo-
lung der Personenunabhngigkeit und Wieder-
gieunterricht teilnahmen. Allerdings ist die
holbarkeit der Effekte (125 Schler).
Angleichung nicht vollstndig, es gibt viel-
mehr einige wichtige und interessante Unter-
Studie 3: Stabilittsuntersuchung:
schiede.
Fragestellung: berprfung der Stabilitt der in
Studie 1 ermittelten Effekte (62 Schler).
8. Abschlieende Kritik
Studie 4: Expertenstudie
Frau Seiffge-Krenke hat das von ihr entwickelte
Fragestellung: Ermittlung von externen Krite-
Psychologiecurriculum selbst evaluiert und da-
rien zur Beurteilung der Wirkung des Psycho-
bei grten Wert auf externe Validitt und eine
logiecurriculums (27 Hochschullehrer der Psy-
laufende Verbesserung des Projektentwurfs an-
chologie).
hand neuer Ergebnisse (formative Evaluation)
gelegt. Unter diesen Zielsetzungen hatte dann
7. Wichtige Ergebnisse
zwangslufig die interne Validitt zu leiden.
Deutliche kognitive und affektive Umstruk- Eine kurze kritische Stellungnahme zu einer
turierung in Richtung einer zunehmenden so umfangreichen Studie vorzunehmen mu,
Wissenschaftsorientierung in den Experi- sowohl fr den Kritiker als auch fr den Eva-
mentalgruppen. Eine gegenlufige Entwick- luator, ein unbefriedigendes Unterfangen blei-
lung ist bei den Kontrollgruppen zu verzeich- ben, das in keinem Fall der Evaluationsstudie
nen. gerecht werden kann.
Einsatzgebiete psychologischer Evaluation 79
3.3.3 Evaluation im forensischen vers diskutiert. Die verschiedenen Positionen
Bereich beinhalteten Aussagen von es gibt sehr groe
Erfolge bis es gibt kaum Erfolge. In dieser
Als drittes Beispiel wird eine Arbeit vorgestellt, Evaluationsstudie untersucht Ortmann den Er-
die sich mit einer typischen Fragestellung aus folg und die Gre des Erfolges der sozial-
dem forensischen Bereich beschftigt. therapeutischen Behandlung.
Der Erfolg oder der Mierfolg der Sozial-
therapeutischen Anstalten im Bezug auf die 2. Evaluationsobjekt
Resozialisierungseffekte wird in der Bundesre-
publik wird seit den siebziger Jahren teilweise Die Studie umfate 250 Gefangene in Haftan-
sehr kontrovers diskutiert. stalten des Landes NRW.
Zu der Bedeutung des Resozialisierungs-
oder Behandlungsvollzuges hat sich 1983 3. Evaluationsort
auch das Bundesverfassungsgericht geuert
(Beschlu vom 28.06.1983). Es vertritt die Bei Ortmanns Untersuchung handelt es sich
Meinung, da das Ziel des Strafvollzuges um eine Feldstudie.
vornehmlich, also nicht ausschlielich, dar- Die Gefangenen waren in den sozialtherapeu-
in besteht, den Gefangenen zuknftig auf tischen Haftanstalten Dren und Gelsenkir-
ein Leben in sozialer Verantwortung und chen, sowie in mehr als zehn Regelvollzugs-
ohne Straftaten vorzubereiten. (s. du Menil, anstalten in NRW inhaftiert.
1994)
Seit den ersten Reformbemhungen in den 4. Zielsetzung
sechziger Jahren bis zum heutigen Zeitpunkt,
ist die groe Zahl an Schwierigkeiten kaum zu Ziel der Studie war es, festzustellen ob, und
bersehen. Gerade die in letzter Zeit wieder wenn, wie gro der (positive) Effekt des Sozial-
vermehrt gefhrten Diskussionen ber die therapie auf das Legalverhalten der Probanden
mglichen Behandlungs- und Prventions- nach deren Entlassung ist. Als Zwischen-
manahmen in dem Bereich der Sexual- kriterium des Erfolges wurde auf positiven Aus-
straftter zeigen das ganze Ausma der Proble- wirkungen der Sozialtherapie schon whrend
matik. der Inhaftierung geachtet, Sie betreffen die Per-
Grundlage dieser Diskussionen, die sowohl snlichkeit des Tters, seine soziale Situation
von der Bevlkerung, der Fachffentlichkeit etc.
als auch von der Politik gefhrt werden, sind
einerseits die reformpolitischen Richtungen 5. Design und Untersuchungsmethodik
der beteiligten Parteien, andererseits die in die-
sem Bereich durchgefhrten Evaluations- Fachdienste (Psychologen, Pdagogen, Sozial-
studien (vgl. Lsel, 1994, Dnkel, 1980). arbeiter, Theologen) der jeweiligen Justiz-
vollzugsanstalten und die Fachdiensten der
sozialtheapeutischen Anstalten begutachteten
Fallbeispiel 3: Resozialisierungseffekt der die Gefangenen, die sich um Verlegung in eine
Sozialtherapie sozialtherapeutische Anstalt beworben hatten
Die sozialtherapeutischen Haftanstalten stell-
Anhand der experimentellen Lngsschnittstu- ten Paare von, als geeignet begutachteten In-
die zum Resozialisierungseffekt der Sozialthera- sassen zusammen, aus dieser Population wurde
pie von R. Ortmann, 1994 sollen hier die Be- nun nach dem Zufallsprinzip die Experimen-
sonderheiten der Evaluation im forensischen tal- und Kontrollgruppe gezogen.
Bereich dargestellt werden.
Zur Experimental- und Kontrollgruppe gehr-
1. Problemstellung ten jeweils 114 Probanden.

In den letzten ca. 25 Jahren wurden die Erfolge Folgende Erhebungsinstrumente wurden einge-
der sozialtherapeutischen Behandlung kontro- setzt:
80 Einsatzgebiete psychologischer Evaluation

Freiburger Persnlichkeitsinventar zeitpunkten, der Gieen-Test zum 3. Mezeit-


Gieen-Test punkt) zeigen im Lngsschnitt einen breiten,
Interview 2 Jahre nach Haftentlassung gruppenunabhngigen Trend zur Verbesserung
Aktenlage bezglich der eventuellen Wieder- der Kriterienwerte mit der Haftzeit.
inhaftierung Hauptergebnis der Untersuchung, so der Au-
tor, ist der geringe Effekt der Sozialherapie.
Die Phase der Datensammlung erstreckte sich Der Vergleich zwischen Experimental- und
ber 8 Jahre, 1990 wurden die letzten Inter- Kontrollgruppe, dieser stellt den strengsten
views gefhrt. Mastab bezglich des sozialtherapeutischen
Das Untersuchungsdesign enthlt 4 Mezeit- Erfolges dar, lt weder fr die Wiederin-
punkte: haftierung noch fr die selbstberichtete Delin-
quenz auch nur einen Hauch einer Tendenz
1. zu Beginn der Sozialtherapie-Experimental-
zugunsten der Sozialtherapie erkennen. (Ort-
gruppe
mann, 1994). Die Experimentalgruppe setzte
2. ca. in der Mitte der sozialtherapeutischen
sich aus den Vollteilnehmern der Sozialthera-
Behandlung-Experimentalgruppe
pie und den Gefangenen zusammen, die die
3. kurz vor der Entlassung aus der Haft
Sozialtherapie vorzeitig abbrachen und in den
4. zwei Jahre nach der Haftentlassung
Regelvollzug rckverlegt wurden.
Der Untersuchungsplan wird in Diagramm III/10 Werden die Vollteilnehmer der Sozialthera-
dargestellt. pie, diese Gruppe bezeichnet Gefangene, die
die komplette Sozialtherapie absolviert haben,
6. Evaluationsmodell mit der Kontrollgruppe verglichen zeigt sich
kein deutlicher Effekt der Sozialtherapie in Be-
Die Untersuchung von Ortmann entspricht den zug auf das Hauptkriterium Legalverhalten
wesentlichen Kennzeichen einer summativen Eva- nach Haftentlassung.
luation, wie sie im Diagramm III/6 dargestellt sind.
8. Abschlieende Kritik
7. Wichtige Ergebnisse
Vorteile der Untersuchung
Die Ergebnisse der zu allen Mezeitpunkten
durchgefhrten Persnlichkeitstests, (das Frei- Die Untersuchung besitzt ein relativ starkes,
burger-Persnlichkeitsinventar bei allen 4 Me- nach Kausalursachen forschendes Design

Diagramm III/10
Untersuchungsplan der experimentellen Lngsschnittstudie von Ortmann, 1984

Entscheidung nach Haftphase, Nach Haftentlassung


dem Zufallsprinzip Betreuung, Behandlung
aus der Bewerber-
gruppe

Sozialtherapie 1. Mezeitpunkt 2. Mezeitpunkt 3. Mezeitpunkt 4. Mezeitpunkt


(Experimental-
gruppe) N = 103 N = 100 N = 90 N = 71
N = 114

1. Mezeitpunkt 2. Mezeitpunkt 3. Mezeitpunkt 4. Mezeitpunkt


Regelvollzug
(Kontrollgruppe) N = 111 N = 104 N = 89 N = 80
N = 114
Einsatzgebiete psychologischer Evaluation 81
Die Experimental- und Kontrollgruppen wur- Fazit
den streng nach dem Zufallsprinzip ausge-
whlt Die von Ortmann 1994 verffentlichte Lngs-
Die Effekte wurden mit verschiedenen Me- schnittstudie zum Resozialisierungseffekt der
instrumenten erhoben Sozialtherapie zeigt auf eindrucksvolle Weise,
Es gab, ber einen Untersuchungszeitraum wie Evaluation auch unter sicherlich groen
von acht Jahren gesehen,einen sehr gerin- organisatorischen Problemen mglich ist.
gen Ausfall von Probanden (16%) Gekennzeichnet ist die Studie durch ihre in-
Die 4 Mezeitpunkte erlauben Aussagen ber tensive Bemhung, eine systematische, em-
die Stabilitt von Effekten pirisch gesttzte Optimierung der Manahme
Sozialtherapie zu erreichen.
Wie in den vorhergehenden Abschnitte dar-
Nachteile der Untersuchung gestellt, treten vor allem besondere Probleme
hinsichtlich der Zielexplikation und der
Das Zufallsprinzip zur Bildung der Stichpro- Nutzenbestimmung auf, also Fragestellungen
ben kann ethische Fragen aufwerfen im Projektverlauf, die den eigentlichen Kern der
Das zu dem 4. Mezeitpunkt verwendete In- Evaluation bilden. Diese Problembereiche wer-
strument Nachbefragung zwei Jahre nach den daher ausfhrlich im nachfolgenden vier-
Haftentlassung wird nicht nher erlutert ten Kapitel besprochen.
Die genannten Zwischenkriterien, (Persn-
lichkeit des Tters, seine soziale Situation),
sind nicht nher definiert
82 Einsatzgebiete psychologischer Evaluation

bersicht Kapitel 3:
Einsatzgebiete psychologischer Evaluation
3.1
Einteilungsgesichtspunkte fr Evaluationsstudien
Idealtypische Klassifikationsraster fr Evaluationsstudien sind nicht mglich!

Gruppen von Evaluationsobjekten Probleme bei der Bestimmung von Orte der Evaluation
Personen, Produkte Evaluationszielen Evaluation im Feld (Unterneh-
Umwelt- und Umgebungs- Zielexplikation men, Klinik etc.)
faktoren Heterogenitt der Zielstrukturen Evaluation im Labor
Techniken und Methoden Vernderbarkeit der Ziele Groer Anteil an Evaluationen
Zielvorgaben, Programme, whrend der Evaluation im berschneidungsgebiet
Projekte Feld/Labor
Systeme und Strukturen Mgliche Zielstrukturen der
Forschungsergebnisse u. Auftraggeber:
Evaluationsobjekte Bewertung ohne detailliertes
Ziel
Verantwortungsdelegation
Durchsetzungs- und Ent-
scheidungshilfe
Optimierungsgrundlagen
Evaluationsnutzung
Evaluationsmodell Evaluationsberiche Bei der Gestaltung des Evaluations-
Entscheidungssituation Bildungssektor, Wirtschaft projektes mitbercksichtigen =
Entscheidungsbedingungen Agrar- und Verkehrspolitik praktische Umsetzung der Ergebnisse
Art der verwendeten Instru- Familien- und Sozialpolitik Beispiele:
mente und Verfahren Justizvollzug, Gesundheits- geschlossene Selbstevaluation
Ausma der Przision bei der wesen Ergebnisse dienen Macht-
Sammlung und Analyse von Arbeits- und Beschftigungs- entscheidung
Informationen politik Ergebnisse fr die Fach-
methodische Fhigkeiten der Umweltpolitik ffentlichkeit
Evaluatoren und ihrer Adressa- Stdtebau- und Wohnungs- Ergebnisse werden fr eine
ten politik politische Entscheidung ver-
Militrischer Bereich wendet und verffentlicht usw.

3.2
Evaluation als interdisziplinres Feld
Evaluation als integrativer, Politikfelder berschreitender Faktor
Evaluationsforschung = Problem Ziel
interdisziplinres Feld Mangelnde Zusammenarbeit der Integrative Zusammenarbeit
verschiedenen Fachdisziplinen z.B.
Wirtschaftswissenschaften,
Psychologie, Soziologie

Entwicklung der Evaluationsforschung


USA BRD
Anfnge in sozialpolitischen Reformprogrammen der Anfnge Ende der sechziger, Anfang der siebziger
sechziger Jahre. Heute fester Bestandteil bei der Jahre im Rahmen politischer Reformprogramme,
Programmplanung, -realisierung, -kontrolle und vor allem im Bildungsbereich. Heute expandierende
-finanzierung, zunehmende Professionalisierung der Wirtschaftsrichtung, aber noch fehlt eine echte
Evaluatoren Professionalisierung

3.3
Evaluation in der Praxis
In der Wirtschaft z.B. als Als Entwicklungsinstrument im Optimierungs- und Kontrollmittel im
Managementmittel Schul- und Bildungswesen Bereich des Justiz- und Sozialwesen
83

4. Zielexplikation und
Bewertungskriterien

Evaluation ist nie Selbstzweck. Die Bewertung Evaluationsprojekt skizziert. Prinzipiell die glei-
von Manahmen, Organisationsformen oder che Struktur lt sich auch auf die anderen ty-
Einzelpersonen macht nur dann Sinn, wenn pischen Fragestellungen (Vergleich einer Alter-
auf der Grundlage dieser Ergebnisse praktische native mit einem normativen Standard bzw. das
Konsequenzen eingeleitet werden, etwa die Aufzeigen von subjektiven Defiziten gegenber
Auswahl der besseren Alternative oder die Erwartungen; vgl. Abschnitt 2.1.3) anwenden.
Durchfhrung von Verbesserungen durch In- Leider sind die Fragen der Zielsetzung in vielen
terventionen (Organisationsnderungen, Wei- Evaluationsprojekten die grte Schwachstelle,
terbildung etc.). Dieses besser/schlechter setzt deren insuffiziente Ausfllung die Praxisrele-
ein (subjektiv bewertetes) Ziel voraus, das durch vanz (und damit in den meisten Fllen auch
die einzelnen Alternativen in mehr oder weni- die Rechtfertigung) des Projektes beeintrchtigt.
ger vollkommener Weise erreicht wird. Oder Es ist gerade bei sozialwissenschaftlich interes-
anders formuliert: Die Evaluation dient dazu, santen Themen nicht einfach, berhaupt zu
die Grundlage fr ein nutzenmaximierendes Beginn des Projektes einen Konsens ber Ziel-
Verhalten zu optimieren. Der Begriff Nutzen setzung und Nutzenaspekte herbeizufhren;
ist natrlich in voller Breite zu verstehen, und noch schwieriger ist es, solche Vereinbarungen
in keiner Weise auf finanzielle Aspekte be- auch als Grundlage fr die nachtrgliche Be-
schrnkt. wertung von Projekten beizubehalten, wenn
unerwnschte Ergebnisse auftraten oder die
Fr die effiziente Gestaltung eines Projektes ist inzwischen stark genderten Rahmenbedin-
es daher unverzichtbar, zu wissen gungen eine andere Projektausrichtung htten
sinnvoll erscheinen lassen.
in welchem Verwertungszusammenhang die
Ergebnisse zu sehen sind (Zielexplikation,
4.1) 4.1 Zielexplikation
welche Kriterien dafr herangezogen werden
sollen (Bewertungsproze, 4.2) Die Freirume des Evaluators schwanken in Ab-
wie der Nutzen der aufgetretenen Auspr- hngigkeit vom Auftraggeber und dem konkre-
gungsgrade der Kriterien einzuschtzen ist ten Arbeitsfeld sehr stark. Manchmal sind die
und wie auf dieser Basis eine globale Alter- Vorgaben so strikt, da sich eine berlegung
nativenbewertung erfolgen kann (Bewer- zur Zielsetzung erbrigt, wenn man persnlich
tungs- und Entscheidungshilfemethoden, bereit ist, auch ohne Kenntnis der spteren Ver-
4.3) wendung ein solches Projekt durchzufhren
(etwa: Stellen Sie fest, wieviele Personen die
Im Diagramm IV/1 ist die Struktur dieses Problem- von uns zugeschickten Informationsbrosch-
bereiches als Leitfaden fr die folgenden Aus- ren gelesen haben). Der Evaluator beschrnkt
fhrungen am Beispiel eines Problems der sich dann auf die Rolle eines Datensammlers,
Alternativenauswahl (summativ) durch ein der die gewnschte Teil-Sachinformation liefert
84 Zielexplikation und Bewertungskriterien

Diagramm IV/1
Phasen eines Evaluationsprojektes am Beispiel eines Problems der Alternativenaus-
wahl (summativ)

Arbeitsschritte Hilfen

1. Nutzenbestimmung fr wen?
(Identifizierung von Personen oder
Organisationen, deren Nutzen maximiert
werden soll)
Gesprchs- und Kommunikationstechniken
2. Nutzenbestimmung von was?
(Identifizierung des Problems, d.h. der
Entscheidung fr die der berechnete
Nutzen relevant ist)

3. Identifizierung der zu evaluierenden


Alternative(n)

4. Zusammentragen der relevanten


Bewertungskriterien Zielexplikationsverfahren

5. Zielanalyse
(Wie soll die optimale Alternative auf der/
den Bewertungskriterien aussehen?)

6. Nutzenmessung
(Festlegung des Nutzens fr jedes Verfahren der Nutzenmessung
Bewertungskriterium und jede Alternative)

7. Nutzenverrechnung
(Zusammenfassung der Nutzenwerte pro
Alternative) Bewertungs- und Entscheidungshilfe-
methoden
8. Entscheidung an Hand der in der
Zielanalyse festgelegten Kriterien

und sonst nichts. Die Fragen der Zielfindung Verwertbarkeit der Ergebnisse aufgrund seiner
werden dadurch natrlich nicht aufgehoben, Projektdurchfhrung bernehmen mu
sondern nur vom Evaluator auf den Auftragge- (Schauen Sie sich einmal unsere Weiterbil-
ber verlagert. dungsangebote an, irgend etwas luft da nicht
Hufiger findet man bei sozialwissenschaft- so ganz richtig , Stellen Sie fest, welche Psy-
lich gesttzter Evaluation das andere Extrem: chotherapie fr unsere speziellen Patienten am
Der potentielle Auftraggeber hat eine so vage besten ist). Hier ist eine besonders intensive
Vorstellung von seinen Wnschen, da der Aufklrung des Auftraggebers ntig, die manch-
Evaluator die faktische Verantwortung fr die mal bei Vorhaben der ffentlichen Hand oder
Zielexplikation und Bewertungskriterien 85
grerer Konzerne zu einem Projekt fr sich Probleme gegen das Selbstbild vieler Auftragge-
werden kann. ber verstt. Wenn das Projekt aufgrund sol-
Der Regelfall ist, da von Seiten des Auftrag- cher Schwierigkeiten suboptimal wird, ist dies
gebers zu Beginn des Projektes eine gewisse Vor- nur bedingt dem Evaluator anzulasten. Die
gabe der Zielsetzung vorliegt, da sie aber nicht sinnvolle Verwendung von Rckmeldungen
so rational und konkretisiert ist, da nicht durch empirische Evaluationen setzt eine ge-
durch die Hilfe des Evaluators noch wesentli- wisse Organisationskultur voraus (5.1.3), die
che Verbesserungen mglich wren. Einige nicht kurzfristig und schon gar nicht bezogen
dafr bewhrte Vorgehensweisen werden in auf ein Einzelprojekt allein erreicht werden
den folgenden Abschnitten kurz skizziert. kann.
Behandelt werden Aspekte der Zielgruppenbe-
stimmung, der Konkretisierung der Evalua-
tionsobjekte sowie die Mglichkeiten antizipa- 4.1.1 Zielgruppenbestimmung
torischer berlegungen der Verwendung von
Projektergebnissen. Es berrascht immer wieder, wie eingeschrnkt
viele Auftraggeber zunchst das Evaluations-
projekt sehen. Dies betrifft sowohl die zu eva-
Konflikte luierenden Alternativen (oft kann man hier
Vorschlge hinzufgen, etwa bei vergleichend
Wesentlich erschwert kann die Arbeit zu diesen ins Auge gefaten Therapiemanahmen oder
Punkten durch das Vorliegen von Konflikten in- Frdermglichkeiten von Mitarbeitern), als
nerhalb des Auftraggebers werden. Halbwegs auch die betroffenen Personen. So werden
bewltigbar sind die dadurch verursachten Pro- zum Beispiel in Kliniken von unterschiedlichen
bleme bei institutionalisierten Konflikten, wenn Therapien nicht nur die Patienten, sondern
also die Kontrahenten aufgrund ihrer Funktion auch deren Angehrige, die Pfleger und Kran-
(verschiedene politische Parteien, partiell kon- kenschwestern, die Therapeuten und manch-
kurrierende Abteilungen eines Unternehmens, mal sogar, wenn etwa die allgemeine Zeit-
verschiedene organisierte Interessengruppen wie planung zu verndern ist, auch das gesamte
zum Beispiel im Gesundheitswesen) klar erkenn- Hilfspersonal (zum Beispiel Kche) tangiert,
bar sind und es aufgrund dieser Organisations- ganz zu schweigen von den Kostentrgern der
form auch zulssig ist, offen die unterschiedli- Manahme. Der Evaluator kann durch eigene
chen Schwerpunktsetzungen zu betonen. In Vorschlge den Gesichtskreis erweitern, und
solchen Fllen empfiehlt sich fr den Evaluator dieses ist auch ein vor allem in Einzelgespr-
absolute Offenlegung seiner Planungen, Integra- chen oft gewhltes Vorgehen. Es besteht aber
tion der unterschiedlichen Meinungen durch die Gefahr, da solche von auen kommen-
Aufnahme mglichst vieler gewnschter Aspek- den Vorschlge vom Auftraggeber nicht ohne
te (zu dem damit verbundenen Vorgehen vgl. weiteres akzeptiert werden, daher ist es besser,
die entsprechenden Ausfhrungen im Abschnitt die Gesprchspartner selbst auf erweiterte Ideen
4.2), und, falls ein solcher Konsens nicht mg- kommen zu lassen. Hierbei kann man sich vor
lich ist, das Bestehen auf formalisierten Entschei- allem in Gruppensitzungen einer Flle von im
dungen gem den in der jeweiligen Situation Bereich der betrieblichen Weiterbildung ein-
zwischen den Kontrahenten vereinbarten (de- gefhrten Kreativittstechniken bedienen
mokratischen) Spielregeln. (vgl. dazu etwa Geschka, 1988; Preiser, 1976),
Nahezu unlsbar wird die Situation bei ver- fr die Zielgruppenbestimmung besonders
deckten Konflikten, wie sie vor allem durch per- empfehlenswert sind hierarchisch gesteuerte
snliche Antipathien oder Konkurrenz- Assoziationsketten.
situationen innerhalb der auftraggebenden
Institutionen entstehen knnen. Selbst wenn
der Evaluator rechtzeitig auf solche Probleme Beispiel fr Assoziationsketten
aufmerksam wird (was hufig nicht der Fall ist),
hat er kaum die Mglichkeit, Konfliktlsungs- Dieses Vorgehen lt sich am leichtesten an
techniken einzusetzen, da das Zugeben solcher einem Beispiel illustrieren. Ausgangspunkt sei
86 Zielexplikation und Bewertungskriterien

der Wunsch eines Schulbuchverlages, zu pr- Klassenstufe / Schulform / Intelligenz / Vor-


fen, ob durch advanced organizer (vor jedem kenntnisse/Arbeitsmotivation/Geschlecht/
Kapitel bzw. Abschnitt wird eine bersicht ber Hausaufgabenbetreuung/u.s.w.
die folgenden Ausfhrungen geboten, um dem
Leser den schnellen Aufbau einer entsprechen- Es kann sein, da man die einzelnen Einteilun-
den kognitiven Struktur zu ermglichen; vgl. gen unverbunden nebeneinander stehen lassen
etwa Bruner, 1963) die Verstndlichkeit von kann. In manchen Fllen ist es aber angezeigt,
Texten (und damit die Verbreitung des Buches) fr eine genauere Zielgruppenbestimmung
verbessert werden kann. Man kann die so for- Kombinationen zu bilden, also etwa Schler
mulierte Fragestellung direkt aufgreifen und das der Klasse 6 am Gymnasium ohne Unter-
gesamte Projekt darauf beschrnken. Man er- sttzung bei den Hausaufgaben. Ob solche
hlt dann ein laborexperimentelles Design, in Ketten notwendig sind, hngt davon ab, in
dem randomisierte Schlergruppen verschiede- wieweit Wechselwirkungen zwischen den ein-
nen Materialvariationen ausgesetzt und hin- zelnen Definitionsteilen hinsichtlich der Frage-
sichtlich ihres Textverstndnisses geprft wer- stellung plausibel sind.
den. Einfach, berschaubar und kostengnstig Eine weitere Verfeinerung entsteht durch die
durchfhrbar aber nicht unbedingt ein fr Kombination der Teilgruppen verschiedener
die praktische Entscheidung des Verlages wirk- Obermengen, soweit dies sachlich sinnvoll ist.
lich relevantes Evaluationsprojekt. Ein Beispiel: Schler der Klasse 6 an einem
Mchte man mit Hilfe hierarchischer Asso- Gymnasium ohne Hausaufgabenbetreuung,
ziationsketten die Zielsetzung nher abklren, die bei einem lteren Lehrer mit besonderer
so kann man zunchst berlegen, welche Per- Vorliebe fr Frontalunterricht das Fach Eng-
sonengruppen mit dem Buch unmittelbar Kon- lisch lernen, deren Eltern keine Kenntnisse in
takt haben werden, also etwa Englisch haben und wenig an dem Schulerfolg
ihrer Kinder interessiert sind.
Autor/Lehrer/Schler Die einfache Methodik des Bildens eventuell
relevanter Subgruppen durch Kombination aus
Kurzes Nachdenken zeigt, da diese Gruppie- verschiedenen Obermengen ergibt eine nahezu
rung nicht vollstndig ist; man mu zumindest unbersehbare Vielfalt von potentiellen Ziel-
erweitern auf gruppen, so da die eigentliche Aufgabe der
Zielgruppenbestimmung dann nicht mehr in
Autor/Verlag/Lehrer/Schler/Eltern dem Finden von mglichen Ideen, sondern in
der Reduktion auf die wirklich wesentlich er-
Da Schulbcher auch zugelassen und gekauft scheinenden Teilgruppen besteht. Im Beispiel
werden mssen, sollte man erweitern auf der advanced organizer wird man zumindest
berlegen, das ursprngliche Einfach-Design
Autor/Verlag/Schulbehrden/Hndler/Leh- um Aspekte des Entwicklungsgrades der Sch-
rer/Schler/Eltern ler, des Faches, der Unterrichtsmethodik des
Lehrers und evtl. des Ausmaes an Unterstt-
Damit hat man eine Zusammenstellung von zung bei schulischen Aufgaben zu Hause zu
Personen-Obermengen, die eine ganz gute erweitern, wobei man natrlich nicht zwangs-
Grundlage fr eine feinere Ausdifferenzierung lufig alles neu empirisch untersuchen mu,
bieten. Man greift jede dieser Begriffe heraus sondern teilweise auf vorhandene Forschungs-
und berlegt, welche Einteilung (Ausdifferen- ergebnisse zurckgreifen kann. Auerdem wird
zierung) irgendwie relevant fr das zu evaluie- man darauf hingewiesen, da nicht nur der
rende Problem sein knnte. Fr die Population Lernerfolg, sondern auch Aspekte wie Akzep-
Lehrer wre dies etwa tanz durch die Lehrer (ohne die sich ein Schul-
buch wohl nicht durchsetzen kann), der durch
Alter/beruflicher Status/Fach/Unterrichts- solche didaktische Hilfen vernderte Umfang
methodik/Schulform/u.v.a. und natrlich auch der Preis mit bercksichtigt
werden mssen (vgl. dazu die Kriterienexpli-
oder fr die Schler kationen in Abschnitt 4.2).
Zielexplikation und Bewertungskriterien 87
4.1.2 Konkretisierung des zge? u.s.w.), Psychotherapie bei Suchtkran-
Evaluationsobjektes ken, Offener Strafvollzug oder Stationre
Altenversorgung.

Die fr Psychologen und andere empirisch ori-


Da vom Auftraggeber im allgemeinen nicht die
entierte Sozialwissenschaftler selbstverstndli-
kreative Gestaltung aller mglichen Manah-
che Trennung zwischen theoretischem Begriff
men erwartet werden kann, sondern eher die
(Konstrukt) und operationalisierten, empirisch
Auswahl aus mehreren Vorschlgen des
erfabaren Indikator ist den meisten Auftrag-
Evaluators, empfiehlt es sich, zunchst eine
gebern von Evaluationsprojekten nicht gelu-
Vielzahl mglicher Gestaltungsdimensionen zu
fig. Wenn diese Frage berhaupt gesehen wird,
erarbeiten. Als Techniken dafr bieten sich, je
scheint man hufig zu meinen, da ihre L-
nach Problemstellung, an:
sung ein Teil der Aufgabe des Evaluators sei.
Dieser kann aber die erforderlichen Konkreti- Sorgfltige Analyse der bereits empirisch vor-
sierungen nur auf der Basis einer mglichst gu- handenen unterschiedlichen Ausprgungen
ten Kenntnis der Zielsetzung vorschlagen. Es der zu evaluierenden Manahme auf den re-
ist in Anbetracht der Wichtigkeit dieses Punk- levanten Dimensionen (Literaturstudium,
tes fr die sptere Verwendung der Ergebnisse Hospitationen, Experteninterviews)
dringend zu empfehlen, die so erstellten Vor- Gruppendiskussionen (mit verschiedenen
schlge vom Auftraggeber prfen und mg- Betroffenen, Prponenten bestimmter Ent-
lichst formell festlegen zu lassen. scheidungsideen, Auftraggeber und eventu-
elle Experten)
Schon an einem so einfachen Problem wie die
Brain-Storming-Techniken, insbesondere
mit Mitarbeitern des Auftraggebers und des
advanced organizer wird die Beeinflussung
Projektteams (siehe dazu Diagramm IV/2) und
der Ergebnisse durch die konkrete Festlegung
hnliche kreativittsfrdernde Gruppenver-
dieses Begriffes in der Untersuchung deutlich.
fahren
Die Realisierungsmglichkeiten fr advanced
organizer reichen schon rein optisch von ei-
nem kleinen Kasten im Kleindruck mit aus-
Ausfhrliche Darstellungen finden sich bei
schlielicher Angabe der kommenden Zwi-
Osborn (1963), Ulmann (1968), Preiser (1976),
schenberschriften bis hin zu mehrseitigen
Sturm (1978) und Geschka (1988).
Darstellungen; inhaltlich von einer bloen Auf-
zhlung der folgenden Hauptpunkte bis hin zu
Die verschiedenen Ausprgungsgrade der so er-
einer umfassenden, evtl. noch Sekundraspekte
haltenen Gestaltungsdimensionen knnen
mit beinhaltenden Begrndung gerade dieser
dann systematisch kombiniert werden, zum
Auswahl und Reihenfolge. Wahrscheinlich wir-
Beispiel in Anlehnung an die Faccettentheorie
ken sich diese Gestaltungs-Details strker auf
(Guttman, 1957). Im allgemeinen werden nur
relevante Bewertungskriterien, wie Verstnd-
wenige Kombinationen aus Sachgrnden ent-
lichkeit, Akzeptanz und Kosten aus als die blo-
fallen (etwa bei den advanced organizern die
e Unterscheidung zwischen dem Vorhanden-
Kombination von Maximal 5 Zeilen Platz
sein oder Nichtvorhandenseins irgendeines
und Sorgfltige inhaltliche Begrndung der
advanced organizers.
folgenden Abschnitte), so da selbst bei nur
wenigen dem Auftraggeber und dem Evaluator
Je komplexer die zu evaluierende Manahme relevant erscheinenden Gestaltungsdimensio-
ist, um so vielfltiger wird der Gestaltungs- nen eine viel zu groe Vielfalt potentieller
spielraum. Man denke etwa an Begriffe wie Ge- Konkretisierungen vorliegt. Bei der fr ein
samtschule (halbtags oder ganztags? freiwillige durchfhrbares Projekt nicht vermeidbaren Be-
oder gegen ihren Wunsch dorthin versetzte grenzung auf wenige Varianten sollten die sp-
Lehrer? normale Schler/Eltern oder an dieser tere praktische Verwendung der Ergebnisse und
Schulform besonders interessierte? additiv, in- die in Zukunft zu erwartenden Rahmenbedin-
tegriert oder kooperativ? Anzahl der Parallel- gungen beachtet werden (vgl. 4.3.3).
88 Zielexplikation und Bewertungskriterien

Diagramm IV/2
Kurzdarstellung der Brain-Storming-Methode (nach Osborn, 1963)

Grundlagen Richtlinien fr die Durchfhrung (vgl. Sturm,


1979):
Beim Brainstorming handelt es sich um eine
Technik zur kreativen Problemlsung, die 1. Vorbereitung
nach dem Prinzip der freien Assoziation Brain-Storming-Sitzungen sollten nicht spon-
arbeitet. Sie zielt darauf ab, die negativen Er- tan einberufen werden, sondern sind gut vor-
scheinungen von Konferenzen und Diskus- zubereiten. Komplexe Probleme sollten auf-
sionsrunden wie z.B. destruktive Kritik, Riva- gespalten und in getrennten Sitzungen
litt unter den Teilnehmern, Verzettelung in aufgearbeitet werden.
unwichtige Einzelheiten zu berwinden. Beim
2. Teilnehmerzahl
klassischen Brainstorming sind grundstzlich
Die angemessene Teilnehmerzahl fr eine
die Phasen Ideenfindung und Ideen-
Brain-Storming-Sitzung liegt zwischen vier bis
bewertung voneinander zu unterscheiden. In
sieben Teilnehmern.
der Phase der Ideefindung, auch green-light-
stage genannt, werden die Teilnehmer vom 3. Killerphrasen
Moderator aufgefordert, zu einem spezifi- Whrend der Phase der Ideenfindung (green-
schen Problem mglichst viele Ideen zu pro- light-stage) ist jegliche Kritik sowohl posi-
duzieren. Die Betonung liegt hier also zu- tive als auch negative an den einzelnen Vor-
nchst auf der Quantitt der Einflle, nicht schlgen der Teilnehmer untersagt. Dazu sind
auf der Qualitt. In der anschlieenden Phase auch nonverbale uerungen zu rechnen.
der Ideenbewertung (red-light-stage) wer-
den die einzelnen, zuvor protokollierten Ideen 4. Problemprsentation
an Hand festgelegter Kriterien bewertet. Bei komplexen Problemen ist es empfehlens-
Ulmann (1966) hat zu diesem Zweck eine spe- wert, den Mitgliedern der Gruppe Gelegen-
zielle Technik entwickelt, die die Auswahl heit zu geben, die Problemstellung von einem
sinnvoller Ideen erleichtern soll. Dazu bewer- Fachexperten erlutern zu lassen, so da mg-
ten die Teilnehmer der Brainstorming-Sitzung liche Fragen beantwortet und Unklarheiten
alle Ideen an Hand der folgenden Kriterien: beseitigt werden knnen.

Einfachheit 5. Ideenflu
Realisierbarkeit Die Teilnehmer sollten dazu aufgefordert wer-
Schwierigkeitsgrad den, alle Ideen, die aufkommen, auch unge-
whnliche oder unrealistisch erscheinende,
Der Grad der Einfachheit, Realisierbarkeit auszusprechen. Die Einflle brauchen nicht
bzw. Schwierigkeit wird dazu auf einer ausfhrlich erlutert zu werden, es reicht die
Punkte-Skala eingetragen. Voraussetzung fr Andeutung des Gedankenganges.
das Gelingen einer Brainstorming-Sitzung
sind eine gute Vorbereitung und ein erfah- 6. Zeitlimit
rener Moderator, der die unbedingte Einhal- Eine Brain-Storming-Sitzung sollte den zeit-
tung der Grundregeln des Brainstormings lichen Rahmen von 30 Minuten nicht ber-
kontrolliert. schreiten.
Zielexplikation und Bewertungskriterien 89
4.1.3 Antizipatorische Fr eine grobe Abschtzung der durch die
Ergebnisverwertung Projektergebnisse denkbaren Situationsvern-
derungen und darauf gesttzte zustzliche
Untersuchungsziele kann man auch die Metho-
Gerade grere sozialwisssenschaftliche Evalua- de des Planspieles einsetzen (Diagramm IV/4; vgl.
tionsvorhaben leiden hinsichtlich der prakti- Rohn, 1980, 1986; Baehr & Eberle, 1986;). Da-
schen Verwendbarkeit besonders unter zwei bei mu man nicht an die (in anderen Berei-
strukturellen Gegebenheiten: chen hufigen) stark formalisierten und EDV-
gesttzten Varianten denken, es gengen ganz
Projektunabhngige Vernderungen der Rah- einfache Formen, die man vielleicht zur Ver-
menbedingungen bzw. Zielsetzungen. Durch
meidung von Miverstndnissen koordinierte
die Dauer der Projekte (meist mehrere Jahre)
Rollenspiele nennen knnte und kaum tech-
haben sich die Rahmenbedingungen und da-
nischen Aufwand erfordern. Den Teilnehmern
mit auch die Zielsetzungen des Auftraggebers
(evtl. tatschlich Betroffene oder Projekt-
verndert; die erzielten Resultate sollen aber
mitarbeiter) werden fiktive Projektergebnisse
gerade fr die neuen Umstnde aussagekrf-
vorgelegt und gebeten, gem der von ihnen
tig sein.
zu vertretenen Rolle das weitere Vorgehen fr
Nachtrgliche, ergebnisabhngige Verschie- die Lsung des mit dem Evaluationsprojektes
bungen. Die konkreten Ergebnisse des Pro-
bearbeiteten Problems zu diskutieren.
jektes knnen die Problemsicht der Beteilig-
Es stehen inzwischen gengend viele und
ten bzw. Betroffenen stark verndern, so da
auch im Kontext anderer Verwertungszusam-
jetzt neue Aspekte wichtig werden die man
menhnge ausreichend ausgebaute Sozial-
aber aufgrund einer ursprnglich anderen
techniken zur Verfgung, um die Zielsetzung
Zielsetzung nicht untersucht hat.
von Evaluationsprojekten wesentlich besser zu
fundieren, als es derzeit (noch) blicher Praxis
Die Lsung dieser beiden Probleme wrde eine entspricht. Die fehlende rechtzeitige elaborierte
exakte Zukunftsprognose voraussetzen, die Ausarbeitung der Zielsetzung ist zum Teil nicht
natrlich nicht mglich ist. Zumindest fr gr- vermeidbar, etwa aufgrund von Ressourcen-
ere Evaluationsvorhaben sollte man aber ver- mangel des Auftraggebers oder, hufiger, in An-
suchen, wenigstens grob die sptere Verwer- betracht der Zeitperspektive (fr die auch nur
tungssituation zu antizipieren. Ein hierzu grobe Anwendung der in diesem Abschnitt skiz-
geeignetes Mittel ist die Szenario-Technik zierten Techniken mte man in einem gre-
(vgl. Reibnitz, 1983), deren Grundgedanke im ren Projekt etwa 4 Monate veranschlagen). Wo
Diagramm IV/3 dargestellt ist. Es wird aufgrund es aber mglich ist, sollte man eine detaillier-
des Aufwandes selten mglich sein, eine idea- tere und mglichst begrndete Zielexplikation
le Szenario-Studie fr die Zielsetzung von Eva- anstreben.
luationsprojekten durchzufhren; aber schon
eine relativ grobe Abschtzung der erwartbaren
Vernderungen kann helfen, bei der Definition 4.2 Bewertungsproze
der Zielgruppe oder der Konkretisierung von
Evaluationsdetails Fehler zu vermeiden. Das Er- Nach Festlegung der (Teil-)Ziele mu man sich
gebnis kann durchaus der Verzicht auf das darber einigen, an welchen empirischen Be-
Evaluationsvorhaben selbst sein (als fiktives Bei- obachtungen man das Ausma der Ziel-
spiel: Evaluierung eines Ausbildungskonzeptes erreichung beurteilen mchte. Letztlich baut
der Bundesanstalt fr Arbeit fr die Umschulung der empirisch-wissenschaftliche Informations-
von Arbeitslosen zu Technischen Zeichnern in gewinn stets auf der Menge der erhobenen Aus-
Anbetracht der Verbreitung von CAD-Anlagen), prgungsgrade der ausgewhlten Indikatoren
meistens werden Projektteile dadurch akzentu- auf, so da das gesamte Ergebnis entscheidend
iert (etwa Evaluation von Manahmen zur Kran- von der konkreten Auswahl abhngt. Ob man
kenversorgung in Anbetracht der erwartbaren den Lernerfolg von Schlern in verschiede-
Bevlkerungszahl, Altersverteilung und Beitrags- nen schulischen Organisationsformen an den
aufkommen fr die Krankenversicherung). von den Lehrern vergebenen Noten, objekti-
90 Zielexplikation und Bewertungskriterien

Diagramm IV/3
Kurzdarstellung der Szenario-Technik (vgl. v. Reibnitz, 1983)

Definition Hauptachse des Trichters, die Extremszenarien


definieren die uere Hlle, der Trichter hat
Szenario-Technik ist eine systematische Me- seine punktfrmige Spitze in der Gegenwart
thodik zur Entwicklung und Beschreibung (hier fallen ja alle Szenarien zusammen) und
mglicher zuknftiger Situationen sowie zum erweitert sich im Verlauf der Zeit immer mehr,
Aufzeigen des Entwicklungsverlaufes, der zu so da dann die verschiedenen Szenarien im-
diesen Situationen gefhrt hat. Die Szenario- mer strker auseinanderklaffen. Je mehr Zeit
Technik besteht aus acht logisch aufeinander vergeht, um so unsicherer wird auch die Pro-
aufbauenden Schritten, die den gesamten Pro- gnose, da immer mehr unkontrollierte und
ze transparent und in allen Phasen nachvoll- nicht vorhergesehene Strereignisse die Ent-
ziehbar machen. wicklung verndern werden.
Ziel solcher Studien ist es vor allem, durch
Charakteristika rechtzeitig eingelegte Manahmen dafr zu
sorgen, da prognostizierte unerwnschte
Sorgfltige Analyse der gegenwrtigen Situa- Szenarien nicht Realitt werden.
tion Selbstverstndlich darf man auch die Ergeb-
Einbeziehung von quantitativen und quali- nisse sorgfltiger Szenario-Studien nicht als
tativen Aspekten unfehlbare Orakel interpretieren; sie bieten
Ermittlung von Annahmen fr die Haupt- aber immer dann, wenn man zuknftige Ent-
einflufaktoren wicklungen sinnvoll steuern mchte wie
Verfahrensmig relativ problemlose Verar- dies bei allen Fragen der antizipatorischen
beitung von Strereignissen oder prognostischen Evaluation der Fall ist
Entwicklung von alternativen, in sich kon- eine rationalere Grundlage als die persnli-
sistenten (= stimmigen) Zukunftsbildern (= chen Zukunftserwartungen.
Szenarien)
Ablauf
Zugrundeliegendes Denkmodell der Szenario-
Technik 1. Strukturierung und Definition des Unter-
suchungsfeldes
Aus der Flle der plausiblen, in sich stimmi- 2. Identifizierung und Strukturierung der wich-
gen Szenarien wird jenes ausgewhlt, das die tigsten Einflubereiche auf das Unter-
hchste Plausibilitt (nach den vorliegenden suchungsfeld
Expertenangaben) aufweist, das sogenannte 3. Ermittlung von Entwicklungstendenzen
Trendszenario. Zustzlich werden minde- und kritische Beschreibung der Umfelder
stens zwei weitere Extremszenarien ausge- 4. Bildung und Auswahl konstanter Annahme-
whlt, eines mit einer besonders positiven, das bndel
andere mit einer extrem negativen Entwick- 5. Interpretation der ausgewhlten Umfelds-
lungstendenz; falls zweckmig, knnen auch zenarien
verschiedene Extrementwicklungen antizi- 6. Einfhrung und Auswirkungsanalyse signi-
piert werden. fikanter Strereignisse
Die Vorstellung ist, da man mit der Aus- 7. Ausarbeitung der Szenarien bzw. Ableiten von
wahl von mindestens drei Szenarien ein Konsequenzen fr das Untersuchungsfeld
Trichtermodell der zuknftigen Entwick- 8. Konzeption von Manahmen und Planun-
lung hat. Das Trendszenario entspricht der gen.
Zielexplikation und Bewertungskriterien 91
ven Testverfahren, Einschtzungen der Eltern bei ebenfalls noch erhebliche Freirume (und
oder der spteren leistungsmigen Entwick- damit Vernderungen der Ergebnisse durch
lung der Schler in folgenden Klassen mit, die Auswahl) vorhanden sind; wichtig er-
kann einen groen Unterschied in dem scheint hier vor allem eine Konsensfindung
Bewertungsergebnis ausmachen. Im einzelnen mit dem Auftraggeber bzw. mit den relevan-
sind folgende Punkte zu klren: ten Teilgruppen innerhalb des Auftraggebers,
da ansonsten mit einer nachtrglichen Ab-
Auswahl der Bewertungskriterien; hierzu wertung der Meinstrumente bei uner-
mssen zunchst die Ziele mglichst detail- wnschten Ergebnissen gerechnet werden
liert erfat und anschlieend mglichst ide- mu (4.2.3).
enreich fr die Teilziele geeignete Vorschlge
gefunden werden, danach ist eine Reduktion Wie aufwendig die einzelnen Teile in einem
auf eine bewltigbare Arbeitsmenge notwen- konkreten Projekt durchgefhrt werden kn-
dig (4.2.1) nen, mu im Einzelfall unter Kosten/Nutzen-
Nebenfolgenabschtzung; unabhngig von Aspekten entschieden werden. In keinem Fall
den eigentlichen Zielen ist damit zu rech- sollte man auf eine offizielle Konsensfindung
nen, da jede Manahme auch mit nicht be- bzgl. der Meinstrumente verzichten.
absichtigten und evtl. unerwnschten zu-
stzlichen Konsequenzen verbunden ist, zu
deren hypothetischen Formulierung die Ver- 4.2.1 Auswahl der
wendung von Handlungsmodellen ntzlich Bewertungskriterien
erscheint (4.2.2)
Als letzter Schritt ist die Operationalisierung Bevor man zu den einzelnen Beurteilungs-
fr die einzelnen abstrakten Bewertungs- dimensionen bergeht, mu zunchst die Ziel-
kriterien (und Nebenfolgen) festzulegen, wo- setzung der zu evaluierenden Manahmen

Diagramm IV/4
Kurzdarstellung der Planspiel-Technik (vgl. Baehr und Eberle, 1986)

Beim Planspiel handelt es sich um eine im Reduktion der Realitt auf zielrelevante Fak-
militrischen Bereich entstandene Unter- toren des Planspiels.
weisungsmethode, die speziell dem Ent- Aktives Handeln in Form abstrakter Denk-
scheidungshilfetraining dient. Dem Plan- ttigkeit bzw. Interaktion der Spieler in der
spiel liegt immer eine reale Situation simulierten Realitt.
zugrunde, die in einem Modell simuliert Hohe Motivationskraft durch Ausnutzung
wird. Auf diese Weise soll die wechselseitige des dem Menschen innewohnenden Spiel-
Abhngigkeit der einzelnen Systemelemen- triebes und damit Wirkung und Verstrkung
te verdeutlicht werden und die Wirkung des sachbezogenen Interesses.
einzelner Entscheidungen auf das Gesamt- Rollenspielartige bernahme bestimmter
system transparent gemacht werden. Beim Verhaltensweisen innerhalb der Simula-
Planspiel bernehmen die Teilnehmer die tionssituation.
Rolle von Entscheidungsinstanzen. Konflikttraining verursacht durch abwei-
Auf Grund der modellartigen Simulation chende Zielvorstellungen zwischen den
des Gesamtsystems knnen die Folgen der Spielgruppen, sowie innerhalb der einzel-
Entscheidungen ermittelt und bewertet wer- nen Gruppen.
den. Training der Kommunikationsfhigkeit, da
die gestellte Aufgabe einen Informations-
Die wichtigsten Elemente des Planspiels sind: austausch innerhalb der Gruppen, zwischen
Nachahmung der Realitt im Modell bzw. den Gruppen und zum Spielleiter erfordert.
92 Zielexplikation und Bewertungskriterien

mglichst detailliert werden. Das einfachste Team erfolgen, da Gruppen fr solche Auf-
Vorgehen ist, wieder Hierarchien, wie in 4.1.1, gabentypen wesentliche Vorteile bieten, wobei
auszuarbeiten. Fr das dort verwendete ad- eine interessens- und vorbildungsmig hete-
vanced organizer-Beispiel wren dabei folgende rogene Gruppenzusammensetzung empfeh-
Schritte erforderlich (Beispiele nur aus der Sicht lenswert sein kann. Statt oder ergnzend zum
der Zielsetzung des Lehrers): brainstorming (vgl. Diagramm IV/2) knnen fr
solche Gruppensitzungen auch Metaplan-Tech-
Erfassung von: niken erfolgreich eingesetzt werden, die Grund-
1. Analyse der Ist-Situation: struktur davon findet sich im Diagramm IV/5.
Eine ausfhrliche Darstellung geben Klebert et
dem durchschnittlichen Leistungsniveau in al. (1988),Schnelle (1982).
der unterrichteten Klasse
Der Konsens zwischen allen Beteiligten, ge-
der Motivation der Schler, mit dem alten rade auch bei offenen oder verdeckten Konflik-
Lehrbuch zu arbeiten
ten innerhalb der Institutionen des Auftragge-
den auftretenden Problemen, die sich bei der bers, wird bzgl. der Kriterienauswahl im Prinzip
Arbeit mit dem alten Lehrbuch ergeben
am leichtesten erreicht, wenn alle auch nur an-
nhernd sinnvoll erscheinenden Vorschlge in
2. Festlegung der Richtziele (Grobziele):
die Projektplanung aufgenommen werden. In
a) schulische Ziele einem solchen Fall kann sich jeder an dem
b) persnliche Ziele Findungsproze Beteiligte im Projektplan wie-
derfinden, und man kann auch sehr schwer
3. Bestimmung der Feinziele: sachlich argumentieren, da das Erheben ir-
gendeines Aspektes mit Sicherheit unntig oder
mgliche Feinziele von a):
gar schdlich sei.
diadaktische Verbesserung des Unterrichtes Man sollte aber zur Qualittssicherung be-
Straffung des Unterrichts strebt sein, im Konsens der potentiellen
Verbesserung des Klassendurchschnitts Konfliktpartner eine Eingrenzung der Vor-
zeitkonomische Aspekte schlge zu erreichen. Dabei knnen Techniken,
Steigerung der Motivation der Schler wie sie im Abschnitt 4.3 besprochen werden
Erleichterung der Informationsaufnahme (Diagramm IV/9) ntzlich sein.
usw.

mgliche Feinziele von b): 4.2.2 Nebenfolgenabschtzung


Demonstration von Innovationsfreudigkeit
Prinzipiell ist bei jeder Manahmenbewertung
Erhhung der eigenen Motivation
damit zu rechnen, da diese nicht nur die ge-
Hoffnung auf hheres Ansehen/Status
wnschten Effekte in mehr oder weniger star-
Zeitersparnis bei der Themenauswahl und
kem Ausma zeigen wird, sondern zustzliche
Vorbereitung
Auswirkungen zeigt, die in keiner Weise der
Durchsetzung im Kollegium Ausgangsintention entsprechen (das Problem
wissenschaftliche Orientierung ist strukturell hnlich wie die Trennung von
usw. Haupt- und Nebenwirkungen im Therapiebe-
reich). Dies betrifft sowohl die zu evaluierenden
4. Hierarchisierung der Ziele nach (subjektiven) Kri- Sachverhalte, als auch die Evaluationsstudie
terien. selbst, die ihrerseits unerwartete Konsequenzen
haben kann, die nichts mit der eigentlichen
In gleicher Weise lassen sich natrlich die Zielsetzung zu tun haben (etwa erhhter Ein-
Ziele anderer Gruppen von Betroffenen (vgl. satz der mit-evaluierten Lehrer im Schul-
4.1.1) verfolgen. bereich, die Aufwertung von an sich nicht so
Das Finden von Zielhierarchien und dazu wichtigen Projekten durch hohen Evaluations-
passenden Bewertungsdimensionen sollte nach aufwand, die Frderung der Durchsetzung ei-
Mglichkeit nicht als Einzelarbeit, sondern im ner Innovation, da diese zu berprfungs-
Zielexplikation und Bewertungskriterien 93

Diagramm IV/5
Grundstruktur der Metaplan-Methode (nach Schnelle, 1982)

Definition Kleingruppenarbeit
Vorstellen der Ergebnisse in der Gruppe
Die Metaplan-Methode ist eine Gesprchs- Feedback entweder durch die Teilnehmer
bzw. Diskussionstechnik, die durch hierarchie- selbst oder durch den Moderator
freies Arbeiten Teilnehmer motiviert und de-
ren Kreativitt frdert. Phase 3: Finale
Erstellen eines Ttigkeitskatalogs in der
Die Teilnehmer sammeln Gruppe/Kleingruppe
durch Kartenabfrage Beitrge zu einer be- Feststellen der Zufriedenheit und des Grup-
stimmten Problematik; penklimas durch den Moderator
gewichten diese Probleme;
fassen die Beitrge zu Problembndeln zu-
sammen; Anwendungsgebiete

Der Moderator sorgt fr hufig in konflikttrchtigen Situationen (z.


den organisatorischen Ablauf der Modera- B. sehr gut geeignet zur Bildungsbedarfs-
tion; analyse)
Visualierung der Sach- und Beziehungs- zur Erarbeitung neuer Problemstellungen
probleme in der Gruppe;
Gleichberechtigung der Teilnehmer; Vorteile
Selbstverantwortlichkeit der Teilnehmer
Anhufung verschiedener Informationen,
Ablauf der Moderation Meinungen, Ideen zu einer bestimmten Pro-
blematik
Phase 1: Einstieg
Warming-up Nachteile
Problembewutsein der Teilnehmer schaffen hoher personeller und finanzieller Aufwand
Interessen sichtbar machen (hufig sind zwei Moderatoren ntig)
Ist die reale Ungleichheit der Teilnehmer
Phase 2: Bearbeitung der Problematik berhaupt ausgleichbar?
Problemfragen formulieren In welchem Ma engen nicht-vernderliche
Problemspeicherung Strukturen den Entscheidungsraum ein?

zwecken im kleinen Rahmen realisiert werden nen auswirken knnten, also ob sie fr die je-
mu). Zu einer umfassenden Bewertung gehrt weiligen Personen
es, auch solche Nebenfragen schon bei der Pro-
jektplanung mit zu beachten. Das rechtzeitige
ein (neues oder zustzliches) Problem dar-
stellen bzw. zur Folge haben
Entdecken potentieller Nebenwirkungen ist be-
sonders schwierig, weil diese ja eben nicht zu
die Mittel fr die Bearbeitung bestehender
Probleme verndern bzw. erweitern
den ursprnglich intendierten Manahmen-
zielen gehren. Eine ntzliche Hilfe, um an
die Handlungsziele beeinflussen
mglichst viele denkbare, aber nicht intendierte
die Bewertung der Konsequenzen von Ziel-
erreichungen verndern
Folgen zu denken, ist die Bercksichtigung von
Handlungsplnen (vgl. Diagramm I/2). Fr jede
irgendwie von den Evaluationsobjekten oder
Einige Beispiele:
der Evaluationsstudie selbst betroffenen Perso-
nengruppen (vgl. 4.1.1) wird berlegt, in wel- Eine politische Partei hat sich seit Jahren ve-
cher Weise sich die Manahmen in diesen Pl- hement fr eine bestimmte Schulorganisa-
94 Zielexplikation und Bewertungskriterien

tion eingesetzt; ein gegenteiliges Evaluations- Manahmen im Partei/Schulsystem-Beispiel,


ergebnis knnte u.a. die Glaubwrdigkeit der insbesondere eine mglichst weitgehende Ver-
Aussagen und ihr Prestige herabsetzen, so meidung von Einflunahme auf die Ausgestal-
da dieses zu einem Problem wrde (er- tung und Berichtlegung des Projektes. Ein Pro-
wartbare Folge: Manahmen zur Vermei- blem kann sein, da die Ausarbeitung solcher
dung unerwnschter Resultate). denkbarer Nebenfolgen als zynisch bezeich-
Lehrer, die einen methodisch schlecht gestal- net und von den Beteiligten als eine unsachge-
teten Unterricht halten, knnen in der me Unterstellung zurckgewiesen wird
Verfgbarkeit didaktisch gut aufbereiteter irrationales Verhalten politischer Parteien, feh-
Lernprogramme ein Mittel zur (partiellen) lende Innovationsfreudigkeit bei Lehrern, Ei-
Problemlsung sehen und daher darauf ver- gennutz sowie die Bercksichtigung nicht-me-
zichten, ihren eigenen Unterricht adquat zu dizinischer Kriterien bei der Bestimmung der
verbessern (Folge: Reduktion des Bestrebens, Behandlung durch rzte verstoen gegen die
sich selbst optimaler zu verhalten bzw. wei- sozial akzeptierten Normen der jeweiligen
terzubilden). Gruppe. Bei einer solchen Erhebung sollte man
Der Entwickler eines speziellen Seminarpro- daher die Ideensammlung mit Anonymisie-
grammes zur Einfhrung in die Textverarbei- rungstechniken (etwa Metaplan, u.U. auch
tung hat groes persnliches Interesse an ei- wirklich vertrauliche Interviews) durchfhren
nem guten Abschneiden dieser Methodik und als Evaluator deutlich machen, da diese
im Vergleich zu anderen Angeboten, so da Ideen nicht von dem Projektteam selbst ent-
fr ihn ein entsprechendes Ergebnis als an- wickelt, sondern von praxiserfahrenen Auen-
zustrebendes Ziel anzusehen ist (mgliche stehenden genannt wurden.
Folge: Einflu auf die Auswahl der Alternati-
ven, ganz besondere Anstrengung in den
evaluierten, von ihm selbst gestalteten Semi- 4.2.3 Operationalisierungsfragen
naren).
Eine Vernderung in der Kostenerstattung fr Nach Auswahl der theoretischen Bewertungs-
Rettungsfahrten (bezahlt wird nur noch, kriterien der zu evaluierenden Manahmen
wenn der Patient mindestens einen Tag lang mssen diese in konkreter Weise fabar ge-
stationr im Krankenhaus behandelt wird) macht werden. Dabei ergeben sich sowohl in-
verndert die nicht unmittelbar medizini- haltliche als auch methodische Probleme.
schen Konsequenzen des rztlichen Han- Die inhaltliche Problematik (an welchen Be-
delns; wird nur ambulant versorgt, hat dies obachtungen kann man das Ausma von The-
auch bei ausreichendem Behandlungserfolg rapie-Erfolg oder Lernfortschritt erfassen?)
fr den Patienten negative finanzielle Konse- ist nicht Gegenstand einer empirischen Wis-
quenzen, die vom Arzt evtl. nicht gewnscht senschaft, sondern erfordert eine geisteswissen-
werden. Noch massiver knnen die Auswir- schaftlich begrndete Setzung, etwa anhand
kungen bezglich des Hilfeverhaltens von von subjektiver Plausibilitt, Vertrglichkeits-
Mitmenschen sein, da die Fahrtkosten (die kriterien mit etablierten Anstzen oder unter
durchaus 300 DM betragen knnen) nicht Bercksichtigung von Nutzen-berlegungen
immer vom potentiellen Patienten, sondern (fr das prinzipielle Problem, da sich die in-
im Konfliktfall von dem zu tragen sind, der haltliche Seite der Operationalisierung der Be-
den Wagen bestellt hat. urteilung durch empirische Forschung entzieht,
siehe etwa Wottawa, 1988, Seite 73). Dies
In all diesen Fllen wre es prinzipiell mglich, macht eine intensive Abstimmung mit dem
bei rechtzeitiger Bercksichtigung durch Erwei- Auftraggeber erforderlich, selbst dann, wenn
terung des Projektes dessen Leistungsfhigkeit man auf bewhrte Tests zurckgreift.
zu erhhen, sei es durch Ergnzung des Kri-
terienkataloges, methodischer Vorkehrungen Die methodischen Probleme der Operationali-
(zum Beispiel die Vermeidung von direkter oder sierung sind zwar nahezu ebenso schwierig,
auch nur indirekter Selbstevaluation) oder doch aber wissenschaftlich leichter bearbeitbar. Im
zumindest die Empfehlung vorbereitender folgenden wird auf die Punkte eingegangen:
Zielexplikation und Bewertungskriterien 95
Ideographische Anstze einzelfallbezogener Darstellung) und Fallbei-
Nomothetische Anstze; die Itemmengen spiele. Solche Ausarbeitungen haben oft einen
sind definiert durch hohen heuristischen Wert, bereiten aber
Stoffgebiete Schwierigkeiten bzgl. der Verallgemeinerung
Konstruktionsregeln der Ergebnisse. Auffallend ist auch, da etwa
eindimensionale Modelle im Zusammenhang mit den sehr kontrovers
beurteilten Gesamtschulevaluationen in Nord-
Die Wahl des methodischen Ansatzes sollte in rhein-Westfalen einzelfallorientierte Ausarbei-
jedem Evaluationsprojekt mglichst nach tungen (Diederich und Wulf, 1979) eine we-
Sachaspekten getroffen werden, auch wenn sentlich geringere ffentliche Resonanz fanden
vielfach eine Bercksichtigung von Ressourcen- als auf nomothetischer Messung aufbauende
mangel nicht zu vermeiden ist. Studien (etwa Haenisch et al., 1979, Lukesch et
al., 1979), obwohl alle diese Berichte in der glei-
chen Verffentlichungsreihe erschienen sind
und man annehmen knnte, da zumindest
Ideographische Anstze
fr die ffentlichkeit Fallbeschreibungen an-
schaulicher sind als Testergebnisse. Der Grund
An Methoden dieser Art wird man denken,
dafr knnte darin liegen, da solche wei-
wenn die Evaluationsergebnisse stark in Abhn-
chen Ausarbeitungen deutlich erkennbar in
gigkeit von Individuen bewertet werden ms-
erheblichem Ausmae von der subjektiven Vor-
sen. Typische Beispiele:
einstellung der Untersucher abhngen, so da
Erfolgskrontrolle von psychologischer Bera- die Glaubwrdigkeit von darauf gesttzten Be-
tung oder Psychotherapien; fr einen Klienten wertungen vor allem in kontroversen Situatio-
kann die Reduktion des bertriebenen Selbst- nen herabgesetzt ist. Man sollte solche Verfah-
wertgefhls, fr einen anderen die Steigerung ren daher vor allem bei allgemeinem Konsens
dieser Dimension ein wesentliches Inter- und insbesondere bei formativen Fragestellun-
ventionsziel sein, so da einer die Personen gen einsetzen.
umfassende Mittelung dysfunktional wre. Die (unbeabsichtigte) Einflunahme des Un-
Bewertung von einzelnen Manahmen un- tersuchers auf die Ergebnisse wird geringer,
ter besonderer Bercksichtigung singulrer wenn man die ideographische Datenerhebung
Aspekte, vor allem im Zusammenhang mit strker methodisch strukturiert. Beispiele dafr
formativer Evaluation; typisch dafr ist etwa sind Anstze, deren Ziel es ist, die fr die jewei-
die wissenschaftliche Begleitung von Mo- lige Fragestellung relevanten kognitiven Struk-
dellversuchen, die nicht auf normativ-verall- turen der Gesprchspartner (auch subjektive
gemeinerte Aussagen hin orientiert ist, son- Theorien oder Entscheidungsregeln ge-
dern vorwiegend den Zweck hat, fr den nannt) zu erheben. Frhe Beispiele dafr fin-
einen zu evaluierenden Einzelfall mglichst den sich etwa im diagnostischen Bereich
optimale Gestaltungshinweise zu geben. (Kleinmuntz, 1963) oder auch der Erfassung
Interventionen, die qualitative Vernderun- subjektiver Theorien von Lehrern (vgl. dazu
gen von Zusammenhangsstrukturen zum Hofer, 1975). Fr das Vorgehen bei solchen
Ziel haben, zum Beispiel Vernderung von Erhebungen kann man sich zum Beispiel der
Ablufen in Organisationen oder die bessere Strukturlegetechnik (Scheele & Groeben, 1984)
Gestaltung kognitiver Strukturen durch Wei- oder des Prinzips von HYPAG/Structure (Wotta-
terbildung; hier kann nur der Vergleich der wa & Echterhoff, 1982) bedienen. Diese An-
strukturellen Gegebenheiten vor und nach stze sind im Diagramm IV/6 bzw. IV/7 kurz skiz-
der Intervention die Evaluationsgrundlage ziert. Ein Anwendungsbeispiel fr den Bereich
bilden, was eine individuumsorientierte Er- der Evaluation (Auswirkung einer Weiterbil-
hebung voraussetzt. dungsmanahme) findet sich etwa in Wottawa
& Hof, 1987.
Die hufigsten, aber auch weichsten metho-
dischen Anstze fr diese Art von Datenerhe- Fr manche Fragestellungen ist die entschei-
bung sind Interviews (mit anschlieender dende Operationalisierung zwar nur individu-
96 Zielexplikation und Bewertungskriterien

ell mglich, eine methodisch mglichst eindeu- Ziele in Punktwerte ist zwar sicher subjektiv be-
tige Zusammenfassung der Einzelergebnisse zu einflut und entspricht nicht den Vorstellungen
einer Gesamtbewertung aber unbedingt erfor- harter nomothetischer Messung, ermglicht aber
derlich (was die beiden vorhergehend bespro- eine objektivere und besser nachkontrollierbare
chenen Anstze kaum leisten knnen), gerade Zusammenfassung der Einzelergebnisse als die
im Bereich der Therapie-Evaluation. Hier ist das anderen hier besprochenen ideographisch orien-
Ziel nicht nur eine Betrachtung des Interven- tierten Vorgehensweisen. Beispiele fr die An-
tionserfolges im Einzelfall, sondern eine ver- wendung der GAS fr Evaluationsfragen finde
gleichend-verallgemeinernde Aussage ber die sich u.a. in Sherman, R. (1977).
relative Bewhrung verschiedener Therapie-
methoden fr spezielle Indikationsstellungen.
Ein speziell dafr entwickelter Operationali- Nomothetische Messung
sierungsansatz ist die Goal-Attainment-Scale
(GAS; s. Franklin & Trasher, 1976, Wittmann Wird ein fr die Evaluation ausgewhlter theo-
1985), deren Grundprinzip im Diagramm IV/8 dar- retischer Konstrukt fr eine nomothetische
gestellt ist, beinhaltet auch Bewertungsaspekte Messung, also fr alle betroffenen Personen in
und wird daher im Abschnitt 4.3 besprochen. der gleichen Form, operationalisiert, so stellt
Die dort vorgenommene Umrechnung des re- sich die Frage nach der Rechtfertigung gerade
aktiven Ausmaes des Erreichens verschiedener dieser Indikatorenwahl schlielich hngt das

Diagramm IV/6
Kurzdarstellung der Struktur-Lege-Technik (SLT) (nach Groeben und Scheele, 1984)

Gundlagen 2. Die Vp erhlt zur Vorbereitung auf die fol-


gende Sitzung, in der sie ihre subjektive
Ziel der SLT ist die Rekonstruktion subjektiver Theorie konstruieren soll, den Struktur-
Theorien. Lege-Leitfaden, der die Grundprinzipien
Darunter verstehen die Autoren ein Ag- des Verfahrens erlutert.
gregat aktualisierbarer Kognitionen der Selbst- 3. Die Vp legt auf Grund der Interview-
und Weltsicht mit zumindest impliziter informationen fr sich bereits mit Hilfe
Argumentationsstruktur, die eine (wenigstens der Krtchen eine seiner Meinung nach
partielle) Explikation bzw. Rekonstruktion die- fr die Vp relevante Theoriestruktur fest.
ses Aggregates in Parallelitt zur Struktur wis- 4. In der Sitzung wird die Vp aufgefordert,
senschaftlicher Theorien erlaubt. (Groeben & ihre eigene Theoriestruktur zu rekonstru-
Scheele, 1984, S. 2), ieren. Sie kann dazu auch andere Konzept-
Zur Explikation dieser subjektiven Theorien karten benutzen, als die, die vom VL erar-
werden eine Reihe von Kstchen verwendet, beitet wurden.
die Begriffe und Konzepte reprsentieren so- 5. Die Theoriestruktur der Vp wird mit der
wie Kstchen, die die formalen Beziehungen des VL verglichen und die Vp entscheidet,
zwischen diesen Begriffen und Konzepten an welchen Stellen sie der Rekonstruktion
festlegen. des VL zustimmt oder aber der eigenen
Version den Vorzug gibt.
6. Aus dem Vergleich der beiden Rekonstruk-
Arbeitsablauf tionen soll sich schlielich eine endgl-
tige, beide Versuche integrierende Version
1. Durchfhrung eines halbstandardisierten entwickeln.
Interviews mit der Vp, wobei sog. hypo-
thesen-ungerichtete, hypothesen-gerichtete
und Strfragen eingesetzt werden.
Zielexplikation und Bewertungskriterien 97

Diagramm IV/7
Kurzdarstellung von HYPAG/Structure

Grundlagen dungsprozedur selten auf klar formulierten


Regeln, sondern meist auf Nachahmungs-
Ausgangspunkt ist die berlegung, da lernen oder erst in anwendbare Regeln zu
die meisten Personen bei bloem Befragen transformierenden Wissensbasen beruhte;
ihre eigenen Entscheidungsregeln auch in daher eine Situation geschaffen werden
hufig auftretenden Situationen (Diagno- mu, in der die zu analysierende Person
stik, Indikationsstellung) nicht zutreffend durch ein Wechselspiel von der Abgabe sub-
explizieren knnen; jektiver Begrndungen und deren Vergleich
der normale Entscheidungs- oder Auswahl- mit dem tatschlichen Entscheidungen ver-
ablauf auch keinerlei Veranlassung bietet, anlat wird, allmhlich zutreffende Be-
sein Regelsystem zu explizieren; dies um so grndungen ihres eigenen Verhaltens zu
mehr, als die Einarbeitung in die Entschei- kommen.

Verhalten Befragung
Beobachtung des Frage: Warum so entschie-
realen Entschei- den? Antwort: Wenn (Indikato-
dungsverhaltens ren) , dann (Entscheidung)

Speicherung bersetzung der subjektiven Begrndung in ein


(mgl. auf EDV) Modell: Darstellung der Antworten in
konfiguralerbzw. logischer Form (evtl. EDV)
Erneute Verhaltensbeobachtung

Anwendung des vorlufigen Modells auf einen


Speicherung (neuen) Entscheidungsfall
Mgliche Folgen:
Fehler (andere Modellentscheidungen als durch
Mensch): Rckmeldung an Befragten und Modell-
vernderung
Nicht entscheidbar (wenn-Teile des Modells
tref fen nicht zu): Rckmeldung an Befragten und
Modellergnzung
Treffer (Modell trif ft gleiche Entscheidung wie
befragter Entscheider)

Testung des genderten Modells an


allen schon abgearbeiteten Fllen

Kreuzvalierung des als gltig angesehenen der Manahme (z.B. Training, Beratung,
Regelsystems an Fllen, die nicht zur Erstel- Therapie)
lung herangezogen wurden. Aufbereitung von Informationen in einer
Einleitung praktischer Manahmen, je nach den Entscheidungsregeln entsprechenden
Zielsetzung etwa: Form (Akzeptanz von Materialien, Erleich-
Intervention zur nderung nicht optimal terung der Entscheidungsfindung)
erscheinender Teilregeln Erarbeitung von Entscheidungshilfen, meist
Bewertung von Interpretationen durch den computergesttzt.
Vergleich des Regelsystems vor und nach
98 Zielexplikation und Bewertungskriterien

Diagramm IV/8
Kurzdarstellung des Goal-Attainment-Scaling (nach Wittmann, 1981)

Definition Punktwert +1 bis +2: Kategorien von be-


GAS ist ein Oberbegriff fr eine Vielzahl von sonders erwnschten Ausgngen, wobei +2
Techniken, die alle auf spezifische Klientenziele das bestmgliche Ergebnis darstellt;
und skalierbare Teilschritte zugeschnitten sind Jeder Zielbereich wird seiner relativen Be-
(meist im klinischen Bereich eingesetzt). deutung nach in Relationen zu den ande-
ren gewichtet. Dadurch soll der Wert dieses
Ziel Zieles in Relation zu den anderen sichtbar
Bestimmung der durch eine Manahme zu er- werden.
reichenden Effekte
Anwendung
Durchfhrung vor allem im klinischen Bereich Verbreitung
Auswahl relevanter Kriterien fr den kon- als Evaluationsinstrument, GAS beteiligt den
kreten Einzelfall (z.B. Festlegung und Spezi- Klienten besonders stark, bietet unmittelbare
fikation von klaren und realistischen Be- Rckmeldung der Behandlungsergebnisse
handlungszielen); aus dem Einzelfall an den Therapeuten
Exakte, empirisch mglichst eindeutige Be- auch einsetzbar fr Ziele einer Einrichtung,
schreibung dieser Kriterien; die soziale oder pdagogische Programme
Ziele werden auf einer 5-Punkte-Skala ska- durchfhrt
liert:
Punktwert 0: ein erwarteter wahrschein- Probleme
licher Ausgang unter der Annahme einer ef- Subjektive Bewertung aller Aspekte, vor al-
fektiven Behandlung lem Beliebigkeit der Ziele
Punktwert -1 bis -2: Kategorien weniger Validitt des Verfahrens ist auf Grund der
erwnschter Ausgnge Individualspezifitt schwer abschtzbar

Evaluationsergebnis ja ganz wesentlich von der schnitt 4.1.1), eine nachtrgliche Aufnahme fr
genauen Ausformung des Meinstrumentes ab. die Nicht-Bercksichtigung weiterer Vorschlge
ist schwierig, und stets bleibt offen, ob die im
Eine denkbare Mglichkeit ist es, unsystema- Nachhinein den Datensatz zugrundegelegten
tisch eine grere Anzahl von Einzelindi- Dimensionen den eigentlich angestrebten theo-
katoren (Items, Beobachtungen u. dgl.) zu sam- retischen Bewertungskonstrukten entsprechen.
meln und ber die einzelnen Fragen einen Aus diesen Grnden sollte ein solches per-
Konsens herbeizufhren. Da fr die meisten fiat-Vorgehen nur dann gewhlt werden,
Kriterien die Erfassung mit einem einzelnen wenn aufgrund gegebener Rahmenbedingungen
Item zu wenig aussagekrftig ist (Einteilung der ein sorgfltiger strukturiertes Vorgehen nicht
Personen nur in so viele verschiedene Klassen mglich ist.
als Antwortmglichkeiten vorgesehen sind, ge-
ringe Megenauigkeit) kann man im Nachhin- Eine andere Mglichkeit ist es, fr die einzel-
ein mit deskriptiven Verfahren wie der Fakto- nen Kriterien auf bereits vorhandene und mg-
renanalyse versuchen, die Informationsmenge lichst gut konstruierte Test- oder Erhebungs-
in Richtung auf einige besonders wesentliche verfahren zurckzugreifen. Man kann damit
Kriterien hin zusammenzufassen. eine eigene Entwicklungsarbeit sparen, der Ver-
Ein solches Vorgehen drfte in der Eva- gleich mit anderen Untersuchungen wird we-
luationspraxis gar nicht so selten sein, bringt sentlich erleichtert und die Verantwortung fr
aber erhebliche Nachteile mit sich. Eine un- evtl. doch bestehende Schwachstellen der Mes-
strukturierte oder nur schwach an Kriterien- sung wird an die ursprnglichen Autoren de-
vorstellungen orientierte Itemsammlung wird legiert. Prfen mu man allerdings, ob die
im allgemeinen weniger Einflle erbringen als konkrete Operationalisierung auch tatschlich
ein systematisiertes Vorgehen (vgl. dazu Ab- einer Evaluationsfragestellung, die meist Vern-
Zielexplikation und Bewertungskriterien 99
derungsaspekte zum Inhalt hat, auch gerecht Festlegung von Stoffgebieten
wird. Dazu einige Beispiele:
Vor allem im pdagogisch-psychologischen Be-
Erfassung des Therapieerfolges an einer Be-
reich liegen fr manche Teilgebiete komplette
findlichkeitsskala, die auf maximale Relia-
Operationalisierungen der Bewertungskriterien
bilitt hin konstruiert wurde es besteht die
vor, vor allem bzgl. kognitiver Lerninhalte. Der
Gefahr, da durch die Itemselektion bei der
Wissensstoff fr ein bestimmtes Fach ergibt sich
Testkonstruktion gerade die besonders nde-
im Prinzip aus der Zusammenfassung aller da-
rungssensitiven Items eliminiert wurden, was
fr zugelassenen Lehrbcher, die (bisherigen)
die Aussagekraft fr eine Interventionsbewer-
Abituranforderungen finden sich in der Menge
tung senkt.
aller gestellten Prfungsthemen, Kriterien der
Anwendung eines Fragebogens fr Fh-
Schulreife ergeben sich durch eine zusam-
rungsstil, bei dem die Probanden das ihrer
menfassende Sammlung der fr die erfolgrei-
Meinung nach richtige Verhalten in vorge-
che Einschulung erforderlichen Verhaltens-
gebenen Beispielsituation anzugeben haben
weisen. Daher wird in diesem Bereich die
unabhngig von Evaluationsprojekten kann
Testkonstruktion strker als in anderen Teilge-
ein solches Vorgehen durchaus Informatio-
bieten auf der sogenannten kriteriumsorien-
nen ber das tatschliche Fhrungsverhalten
tierten Messung (vgl. dazu Klauer, 1987) auf-
indirekt erschlieen lassen, nach gezielten
gebaut, wobei leider diese Bezeichnung zu
Interventionsprogrammen ist aber die Ge-
Miverstndnissen fhren kann gemeint ist
fahr hoch, da die Teilnehmer im Sinne der
nicht eine Erhhung der Test/Kriteriumsbezie-
Veranstaltungsinhalte antworten, ohne auch
hung im Sinne einer korrelativen Kriteriums-
nur im geringsten daran zu denken, ihre Ein-
validitt, sondern die sachgerechte Zusammen-
stellungen oder gar das Verhalten zu modifi-
stellung von Itemstzen aus einer das Kriterium
zieren.
definierenden Gesamtmenge (vgl. dazu auch
Verwendung eines in internationalen Ver-
den Begriff der Inhaltsvaliditt etwa bei
gleichsstudien entwickelten Tests fr Fremd-
Cronbach, 1978).
sprachen fr die Evaluation einer neuen
Kann man von einer solchen Stoffmenge aus-
Lehrmethode; war die Zielsetzung der Aus-
gehen, ist es nur noch erforderlich, ein objekti-
gangsstudie (zum Beispiel der Erwerb von
ves Verfahren zur Umsetzung in konkrete Me-
Grundfertigkeiten wie Wortschatz oder ele-
instrumente vorzunehmen. Dies ist manchmal
mentare Grammatik) und die Spezifitt der
vllig unproblematisch, etwa ein Zusammen-
Intervention (zum Beispiel Verbesserung der
stellen aller in den zulssigen Englisch-Lehr-
kommunikativen Fhigkeiten) nicht ausrei-
bchern verwendeten Vokabeln und Bildung
chend hnlich, ist dieses Meinstrument
einer Zufallstichprobe daraus fr einen Wort-
auch dann nicht zu empfehlen, wenn es me-
schatztest. Der Aufwand ist hher, wenn fr
thodisch noch so fundiert ist.
die Fragenerstellung Umformungen erforder-
lich sind, aber auch dann leistbar man kann
Die besondere Zielrichtung von Evaluations-
etwa die Beherrschung des Faches Geschich-
projekten erfordert leider im Prinzip hufig eine
te so erfassen, da man aus der Menge aller
spezifische Neukonstruktion der Meinstru-
Abstze in den zulssigen Lehrbchern wieder-
mente, auch wenn eine solche aus Zeit- und
um nach Zufall auswhlt und fr jeden dieser
Kostengrnden in der Praxis hufig nicht gelei-
Abstze nach mglichst objektiv befolgbaren
stet werden kann. Zumindest in groen Projek-
Regeln eine Frage erstellt. Zwar wird in einem
ten und vor allem dann, wenn die Verwendung
solchen Fall die Abhngigkeit vom Itemersteller
der Meinstrumente im Lngsschnitt vorgese-
relativ hoch sein (insbesondere bei multiple-
hen ist, sollte man aber stets eine sorgfltige
choice-Aufgaben, wenn die Wahl der Dystrak-
Mekonstruktion anstreben. Hierbei knnen
toren eine Rolle spielt), aber bei entsprechen-
folgende drei Anstze wichtig werden:
der Schulung sollte sich daraus keine ent-
Stoffgebiete mit Umsetzungsregeln scheidende Verzerrung der Meinstrumente
Systematisierte Itemkonstruktion gegenber der Gesamtheit der Stoffmenge er-
Eindimensionale probabilistische Modelle geben.
100 Zielexplikation und Bewertungskriterien

Ein solches Vorgehen hat, wenn die Voraus- unrealistischer Zielvorgabe (hufig wird dies
setzung einer konsensmig akzeptierten Stoff- etwa bei Lehrplnen unterstellt) die danach
menge tatschlich gegeben ist, eine Reihe von konstruierten Itemmengen insgesamt viel zu
Vorteilen, insbesondere schwierig werden und damit nur eine geringe
Differenzierungsfhigkeit zwischen den einzel-
objektive, nachprfbare und damit sehr nen Probanden erlauben.
kritikresistente Fragenkonstruktion Da diese Probleme aber weniger oder ber-
eine Kontrolle der Einhaltung normativer haupt nicht ins Gewicht fallen, wenn man
Standards wird aufgrund objektiver Zielvor- nicht am Vergleich von Einzelpersonen, son-
gaben mglich (schlielich sollten die Inhal- dern von ganzen Gruppen (Schulen etc.) inter-
te der Lehrbcher bzw. der Lehrplne ja auch essiert ist, sollte man an diese Technik der
tatschlich beherrscht werden!); dies ermg- Testerstellung vor allem dann denken, wenn
licht eine bessere Ergebnisbewertung als die viele Einzelergebnisse zu relativ globalen (Insti-
mit blichen Verfahren erzielten Vergleiche tutions-) Bewertungen zusammengefat wer-
verschiedener Teilgruppen. den, was ja gerade im pdagogischen Bereich
Es sind wiederholte Messungen bei Sicher- hufig ist. Bei der praktischen Anwendung sollte
stellung der Vergleichbarkeit ohne Vertrau- man darber hinaus zu einer Erhhung der
lichkeits- und Coaching-Probleme mglich; Differenziertheit der Aussagen versuchen, die
gelingt eine objektive Umsetzung von Stoff- Stoffmenge nicht zu global festzulegen, son-
menge in Items, so kann man von Me- dern verschiedene Untergruppen (etwa Wort-
zeitpunkt zu Mezeitpunkt nach diesen schatz, passive Sprachbeherrschung etc.) zu bil-
Regeln neue Tests zusammenstellen, die den, aus denen jeweils eine Itemstichprobe
trotzdem die gleiche Stoffmenge erfassen gezogen wird.
und mit Ausnahme von Zufallsschwan-
kungen auch die gleiche durchschnittliche
Schwierigkeit aufweisen. Da stets andere Fra- Systematische Itemkonstruktion
gen verwendet werden, ist auch Verletzung
der Vertraulichkeit und eine an den in den Um die Nachteile einer willkrlichen oder nur
vorgehenden Untersuchungen verwendeten vage assoziativ zu einem Oberbegriff passenden
Items orientierte Testvorbereitung nicht Itemerstellung zu vermeiden, kann man versu-
mglich, und ein anderes sinnvolles chen, sich an explizite Konstruktionsregeln zu
Tranining wre identisch mit dem ohnedies halten. Hierfr sind zwei verwandte Denkan-
vorgegebenen Ziel, die definierte Stoffmenge stze verbreitet:
mglichst umfassend zu erlernen.
Die Facettentheorie (Guttman, 1957; Borg
Problematisch sind bei diesem Vorgehen die 1981.) geht davon aus, da verschiedene
Meeigenschaften der so gewonnen Instru- Aspekte der Aufgaben (im Beispiel Grund-
mente. Da die Stoffmengen in sich sehr hete- rechenfertigkeit etwa die vier Grundrechen-
rogen sein knnen, knnen die einzelnen Items arten, die Teile des Zahlenraumes Einer,
vllig unterschiedliche Aspekte ansprechen, de- Zehner, Hunderter die Bercksichtigung po-
ren Zusammenfassung zu einem Kriteriums- sitiver und negativer Zahlen sowie nur gan-
wert nicht durch wissenschaftliche Aspekte, zer oder auch Dezimalzahlen) zu einzelnen
sondern nur durch die meist wissenschafts- Facetten kombiniert werden (eine solche
extern definierte Stoffmenge gerechtfertigt ist. wre etwa die Kombination Multiplikation
In Abhngigkeit von den Schwankungen der von positiven ganzen Zahlen mit hchstens
Itemschwierigkeiten (die u.a. von der jeweili- zweistelligen Ergebnissen.) Nach diesem
gen Ausgangsmenge, etwa der Gestaltung eines Prinzip lassen sich auch Skalen fr die Be-
konkreten Lehrbuches, abhngt) kann es auch wertung von Therapien erarbeiten (etwa bei
sein, da fr verschiedene Testformen mit aus- Kernberg et al., 1972;). Dort wurden 16
reichend hnlicher Schwierigkeit relativ groe Aspekte mit jeweils 2 bis 7 Ausprgungs-
Itemmengen erforderlich sind. Zu den Me- graden erarbeitet und aus der Vielzahl der
eigenschaften gehrt auch das Problem, da bei damit mglichen Facetten eine Teilmenge fr
Zielexplikation und Bewertungskriterien 101
das Evaluationsinstrument ausgewhlt. Fr Gltigkeit eindimensionaler Modelle) inner-
die Konstruktion von Intelligenztests vgl. halb der einzelnen Facetten zu erhalten.
auch Jger, (1967).
Die rationale oder regelgeleitete Item-
konstruktion besteht in der systematischen Eindimensionale probabilistische Modelle
Kombination kognitiver Prozesse, die fr die
Aufgabenlsung bentigt werden. hnlich Dieser sich an den methodischen Aspekten von
wie bei der Facettentheorie erleichtert dieses Messung orientierende Ansatz (fr eine ber-
Vorgehen die Bildung groer, in ihrer Struk- sicht siehe Lord & Nowick, 1968; Fischer, 1974,
tur bekannter Itemmengen, wie sie insbeson- Henning 1974, betrifft in keiner Weise die in-
dere fr mageschneidertes, computer- haltliche Festlegung der Indikatoren, sondern
gesttztes Testen (Vorgabe einer fr jeden nur deren im Hinblick auf Meeigenschaften
Probanden nach individueller Trennschrfe optimale Zusammenstellung. Da eindimensio-
ausgewhlten Itemmenge) bentigt werden. nal als eine besondere Definition von hn-
Allerdings kann die Kombination von An- lich aufgefat werden kann (vgl. dazu
forderungen unerwartete Effekte im Sinne Wottawa, 1979), ist es im Prinzip mglich, fr
von Wechselwirkungen ergeben (zum Bei- jedes einzelne Item (etwa aus einer Stoffmenge
spiel die Mglichkeit, die Antwort auf einem ausgewhlt oder auf andere Weise konsensmig
viel leichteren Weg zu finden, als bei der festgelegt) unabhngig von seiner psychologi-
Konstruktion intendiert), so da die tatsch- schen Komplexitt durch das Hinzufgen ent-
liche Homogenitt der Items zustzlich zur sprechend gleich strukturierter Fragen (hierbei
Einhaltung der Konstruktionsprinzipien mit knnen die Prinzipien der rationalen Item-
probalistischen Testmodellen empirisch ge- konstruktion helfen) eine ganze Dimension zu
prft werden mu. Ein Beispiel dafr gibt erstellen. Der Erfolg einer solchen Test-
Hornke, (1986). konstruktion hngt im allgemeinen nur vom
Einfallsreichtum des Untersuchers ab, so da die
Verglichen mit der Festlegung von Stoffmengen Verwendung solcher Modelle im Prinzip keine
hat dieser Ansatz den Nachteil, keine an einem Einschrnkung der inhaltlichen Vielfalt bedeu-
bereits bestehenden externen Mastab orien- tet. Sie sind daher kein Ersatz, sondern eine Er-
tierte Aussage zur Bewertung der erbrachten gnzung der inhaltlich orientierten Anstze.
Testergebnisse leisten zu knnen. Im brigen Der Vorteil liegt in den Meeigenschaften fr
ist er mit dem zuerst diskutierten Vorgehen hin- Einzelpersonen, insbesondere durch die Anpas-
sichtlich der Leistungsfhigkeit vergleichbar, sung der Itemschwierigkeit an den Leistungs-
vor allem ist ebenfalls eine Testwiederholung stand verschiedener Subgruppen (Schulformen,
mit jeweils verschiedenen, aber strukturell glei- Leistungskurse, Altersstufen). Sie ermglichen
chen Items mglich. Dies ist vor allem dann besser als alle Alternativen die Beobachtung
wichtig, wenn die gleiche Dimension im von Entwicklungsverlufen einzelner Personen
Lngsschnitt erfat werden soll (Lernfortschritte im Lngsschnitt. Fr Evaluationsfragestellun-
einzelner Schler, Vernderungen durch thera- gen gengt es brigens im allgemeinen, mit re-
peutischen Eingriffe zu vielen Zeitpunkten lativ schwachen Modellen (Mokken-Skalierung
whrend der Behandlung, Kontrolle der Aus- oder dreiparametrige logistische Modelle) zu
wirkungen einer Werbeaktion unter Benutzung arbeiten, da Meeigenschaften bzgl. der einzel-
eines Lngsschnitts-Panels) und man zur Ver- nen Items (etwa ein spezifisch objektiver Ver-
meidung von Streffekten mit jeweils unter- gleich der Items untereinander), die restriktive-
schiedlichen Items arbeiten mchte. Das Wech- re Modelle erfordern, fr die Projektzielsetzung
seln der Aufgaben ist zum Beispiel ganz meist nicht erforderlich sind. Trotzdem kann
besonders wichtig bei wiederholten Evalua- der Aufwand fr die Vortestung und entspre-
tionsmessungen im Schulsystem. Auch wei chende Modifikation der vorgeschlagenen Ska-
man mehr ber die Struktur der von den ein- len ganz erheblich sein, so da unter Effizienz-
zelnen Items angesprochenen Dimensionen, gesichtspunkten der Verzicht auf diese Modelle
und man hat eine hhere Chance, besonders die bessere Alternative sein kann, vor allem
wnschenswerte Meeigenschaften (effektive dann, wenn nur Gruppenvergleiche interessie-
102 Zielexplikation und Bewertungskriterien

ren. Ein sehr interessanter, auch unter Effizienz- bung in die jeweiligen Verfahren kann durch
gesichtspunkten fr Evaluationsprojekte sinn- die theoretischen Konzepte nur untersttzt,
voller Ansatz auf dieser Basis ist das sogenannte aber sicher nicht ersetzt werden.
Matrix-Sampling (Miles und Huberman,
1984).
4.3.1 Explizite Verfahren
der Nutzenbestimmung
4.3 Bewertungs- und Fr eine objektive, formalisierte Nutzenbestim-
Entscheidungshilfen mung sind folgende Teilschritte erforderlich:

Mit dem Erheben der Bewertungskriterien en- fr jedes Evaluationsobjekt mu der Aus-
det der naturwissenschaftliche Teil der Arbeit prgungsgrad auf den festgelegten Kriterien
an Evaluationsprojekten. Nach Abschlu dieser erhoben werden; zum Beispiel: Ergebnisse
Arbeit liegen im glcklichen Fall alle relevan- der Schler eines Schulsystems (Evaluations-
ten, empirisch erfabaren Informationen fr objekt) in einem Vokabeltest im Englischen
eine summative (Auswahl-) oder formative Ent- (eines der Bewertungskriterien).
scheidung vor, die wissenschaftliche Arbeit ist fr jeden empirisch gefundenen Auspr-
eigentlich zu Ende. gungsgrad eines jeden Bewertungskriteriums
mu der Nutzen festgestellt werden; die-
Wie schon das Wort Evaluation sagt (vgl. Kap. sen Vorgang nennt man Nutzenmessung,
1), umfat die Arbeit des Evaluators aber mehr und dieser erfordert subjektive Setzungen (im
als das Aufzeigen von sinnvoll gewhlten em- Beispiel mu jemand festlegen, wie ntzlich
pirischen Fakten. Eine Bewertung ist nur zum Beispiel ein Ergebnis von durchschnitt-
mglich, wenn die objektiv bestehenden Fak- lich 20 richtigen Lsungen im Vergleich zu
ten in nur subjektiv existierenden Nutzen nur 15 richtigen Antworten ist).
bersetzt und das weitere Vorgehen nach dem liegen mehrere Bewertungskriterien vor, mu
Prinzip der Nutzenmaximierung geplant wird. bestimmt werden, wie die einzelnen Ergeb-
Dieses erfordert einerseits eine Klrung der Fra- nisse zu einem Gesamtnutzen zusammen-
ge, wessen Nutzen optimiert werden soll (siehe gefat werden knnen; dies nennt man
dazu Abschnitt 4.1), ein Problem, das insbe- Nutzenverrechnung (im Beispiel wren
sondere in Folge des Bestehens von Abhngig- etwa die gefunden Nutzenwerte auf den Kri-
keitsverhltnissen zwischen Evaluator und Auf- terien Vokabeltest Englisch, Rechenaufga-
traggeber (etwa als Dienstherr, Arbeitgeber oder ben, Wohlbefinden in der Klassengemein-
Financier der Studie und vielleicht noch fol- schaft etc. zu verrechnen keine ganz leichte
gender!) die professionelle Ethik des Evaluators Aufgabe!).
berhren kann. Andererseits ist damit zu rech-
nen, da die Umsetzung der empirischen Fak- Die Probleme werden noch dadurch verstrkt,
ten in Nutzenwerte oder Globalentscheidungen da der Nutzen fr verschiedene Gruppen
den Abnehmern der Evaluationsergebnisse von Betroffenen bzw. Entscheidern sehr unter-
oft sehr schwer fllt, so da es mit die Aufgabe schiedlich gesehen werden kann. Werden etwa
des Evaluators ist, diesen bersetzungsproze verschiedene Therapieformen fr Alkoholkranke
durch geeignete Sozialtechniken zu unterstt- anhand der Kriterien Dauer des Aufenthaltes
zen. Hierzu liegt eine Flle von Anstzen vor, in einer Suchtklinik und Rckfallquote eva-
die wichtigsten sind im Diagramm IV/9 zusam- luiert, knnen Patienten, Klinikleitung und
mengefat. Kostentrger sehr unterschiedliche Nutzenbe-
wertungen haben. Fr die Klinikleitung mag
In den folgenden drei Abschnitten knnen fr ein lngerer Aufenthalt auch hheren Nutzen
die Bereiche Nutzenmessung, Entscheidung haben, zumindest bei unvollstndiger Kapazi-
durch Experten und Entscheidung durch Be- ttsauslastung (Einnahmensicherung), fr die
troffene jeweils nur die allerwichtigsten Anstze Kostentrger ist jeder Tag weniger eine wich-
diskutiert werden. Die wichtige praktische Ein- tige Einsparung, und fr den Patienten (und
Zielexplikation und Bewertungskriterien 103

Diagramm IV/9
bersicht ber einige wichtige Techniken zu Entscheidungs- und Bewertungshilfen (Auswahl)

Vorwiegend monetre Anstze Bewertung durch Experten


Kosten-Nutzen-Analyse Expertenurteil
Kosten-Effektivitts-Analyse Gruppendiskussion
Methoden der Kosten- und Investitions- Szenario-Technik
rechnung DELPHI-Technik
Management Systems (z.B. Management
by Budgeting Systems PPBS) Elaborierte wissenschaftliche Anstze
Entscheidungsanalyse (EA)
Nutzenbestimmung durch Betroffene Soziale Urteilsbildungstechnologie (SJT)
Concret goal setting (GS) Multi-Attributive Nutzentechnik (MAUT)
Goal-Attainment-Scaling (GAS)
Goal-Orientate + Automate + Progress Note
(GAP)
Patient Progress Record (PPR)
Informierte Einzelentscheidung
Planungszelle

evtl. den Kostentrger) kann vor allem die Ver- formalisierte Verrechnungsmethoden er-
hinderung von Rckfllen die alles andere ber- leichtern.
ragende Bedeutung haben. Sofern so stark diver-
gierende Bewertungen wirklich vorliegen, ist eine Die Vorteile einer auch nur auf Ranginfor-
objektive Nutzenbestimmung kaum mglich. mation aufbauenden Nutzenmessung werden
deutlich, wenn man sich berlegt, da ein
Die hier angedeuteten Schwierigkeiten sollen monotoner Zusammenhang zwischen Krite-
nicht zu einer Abwertung expliziter Verrech- riumsausprgung und Nutzen in keiner Weise
nungsverfahren fhren. Die Probleme bestehen selbstverstndlich ist (fr verschiedene Funk-
in gleicher Form bei allen anderen Entschei- tionsverlufe vgl. Diagramm IV/10). Zwar gibt es
dungsverfahren, nur werden sie dort weniger sicher oft monotone Zusammenhnge, doch
deutlich, was fr eine sachgerechte Lsung oft sollte man dies nie ungeprft voraussetzen,
von Nachteil ist. nicht einmal bei so einfachen Aspekten wie
Preis oder Intellektuelle Leistungsfhigkeit
eine besonders billige Ware kann leicht nur
Nutzenmessung
wegen des Preises als qualitativ minderwertig
eingestuft werden (was den Nutzen des Kaufes
Die bersetzung einzelner Kriteriumsauspr-
entsprechend subjektiv senkt), und ob eine
gungen in zugeordnete Nutzenwerte erfllt
Spitzenintelligenz fr einfachste Berufsttig-
zwei Funktionen:
keiten (wegen dem subjektiven Anspruchsni-
Sie ermglicht die Anwendung formalisier- veau) oder fr Konzentration erfordernde T-
ter Bewertungs- bzw. Entscheidungsverfah- tigkeiten wie etwa Autofahren (etwa wegen der
ren, vor allem bei Vorliegen harter (Intervall- intensiven gedanklichen Beschftigung mit ei-
oder Rational-) Skalen, etwa nach dem nem Problem) wirklich besser geeignet ist als
Erwartungs-mal-Wert-Prinzip (siehe dazu ein durchschnittlich begabter Mensch, ist zu-
Winterfeldt, 1974) mindest fraglich (man vergleiche etwa die eben-
Auch bei schwachen (Rang-)Skalen trgt die falls inverte u-frmige Beziehung zwischen An-
Nutzenmessung zur Problemexplikation bei strengung und Leistung, siehe etwa Kleiner und
und kann damit eine rationale, konsens- Hukla, 1970). Zunchst monoton verlaufende
bezogene Entscheidungsfindung auch ohne und ab einem Grenzwert weitgehend konstant
104 Zielexplikation und Bewertungskriterien

bleibende Kriteriums/Nutzenbeziehungen fin- lung von Nutzenwerten fr die einzelnen Krite-


den sich u.a. bei den sogenannten Hygiene- riumsausprgungen ber Personengruppen hin-
Faktoren der Arbeitsplatzgestaltung (Herzberg weg die Aussagekraft stark reduzieren kann.
1959, S. 66). Die Verbesserung solcher Aspekte Grere Praxisrelevanz haben Verfahren, die
(etwa Senkung der Lrmbelastung) erhht bis die Mehrdimensionalitt des Nutzens von
zu einer gewissen Grenze den Nutzenaspekt Handlungsalternativen bercksichtigen. Auch
Arbeitszufriedenheit, jenseits eines solchen wenn dort vergleichbare methodische Schw-
kritischen Wertes fhrt eine weitere Verbesse- chen auftreten, liefert die Explikation der rele-
rung der objektiven Fakten aber nicht mehr zu vanten Teildimensionen an sich schon einen
einer Nutzensteigerung. Informationsgewinn, der selbst dann fr die
Fr das Erarbeiten der im konkreten Anwen- Entscheidungsfindung ntzlich ist, wenn man
dungsfall vorliegenden Kriteriums/Nutzen- auf formalisierte Entscheidungen verzichtet.
beziehung wurde eine Reihe von technischen Ein fr die multidimensionale Nutzenmessung
Vorgehensweisen entwickelt, die sich vor allem besonders wichtiger Ansatz ist die MAUT-
hinsichtlich des Aufwandes bei der Durchfh- Technik, die schon in verschiedenen Anwen-
rung des nutzenbezogenen Vergleichs zwischen dungsbereichen von Evaluationsfragestellun-
den einzelnen Ausprgungsgraden und, damit gen eingesetzt wurde (siehe etwa Kasubek und
zusammenhngend, dem angestrebten Skalen- Aschenbrenner, 1978).
niveau der Nutzendimension unterscheiden. Das Vorgehen dieser Technik ist im folgenden
Einige wichtige Anstze dazu finden sich im dargestellt:
Diagramm IV/11 (vgl. Fishburn 1967). Fr Eva-
luationsfragestellungen ist die Anwendbarkeit 1. Identifizierung der Personen oder Organisa-
dieser Verfahren dadurch eingeschrnkt, da sie tionen, deren Nutzen zu maximieren ist.
im Prinzip fr jeden Beteiligten (oder doch zu- 2. Erarbeitung des Problembereichs, das heit
mindest jede beteiligten Gruppe) gesondert der Entscheidung, fr den/die die Nutzen-
durchgefhrt werden mten und eine Mitte- maximierung relevant ist.

Diagramm IV/10
bersicht ber Methoden der eindimensionalen Nutzenmessung (nach Fishburn, 1967)

Der funktionale Zusammenhang zwischen Kri- fr die der Nutzen konstant bleibt; ein Beispiel ist
teriumsausprgung (k) und dem Nutzen davon etwa die Erledigungsgeschwindigkeit von (Teil-)
(N(k)) kann folgende Formen aufweisen: Arbeiten in einem Projekt, deren Erhhung nur
nicht-monotone: tritt auf, wenn ein mittlerer dann eine Nutzensteigerung erbringt, wenn nicht
Kriteriumswert besonders gnstig ist, etwa bei auf andere Teilarbeiten gewartet werden mu (2)
dem Verhltnis von (psychischer) Anspannung streng monotone: der Nutzen steigt zwar stets mit
und Leistung (1) steigendem Kriterium, aber nicht proportional; ty-
monotone: der Nutzen steigt i. A. monoton mit pisch fr alle Grenznutzenphnomene, etwa bei
dem Kriterium, es gibt aber Kriteriumsintervalle, finanziellen Anreizen durch Gehaltssteigerungen
(3)
N (k)
lineare: gleichbleibender, proportionaler Nutzen-
anstieg bei steigenden Kriteriumswerten; empi-
3 risch relativ selten, aber zur Vereinfachung in vie-
len Nutzenmessungsmethoden als nherungweise
4 Abbildung ohne berprfung angenommen (Aus-
2 nahme: MAUT und EA mit expliziter berprfung
der Verlaufsform der Nutzenfunktion) (4)
5 unstetige:der Funktionsverlauf verndert an ei-
nem Grenzwert seine Struktur; typisch fr alle
Hygienefaktoren, die zunchst mit steigender
Ausprgung auch einen hheren Nutzen haben
1 (z.B. am Arbeitsplatz), aber jenseits eines sinnvol-
len Grenzwertes keine weitere Nutzensteigerung
mehr erbringen (5)
k
Zielexplikation und Bewertungskriterien 105

Diagramm IV/11
bersicht ber Methoden der eindimensionalen Nutzenmessung (nach Fishburn, 1967)

Wichtige Unterscheidungskriterien von Nutzen- 2. Paarvergleich


messungsmethoden
Beim Paarvergleich werden alle in Frage stehenden Al-
Skalenniveau der Messung ternativen jeweils bzgl. eines Bewertungskriteriums mit
Subjektive, teilweise subjektive oder objektive allen anderen Alternativen verglichen. Dabei mu zu
Bewertungskriterien jedem Paar angegeben werden, welche Alternative be-
Methode arbeitet mit Wahrscheinlichkeit oder nicht vorzugt wird.
Methode basiert auf Prferenzurteilen, Indifferenz- Aus diesem Vergleich ergibt sich die Bevorzugungs-
urteilen, direkten Gleichheits- oder Ungleichheits- wahrscheinlichkeit jeder Alternative auf jeder Bewer-
urteilen ber den Nutzen tungsdimension.
Anzahl der Bewertungskriterien, die in ein Urteil ein- Von den Bevorzugungswahrscheinlichkeiten kann wie-
gehen derum auf die Beliebtheit jeder Alternative geschlos-
Methode ist geeignet fr diskrete und/oder kontinu- sen werden, die den Ausgangspunkt fr die Zuordnung
ierliche Bewertungsfaktoren von Nutzenwerten darstellt.

3. Gewichtete Rangreihe
Gebruchliche Verfahren der eindimensionalen Bei dieser Methode mssen die Alternativen fr jedes
Nutzenmessung Bewertungskriterium getrennt in eine Rangreihe ge-
bracht werden. Danach erfolgt die Gewichtung der Al-
1. Einfache Rangreihenbildung ternativen, wobei die schlechteste Alternative einen
Ziel dieser Methode ist es, die Bewertungsalternativen festen Wert (z.B. 10 Punkte) zugeordnet bekommt. Alle
bzgl. ihres Nutzens auf jeder Bewertungsdimension in anderen Alternativen mssen nun hierzu und unter-
eine Rangreihe zu bringen. Der Rangplatz der Alterna- einander bzgl. ihrer Ntzlichkeit auf dem Bewertungs-
tive kennzeichnet dann den Nutzenwert auf der ent- kriterium ins Verhltnis gebracht werden.
sprechenden Bewertungsdimension.

3. Identifizierung der Alternativen, die in die (Vorher mssen alle Werte normiert werden.)
Bewertung eingehen sollen.
4. Zusammentragen der relevanten Bewer- 10. Entscheidung: Wahl derjenigen Alternative
tungskriterien, anhand derer die Alterna- mit dem hchsten Ntzlichkeitswert ui.
tiven bewertet werden sollen.
5. Einordnung der relevanten Bewertungs-
Fr eine ausfhrliche Darstellung der multi-
kriterien in eine Zielhierarchie.
attributiven Nutzentechnik vgl. von Winterfeld
6. Gewichtung der Bewertungskriterien
(1974), Kaplan und Schwartz (1973), Wendt
7. Erstellung von Nutzenfunktionen fr jedes
und Vlek (1975).
einzelne Bewertungskriterium.
Unabhngig von Verfahrensdetails sollte
8. Feststellung des Ausprgungsgrad jeder zu
man sich als Evaluator stets bewut sein, da
bewertenden Alternative auf jeder Bewer-
auch numerisch erhaltene Nutzenwerte
tungsdimension (gleicher Skalenbereich fr
nichts an dem Faktum ndern knnen, da sie
alle Kriterien wichtig!).
letztlich subjektive Setzungen sind. Das Ergeb-
9. Bestimmung des Gesamtnutzens jeder zu be-
nis entsprechender Auswertungen ist streng ge-
wertenden Alternative nach folgender Formel:
nommen nicht ein wissenschaftlich erfater
Nutzenwert, sondern die Aussage Die Perso-
ui (Aj) = Summe (wi . ui (xij))
nen haben subjektiv folgenden Nutzen einge-
wobei u (Aj) = Gesamtnutzen schtzt oder Das Wahlverhalten der Personen
der Alternative Aj lt sich durch Zugrundelegung folgender
u (Aij) = Teilnutzen von xij Nutzenstruktur beschreiben. Nutzenaspekte
xij = Ausprgung der Alter- bleiben stets eine Sache der Setzung durch In-
native A auf dem i-ten dividuen, deren Subjektivitt auch nicht durch
wi = Gewicht des i-ten noch so elaborierte und objektive Erhebungs-
Kriteriums methoden beseitigt werden kann.
106 Zielexplikation und Bewertungskriterien

Nutzenverrechnung legen ist, wenn sie gleichzeitig in allen


Bewertungskriterien niedrigere Nutzenwerte
Die Zusammenfassung der Teilnutzen-Werte hat. So ist etwa im Diagramm IV/12 das Objekt A
auf den Bewertungskriterien erfolgt im einfach- in beiden Kriterien dem Objekt U unterlegen;
sten Fall in linearer Form. Die einzelnen Krite- unabhngig davon, wie man diese Kriterien ge-
rien erhalten je nach ihrer (subjektiven) Bedeu- wichtet, wrde immer fr A daher ein niedrige-
tung ein Gewicht zugeschrieben, und der rer Gesamtnutzen als fr U folgen, so da A
Gesamtnutzen eines Evaluationsobjektes ergibt innerhalb der dort dargestellten Vergleichsob-
sich aus der damit gewichteten Summe der jekte niemals das beste sein kann. Aus gleichen
Nutzenwerte dieses Objektes in den einzelnen berlegungen scheiden B, C und D aus. Fr die
Kriterien. Dieses Vorgehen wird zum Beispiel verbleibenden Objekte ist keine weitere Selekti-
bei MAUT gewhlt, wo auch diese Art der Zu- on nach diesem Prinzip mglich. Z hat zwar
sammenfassung formal dargestellt wurde (s.o.). den hchsten Wert auf dem 1. Kriterium, ist
Eine so einfache Verrechnungsform ist aber aber den anderen im 2. Kriterium unterlegen,
nicht immer sinnvoll. Sie impliziert zum Bei- hnliches gilt fr U, X und Y.
spiel, da ein Evaluationsobjekt mit durch-
schnittlichen Nutzenwerten auf den Bewer- Die Bildung der pareto-optimalen Teilmenge ist
tungskriterien den selben rechnerischen vor allem dann ntzlich, wenn viele Objekte
Gesamtnutzen haben kann wie ein anderes, zu evaluieren sind und klare Verrechnungs-
da auf einigen Kriterien sehr hohe, auf ande- regeln fehlen (gut anwendbar zum Beispiel bei
ren ganz geringe Nutzenwerte erbrachte. Sind Personalentscheidungen, Verpackungs- oder
nun die einzelnen Kriterien fr verschiedene Textvarianten in der Werbung, Anbieter von
Betroffene unterschiedlich bedeutsam, wre Weiterbildungsseminaren). Das Vorgehen lie-
eine solche Gleichheit rechnerischer Art in- fert i. A. keine endgltige Entscheidung, son-
haltlich nicht sinnvoll. Hinzu kommt, da die dern nur eine Vorselektion der Objekte, die zu
Bildung von gewichteten Summen fr die recht in die engste Wahl kommen.
Nutzenwerte die Messung auf dem Niveau von
mindestens Intervallskalen bedingt, was oft
nicht sinnvoll angenommen werden kann. Anwendung multipler cut-off-Strategien:
Unterstellt man vorsichtig-realistisch, da die
Nutzenmessung von Ausnahmefllen abgese- Auch wenn eine klare Zusammenfassung der
hen nur auf Rangskalen erfolgen kann und ins- einzelnen Nutzendimensionen fehlt, kann man
besondere eine Gewichtung der einzelnen Teil- hufig plausibel machen, da auf den einzel-
aspekte ber Personen bzw. Personengruppen nen Teilnutzenaspekten jeweils gewisse Min-
hinweg unterschiedlich sein knnen, so ist auf destwerte berschritten werden mssen (dies
der Basis einer formalen Nutzenverrechnung hat auch den Vorteil, da man mit Ordinal-
oft nur ein screening (damit meint man eine skalen bei der Nutzenmessung auskommt). Ein
mglichst einfache Vorauswahl letztlich nicht Beispiel dafr wre etwa die Auswahl besonde-
relevanter Alternativen) der Evaluationsobjekte res guter Seminaranbieter fr Weiterbildungs-
mglich. Man kann sich dazu des Gedankens programme (es kommen nur solche in Frage,
des Bildens der pareto-optimalen Teilmenge die fr die einzelnen Teildimensionen wie Lern-
bedienen, das Prinzip ist anhand von nur 2 erfolg, Seminarklima oder bertragbarkeit der
Nutzendimensionen im Diagramm IV/12 darge- Inhalte Mindestwerte berschritten haben),
stellt. Eine andere Mglichkeit sind Multiple- therapeutische Eingriffe (nur solche, die etwa
Cut-Off-Strategien. hinsichtlich unerwnschte Nebenwirkungen
Hchstgrenzen nicht berschreiten) oder die
Optimierung von Textgestaltungen (jeweils
Bilden von pareto-optimalen Teilmengen Mindest- bzw. Hchstwerte in Lnge, Verstnd-
lichkeit, emotionale Anmutung und dgl.). Die
Die Idee dabei ist, da eine Alternative unab- gleiche Denkweise ist auch typisch fr die Aus-
hngig von der speziellen Gewichtung oder wahl von Personen auf der Basis von Einzelfall-
Verrechnung immer dann einer anderen unter- bewertungen, etwa in der Eignungsdiagnostik,
Zielexplikation und Bewertungskriterien 107
der Potentialabschtzung oder bei Plazierungs- techniken vgl. Klebert et al. 1988). Typische
aufgaben. Man spricht dort gerne von Screen- Beispiele dafr sind etwa Projektgruppen in
ing-Verfahren. Eine solche formale Vorselek- Wirtschaft oder Verwaltung, Lehrerkonferen-
tion erleichtert auch bei Fehlen expliziter zen, Sitzungen von Therapeutenteams. Fr
Regeln der Nutzenverrechnung das weitere Vor- kompliziertere, spezielle Kenntnisse erfordernde
gehen, da die Zahl der noch zu bercksichti- Problemlagen ist es aber sinnvoll, zustzlich das
genden Objekte reduziert wurde. Zwischen den Wissen von Spezialisten (zum Beispiel Evalua-
verbleibenden Alternativen mu anschlieend toren) zustzlich einzubeziehen.
mit weniger formalisierten Verfahren entschie- In der Praxis finden sich fr die Beteiligung
den werden. Eine Mglichkeit ist die Konsens- von Experten an der Entscheidungsfindung viele
findung unter Betroffenen (vgl. 4.3.3), eine an- institutionalisierte Vorgehensweisen, etwa
dere der Einsatz von Experten. Enquette-Kommissionen, Anhrungen oder Be-
gutachtungen. Solche Methoden sind solange
weitgehend unproblematisch, als es um das
4.3.2 Expertengesttzte Darstellen von (wissenschaftlich) unumstritte-
Entscheidungsfindung nen Fakten geht. Setzen subjektive Bewertun-
gen mit ein oder sind die Fakten insbeson-
Am einfachsten ist die Zusammenfassung un- dere im Hinblick auf ihre Bedeutung und
terschiedlicher Aspekte durch eine persnliche Verursachung nicht so eindeutig beschreibbar
Einzelentscheidung (typisch in Teilen von (im sozialwissenschaftlichen Bereich gilt dies
Managementfunktionen, aber eher mit abneh- fast immer), bieten solche Anhrungen manch-
mender Tendenz) oder der Versuch, auf der Ba- mal ein das Ansehen der Wissenschaft nicht
sis der empirischen Ergebnisse einen Gruppen- gerade frderndes Bild.
konsens herbeizufhren. Bei nicht besonders Zur Vermeidung solcher Mistnde ist es an-
konfliktreichen Situationen gengt es oft, wenn gezeigt, anstatt ffentlicher Schaukmpfe
es gelingt, die fr die jeweilige Entscheidung zumindest fr politisch-emotional sehr umstrit-
zustndige oder davon unmittelbar betroffene tene Evaluationsfragestellungen Techniken ein-
Gruppe von Personen zusammenzufhren und zusetzen, die Rollenverhalten einschrnken
unter sachgerechter, konsensfrdernder Moti- und konsensbildend wirken. Einige Beispiele
vation diskutieren zu lassen (fr Moderations- (etwa Meta-Plan) wurden bereits in den vorher-

Diagramm IV/12
Prinzip der Pareto-optimalen Teilmenge

Grundlagen Skizze des Entscheidungsverlaufes bei zwei


Nutzendimensionen
Liegt mehr als ein Bewertungskriterium vor, stellt sich
die Frage nach der Zusammenfassung der jeweiligen Die Alternative A ist auf beiden Dimensionen kleiner
Nutzenwerte zu einer Auswahlentscheidung. Unab- als U und wird ausgeschlossen, B und C werden von X
hngig von einer speziellen Gewichtung oder einer bertroffen, D von Y. Die brigen (U, X, Y, Z) knnen
anderen Verrechnungsvorschrift kann aber jede Alter- nicht ausgeschlossen werden; zwar wird z.B. Y von Z
native von vorneherein ausgeschlossen werden, die auf der ersten Nutzendimension bertroffen, hat aber
gleichzeitig auf allen Nutzen-Teildimensionen von ei- auf der zweiten einen etwas hheren Wert, soda Y
ner anderen Alternative bertroffen wird. und U (z.B. bei wesentlich strkerer Gewichtung der
zweiten gegenber der ersten Dimension) in der
Gesamtbewertung doch ber Z liegen knnte.
Nutzen 2
U Die verbleibende Alternativenmenge wird pareto-
A X optimal genannt.
B Y Z
C
D

Nutzen 1
108 Zielexplikation und Bewertungskriterien

gehenden Abschnitten besprochen. Fr die Ar- ten angewandt; ein Beispiel im Zusammenhang
beit mit Experten besonders bewhrt hat sich mit der Curriculumsentwicklung gibt Huler
die sogenannte Delphi-Methode, die in Dia- et al., 1980.
gramm IV/13 dargestellt ist (vgl. Linstone &
Turoff, 1975; Bortz, 1984). Die anonyme Rck-
meldung ber die Angaben der Expertenkolle- 4.3.3. Entscheidungsfindung
gen vermeidet gruppendynamische Effekte, es durch Betroffene
fllt leichter, die von anderen vorgebrachten
Argumente ohne Emotionen zu prfen und seine Eigentlich sind die Betroffenen (aus wissen-
ursprngliche Aussage als Ergebnis solcher zu- schaftlicher Sicht meist Laien) jene Gruppe, die
stzlicher berlegungen ohne Gesichtsver- am ehesten befugt wre, bei Evaluations-
lust zu verndern. Leider ist dieses Verfahren fragestellungen eine Entscheidung zu treffen.
von den Kosten her aufwendig, und es wider- Das Problem dabei ist, da eine begrndete
spricht auch dem Selbstverstndnis vieler Wis- Auswahl oder Gestaltungsvorschlge doch eine
senschaftler wer gibt schon gerne zu, da er relativ weitgehende Sachkenntnisse der Grund-
auch in er Rolle als Sachverstndiger zu einigen lagen und Nebenfolgen voraussetzen, ber die
Themen dazu neigt oder doch zumindest nei- auch ein intelligenter und in der Sache enga-
gen knnte, auch sachfremde Einflsse wie gierter Laie im allgemeinen nicht verfgt.
Emotionen in seine Aussagen einflieen zu las- Dazu kommt noch, da Betroffene natrlich
sen? sehr dazu neigen, ihre persnlichen Nutzen-
Aus solchen Grnden wird die Delphi-Tech- aspekte besonders hoch zu veranschlagen und
nik (bisher) fr Evaluationsfragen leider nur sel- evtl. sogar massive Nachteile fr andere weni-

Diagramm IV/13
bersicht ber die Grundlagen der DELPHI-Technik (nach Bortz, 1984)

Definition Die Ergebnisse der Umfrage werden durch das


Leitungsteam ausgewertet (qualitativ und quantita-
Bei der DELPHI-Methode handelt es sich um eine spe- tiv)
zielle Form der schriftlichen Befragung, mittels derer Auf der Basis der Resultate dieser ersten Befragung
ein Kreis von Experten zu einem ausgewhlten Pro- wird durch das Leitungsgremium ein neuer Fragen-
blembereich in einem mehrstufigen Proze individuell katalog entworfen.
befragt wird, soda gruppendynamische Effekte ausge- In einer zweiten Befragungsrunde erhalten die ein-
schaltet werden knnen. Ein Leitungsgremium ber- zelnen Experten den neuen Fragebogen zusammen
nimmt dabei eine Koordinationsfunktion, indem es mit den Ergebnissen der ersten Umfrage sowie zu-
einen Katalog von Ausgangsfragen und Zielen entwik- stzliche Informationen ber die Standpunkte und
kelt, die Antworten der Experten auswertet, sowie ei- Lsungsbeitrge der anderen Experten. Die Exper-
nen stndig verbesserten Fragenkatalog ausarbeitet. ten werden dabei um eine Kommentierung ihrer
Antwort im Vergleich zu den Gruppenergebnissen
Ziele gebeten, wobei eine gewisse Angleichung der An-
Gewinnung von neuen Ideen durch Experten sichten erwartet wird.
Annherung der Standpunkte durch stndige Rck- Weitere Auswertungen und Umfragen (meistens
meldung, soda ein bereinstimmender Lsungs- werden drei bis fnf Wiederholungsrunden nach
vorschlag fr das behandelte Problem entwickelt dem obigen Ablaufschema durchlaufen). Dabei wer-
werden kann. den extreme Meinungen eliminiert und das Schwer-
gewicht auf strittige Punkte gelegt.
Ablauf der DELPHI-Technik Liegt eine Ideensammlung von grerer Aussage-
fhigkeit vor, erarbeitet das Leitungsgremium
Das Leitungsgremium erarbeitet fr die anstehende schlielich einen umfassenden Lsungsvorschlag fr
Problematik einen speziellen Fragebogen das relevante Problem.
Ein ausgewhltes Expertenteam wird mit Hilfe des
vorbereiteten Fragebogens um seine Meinung gebe-
ten. Die schriftliche Befragung findet individuell
und anonym statt.
Zielexplikation und Bewertungskriterien 109
ger gravierend zu gewichten. Mchte man diese Modifikation wre das Verfahren sicher auch
Strungen ausschalten, ist ein intensiver per- sehr gut geeignet, in anderen Bereichen eine
snlicher Kontakt zwischen verschiedenen wirkliche Beteiligung der Betroffenen an der
Betroffenen mit unterschiedlichen Interessen, (politischen) Entscheidungsfindung zu ermg-
eine sorgfltige Information dieser Entschei- lichen, deren Qualitt weit ber die in man-
der sowie eine konsensfrdernde Diskussions- chen Bereichen gesetzlich vorgesehenen An-
gestaltung erforderlich. Wichtig ist auch eine hrungen hinausgeht.
wirklich reprsentative Auswahl der Entschei-
der aus der Gesamtheit der Betroffenen, da Leider mu man feststellen, da die Planungs-
sonst durch Selbstselektion oder Verbands- bzw. zelle in jngster Zeit nur selten angewandt zu
Parteiennominierung ein stark verzerrtes Bild werden scheint, was nur zum Teil durch die
ber die tatschlich vorhandenen Interessen, nicht unerheblichen Kosten zu erklren ist.
noch verstrkt durch die bei den Experten ge- Man mu im Bereich der Evaluation damit le-
nannten Rollenzwngen, entstehen kann. ben, da die Berechtigung zum Treffen von Ent-
Ein fr die Lsung dieser Probleme hervorra- scheidungen mit sehr vielen zustzlichen, fr
gend geeigneter Ansatz ist die Planungszelle die Motivierung von Menschen wichtigen,
(Dienel, 1978), die im Diagramm IV/14 skizziert Nebenaspekten verbunden ist und sich daher
ist. Die dort getroffenen Manahmen schlie- kaum jemand subjektiv als bedeutend einge-
en den empirischen Erfahrungen zufolge schtzte Entscheidungen von anderen abneh-
nahezu alle klassischen Streffekte einer Ent- men lt. Die Delegation relevanter Entschei-
scheidungsbildung durch Laien aus, kompetente dungen etwa von politischen Mandatstrgern
Durchfhrung der einzelnen Teilschritte vor- auf informierte Betroffene drfte vor diesem
ausgesetzt. Das Verfahren ist besonders dann Hintergrund nicht als Entlastung, sondern als
angemessen, wenn die wissenschaftlichen ein Verlust von Macht und Einflu gesehen
Grundlagen fr die Entscheidung entweder we- werden. Wozu braucht man eigentlich noch
nig wichtig oder leicht verstndlich sind. Dies politische Parteien und deren Mandate, wenn
drfte der Grund sein, warum diese Methode in wichtigen Angelegenheiten ohne oder sogar
vorwiegend fr antizipatorische Evaluation von gegen sie entschieden wird? Da es fr politische
Stadtplanungsmanahmen (siehe dazu Dienel, Entscheidungen sehr unglcklich wre, zuerst
1978) eingesetzt wurde. Bei entsprechender eine Planungszelle einzufhren und spter als

Diagramm IV/14
bersicht ber die Grundlagen der Planungszelle (nach Dienel, 1978)

Prinzip Merkmale des Modells:


Das Prinzip der Planungszelle liegt in der Zusammen- Unerlliche konstruktive Merkmale
fassung einer greren Anzahl von Betroffenen in Gruppenentscheid
mehreren Kleingruppen. Diese erhalten sorgfltige und Akzeptable Rollenzuordnung fr alle Teilnehmer
umfassenden Informationen durch Fachexperten. In Freistellung der Teilnehmer von Arbeits- und
einer Diskussion der Informationen in der Kleingruppe Familienverpflichtungen
werden abschlieend eine Bewertung des Problems Vergtete Teilnahme
bzw. eine Beschlufassung festgelegt. Befristete Teilnahme
Teilnehmerzufallsauswahl
Definition Planungszelle (nach Dienel, 1978, S. 74) Laienteilnehmer
Fachliche Begleitung
ist eine Gruppe von Brgern, die nach einem Zu- Vorgegebenen Aufgabenstellung
fallsverfahren ausgewhlt und fr begrenzte Zeit von Freizgigkeit des Einsatzes
ihren arbeitstglichen Verpflichtungen vergtet freige- Simultananwendbarkeit durch andere Gruppen
stellt worden sind, um, assistiert von Prozebegleitern, Variable Merkmale
Lsungen fr vorgegebene, lsbare Planungsprobleme Teilnehmerzahl (meistens 25 Personen)
zu erarbeiten. Dauer (meistens drei Wochen)
Programmdichte (= Einflumglichkeit auf den
Programmablauf)
110 Zielexplikation und Bewertungskriterien

rechtlich verantwortliches (politisches) Gremi- Evaluation) meist einem umfassenden Dis-


um eine gegenteilige Entscheidung zu treffen kussionsproze vorbehalten, den man als
(man denken nur an die Darstellung eines sol- freies Spiel der Argumente charakterisie-
chen Vorgehens in den Massenmedien!), bedeu- ren knnte. In solchen Fllen ist die Ge-
tet die Einschaltung einer Planungszelle prak- fahr, da der Evaluator zum Anwalt einer
tisch die Entscheidungsdelegation und damit bestimmten Richtung wird, besonders
eine sowohl subjektiv erlebte als auch objektiv hoch (vgl. Abschnitt 2.1.1).
gegebene Entmachtung in dieser Teilfrage. Viele Entscheider wrden vermutlich vllig
demotiviert, wenn sie alle oder doch die
wichtigsten beruflichen Entscheidungen auf
4.3.4 Grenzen objektiver einer rein rationalen, berechenbaren (und
Nutzenbewertung damit letztlich auch automatisierbaren) Ba-
sis treffen sollten. Die vllige Reduktion auf
Verfahren zur Nutzenmessung und Hilfen bei solche formalisierten Verfahren wrde kei-
der Entscheidungsfindung knnen wesentlich nen Raum mehr fr persnliche Vorlieben,
zu rationalen, auch konsensfhigen Entschei- Freude am auch in Grenzen willkrlichen
dungen auf der Basis von Evaluationsprojekten Gestalten und kreativen, den formal-rationa-
beitragen. Man darf aber nicht erwarten, da len Rahmen bersteigende Ideen lassen. Ver-
solche objektiven Techniken stets anwend- mutlich wren viele gesellschaftliche Vern-
bar bzw. an sich akzeptabel sind. Manche Hin- derungen nie erfolgt, wenn man ihre
derungsgrnde sind bedauerlich und nicht berlegenheit gegenber althergebrachten
prinzipiell (Innovationsscheu, Angst vor Reduk- Verfahrensweisen auf der Basis empirisch er-
tion des persnlichen Einflusses etc.), einige hobener und explizit verrechneter Nutzen-
aber auch sachlich gerechtfertigt: werte htte begrnden mssen.

Die Setzung von Zielen wie die Welt sein Diese Argumente sollten aber nicht als Abwer-
soll ist keine empirische Frage, sondern eine tung einer sorgfltigen Nutzenerhebung ver-
subjektive Entscheidung; es ist daher durch- standen werden. Auch heute noch drfte es
aus legitim, sich fr die Erreichung eines Zie- eher einen Mangel als ein bertriebenes Aus-
les auch bei (zunchst?) widersprechenden ma rationaler Entscheidungen geben, selbst
Evaluationsergebnissen politisch bzw. argu- bei der Verwendung von empirischen Evalua-
mentativ einzusetzen. tionsergebnissen.
Oft sind die Entscheider eingebettet in ein Es kommt immer wieder vor, da sich der
Netzwerk von Einflssen, und die von ih- Evaluator ber sachfremde Einflsse auf die
nen ausgewhlte Alternative wirkt auf- Projektdurchfhrung und Ergebnisverwertung
grund der Reaktion der Betroffenen auf die rgert, langfristig (vom Mittelalter bis heute) ist
Situation der Entscheider zurck. Dies ist aber eine evaluationsfreundliche Vernderung
typisch fr politische Manahmen (Ge- der Gesellschaft unverkennbar. Auch mu man
setzesvorhaben, Gestaltung von Schulsy- damit rechnen, in diesem Berufsfeld immer
stemen, Organisationsmanahmen der wieder Entscheidungstrgern mit offensichtlich
Verwaltung) oder die Arbeit besonders be- feudalstaatlich geprgten Denkstrukturen zu
deutsamer Organisationen (Parteien, Ge- begegnen (und dies keineswegs nur in Politik
werkschaften, Krankenkassen u..), in klei- und Verwaltung), doch kann gerade die Ex-
nerem Umfang auch in privaten Vereinen plikation der Zielsetzung und der Bewertungs-
wie etwa Berufsverbnden. In solchen Si- kriterien wesentlich dazu beitragen, den
tuationen bleibt die Bewertung von Al- Wirksamkeitsbereich solcher gesellschaftlicher
ternativen (insbesondere bei prospektiver Fossilien allmhlich einzuschrnken.
Zielexplikation und Bewertungskriterien 111

bersicht Kapitel 4:
Zielexplikation und Bewertungskriterien
4.1
Zielexplikationen
Mglichkeiten
Strikte Vorgaben der Zielsetzung Vorliegen einer gewissen Zielset- Auftraggeber hat nur eine sehr
durch den Auftraggeber zung durch den Auftraggeber. vage Vorstellung von den Zielen
Evaluator mu diese aber der Evaluation. Evaluation mu
konkretisieren und verbessern intensive Zielexplikation betreiben

Regelfall
Problem: Zielexplikation bei Vorliegen von Konflikten innerhalb des Auftrages

Zielgruppenbestimmung Konkretisierung des Evaluations- Antizipatorische Ergebniswertung


Bestimmung der von der projekts Probleme bei Evaluationsvor-
Evaluation betroffenen Erarbeitung von relevanten haben
Zielgruppe Ausprgungsgraden des Vernderung der Rahmenbedin-
Hilfsmittel: Evaluationsprojektes gungen
Kreativittstechniken Hilfsmittel: Nachtrgliche, ergebnis-
Situationsanalyse abhngige Verschiebung
Gruppendiskussion Abhilfe durch Antizipation der
Brain-Storming Verwertungssituation
Hilfsmittel: Szenario-Technik
Planspiel

4.2
Bewertungsproze
Bewertungskriterien Nebenfolgenabschtzung Operationalisierungsfragen
Aufstellung einer Zielhierarchie Abschtzung der Nebenfolgen Operationalisierung der Bewertungs-
und Auswahl der passenden durch Untersuchung der Zielgrup- kriterien
Bewertungsdimensionen pen, ob Manahmen Konse- Inhaltliche und methodische
Hilfstechniken: quenzen fr die Handlungsplne Probleme
Brain-Storming der Zielgruppen haben knnte
Metaplan-Techniken Hilfsmittel:
Metaplan-Techniken
vertrauliche Interviews

4.3
Bewertungs- und Entscheidungshilfen
Verfahren der Nutzenbestimmung
Teilschritte der Nutzenbestimmung
eindimensional: mehrdimensional:
funktionale Verknpfung z. B. MAUT
Kriteriums-/Nutzenwert
Zusammenfassung der Nutzenwerte
zur Nutzenverrechnung
Linearkombinationen
pareto-optimale Teilmenge
multiple cut-off-Strategien

Entscheidungsfindung durch Entscheidungsfindung durch Grenzen objektiver Nutzen-


Experten Betroffene bewertung
Hilfstechniken: Hilfstechniken: Zielsetzung subjektiv
Delphi-Methode Planungszelle vernetzte Einflsse
Meta-Plan Moderation Freiraum fr Entscheider
113

5. Planung von Evaluationsprojekten

Wie schon im 1. Kapitel dargestellt, ist das Da fr diese Arten von Evaluation aber am ehe-
Berufsfeld Evaluation so heterogen, da eindeu- sten Hinweise in der vorhandenen Literatur
tige Vorschriften fr die Planung solcher Vor- verfgbar sind (siehe dazu etwa Prell, 1984;
haben nicht zu erstellen sind. Hinzu kommt Hellstern und Wollmann, 1984), wird im fol-
noch, da die Planung von Projekten naturge- genden von einem kommerziell orientierten
m eine Gestaltungsaufgabe ist, fr die es auch Evaluationsvorhaben ausgegangen.
im konkreten Einzelfall viele verschiedene Das folgende Kapitel ist nach dem zeitlichen
durchaus gute Lsungen gibt. Ablauf der Arbeit an einem Evaluationsprojekt
Um wenigstens einen ersten Einblick in die gegliedert, die Hauptpunkte dabei sind in Dia-
Planungsarbeit geben zu knnen, wird in den gramm V/1 zusammengefat.
folgenden Abschnitten von einem typischen
Fall, nmlich der Reaktion auf eine Projektaus- Diagramm V/1
schreibung, ausgegangen. Die Projektarbeit Besonders wichtige Punkte bei der Planung
beginnt dann mit der Angebotserstellung, wo- von Evaluationsprojekten
bei vor allem Fragen des Projektmanagements
(5.1.) wichtig sind. Kommt ein Auftrag zustande, Beginn der Projektarbeit
beginnt die eigentliche, intensive Vorbereitung
Angebotserstellung
(Design-Fragen, Abschnitt 5.2.) und darauf auf-
bauend die Vorbereitung der Auswertung (5.3).
Projektmanagement Informationsbeschaffung
Auf andere Auftragsverhltnisse bei der Evalua- Entwicklung eines vor-
lufigen Arbeitsplans
tion, etwa Zeit- und Kosten-
schtzung
Einholen eines einzigen Angebots bei einem
besonders vertrauten oder als besonders Designfrage Identifizierung u. ber-
kompetent geltenden Experten, prfung potentieller Str-
Finanzierung des Vorhabens aus Stiftungs- und Fehlerquellen
oder anderen Frderungsmitteln, Entwicklung eines Unter-
suchungsplanes
Planung einer Evaluation mit ausschlielich Auswahl und Applikation
hausinternen Mitteln, ber die evtl. der spezifischer Datenerhe-
Evaluator selbst im Rahmen seiner berufli- bungsverfahren
chen Zustndigkeit ohne finanzielles Risiko
(Vorbereitung der) Entscheidung fr be-
verfgen kann,
Auswertung stimmte Mae an
Durchfhrung des Vorhabens im Rahmen ei- Effektstrke
ner Diplomarbeit, o.. Wahl eines spezifischen
Selbstevaluation Auswertungsverfahrens
(z.B. lineare Modellan-
stze vs. qualitativer
sind einige der in den folgenden Abschnitten Auswertungstechniken)
dargestellten Ausfhrungen nicht anwendbar.
114 Planung von Evaluationsprojekten

5.1 Projektmanagement sentlichen Inhalt des (meist schriftlichen) An-


gebotes bildet (5.1.2). Auf der Basis dieser vor-
lufigen Planung wird ein Zeit- und Kostenplan
Die fr die Projektorganisation entscheidende erstellt, bei dem man prinzipiell vor einem Di-
Phase ist die Planung, die auch die Grundlage lemma steht:
jeder professionellen Angebotserstellung ist.
Gelingt es, diese vorbereitenden Arbeiten sach-
veranschlagt man den Aufwand zu niedrig,
knnen erhebliche finanzielle Belastungen
gerecht durchzufhren, kann sich das sptere
des Institutes die Folge sein, auch die Quali-
Projektmanagement im wesentlichen auf die
tt der Arbeitsausfhrung leidet darunter er-
Kontrolle der Einhaltung des Planes beziehen,
heblich
was gegenber ad-hoc-Lsungen fr nicht
rechtzeitig berlegte Probleme sehr entlastet
kalkuliert man zu grozgig, kann der ber-
zogen Betrag die Ursache sein, den Zuschlag
und die Qualitt der Projektarbeit frdert.
nicht zu erhalten, mit allen Konsequenzen
In diesem Abschnitt kann nur ein erster Ein-
daraus (zum Beispiel Kndigung von ohne
blick in technische Hilfen fr die Planung und
weitere Projekte nicht lnger finanzierbaren
Abwicklung von Evaluationsprojekten gegeben
Mitarbeitern)
werden. Meist beginnen die Probleme schon
mit unzureichenden Informationen fr ein
auch nur annhernd aussagekrftiges Angebot. Diese Entscheidung wird oft weniger auf der
Fr Evaluationsvorhaben (und hnliche Fra- Basis solider Fachkenntnisse getroffen, sondern
gestellungen auf der Basis sozialwissenschaftli- bleibt der Zustndigkeit des jeweiligen Instituts-
cher Kenntnisse) sind Ausschreibungen mei- leiters vorbehalten, der aufgrund seiner Stel-
stens nur bedingt informativ. Man kann in lung letztlich die Entscheidung zu verantwor-
einer fr die Angebotserstellung halbwegs aus- ten hat. Von der Fachseite kann nur eine
reichenden Weise ein Bauprojekt, die Erledi- Kalkulation der erforderlichen Mindestauf-
gung von EDV-Arbeiten oder den Ankauf einer wendungen geleistet werden (vgl. Abschnitt
bestimmten Menge einer Ware mit vorgegebe- 5.1.3).
nen Qualittsstandards ausschreiben, die Pla-
nung eines Evaluationsprojektes setzt aber eine
wesentlich intensivere Kenntnis der speziellen 5.1.1 Informationen zu Projekt-
Rahmenbedingungen voraus. Hufig ist dieses details und Rahmenbedingungen
Faktum, und insbesondere die genaue Ausdiffe-
renzierung der notwendigen Vorinformatio- Es empfiehlt sich, zunchst eine Liste von
nen, dem potentiellen Auftraggeber gar nicht Aspekten anzufertigen, die man vor der kon-
bekannt wenn im eigenen Hause erfahrene kreten Projektarbeit gerne geklrt htte. Im Dia-
Evaluatoren wren, wre ja vermutlich eine gramm V/2 sind einige Bereiche genannt, die
Ausschreibung fr externe Auftragnehmer man zum Beispiel in einem Vorgesprch ber
nicht erforderlich. Hinzu kommt, da es zwar eine Evaluation einer laufenden Werbekampa-
zur Allgemeinbildung gehrt, Grundkenntnisse gne klren sollte (nur eine Auswahl aus allen
in naturwissenschaftlichen oder technischen vermutlich wichtigen!). Man mu allerdings
Bereichen zu haben, im allgemeinbildenden davon ausgehen, da aufgrund der ersten, rela-
Schulwesen aber ebenso wie innerhalb der mei- tiv vagen Vorkenntnisse zunchst relevante
sten universitren Studiengnge kaum sachlich Punkte bersehen werden.
zutreffende Darstellungen ber psychologische Ein Teil der bentigten Informationen, ins-
oder sozialwissenschaftliche Inhalte zu finden besondere zum allgemeinen Hintergrund, lt
sind. Die Einholung der erforderlichen Infor- sich auf der Basis von schriftlichen Unterlagen
mationen stt daher von Seiten der potentiel- beschaffen. Allgemeine Informationen wie Gr-
len Auftraggeber manchmal auf Unverstndnis e des Unternehmens, Zahl der Zweigstellen,
(siehe 5.1.1). Nach Lsung dieser Probleme Umsatz- und Gewinndaten kann man den jhr-
kann ein vorlufiger Arbeitsplan erstellt wer- lichen Geschftsberichten entnehmen, die sich
den, dessen mglichst bersichtliche und entweder an Universittsbibliotheken (Wirt-
gleichzeitig werbende Darstellung den we- schaftswissenschaften!) befinden oder bei dem
Planung von Evaluationsprojekten 115
potentiellen Auftraggeber direkt angefordert haben. Das Gesprch mu mglichst flexibel
werden knnen. Eine nicht ganz problemlos gefhrt werden, um auch gegenber zunchst
zugngliche Informationsquelle sind nach nicht bercksichtigten Aspekten offen zu sein,
Stichworten aufbereitete Archive von Zeitungs- gleichzeitig mu aber sichergestellt werden,
bzw. Zeitschriftenartikeln, wie sie insbesondere da alle relevanten Bereiche angesprochen wer-
die groen Verlage in der Bundesrepublik un- den. Man kann eine entsprechende Aufstellung
terhalten und gelegentlich auch externen In- von abzuklrenden Punkten (vgl. dazu auch Dia-
teressenten zugnglich machen. gramm V/2) durchaus als Arbeitsgrundlage neh-
men.
Eine besonders wichtige Grundlage sind persn- Auch bei sorgfltigster Vorbereitung hngt
liche Gesprche mit dem potentiellen Auftrag- der Gesprchserfolg stark vom Verhalten des
geber, die in jedem Fall herbeigefhrt werden Evaluators ab, wertvolle Hinweise dazu geben
sollten. ber Fakten hinaus kann man dabei die psychologiegesttzten Ausarbeitungen fr
auch Hintergrnde, erwartete Probleme und effektive Gesprchsfhrung (siehe dazu etwa
evtl. Konflikte zwischen Mitarbeitern oder Ab- Kopperschmidt, 1976 Holly, 1979.) Bei der
teilungen des Auftraggebers erfahren oder doch bertragung auf Informationsgesprche dieser
erahnen (gerade in dieser Hinsicht ist der direkte Art mu man allerdings bedenken, da diese
persnliche Kontakt dem leichter erreichbaren Anstze meist aus dem klinischen Bereich her-
Telefongesprch weit berlegen). Die Informa- aus entwickelt wurden und gewisser Modifizie-
tionsbeschaffung fr die Angebotserstellung ist rungen bedrfen.
hufig nicht nur ein sachliches Problem, son- Die explizite Nachbereitung der Informa-
dern auch ein taktisch-psychologisches. tionserhebungsphase unterbleibt leider oft.
Die beste Vorbereitung fr ein persnliches Anfnger nehmen sie zu wenig wichtig, und
Gesprch ist das Erstellen einer Fragenliste, die erfahrene Evaluatoren haben das Gefhl, ohne-
man aber in keinem Fall als Fragebogen ver- dies alles an relevanten Ergebnissen auch ohne
stehen darf. Ein Informationsgesprch mit ei- schriftliche Fixierung prsent zu haben. Meist
nem potentiellen Auftraggeber sollte niemals gilt dies aber nur kurzfristig, man vergit auch
den Charakter eines standardisierten Interviews entscheidende Punkte relativ schnell.

Diagramm V/2
Auflistung des besonders relevanten Informationsbedarfes am Beispiel Werbestrategie

Anforderungen u. Auflagen von Seiten des Auftraggebers Restriktionen von Seiten der Auftraggebers

Klrung der Intention bzw. der Zielsetzung Definition des kalkulierten Zeit- und
Bercksichtigung der Firmenphilosophie Kostenvolumens
Verstndigung ber die Produkt- , Sortiments-, Erfragen von Kapazittsbeschrnkungen etc.
Distributions- und Finanzpolitik der Unternehmung
Abklrung der Konkurrenzsituation etc.

Informationen ber spezifische Eigenschaften u. Fragen der Entwicklung, Beschaffung,


Qualitten des betreffenden Produktes Finanzierung u. Distribution des Werbematerials

Abklrung (produktions-)technischer Details Erfassung von akzeptierten Mieten u.


Stellung des Produktes im Sortiment des Anbieters Brokosten
innovative Eigenschaften u. Funktionen des Produktes Erfragen von Volumen fr Lhne u. Gehlter
etc. Klrung der Frage Make or Buy etc.

Informationen ber die von der Unternehmung in der


Vergangenheit durchgefhrten Werbeaktionen

Strategien, Aufmachung
Erfolge, Defizite etc.
116 Planung von Evaluationsprojekten

5.1.2 Vorlufiger Arbeitsplan Arbeiten zur Angebotserstellung bestenfalls bei


Auftragserteilung in Rechnung gestellt werden
knnen, so da man zwischen der sachlichen
Schon fr mittlere und erst recht fr groe Pro-
Fundierung des Angebots und dem mglicher-
jekte empfiehlt es sich, die notwendigen Teil-
weise finanziell nicht ersetzten Arbeitsaufwand
schritte in Form eines strukturierten Arbeits-
fr die Angebotserstellung abwgen mu. Dies
planes niederzulegen. Dieser mu nicht
ist fr kleinere Institute oder gar freiberuflich
aufwendig formalisiert sein, sollte aber doch
ttige Wissenschaftler, die kommerziell Evalua-
alle Punkte bercksichtigen, die ein Angebot
tionsprojekte durchfhren, ein erhebliches Pro-
unbedingt enthalten mu:
blem. Bei mittelgroen Evaluationsprojekten
Die einzelnen vorgesehenen Arbeitsschritte mu man fr alle Arbeitsschritte der Detail-
in der fr das Projekt notwendigen zeitlichen planung bis zu einem vollen Mannmonat rech-
Abfolge nen, die Selbstkosten dafr sind betrchtlich.
Entscheidungspunkte, die im Verlaufe der Zum eigentlichen Bruttogehalt kommen die
Arbeit durch den Auftraggeber geklrt wer- Lohnnebenkosten (etwa 80%), Ausgaben fr
den mssen Raummiete, Heizung, Telefon und Arbeitsmit-
Zu den einzelnen Arbeitsschritten den unge- tel sowie der von diesem Mitarbeiter zu erbrin-
fhr dafr vorgesehenen Aufwand (etwa An- gende Deckungsbetrag fr die brigen Instituts-
zahl der Beobachtungseinheiten, ungefhre kosten (anteilige Umlage von zum Beispiel
Dauer der Datenerhebung fr die einzelnen Ausgaben fr Verwaltungspersonal, technische
Interviewflle usw.), evtl. mit Angabe emp- Einrichtungen wie etwa EDV-Anlagen, Werbe-
fohlener Mindest- und Hchstgrenzen und PR-Aktionen, Aufwendungen fr Weiter-
Eine sorgfltige Auflistung aller Arbeiten, die bildung wie Kongresse und dgl.). Ein Mann/
vom Arbeitgeber erbracht oder von diesen Monat kann daher auch bei kostengnstig ge-
auerhalb des Angebotes in Auftrag gegeben fhrten Instituten leicht einem halben Jahres-
werden sollen (etwa interne Entscheidungen nettoeinkommen eines akademisch vorgebilde-
nach einzelnen Projektteilen) ten Mitarbeiters entsprechen. Da selbst bei
Alle vom Auftraggeber zu verantwortenden gezielten Ausschreibungen, die von vorn her-
Vorarbeiten, die aufgrund der Vorgesprche ein nur an fr geeignet gehaltene Institutionen
in Aussicht gestellt wurden und eine uner- ausgegeben werden, von dem potentiellen Auf-
lliche Grundlage des Angebotes sind (zum traggebern meist 3 bis 6 Angebote eingeholt
Beispiel die Zustimmung des Betriebsrates, werden (bei offenen Ausschreibungen ist die
der ausgewhlten Schulen etc.) Zahl der Mitbewerber meist deutlich grer),
mte man im Durchschnitt fr jeden tatsch-
Hinzu kommen natrlich mglichst exakte Ter- lich erhaltenen Auftrag mit Vorbereitungs-
minangaben und die erforderlichen finanziel- kosten von 2 bis 3 Jahresnettoeinkommen
len Aufwendungen. Da sich der Auftraggeber rechnen. Es wre sehr schwer, solche Betrge
im Falle des Zustandekommens eines Vertrages zustzlich in der Kostenkalkulation einzubrin-
selbstverstndlich auf diese Kalkulationen be- gen und trotzdem noch unter finanziellen Ge-
rufen wird, ist dies ein nicht ganz einfaches sichtspunkten wettbewerbsfhig zu bleiben.
Vorhaben. Der sinnvolle Aufwand fr diesen Schon aus diesem Grund beschrnkt sich die
(vorlufigen) Arbeitsplan ist schwer einzuscht- Ausarbeitung des Projektplanes fr die An-
zen. Eine zu oberflchliche Analyse ist un- gebotserstellung auf eine grobe Vorplanung.
verantwortbar, da man ja spter an die Arbeits- berdies sind viele Auftraggeber nicht bereit,
schritte (auch hinsichtlich der Kosten) die auch fr sie zeitaufwendigen Arbeiten fr
gebunden ist. Streng genommen knnte man die Bereitstellung der notwendigen Detail-
ein verantwortbares Angebot erst dann vorle- informationen fr neue Anbieter zu leisten. So
gen, wenn alle Detailplanungen abgeschlossen wre es etwa einer Weiterbildungsabteilung
sind, da sich erst zu diesem Zeitpunkt eine halb- nicht zumutbar, wegen einer fundierten An-
wegs exakte Kostenplanung erstellen lt. Dem gebotserstellung die Mitarbeiter von etwa 6
steht aber entgegen, da in den meisten (in oder gar 10 verschiedenen Anbietern whrend
keiner Weise allen) Ausschreibungsfllen die jeweils mehrtgiger Hospitationen zum Zwecke
Planung von Evaluationsprojekten 117
einer detaillierteren Zielexplikation mit den 5.1.3 Zeit- und Kostenabschtzung
Details der Bildungsarbeit vertraut zu machen.
Vieles wird erleichtert, wenn eine lngere ver- Fr dieses Fragestellungen wurden eine Vielzahl
trauensvolle Kooperation mit dem potentiellen von Techniken entwickelt, vor allem im wirt-
Auftraggeber besteht oder zumindest fundierte schafts- und ingenieurwissenschaftlichen Be-
Erfahrungen mit hnlichen Projekten vorlie- reich. Einige davon sind in Diagramm V/3 zu-
gen, von denen aus man die ungefhren Ko- sammengestellt.
sten bertragen kann. Fr Anfnger, die ohne Den gebruchlichsten Verfahren (Balkenplan-
eine lngere Mitarbeit in einer eingefhrten Un- und Netzplantechnik sowie Ableitungen davon)
ternehmung selbstndig Evaluationsprojekte geht eine Struktur- und eine Zeitanalyse voraus.
einwerben wollen, ist der dem Angebot zugrun-
deliegende Arbeitsplan leider eine sehr risikorei-
che Hrde, an der man auch bei sehr guten Fach- Strukturanalyse
kenntnissen (etwa durch Erfahrungen in
wissenschaftsbezogenen Projekten) scheitern Das Ziel der Strukturanalyse ist die Zerlegung
kann. des Gesamtprojektes in die es konstituierenden:

Diagramm V/3
bersicht ber die Methoden der Projektplanung und -kontrolle

Methoden der Kostenplanung und -kontrolle Methoden der Zeitplanung und -kontrolle

Abweichungsanalyse Nutzen-Kosten- Balkenplantechnik Netzplantechnik


Auerplanmige Analyse Einsatzmittelber- Planmige Berichte
Berichte Planmige Berichte sicht Prsentationen
Einsatzmittelber- Prsentationen Graphen, Netze Sofort-Manahmen-
sicht Sofort-Manahmen- Verfahren
Kostenentwicklungs- Verfahren Soll-Ist-Vergleich
plan Soll-Ist-Vergleich Termin-Trend-
Kostenschtzung und Zahlungskontrolle Darstellung
-erfassung
Kosten-Trend-
Rechnung
Netzplantechnik

Methoden der Durchfhrungsplanung und


-kontrolle

nderungsverfahren Nutzenwertanalyse
Auftragsvergabe Planmige Berichte
Auerplanmige Planspiele
Berichte Prsentationen
Brainstorming Projektbesprechung
Checklisten Projekt-
Einsatzmittelber- strukturanalyse
sicht Relevanz- und
Dokumentation z.B. Entscheidungsbaum-
Projektstrukturplan verfahren
Graphen, Netze Szenario-Schreiben
Kontrollbesuche Sofort-Manahmen-
Morphologische Verfahren
Methoden Soll-Ist-Vergleich

Fr eine ausfhrliche Beschreibung der einzelnen Methoden siehe: Der Bundesminister fr Bildung, Forschung,
Wissenschaft u. Technologie (Hrsg.), 1977
118 Planung von Evaluationsprojekten

Diagramm V/4
Strukturanalyse zur Durchfhrung und Bewertung am Beispiel Werbekampagne

VORGANG EREIGNIS ANORDNUNGSBEZIEHUNG


zeitforderndes Geschehen mit Eintreten eines definierten quantifizierbare Abhngigkeit zw.
definiertem Anfang u. Ende Zustandes im Projektverlauf den Vorgngen

1. Gesprch mit Auftraggeber Expos 2


2. Konzeptphase (Ist-Zustands- Konzeptvorlage 1 3, 5, 8
Analyse, Zielgruppenanalyse,
Standortauswahl) Projektdurchfhrungsplan 2 4
3. Planungsentwicklung
(Konzeption des Marketing,
Festlegung der Marketing-
strategie) Entwurf des Werbematerials 3 7
4. Gesprche mit Werbeagen-
turen u. Designern Kostenbersicht 2 6
5. Einholen von Kostenvoran-
schlgen Auftragsvergabe 5 7
6. Angebotsauswertung Werbemittel 6 10
7. Herstellung des Werbe-
materials Personalauswahl 2 9
8. Stellenausschreibung fr
Distributoren/Interviewer
9. Personalschulung einsatzfhige Interviewer 8 11
10. Projektdurchfhrungsphase Werbekampagne 7 11
11. Erhebung/Interviews Rohdaten 10 12
12. Auswertung der Erhebungs- Abschlubericht, Evaluation 11
daten

Diagramm V/5 Vorgnge: zeiterfordernde Geschehnisse mit


Zeitanalyse fr das Werbekampagne- definiertem Anfang und Ende
Beispiel (vgl. Diagramm V/4) Ereignisse: Eintreten eines definierten Zu-
standes im Ablauf (des Projektes)
Anordnungsbeziehungen: quantifizierbare
Vorgangs- Gem dem Gem dem
nummer deterministischen stochastischen
Abhngigkeiten zwischen den Vorgngen,
Konzept Konzept deren Gesamtheit die Ablaufstruktur (des
Bestimmung d. Bestimmung d. Projektes) bildet.
Zeitvariablen Zeitvariablen (vgl. REFA, 1985)
aufgrund von aufgrund von
Erfahrungswerten Wahrscheinlichkeiten
Zur Kennzeichnung der Anordnungsbezie-
hungen zwischen den einzelnen Vorgngen wer-
1 1 0,5 2
den die Vorgnger (dem betreffenden Vorgang
2 6 4 7
unmittelbar vorgeordneter Vorgang) bzw. Nach-
3 2 1 3 folger (unmittelbar nachgeordneter Vorgang) zu
4 2 1 3 jedem Vorgang ermittelt und festgehalten.
5 1 0,5 2 Es empfiehlt sich, den Projektablauf zunchst
6 1 0,5 2 global und danach mit fortschreitender Detail-
7 5 4 6 lierung aufzugliedern.
8 2 1 3 Die Aufstellung aller Vorgnge, Ereignisse und
9 1 0,5 2 Abhngigkeiten (Anforderungsbeziehungen), aus
10 1 0,5 2
denen sich das Projekt zusammensetzt, erfolgt in
der Regel auf Grund der Einbeziehung von Erfah-
11 1 0,5 2
rungen aus derartigen Problemstellungen.
12 3 2 4
Ein Beispiel fr eine solche Strukturanalyse
gibt Diagramm V/4.
Planung von Evaluationsprojekten 119

Diagramm V/6
Graphische Darstellung der Ergebnisse aus Struktur- und Zeitanalyse als Balkenplan
zum Beispiel Werbekampagne
Wochen
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23
Vorgnge
Gesprche mit
Auftraggebern
Konzeptphase
Planungsentwicklung
Gesprche mit
1
Werbeagenturen
Kostenvoranschlge
Bewertung:
2
Auftragserteilung
Herstellung des
Werbematerials
Stellenausschreibung
fr Interviewer
Personalauswahl und
Schulung
Projektdurchfhrungs-
phase
Erhebungen;
Interviews
Auswertung;
Evaluation

Legende: deterministische Zeitvariable

Erluterung: Durch den Balkenplan knnen sog. Oder-Beziehungen (d.h. der Nachfolger eines Vorganges
X kann der Nachfolger Y oder Z sein) nicht dargestellt werden. Zur Illustration s. 1: Verlaufen
die Gesprche mit den Werbeagenturen erfolgreich, kann im Anschlu daran sofort die Pro-
duktion des Werbematerials beginnen; oder scheitern die Gesprche, so verzgert sich der
Anfangstermin fr die Herstellung. Eine Oder-Beziehung kann auch fr 2 angenommen
werden; die Bewertung der Kostenvoranschlge fhrt zur Auftragserteilung und zieht die Her-
stellung des Werbematerials nach sich oder die Kostenbewertung fhrt zur Einholung neuer
Kostenvoranschlge anderer Firmen.

Zeitanalyse jekte deterministisch (mit fest angenomme-


nen Zeiten). Rein technische Variablen (zum
Das Ziel der Zeitanalyse ist es, die Dauer der durch Beispiel die Dauer fr die Fertigung des Werbe-
die Strukturanalyse gefundenen Vorgnge und materials) lassen sich durch Rcksprachen mit
deren Anordnungsbeziehungen zu ermitteln. potentiellen Auftragnehmern unter Bercksich-
Die Dauer wird in Zeiteinheiten angegeben. tigung vorhandener Kapazitten ermitteln. Fr
Die damit verbundenen numerischen Gren das Werbekampagne-Beispiel sind entsprechen-
erhlt man in der Regel entweder durch Ab- de (grobe) Abschtzungen fr den Zeitbedarf
schtzung plausibel erscheinender Zeitinter- der einzelnen Vorgnge aus Diagramm V/4 im
valle (sog. stochastisches Konzept) oder durch Diagramm V/5 eingetragen. Auf diesen Grundla-
Rckgriff auf die Erfahrungswerte frherer Pro- gen bauen dann die spezifischen Techniken auf.
120 Planung von Evaluationsprojekten

Diagramm V/7
Graphische Darstellung eines Quick-Look-Plans zum Beispiel Werbekampagne

Wochen
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23
Vorgnge
Gesprche mit
Auftraggebern 1
Konzeptphase
Planungsentwicklung 2 3
Gesprche mit
Werbeagenturen
Kostenvoranschlge
Bewertung:
Auftragserteilung
Herstellung des
Werbematerials
Stellenausschreibung
fr Interviewer
Personalauswahl und
Schulung
Projektdurchfhrungs-
phase
Erhebungen;
Interviews
Auswertung;
Evaluation

Legende: geplante Terminsituation (deterministische Zeitvariable)


eingetretene Terminsituation
Abhngigkeiten zwischen den Vorgngen

Erluterung: Anmerkungen zu den Balken- und Terminverlagerungen: z.B. ermglicht der vorzeitige Ab-
schlu der Gesprche mit den Auftraggebern eine terminliche Verlagerung der Konzeptphase
(2), wodurch auch die Planungsentwicklung (3) zu einem frheren Zeitpunkt aufgenommen
werden kann. Durch die zustzlich zur Verfgung stehende Zeit kann diese dann profunder
durchgefhrt werden.

Balkenplantechnik Bundesminister fr Forschung und Technolo-


gie, 1977). Ein ausfhrliches Beispiel fr die
Das fr die Zeitplanung bei sozialwissenschaft- Studienplanung, insbesondere im Zusammen-
lichen Projekten wohl gebruchlichste Verfah- hang mit der Diplomarbeit, gibt Wottawa,
ren ist die Balkenplan-Technik. Die Zeiten fr (1996).
die einzelnen Arbeitsvorgnge werden abge-
schtzt, die einzelnen Arbeiten der zeitlichen Dieses Verfahren ist leicht verstndlich, auch
Sequenz nach geordnet und unter Bercksich- fr Laien bersichtlich und fr einfache Pro-
tigung von berlappungsbereichen in Dia- jektvorhaben voll ausreichend. Schwierigkeiten
grammform dargestellt. Ein Beispiel dafr fin- treten auf, wenn die einzelnen Arbeitsteile in
det sich im Diagramm V/6, ausfhrlichere komplizierter Weise miteinander verknpft
Darstellungen dieser Methode sowie auch Hin- sind, also etwa die Erledigung von drei spezifi-
weise auf verwandte Verfahren gibt Brand, 1974 schen Vorarbeiten mit jeweils unterschiedlicher
Planung von Evaluationsprojekten 121

Diagramm V/8
Arbeitsschritte der Netzplantechnik nach (REFA, 1985)

Problemstellung

1. Zeitplan (Kostenplan) fr alle Arbeitsschritte eines Projektes?


2. Kontrolle und Termin- (Kosten-) berwachung?
3. Darstellung der logischen Zusammenhnge vom Anfang bis zum Endtermin?
4. Auffinden der potentiellen kritischen Engpsse des Projektes?

anderes
Nein Planungsverfahren

Ja

Netzplantechnik

Phase 1: Ereignisse, Vorgnge/Arbeitsschritte Phase 2: Dauer (Kosten) der Vorgnge/


(Strukturanalyse s. Balkenplantechnik) Arbeitsschritte (Zeitplananlyse s. Balkenplantechnik)

ja Zeit-Kostenvariablen bekannt? nein

Bestimmung des kritischen Weges auf Netzplanberechnung auf Grund von


Grund von Erfahrungswerten Schtzwerten (stochastisches Konzept)
(deterministisches Konzept)

Phase 3: Erstellung des Netzplanes

Bestandteile/Elemente zur Grundstze/Nebenbedingungen


Konstruktion eines Netzplanes:
1. Alle Vorgnge und Ereignisse mssen genau defi-
a) Elemente zur Darstellung strukturanalytischer niert sein
Ergebnisse: 2. das Netzwerk hat nur einen Start- und Endpunkt
Ereignisse = Knoten p 3. das Netz ist lckenlos verknpft, d.h. jedes Ereig-
(reale) Vorgnge/Arbeitsschritte = Pfeile nis ist ber ein Kette von Vorgngen mit dem Start
fiktive Vorgnge/Arbeitsschritte, die eingefhrt und Ende verbunden
werden, um den Nebenbedingungen zu gengen = 4. zwei Ereignisse drfen nur durch einen einzigen
Scheinvorgnge Vorgang verbunden sein
5. jedem Vorgang ist eine Zeitvariable zugeordnet,
b) Darstellung zeitanalytischer Werte (bei dieser Methode sagt die Lnge des Pfeiles
Zeitangaben (deterministisch und oder stochastische) nichts ber den Zeitbedarf aus!)
die Zeitvariablen werden nur den realen Vorgngen 6. das Netz mu schleifenfrei verlaufen
zugeordnet, Scheinvorgnge haben grundstzlich die 7. parallel verlaufende Vorgnge werden durch
Zeitdauer null. Scheinvorgnge miteinander verbunden (damit
Bedingung 4 nicht verletzt wird)

Phase 4: Graphische Darstellung des Netzplans

Phase 5: Netzplanberechnung

Unter verschiedenen Wegen vom Anfang bis zum Endpunkt gibt es einen Weg von lngster Zeitdauer (sog. kriti-
scher Weg), dieser Weg bestimmt den frhestmglichen Zeitpunkt fr das Projektende, d.h. addiert man alle
Zeitvariablen, die den Vorgngen des kritischen Weges zugeordnet sind, so reprsentiert die Summe den frhest-
mglichen Endzeitpunkt
122 Planung von Evaluationsprojekten

Diagramm V/9
Graphische Darstellung eines Netzplans zum Beispiel Werbekampagne

3 4
B C D
(2) (2)
(13) (1-3)

1 2 5 6 7 10 11
A E F G J K
(1) (6) (1) (1) (5) (1) (1)
(0,52) (57) (0,52) (0,52) (46) (0,52) (0,52) (3)
12 (24)
8 9
H I L
(2) (1)
(13) (0,52)

Legende: x Ereignis (x) (A = 1, B = 2, etc. aus Diagramm


V/4)
(n)
Vorgang (n)

Scheinvorgang
() deterministische Zeitvariable
() stochastische Zeitvariable

Zeitdauer die Voraussetzung sind, mit einem dieses Vorgehens sind in Diagramm V/8 darge-
vierten Projektschritt beginnen zu knnen, falls stellt. Die bertragung des Balkenplanes aus Dia-
dieser nicht auf Grundlage eines anderen, b- gramm V/6 in diese Darstellungsform gibt Dia-
licherweise lnger andauernden Projektfort- gramm V/9.
schrittes aufgebaut werden kann. Fr solche
komplizierten Flle und insbesondere fr eine Das Diagramm V/9 zeigt die logische Verknp-
sachgerechte Zeitabschtzung bei sehr komple- fung der Vorgnge und Ereignisse des Projek-
xen Arbeitsvorhaben wurde die sogenannte tes. Jedes Ereignis ist ber eine Kette von Vor-
Netzplantechnik (s.u.) entwickelt, die auch gngen mit dem Start- und Endpunkt
den Vorteil hat, EDV-gesttzten Optimierungs- verbunden.
abschtzungen zugnglich zu sein.
Ein Spezialfall der Balkenplantechnik ist der Zur Bestimmung des frhestmglichen Projekt-
sogenannte Quick-Look-Plan. Er dient zur Kon- termins ist es zunchst erforderlich, die Dauer
trolle der Projektfortschritte. Die geplante Ter- aller mglichen Wege, die (vom Startpunkt aus-
minsituation wird mit der tatschlichen ver- gehend) zum Endpunkt des Netzes fhren, zu
glichen (Soll-Ist-Vergleich), um Abweichungen berechnen. Dieses geschieht durch Addition al-
mglichst frhzeitig zu erkennen. ler (deterministischen) Zeitvariablen, die den
Das Vorgehen ist einfach. Unter den Balken Vorgngen eines Weges zugeordnet sind. Aus
mit der geplanten Dauer wird zustzlich der den verschiedenen Summenwerten wird dann
tatschlich bentigte Zeitaufwand eingetragen der Wert minimaler numerischer Gre
(fr ein Beispiel s. Diagramm V/7). selegiert; dieser reprsentiert die Dauer des sog.
kritischen Weges.

Netzplantechnik Der kritische Weg im Beispiel aus Diagramm V/9


wre mit 15 Zeiteinheiten verbunden:
Fr komplizierte Projekte mit vielfltig abhn-
gigen Vorgngen ist der Balkenplan ungeeig- (1 6 2 2 5 1 1 3) = 21
net, in diesen Fllen wird meist die Netzplan- (1 6 1 1 5 1 1 3) = 19
technik gewhlt. Die einzelnen Arbeitsphasen (1 6 2 1 1 1 3) = 15
Planung von Evaluationsprojekten 123
Mchte man den ungnstigsten (sptesten) realistische Festlegung von Terminen
Projektendtermin ermitteln, so addiert man je- potentielle Engpsse/Strungen knnen klar
weils den maximalen stochastischen Wert aller erkannt werden, da der Netzplan eine syste-
Vorgnge, die auf dem kritischen Weg liegen. matische und lckenlose Darstellung der zwi-
Im Beispiel: schen den Vorgngen bestehenden Zusam-
menhnge ermglicht.
(2 7 3 3 6 2 2 4) = 29
Fr wirklich komplexe Projekte (diese sind al-
Netzplne erlauben es auch, in Abhngigkeit
lerdings bei normalen Evaluationsfragestellun-
von Entscheidungsknoten von Anfang an ver-
gen selten, am ehesten treten sie noch bei einer
schiedene Projektvarianten vorzusehen. Ist es
langfristigen, formativen Programmevaluation
zum Beispiel unsicher, ob die Stellenausschrei-
auf) sind grafische Darstellungen allerdings
bung der Interviewer (Vorgang 8 in dem Netz-
nicht mehr bersichtlich genug, so da man
plan aus Diagramm V/9) ausreichend viele gut
dann entsprechende EDV-Hilfen bentigt, was
geeignete Mitarbeiter erbringt, knnen zwei ver-
die Arbeit erschwert. Auerdem ist die Zuver-
schiedene weitere Arbeitsplne erstellt werden
lssigkeit der Zeitabschtzungen immer ein Pro-
(zum Beispiel zustzlicher Einbau einer lnge-
blem, da man stets mit unerwarteten Ereignis-
ren Schulungsphase oder nderung der Materia-
sen rechnen mu. Netzplne sind daher zwar
lien in der Form, da man mit weniger gutem
ein der Intuition der Projektleitung sicher
Personal auskommt). Solche Vorausplanungen
berlegenes Mittel, man darf sie aber auch
von mehr oder weniger wahrscheinlichen Ka-
nicht als absolut sicher und durch sptere Er-
tastrophen erleichtern die Bewltigung von
fahrung im laufenden Projekt nicht zu korrigie-
Problemen whrend der Projektdurchfhrungs-
rende Tatsachenfeststellungen fehlinterpretie-
phase auerordentlich. Leider geht die ber-
ren.
sichtlichkeit des Netzplanes verloren, wenn man
zu viele Entscheidungknoten vorsieht, so da
man selten mehr als zwei dieser Knoten gleich-
Kostenschtzung
zeitig aufnehmen kann.
Erweitert man diesen Ansatz um eine Ab-
Im Prinzip ist die Berechnung der durch das
schtzung der Eintretenswahrscheinlichkeit der
Projekt ausgelsten Kosten relativ leicht, wenn
Ausgnge des Entscheidungsknoten (im Bei-
die einzelnen Vorgnge und die dafr erforder-
spiel: erfolgreiche Personalsuche bzw. Mier-
lichen Zeiten wirklich gut in den Zeitplan auf-
folg), lassen sich Netzplne zum Entscheidungs-
genommen wurden. Man braucht dann nur die
netzplan-Verfahren ausbauen, die den Vorteil
Personalkosten fr die jeweiligen Arbeiten (un-
haben, auch oder-Beziehungen zwischen den
ter Einrechnung aller Lohnnebenkosten, vgl.
Vorgngen zu erfassen. Als Beispiel etwa: Mit
Einleitung zu Kap. 5) mit den Zeiten zu multi-
der Erhebung kann begonnen werden, wenn
plizieren. Die Sachkosten (Material etc.) sind
entweder die Stellenausschreibung den er-
meist aus vorliegenden Angeboten bekannt.
wnschten Erfolg hatte oder weitere, zustzli-
Eine solche Kalkulation ist etwa die Grundla-
che Schulungen abgeschlossen wurden oder die
ge eines Universittsinstituts fr die Beantra-
Erhebungsmaterialien entsprechend modifi-
gung von Frderungsmitteln bei der Deutschen
ziert wurden. Mit dieser Erweiterung ist die
Forschungsgemeinschaft oder einer Stiftung, da
Netzplan-Vorgehensweise dann den Balken-
in solchen Fllen die Fixkosten (Verwaltungs-
plnen auch qualitativ berlegen.
apparat, Leerlufe ohne finanzierte Projekte,
Weiterbildungs- und Vorbereitungszeiten, Ko-
Als besondere Strke von Netzplnen sind zu
sten fr Rume und Grundausstattung) von der
nennen:
ffentlichen Hand getragen werden und die
bersichtliche Darstellung termingebun- erheblichen steuerlichen Belastungen privater
dener Projekte Unternehmen ebenfalls keine Rolle spielen. Die
geringer Rechenaufwand tatschlichen Kosten bei Finanzierung der
der Planer wird gezwungen, alle Projekte zu- Institution ber Evaluationsprojekte knnen
sammenhngend grndlich zu durchdenken leicht, je nach Ausma der erforderlichen Bei-
124 Planung von Evaluationsprojekten

trge zu den laufenden Institutskosten, das BO F HH M BO 224 495 780 610 2110
Doppelte der zunchst kalkulierten Betrge aus- BO F M HH BO 224 400 780 349 1753
machen. Sozialwissenschaftlich gesttzte ange- BO M HH F BO 614 780 495 224 2113
wandte Ttigkeit ist bedauerlicherweise teuer. BO M F HH BO 614 400 495 349 1858
Eine sehr gute bung ist es, sich fr eine klei-
ne, berschaubare Arbeit (zum Beispiel die ei-
gene Diplomarbeit) die gesamten Kosten durch-
zurechnen, und dabei neben der eigentlichen Leider steigt der Aufwand mit der Zahl der Std-
Arbeitszeit auch die von der Universitt getra- te enorm an. Schon fr 10! = 3 628 800 Mg-
genen Aufwendungen, so insbesondere fr lichkeiten ist auch ein schneller Rechner sehr
hochspezialisierte Beratung, mit zu bercksich- gefordert, die Rechenzeiten knnen teurer wer-
tigen. Vor diesem Hintergrund werden die den als die Einsparungen durch die optimale
manchen Anfngern traumhaften Tagesstze Reihenfolge. In solchen Fllen kann man mit
von erfolgreichen freiberuflich ttigen Kollegen begrenzter Enumeration arbeiten. Man be-
verstndlich, die je nach Kalkulationsart und ginnt mit einer plausibel erscheinenden Rei-
persnlichem Marktwert durchaus bei der Hlf- henfolge (so wird niemand meinen, da man
te (und mehr) eines Monatseinkommens eines die Strecke MHHF whlen sollte) und ver-
Anfngers im ffentlichen Dienst mit akademi- sucht davon ausgehend, weitere Verbesserun-
scher Vorbildung liegen. gen durch Permutation zu finden.
Eine umfangreichere bersicht ber die hier
skizzierten Techniken gibt Ziegenbein, 1984;
Entscheidungsbaumverfahren Bramsemann, 1978.

In manchen Evaluationsprojekten stellt sich


unter Kostenaspekten die Frage nach der opti- 5.2 Designfragen
malen Reihenfolge von Teilarbeiten. Besonders
typisch dafr sind Terminvereinbarungen an War das Angebot erfolgreich, kann die Detail-
verschiedenen Orten (etwa zur Durchfhrung planung beginnen. Gewisse Vorstellungen ber
von Datenerhebung durch das gleiche Team die anzuwendenden Methoden, Designs und
oder die Abhaltung von Experteninterviews). Auswertungstechniken muten natrlich schon
Das konzeptuell einfachste Vorgehen dabei vorliegen, um den Arbeitsplan gem Ab-
ist die sogenannte Voll-Enumeration. Dabei schnitt 5.1 zu erstellen. Die Detailarbeit erfolgt
werden einfach alle mglichen Reihenfolgen aus Kostengrnden aber meist erst nach Auf-
durchpermutiert und der fr jede Variante er- tragserteilung.
forderliche Aufwand (etwa die Fahrstrecken)
bestimmt. Es gibt zahlreiche Bcher, in denen die verschie-
Wrde etwa in dem Werbekampagne-Beispiel denen Mglichkeiten der formalen Design-
jeweils ein Gesprch zwischen dem Projektlei- planung entweder aus grundlagenwissenschaft-
ter (Sitz Bochum, BO) und Geschftsfhrern in licher Sicht (vgl. dazu Schulz, 1981; Cook,
Frankfurt (F), Hamburg (HH) und Mnchen (M) 1979) oder speziell fr Evaluationsprojekte dar-
zu fhren sein, ergibt sich fr jede Reihenfolge gestellt sind, etwa in Rutman, 1977; Trochim,
der Gesprche der Fahrtaufwand annhernd 1984. Die Vielfltigkeit des Aufgabenfeldes
durch die Addition der Entfernungskilometer. Evaluation (vgl. dazu Diagramm II/2) lt es
Da drei Stdte in der Reihenfolge zu permutie- kaum mglich erscheinen, im Rahmen eines
ren sind (Bochum steht ja als Ausgangs- und einzelnen Kapitels die Designproblematik er-
Endpunkt fest), erhlt man 3! = 6 verschiedene schpfend zu behandeln. In den folgenden 3
Mglichkeiten, und zwar: Unterabschnitten kann nur auf die wichtigsten
Fehlerquellen, typischen Untersuchungsplne
Reihenfolge Einzeldistanzen Summe und bewhrte Erhebungstechniken verwiesen
werden, die Detailproblematik der einzelnen
BO HH F M BO 349 495 400 610 1854 Verfahren findet sich in der jeweiligen Spezial-
BO HH M F BO 349 780 400 224 1753 literatur.
Planung von Evaluationsprojekten 125
5.2.1 Fehlerquellen baren Teilgruppen (mit bzw. ohne Manah-
menwirkung) zumindest schwierig.
Im Prinzip gibt es nahezu unbersehbar viele
Fehlerquellen bei der Durchfhrung von Eva-
luationsprojekten. Besonders oft stren fol-
quvivalenzprobleme
gende:
Reifung An die Nicht-quivalenz denkt man vor allem,
Nicht-quivalenz (von Vergleichsgruppen) wenn es nicht mglich ist, die Probanden nach
Mortalitt (im statistischen Sinne) einem Zufallsprinzip den verschiedenen Eva-
luationsbedingungen zuzuweisen; dies ist
Wichtig ist, da man diese Strquellen nicht typischerweise bei (partieller) Selbstselektion
nur im engsten Sinn der Begriffsdeutung sieht, der Probanden der Fall, etwa bei der freiwilli-
sondern das Prinzip, die dahinterstehenden gen Anmeldung von Schlern zu bestimmten
Strukturprobleme, auch in verschiedene Kon- Schulformen (man kann zum Glck in de-
texte bertrgt. Als Beispiele: mokratischen Staaten niemand zwingen, sein
Kind zu Untersuchungszwecken einer bestimm-
ten Schulart oder gar einer Versuchsschule an-
Reifung zuvertrauen) oder bei der Zuordnung von
Treatment-Gruppen im Konsens mit den Be-
Reifung im Sinne einer Fehlerquelle von De- troffenen (so wre es kaum vorstellbar, da man
signs liegt dann vor, wenn es generelle Vern- zum Zwecke einer Evaluation verschiedener
derungen gibt, die nicht auf gezielt gesetzte chirurgischer Eingriffsmglichkeiten bei Brust-
Manahmen zurckgehen (etwa eine zuneh- krebs die betroffenen Frauen nach Zufall ent-
mende Akzeptanz von EDV in Verwaltungs- weder einer radikalen Entfernung oder einer
berufen). Sie finden sich u.a. bei: teilweise die Brust erhaltenden operativen Ma-
nahme zufhrt); gleichermaen wre es bei
Bewertung von Werbekampagnen (durch einer psychologischen Intervention nicht ver-
Gewhnung an die Konsumgewohnheiten
tretbar, auch schwierige Flle (zum Beispiel
der sozialen Umgebung)
hoch selbstmordgefhrdete Patienten) aus
den medizinisch-therapeutischen Bereich Untersuchungsgrnden einer Warteliste zu-
(zum Beispiel Coping-Strategien bei chroni-
zufhren und zunchst auf eine Hilfestellung
schen Krankheiten)
zu verzichten oder sie einem neuen, bisher
Aufklrungsaktionen, etwa bzgl. neuer ge- nicht bewhrten Ansatz als Therapietechnik
setzlicher Bestimmungen, zum Beispiel fr
auszusetzen.
von der ffentlichen Hand gewhrten Un-
Das gleiche Problem der Nicht-quivalenz
tersttzungen (durch langsames Gewhnen
liegt auch vor, wenn sich die Schaffung von
der Betroffenen und der Verwaltungsstellen
Bedingungskonstellationen fr die Evaluations-
an die routinemige Beantragung und Ver-
manahme nicht willkrlich gestalten lt,
gabe dieser Mittel) .
sondern bestimmte Kombinationen aus Sach-
Schuluntersuchungen, die ohne ausreichen- grnden vorgegeben sind; typische Beispiele
de Kontrollgruppen im Lngsschnitt durch-
dafr:
gefhrt werden und keine Trennung von Pro-
gramm- und Entwicklungseffekten zulassen. die Kombination von Lehrern und Schul-
formen (freiwillige Meldungen zu bestimm-
Generell zwingt dieser Verflschungsaspekt zu ten Schulformen verzerren die Ergebnisse
Designs, die nicht nur die Entwicklung der zu u. U. ebenso wie Zwangsversetzungen mit
evaluierenden Manahme ber die Zeit hinweg den darauf folgenden negativen emotiona-
verfolgen, sondern auch Beobachtungsgruppen len Einstellungen der Betroffenen),
ohne die Auswirkungen der Manahme vorse- die Kombination des didaktischen Vorge-
hen. Leider ist dies manchesmal technisch hens und der Trainer fr Weiterbildungs-
unmglich (zum Beispiel bei gesetzlichen Ma- manahmen (selbst wenn hier durch
nahmen) oder wegen der Frage nach vergleich- Anweisung zum Beispiel fr zufllig ausge-
126 Planung von Evaluationsprojekten

whlte Trainer ein spezieller Seminarstil vor- ohne der Mglichkeit, bei schlechten Leistun-
geschrieben werden knnte, wre das fr die gen aufgrund der Beurteilung der Lehrer eine
Aussagekraft des Ergebnisses aufgrund der zu Klasse wiederholen zu mssen, was im Quer-
erwartenden Wechselwirkungen zwischen schnittsvergleich der Klassenstufen eine Verzer-
Trainerpersnlichkeit und didaktischem rung der durchschnittlichen Leistungsstrken
Konzept zweifelhaft) ergibt.
die Herstellung von Bedingungskombina- Es ist die Aufgabe des Evaluators, durch die
tionen, die gefhrliche Auswirkungen haben Gestaltung des Untersuchungsplanes und der
knnten (man denke etwa an einen Feld- Rahmenbedingungen alle denkbaren Str-
versuch zur Verkehrslenkung und die Kom- quellen so gering wie mglich zu halten. Es ist
bination des Verkehrszeichens Schule und aber unter den blichen quasi-experimentellen
Geschwindigkeitsbeschrnkung auf 120 Bedingungen faktisch nicht mglich, alle oder
km/h). auch nur alle plausibel erscheinenden Verzer-
rungen auszuschlieen, woraus sich die prinzi-
pielle Angreifbarkeit jeder zumindest greren
Statistische Mortalitt Evaluationsstudie im Feld ergibt.

Die statistische Mortalitt stammt ursprng-


lich aus dem medizinischen Bereich (das Ster- 5.2.2 Untersuchungsplne
ben der Patienten whrend der unterschiedli-
chen Behandlungen mit schwierigen Folgen fr
Eine bersicht ber einige besonders wichtige
die Auswertung, vgl. dazu Cook und Campbell,
Untersuchungsplne (in Anlehnung an Cook
1976). Bei im engeren Sinne sozialwissenschaft-
& Campbell, 1976) ist im Diagramm V/10 enthal-
licher Evaluation tritt das gleiche Phnomen
ten.
auf, wird aber dort bedauerlicherweise oft nicht
Das Grundbestreben aller Designanstze ist
ausreichend beachtet, da das Sterben bzw.
es, Strquellen (insbesondere die im vorherge-
Aussscheiden von Probanden in diesem Bereich
henden Abschnitt skizzierten) soweit wie mg-
im Gegensatz zur medizinischen Behandlung
lich auszuschlieen. Wie schon der Name Ver-
nicht besonders eng und systematisch mit der
suchsplne andeutet, kommen sie zum
Intervention verknpft erscheint. Das struktu-
grten Teil aus Entwicklungen im Bereich der
rell gleiche Phnomen zeigt sich aber, wenn
experimentellen Grundlagenforschung, wo
sich Probanden einer als unangenehm empfun-
sich auch das Ausschalten von Streffekten in
denen Situation entziehen (spezielle Schule,
annhernd idealer Weise realisieren lt. Sie
lngerfristiges Weiterbildungsprogramm, zum
passen daher im wesentlichen zu einer summa-
Zwecke der Evaluation neu gestaltete Arbeits-
tiven Evaluation verschiedener, mglichst dis-
bedingung). Analysiert man ohne Bercksichti-
junkter Manahmen.
gung dieser Ausscheider die Manahme, bauen
Fr die meisten Flle der Programmevalua-
alle Vergleiche nur auf den Personen auf, de-
tion im Feld kommen nur quasi-experimentelle
nen die spezifische Interventionsbedingung re-
Designs in Frage, die deshalb ausfhrlich in Dia-
lativ zugesagt hat, was eine berschtzung der
gramm V/10 enthalten sind. Die fr echte experi-
positiven Auswirkung der Manahme zur Fol-
mentelle Designs erforderliche Bildung von
ge hat (vor allem dann, wenn einer neuen Vari-
wirklich quivalenten Vergleichsgruppen ist
ante, zum Beispiel bei der Arbeitsgestaltung,
nur in manchen, der Grundlagenforschung na-
ausgewichen werden kann, whrendem sich
hestehenden Evaluationsvorhaben mglich.
ein Verbleiben in den bisherigen Bedingungen
Typische Beispiele dafr sind:
nur wesentlich schwerer vermeiden liee, vgl.
3.3.3). Der strukturell gleiche, aber anders ver- Fragestellungen, bei denen wichtige Teilas-
ursachte Problemkreis liegt vor, wenn die Mor- pekte in kontrollierten Untersuchungen ge-
talitt durch die spezifischen Gegebenheiten prft werden knnen; zum Beispiel Verstnd-
der jeweils zu evaluierenden Manahmen be- lichkeit von Textvarianten, Akzeptanz von
einflut wird. Ein Beispiel dafr ist der Ver- Werbemitteln, Prfung der Benutzerfreund-
gleich von Schulorganisationsformen mit und lichkeit von Gerten. Hier ist eine echte Zu-
Planung von Evaluationsprojekten 127

Diagramm V/10
bersicht ber besonders wichtige Versuchsplne (vgl. Cook & Campell, 1976)

Quasi-experimentelles Design: Design mit entgegengesetztem Treatment,


Design mit unbehandelter Kontrollgruppe, nicht-quivalenter Kontrollgruppe,
Vortest und Nachtest Vortest und Nachtest

1 X 2 1 X+ 2
1 2 1 X

2

Design mit entfernten Treatments, Design mit wiederholtem Treatment


Vortest und Nachtest

1 X 2 3 X 4 1 X 2 3 X 4

Selektives-Kohorten-Design

X 1. Kohorte 1 1. Kohorte
2. Kohorte X 1 2. Kohorte

Regressions-Discontinuity-Design mit Zeitreihenanordnung


Vor- und Nachtest
1 2 3 4 X 5 6 7 8

Zeitreihenmodell mit

30 nicht-quivalenter Kontrollgruppe
Nachtestwerte



12345 X 5678910
10 12345 5678910
-10
-10 0 10 20 Vortestwerte Zeitreihenmodelle mit nicht-quivalenten
abhngigen Variablen

1a2a3a X4a5a6a
1b2b3b X4b5b6b

Korrelationsdesigns gekreuzte Panelstudie


Pfadanalyse

a 0,8
X1 X1 A1 A2
b 0,6
d c 0,55 0,5
e 0,45
X1 f X1 B1 B2
0,8
128 Planung von Evaluationsprojekten

teilung nach Zufall zu den verschiedenen lich zugesagter Leistungen (was ja ein wesentli-
Gruppen mglich. ches Element des Qualittsmanagement ist) zu
Studien, die wegen der hohen Bedeutung der berprfen, oder um Hinweise auf Schwach-
Ergebnisse unter Konsens aller Beteiligten stellen (in welchen Bereichen wurde die erwar-
trotz erheblicher praktischer Konsequenzen tete Leistung nicht erbracht?) zu geben. Es kann
randomisiert erfolgen knnen; typisch dafr aber daraus nicht abgeleitet werden, ob die eva-
sind etwa Prfungen von Pharmazeutika, luierte Manahme tatschlich die Ursache
wenn ein neues, vorgetestetes Prparat mit der Zielerreichung (oder der Zielverfehlung)
dem bisherigen Standardmittel im Doppel- war, da stets auf eine Vielzahl mglicher weite-
Blind-Versuch verglichen wird. Die Grenzen rer frderlicher oder das Ergebnis beeintrchti-
der zuflligen Zuteilung liegen dort, wo die gender Faktoren verwiesen werden kann. Fr
unmittelbaren Folgen des Treatments fr die manche Fragestellungen ist der Verweis auf sol-
Betroffenen gravierend sind (zum Beispiel bei che Drittvariablen allerdings nicht nahelie-
der Prfung des Nutzens einer Vollampu- gend, vor allem bei der berprfung von Lei-
tation gegenber einer brusterhaltenden stungen, die unmittelbar fr Kunden bzw.
Operation bei Brustkrebs). Leistungsempfnger erbracht wurden (wenn
Feldexperimente zu Fragen, die eine Grup- Teilnehmer ohne entsprechende Vorkenntnisse
penzuweisung nach (fast) zuflliger Auswahl zu einer drei-tgigen EDV-Schulung geschickt
erlauben, da die Probanden gar nicht wissen, werden, und danach die zugesagten Leistungs-
da sie an einer Evaluationsstudie mitwir- ergebnisse im Abschlutest erzielen, ist es kaum
ken; dies gilt etwa fr die Bewertung von ver- glaubhaft, da dies auf andere Faktoren als die
schiedenen Formen einer Seminargestaltung Trainingsmanahme selbst zurckgeht). Je we-
in der Weiterbildung bei zuflliger Aufteilung niger direkt aber die Wirkung der Manahmen
ohnehin vorhandener Parallelgruppen, das geprft wird, um so problematischer wird der
Erproben verschiedener Interviewtechniken mgliche Einflu von Zusatzaspekten. So wre
oder, mit gewissen Einschrnkungen bezg- etwa im gewhlten Beispiel die Feststellung des
lich der Gruppenquivalenz, bei Manah- Trainingserfolges an zugesagten Transferleistun-
men zur Verkehrslenkung. gen (also die tatschliche Nutzung der Lern-
inhalte in der beruflichen Praxis) schon wesent-
Solche Studien sind aus wissenschaftlich-me- lich weniger stringent auf das Training
thodischer Sicht natrlich besonders aussage- zurckzufhren, da positive Ergebnisse zum
krftig, sollten aber wegen der fr viele Frage- Beispiel durch die Hilfestellung von Vorgesetz-
stellungen unrealistisch hohen Anforderungen ten oder Kollegen erreicht werden knnen
nicht als die einzig zulssige Vorgehensweise (selbst bei einem vllig unzureichenden Trai-
angesehen werden. ning), und die Nicht-Erfllung der Ergebnis-
vereinbarung auch bei hoher Trainingsqualitt
durch Rahmenbedingungen (zu groer zeitli-
Sonderfall: berprfung der Zielereichung
cher Abstand zwischen Training und der tat-
Die hier diskutierten Designfragen stellen sich schlichen Mglichkeit der Nutzung der
im Prinzip nicht, wenn das Ziel der Evaluations- Trainingsergebnisse durch vorbergehend feh-
studie (zum Beispiel im Rahmen des Qualitts- lende technische Mglichkeiten am Arbeits-
managements, siehe Abschnitt 2.2.4) die Kon- platz, Widerstnde gegen die Nutzung der
trolle des Erreichens eines vorher festgelegten Trainingsinhalte durch eine zum Beispiel sub-
Ergebnisprofils ist. Da in diesem Fall keine ver- jektiv verschlechtert erlebte Arbeitssituation bei
gleichende Evaluation vorliegt, erbrigt sich die Anwendung der neuen Kenntnisse, Behinde-
Notwendigkeit, durch entsprechende Designs rung des Trainingstransfers durch Vorgesetzte
aussagekrftige Gruppenvergleiche zu sichern. oder Kollegen, die auf das Beibehalten der bis-
Allerdings mu man sich bei einem solchen herigen Verfahrensweisen drngen und sofort)
Ansatz darber im klaren sein, da die damit verursacht werden kann. Es empfiehlt sich da-
erzielten Ergebnisse keinerlei Aussagen ber her auch bei solchen Evaluationsstudien, die
Kausalursachen zulassen. Sie sind daher zum zunchst kein unmittelbares Designproblem
Beispiel gut geeignet, um die Erfllung vertrag- stellen, mgliche frdernde oder hemmende
Planung von Evaluationsprojekten 129
Aspekte rechtzeitig in den Untersuchungsplan tung wichtigsten Faktoren kombiniert, ergibt
aufzunehmen um damit zumindest korrelativ, sich der im Diagramm V/11 dargestellte Plan,
wenn auch nicht kausal-experimentell, zu ei- der gegen alle Prinzipien der Auswertbarkeit (im
ner weiteren Aufklrung des Bedingungsgefges Sinne des Allgemeinen Linearen Modells, vgl.
beitragen zu knnen. Ein solches Vorgehen ist dazu etwa Rochel, 1983) verstt. Die Ursache
insbesondere dann unverzichtbar, wenn die dafr ist natrlich nicht Inkompetenz oder
Zielsetzung formativer Art ist, also eine Verbes- bser Wille der Verantwortlichen, sondern die
serung der Gestaltung der evaluierten Manah- bei Evaluationsstudien im Feld kaum vermeid-
men erfolgen soll. bare Bercksichtigung wissenschafts- bzw.
untersuchungsexterner Faktoren. Was soll der
Evaluator zum Beispiel tun, wenn aufgrund
Grenzen der Realisierbarkeit von
programmatischer Einstellungen der verant-
Idealforderungen
wortlichen Bildungspolitiker die Gesamtschu-
Wie schwierig die Erfllung strenger Design- len in einem Bundesland praktisch nur in
forderungen selbst in sorgfltigen, mit hohem Ganztagsform realisiert wird, whrendem sich
Aufwand durchfhrbaren Evaluationsstudien Ganztagsschulen im gegliederten Schulwesen
ist, zeigen etwa die Konstanzer Studien zur nicht reprsentativ finden?
Gesamtschulevaluation in den Bundeslndern Auerhalb der summativen Evaluation kann
Niedersachsen, Hessen und Nordrhein-Westfa- man oft berhaupt nicht von einem Versuchs-
len. Selbst wenn man nur fr die Schulgestal- plan sprechen (etwa bei antizipatorischer Eva-

Diagramm V/11
Beispiel eines unvollstndigen, daher nicht auswertbaren Designs der Konstanzer
Studien (aus Wottawa, 1982)

a) Klasse 6

TS GS
Lehrer Lehrer

normal freiwillig normal freiwillig


ganztags 0 0 0 0
freiwillige halbtags 0 0 0 0
Schleranmeldungen ganztags 0 0 0 0
normal halbtags NW 0 He 0

b) Klasse 9

TS GS
Lehrer Lehrer

normal freiwillig normal freiwillig


ganztags 0 0 0 0
freiwillige halbtags 0 0 0 0
Schleranmeldungen ganztags 0 0 0 0
normal halbtags NW, NS 0 He 0

0 = diese Bedingungskombination wurde nicht erfat


He, NW, NS = diese Bedingungskombination wurde in Hessen, Nordrhein-Westfalen, Niedersachsen erfat
130 Planung von Evaluationsprojekten

luation), und fr viele Fragestellungen der for- eine Untersuchung nur deswegen als unwis-
mativen Evaluation entsprechen die realisier- senschaftlich abzulehnen und nicht durch-
ten Designs keinen vertretbaren Forderun- zufhren, weil sie aus unvermeidbaren, sach-
gen. Man denke etwa daran, da im Laufe eines inhrenten Grnden den Designforderungen
lngerfristigen Prozesses ein Therapeutenteam nicht voll entsprechen kann
die Details einer bestimmten Therapietechnik, nicht alles zu tun, um die fr die Vermei-
inklusive der dafr erforderlichen Indikations- dung von Strquellen sinnvollen Design-
stellung, optimieren mchte. Die Einhaltung forderungen soweit wie mglich zu errei-
von Versuchsplanbestimmungen, etwa eine chen
randomisierte Zuteilung von Personen, wrde eine verffentlichte Evaluationsstudie nur
vor allem bei einer ausfhrlichen Indikations- deswegen negativ zu charakterisieren, weil
stellung an der Verfgbarkeit vergleichbarer sie idealen methodischen Anforderungen
Probanden in einem berschaubaren Zeitraum nicht entspricht.
scheitern. Gleiche Probleme finden sich bei vie-
len Arten der berufsbegleitenden formativen Dieser letzte Punkt ist von besonderer prakti-
Evaluation, zum Beispiel bei der Verbesserung scher Bedeutung bei Projekten, die aus berge-
des didaktischen Vorgehens von Lehrern, Ver- ordneten Gesichtspunkten heraus kontrovers
nderungen im Fhrungsverhalten von Mana- beurteilt werden, was fr viele gerade gesamt-
gern oder die Fortentwicklung von Werbe- gesellschaftlich besonders relevante Vorhaben
manahmen. In diesen Fllen ist der zutrifft. Da sich bei greren Vorhaben im Re-
entscheidende Zweck der Datenerhebung nicht gelfall nicht vermeidbare Methodenschwchen
eine vergleichende Bewertung im Sinne des oder der Zwang ergeben, entweder den einen
Hypothesentestens, sondern soll primr heu- oder den anderen Nachteil in Kauf zu nehmen,
ristischen Wert haben, Hinweise auf mgliche ist eine darauf gesttzte nachtrgliche Kritik im
und sinnvolle Verbesserungsvorschlge liefern. Sinne einer Abwertung der Aussagekraft der
Solche dynamischen Prozesse widersetzen sich erreichten Ergebnisse praktisch immer mglich
im Regelfall einer wissenschaftlich exakten und damit letztlich nicht aussagekrftig. Das
Versuchsplanung. Problem ist, da es andererseits natrlich auch
Evaluationsprojekte gibt, die wesentlich
schlechter als notwendig durchgefhrt bzw.
Notwendig: Praktikable Kompromisse
weit berinterpretiert wurden und zu Schls-
Eine mglichst gute Kenntnis der Techniken sen kommen, die sich gerade auch aufgrund
der Versuchsplanung zur Vermeidung von Str- der Methodenschwchen wirklich nicht auf
effekten ist eine unverzichtbare kognitive die gefundenen Daten sttzen lassen. Ob es
Grundlage fr ein sinnvolles Arbeiten im Be- sich im Einzelfall um eine professionell sehr
reich von Evaluationsprojekten. Man darf nur gute, unter den gegebenen Rahmenbedingun-
nicht den Fehler machen, sklavisch an den gen ptimale Designlsung handelt oder eine
entsprechenden, von der Grundlagenforschung auch fachlich sehr schwache Studie vorliegt,
her geprgten Vorbildern zu hngen. Diese sind kann auf der Basis des verffentlichten Berich-
zwar bei entsprechenden Voraussetzungen op- tes oft nicht entschieden werden, da dort die
timale Bearbeitungswege, aber in keiner Weise schwierige Hintergrundsituation hufig nicht
die einzige Mglichkeit, heuristisch verwertbare mehr ausreichend dargestellt ist (bzw. der Ver-
Informationen zu sammeln. Nur fr den relativ dacht entstehen kann, da Schwierigkeiten
kleinen, aber das Bild des Evaluators zumindest aufgebauscht werden, um unntige methodi-
in der Literatur stark prgenden Teilbereich sche Schwchen im Nachhinein zu rechtferti-
summativer Evaluation knnen Idealvorstel- gen). Fr die Abwgung zwischen den beiden
lungen bezglich der Designs gelegentlich wirk- beln Ungerechtfertigte Kritik und Kritik-
lich realisiert werden. In den brigen Fllen lose Hinnahme nicht vertretbarer Studien
stellen die Designforderungen hufig nur eine fehlen derzeit professionelle Standards, die
Denkhilfe in Form eines nicht-erreichbaren Ide- vielleicht bei einer qualitativen und quantita-
als dar, dessen Annherung man soweit wie tiven Zunahme von praktisch ttigen Evalua-
mglich versuchen sollte. Falsch wre es: toren allmhlich entstehen werden.
Planung von Evaluationsprojekten 131
5.2.3 Datenerhebungsverfahren Die Konstrukte, fr die die jeweiligen Test-
verfahren Operationalisierungen darstellen,
Auf die besondere Problematik einer sinnvol- sind berwiegend nach den Bedrfnissen der
len Definition der jeweiligen Bewertungs- Forschung oder der Diagnostik ausgewhlt;
kriterien wurde bereits im Abschnitt 4.2.3 ver- sie decken oft nicht den Operationalisie-
wiesen. Fr die konkrete Erhebung der jeweils rungsbedarf von Evaluationsprojekten ab. Als
ausgewhlten Kriterien stellt sich das aus Beispiel: Um einen Schler mit Schwierigkei-
grundlagenwissenschaftlicher Sicht bedauerli- ten im Sprachbereich zu helfen, ist fr die
che Problem, da nicht selten gilt: Je exakter Differentialdiagnose ein die einzelnen Berei-
die Art des Meverfahrens, um so geringer der che der Sprachbeherrschung ausdifferenzie-
praktische Nutzen. rendes Testverfahren von groem Vorteil
aber wie fat man Wortschatz, Satzstruktur,
Beherrschung der Zeitformen, Wortflssig-
Tests bzw. Fragebgen
keit etc. zu einer Mazahl zusammen, die die
Evaluation zweier verschiedener Lehrbuch-
Aus Grnden der Exaktheit besonders wn-
varianten gestattet?
schenswert wren sorgfltig konstruierte (psy-
Der Zusammenhang zwischen Testwert und
chologische) Testverfahren, die einer problem-
Nutzen (vgl. Abschnitt 4.3.1) ist entweder
adquaten Testtheorie gengen. Es drfte aber
berhaupt nicht bekannt oder dem Auftrag-
kaum Evaluationsprojekte geben, in denen es
geber zumindest schwer vermittelbar; was
mglich ist, den dafr erforderlichen Konstruk-
wrde es zum Beispiel an praxisrelevanten
tionsaufwand zustzlich zu den sonstigen Ar-
Nutzen bedeuten, wenn ein Fhrungskrfte-
beiten abzudecken. Man ist daher im Regelfall
training im Durchschnitt bei den Teilneh-
darauf angewiesen, auf vorhandene Meverfah-
mern eine Steigerung des Faktors Q2 im 16
ren oder einfachere Konzepte zurckzugreifen.
PF um einen Staninwert (eine Normierungs-
Die blichen, am Markt erhltlichen Testver-
art, bei der den Prozentrngen 0 bis 10 der
fahren sind aus naheliegenden Grnden entwe-
Wert 1, zwischen 11 und 20 der Wert 2 etc.
der fr Forschungszwecke (mit starker Anlehnung
zugeordnet wird) erbringt?
an theoretisch-psychologische Konstrukte) oder
fr angewandt-diagnostische Fragen entwickelt
In Anbetracht dieser Sachlage gibt es nur weni-
worden, nicht fr Evaluationszwecke. Dies be-
ge Bereiche, in denen der Einsatz von wissen-
reitet insbesondere folgende Probleme:
schaftlich konstruierten allgemeinen Testver-
Oft geringe nderungssensitivitt; meist sind fahren wirklich empfehlenswert ist. Hufig
die Items so ausgewhlt, da sie auch eine finden sich solche Evaluationsprojekte in den
hohe Testwiederholungsreliabilitt zeigen, USA fr den pdagogischen Bereich, da dort
und damit gerade nicht kurzfristig fluk- Tests auch als schulische Prfungen eingesetzt
turierende, leichter einer Intervention zu- werden (vergleichbar damit ist in der Bundesre-
gngliche Aspekte erfassen (besonders deut- publik Deutschland etwa die Bewertung der
lich im Intelligenzbereich). Ausbildung verschiedener medizinischer Fakul-
Die Lnge der Testverfahren ist auf die Be- tten anhand der bundesweit einheitlichen
drfnisse der Einzelfalldiagnostik abgestellt, Prfungen im ersten medizinischen Staatsex-
so da sie fr manahmebezogene Evaluati- amen), zum gleichen Zweck knnen auch die
on (die auf der Basis von Gruppendaten er- Bundeslnder mit Zentralabitur (in manchen
folgt) hufig unter Effizienzaspekten zu auf- Bundeslndern, zum Beispiel Baden-Wrttem-
wendig sind; die Reduktion der Testlnge berg, werden in jedem Jahr fr das ganze Land
verndert aber, soweit nicht aufgrund des je- gleiche Abituraufgaben gestellt) diese Arbeiten
weiligen Verfahrens von einer annhernden heranziehen, ohne da dort der Anspruch an
Parallelitt der einzelnen Items auszugehen Testkonstruktion bei den Prfungsaufgaben
ist, auch die inhaltlichen Aspekte und beein- erfllt wre. Fr manche therapeutische Inter-
trchtigt somit stark die Bezugnahme auf die ventionen bei Kindern knnen Entwicklungs-
wissenschaftlichen Grundlagen und sonsti- bzw. Reifetests eingesetzt werden, bei Erwach-
ge mit dem Test gewonnenen Erfahrungen. senen wird man hufig mit speziellen Konstruk-
132 Planung von Evaluationsprojekten

tionen (etwa GAS, vgl. Diagramm IV/8) vorteil- tensbeobachtung und mndliche Interviews)
hafter arbeiten. wesentlich kostengnstiger ist. Einige beson-
Das Bestreben vieler Evaluatoren, objektive ders wichtige Probleme, wie sie bei Fragebgen
Testverfahren einzusetzen, ist verstndlich. wissenschaftlich untersucht sind, finden sich
Man mu aber auch die Grenzen der Mglich- im Diagramm V/12. Auch bei sorgfltiger Gestal-
keiten dieser Instrumente zumindest bei ihrem tung kann natrlich nicht verhindert werden,
derzeitigen Entwicklungsstand sehen, und es da man immer nur die (Selbst-) Einschtzung
kann sinnvoller sein, mit einer weichen, we- der Befragten erfhrt und damit der Verhaltens-
niger exakten und elaborierten Methode ein in- und Praxisbezug immer angezweifelt werden
teressantes Kriterium zu messen als mit hoher kann.
Przision etwas, was inhaltlich nicht zu den ei-
gentlichen Evaluationszielen pat. Allerdings
ist der Verteidigungswert von sog. bewhrten Beobachtung
Testverfahren gegen sptere Kritik hher als bei
ad-hoc konstruierten Instrumenten. Die Vermeidung der Realittsferne, die man
Testergebnissen und Fragebgen zuschreiben
Eine etwas weniger fundierte Memethode ist kann, ist mit Methoden der Verhaltens-
der Versuch, im Rahmen des Evaluations- beobachtung mglich (vgl. etwa Knig, 1972).
projektes Fragebgen fr die interessanten Diese Methoden sind dann ideal, wenn der
Variablen selbst zu konstruieren. Oft ist dies das technische Aufwand bewltigbar ist und sich
einzig denkbare Vorgehen, da die schriftliche die Evaluationskriterien wirklich auf beob-
Vorgabe von Fragebgen gegenber den Wer- achtbare Verhaltensweisen beziehen. Typische
ten unter besprochenen Alternativen (Verhal- Beispiele:

Diagramm V/12
Probleme der Fragebogenkonstruktion (nach Knig, 1972)

Klrung der Frage, welche Ausknfte von den Befragten gewnscht werden
Klrung der Frage, an welche Personen-(Gruppen) sich der Fragebogen richten soll
Wahl des testtheoretischen Ansatzes (Modellwahl)
Auswahl der einzelnen Fragen; die verschiedenen Einzelfragen mssen so aufeinander abgestimmt werden, da
eine logische Fortentwicklung der Fragen gegeben und somit ein einheitliches Ganzes vorhanden ist.
Formulierung der Fragen
1. Wahl assoziationsarmer, unbelasteter und subgruppenspezifischer Formulierungen sowie einfacher und klarer
Syntax
2. Bei heiklen Themen: Formulierung mu so gewhlt werden, da der Befragte bei bestimmten Antworten keinen
Prestigeverlust befrchten mu und somit Abwehrmechanismen auf ein Mindestma beschrnkt werden knnen
3. Verwendung offener vs. geschlossener Fragen
4. Wahl der mglichen Antwortalternativen (bei geschlossenen Fragen) Dichotomie vs. Auswahl zwischen meh-
reren Mglichkeiten
5. Verwendung indirekter oder direkter Frage (Face-Validitt fr die Befragten)
6. Probleme, die sich bei indirekten Fragen ergeben: Selbstdarstellungstendenzen oder Fragebeantwortung im
Hinblick auf soziale Erwnschtheit von Seiten der Befragten, Widerstnde des Respondenten, etc.
7. Probleme die sich bei direkten Fragen ergeben: Probleme, die Gltigkeit derartiger Fragen zu bewerten
8. Fragen mssen so formuliert werden, da die Befragten zur Mitarbeit bereit sind
9. Fragen drfen nicht die ggf. vorhandenen Erwartungen des Testkonstrukteurs widerspiegeln
Anzahl der Fragen und Stellung der Fragen in der Fragenfolge (Abfolge von den einfacheren zu den komplizier-
teren Fragen, Bercksichtigung potentieller Ermdungseffekte bei exzessivem Fragenumfang
Aufzeichnung der Fragebogendaten
1. Feldverschlsselung
2. wrtliche Aufzeichnung
3. Gewichtung der verschiedenen Antwortalternativen
Planung von Evaluationsprojekten 133
Verhaltenstherapien, etwa hinsichtlich pho- mierung der jeweiligen Manahmen geben
bischer Reaktionen knnen, mssen von Beobachtern im Nachhin-
Trainings in Sozialtechniken, etwa Diskus- ein in die objektiv beobachtbaren Fakten hin-
sionsverhalten, Kommunikationstechniken eininterpretiert werden, was natrlich zu Ver-
oder Gesprchsfhrung zerrungen fhren kann.
Lehrverfahren oder Lehrmethoden mit ko-
gnitiven Inhalten und unmittelbarer Hand-
lungsrelevanz, etwa die Bedienung von Interviewtechniken
Maschinen, EDV-Anlagen oder auch die
Postkorb-bung aus dem Assessmentcenter. Fr die Erfassung der subjektiven Erklrungen
fr das Verhalten sowie generell fr sehr kom-
Fr diese Beispiele wird es angemessen sein, das plexe kognitive Strukturen und deren Vernde-
Verhalten unmittelbar (etwa die Reaktion auf rungen ist das offene oder teils strukturierte
einen vorher massiv Angst auslsenden Reiz, Interview ein sehr aufwendiges, aber unver-
Aufbau und Durchfhrung eines Vortrages, die zichtbares Hilfsmittel. Hinweise dazu gibt Dia-
Art des Umganges mit der Maschine) zu erhe- gramm V/13.
ben anstatt indirekt ber Fragebgen oder Tests Bei normaler Gesprchsfhrung bleibt fr die
Meinungen bzw. Kompetenzen zu erfassen. Interpretation der subjektiv gesehenen Zusam-
Was Verhaltensbeobachtungen aber nicht di- menhnge ein fr Evaluationsfragestellungen
rekt leisten knnen, ist die Erfassung der sub- manchesmal nicht vertretbarer Spielraum des
jektiv gesehenen Zusammenhnge und Ursa- Interviewers, so da sich der Einsatz spezieller
chen fr die jeweilige Verhaltensweise. Diese Techniken empfiehlt, wenn gerade die Vern-
Strukturen, die vor allem Hinweise auf Opti- derung solcher subjektiven Theorien das Ziel

Diagramm V/13
Das Interview Grundbegriffe und Probleme (Knig, 1972)

Aufgaben des Interviews


Entdeckung: Auffinden der relevanten Variablen, die zur Herstellung der theoretischen Zusammenhnge ben-
tigt werden oder die eine Abgrenzung der relevanten Befragtengruppen erlauben
Messung: von Ausprgung der Variablen. (Mit welcher Hufigkeit sind bestimmte Variablen in einer bestimm-
ten Population verteilt?)
Interpretation u. Verfeinerung statistischer Beziehungen: Deutung unerwarteter Korrelationen oder sog. Aus-
reier-Flle
Formen
Unterscheidung strukturiert unstrukturiert bezieht sich darauf, ob ein Fragebogen verwendet wird
strukturiert: mit Fragebogen, Inhalt, Anzahl u. Reihenfolge der Fragen festlegt
unstrukturiert: kein Fragebogen oder nur Gesprchsleitfaden, hoher Freiheitsspielraum. Fragen sind dem
Befragten jeweils individuell anpabar
Unterscheidung geschlossene offene Fragen bezieht sich auf die Form der einzelnen Fragen
geschlossen: Auswahl der zutreffenden Alternativen aus einer Reihe von Antwortmglichkeiten
offen: erfordert freies Antwortverhalten
Unterscheidung standardisiert nicht-standardisiert. Bezieht sich auf die Verwendung von Antwortkategorien
standardisiert: individuelle Antworten nach Kategorien geordnet, soda sich fr die befragte Gruppe Hufig-
keitsverteilungen ergeben
nicht-standardisiert: Verzicht auf Kategorisierung, nur sinnvoll, wenn auf Hufigkeitsverteilungen und Ver-
gleichbarkeit verzichtet werden kann.
Unterscheidung weiches, neutrales, hartes Interview, anhngig davon, wie autoritr der Interviewer das Interview
leitet.
Problem: Einflu des Interviewers (Auftreten, Art d. Frageformulierung, Tonfall, etc.), Einflu d. Situation
(Strfaktoren wie Lrm, unerwartete Unterbrechungen durch Telefonanrufe whrend des Interviews, etc.)
Ist die Vergleichbarkeit der Einzeldaten derart garantiert, da sie tatschlich als Hufigkeiten bestimmten
Variablen zuordbar sind?
Entsprechen die erhobenen Daten normalen, alltglichen Verhaltensweisen u. Einstellungen der Befragten
oder spiegeln die Daten lediglich Artefakte wider?
134 Planung von Evaluationsprojekten

von Interventionsmanahmen sind. Dafr ste- an Einsparungen sind durchaus realistisch. Die-
hen u.a. die Verfahren zur Verfgung, die schon ses Vorgehen sollte daher insbesondere dann
in 4.2.3 (Diagramm IV/6 und IV/7) besprochen gewhlt werden, wenn die Probanden stark be-
wurden. lstigt oder gar geschdigt (und sei es nur in
Form des Unterbleibens einer an sich mgli-
Die Flle der im sozialwissenschaftlichen Be- chen besseren Frderung) werden. Da dadurch
reich eingefhrten Erhebungsmethoden konnte berdies wesentliche Kosten eingespart werden,
hier nur in dieser groben Form vorgestellt wer- sollte sie fr viele Evaluationsstudien das be-
den, ausfhrlichere Einblicke gibt etwa Bortz, vorzugte statistische Herangehen sein. Aller-
1984. dings gibt es auch Grnde, die dagegen spre-
chen:
Die Kosten der Datenerhebung sind nicht im
5.3 Auswertungsverfahren Vornherein kalkulierbar; die Probandenzahl
hngt ja, im Gegensatz zu festen Stich-
Die vorgesehenen Auswertungsverfahren soll-
probengren, von den erst zu erhebenden
ten schon in der Planungsphase mglichst ge-
Resultaten ab.
nau mit dem Auftraggeber abgesprochen wer-
den zumindest dann, wenn dieser berhaupt
Gerade wegen der Einsparung von Personen
liefert die Sequentialstatistik oft schon signi-
bereit ist, sich auf solche Detailfragen einzu-
fikante Ergebnisse, wenn erst eine der b-
lassen. Ganz besonders gilt die Notwendigkeit
lichen Gepflogenheiten nach zu geringe
der Vorabsprache fr die prinzipielle Entschei-
Stichprobengre erreicht ist; die konkreten
dung, ob berhaupt statistisch vorgegangen
Erfahrungen zeigen, da die Auftraggeber
werden soll oder eine eher beschreibend-ver-
manchmal erhebliche Schwierigkeiten ha-
stehende, hermeneutische Vorgehensweise ge-
ben, eine solche zu kleine empirische Stu-
wnscht wird.
die zu akzeptieren (vor allem dann, wenn
Ein wichtiger Punkt, sofern man statistisch
die Ergebnisse nicht der Vorerwartung ent-
vorgehen mchte, ist die Entscheidung zwi-
sprachen); hier ist rechtzeitige Aufklrung
schen festen Stichprobengren oder Sequen-
vor Bekanntsein der Ergebnisse unverzicht-
tialstatistik. Bei der letzteren wird nicht von
bar!
vorn herein die Anzahl der zu untersuchenden
Personen festgelegt, sondern die Hypothesen-
Die Sequentialstatistik erfordert mehr Vor-
berlegungen, insbesondere bezglich der
prfung schrittweise, nach jeder neu untersuch-
Alternativhypothesen: Dies kann, vor allem
ten Person nochmals durchgefhrt. Darin liegt
bei mehrdimensionalen Ho Schwierigkeiten
ein erheblicher Vorteil: Bei festen Gruppen-
machen.
gren kann es sein, da eine Signifikanz nur
deswegen nicht auftritt, weil man ein paar Pro-
banden zuwenig eingeplant hat. Tatschlich Fr weitere Details zur Sequentialstatistik siehe
sind ja die Trennschrfe-Abschtzungen, die die etwa Wald, 1947; Bauer et al., 1986. Auf die
Grundlage fr eine sinnvolle Bestimmung der Schwierigkeiten, diese Verfahren trotz offen-
Gruppengren bieten knnten, meist nur sichtlicher theoretischer und pragmatischer
schwach fundiert und werden berdies in der berlegenheit im sozialwissenschaftlichen Be-
Forschungspraxis nur selten berhaupt einge- reich verstrkt einzufhren, verweist Diepgen,
setzt (s. dazu Gigerenzer, 1989). Ebenso schade 1987.
ist es, wenn man viel zu viele Personen unter- Es ist natrlich unmglich, im Rahmen eines
sucht, etwa mehrere hundert, und die statisti- allgemeinen Evaluationsbuches alle methodi-
sche Absicherung der Effekte schon mit einem schen Anstze im Detail darzustellen. Im fol-
Bruchteil davon mglich gewesen wre. genden finden sich zunchst einige Ausfhrun-
Da die Sequentialstatistik garantiert, da ge- gen ber das Problem von Effektstrken (5.3.1),
rade soviele Daten erhoben werden, wie man die leider hufig durch bloes Signifikanztesten
zur Entscheidungsfindung bentigt, reduziert ersetzt werden; daran anschlieend werden ei-
sie die durchschnittlich erforderlichen Proban- nige fr den Evaluationsbereich wichtige Be-
denzahlen ganz enorm, Angaben ber ca. 2/3 sonderheiten linear-statistischer Verfahren be-
Planung von Evaluationsprojekten 135
sprochen (5.3.2), da diese fr die Auswertung die Mittelwert und Standardabweichung festle-
von Evaluationsprojekten eine quantitativ be- gen und die Einzelergebnisse in Relation dazu
sondere Bedeutung haben. Im letzten Abschnitt umformen.
(5.3.3) wird ein kurzer berblick ber wichtige Welche Festlegung von Mittelwert und Stan-
qualitative Verfahren gegeben, die insbesondere dardabweichung man whlt, ist aber im Prin-
fr die Auswertung weicher Daten (Nominal- zip willkrlich. Hufig (vgl. Lienert, 1969) sind
skalen oder berhaupt keine explizite Messung, z-Werte (Mittelwert 0, Standardabweichung 1),
wie sie bei Interviewergebnisse hufig ist) Be- T-Werte (50 bzw. 10) und Standardwerte (100
deutung haben. bzw. 10). Ein z-Wert von 1 entspricht also ei-
Fundierte Einblicke in die Flle im Rahmen nem T-Wert von 60 (Mittelwert eine Standard-
der sozialwissenschaftlichen Evaluationsfor- abweichung) und einem Standardwert von 110.
schung relevanten Methoden geben etwa Cook Sachlich sind alle drei Darstellungen quiva-
und Reichard, 1979 oder Bortz, 1993. lent.
Diese Vergleichbarkeit gilt aber nicht fr die
Aufnahme der Information bei Laien oder gar
5.3.1 Beurteilung der Effektstrke den Medien. Hat etwa ein Schulsystem in ei-
nem Bewertungskriterium gegenber der
Fr viele Fragestellungen im Zusammenhang Normstichprobe einen Wert erhalten, der eine
mit Evaluationen gengt es nicht zu wissen, halbe Streuung unter dem Mittelwert der
da ein Effekt besteht, sondern man mchte Normstichprobe liegt, und das andere System
auch Angaben darber, wie gro zum Beispiel ein genau dem Norm-Mittelwert entsprechen-
der Unterschied zwischen zwei Programm- des Ergebnis, so wrde dies in z-Werten 0,5
varianten ist. Leider ist diese Frage viel kompli- bzw. 0,0 bedeuten. Fr Laien wre schon die
zierter, als man zunchst meinen sollte. Die Vorstellung einer negativen Schulleistung ab-
mangelnde Vertrautheit mit der (fr psycholo- surd, und da ein Leistungswert von genau
gische bzw. sozialwissenschaftliche Meinstru- Null etwas Gutes sein knnte, wre fr viele
mente selbstverstndlichen) Skalenproblematik schwer vorstellbar. Betrachtet man nur die Dif-
in der ffentlichkeit bzw. bei den Nutzern der ferenz der beiden Systeme, so entsteht bei ei-
Projektergebnisse, die Verwechslung von Signi- nem Wert von 0,5 eigentlich der Eindruck ei-
fikanz und Relevanz, sowie die hufige Fehlin- nes vernachlssigbaren (Hinter dem Komma)
terpretation von statistischen Kennzahlen Unterschiedes. Etwas anderes wre der gleiche
durch Laien erschwert wesentlich eine sachge- Sachverhalt mit Standardwerten. Fr das zwei-
rechte Kommunikation der Evaluationsergeb- te System klingt die Angabe von 100 (statt 0)
nisse. eigentlich nach vlliger Soll-Erfllung, und eine
Differenz von fnf Punkten (vermutlich als
5% vllig fehlinterpretiert) klingt ja halbwegs
Normierte Skalenwerte beachtlich.
Gerade unter dem Gesichtspunkt der ffent-
Sofern man von einer sorgfltigen Messung lichkeitswirkung hat es sich in den USA einge-
durch Tests, Fragebgen oder Verhaltens- brgert, die Evaluationsergebnisse von Schul-
beobachtungen ausgehen kann, ist in sozial- untersuchungen (zum Beispiel alljhrliche
wissenschaftlichen Projekten das Meniveau Leistungsvernderungen) auf einer Skala anzu-
auf Intervallskalenniveau erreichbar. Bei diesen geben, deren Mittelwert 350 und die Standard-
sind beliebige lineare Transformationen mg- abweichung 50 betrgt. Auf dieser Skala wre
lich, ohne da die inhaltliche Aussage vern- das hier beispielhaft verwendete Ergebnis 325
dert wrde. zu 350, und 25 Punkte weniger ist ja durchaus
Man bentzt dies, um die an sich ohne Zu- beachtlicher als 0,5 z-Werte, zumindest fr den
satzinformation nicht interpretierbaren Ereig- Laien.
nisse (was heit es, wenn in einem Test eine
Probandengruppe im Mittel 18, die andere 25 Es kann keine richtige Normierung geben, da
Punkte erreicht hat?) zu standardisieren. Am die entsprechenden Setzungen bei Intervall-
gebruchlichsten sind dafr Vorgehensweisen, skalen eben willkrlich sind. Vielleicht wre es
136 Planung von Evaluationsprojekten

sinnvoll, sich auf eine Skala bei ffentlichen prgungsgraden auf den Parameterdimensio-
Darstellungen zu einigen, damit allmhlich ein nen) genau eine vorher prognostizierte Kugel
Gefhl fr die Bedeutung von zum Beispiel 10 zu ziehen. Das Auftreten eines signifikanten Er-
Standardwerten entsteht. Verwenden sollte gebnisses hngt daher im wesentlichen von der
man die normierten Werte bei der Ergebnis- Trennschrfe des Vorgangs ab, also insbeson-
darstellung vor allem dann, wenn die Adressa- dere von der Genauigkeit der Messung und der
ten ber eine entsprechende Vorbildung ver- Anzahl der herangezogenen Versuchspersonen.
fgen. In jedem Fall sind normierte Werte Mit steigender Stichprobengre fhren auch
gnstiger als die Roh-Punkte, da diese auch von immer kleinere Unterschiede zwischen den zu
Fachleuten ohne Zusatzinformationen (die eine evaluierenden Manahmen zu einem signifi-
implizite Normierung ermglicht) nicht inter- kanten Resultat.
pretiert werden knnen. Im Bereich der (psychologischen) Grundla-
genforschung ist dieses Phnomen deswegen
nicht allzu gravierend, weil aus Grnden des
Signifikant = relevant? Aufwandes meist nur eine sehr kleine Zahl von
Probanden untersucht werden kann, so da in
Zustzlich zum Ausma gefundener Unter- einer an sich statistisch nicht vertretbaren, aber
schiede mu geklrt werden, ob diese vielleicht praktisch plausiblen Schluweise von einer Si-
nur durch Zufallsschwankungen in der Stich- gnifikanz (unter der Nebenbedingung eben
probenziehung in der gefundenen Gre auf- kleiner Stichproben) auf das Bestehen eines
treten knnen, also nicht als gesicherte, von nicht unerheblichen Unterschiedes zwischen
Null verschiedene Befunde zu interpretieren den Versuchsgruppen indirekt geschlossen wer-
sind. Dazu bedient man sich der bekannten den kann. Da aber bei zahlreichen Evaluations-
Methoden der statistischen Inferenz. Die (in projekten die Stichproben sehr gro sind (man
vieler Hinsicht bedauerlicherweise) hufigste denke etwa an die vielen hundert Schler bei
statistische Testtheorie fr die Auswertung psy- Schulvergleichsuntersuchungen oder die bli-
chologischer oder sozialwissenschaftlicher Stu- cherweise 1000 bis 2000 Personen umfassen-
dien geht auf Neyman-Pearson zurck. Die den Umfragen fr Rckschlsse auf allgemein
Grundidee (vgl. dazu ausfhrlicher Bortz, 1979) wirksame Manahmen wie etwa Aufklrungs-
solcher Auswertungen in den meisten Anwen- oder Werbekampagnen) werden auch viele
dungen aus dem Grundlagenbereich ist, da sachlich irrelevante Unterschiede sehr hoch
man zunchst eine Hypothese (Ho ) aufstellt, an signifikant. Die statistische Signifikanz kann
die man ohnedies nicht glaubt (zum Beispiel in solchen Fllen nur eine notwendige Bedin-
kein Unterschied zwischen verschiedenen Ma- gung (wenn der Effekt nicht einmal gegenber
nahmen) und sich dann freut, wenn die schon zuflligen Unterschieden gesichert ist, sollte
inhaltlich unplausible Null-Hypothese auf- man ihn nur uerst vorsichtig interpretieren)
grund der empirischen Beobachtungen falsifi- aber niemals als hinreichend verstanden wer-
ziert werden kann (es also doch Unterschiede den. Fr ausfhrlichere Darstellungen zum Si-
zwischen den Manahmen gibt). Die Freude ist gnifikanz-Testen vgl. etwa Clau und Ebert,
voll berechtigt, da sie im wesentlichen aussagt, 1972; Siegel, 1956.
da der Untersucher ausreichend viel und
grndlich gearbeitet hat unter den blichen
Stetigkeitsannahmen (kontinuierliche Para- Interpretation deskriptiver Kennzahlen
meterdimension, unendliche Population) ist
die Chance, da es tatschlich keinen Unter- Um unabhngig bzw. ergnzend zur zufalls-
schied zwischen den Manahmen in der kritischen Absicherung deskriptive Aussagen
Population gibt (also die Differenzen aller ber die Strke der nachgewiesenen Effekte er-
Populationsparameterwerte exakt null sind) halten zu knnen, wurden in der Statistik ver-
verschwindend gering bzw. berhaupt null. Sie schiedene Mazahlen entwickelt, die aber auch
entspricht der Wahrscheinlichkeit, aus einer zum Teil Probleme mit sich bringen, wenn man
Urne mit unendlich vielen Kugeln (entspre- sie falsch anwendet oder unzulssig interpre-
chend den unendlich vielen mglichen Aus- tiert (s. dazu Stelzl, 1982).
Planung von Evaluationsprojekten 137
Auch bzgl. dieser Kennziffern bestehen gele- berlegungen ber die unterschiedlich intel-
gentlich erhebliche Interpretationsunsicher- lektuelle Anregung eines Einzelkindes, des
heiten. Um nur 2 Beispiele herauszugreifen: zweiten, in die Familie hinzukommenden
Kindes usf., unter Beachtung der Altersab-
Ein t-Wert von 2,0 oder 3,0 gilt schon als stnde). Auf dieser Basis konnte ein Modell
massives Ergebnis; tatschlich ist aber
erarbeitet werden, dessen Vorhersagen mit
selbst dann die berschneidung zwischen
den Testwerten zu 0,94 korrelierte, was ber
den beiden verglichenen Gruppen betrcht-
der erwartbaren Testreliabilitt liegt. Die Er-
lich (s. Wottawa, 1981). Wie man dort sieht,
klrung dafr ist, da die Daten von fast
sind auch sehr hoch signifikante Ergebnisse
400 000 Rekruten verrechnet wurden und
mit ganz massiven berlappungen behaftet,
das Modell nicht fr Einzeldaten, sondern
so da eine Verallgemeinerung des gesicher-
fr die Mittelwerte der Kombinationen von
ten Mittelwertunterschiedes auf Unterschiede
Familiengre und Geburtsreihenfolge Vor-
der Einzelpersonen nur sehr bedingt erfol-
hersagen leistet. Jeder der 35 Datenpunkte
gen kann. Das Ergebnis darf dann nicht lau-
fate also die Werte von Tausenden Einzel-
ten Die Angehrigen der Gruppe A zeigten
beobachtungen zusammen, was die Fehler-
hhere Werte als die der Gruppe B sondern
varianz entsprechend stark reduziert. Auf die-
Der Mittelwert der einen Gruppe ist hher
ser Basis gewonnene Korrelationen werden
als der der anderen. Es ist manchesmal nicht
mit steigender Stichprobengre nicht aus-
ganz einfach, den Auftraggeber (oder bei poli-
sagekrftiger, sondern verlieren im Gegensatz
tisch relevanten Manahmen gar die interes-
zur Anschauung gerade mit hheren Fall-
sierte ffentlichkeit) auf die fr praktische
zahlen immer mehr Wert als Ausdruck der
Bewertung von Ergebnissen nicht unerheb-
Effektstrke eines Phnomens. Dieses eigent-
lichen Unterschiede dieser beiden Formulie-
lich elementare statistische Phnomen ist fr
rungen hinzuweisen und den Sachverhalt
die Evaluationsforschung deswegen von be-
aufzuklren.
sonderer Bedeutung, da dort meistens Ma-
Selbst so vertraute Mae wie die Korrelation nahmen auf der Basis von Mittelwerten (etwa
machen erhebliche Schwierigkeiten; man von Schulklassen oder therapeutischen Indi-
denke an das Problem, einem sozialwissen- kationsgruppen) bewertet werden und sich
schaftlichen Laien klarzumachen, warum der daher die Verwendung entsprechender
gleiche Sachverhalt einmal mit einer Korre- Bestimmtheitsmae auf dieser Grundlage an-
lation von 0,7 (fr den Laien: ber Zwei- bietet.
drittel), das andere Mal mit einem Be-
stimmtheitsma von 0,49 (weniger als die Neben dieser statistisch-technischen Effekte,
Hlfte) beschrieben wird oder was eigent- die zu einer Fehlinterpretation meist im Sinne
lich der Begriff Varianzaufklrung bedeu- einer berschtzung der Aussagekraft der Stu-
tet. Methodisch interessanter ist die Mglich- die fhren, scheint die Verarbeitung multivaria-
keit, insbesondere multiple Korrelationen ter Information Schwierigkeiten zu machen. So
(oder Bestimmtheitsmae) durch die Ver- ist man zum Beispiel gewhnt, eine durchaus
wendung von Mittelwerten anstelle von Ein- brauchbare Information ber eine Stichprobe
zeldaten in der Regressionsgleichung nahezu durch ein Ma der Zentraltendenz, insbeson-
beliebig zu erhhen. Da bereits durch das dere den Mittelwert, zu erhalten. Es dominiert
bloe Ausmitteln von Mefehlern bei einem die (implizite) Vorstellung, da sich die Me-
solchen Vorgehen die Varianz der abhngi- werte meistens irgendwie eingipfelig, wenn
gen Variablen stark reduziert wird, knnen schon nicht unbedingt nach der Gau-Vertei-
dabei Korrelationen in der Grenordnung lung (die ja aus diesen Grnden auch Normal-
der Testreliabilitt (auf der Basis der Einzel- verteilung genannt wird) um diesen Wert
personen berechnet!) auftreten, ein Beispiel herum gruppieren. Diese Vorstellung stimmt
dieser Art findet sich etwa bei dem Kon- schon im univariaten Fall oft nicht (so ist zum
fluenzmodell (Zajonc, 1979). Bei diesem wird Beispiel der Mittelwert bei extrem zwei-
die Intelligenz auf Grund der Familien- gipfeligen Verteilungen besonders weit von al-
konstellation vorhergesagt (vor allem durch len tatschlich gefundenen Mewerten ent-
138 Planung von Evaluationsprojekten

fernt), vllig unbersichtlich wird es im multi- ter, bersichtlicher Form geben, um die sptere
variaten Fall. Als Anschauungshilfe werden ge- Zusammenfassung in dieser Form zu erleichtern.
legentlich optische Darstellungen verwendet,
etwa die Cherkoff-Gesichter. Dies sind einfa-
che Strichzeichnungen, die Ausprgungen der 5.3.2 Auswertungsverfahren auf
Einzelheiten (etwa der Augenabstand, die Au- der Basis allgemeiner linearer
gengre, Krmmung des Mundwinkels etc.) Modellanstze
entsprechen den Ausprgungsgraden der ein-
zelnen Variablen (siehe dazu etwa Daumen- Mchte man mehr als einfache Gruppen-
fang, 1984). Solche Darstellungen knnen vergleiche auf der Basis elementarer Effekt-
Fehlinterpretationen, etwa bezglich der Be- strken, wird im sozialwissenschaftlichen Be-
schreibungsgte (die oft berschtzt wird) reich fr die Analyse von Strukturen in den
einer Stichprobe durch das multivariate gefundenen Daten meist auf Spezialflle des all-
Mittelwertsprofil, vermeiden helfen. gemeinen linearen Modells zurckgegriffen. (s.
Leider ist es relativ leicht, die mit den einzel- etwa Rochel, 1983 oder Moosbrugger, 1978).
nen Maen der Effektstrke verbundenen Pro- Auf den ersten Blick sind diese Anstze nicht
bleme aufzuzeigen; viel schwieriger ist es, posi- nur beliebt, sondern auch sachlich sinnvoll, da
tive Empfehlungen zu geben, da jede dieser sie in einfacher Weise auch die Erfassung kom-
Kennziffern ihre Vor- und Nachteile hat. Es plexer Sachverhalt ermglichen. Speziell fr die
bleibt nur, die jeweiligen Besonderheiten fr Evaluationsforschung, aber nicht nur dort, ist
das konkrete Projekt abzuwgen und vor allem mit diesem Ansatz aber auch eine Reihe von
durch vorbereitende Information zu versuchen, Schwierigkeiten verbunden:
bei den Abnehmern der Ergebnisse wenig-
stens ein wenig Verstndnis der Interpretations-
Diese Modellform ist populationsabhngig
(im Sinne fehlender Teilgruppenkonstanz,
schwierigkeiten zu erwecken, was allerdings in
vgl. Wottawa, 1987).
keiner Weise einfach ist.
Die Ergebnisse knnen nur deskriptiv, nicht
funktional interpretiert werden.
Meta-Analysen
Das Modell ist stets als Einheit zu sehen, das
Herausgreifen von Teilergebnissen ohne Be-
achtung des Gesamtrahmens ist nicht zuls-
Die im Abschnitt 5.2 dargestellten Schwierig-
sig.
keiten von wirklich aussagekrftigen Evaluations-
projekten lassen es in diesem Forschungsfeld
besonders wichtig erscheinen, die Ergebnisse Populationsabhngigkeit
(gerade in Form der Effektstrken) mglichst
vieler verschiedener Studien zu einer Global- Das Problem der Populationsabhngigkeit wur-
aussage zusammenzufassen. Dies setzt die Ein- de insbesondere im Zusammenhang mit der
haltung bestimmter methodischer Vorgehens- Faktorenanalyse diskutiert (vgl. dazu Fischer,
weisen voraus. Ausfhrliche Darstellung dieser 1974), trifft aber in gleicher Weise fr alle An-
Techniken finden sich bei Fricke und Treinies, stze des allgemeinen linearen Modells zu. Da
1985. Fr den psychologisch-sozialwissenschaft- die Modellgltigkeit immer fr eine vorgegebe-
lichen Bereich besonders interessante Ergebnisse ne Population (aus der der speziell ausgewerte-
von Meta-Analysen geben Hunter et al. (1982), fr te Datensatz als Stichprobe genommen ist)
die Wirkung von Psychotherapien Grawe (1990). postuliert wird, ist eine bertragung der Mo-
Zusammenfassende Auswertungen dieser Art dellergebnisse auf Teilgruppen daraus nicht zu-
ersetzt natrlich nicht die Detailarbeit in den lssig und wrde zu massiven Fehleinschtzun-
einzelnen Evaluationsprojekten, sind aber eine gen fhren.
wertvolle und unverzichtbare Grundlage fr all- Wieweit dieses Problem fr die Evaluations-
gemeine Empfehlungen. Es wre anzustreben, forschung strt, hngt davon ab, ob sich die
da alle publizierten Evaluationsprojekte die fr evaluativ untersuchten Manahmen auf Ein-
eine sachgerechte Aufarbeitung in Meta-Analy- zelpersonen (die ja immer Teile einer Popula-
sen erforderlichen Angaben in zusammengefa- tion sind) bezieht oder ob vordefinierte, sach-
Planung von Evaluationsprojekten 139
lich sinnvolle Populationen den Manahmen (fr die Population), aber nicht funktional ver-
ausgesetzt werden. Interessiert man sich etwa standen werden knnen. So hngt zum Beispiel
im Rahmen einer pdagogisch-psychologischen das Verhalten eines Klienten whrend eines
Fragestellung fr die Zusammenhangsstruktur Therapieverlaufes in keiner Weise davon ab,
verschiedener Einflugren bei Hauptsch- welche anderen Patienten irgendwann einmal
lern im Gegensatz zu Realschlern (Hesse, mit seinen Daten gemeinsam fr die Projekt-
1982), so ist die Population der jeweiligen Sch- auswertung verrechnet werden. Trotzdem wird
lerschaft durch Sachaspekte definiert. Mchte je nach Zusammensetzung der Daten fr die
man diese Population als ganze weiter untersu- Auswertung aus dem im vorigen Absatz darge-
chen, etwa mit dem Ziel der Evaluation von stellten Grnden einmal die Beziehung zwi-
Manahmen, die eine als nicht optimal er- schen emotionaler Befindlichkeit und Dauer
scheinende Zusammenhangsstruktur zwischen der Therapie sehr eng sein, das andere Mal ver-
Variablen gnstig beeinflussen sollen, sind schwindend gering. Gleiches gilt fr verwandte
entsprechende pfadanalytische oder LISREL- Verfahren, etwa auch fr die Faktorenanalyse.
Modelle u. U. sehr ntzlich. Gleiches gilt fr Da die Zahl der fr die Beschreibung der Ergeb-
Vergleiche zwischen verschiedenen Populatio- nisse sinnvollerweise erforderlichen Faktoren
nen. So konnte etwa Hesse in der oben zitier- ebenfalls von einer Populationsdefinition ab-
ten Arbeit deutliche strukturelle Unterschiede hngt, ist die Intelligenz oder Persnlich-
zwischen Haupt- und Realschule nachweisen. keit eines Menschen je nach der durch den
Vergleichbar sind viele Fragestellungen aus dem Untersucher willkrlich zu setzenden Popula-
sozialwissenschaftlichen Bereich, in denen die tionen einmal durch sehr viele Faktoren zu be-
Populationen Parteien, Verbnden, Industrie- schreiben (bei homogenen Gruppen), das an-
betrieben oder sogar ganzen Staaten entspre- dere Mal gengen wesentlich weniger (bei
chen. Typische Gegenbeispiele finden sich im heterogenen Populationen). Diese Artefakte
Bereich der Einzelfallintervention (zum Beispiel machen es auch unmglich, solche (linearen)
bei psychologischen Therapietechniken oder Auswertungen als eine ausreichende Grundlage
pdagogischen Manahmen). Zeigt sich etwa fr Prognosen fr Vernderungen von Einzel-
ein fr die Bewertung der Evaluationsergebnisse fllen abzuleiten (whrenddem es durchaus
wichtiger Zusammenhang zwischen Intelligenz mglich ist, durchschnittliche bzw. gruppen-
und Lernsteigerung durch die Manahme, bezogene Vernderungen halbwegs sicher in
kann dieser je nach Definition der Population Trendberechnungen auf der Basis von Regres-
fr die Modellanwendung nahezu beliebig ma- sionsgleichungen vorherzusagen).
nipuliert werden. Whlt man als Population In manchen Evaluationsprojekten ist man in
eine Gruppe von Schlern mit relativ hnlicher besonderer Weise auf funktionale Modelle fr
Intelligenz, wird auch ein an sich starker Einzelflle angewiesen. Beispiele dafr sind
Zusammenhang als Folge der Reduktion der etwa formative Evaluationen von ber-
true-score-Varianz bei gleichbleibender Fehler- wachungs-oder Steuerungsanlagen (wo die In-
varianz in den Zusammenhangskennziffern na- formationsverarbeitung bzw. sensomotorische
hezu verschwinden; whlt man eine Populati- Koordination des Bedieners mglichst exakt zu
on zum Beispiel aus zwei Extremgruppen modellieren wre) und bei anderen ergonomi-
(besonders hoch- bzw. niedrig-intelligente schen Fragestellungen, zum Beispiel der Opti-
Schler), wird wegen der dann erfolgten massi- mierung von Computersoftware. Fr Steue-
ven Erhhung der Varianz der true-scores bei rungseinrichtungen haben sich insbesondere
sonst gleichem Sachverhalt eine wesentlich bes- Modelle auf der Basis der regelungstechnischen
sere Modellanpassung resultieren. Anstze bewhrt, die zu einer Beschreibung des
Verarbeitungsprozesses auf der Basis von Diffe-
rentialgleichungsmodellen fhren (fr An-
Deskription, nicht Funktionsanalyse wendungsflle in der mathematischen Soziolo-
gie siehe etwa Coleman 1956). Beispiele fr die
Diese Populationsabhngigkeit ist auch einer funktionale EDV-Modellierung von relevanten
der Grnde, warum Auswertungen auf der Wissens- bzw. Denkstrukturen finden sich bei
Grundlage des linearen Modells nur deskriptiv Kleinmuntz, 1963; 1972.
140 Planung von Evaluationsprojekten

Kontextabhngigkeit abwerten. Man mu nur bei der Detailplanung


seines Evaluationsprojektes wissen, ob sach-
Eine selbst bei sachgerechter Lsung der ersten immanente Grnde oder die Wnsche des Auf-
beiden Problempunkte verbleibende Schwierig- traggebers zum Beispiel die Erarbeitung funk-
keit fr die Interpretation dieser beliebten tionaler Modelle erzwingen und in solchen
Gruppe von Auswertungsverfahren ist das Fak- Fllen die dann notwendigen Vorarbeiten
tum, da alle Modellparameter (also alle Aussa- rechtzeitig einkalkulieren und auch bedenken,
gen ber die Beziehungen zwischen den einzel- da die Gewinnung fr solche Spezialent-
nen Variablen) im Kontext des Gesamtmodells wicklungen ausreichend kompetenter Mitarbei-
zu sehen sind. Man kann also etwa aus einer ter ein nicht unerhebliches Problem sein kann.
pfadanalytischen oder auf LISREL aufbauenden Schlecht sind nicht die linear-statistischen Aus-
Auswertung nicht einen einzelnen Parameter- wertungsverfahren an sich, sondern deren Fehl-
wert fr eine Teilbeziehung innerhalb des Mo- anwendung bzw. Fehlinterpretation, die ver-
delles herausgreifen und dies dann als Ergebnis mutlich gar nicht selten auf eine mangelnde
darstellen; welches -Gewicht zwischen den Problemsicht des Untersuchungsleiters in der
Variablen A und B bei der Schtzung der Planungsphase, wo sich noch alternative L-
Modellparameter aus den empirischen Daten sungskonzepte htten realisieren lassen, zu-
herauskommt, hngt ganz wesentlich von den rckgehen drften.
brigen in die Untersuchung aufgenommenen
Variablen ab und kann bei einer nderung die-
ser Variablenmenge nicht nur im Ausma, son- 5.3.3 Qualitative
dern sogar im Vorzeichen variieren. Auf die da- Auswertungsverfahren
mit verbundenen Probleme hinsichtlich von
Mit diesem Begriff werden verschiedene Aus-
Reihenfolgeneffekten von Variablenaufnahmen
wertungsstrategien angesprochen, die eigent-
bzw. Variablenselektion bei Regressionsan-
lich nur gemeinsam haben, da sie weniger
stzen und nicht-orthogonalen varianzanaly-
stringente Anforderungen an das Meniveau
tischen Plnen verweist zum Beispiel Rochel,
stellen und in besonderer Weise zu verbalen
1983. Dieses Faktum ist im brigen nicht un-
Interpretationen kompatibel sind.
bedingt eine Schwche dieses besonderen
Im wesentlichen lassen sich drei oft ge-
Auswertungsverfahrens, sondern ergibt sich
brauchte Begriffsbedeutungen unterscheiden:
zwangslufig aus der inkrementellen Struktur
der einzelnen Parameter. Der zustzliche Bei- qualitativ meint im Gegensatz zu quanti-
trag eines Effektes hngt eben auch empirisch tativ statistische Verfahren, die nur auf No-
davon ab, welche anderen Effekte kontrolliert minalsskalen aufbauen; Beispiele sind etwa
werden. Aber: Wie vermittelt man einem Auf- die Konfigurationsfrequenzanalyse (Krauth
traggeber, da ein wichtiger, kostenintensiver & Lienert, 1973), die Methode GUHA (Hajek
Aspekt seiner Manahme (als Beispiel etwa die & Havranek, 1978), HYPAG/SEARCH (s. Wot-
Gre von Schulklassen) sich je nach Aus- tawa, 1978; 1987) und TYPAG (Hollmann,
wertungskontext im Ausma und evtl. sogar in 1991)
der Richtung unterschiedlich auswirkt? qualitativ ist die Art der Datenauswertung,
Neben diesen kritischen Aspekten mu man weil keine statistisch-numerischen Verfah-
aber auch betonen, da es fr eine einfach ren, sondern EDV-gesttzte Strukturierungs-
handhabbare, keine komplizierten Entwick- hilfen eingesetzt werden; hierunter fallen
lungsarbeiten erfordernde Auswertung multi- etwa EDV-gesttzte Verfahren der Inhalts-
pler Zusammenhangsstrukturen derzeit eigent- analyse oder die sog. Plan-Analyse (Grawe &
lich keine praktikable Alternative zu den Caspar, 1984).
verschiedenen Spezialfllen des allgemeinen li- qualitativ ist der Verzicht auf alle zhlen-
nearen Modells gibt (auf zumindest partiell den bzw. rechnenden Verfahren, es verblei-
konkurrenzfhige konfigurale Anstze wird im ben subjektive Interpretationen und Ver-
nchsten Abschnitt eingegangen). Die hier sehr stehenserlebnisse, etwa vergleichbar mit der
pointiert dargestellten Kritikpunkte sollen auch Interpretation von Kunstwerken (s. etwa
in keiner Weise Auswertungsanstze dieser Art Dilthey, 1896).
Planung von Evaluationsprojekten 141
Konfigurale Techniken fr diese Art qualitativer Verfahren Henning
und Kemnitz, 1986).
Diese Auffassung ist natrlich die den im
vorhergehenden Abschnitt besprochenen Der entscheidende Nachteil aller dieser Anstze
Verfahren am hnlichsten. Es sind statistische ist aber, da aus Grnden der bersichtlichkeit
Auswertungstechniken, die nicht auf eine ma- vor allem induktive Verfahren fr sehr komplexe,
thematisch-quantitative Beschreibung von Zu- zahlreiche Variablen gleichzeitig bercksich-
sammenhangsstrukturen ausgerichtet sind, tigende Auswertungen selbst dann ungeeignet
sondern eigentlich nur Konfigurationen in den sind, wenn die in diesem Fall astronomisch ho-
Daten (also Kombinationen verschiedener hen Rechenzeiten bewltigbar wren. Fr ber-
Merkmalsausprgungen auf Nominalskalen) schaubare Variablenstze (oder solche, die sich
aufbauen. ohne Schaden fr das Gesamtprojekt in ent-
Ein erheblicher Vorteil gegenber den linea- sprechend kleine Subgruppen zerlegen lassen)
ren Techniken ist bei diesen Anstzen, da die knnen daher diese Anstze als ernsthafte Al-
gefundenen Konfigurationen strukturgleich ternative gegenber dem allgemeinen linearen
mit wenn-dann-Stzen sind (vgl. dazu die Modell empfohlen werden, fr die Deskription
Ausfhrungen im Diagramm IV/7). Es entspricht sehr groer Variablenmengen bleibt die tradi-
dem normalen Argumentieren, da ein be- tionelle Auswertungsmethode trotz aller Schw-
stimmtes Ereignis dann zu erwarten ist, wenn chen aber auch weiterhin unverzichtbar.
die eine Bedingung und die zweite Bedingung
und/oder dritte Bedingung gegeben ist, und
dies entspricht unmittelbar den daraus folgen- Strukturierungshilfen
den Datenkonfigurationen; im Gegensatz dazu
ist es auerordentlich mhsam, etwa eine mul- Die zweite der genannten qualitativen Ver-
tiple Regressionsgleichung aus den drei ge- fahrensgruppen sind Anstze, bei denen kom-
nannten Bedingungsvaribalen zur Vorhersage plexes Material EDV-gesttzt ausgewertet bzw.
des Ereignisses verbal darzustellen, da insbeson- strukturiert wird. Hierzu gehren viele Verfah-
dere die zahlreichen Kompensationsmglich- ren der Inhaltsanalyse, sofern sie ber einfache
keiten bei den verschiedenen quantitativen Auszhlungen von Worthufigkeiten hinausge-
Ausprgungsgraden der Variablen sich so gut hen (s. etwa bei Rust, 1983). Gerade fr die
wie nicht in normaler menschlicher Sprache Auswertung von offenen Interviews, etwa bei
darstellen lassen. Damit hngt auch der weitere der Bewertung von Manahmen im Bildungs-
Vorteil zusammen, da zwar die Gte der Er- oder Therapiebereich durch unmittelbar betrof-
gebnisse insgesamt (also zum Beispiel wieviele fene Probanden, knnen damit interessante
Kombinationen mit welchen Vorhersage- Einblick erarbeitet werden. Oft ist es auch mg-
mglichkeiten aufgetreten sind) ebenfalls von lich, darauf aufbauende quantitative Auswer-
der Populationsdefinition und der Menge der tung anzuschlieen.
fr die Untersuchung aufgenommenen Varia- Qualitative Strukturierungshilfen sind noch
blen abhngt (vergleichbar mit den entspre- weniger verbreitet. Ein Vorgehen dabei ist die
chenden Problempunkten bei dem allgemeinen (teil-)formalisierte Darstellung von subjektiven
linearen Modell), jede einmal erarbeitete Aus- Theorien, etwa SLT oder HYPAG/Structure (vgl.
sage in Form eines wenn-dann-Satzes aber Diagramme IV/6 und IV/7). Gerade bei Weiterbil-
unmittelbar fr jeden dadurch erfabaren Ein- dungsmanahmen kann die Vernderung der
zelfall formuliert ist. Die Probleme der Popu- subjektiv von den Teilnehmern gesehenen Zu-
lationsabhngigkeit verlagern sich dadurch von sammenhnge bzw. mglichen Handlungs-
der Einzelfallformulierung auf die Heuristik, plne ein wichtiger Hinweis auf den Erfolg der
also darauf, welche Variablen etwa bei Such- Manahme sein, ein Beispiel unter Verwen-
vorgngen in Datenstzen als besonders rele- dung dieser Technik gibt Wottawa und Hof,
vant erscheinen. Dies ist daher keine endgl- 1987. EDV-gesttzte Strukturierungshilfen kn-
tige Lsung fr dieses Problem, aber doch eine nen die bersichtliche Darstellung komplexer
gerade fr einzelfallorientierte Intervention Sachverhalte, gerade auch bei Interview-Aus-
und Evaluation wesentliche Verbesserung (vgl. wertungen, sehr erleichtern.
142 Planung von Evaluationsprojekten

Ein besonders eindrucksvolles Beispiel dafr inhaltlichen und dem methodischen Vorgehen
ist die Plan-Analyse (Grawe und Caspar, 1984), voraus.
die vor allem fr Anwendungsflle aus dem Be-
reich der Therapie und Therapie-Evaluation
entwickelt wurde. Die Grundidee dabei ist, da Verstehen
komplexe Strukturen (zum Beispiel Handlungs-
plne, das Verfahren lt sich aber natrlich Der im strengsten Sinn qualitative Ansatz ist
auch auf jede andere Art von Strukturbezie- ein rein verstehend-interpretatorisches Vorge-
hungen anwenden) dadurch bersichtlicher hen. Diese Methodik ist in vielen geisteswis-
gemacht werden, da vom Untersucher die je- senschaftlichen Bereichen unverzichtbar, etwa
weils paarweisen Beziehungen erarbeitet wer- bei der Interpretation von Kunstwerken oder
den und das Programm dabei hilft, daraus eine Gedichten, dort wurden auch Arbeitstechniken
nachvollziehbare Gesamtstruktur (etwa in dazu entwickelt. Fr die empirische Evalua-
Form hierarchischer Entscheidungsablufe oder tionsforschung ist dieses Vorgehen aber von
Organisationsstrukturen) aufzubauen. Anstze untergeordneter Bedeutung, man wrde z-
dieser Art knnen eine sehr wertvolle Hilfe sein, gern, ein solches Projekt zum Beispiel nur auf
um die Erfassung und insbesondere die ber- einer verstehenden Beschreibung einiger Tie-
sichtliche Prsentation komplexer Befunde in feninterviews aufzubauen. Auch zeigen Erfah-
qualitativ orientierten Evaluationsstudien zu rungen im Bildungsbereich, da die ffentliche
beschreiben. Sie sollten aber wegen der relati- Akzeptanz rein beschreibender Arbeiten gering
ven Willkrlichkeit immer nur heuristisch-for- ist.
mativ, nicht als endgltig-summatives Ergeb- Trotzdem kann bei vielen Projekten nicht auf
nis dargestellt werden. eine subjektiv-spekulative Interpretation ver-
Da die notwendigen technischen Hilfen, ne- zichtet werden, vor allem bei formativen Eva-
ben den EDV-Programmen auch die Einschu- luationen. Es wre unvertretbar, die oft feststell-
lung in ihre sachgerechte Nutzung, bei quali- baren, wenn auch zunchst nicht geplanten
tativen Verfahren noch wesentlich weniger und daher auch nicht quantitativ erfaten Hin-
verbreitet sind als fr quantitativ-statistische weise auf Optimierungsmglichkeiten nur des-
Methoden, sollte vor der endgltigen Fest- halb nicht zu nutzen, weil man dafr keine
legung solcher Auswertungsmethoden in der Auswertungsstatistiken vorlegen kann. Man
Planungsphase die Verfgbarkeit entsprechen- sollte aber solche persnlichen Eindrcke, Mei-
der Ressourcen gesichert sein. Auch mu der nungen und Vorschlge deutlich als solche
Arbeitsaufwand relativ hoch veranschlagt wer- kennzeichnen und nicht den Eindruck erwek-
den, und insbesondere ist er nicht delegierbar. ken, sie seien durch objektivierbare Fakten ab-
Der vorwiegend inhaltlich-wissenschaftlich gesichert. Manchesmal ist es zur Vermeidung
ausgerichtete Projektmitarbeiter kann fr die solcher Miverstndnisse sogar besser, Hinweise
rein statistische Datenanalyse die entsprechen- auf dieser Grundlage nur in einem persn-
den Arbeiten (weitgehend) an Spezialisten de- lichen Gesprch mit dem Auftraggeber weiter-
legieren, qualitative Auswertungsverfahren set- zugeben und nicht in den offiziellen Bericht
zen aber eine enge Abstimmung zwischen dem aufzunehmen.
Planung von Evaluationsprojekten 143

bersicht Kapitel 5:
Planung von Evaluationsprojekten
5.1
Projektmanagement
Wichtige Informationen im Vorfeld oder zu Beginn des Projektes:
Informationen ber Rahmenbedingungen
Erstellung eines Arbeitsplans
Zeit- und Kostenplan

Informationen zu Projektdetails Wichtige Punkte des Arbeitsplans Zeit- und Kostenschtzung


u. Rahmenbedingungen Arbeitsschritte in zeitlicher Struktur- und Zeitanalyse
Geschftsberichte, Verffent- Reihenfolge planen, Aufwand der Ziel:
lichungen in Zeitschriften Schritte einplanen Zerlegung des Gesamtprojektes in
Persnliche Kontakte mit dem Exakte Terminangaben, Einzelschritte und Ermittlung der
Auftraggeber etc. Deadlines Dauer dieser Schritte
Finanzielle Aufwendungen Hilfstechniken
Entscheidungspunkte mit Balken- und Netzplantechnik
Auftraggeber klren Entscheidungsbaumverfahren
Auflistung aller zu erbringenden
Leistungen oder in Auftrag
gegebenen Arbeiten

5.2
Designfragen
Fehlerquellen: Reifung, Nicht-quivalenz von Vergleichsgruppen, Mortalitt im statistischen Sinne

Untersuchungsplne Datenerhebungsverfahren
Quasi-Experimentelle Designs Psychologische Tests
gnstig in Evaluationsstudien Fragebgen
Verhaltensbeobachtung
Echte Experimentelle Designs Offene oder teilstrukturierte
in Evaluationsstudien kaum Interviews
anwendbar

Sonderfall Qualittsmanagement
gnstig, um vertraglich zugesagte
Leistungen zu berprfen
keine Rckschlsse auf Kausal-
ursachen mglich!

5.3
Auswertungsverfahren
Unterscheidung Sequentialstatistik oder feste Stichprobengre

Effektstrke Allgemeines Lineares Modell Qualitative Auswertungsverfahren


sinnvoll fr einfachen sinnvoll bei komplexer Situation sinnvoll bei wenig stringenten
Gruppenvergleich Problem: Populations- und Anforderungen an das Meniveau
Beispiel: Normierte Skalenwerte Kontextabhngigkeit Beispiel: Konfigurale Techniken
Problem: Signifikant Relevant Deskription, nicht Strukturierungshilfen
Funktionsanalyse Verstehen (Hermeneutik)
145

6. Durchfhrung von Evaluationsstudien

Je sorgfltiger die Planungsarbeiten durchge- fhren kann), und die vor allem im wirtschafts-
fhrt wurden, um so weniger prinzipielle Pro- nahen Bereich sehr elaborierten Darstellungs-
bleme wird die Durchfhrung des konkreten hilfen (Medien bei Vortrgen, optische Auflok-
Projektes machen. Trotzdem wre es eine Illu- kerung) werden an der Universitt nur selten
sion, auerhalb von sehr kleinen und ber- in vergleichbar intensiver Weise gepflegt. Hin-
schaubaren Projekten von einer reibungslosen weise zu solchen Fragen gibt Abschnitt 6.3.
Durchfhrung auszugehen. Zumindest bei ln-
gerfristigen Vorhaben sind Schwierigkeiten im
Bereich der Organisation zu erwarten, typische 6.1 Organisatorische Fragen
Beispiele und Manahmen fr deren partielle
Behebung werden im Abschnitt 6.1 diskutiert. Die wichtigsten Organisationsprobleme finden
Weniger mit Unsicherheiten behaftet ist die sich im Bereich des Personals sowohl bei den
sachgerechte Durchfhrung der Auswertungs- Projektmitarbeitern, als auch bei Auftraggebern
arbeiten, doch mu man auch dort auf eine oder anderen fr die Durchfhrung erforderli-
sorgfltige Fehlerkontrolle und die Einhaltung chen Kontaktpersonen (zum Beispiel Lehrer,
der Vertraulichkeits- bzw. Datenschutzbestim- Verwaltungsbeamte etc.). Zumindest fr die ei-
mungen achten. Bei aller Mhe aber nicht ver- genen Mitarbeiter kann man einige Schwierig-
meidbar ist das prinzipielle Problem, da von keiten vermeiden, wenn man rechtzeitig auch
der unbersehbaren Vielzahl der denkbaren deren Einschulungsbedrfnisse und ihre per-
Auswertungen nur ein kleiner Teil erfolgen snlichen Interessen, zum Beispiel im Hinblick
kann und diese Auswahl stets mit dem Vorwurf auf ihre weitere berufliche Entwicklung, bei der
von Manipulation rechnen mu. Fragen die- Projektplanung und der Personalfhrung be-
ser Art werden im zweiten Abschnitt dieses Ka- achtet (6.1.1). Darber hinaus mu man sich
pitels besprochen (6.2). im klaren sein, da grere Vorhaben nicht
ohne explizite Kontrolltechniken durchgefhrt
Am Schlu des Evaluationsprojektes steht meist werden knnen, wenn man vermeiden will,
eine schriftliche, oft durch eine mndliche Pr- da sich am Ende einer zum Beispiel zweijhri-
sentation ergnzte Berichtlegung an den Auf- gen Arbeitsphase nicht mehr behebbare Pro-
traggeber, ggf. auch an andere Instanzen (zum bleme auftrmen und u.U. das ganze Projekt
Beispiel ffentlichkeit, Schulleiter). Die damit ergebnislos abgebrochen werden mu. Einige
verbundenen Darstellungs- und Kommunika- Hinweise, die eine entsprechend sorgfltige Ein-
tionsprobleme werden von Akademikern ohne arbeitung natrlich nicht ersetzen knnen, fin-
einschlgige Erfahrung oft unterschtzt. Man den sich im Abschnitt 6.1.2.
lebt innerhalb einer universitren Bezugs- Nahezu alle Organisationsprobleme lassen
gruppe in einem fr Auenstehende schwer sich lsen, wenn man rechtzeitig an ihr Auftre-
nachvollziehbaren Abstraktionsniveau, einer ten denkt, also eine (in den Evaluations-Begrif-
fachspezifischen Begriffsbildung (die leider fen gem Diagramm II/2) antizipatorische In-
nicht nur manchmal unverstndlich ist, son- put-Evaluation fr das eigene Projekt mit
dern auch zu Miverstndnissen bei Laien ausreichender Aussagekraft anstellt.
146 Durchfhrung von Evaluationsstudien

Bei aller Sorgfalt mu trotzdem davon ausge- Bei befristeten Projekten wird die Situation
gangen werden, da sich zum Teil vorherseh- noch durch regionale Mobilittseinschrn-
bare, zum Teil aber vllig berraschende Kata- kungen erschwert, da viele Interessenten
strophen ergeben, die ein bei aller Sorgfalt der zgern, fr vielleicht nur ein Jahr ber gr-
Planung doch sehr flexibles Krisenmanagement ere Entfernungen hinweg den Wohnort zu
erfordern. Einige Beispiele finden sich in 6.1.3. wechseln.

Eine Lsung wre die rechtzeitige Einstellung


6.1.1 Fragen der Personalfhrung und vorbereitende Einschulung von Anfn-
gern. Es knnen sich aber nur wenige private
Die Verhltnisse gestalten sich natrlich unter-
Institute eine solche langfristige Personalpla-
schiedlich, je nachdem, ob ein Evaluations-
nung finanziell leisten, und berdies wird die
projekt firmen- oder klinikintern, durch Mitar-
praktische Leistungsfhigkeit von Bewerbern
beiter eines Ministeriums, im Rahmen der
unmittelbar nach Abschlu der akademischen
Aufgaben eines Universittsinstituts oder als
Ausbildung skeptisch beurteilt, vielleicht nicht
Auftrag an ein privatwirtschaftlich organisier-
immer zu recht.
tes Institut durchgefhrt wird (vgl. Diagramm II/
Spezialisten unter den Mitarbeitern (insbe-
5). In groen Firmen und bei ffentlichen Ar-
sondere im EDV-Bereich) knnen bei lngerfri-
beitgebern gibt es meist bewhrte, langfristig
stigen Projekten eine erhebliche informelle
festgelegte Formen der Personalfhrung, so da
Machtstellung erlangen, und zwar dann, wenn
dort keine besonderen Probleme zu erwarten
ihre Detailkenntnisse (zum Beispiel ber die
sind. Anders ist die Situation bei privaten
Datenorganisation) oder ihre persnlichen Be-
(Klein-)Instituten, die zwar einen erheblichen
ziehungen zu externen Stellen (zum Beispiel bei
Arbeitsmarkt bieten (es gibt in der Bundesrepu-
der Organisation einer Untersuchung mit zahl-
blik Deutschland einige hundert angewandt-
reichen Kontaktpartnern aus wichtigen Klini-
forschende, sozialwissenschaftliche Institute),
ken) entweder aus Zeit- oder Kostengrnden
aber bezglich der Personalfhrung schon we-
nicht mehr von anderen bernommen werden
gen des grenbedingten Fehlens entsprechen-
knnen (vor allem nicht im Konfliktfall).
der Spezialisten (kein Institut mit vielleicht 5
Noch schwieriger als fachlich-wissenschaft-
bis 10 Mitarbeitern kann sich einen eigenen
lich gut ausgebildete Mitarbeiter sind Bewerber
Personalfachmann leisten) auf diesem Gebiet
zu finden, die darber hinaus auch Projekt-Ma-
nicht das professionelle Niveau grerer Insti-
nagementaufgaben (Abstimmung und Kontrolle
tutionen erreichen. Gleichzeitig sind bei klei-
der Teilarbeiten, Kontakte mit dem Auftrag-
nen Instituten die Folgen von Fehlern beson-
geber und den anderen kooperierenden Stellen,
ders gravierend, da Ausflle kaum durch andere
flexible Anpassung der Projektarbeit an gen-
Mitarbeiter abgedeckt werden knnen.
derte Situationen) eigenstndig bernehmen
knnen. Dies gilt ganz besonders zu den Kon-
Aus der Sicht des Arbeitgebers lassen sich die
ditionen befristeter Projektstellen und der oft
strendsten Punkte wie folgt beschreiben:
an die Vergtung im ffentlichen Dienst ange-
Es besteht ein auerordentlicher Mangel an glichenen Bezahlung. Eine Einschulung auch
fachlich qualifiziertem Personal, das zum begabter Nachwuchskrfte fr solche Aufgaben
Zeitpunkt der bernahme eines neuen Pro- ist kurzfristig schwierig, so rechnet man etwa
jektes auch tatschlich zur Verfgung steht. in der Marktforschung hufig mit etwa zwei
Der Arbeitsmarkt fr solche Spezialisten ist Berufsjahren, bis vom Mitarbeiter selbstndig
relativ klein, ein Abwerben von anderen auch die Kontakte nach auen bernommen
Instituten whrend dort laufender Projekte werden knnen. Aus der Sicht der Bewerber
problematisch, und arbeitslose berufserfah- mag diese Zeitvorstellung bertrieben vorsich-
rene Krfte sind selten (umgekehrt kann es tig erscheinen; man mu aber auch sehen, da
wegen dem kleinen Stellenmarkt aber durch- der Vorgesetzte bzw. Institutsinhaber bei einer
aus sein, da auch gute Spezialisten einige Verrgerung eines wichtigen Auftraggebers
Zeit brauchen, um eine neue Stelle zu fin- ein erhebliches Risiko eingeht, das bei kleine-
den). ren Instituten auch die eigene wirtschaftliche
Durchfhrung von Evaluationsstudien 147
Existenz gefhrden kann. Es mag aber auch un- tigung ber das Projekt hinaus unwahr-
sachliche Grnde fr diese Skepsis geben; so scheinlich es sei denn, man ist so gut, da
wertet die Betonung der besonderen Schwierig- es aufgrund der eigenen Projekt-(Akquisi-
keit des Projekt-Managements die Leistung der tion-) Fhigkeit zu einer erheblichen Umsatz-
erfahrenen Krfte gegenber den Anfngern erweiterung kommt.
auf, was in Anbetracht der eher zunehmenden Es gibt wenig Untersttzung durch den Ar-
fachlich-wissenschaftlichen Kompetenz der beitgeber im Hinblick auf Weiterbildungs-
Universittsabsolventen die erheblichen Ein- mglichkeiten, die nicht unmittelbar fr das
kommensunterschiede zwischen diesen beiden konkrete Projekt relevante Kompetenzsteige-
Gruppen subjektiv rechtfertigt. Ob sachlich voll rungen erbringen.
berechtigt oder bertrieben, in jedem Fall mu
man mit dem Bestehen dieser Leistungs-
einschtzung durch potentielle Arbeitgeber Positive Aspekte
rechnen und bei der eigenen Stellensuche und
Bei diesen Aufstellungen wurden jeweils nur die
Karriereplanung beachten.
Negativaspekte betont. Es gibt auch erhebliche
Pltzliche Kndigungen der Projektmitarbei-
positive Anreize durch die Art der Aufgaben-
ter knnen die gesamte Zeitplanung und auch
stellung, zum Beispiel
den Kostenrahmen (durch die dann erforderli-
chen Einschulungsmanahmen) sprengen; ver- Hohe Identifikationsmglichkeit mit der ei-
tragliche Vereinbarungen sind dagegen nur be- genen Arbeit als Folge eines berschaubaren
dingt wirksam, da ein an seiner Arbeitsstelle Projektes mit erkennbarer eigener Teillei-
nicht mehr ttig sein wollender Mitarbeiter zu stung;
einer massiven Strquelle des gesamten Projek- Vor allem fr Anfnger oft Ttigkeitsanfor-
tes werden kann. derungen, die deutlich ber den bei Studien-
abschlu erreichten Fachkompetenzen lie-
gen und entsprechend fordern;
Organisationsaufgaben Die oft hohe Identifikation aller Beteiligten
mit den Projektaufgaben und das Wissen,
Aus der Sicht der Projektmitarbeiter ist die Ar-
nur bei gemeinsamer Anstrengung wirk-
beitssituation an kleinen Instituten oft proble-
lichen Erfolg erreichen zu knnen, fhren
matisch:
unter gnstigen Voraussetzungen (soziale
Der Arbeitsplatz wird als unsicher empfun- Kompetenz der Beteiligten, Fhrungsstil) zu
den, vor allem bei befristeten Arbeitsvertr- einem sehr angenehmen Betriebsklima in-
gen; Stellenangebote von auen auch wh- nerhalb des Teams.
rend laufender Projekte erscheinen daher Bei guter persnlicher Kompetenz nicht ge-
besonders attraktiv; ringe Chancen, allmhlich immer selbstn-
Die Beschftigungsdauer sowie die hufige digere Bereiche zugewiesen zu bekommen
Beschrnkung der Arbeit auf typische Spe- und schlielich selbst Leistungsaufgaben zu
zialistenttigkeit beschrnken die Chance zur bernehmen; diese Chance wird aber mei-
persnlichen Weiterqualifikation und redu- stens nicht vom Vorgesetzten an den Mitar-
zieren die Mglichkeiten der Befriedigung beiter herangetragen, sondern mu von die-
von Gestaltungsbedrfnissen; sem (manchmal mhsam) erarbeitet werden
Es gibt wenig bzw. keine Aufstiegsmglich-
keiten innerhalb des Projektes und spter (ge- Fr die Personalfhrung selbst werden spezielle
nerell bei kleineren Instituten). Bei Projekten Instrumente wie sie etwa fr Grounterneh-
an Universitten oder vergleichbaren Ein- men entwickelt wurden (siehe dazu etwa Gabele
richtungen kann die Projektstelle ein guter und Oechsler, 1984; Zander, 1982; Stroebe und
Einstieg in ein lngerfristig angelegtes Be- Stroebe, 1984) kaum relevant werden, da der
schftigungsverhltnis sein, ebenso bei gr- unmittelbare persnliche Kontakt formalisierte
eren privaten Firmen. Hat aber das beschf- Instrumente (zum Beispiel schriftliche Personal-
tigende private Institut nur zwei oder drei beurteilungen) ersetzt. Man sollte sich aber
Akademiker als Mitarbeiter, ist eine Beschf- wechselseitig bemhen, die berechtigten Be-
148 Durchfhrung von Evaluationsstudien

drfnisse des Partners zu erkennen, auch emo- des jeweiligen Projektbudgets, also ohne Be-
tional zu akzeptieren und bei der Durchsetzung rcksichtigung der zugeschlsselten Gemeinko-
der eigenen Ziele so weit wie mglich zu be- sten, gar nicht so seltene Fehler sind:
rcksichtigen. Die besonderen Arbeitsbedin-
gungen an kleinen privaten Instituten sollte
Keine Bercksichtigung der Lohnneben-
kosten (vgl. Kapitel V, Einleitung)
man bei der persnlichen Stellensuche stark
beachten. Viele Absolventen, die in einer stark
Kalkulation der Projektarbeiten auf der Basis
eines 52-Wochen-Jahres; im Durchschnitt ist
formell gegliederten groen Organisation sich
wegen Urlaubs- und anderen Ausfallzeiten
zu sehr eingeschrnkt und zu wenig in ihrer
der deutsche Arbeitnehmer nur 43 Wochen
Individualitt beachtet fhlen, knnen bei sol-
im Jahr produktiv ttig; werden etwa Ur-
chen kleinen Arbeitgebern mehr Entfaltungs-
laubszeiten bei der Planung nicht beachtet,
mglichkeiten finden. Wer Sicherheit, starke
kann dies zu einem ganz erheblichen Kosten-
Arbeitsteilung oder hierarchischen Aufstieg
faktor (Ablsung des Urlaubsanspruches
sucht, fhlt sich vermutlich in groen Institu-
bzw., sofern berhaupt mglich, die Bezah-
tionen wohler.
lung von Ersatzkrften) werden;
Keine Reserven fr die berbrckung von
Ausfllen (vorzeitige Kndigungen, Mutter-
6.1.2 Kontrolltechniken des
schaftsurlaub, lngere Erkrankungen);
Projektverlaufes und des
Keine rechtzeitige Einplanung von (inflati-
Konfliktmanagements onsbedingten) Lohn- und Preissteigerungen.;
Grere Evaluationsprojekte mit lngerer Lauf-
Besondere Probleme knnen auftreten, wenn
zeit knnen auch von genialen Projektleitern
mit dem Auftraggeber kein Festpreis, sondern
nicht ohne eine regelmige Rckmeldung
zumindest in Teilen der Ersatz der tatschlichen
ber die Einhaltung von
Aufwendungen verabredet wurde. Dies kann
Zeitplanung zum Beispiel dann erforderlich sein, wenn sich
Kostenrahmen die Kosten mancher Arbeitsschritte in der
Vereinbarte Qualittsstandards Planungsphase nicht realistisch abschtzen las-
sen oder wesentlich von dem spteren Verhal-
durchgefhrt werden.
ten des Auftraggebers selbst abhngen. Beispiele
sind etwa die teilweise mhevollen und mit
Relativ einfach ist dies bzgl. des Zeitablaufes,
Dienstfahrten verbundenen Einholungen von
wenn bei der Projektplanung ein detaillierter
Zustimmungen von Eltern, Lehrern und Sch-
Zeitplan (vgl. Diagramm V/6) erarbeitet wurde. In
lern bei Schuluntersuchungen, oder die u.U.
diesem Fall mu man nur sicherstellen, da die
langwierigen Kommunikationsprozesse zwi-
einzelnen Teilschritte nicht ber Gebhr ber-
schen der technischen Entwicklungsabteilung
zogen und dadurch die Pufferzeiten zu frh auf-
und den Projektmitarbeitern bzgl. der Erarbei-
gebraucht werden. Ein wenig schwieriger ist es
tung einer neuen Produktvariante auf der Basis
fr den nur-sozialwissenschaftlich ausgebil-
vorlufiger Projektergebnisse im Falle einer for-
deten Projektleiter, sich auch ein sachgerechtes
mativen Produktevaluation. In solchen Fllen
Bild ber die tatschlich entstandenen Kosten
mssen die Bestimmungen des Auftraggebers
zu erarbeiten. Zwar wird es im Regelfall nicht
(zum Beispiel Hchstbetrge fr bernach-
notwendig sein, umfangreiche formalisierte
tungs- und Verpflegungsspesen, Kilometergeld,
Kontrolltechniken wie bei Wirtschaftsprojekten
anzurechnendes Stundenhonorar) zustzlich zu
blich (vgl. dazu Ziegenbein, 1984; Bramse-
der eigenen Kalkulation beachtet werden.
mann, 1978; Whe, 1982) einzusetzen, aber
eine regelmige (evtl. wchentliche) Gegen-
berstellung der bis zum jeweiligen Arbeits- Die laufende Kontrolle der dem Auftraggeber
schritt geplanten Ausgaben, der durch Vertrge zugesicherten Qualittsstandards kann in for-
eingegangenen Zahlungsverpflichtungen und malisierter Form nur fr die eher quantitativen
den bereits tatschlich verausgabten Betrgen Teile der Projektarbeit (Rcklauf von Frageb-
sollte selbstverstndlich sein. Selbst innerhalb gen, Verweigerungsraten von mndlichen In-
Durchfhrung von Evaluationsstudien 149
terviews, Ausflle durch fehlende Zustimmung 48-Stunden-Dauerschlafes; eine andere Institu-
von zum Beispiel Schulen und Kliniken) durch- tion hat die Kooperation mit einem Institut ein-
gefhrt werden. Hinweise auf entsprechende gestellt, nachdem alle an einem Experiment zur
Verfahren gibt etwa der Bundesminister fr For- Optimierung von Beipack-Zetteln beteiligten
schung und Technologie, 1977. Die Sicherung weibliche Versuchspersonen am nchsten Tag
der eher qualitativen Anforderung wie Erfolg wegen belkeit arbeitsunfhig waren, obwohl
der Interviewerschulung, Informationsaus- die verschiedenen Beipack-Varianten aus-
schpfung, sicherstellende Kodierung offener schlielich mit einem Placebo kombiniert ge-
Antworten oder umfassend aussagekrftige geben wurden und damit tatschliche Medi-
Datenauswertung bleibt whrend der Projekt- kamentenfolgen ausgeschlossen waren.
arbeit meist dem subjektiven Eindruck des
Leiters, der auf der Basis seiner persnlichen Nicht-vorhersehbare Reaktanz; so mute etwa die
Erfahrung das laufende mit erfolgreich abge- empirische Evaluation eines Studienganges ei-
schlossenen Projekten vergleichen kann, ber- ner Hochschule abgebrochen werden, weil sich
lassen. die Studenten des Fachbereiches geschlossen
weigerten, als Interviewpartner zur Verfgung
Eine bersicht ber einige Kontrolltechniken zu stehen. Die Ursache war, da der Unter-
findet sich im Diagramm V/3 (vgl. Abschnitt suchungsleiter als Finanzier des Evaluations-
5.1.3). projektes das zustndige Landes-Wissenschafts-
ministerium (fr die Studenten damals ein
Feindbild) und nicht, wie es auch faktisch rich-
6.1.3 Unerwartete Strflle tig gewesen wre, die Hochschule selbst als Auf-
traggeber genannt hatte.
Prinzipiell mu man davon ausgehen, da na-
hezu jede denkbare Katastrophe im Verlaufe ei- berlappung des Untersuchungsdesigns mit ande-
nes lngerfristigen Evaluationsprojektes auch ren Zielsetzungen; so fanden sich in einer auf
tatschlich eintreten kann. Typische Beispiele: zwei Jahre geplanten Evaluation verschiedener
Formen von Arbeitsgestaltung am Ende der Pro-
nderung der Zielsetzung des Projektes; Ursachen jektphase nur noch zwei Personen in der Be-
dafr kann ein anderer Verwertungszusammen- dingungskombination, in der sie aufgrund der
hang sein (vgl. dazu etwa die Szenario-Technik, Untersuchungsplanung htten sein sollen, die
Diagramm IV/3), ein Personalwechsel beim Auf- brigen waren entweder auf eigenen Wunsch
traggeber mit entsprechend unterschiedlicher (Schichtwechsel, bevorzugte Zusammenarbeit
Schwerpunktsetzung (als konkretes Beispiel: mit bestimmten Kollegen, vielleicht auch Ab-
Pltzliche Aufgabe des vorher als unverzichtbar lehnung der zufllig zugeteilten Arbeitsform)
bezeichneten Grundsatzes, alle Unternehmens- oder aufgrund von gem Erfordernissen der
teile als Einheit im Hinblick auf die cooperate Arbeitsorganisation erfolgten nderungen
identity aufzufassen und die PR-Manahmen nicht mehr in der entsprechenden Design-
auf dieser Grundlage zu optimieren) oder Ent- Zelle.
fallen der eigentlichen Untersuchungsgrund-
lage (etwa bei der formativen Evaluation einer Das Auftreten inakzeptabler Methodenartefakte; so
Werbekonzeption, wenn von der Konkurrenz wurden in einer Studie zu verschiedenen Mg-
ein in jeder Hinsicht berlegenes Produkt ber- lichkeiten der Wohnungsgestaltung auch un-
raschend auf den Markt gebracht wird). tersucht, wie hoch die vermutliche Verweil-
dauer in den einzelnen Wohnungsformen fr
Pltzliches Auftreten nicht bekannter oder zu- Personen mit verschiedenem Alter, Lebenslauf-
mindest vom Auftraggeber verschwiegener zyklus und dgl. sein wrde; als Folge des ver-
Nebenwirkungen; als ausschlielich der Praxis wendeten multipel-linearen Regressionsan-
entnommene Beispiele: Versumen einer satzes ergab sich fr alle Personen mit einem
Staatsprfung einer studentischen Versuchsper- Einzugsalter von ber 55 eine negative progno-
son bei der Erprobung der therapeutischen Wir- stizierte Verweildauer, was infolge des Fehlens
kung eines Psychopharmakons als Folge eines rechtzeitiger Qualittskontrollen erst sehr
150 Durchfhrung von Evaluationsstudien

knapp vor dem endgltigen Abgabetermin des 6.2 Auswertungsarbeiten


Schluberichtes erkannt wurde.
Gegenber den aus dem Studium vertrauten Se-
Auch absolut Unvorhersehbares passiert. So wur- minar- bzw. Diplomarbeiten haben grere
den etwa Teile der Daten einer Schulsystem- Evaluationsprojekte den Nachteil, da sehr viele
evaluation durch einen Brand vernichtet (Aurin, Detailarbeiten nicht vom Untersuchten selbst
1986). In einem anderen Projekt verweigerte ein durchgefhrt oder auch nur annhernd ausrei-
befristet Beschftigter (und aus anderen Grn- chend supervisiert werden knnen. Es sind da-
den in eine Konfliktkonstellation gedrngter) her fr solche Ttigkeiten Kontrollen erforder-
Mitarbeiter die Herausgabe der von ihm erhobe- lich, die gleichzeitig auch eine weitere
nen Patienteninterviews innerhalb einer The- Motivationshilfe fr sorgfltiges Arbeiten sein
rapieevaluation mit der Begrndung, er sehe den knnen (6.2.1). Fr viele, gerade vom Inhalt
Vertraulichkeitsschutz der Patientenangaben her besonders interessante Evaluationsprojekte
durch ungengende Anonymisierung gefhrdet, stellt sich auch in besonderem Mae die Frage
was zu erheblichen Zeitverzgerungen bei der der Vertraulichkeit, und zwar sowohl im Hin-
Projektdurchfhrung fhrte. blick auf die Interessen der befragten bzw. be-
obachteten Probanden als auch des jeweiligen
Unerklrliches; so mute etwa bei einer Ver- Auftraggebers. Hierbei sind neben einer an sich
gleichsuntersuchung ber die kognitive Lei- selbstverstndlichen professionellen Ethik auch
stungsfhigkeit der Studenten verschiedener die Rechtsbestimmungen zu beachten (6.2.2).
Universitten ein bestimmter Teilbereich bei Prinzipiell nicht lsbar ist das Problem, da
der Auswertung unbercksichtigt bleiben, da durch die spezifizierte Festlegung der Aus-
die Studenten einer groen sddeutschen Uni- wertungsplne immer nur ein Teil der denkba-
versitt gerade in diesem Bereich so extrem ren Vielfalt an Ergebnissen erarbeitet werden
schlechte Werte zeigten, da diese Ergebnisse kann, was zumindest bei emotional heftig ab-
ganz einfach nicht stimmen konnten; die Ursa- gelehnten Ergebnissen leicht zum Vorwurf be-
chenforschung (u. a. Fehlverhalten des Ver- wuter Manipulation fhren kann (6.2.3.).
suchsleiters, bewute Sabotage der Untersu-
chung durch Studenten etc.) erbrachte keine
akzeptable Erklrung; 6.2.1 Kontrolle der Datenqualitt

Keines der hier genannten Beispiele ist erfun- Fehler knnen sich in jeder Phase der Projekt-
den, sofern kein Literaturzitat angegeben ist, arbeit mit Daten einschleichen:
kommen sie aus der persnlichen Projektarbeit
Bei der Erhebung: zum Beispiel Probleme mit
der Verfasser oder wurden von absolut zuver- Interviewern bei mndlicher Befragung oder
lssigen Kollegen mndlich berichtet. Man hohe systematische Antwortverweigerungen
sieht daran vielleicht die Vielfltigkeit der auf- bei schriftlichen (postalischen) Erhebungen
tretenden Strungen, vielleicht auch einige
Bei der Datenaufbereitung: Kodierfehler, fal-
Strategien zu ihrer Begrenzung. Das Problem sche EDV-Eingabe
ist, da die Kombination aller denkbaren
Bei der Auswertung: Verwechseln von
Verhinderungsmanahmen fr Strflle jede Variablennummern oder Codes, falsche
Untersuchung wesentlich verteuern und u.U. (Sub-) Dateien
so aufwendig machen wrde, da sie nicht
mehr in Auftrag gegeben werden knnte. Man Eine vllige Sicherheit gegen alle solche
wird Katastrophen nie voll ausschlieen kn- projektbedingten Fehler kann nicht garantiert
nen, was es um so wichtiger macht, mit dem werden, vieles lt sich aber durch organisato-
Auftraggeber ein mglichst positives Verhltnis rische Manahmen erreichen.
herzustellen. Korrektes, entgegenkommendes
und auch gegenber Verhaltensweisen des Auf- Datenerhebung durch Interview
traggebers fehlerfreundliches Verhalten kann
viel dazu beitragen, im Notfall dessen Verstnd- Interviewer sollten Arbeitsbedingungen erhal-
nis fr unvorhergesehene Strungen zu finden. ten, die eine ehrliche Datenerhebung nahele-
Durchfhrung von Evaluationsstudien 151
gen und Verflschungen zumindest nicht pro- die Testung bzw. Befragung der Schler ein-
vozieren. Neben einer als zu niedrig empfunde- gesetzten Studenten in den von ihnen sub-
nen Bezahlung knnen sich vor allem folgende jektiv bevorzugten Schulformen gezielt Hin-
Bedingungen negativ auswirken: weise fr das optimale Ausfllen gegeben
haben sollen).
Bezahlung der Interviewer nach erfolgreich
durchgefhrtem Interview ohne faires Ent- Neben der Vermeidung solcher organisatori-
gelt fr erfolglose Besuche (Proband nicht scher Mngel (wobei man auch die Position
angetroffen, Antwort verweigert) sparsamer Projektleiter sehen mu: hufig
Keine Vorgabe von Namen und Adressen von werden Projekte auf der Basis von Ausschrei-
zu befragenden Personen (da dann der Inter- bungen vergeben, was zu knapper Kalkulation
viewer wei, da kein nachtrgliches Kon- zwingt!) sollte man sich um eine gute
trollieren des Stattfindens des Interviews Interviewerschulung bemhen, die meist von
mglich ist); sofern sich dies nicht vermei- den Projektmitarbeitern selbst zu gestalten ist.
den lt, ist eine Lsungsmglichkeit das Diese sollte die Problematik geflschter Daten
nachtrgliche Notieren dieser Daten (aus im Hinblick auf die Aussagekraft des gesamten
Vertraulichkeitsgrnden unabhngig vom ei- Ergebnisses deutlich machen und versuchen,
gentlichen Interviewbogen), dies stt aber bei den Interviewern auch intrinsische Motiva-
hufig auf erhebliche Reaktanz bei den Be- tion und Identifikation mit dem Gesamtprojekt
fragten (man kann zum Beispiel kaum je- zu erreichen. Auch sollte man die Interviewer
mand auf der Strae ansprechen und ihn auf die Durchfhrung von Kontrollen hinwei-
ber seine Meinung etwa zu einer politisch sen.
relevanten Manahme fragen, ihm Anony- Ein auch bei massiver Schulung nicht vllig
mitt zusichern, und anschlieend Name ausschliebares Problem sind Interviewerein-
und Adresse aufschreiben). flsse (fr die dadurch ausgelsten Effekte vgl.
Quotenvorgaben; wenn der Interviewer je- etwa Knig, 1972; Roth, 1984, S. 150 ff.). Wenn
weils bestimmte Prozentstze von zum Bei- es die Gre des Projektes zult, kann man
spiel Geschlecht, Alter und Berufsgruppe durch ein bewute Streuung der Interviewer-
befragen mu, kann leicht die Situation ent- merkmale einen Ausgleich der einzelnen Str-
stehen, da er gegen Ende seiner Daten- effekte anstreben, jedenfalls ist es ungnstig,
sammlung verzweifelt einen 20jhrigen einen einzelnen Interviewer zu groe Fall-
mnnlichen Altersrentner bentigt. Findet er zahlen zuzuordnen (in der Praxis relativ be-
einen solchen nicht, mu er entweder auf whrt haben sich etwa 10, bei greren Studi-
einen Teil der bereits durchgefhrten Inter- en ausnahmsweise auch 15 Interviews als
views verzichten (die er dann auch nicht ab- Hchstgrenze). Daraus ergeben sich natrlich
rechnen kann) oder einen Lsungsweg wh- erhhte Aufwendungen fr Interviewer- Suche
len, den man nicht mehr als empirische und Schulung, die man aber in Kauf nehmen
Datenerhebung bezeichnen kann. sollte.
Unbefriedigende Arbeitskonditionen, fehler-
behaftete Adressenvorgabe (ein hoher Anteil
von nicht auffindbaren Personen), schlecht Interviewerkontrolle
aufgebaute Fragebgen (zum Beispiel mit vie-
len Verweigerungen aufgrund unverstnd- Besonders aussagekrftig sind nachfassende
lich formulierter oder in der Reihenfolge un- Kontrollen bei den Probanden. Dies sollte nicht
gnstig positionierter Fragen) oder fehlender unbedingt als Kontrollanruf erkennbar sein,
Spesenersatz fr erfolglose Fahrten. gnstiger ist ein Anruf bei einer (angeblich) be-
Massive Interviewer- bzw. Untersuchungs- fragten Person mit der Bitte um Aufklrung ei-
leitereffekte sind zu erwarten, wenn sich die- nes Details oder einer Beurteilung des
ser Personenkreis mit bestimmten Evalua- Interviewerverhaltens. Ein solches Vorgehen ist
tionsergebnissen identifiziert (ein Beispiel natrlich nur bei Interviews mit bekannten Pro-
dafr sind etwa die Gerchte, da bei man- banden, etwa bei vorgegebenen Adressen aus
chen Schulvergleichsuntersuchungen die fr einer Stichprobe, mglich.
152 Durchfhrung von Evaluationsstudien

Eine zumindest heuristisch wertvolle Hilfe Einige Lsungsmglichkeiten:


kann auch die Datenanalyse der abgegebenen
Interviews sein. Neben Plausibilittskontrol-
Die angeschriebenen Personen werden gebe-
ten, bei absoluter Zusicherung der Anonymi-
len (siehe weiter unten) kann auch die Pr-
tt der Auswertung den Absender auf dem
fung der Homogenitt (erfat durch die
Couvert (nicht auf dem Fragebogen) zu ver-
Varianz) der von einem Interviewer geliefer-
merken.
ten Daten im Vergleich zur Gesamtstichprobe
(bzw. nach strukturellen Merkmalen hnli-
Bei schriftlichen Befragungen in Organisatio-
nen wie zum Beispiel Unternehmen werden
chen Datenstzen) interessante Hinweise ge-
auf den Fragebgen gerne vor dem Austeilen
ben. Ist die Datenvarianz deutlich geringer,
Code-Nummern vermerkt, die eine Identifi-
liegt zumindest den Verdacht nahe, da der
kation der jeweiligen Abteilung ermglichen;
Interviewer relativ hufig seine eigene Vor-
selbstverstndlich mu dies offiziell gesche-
meinung (unmittelbar oder durch Interview-
hen und mit dem Betriebsrat geklrt sein!
einflsse) in die Ergebnisse hat einflieen las-
sen oder entgegen den blichen Anweisungen
Bei manchen schriftlichen Befragungen fin-
det sich auf dem Rckantwortcouvert eine
bevorzugt seinen engeren Bekanntenkreis be-
Adresse, die eine Projektnummer enthlt;
fragt hat, was ebenfalls leicht zu relativ homo-
diese Projektnummer ist individuell fr jede
genen Antworten fhrt. Solche Befunde sind
befragte Person (ein entsprechender Aus-
aber selbstverstndlich nur Hinweise, die
druck, zum Beispiel auf Klebeetiketten oder
nicht zu einem (mglicherweise ungerechtfer-
Endlos-Couverts ist EDV-mig unproblema-
tigten) Vorwurf fhren sollten, sondern viel-
tisch) und ermglicht somit eine Identifika-
leicht zu einer gezielten Nachfrage.
tion der antwortenden Personen. Allerdings
ist ein solches Vorgehen rechtlich proble-
matisch. Auch frdert es nicht gerade das
Schriftliche Befragung
Vertrauen der Befragten in die Anonymitts-
garantie, wenn mehrfach mit der Begrn-
Bei der postalischen Befragung sind einige Str-
dung sie haben noch nicht geantwortet
effekte noch massiver als beim persnlichen
nachgefragt wird, ohne da den Betroffenen
Interview; so wei man etwa nie genau, wer
der Kontrollmechanismus fr die eingegan-
den Fragebogen tatschlich ausfllt, ob es sich
gene bzw. fehlende Antwort ersichtlich ist.
um eine Gruppenarbeit der ganzen Familie
Wertvolle Hinweise fr eine rechtlich saube-
handelt, und ob nicht einige Fragen miver-
re, allerdings manchmal auch umstndliche
stndlich formuliert waren. Aus dem letzteren
Regelung finden sich in Lecher, 1988.
Grund mu man bei der Fragebogenkonstruk-
tion besonders sorgfltig vorgehen.
Fehler bei der Datenaufbereitung
Das Hauptproblem der postalischen Befragung
ist sehr hufig die Rcklaufquote. Es gibt einige Codierarbeiten sind lstig, erfordern aber oft
Tricks, um schon durch die Gestaltung des Ma- eine erhebliche allgemeine Intelligenz, so da
terials diese zu erhhen (zum Beispiel das man neben speziell mit solchen Ttigkeiten be-
Antwortcouvert nicht freistempeln lassen, son- schftigen Bropersonal bei unregelmigem
dern mit einer Briefmarke versehen), doch wird Anfall von Arbeiten auf gutes Aushilfspersonal
man trotzdem hufig darauf angewiesen sein, zurckgreifen mu. Von Mitarbeitern, die nur
bei den nicht antwortenden Befragten nachzu- kurzfristig, ohne Kenntnis der Projektzusam-
fassen. Dies wird wesentlich dadurch erleich- menhnge und oft auch ohne soziale Bindun-
tert, wenn man am Posteingang erkennen gen an das Projektteam beschftigt werden,
kann, welche Personen aus der ursprnglichen kann man keine ausgeprgte intrinsische Moti-
Adressenliste geantwortet haben. Diese Identi- vation fr die Durchfhrung der (ohnedies
fikationsarbeit kann aber erhebliche Schwierig- meist sehr langweiligen) Codierarbeiten erwar-
keiten machen, wenn die Fragebgen aus Grn- ten. Leider ist oft eine erhebliche Fehlerquote
den der Anonymitt keine Namensangaben zu beobachten, vor allem bei (niedriger) Bezah-
tragen. lung pro durchgearbeitetem Fragebogen. Aus
Durchfhrung von Evaluationsstudien 153
diesem Grund mssen zur Fehlerkorrektur ter Antwortalternativen wie etwa immer eine
unbedingt Kontrollen erfolgen. Ideal, aber nur Extremkategorie oder die Unentschlossen-Mg-
selten finanzierbar sind Doppelarbeiten (das lichkeit).
gleiche Ausgangsmaterial wird von zwei Hilfs-
krften codiert, die Ergebnisse werden vergli- Solche Programme mit Plausibilittsberlegun-
chen). Eher realisierbar ist eine die Sorgfalt un- gen erkennen Interviewer- , Aufbereitungs- oder
tersttzende Entlohnung, insbesondere die Eingabefehler um so besser, je umfangreicher
Bezahlung nach Zeit anstatt nach Stck (wo- das entsprechende Programm gehalten wird.
raus ein gewisses Eigeninteresse entsteht, die Allerdings steigt gleichzeitig auch die Wahr-
Arbeit nicht allzu schnell zu erledigen) sowie scheinlichkeit, ohne Vorliegen eines Fehlers
Kontrollen mit einer entsprechenden (auch fi- auffllige Datenkombinationen auszuwerfen
nanziellen) Verrechnung gefundener Fehler. (schlielich kann es ja tatschlich den 23jhri-
Prinzipiell Gleiches gilt fr Dateneingabe- gen Promovierten geben, der Rentner als Be-
arbeiten an die EDV. Hier ist der Leistungsun- ruf angegeben hat, da seine Waisenrente die
terschied zwischen professionellen Mitarbeitern finanzielle Haupteinnahmequelle darstellt).
und Aushilfspersonal besonders gravierend (ge- Solche aufflligen Personen drfen daher
schulte Krfte haben etwa die doppelte Ge- nicht sofort ausgeschieden werden, sondern die
schwindigkeit von ungeschulten), auch die Ursache fr die auffallenden Kombinationen ist
Sorgfalt ist bei Spezialisten hher. ber den Vergleich der Dateneingabe mit den
Die frher vor allem im kommerziellen Be- schriftlichen Unterlagen, die richtige Codie-
reich bliche Gewohnheit, zumindest alle rung der Unterlagen und schlielich im Ex-
wichtigen Daten ber einen Prflocher dop- tremfall durch Nachfrage zur Kontrolle des
pelt einzugeben, ist im Zusammenhang der un- Interviewverhaltens nachzuvollziehen. Da dies
mittelbaren Bildschirmeingabe zumindest bei sehr aufwendig ist, steht man vor dem Dilem-
sozialwissenschaftlichen Projekten deutlich zu- ma, da mit steigernder Sicherheit der Identifi-
rckgegangen. Ein leider nur partieller Ausweg kation von Inplausibilitten der Arbeitsauf-
sind die unten besprochenen Plausibilittskon- wand fr die Klrung der einzelnen Befunde
trollen an der EDV. ansteigt. Im allgemeinen wird man sich mit um
Leider werden die durch Codier- und Daten- so grberen Plausibilittskontrollen zufrieden
eingabefehler verursachten Verzerrungen der geben knnen, je sorgfltiger die Kontrolle der
Ergebnisse von akademisch gebildeten Anfn- einzelnen Arbeitsschritte vorher erfolgt ist.
gern meist unterschtzt.
Plausibilittskontrollen gehen heute nach Datenauswertung
den professionellen Standards jeder Datenana-
lyse voraus. Das Grundprinzip ist, da man sich Die typischen Fehler hier (insbesondere Ver-
zunchst berlegt, welche Konfigurationen in wechslungen von Variablennummern, was be-
den Daten einzelner Personen auerordentlich sonders leicht geschehen kann, wenn verschie-
unwahrscheinlich sind. Meist nimmt man dazu dene Projektmitarbeiter Auftrge an die EDV
objektive Merkmale, wie Alter, Geschlecht, Art mit unterschiedlichen Variablen-Ordnungen
und Dauer der Ausbildung u. . Fr Evaluations- geben) treten seltener auf als bei der Datenein-
studien auerhalb des allgemeinen sozialwis- gabe, knnen dann aber um so gravierender
senschaftlichen Bereiches wichtig sind auch die sein. Neben sorgfltiger Arbeit wozu auch
Mglichkeiten, unplausible Testergebnisse zu gleich bezeichnete Unterlagen und das Wegs-
identifizieren (massive Abweichungen zwi- perren von Vorlagen mit nicht mehr gltiger
schen einzelnen Subtests der gleichen Person, Numerierung der Variablen gehrt ist die se-
hhere Beantwortungsraten fr schwierige mantische Plausibilittskontrolle zu empfeh-
als fr leichte Items) oder auf wahrscheinlich len. Jedem (wirklich jedem!) Widerspruch in
verflschendes Antwortverhalten zu schlieen den Ergebnissen ist nachzugehen, auch wenn
(Anlegen von Strickmustern auf den Ant- dies viel Zeit kostet und rckblickend unntig
wortblttern, in dem zum Beispiel immer in erscheint. So kann es ja wirklich sein, da es
der Reihenfolge der Antwortalternativen A, B, zwischen Teilgruppen extreme Varianzunter-
C, D etc. geantwortet wird; Auswahl bestimm- schiede gibt, die Einteilung nach der Kinder-
154 Durchfhrung von Evaluationsstudien

zahl die Zusammenhnge zwischen der Beur- Beispiel im ffentlichen Dienst knnen aus ei-
teilung von Sach- und Personalausstattung von ner irrtmlichen oder wegen seiner persnli-
Leitenden Angestellten vllig verndert (kon- chen Einschtzung zu grozgigen Geneh-
kret in einem Projekt passiert) oder gegenber migung von Vorhaben deutliche Nachteile
der Erwartung vllig entgegengesetzte empiri- entstehen, die Verhinderung von Projekten
sche Befunde auftreten. Trotzdem sollte man in bleibt fr ihn selbst meist vllig folgenlos. Bei
allen solchen und hnlichen Fllen die Aus- einer solchen Reinforcementstruktur fhren
wertung kontrollieren, ggf. von einem damit schon einfachste subjektive Nutzenberlegun-
noch nicht befaten Mitarbeiter unabhngig gen (ausfhrlicher bei Wottawa und Hossiep,
von den bisherigen Eingaben neu durchfhren 1987, S. 48ff.) zu einer Bevorzugung restrikti-
lassen. ver Auffassungen.
Ein besonderes Problem sind selbstgestrick-
te Programme fr die Auswertung. Zwar hat Bei Laien bestehen zum Teil erheblich Miver-
die weite Verfgbarkeit publizierter, ausgeteste- stndnisse bezglich des Begriffes Daten-
ter Programme die projektspezifische Program- schutz.
mierarbeit eingeschrnkt, doch ist auch die Pu- Wesentlicher Gesetzesinhalt des Bundesda-
blikation keine Garantie fr Fehlerfreiheit. Ein tenschutzgesetzes (BDSG) ist der Schutz des ein-
negatives Beispiel ist etwa bei Hrtner et al., zelnen vor den Gefahren der Verbreitung von
(1979) zu finden, der Programmfehler wurde Daten, die sich auf Personen beziehen. Dabei
erst wesentlich spter entdeckt (s. Baumert et bezieht es sich, ohne zwischen verschiedenen
al, 1988). Allerdings ist bei eigenen Program- Arten von Daten zu unterscheiden, auf alle per-
men die Fehlerchance im Regelfall besonders sonenbezogenen Daten und regelt die Daten-
hoch, weil weniger Zeit fr das Austesten (und verarbeitung von Behrden und Privatunter-
manche Fehler zeigen sich nur in seltenen Si- nehmen.
tuationen) verbleibt. In einem konkreten Fall Im ersten Abschnitt des Gesetzes werden Be-
(berprfung der Nebenwirkungen eines griffsbestimmungen, Zuverlssigkeitsvorausset-
Pharmakons unter Benutzung eines seltenen zungen fr die Datenverarbeitung und Rechte
statistischen Verfahrens) wurde ein Programm- der Betroffenen geregelt (16 BDSG).
fehler nur dadurch entdeckt, da die Sig- Der zweite Abschnitt befat sich mit Daten-
nifikanzen so massiv waren, da diese Un- verarbeitung durch ffentliche Verwaltungen
glaubwrdigkeit zu einem Nachrechnen von (721 BDSG). Als berwachungseinrichtung
Hand fhrte (es war bei Korrekturarbeiten im ist der Bundesbeauftragte fr den Datenschutz
Programm ein Statement mit einer Divisions- vorgesehen.
anweisung irrtmlich gelscht worden). Klei-
ne Ursachen knnen erhebliche Auswirkun- Fr die Datenverarbeitung im privaten Bereich,
gen haben! insbesondere im Verhltnis zwischen Arbeitge-
ber und Arbeitnehmer, gilt der dritte Abschnitt
(2230 BDSG), whrend der vierte Abschnitt
6.2.2 Datenschutz Sondervorschriften fr solche Unternehmen
enthlt, die Daten fr Dritte verarbeiten (31
Der gerade fr den EDV-Einsatz in Behrden 40 BDSG). Der fnfte und sechste Abschnitt
und anderen Verwaltungen potentiell beson- des Gesetzes enthalten die Regelungen von
ders gefhrdete Schutz der Privatsphre hat Sanktionen sowie bergangs- .und Schluvor-
eine massive ffentliche Diskussion verursacht, schriften (4147 BDSG). Einige fr die
die auch die Mglichkeiten in Forschungs- Evaluationsarbeit besonders wichtige Paragra-
projekten wesentlich beeinflut. Die Wahrung phen finden sich im Diagramm VI/1.
des Persnlichkeitsschutzes ist ein wichtiges
Anliegen, gerade auch in sozialwissenschaftli- Die Problematik Datenschutz drfte an sich
chen Evaluationsprojekten, sollte aber nicht zu fr die meisten Evaluationsprojekte keinerlei
einer sachlich nicht nachvollziehbaren Behin- Schwierigkeiten bereiten, da eine personenbe-
derung der Projektarbeit fhren, was leider ge- zogene Datenauswertung im Regelfall nicht er-
legentlich vorkommt. Fr einen Juristen zum forderlich ist.
Durchfhrung von Evaluationsstudien 155

Diagramm VI/1
Auszug aus dem Bundesdatenschutzgesetz (BDSG) (vgl. Kittner, 1987)

2: Begriffsbestimmung 2. der Betroffene eingewilligt hat. Die Einwilli-


gung bedarf der Schriftform, soweit nicht we-
(1) Im Sinne dieses Gesetzes sind personenbezo- gen besonderer Umstnde eine andere Form
gene Daten Einzelangaben ber persnliche oder angemessen ist, wird die Einwilligung zusam-
sachliche Verhltnisse einer bestimmten oder be- men mit anderen Erklrungen schriftlich er-
stimmbaren natrlichen Person (Betroffener). teilt, ist der Betroffene hierauf schriftlich be-
(2) Im Sinne dieses Gesetzes ist sonders hinzuweisen.
1. Speichern (Speicherung) das Erfassen, Aufneh-
men oder Aufbewahren von Daten auf einem
Datentrger zum Zweck ihrer weiteren Verwen- 10: Datenbermittlung innerhalb des ffent-
dung, lichen Bereichs
2. bermitteln (bermittlung) das Bekanntgeben
gespeicherter oder durch Datenverarbeitung (1) Die bermittlung personenbezogener Daten
unmittelbar gewonnener Daten an Dritte in der an Behrden und sonstige ffentliche Stellen ist
Weise, da die Daten durch die speichernde zulssig, wenn sie zur rechtmigen Erfllung der
Stelle weitergegeben oder zur Einsichtnahme, in der Zustndigkeit der bermittelnden Stelle
namentlich zum Abruf bereitgehalten werden, oder des Empfngers liegenden Aufgaben erfor-
3. Verndern (Vernderung) das inhaltliche Um- derlich ist. Unterliegen die personenbezogenen
gestalten gespeicherter Daten, Daten einem Berufs- oder besonderem Amtsge-
4. Lschen (Lschung) das Unkenntlichmachen heimnis (45 Satz 2 Nr.1, Satz 3) und sind Sie der
gespeicherter Daten, ungeachtet der dabei ab- bermittelnden Stelle von der zur Verschwiegen-
gewendeten Verfahren. heit verpflichteten Person in Ausbung ihrer Be-
rufs- oder Amtspflicht bermittelt worden, ist fr
(3) Im Sinne dieses Gesetzes ist die Zulssigkeit der bermittlung ferner erforder-
1. speichernde Stellen jede der in 1 Abs. 2 Satz 1 lich, da der Empfnger die Daten zur Erfllung
genannten Personen oder Stellen, die Daten fr des gleichen Zweckes bentigt, zu dem Sie die
sich selbst speichert oder durch andere spei- bermittelnde Stelle erhalten hat.
chern lt,
2. Dritter jede Person oder Stelle auerhalb der
speichernden Stelle, ausgenommen der Betrof- 36: Verarbeitung personenbezogener Daten
fene oder diejenige Personen und Stellen, die zum Zweck der bermittlung in anonymisierter
in den Fllen der Nummer 1 im Geltungsbe- Form
reich dieses Gesetzes im Auftrag ttig werden,
3. eine Datei eine gleichartig aufgebaute Samm- (1) Die in 31 Abs. 1 Satz 1 Nr. 2 genannten Per-
lung von Daten, die nach bestimmten Merk- sonen, Gesellschaften und andere Personen-
malen erfat und geordnet, nach anderen vereinigungen sind verpflichtet, die gespeicher-
bestimmten Merkmalen umgeordnet und aus- ten personenbezogenen Daten zu anonymisieren.
gewertet werden kann, ungeachtet der dabei Die Merkmale, mit deren Hilfe bestimmte ano-
angewendeten Verfahren. Nicht hierzu geh- nymisierte Daten derart verndern verndert wer-
ren Akten und Aktensammlungen, es sei denn, den knnen, da Sie sich auf eine bestimmte Per-
da Sie durch automatisierte Verfahren umge- son beziehen oder eine solche erkennen lassen,
ordnet und ausgewertet werden knnen. sind gesondert zu speichern. Diese Merkmale dr-
fen mit den anonymisierten Daten nicht zusam-
mengefhrt werden, es sei denn, da die dadurch
3: Zulssigkeit der Datenverarbeitung ermglichte Nutzung der Daten noch fr die Er-
fllung des Zweckes der Speicherung oder zu wis-
Die Verarbeitung personenbezogener Daten, die senschaftlichen Zwecken erforderlich ist.
von diesem Gesetz geschtzt werden, ist in jeder
in 1 Abs. 1 genannten Phasen zulssig, wenn (2)
1. dieses Gesetz oder eine andere Rechtsvorschrift (3) Bei automatischer Datenverarbeitung ist die
Sie erlaubt oder Durchfhrung der in Absatz 1 vorgesehenen
Manahmen durch entsprechende Vorkehrungen
sicherzustellen.
156 Durchfhrung von Evaluationsstudien

Die European Science Foundation hat bestimmte wandfreieste Methode in der Einholung der Zu-
Grundstze und Richtlinien fr die Verwen- stimmung der Befragten, doch kann diese in
dung personenbezogener Daten zu Forschungs- Folge von Befrchtungen der Probanden die
zwecken herausgegeben. Einige Hauptpunkte Verweigerungsraten deutlich erhhen.
sollen an dieser Stelle extrakthaft wiedergege-
ben werden (nhere Erluterungen bei Lecher,
1988, S. 28 ff.): Schutz der Privatsphre
Jede Verarbeitung personenbezogener Daten Im Gegensatz zu den Datenschutzbestimmun-
fr Forschungsziele setzt eine ausdrcklich
gen im engeren, gesetzlichen Sinn kann der
gesetzliche Ermchtigung oder die informier-
Schutz der Intimsphre sowie das Problem des
te Einwilligung des Betroffenen voraus.
Geheimnisverrates in Evaluationsstudien
sehr relevant werden. Wie man an der Darstel-
Eine informierte Einwilligung liegt vor, wenn lung einiger wichtiger Rahmenbedingungen in
die Betroffenen ausdrcklich und eindeutig Diagramm VI/2 entnehmen kann, ist die Situa-
darber aufgeklrt worden sind: tion fr Berufspsychologen mit abgeschlossener
a) da die Datenerhebung freiwillig ist; Ausbildung und andere Sozialwissenschaftler
b) da die Weigerung der Datenerhebung kei- verschieden. Dies kann zu der etwas paradoxen
nerlei Konsequenzen hat Situation fhren, da ein als Interviewer einge-
c) welchen Zweck das Forschungsprojekt ver- setzter Sozialwissenschaftler dann unter 203
folgt; StGB fllt, wenn der Leiter des Evaluations-
d) wer Auftraggeber der Erhebung ist bzw. projektes ein Diplom-Psychologe ist, diese zu-
wer erhebt; stzliche Strafbewhrung des Schutzes der In-
timsphre aber nicht besteht, wenn der
Die fr Forschungszwecke zur Verfgung ge- Projektleiter eine andere Vorbildung hat. Dies
stellten personenbezogenen Daten sollten entspricht in keiner Weise der Intention des
nicht fr andere Zwecke verarbeitet werden, Gesetzes, mit diesem Paragraphen sollte an sich
insbesondere nicht fr solche, die spter fr die Arbeit der genannten Berufsgruppen er-
den Betroffenen Konsequenzen haben. leichtert werden, da es zum Beispiel im Rah-
men psychologischer Therapien sicher leichter
Die Leiter von Forschungsprojekten, die mit fllt, eine offene Gesprchsatmosphre zu er-
der Verarbeitung personenbezogener Daten zeugen, wenn der Klient zustzlich zum per-
verbunden sind, sollten die Verantwortung snlichen Vertrauen auch noch auf eine recht-
dafr tragen, da die gemachten Angaben liche Absicherung der Vertraulichkeit der
den aktuellen Datenschutz-Vorschriften Gesprchsinhalte bauen kann.
auch dem momentan herrschenden Technik-
stand entsprechen.
Datenschutz auch bei nderung der
Es darf aber nicht bersehen werden, da Rahmenbedingungen!
es auch datenrechtlich problematische For-
schungsstrategien gibt. In der Psychologie gibt Die Vertraulichkeit von Informationen ist auch
es Projekte, bei denen eine volle Aufklrung der ohne bse Absicht besonders dann gefhrdet,
Beteiligten erst nach ihrem Abschlu erfolgen wenn die befragte bzw. beobachtete Person und
kann. In solchen Fllen mu diese Bedingung, der Projektmitarbeiter untereinander verbunde-
in Verbindung mit dem Angebot des jederzeit nen Sozialnetzen angehren (zum Beispiel Be-
mglichen Rcktritts, den Betroffenen ausdrck- fragung von Studenten durch Studenten des
lich erklrt und von ihnen akzeptiert werden. gleichen Faches, Befragungen in rumlicher
Probleme knnen auch entstehen, wenn Nachbarschaft). Der Versuchung zur Verbrei-
zum Beispiel aus Grnden einer Lngsschnitt- tung personenbezogener Anekdoten sollte
untersuchung (mehrfache Befragungen bei der man stets mit dem Hinweis auf die Rechtslage
gleichen Person) eine Identifikation der Daten- gem Diagramm VI/2 schon bei der Schulung
stze gesichert werden mu. Hier liegt die ein- der Mitarbeiter entgegentreten.
Durchfhrung von Evaluationsstudien 157

Diagramm VI/2
Wichtige rechtliche Rahmenbedingungen fr Psychologen

Beachtung der Persnlichkeitsrechte der Erhebung im Rahmen eines Dienstvertrages


Probanden Verletzungen der Haupt- und Neben-
pflichten des Dienstvertrages fhren all-
gemein zu zivilrechtlichen Sanktionen (z.B.
Grundgesetz (GG) Schadensersatzansprche)

Artikel 1: Schutz der Menschenwrde Zu beachten sind weiterhin


Artikel 2: Freiheitsrechte Berufsgeheimnis 53 StPO
Artikel 5: Recht der freien Meinungs- Geheimnisverletzung 203 StGB
uerung
Artikel 12: Freiheit der Berufswahl
Rechtliche Situation des Beurteilens und
Bewertens in der Berufsausbildung, hierzu:
Psychologische Untersuchungen drfen in Betriebsverfassungsgestz (BetrVG)
dem Umfang geschehen, wie Sie der Wrde Mitbestimmungsrechte des Betriebsrates
des Menschen angemessen sind. Das Eindrin- beim Beurteilen und Bewerten im Betrieb:
gen in den persnlichkeitsrechtlichen Bereich 94, 95, 98 BetrVG, 85 BetrV
ist immer dann unproblematisch, wenn es Mitwirkungsrecht der Jugendvertretung
durch die freie Selbstbestimmung des Proban- ber Beurteilungsbgen: 6668, 70, 80
den ermglicht wird. BetrVG

Relativ schwer zu lsen ist das Problem vern- lagen. Es erfordert ein sehr hohes Ma der Ver-
derter Zugangsberechtigungen zu Aktenmate- innerlichung abstrakter Normen, nicht in den
rial. Typisch ist hier etwa die Situation in Uni- die eigenen Person betreffenden Vorgngen zu
versitten, wo in Zusammenhang mit der schmkern. Strukturell Gleiches gilt fr den
Besetzung von Professorenstellen externe Gut- hierarchischen Aufstieg in Verwaltungen, Schu-
achten eingeholt werden mssen, die nur dann len, Kliniken und Unternehmen. Fr Evalua-
wirklich aussagekrftig sind, wenn der Gut- tionsprojekte wichtig kann dieses strukturelle
achtenersteller von vertraulicher Behandlung Problem werden, wenn die Bewertung von
ausgehen kann (bei allen anderen Regelungen Manahmen eng mit Personen verknpft ist.
wrde eine erhebliche Gefahr von Geflligkeits- Dies trifft zum Beispiel bei Untersuchungen zur
gutachten, evtl. auf wechselseitiger Basis, ent- Bewertung verschiedener Weiterbildungssemi-
stehen). Dieses Material wird gemeinsam mit nare zu, wo es bei unzureichender Anonymisie-
den anderen Personalunterlagen blicherweise rung der Unterlagen durchaus passieren kann,
im Dekanat gespeichert, die Bewerber haben da nach einem beruflichen Aufstieg einer der
dazu keinen Zutritt. Nach Ernennung durch bewerteten Seminaranbieter mit Interesse liest,
den Minister (es kann ohne weiteres sein, da was seine jetzigen Untergebenen damals an
nicht der in den Gutachten besonders gut ab- Kritikpunkten genannt haben. berlegungen
schneidende Erstplazierte, sondern vielleicht dieser Art sprechen brigens dafr, in Zweifels-
ein gerade noch akzeptabel erscheinender Kan- fllen eher externe Evaluatoren heranzuziehen,
didat schlielich die Position erhlt) dauert es als die entsprechenden Informationen firmen-
oft nicht lange, bis der oder die Neue zum intern auszuwerten.
Dekan gewhlt wird oder eine andere, Zugang Ein theoretisch bestehendes, nach den ver-
zu den Dekanatsunterlagen bedingende Funk- fgbaren allgemeinen Informationen aber
tion in der akademischen Selbstverwaltung nicht allzu gravierendes Problem drfte der
bernimmt. Damit automatisch verbunden ist Geheimnisverrat in Kombination mit finanzi-
die Zugangsmglichkeit auch zu Personalunter- ellen Interessen sein. Man mu an diese Mg-
158 Durchfhrung von Evaluationsstudien

lichkeit aber bei wirtschaftsorientierten Eva- die Anzahl der statistischen Ergebnisse ber-
luationsstudien (etwa formative Produkt- schritten. Selbst wenn man den unter metho-
evaluation, alle im Zusammenhang mit Mar- dischen Gesichtspunkten natrlich unsinnigen
keting-Manahmen durchgefhrten Studien) Trick whlt, an der EDV nur die sehr signifi-
denken. Man kann trotz dem Fehlen entspre- kanten Resultate ausdrucken zu lassen, erhlt
chender fundierter Gerchte nicht ausschlie- man auch bei rein zuflligem Datenmaterial in
en, da Dinge dieser Art vorkommen (vermut- diesem Fall ca. 10 000 statistisch auffllige
lich htten im konkreten Fall alle Beteiligten Einzelbefunde. Es ist selbstverstndlich, da
ein erhebliches Interesse, den Vorgang mg- eine solche Auswertungsstrategie absolut unsin-
lichst nicht allzu publik werden zu lassen). An- nig wre.
dererseits kann aber angenommen werden, da
das bei sozialwissenschaftlich gesttzter Evalua-
tion erhobene Material selten einen so hohen Rechtzeitige Auswahl der
Wert hat, da sich das Risiko lohnt. Die effekti- Auswertungsdetails
ven informellen Kommunikationskanle zwi-
schen den Unternehmen machen eine mittel- Die einzige Alternative zu einer allumfassen-
fristige Aufdeckung eines solchen Verhaltens den Auswertung ist, von Anfang an gezielt eini-
sehr wahrscheinlich, und selbst bei Vermei- ge der nahezu unendlich vielen Aufflligkeiten
dung einer Strafanzeige drfte es sehr schwierig als potentiell erwartbar auszuwhlen. Dies hat
sein, in diesem Berufsfeld spter noch Karriere zur Folge, da man:
zu machen.
Nur jene Variablen in der Auswertung be-
rcksichtigt, die man subjektiv fr wichtig
hlt.
6.2.3 Auswertungsplne
Vorher mit dem Auftraggeber abklren mu,
ob es bzgl. der vermuteten Wichtigkeit von
Es ist bei einem realistisch groen sozialwissen-
Effekten die gleichen Meinungen hat.
schaftlichen Evaluationsprojekt so gut wie aus-
geschlossen, smtliche denkbaren Auswertun-
Sehr sorgfltig prft, ob man mit dieser Stra-
tegie nicht anstelle einer objektiven Befund-
gen durchzufhren. Nimmt man als Beispiel
erhebung nur die eigenen Vorurteile bestr-
eine Arbeit mit 40 bercksichtigten Variablen
ken mchte.
(was vor allem bei Verwendung von Codie-
rungsschemata fr Interviews oder Verhaltens-
Stets der Gefahr ausgesetzt ist, da anders-
denkende Leser des Evaluationsberichtes die
beobachtungen, noch strker als bei Frageb-
gezielte Manipulationsabsicht bei der Daten-
gen, eine sehr kleine Zahl ist), ergeben sich
auswertung unterstellen, auch wenn dies im
bereits 780 mgliche, an der EDV mit geringem
Einzelfall nicht gegeben sein sollte.
Zeitaufwand berechenbare Korrelationen. Da
man jetzt aber jede Variable (als mindestens
zweistufigen) Moderator nehmen kann, was im Die Gefahr der Besttigung der Vormeinung
brigen auch fr die wichtige Identifikation entsteht dadurch, da man eben nur jene Ef-
von Wechselwirkungen sehr sinnvoll sein fekte ausweist, die man von Anfang an vermu-
kann, bekommt man selbst bei nur einer zwei- tet hat. So kann man zum Beispiel bei einer
stufigen Einteilung potentieller Moderatoren Schulsystemuntersuchung die Klassengre,
weitere 29 640 Korrelationen. Geht man gar Details des Lehrerverhalten etc. erheben, aus-
dazu ber, mehrere Variablen gleichzeitig als schlielich mit dem Ziel, diese Variablen als
Moderatoren zu verwenden (zum Beispiel die Kovariate zur prziseren Herausarbeitung des
Untersuchung der Fragestellung, ob die Kom- eigentlich wichtigen Systemunterschiedes
bination einer bestimmten Alters- und Be- heranzuziehen. Man wird in Anbetracht der bei
rufsgruppe einen von der Gesamtstichprobe ausreichender Trennschrfe stets widerlegbaren
verschiedenen korrelativen Zusammenhang Nullhypothese (vgl. dazu Abschnitt 5.3.1) auf
zwischen einer bestimmten Form der Arbeits- diese Weise auch mit guter Chance einen stati-
gestaltung und der Arbeitszufriedenheit zeigt), stisch bedeutsamen Systemunterschied ermit-
wird mit Leichtigkeit die Millionengrenze fr teln. Ebenso gut knnte man aber auch umge-
Durchfhrung von Evaluationsstudien 159
kehrt vorgehen und prfen, ob nicht die aus das geplante Auswertungsprogramm ber-
der subjektiven Sicht nur als Streffekte aufzu- nommen werden, so da man deren relative
nehmenden Variablen um vieles bedeutsamer Besttigung oder Widerlegung bereits mit in
sind als die eigentlich fr wichtig gehaltenen, den Abschlubericht aufnehmen kann.
was man entweder direkt (dann aber in Kon- Vor allem bei ffentlichkeitswirksamen Eva-
fundierung mit dem Systemeffekt) oder unter luationsvorhaben nach Mglichkeit rechtzei-
Auspartialisierung des Beitrages der System- tig klren, welche Auswertungslcken vor
unterschiede machen kann. Schon aufgrund dem Hintergrund aktueller politischer Aus-
dieser genderten Reihenfolge der Aufnahme einandersetzungen in der ffentlichkeit, also
von Erklrungsvariablen in lineare Modell- insbesondere bei betroffenen Verbnden und
anstze (s. Abschnitt 5.3.2) sind entsprechende Parteien, auf der Basis des vorlufigen Planes
Ergebnisunterschiede zu erwarten, die dann gesehen werden; dies setzt allerdings die
interpretativ entsprechend der eigenen Vor- Schaffung eines ausreichend dichten Netzes
meinung besonders herausgearbeitet werden informeller Kontakte voraus und sollte im
knnen. brigen niemals ohne Abstimmung mit dem
Auftraggeber durchgefhrt werden.
Antizipatorische Konsensfindung Nach Durchfhrung solcher Vorarbeiten hat
man zwar einen vertretbaren Auswertungsrah-
Eine theoretisch denkbare Lsung wre, die
men, aber meist auch das Problem, da die Viel-
Auswahl der ausgewerteten Effekte auf wissen-
zahl der untersuchten Einzelergebnisse kaum
schaftliche Erkenntnisse zu grnden, zum Bei-
noch rezipierbar ist. Dies macht dann eine
spiel dann, wenn bereits aus Vorstudien das
nachtrgliche Beschrnkung bei der Bericht-
Auftreten mancher Zusammenhnge besonders
legung erforderlich, in deren Verlauf vieles an
plausibel erscheint. Dieser Weg scheitert bei den
guten Vorarbeiten verlorengehen kann.
meisten Evaluationsstudien aber daran, da
sich aus wissenschaftlich-theoretischen berle-
gungen oder auch aus der Flle der Detail-
ergebnisse von Vorstudien fr praktisch jede
Zusammenhangsanalyse eine zumindest nach-
6.3 Berichtlegung
trglich sehr plausibel klingende Begrndung
Das letztlich fr die Praxis relevant werdende
geben lt. Es drfte daher zweckmiger sein,
Ergebnis einer Evaluationsstudie ist nicht das,
die Auswertungsstrategie vorwiegend nutzen-
was im Laufe des Projektes von den dort Betei-
bezogen (natrlich nicht unter vlligem Ver-
ligten erfahren wurde, auch nicht das, was in
zicht auf die Kenntnis von wissenschaftlichen
den entsprechenden schriftlichen und mndli-
Vorergebnissen) aufzubauen und nach Mg-
chen Berichten enthalten ist; relevant werden
lichkeit rechtzeitig folgende Schritte einzulei-
hchstens jene Informationen, die bei den
ten:
Adressaten der Berichte ankommen.
Versuch einer Konsensbildung vorwiegend Wie gro die Unterschiede zwischen gesen-
mit Wissenschaftlerkollegen, die eine gegen- deter und empfangener Information sein
ber den evaluierten Manahmen gegentei- knnen, zeigt etwa die Arbeit von Czerwenka
lige Voreinstellung haben und/oder anderen et al. (1988) zur Bewertung der Schule durch
wissenschaftlichen Schulen angehren. Schler. Grundlage waren Aufstze, in denen
Mit den von den Evaluationsergebnissen be- Schler verschiedener Klassenstufen und Schul-
troffenen Praktikern denkbare Auswertungs- formen in der Bundesrepublik Deutschland ei-
ergebnisse durchspielen (im Prinzip analog nem Wesen von einem anderen Stern schil-
zur Szenariotechnik bzw. Planspielen, vgl. dern sollten, was Schule ist. Diese Aufstze
4.1.3), und mit diesen diskutieren, welche wurden dann unter anderem dahingehend aus-
Einwnde sie gegen die aus ihrer Sicht uner- gewertet, ob Hinweise fr ein eher positives
wnschten Ergebnisse vorbringen wrden. oder negatives Lehrerbild enthalten waren, ob
Diese Hinweise auf denkbare alternative Er- die Schule eher Freude oder keine Freude macht
klrungsanstze knnen gesammelt und in usf. Die Resultate, die auch in den schriftlichen
160 Durchfhrung von Evaluationsstudien

Pressemitteilungen erlutert wurden, zeigten Die nahezu selbstverstndliche Verwendung


u.a. ein berwiegen von wenig Freude an der von Fachausdrcken, wobei weniger das
Schule gegenber Freude (besonders deutlich Fremdwort fr die Berichtlegung an anders
etwa in der 11. Klassenstufe, wo insgesamt 13% vorgebildete Berufsgruppen strt, sondern
positiv und 27% negativ waren). hnliche das hohe Abstraktionsniveau und die jeweils
Ergebnisse erbrachten die Aussagen in diesen definitionsabhngige Bedeutung der verwen-
Aufstzen ber die Lehrer. Die Aufregung ber deten Begriffe und Konzepte.
diese Arbeit war vor allem bei den Lehrerver- Der hufige Gebrauch von einschrnkenden
bnden enorm, was bei bloer Durchsicht des Nebenbemerkungen und Konjunktiven; For-
Abschluberichtes fr den Wissenschaftler ei- mulierungen wie es knnte sein, wenn
gentlich unverstndlich bleibt. Erklrbar wird das nicht wre, vielleicht stimmt es doch!
die Aufregung, wenn man die Rezeption dieser entsprechen meist der wissenschaftlichen
Ergebnisse in der Presse liest. Beispiele fr (meist Redlichkeit, sind aber fr den Laien wegen
gro und fett gedruckte) berschriften: Sch- mangelnder Handlungsrelevanz inakzepta-
ler klagen ber Leistungsdruck, Schlechte bel.
Noten fr das Bildungssystem: Deutsche Sch- Eine unzureichende Beachtung wertender
ler haben grten Frust oder gar Die Lehrer Nebenbedeutungen; so ist eine negative
stellen hufig Feindbild dar (die letzteren Bei- Schleruerung ber Lehrer fr den Wis-
spiele brigens aus dem angesehenen Mn- senschaftler eine bestimmte Auswertungs-
chener Merkur). Noch krasser formulierte die kategorie, fr den Laien ist negativ mit ei-
Abendzeitung: Bayerns Schler: Unsere Leh- ner Note von Fnf oder Sechs gleichzusetzen.
rer sind Versager!. Solche Beispiele zeigen viel-
leicht, welchen (absichtlichen oder tatschlich Lsbar ist die Abstimmung der Berichtlegung
auf die Rezeption zurckfhrbaren) Miver- auf den Adressaten am einfachsten dann, wenn
stndnissen die Berichtlegung von Evaluations- der Evaluationsbericht nur an eine ganz be-
studien ausgesetzt sein kann. stimmte Personengruppe gerichtet ist, zum Bei-
spiel an die Weiterbildungsabteilung eines Un-
Im Abschnitt 6.3.1 wird zunchst darauf einge- ternehmens oder an die verantwortlichen
gangen, da jeder Berichtlegung eine sorgfl- Produktmanager bei einem Packungstest. Wenn
tige Zielgruppenanalyse vorausgehen sollte. man in solchen Situationen
Dann anschlieend (6.3.2) werden Probleme die auch unsachlichen, emotionalen Kom-
der Informationsverdichtung behandelt, die ei- ponenten des Auftrages
nerseits unvermeidlich, andererseits aber gera- den Verwertungs- bzw. Entscheidungszusam-
de wegen der blichen projektinternen Spra- menhang
che leicht manipulativ wirken knnen. Im den Sprachstil der Adressatengruppen, ins-
letzten Abschnitt (6.3.3) wird auf einige Fragen besondere deren Fachtermini
bei mndlicher Prsentation verwiesen.

beachtet, sollte der Bericht ein Erfolg werden.


6.3.1 Zielgruppenanalyse Selbstverstndlich ist, da man bei der ueren
Form die dortigen Standards einhlt; diese sind
Whrend des Studiums ist es blich, da man vor allem in der Wirtschaft bzgl. der optischen
Berichte ausschlielich fr hnlich vorgebildete und (druck-)technischen Gestaltung um vieles
Personen verfat. Typische Konsequenzen sind: anspruchsvoller als im universitren Bereich.
Bei sehr heterogenen Adressatengruppen, wie
Ein sehr komplexer, durchschnittliche kogni- sie vor allem bei greren, ffentlich finanzier-
tive Fhigkeiten der Sprachverarbeitung weit ten Evaluationen blich sind (etwa bei einer
berfordernder Satzbau. Fr wissenschafts- Untersuchung im Schulbereich: Ministerium,
interne Kommunikation ist eine solche Lehrerschaft, allgemeine ffentlichkeit, viel-
Struktur oft sinnvoll, fr andere Zielgruppen leicht auch noch Wissenschaftler) ist die
und insbesondere fr Konsumenten von zielgruppenorientierte Berichtlegung besonders
Massenmedien aber dysfunktional. schwierig. Man wird natrlich verschiedene
Durchfhrung von Evaluationsstudien 161
Varianten erarbeiten, mu aber darauf achten, der Mglichkeit, da auch Laien das Material
da sich dabei nicht scheinbare Widersprche lesen) zustzlich relativ ausfhrlich interpretiert
ergeben. Generelle Erfolgsregeln gibt es nicht; werden. Man kann nun von keinem an der Ent-
in jedem Fall sollte man aber bei den einzelnen scheidung interessierten Auftraggeber, schon
Formulierungen oder Bezeichnungen sorgfltig gar nicht von einem unter Zeitdruck arbeiten-
auf mgliche Miverstndnisse achten und je- den Journalisten oder Laien erwarten, dieses
des Konzept von wenigstens einem Angeh- umfangreiche Material durchzuarbeiten. Auer
rigen der relevanten Teilgruppen (ersatzweise der Zeitproblematik fehlen oft die Detailkennt-
von Kollegen, die in diesen Bereichen beson- nisse, und praktisch immer das Interesse (eine
dere Erfahrung haben) vor der Publikation hin- Ausnahme findet sich bei advokatorischer Re-
sichtlich dieses Aspektes prfen lassen. zeption von Evaluationsergebnissen, siehe un-
ten).
Beispiele fr Prsentationsformen gibt Diagramm
VI/3. Um berhaupt vom Auftraggeber rezipiert zu
werden, mu dieses Material in einen kurz les-
baren Bericht zusammengefat werden, der
Diagramm VI/3 solange man ihn als Wissenschaftler noch ir-
Mgliche Prsentationsformen von gendwie vertreten mchte meist zwischen 80
Evaluationsergebnissen und 100 Druckseiten aufweist. Da dies noch
immer zuviel ist, mu diesem Bericht eine Zu-
Fachbericht sammenfassung beigelegt werden, die aber mit
ca. 3 bis 6 Seiten fr jemand, der nur wissen
kommentierte Zusammenfassung
mchte, welche von zwei denkbaren Ma-
Verffentlichung in einer Fachzeitschrift nahmenvarianten er realisieren soll, noch im-
populrwissenschaftliche mer unntig lang ist. Mglicherweise ent-
Verffentlichung scheidungsrelevant ist meist nur eine ca.
Pressekonferenz einseitige Kurzdarstellung oder Beschlu-
vorlage.
Symposium
Dieser Informationsverdichtungsproze ist
Vorstellung in den Medien unvermeidlich, er findet auch dann statt, wenn
Workshop mit Mitarbeitern in einer sich wissenschaftlich ttige Evaluatoren den
Unternehmung entsprechenden Arbeiten entziehen. In diesem
Poster, Broschren Fall werden die entsprechenden Kurzdar-
stellungen durch Sachbearbeiter des Auftragge-
persnliche Diskussion bers erfolgen, was der bereinstimmung der
Kurzdarstellung mit den tatschlichen Projekt-
aussagen nicht immer dienlich ist.
Mit diesem Informationsverdichtungsproze
6.3.2 Informationsverdichtung verbunden ist natrlich die kaum vermeidbare
Gefahr, die Ergebnisse verzerrt wiederzugeben.
Eines der ungelsten Probleme sozialwissen- Unabhngig von der bestehenden Mglichkeit
schaftlicher Projektforschung ist die notwen- absichtlicher Manipulation wirken zahlreiche
dige Begrenzung des Umfanges des tatschlich gut untersuchte psychologische Prozesse (etwa
handlungsrelevant werdenden Berichtes. Bei selektive Aufmerksamkeit, Halo-Effekte, Disso-
greren, vielleicht auch wissenschaftlich in- nanzreduktionsmechanismen) auf den Verfas-
teressanten Projekten ist eine umfangreiche ser ein. Eine ausfhrlichere Darstellung findet
Dokumentation in Buchform blich, die leicht sich bei Wottawa, (1981). Es soll nochmals be-
deutlich mehr als 500 Seiten umfassen kann tont werden, da diese Mechanismen auch bei
(Beispiele dazu finden sich in Aurin et al. 1986; grter Sorgfalt nur bedingt einzuschrnken
Seiffge-Krenke, 1981). Der Zwang zur wissen- sind und man aus entsprechenden Beobach-
schaftlichen Redlichkeit der Darstellung erfor- tungen nicht auf absichtliche Verzerrungen der
dert dabei umfangreiche Tabellen, die (wegen Autoren schlieen sollte.
162 Durchfhrung von Evaluationsstudien

Nahezu unvermeidbare Angriffspunkte Auch hier ist wieder die Schwierigkeit, da alle
diese Kritikpunkte voll zutreffen knnen, die
Die Kombination aus notwendig reduzierter Mglichkeit von schlechten, elementaren pro-
Informationsdarstellung und der hohen Plausi- fessionellen Standards nicht gengenden
bilitt von Strfaktoren dabei fordert natrlich, Evaluationsprojekten ist natrlich gegeben. Da
gerade bei emotional kontroversen Ergebnissen, sich aber die Argumente nahezu bei jeder, auch
Kritiker mit anderer Meinung heraus. Diese sind noch so sorgfltigen Studie (falls diese ausrei-
im allgemeinen bei ihrer Argumentation bzw. chend komplex angelegt wurde) verwenden
Informationsdarstellung mindestens den glei- lassen, bleibt es dem Kritiker der Evaluations-
chen Verzerrungen ausgesetzt wie die eigent- projektkritiker (mit beliebiger Verallgemeine-
lichen Autoren, hufig sogar in strkerem rung dieses Meta-Kritiker-Begriffes) berlassen,
Mae, da sie subjektiv das Gefhl haben, einer die Angemessenheit der Gegendarstellung zu
verzerrten Darstellung entgegentreten zu mssen bewerten. Im praxisbezogenen Evaluations-
und nur durch berpointierung ihres Stand- bereich greifen die dafr in der Wissenschaft
punktes bei dem Adressaten eine letztlich aus- etablierten Mechanismen (eine breite, vielflti-
gewogene Meinung erreichen zu knnen. ge und relativ wenig interessensbezogene Dis-
Fast immer zur Abwertung verffentlichter kussion, ein allmhliches Vergessenwerden
Evaluationsberichte mgliche Argumentations- unzutreffender Interpretationen) aufgrund des
figuren sind: meist bestehenden Zeitdruckes nicht. Lsungen
fr dieses Problem knnen nicht angeboten
Offensichtliche methodische Schwchen werden leider.
(da es diese bei jedem greren Vorhaben
gibt, wurde zum Beispiel in Abschnitt 5.2.2
begrndet). 6.3.3 Mndliche Prsentation
Es wurde nicht alles bercksichtigt und aus-
gewertet, was man unbedingt htte tun ms- Fr diese, besonders wichtige Form der Ergeb-
sen (siehe 6.2.3) nisdarstellung gilt zunchst ebenso wie fr den
Die verwendeten Operationalisierungen bzw. schriftlichen Bericht eine besondere Betonung
Memethoden sind fehlerhaft (vgl. dazu Ab- der Zuhrerfreundlichkeit. Die technischen
schnitt 4.2.3). Kompetenzdefizite in der mndlichen Repr-
Die Autoren widersprechen sich selbst (es ist sentation sind bei vielen Studienabgngern
bei umfangreicheren Berichten sehr unwahr- noch gravierender als bei schriftlichen Darstel-
scheinlich, da sich nicht inhaltlich hnli- lungen, selbst fr die Benutzung blicher Me-
che, aber in der Aussagerichtung verschiede- dien fehlt hufig sowohl theoretisches Wissen
ne Kleindetailergebnisse und entsprechende als auch praktische bung. Selbstverstndlich
Interpretationen finden). sollte die freie, gegebenenfalls mediengesttzte
Die Ergebnisse sind nur singulr und nicht (Dias, Overhead-Folien) Rede sein, das Vorlesen
verallgemeinerbar (ein oft zutreffendes und vorbereiteter Manuskripte ist fr die Zuhrer
im brigen rhetorisch sehr gutes Argument, meist trostlos. Das Schreiben eines Textes, der
da sich groe Evaluationsstudien im Regel- bei mndlichem Vortrag die Verstndlichkeit
fall nicht wiederholen lassen). der freien Rede erreicht, ist eine ausgesprochene
Die Ergebnisse sind offensichtlich unsinnig, Kunst, die nur wenige beherrschen. Zumindest
da sie entweder gesicherten wissenschaftli- elementare Grundstze der Rhetorik sollte man
chen Ergebnissen widersprechen (bei sorgfl- beachten, sie finden sich zum Beispiel in
tiger Suche lassen sich fast immer einige wi- Hirsch, 1985, Schuh und Watzke, 1983.
dersprechende Befunde in der Literatur
eruieren) oder von angesehenen Experten Im brigen drfte (abgesehen von langfristigen,
negativ bewertet wurden (in Anbetracht der geistesgeschichtlich bedingten Meinungswel-
Pluralitt wissenschaftlicher Meinungen fin- len) dem Ansehen der Wissenschaft kaum etwa
det sich mit etwas Mhe auch dafr ein Be- so geschadet haben, wie die kontroverse ffent-
leg). liche Diskussion zu Evaluationsthemen, zum Bei-
spiel bzgl. gesetzlicher Regelungen, der Energie-
Durchfhrung von Evaluationsstudien 163
versorgung oder der Schulorganisation. Die bernimmt, eingeladen wird und zustzlich
Unterstellung simpler Kuflichkeit wie etwa vielleicht noch in dem jeweiligen sozialen Netz-
durch den damaligen Vorsitzender der Gewerk- werk der zu einer bestimmten Meinung nei-
schaft Erziehung und Wissenschaft (Frister, gende Gruppe eingebunden ist, ist eine gefrb-
1972) ist zwar fr alle an Evaluationsvorhaben te Betrachtungsweise sehr naheliegend. Da der
beteiligten Wissenschaftler eine Zumutung, aber Kollege den analogen Zwngen unterliegt,
in Anbetracht der dargelegten unvermeidbaren kann man sich wechselseitig so weit steigern,
Probleme bei Evaluationsprojekten und dem da zum Schlu die Glaubwrdigkeit tatsch-
fehlenden Kenntnisstand ber diese Schwierig- lich fraglich wird und der Stil der uerungen
keit auch bei sich selbst kompetent fhlenden vielleicht manchmal an der Grenze dessen liegt,
Laien psychologisch verstndlich. Im brigen was man vor sich selbst gerne vertritt. Interes-
hat sicher auch der manchmal bedauerlich Stil sant ist das Phnomen, das nach dem offiziel-
von wissenschaftlichen Diskussionen in der len Teil solcher Veranstaltungen durchaus ein
ffentlichkeit ganz wesentlich dazu beigetra- emotional herzliches Verhltnis zu dem Kon-
gen, das Ansehen (nicht nur, aber besonders) trahenten bestehen kann und man sich eigent-
der Sozialwissenschaften zu schdigen. Tatsch- lich darber einig ist, da man jetzt ein bi-
lich fhren verschiedene Formen der mndli- chen bertrieben hat.
chen Darstellung oder Diskussion von Evalua- Es ist schade, da sich weder bei ffentlich-
tionsergebnissen zu Rollenzwngen, die eine im politischen noch bei kleineren, etwa fr einen
Extrem selbst nicht mehr so ganz gerechtfertigt bestimmten Konzern oder eine bestimmte Kli-
erscheinende berpointierung von Darstellun- nik relevanten Evaluationsvorhaben ein berufs-
gen nahelegen. Wenn man zu einer Veranstal- ethisch begrndeter Konsens ber akzeptable
tung schon als Anwalt fr eine bestimmte Verhaltensweisen gerade bei der mndlichen
Position gemeinsam mit einem Kollegen, der Berichtlegung ergeben hat. Hier bleibt noch ei-
die gleiche Rolle fr eine andere Auffassung niges zu tun.
164 Durchfhrung von Evaluationsstudien

bersicht Kapitel 6:
Durchfhrung von Evaluationsstudien
6.1
Organisatorische Fragen
Fragen der Personalfhrung
Grofirma als Arbeitgeber Kleinere Unternehmen & private Kleininstitute
meist professionelles Personal- aus der Sicht des Arbeitgebers aus der Sicht der Mitarbeiter
management & strukturierte Mangel an fachlich qualifizier- Unsicherheit des Arbeitsplatzes
Hierarchie tem Personal Beschrnkung auf Spezialisten-
Informelle Machtstellung von ttigkeit
Spezialisten geringe oder keine Aufstiegs-
Unerwartete Kndigungen oder chancen
Ausflle geringe Untersttzung bei der
Mangel an Personal zur individuellen Weiterbildung
bernahme von Projekt-
Management-Aufgaben
Kontrolltechniken des Projektverlaufes

Zeitplanung Kostenplanung Qualittsstandard


detaillierte Zeitplanung bei der Gegenberstellung der laufende Kontrolle der dem
Projektplanung geplanten Kosten mit veraus- Auftraggeber zugesicherten
gabten Betrgen Qualittsstandards

Krisenmanagement
Typische Beispiele
nderung der Zielsetzung des Unbekannte oder vom Nicht vorhersehbare Reaktion
Projektes Auftraggeber verschwiegene Personalausflle
berlappungsprozesse Nebenwirkungen absolut Unvorhersehbares
Methodenartefakte

6.2
Auswertungsarbeiten
Datenerhebung Datenaufbereitung
Probleme bei der Interviewerhebung Hauptproblem bei der postalischen Probleme
Schlechte Arbeitskonditionen, Befragung Kodierfehler
fehlerhafte Adressenvorgaben, Rcklaufquote fehlerhafte Dateneingabe
schlecht aufgebaute Frageb-
gen, Interviewer- bzw. Unter- Vorbeugende Manahmen Vorbeugende Manahmen
suchungsleitereffekte, Quoten- Absender der Probanden auf dem Doppelarbeiten
vorgaben, Bezahlung nach Couvert Bezahlung nach Zeit und nicht
erfolgreich durchgefhrten Ausstellen von Code-Nummern nach Stckzahl
Interviews auf den Fragebgen Verrechnung gefundener Fehler
Rckcouvert mit Projektnummern Plausibilittskontrollen

Datenauswertung Datenschutz
Probleme
Verwechslung von Variablennummern oder Codes Beachtung des Bundesdaten-
Selbstentwickelte Programme schutzgesetzes und der grund-
Vorbeugende Manahmen stzlichen Gesetzlichen Richt-
sorgfltige Arbeit linien zum Schutz der Privat-
semantische Plausibilittskontrolle sphre

6.3
Berichtlegung
Zielgruppenanalyse Informationsverdichtung Mndliche Prsentation
Abstimmung der Berichtlegung mit Probleme Beachtung unterschiedlicher
den Adressaten unter Beachtung Absichtliche Manipulation Prsentationsmglichkeiten von
von: Psychologische Prozesse, z.B. Evaluationsergebnissen
Sprachstil der Adressatengruppen Selektive Aufmerksamkeit, Halo- Untersttzung der Prsentation
Verwertungs- bzw. Effekt, Dissonanzeffekte durch Medien bzw.
Entscheidungszusammenhang Moderationstechniken
unsachliche emotionale Vorteil advokatorischer
Komponenten des Auftraggebers Darstellung
165

7. Ausblick: Bewertung
sozialwissenschaftlicher Evaluation

Die Kriterien fr die Bewertung sozialwissen- Schwieriger abzuschtzen ist der Schaden,
schaftlich gesttzter Evaluation stellen sich un- bzw. die Kosten, die durch Evaluations-
terschiedlich dar, je nachdem, ob es um die ergebnisse verursacht werden knnen. Ein Teil-
Bewertung eines einzelnen Projektes oder, glo- aspekt davon ist das Problem unrichtiger Er-
baler gesehen, um das Vorhandensein solcher gebnisse, wie sie durch unzureichende Designs,
Arbeiten berhaupt geht (Abschnitt 7.1 bzw. schlechter bzw. verzerrter Messung, falsche
7.2). Zum Abschlu wird versucht, einige not- Datenauswertung, Interpretation und Rezepti-
wendig subjektive gefrbte Zukunftsperspek- on der Ergebnisse entstehen knnen. Solche Irr-
tiven dieses Bereiches aufzuzeigen (7.3). tmer, die zu projektgesttzten Fehlentschei-
dungen fhren, mssen durch die fachliche
Kompetenz der Evaluatoren so gering wie mg-
7.1 Bewertungskriterien lich gehalten werden. Sie sind vor allem dann
zu befrchten, wenn relative Laien selbst Stu-
einzelner dien durchfhren, zum Beispiel deshalb, weil
Evaluationsvorhaben dem Auftraggeber oder Vorgesetzten (zum
Beispiel in einer Klinik, einer Firma, einem Mi-
Wie bei jeder Manahme ist auch fr die Be- nisterium) nicht ausreichend bewut ist, da
wertung von Evaluationsprojekten zwischen Evaluationen im sozialwissenschaftlichen Be-
den Nutzenaspekten zu unterscheiden, die mit reich gar nicht so einfach durchzufhren sind.
den Ergebnissen selbst verbunden sind und den Die beste Prvention drfte, neben sachgerech-
Aspekten, die schon durch die Durchfhrung ter Aufklrung von ffentlichkeit und Ent-
des Projektes, jedoch unabhngig von den Er- scheidern, das allmhliche Entwickeln einer
gebnissen entstehen. Evaluationsprofession mit fachlichen und
berufsethischen Standards sein (vgl. dazu etwa
die American Evaluation Association). Der an-
Ergebnisabhngige Aspekte dere Schadens-Aspekt von Ergebnissen ist,
da im sozialwissenschaftlichen Bereich viele
Der Nutzen durch die Ergebnisse ist im wesent- Befunde (im Gegensatz zu den klassischen Na-
lichen eine Verbesserung der Entscheidungen, turwissenschaften) keine langfristige Gltig-
um deretwillen das Projekt durchgefhrt wur- keit haben, auch wenn sie nach allen metho-
de. Das Ausma und die Effizienz davon kann dischen Standards erhoben wurden. Die
nur im jeweiligen Einzelfall bewertet werden; nderungen von Rahmenbedingungen (zum
da in absehbarer Zeit nicht mit einer irrationa- Beispiel Fhrungsstil im Unternehmen oder die
len Evaluationseuphorie zu rechnen ist, wer- jeweilige Wirtschaftslage, die Erwartung der f-
den i. A. Evaluationsstudien nur dann durchge- fentlichkeit an das Bildungssystem, die Verfg-
fhrt, wenn eine sehr gute Chance besteht, da barkeit von Therapien im Gesundheitswesen
die Ergebnisse in ihrem Nutzen die Aufwen- u.a.m.) knnen zu stark genderten Verhaltens-
dungen bersteigen. und Reaktionsweisen fhren. Die Projekt-
166 Ausblick: Bewertung sozialwissenschaftlicher Evaluation

ergebnisse mssen daher unter solchen Zu- Verbesserung der realen Verhltnisse durch
kunftsperspektiven diskutiert werden, wobei das Wissen um die Projektdurchfhrung
manche Techniken (etwa Szenario, s. Abschnitt (etwa besondere Anstrengung der Betroffe-
4.1.3) hilfreich sein knnen. Falsch wre es, als nen zum Erzielen guter Ergebnisse).
Evaluator die Dauerhaftigkeit der Befunde un-
realistisch hoch einzuschtzen und sich fr de- Ob die Vor- oder Nachteile strker zum Tragen
ren unreflektierte Aufnahme in den (meist zu- kommen, hngt davon ab, in welches Umfeld
kunftsorientierten) Entscheidungsproze stark die Evaluationsarbeit eingebettet wird, und wie
zu machen. sie die Beteiligten/Betroffenen subjektiv akzep-
tieren. Sinnvolle Evaluationsstudien sind daher
vor allem dann mglich, wenn die jeweilige
Ergebnisunabhngige Aspekte Organisation einen Entwicklungsstand hat, der
durch Rationalitt der Manahmengestaltung,
Die durch die Evaluation selbst, ohne Beach- Vertrauen der Beteiligten untereinander und
tung der Ergebnisse, ausgelsten mglichen Kritikfhigkeit (aktiv und passiv) geprgt ist.
Kosten betreffen vor allem folgende Punkte:
Finanzielle und materielle Aufwendungen;
diese sind relativ exakt kalkulierbar (vgl. dazu
Abschnitt 5.1.3). 7.2 Evaluation als
Zeitverluste vor Treffen der Entscheidungen, gesellschaftliches
gegebenenfalls sogar das berdecken von
Entscheidungsschwche bzw. Verantwor-
Gestaltungsprinzip
tungsscheu.
Das Prinzip wissenschaftlich gesttzter Evalua-
Evtl. Verunsicherung der Entscheidungstr-
tion ist in keiner Weise wertfrei. Es kann einer-
ger, da die von ihnen zunchst eingefhrten
seits nur unter bestimmten gesellschaftlichen
bzw. untersttzten Manahmen objektiv be-
Verhltnissen zum tragen kommen, beeinflut
wertet und damit Fehlentscheidungen auf-
aber auch seinerseits die Akzeptanz politischer
gedeckt werden; im Extremfall kann dies bei
Grundkonzeptionen. Der Grund dafr liegt in
starker Motivierung zum Vermeiden (relati-
den Erfordernissen sachgerechter Evaluations-
ver) Mierfolge zur Innovationsscheu fh-
projekte:
ren.
Verzerrung der realen Verhltnisse durch das
Explikation der Ziele
Wissen, da eine Evaluationsstudie durchge-
fhrt wird: zum Beispiel die Anpassung des
Akzeptanz von Fakten bezglich der Ziel-
erreichung
Leiters einer Weiterbildungsveranstaltung an
die von ihm vermuteten, aus der Sicht der
Einbettung der Ergebnisse in ein auf Opti-
mierung der Zielerreichung hin angelegtes
Evaluatoren-Auftraggeber positiven Krite-
Entscheidungssystem
rien oder die Einhaltung von im Projekt vor-
gegebenen, dem blichen Verhalten der The-
Diese stehen im offensichtlichen Gegensatz zu
rapeuten widersprechenden Regeln bei
politischen Systemen, die
Durchfhrung von Psychotherapien.

Die gleichen Streffekte knnen aber auch zu


Ziele verschleiern wollen (zum Beispiel
Machterhalt bestimmter Familien oder Cli-
ergebnisunabhngigen Vorteilen fhren, etwa
quen)
Zeitgewinn fr sorgfltigeres berlegen und ideologische Forderungen (wie die Gesell-
weitere Informationssammlung, Entlastung schaft bzw. der Mensch sein sollen) ber reale
der Entscheider vor bertriebener Hektik. Verhltnisse stellen
Erhhung der Innovationsfreude, da die neu- Entscheidungen der rationalen Kontrollen
en Verfahren sorgfltig berprft werden, so entziehen wollen (zum Beispiel autoritre
da die Gefahr einer langfristig wirksamen Herrschaftsstrukturen, Durchsetzung reali-
Fehlentscheidung verringert wird. ttsresistenter Dogmen)
Ausblick: Bewertung sozialwissenschaftlicher Evaluation 167
So betrachtet, ist der gesellschaftliche Nutzen publik Deutschland weiter zunehmen; ver-
von Evaluationen, selbst ohne die Verbesserun- mutlich weniger im Bereich groer Vorha-
gen durch konkrete Projektergebnisse, offen- ben (etwa ganze Bildungssysteme), sondern
sichtlich. Allerdings liegen auch hier potentielle in der Form vieler kleinerer, auf technische
Nachteile genau in den gleichen Aspekten: Verbesserung abzielender Projekte.
Die Bedeutung formativer, fr Gestaltungs-
Der Zwang zur Zielexplikation kann fr vorhaben auch heuristisch wertvoller Evalua-
neue politische Richtungen, die erst allmh-
tion wird relativ zu summativen Studien
lich einen diffusen Stimmungsumschwung
zunehmen; daraus leiten sich besondere
zu artikulieren vermgen, zu einer zu fr-
Methodenerfordernisse ab, da gestaltende Ar-
hen, unausgereiften Festlegung fhren bzw.
beiten nicht nach den blichen, an Falsifika-
sie wegen des Fehlens expliziter Ziele zu
tion orientierten Anstzen durchgefhrt wer-
unrecht in der ffentlichen Meinung abwer-
den knnen.
ten.
Es wird schwierig werden, die Nachfrage
Die berbetonung der realen Verhltnisse nach Evaluatoren zu befriedigen; dies gilt
kann zum Fehlen von (politischen) Visionen
nicht in quantitativer Hinsicht (im Gegen-
fhren, die gesellschaftliche Basisinnovatio-
teil: Die Arbeitsmarktsituation fr Psycholo-
nen ermglichen.
gen und Sozialwissenschaftler wird dazu fh-
Rein rationale Entscheidungen knnen nicht ren, da sich viele Absolventen auch mit
nur eine Demotivation der Verantwortlichen
Evaluation beschftigen wollen), sondern in
bedingen (wem macht es schon Spa, nur
Bezug auf die Qualitt der Interessenten.
computerartig sachrational zu entscheiden?),
sondern knnen auch, vor allem bei unzu-
Betrachtet man acht Jahre spter die damaligen
reichend breiter Zielfestlegung, gegen huma-
Erwartungen, so haben sich diese partiell er-
nitre Aspekte verstoen (Bercksichtigung
fllt. Die Nachfrage nach Evaluation hat sich
von Sonderfllen, besonderen Problemlagen,
wesentlich erhht, aber in einem Bereich, der
individuellen Hrten).
von uns damals nicht vorhergesehen wurde.
Der quantitativ wichtigste Nachfragezuwachs
Bercksichtigt man beide Perspektiven, sollte
entsteht durch die zunehmende Verbreitung
man auch als Evaluator akzeptieren, da die
der DIN-ISO 9000ff/2, also die neuen (und von
rationale Ziel-Mittel-Relation zwar unverzicht-
uns vor 8 Jahren nicht antizipierten) Zerti-
bar, aber nicht das einzige Gestaltungsprinzip
fizierungen fr das Qualittsmanagement von
der Gesellschaft sein kann. Werden gesellschaft-
Dienstleistungsorganisationen. Auch dort, wo
lich relevante Evaluationsergebnisse nicht oder
man aus guten Grnden keine offizielle Zer-
nicht voll in politisches Handeln umgesetzt,
tifizierung anstrebt, ist das Bestreben einer
kann dies, unbeschadet der sachlichen Leistung
outputorientierten Steuerung und Bewertung
im jeweiligen Projekt, auch gute Grnde ha-
(vergleiche dazu Diagramm II/2 im Abschnitt
ben.
2.1.1) wesentlich strker geworden, als wir da-
mals vermutet haben. Dies betrifft vor allem
den ffentlichen Sektor, wo sich in Schulen,
7.3 Zukunftsperspektiven Universitten und insbesondere Kommunalver-
waltungen (als Folge der dort stattfindenden
Bei der 1. Auflage 1987 wurde folgende Vermu- Organisationsreformen im Rahmen der neuen
tung ber die Zukunft an dieser Stelle formu- Steuerungsmodelle, fr die psychologischen
liert: Implikationen siehe etwa Stratemann &
Wottawa, 1995) ein enormer Bedarf an klei-
Prognosen sind immer problematisch, sie kn-
nen Evaluationsstudien ergibt, und zwar so-
nen hier nur sehr subjektive Vermutungen wie-
wohl hinsichtlich der Entwicklung geeigneter
dergeben. Es wird interessant sein, etwa im Jahr
und praxistauglicher Instrumente der Ergebnis-
2000 die folgenden Aussagen zu evaluieren:
berprfung als auch bei der Beratung in Bezug
Die Nachfrage nach sozialwissenschaftlich auf die sinnvolle Nutzung der Resultate der
gesttzter Evaluation wird in der Bundesre- Evaluation. Leider zeigten hier einige beson-
168 Ausblick: Bewertung sozialwissenschaftlicher Evaluation

ders in der ffentlichen Darstellung spektaku- tigung von bzw. die Projektvergabe an Eva-
lren Vorgnge (zum Beispiel im Zusammen- luatoren stark gebremst wird. So zwingt zum
hang mit der Evaluation von Hochschulen), Beispiel die katastrophale Haushaltssituation
da das schnelle Aufgreifen eines gesellschaft- der meisten Stdte diese dazu, soweit nur
lich relevanten Themas nicht immer mit me- irgend mglich fr die unverzichtbaren
thodischer Sauberkeit und sachangemessener Evaluationsarbeiten auf bereits vorhandenes
Nutzung der Ergebnisse durch die Entschei- Personal, ggf. mit entsprechender Einschulung,
dungstrger verbunden ist (fr die besonderen zurckzugreifen. Hier liegt ein potentiell aus-
methodischen Probleme von Lehr-Evaluatio- sichtsreiches Beschftigungsfeld vor, wenn sich
nen im Hochschulbereich siehe Kromrey, 1995 in mittlerer Zukunft die Finanzlage potentieller
fr eine systematische Erarbeitung der Mein- Arbeitgeber in diesen Berufsfeldern verbessern
strumente zu diesem Problem etwa Amelang, sollte.
& Bartussek, 1996). Erwartungsgem gibt es Im brigen bleibt unsere schon 1987 geuert
auch kaum noch groe Debatten auf der Hoffnung bestehen, da die Entwicklung der
Basis summativ angelegter Evaluationen fr ge- politischen Rahmenbedingungen eine offene,
sellschaftspolitisch relevante Entscheidungen, sich nach rationalen Prinzipien gestaltende
sondern einen sehr hohen Bedarf an formati- und evaluationsgsttzt lernfhige Gesellschaft
ven Studien. Zu diesen beiden Punkten wurden sichert. Innerhalb dieses Rahmens liegt es dann
unsere Erwartungen also weitgehend erfllt, in der Verantwortung der Human- und Sozial-
allerdings in Bereichen und aus Grnden, die wissenschaften (und -wissenschaftlern!) selbst,
wir vor acht Jahren nicht entsprechend einge- ihren Beitrag zu einer positiven Entwicklung
schtzt haben. unserer Lebensbedingungen zu leisten.
hnliches trifft auch fr die vermutete Ange- Bei Beachtung und Respektierung der Gren-
bots-Nachfrage-Situation zu. Die Arbeitsmarkt- zen der Wissenschaft und unter der Verwen-
situation fr Psychologen und Sozial- dung von sozialwissenschaftlichen Grundlagen
wissenschaftler hat sich quantitativ noch kann Evaluation auf vielen unterschiedlichen
strker verschlechtert als wir damals vermutet Einsatzgebieten einen wertvollen Beitrag lei-
haben, und trotzdem gibt es noch immer ein sten.
Defizit an akzeptierten Evaluatoren, wie die Beachtet man bei der Planung und Durch-
deutliche Konzentration der Nachfrage auf eine fhrung von Evaluationsprojekten die speziel-
relativ kleine Gruppe von Personen zeigt. Ein len Ziele und Bewertungskriterien der Ziel-
aktuell sehr groes Problem ist natrlich die gruppen und Auftraggeber, wird sich die
Finanzlage des ffentlichen Bereiches und im Evaluation als gesellschaftliches Gestaltungs-
Gesundheitswesen, da durch sie die Beschf- prinzip bewhren.

Bei Beachtung und Respektierung der Grenzen der Wissenschaft und unter Verwendung
von sozialwissenschaftlichen Grundlagen kann Evaluation auf vielen unterschiedlichen
Einsatzgebieten einen wertvollen Beitrag leisten.
Beachtet man bei der Planung und Durchfhrung von Evaluationsprojekten die speziel-
len Ziele und Bewertungskriterien der Zielgruppen und Auftraggeber, wird sich die Eva-
luation als gesellschaftliches Gestaltungsprinzip bewhren.
169

8. Literaturverzeichnis
Abramson, T.: Handbook of vocational education evaluation. Biefang, S.: Evaluationsforschung in der Psychiatrie. Frage-
Beverly Hills: Sage, 1979. stellung und Methoden. Stuttgart: Enke, 1980.
Albrecht, U., Pfitzinger, E., Vogel, M.: Projekt DIN EN ISO Birnbacher, D. & Hoerster, N.: Texte zur Ethik. Mnchen:
9000. Vorgehensmodell zur Implementierung eines Qualitts- Deutscher Taschenbuch-Verlag, 1976, S. 198229.
managementsystems. Berlin: Beuth Verlag, 1995. Bolles, R.C.: Learning theory. New York: Holt, Rinehart &
Alkin, M.C.: Die Aufwands-Effektivitts-Evaluation von Winston, 1975.
Unterrichtsprogrammen. In: Wulf, C.: Evaluation. Die Bommert, H. & Petermann, F.: Diagnostik und Praxis-
Beschreibung und Bewertung von Unterricht, Curricula und kontrolle in der Klinischen Psychologie. Kln: DGVT und
Schulversuchen. Mnchen: Piper, 1972. GWG, 1982.
Amt fr Statistik und Stadtforschung der Stadt Bochum Borg, J.: Anwendungsorientierte multidimensionale Skalie-
(Hrsg.): Das rumliche Ordnungskonzept Bochums rung. New York: Springer, 1981.
Erfolgskontrolle der Entwicklungsziele. Bochum: Heft 16, Bortz, J.: Lehrbuch der empirischen Forschung. Fr Sozial-
Dez. 1975. wissenschaftler. Berlin: Springer, 1984.
Aristoteles: Politik. Hamburg: Meiner, 1981. Bortz, J.: Lehrbuch der Statistik. Fr Sozialwissenschaftler.
Atiya, A.S.: Kreuzfahrer und Kaufleute. Die Begegnung von Berlin. Springer, 4. Auflage, 1994.
Christentum und Islam. Stuttgart: Kohlhammer, 1964. Bramsemann, R.:Controlling. Wiesbaden: Gabler, 1978.
Attkinson, C.C. & Broskowski, A.: Evaluation and the Brecht, B.: Das Leben des Galilei. Frankfurt: Suhrkamp,
emerging human service concept. In: Attkinson, C.C., 1963.
Hargreaves, W.A., Horrowitz, M.J., Sorenson, J.E. Briam, K.-H.: Unternehmenskultur als Erfolgsfaktor: Pldoy-
(Eds.): Evaluation of human service programs. New York: er fr eine mitarbeiter- und marktorientierte Strategie der
Academic Press, 1978. Zukunft. Gtersloh: Verlag Bertelsmann-Stiftung, 1996.
Amelang, M. & Bartussek, D.: Differentielle Psychologie Brockmeier, J.: Die Naturtheorie Giordano Brunos, 1980.
und Persnlichkeitsforschung. Stuttgart: Kohlhammer, Bronner, R. & Schrder, W.: Weiterbildungserfolg. Mn-
1996. chen: Hanser, 1983.
Aurin, K., Schwarz, B., Thiel, R.-D.: Vergleichsuntersuchung Bruner, J.S.: The process of education. New York: Random
des Landes Baden-Wrttemberg. Gegliedertes Schulsystem (Vintage), 1963.
und Gesamtschule. Forschungskonzept und Methoden, Bund-Lnder-Kommission fr Bildungsplanung (BKL):
Bd. 1. Ministerium fr Kultus und Sport. Stuttgart: Bildungsgesamtplan, Bd. 1. Stuttgart: 1973.
Verlag und Druck GmbH, 1986. Bundesministerium fr Forschung und Technologie
Baehr, J. & Eberle, P.: DUPPS Ein Metaplanspiel fr die (Hrsg.): Ein Handbuch zur Planung und Durchfhrung
Produktionswirtschaft. In: Personalwirtschaft, 10/1986. von Projekten. Kln: Deutscher Gemeindeverlag GmbH
Battegay, R.: Der Mensch in der Gruppe. Bern: Huber, 1973. & Verlag W. Kohlhammer GmbH, 1977.
Bauer, P., Scheibe, V., Wohlzogen, F.X.: Sequentielle stati- Burgtorf, W. & Wei, R.: Einflu von Verkehrslrm auf
stische Verfahren. Stuttgart: Fischer, 1986. die Gehrerholung whrend der Freizeit. Umweltbun-
Baumert, J., Naumann, J., Roeder, P.M., Trommer, L.: Zur desamt, (Hrsg.), Forschungsbericht 81 10501108. Ber-
institutionellen Stratifizierung im Hochschulsystem der lin, 1980.
Bundesrepublik Deutschland. Forschungsbereich Schule Clau, G. & Ebner, H.: Grundlagen der Statistik fr Psycho-
& Unterricht. Max-Planck-Institut fr Bildungsfor- logen, Pdagogen und Soziologen. Frankfurt/M.: Deutsch,
schung. Berlin: Nr. 16 SuU, 1987. 1972.
Baumert, J.: Curriculumsentwicklung und Lehrerfortbildung Coleman, J.S.: Introduction to mathematical sociology. New
fr die Berliner Gesamtschulen. Berlin: Max-Planck-In- York: The Free Press of Glencoe, 1964.
stitut fr Bildungsforschung Studien und Berichte Cook, T.D. & Campbell, D.T.: The design and conduct
Nr. 41, 1980. of quasi-experiments and true experiments in field
Berthold, H.-J., Gebert, D., Rehmann, B. Rosenstiel, L.v.: settings. In: Dunnette, M.D. (Ed.): Handbook of
Schulung von Fhrungskrften eine empirische Un- industrial and organizational psychology. Chicago: Rand
tersuchung ber Bedingungen und Effizienz. Zeit- McNally College Publishing Company, S. 223326,
schrift fr Organisation 4/1980, S. 221229. 1976.
Beywl, W., Geiter, C.: Evaluation Controlling Qualitts- Cook, T.D. & Reichardt, C.S. (Eds.): Quantitative and qua-
management in der Weiterbildung. Bielefeld: Bertelsmann litative methods in evaluation research. Beverly Hills:
Verlag, 1997. Sage, 1979.
170 Literaturverzeichnis

Cronbach, L.J. & Suppes, P.: Research for tomorrows Glass, G.V. & Ellet, F.S.: Evaluation research. Annual
schools: Disciplined inquiry for education. New York: review of Psychology, 1980, 31, S. 211228.
MacMillan, 1969, 2021. Glass, G.V.: Die Entwicklung einer Methodologie der
Cerwenka, K., Nlle, K., Pause, G., Schlotthaus, W. & Evaluation. In: Wulf, C. (Hrsg.): Evaluation. Mnchen:
Schmidt, H.-J.: Was Schler von der Schule halten. Mn- Piper, 1972, S. 167170.
chen: Bayrischer Lehrer- und Lehrerinnenverband Gniech, G.: Streffekte in psychologischen Experimenten.
e.V., 1988. Stuttgart: Kohlhammer, 1976.
Demski, M., Lorenz, T.: Zertifizierung von Qualitts- Grawe, K., Donati, R., Bernauer, F.: Psychotherapie im
managementsystemen bei Bildungstrgern. Renningen- Wandel, von der Konfession zur Profession. Gttingen:
Malmsheim: expert-Verlag, 1996. Hogrefe, 1995.
Diederich, J. & Wulf, Ch.: Gesamtschulalltag. Die Fall- Groeben, N. & Scheele, B.: Heidelberger-Struktur-Lege-
studie Kierspe. Lehr-, Lern- und Sozialverhalten an technik. Weinheim: Beltz, 1984.
nordrhein-westflischen Gesamtschulen. Paderborn: Guilford, J.P.: Personality. New York: McGraw-Hill, 1959.
Schningh, 1979. Gulden, G.: Evaluation von Traineeprogrammen als Alter-
Dienel, P.C.: Die Planungszelle. Opladen: Westdeutscher native zur klassischen Form des Berufseinstiegs. Betrach-
Verlag GmbH, 1978. tung aus Firmen- und Studentensicht. Mnchen und
Diepgen, R.: Sequential analysis, the ignored alternative. Mering: Hampp, 1996.
German Journal of Psychology 11, 266267, 1987. Glpen, B.: Evaluation betrieblicher Verhaltenstrainings un-
Dilthey, W.: Beitrge zum Studium der Individualitt. Ber- ter besonderer Bercksichtigung des Nutzens. Mnchen
lin, 1896. und Mering: Hampp, 1996.
DIN, Deutsches Institut fr Normung e.V.: DIN EN ISO Gumpp, G.: ISO 9000 entschlsselt. Landsberg/Lech: Ver-
9000ff, NORN EN ISO 9000ff, SN EN ISO 9000ff fr lag Moderne Industrie, 1996
kleine und mittelstndische Unternehmen (KMU). Beuth, Guttman, L.: Introduction to face design & analysis. In:
1997. Proceedings of the Fifteenth International Congress of
Drner, D.: Lohhausen (Hrsg.): Vom Umgang mit Unbe- Psychology, Brussels. Amsterdam, North-Holland,
stimmtheit und Komplexitt. Bern: Huber, 1983. 1957.
Drner, D.: Problemlsen als Informationsverarbeitung. Haenisch, H., Lukesch, H., Klanghofer, R., Krger-Hae-
Stuttgart: Kohlhammer, 1979. nisch, E:-M.: Gesamtschule und dreigliedriges Schulsy-
Drenth, P.J.D.: Der psychologische Test. Eine Einfhrung stem in Nordrhein-Westfalen Schulleistungsvergleich in
in seine Theorie und Anwendung. Mnchen: Barth, Deutsch, Mathematik, Englisch und Physik. Paderborn:
1969. Schningh, 1979.
Echterhoff, W.: Erfolgskontrolle zur Verhaltensbeeinflussung Hajek, P. & Havranek, T.: Mechanizing hypothesis forma-
von Verkehrsteilnehmern: Grundlagen und Empfehlungen. tion. Mathematical foundations for a general theory.
Kln: Verlag TV Rheinland GmbH, 1981. Berlin: Springer, 1978.
Eysenck, H.J.: Dimensions of personality. London: Rout- Halbach, A.: Theorie und Praxis der Evaluierung von Projek-
ledge and Kegan Paul, 1947. ten in Entwicklungslndern. Mnchen: Weltforum,
Fink, A.: Evaluation for Education and Psychology. London:
1972.
Sage, 1995.
Halbach, G., Mertens, A., Schwedes, R., Wlotzke, O.:
Fishburn, P.C.: Methods of estimating additive utilities. Ma-
bersicht ber das Recht der Arbeit. Bonn: Bundesmini-
nagement Science, 1967, 13, 7.
sterium fr Arbeit und Soziales, 1987.
Fischer, G.: Einfhrung in die Theorie psychologischer Tests.
Hrtner, R. Mattes, K., Wottawa, H.: Computerunter-
Grundlagen und Anwendungen. Stuttgart: Huber,
sttzte Hypothesenagglutination zur Erfassung kom-
1974.
plexer Zusammenhnge. EDV in Medizin und Biologie,
Franklin, J.L. & Trasher, J.H.: An introduction to program
11 (2), S. 2329, 1980.
evaluation. New York: Wiley, 1976.
Frassine, J.: Evaluation von sozialen Modellen auf Huler, P., Frey, K, Hoffmann, L., Rost, J., Spada, H.:
Klientenebene. sterreichische Zeitschrift fr Soziologie, Physikalische Bildung: Eine curriculare Delphi-Studie:
5/1, 1980, S. 5358. Teil I und Teil II. Kiel: IPN-Arbeitsberichte, 1980.
Freeman, H.E. & Solomom, M.A.: Das nchste Jahrzehnt Heckhausen, H.: Motivation und Handeln. Lehrbuch der
in der Evaluierungsforschung. In: Hellstern, G.-M. & Motivationspsychologie. Mnchen: Springer, 1989.
Wollmann, H. (Hrsg.): Handbuch zur Evaluierungs- Heider, F.: The Psychology of interpersonal relations. New
forschung, Bd. 1. Opladen: Westdeutscher Verlag, 1984, York: Wiley. 1958.
S. 134151. Hellstern, G.M. & Wollmann, H.: (Hrsg.): Handbuch zur
Frister, E.: Gewerkschaften und Hochschulen. Im Brenn- Evaluierungsforschung, Bd. 1. Opladen: Westdeutscher
punkt, Sonderausgabe Oktober 1972. Verlag, 1984.
Gabele, E. & Oechsler, W.A.: Fhrungsgrundstze und Fh- Henning, H.-J.: Skalenanalyse und Rasch-Modell. Bonn:
rungsmodelle, Bamberg: Bayerische Verlagsanstalt, 1984. Phil. Diss., 1974.
Gell, H. & Pehl, K.: Evaluation in der Erwachsenenbildung. Henning, H.J. & Kemnitz, W.: Evaluation of sequential
Bad Heilbronn: Klinkhardt, 1970. and categorical data. Bremer Beitrge zur Psychologie,
Geschka, H.: Kreativittstechniken in Produktplanung 1986.
und -entwicklung. In: Lhn (Hrsg.): Innovationsberater Hering, E.: Zertifizierung nach DIN EN ISO 9000: Proze-
II. Freiburg: Rudolf Hanfe Verlag, 1988. optimierung und Steigerung der Wertschpfung. Dssel-
Gigerenzer, P. & Sedlmeier, P.: Do studies of statistical dorf: VDI-Verlag, 1996.
power have effect on the power of studies? Psycho- Hermann, J.L., Morris, L.L., Taylor Fitz-Gibbon, C.:
logical Bulletin, 1989, 105, No. 2, S. 109316. Evaluators handbook. Beverly Hills: Sage, 1988.
Literaturverzeichnis 171
Herzberg, F.H., Mausner, B. & Snyderman, B.B.: The Lecher, T.: Datenschutz und psychologische Forschung. Gt-
motivation to work. New York: Wiley, 1959. tingen: Hogrefe, 1988.
Hilgard, E.R. & Bower, G.H.: Theories of learning. Levin, H.M., Glass, G.V., Meister, G.R.: Different
Engelwood Cliffs: Prenctice Hall, 1981. approaches to improving performance at school: a
Hirsch, G.: Die Kunst der freien Rede. Niederhausen/Ts.: coast-effectiveness comparison. Zeitschrift fr interna-
Falken-Verlag GmbH, 1985. tionale sozialwissenschaftliche Forschung, 3(2), 1986, S.
Hoerster, N.: Utilitaristische Ethik und Verallgemeinerung. 155176.
Freiburg: Alber, 1971. Lienert, G.A.: Testaufbau und Testanalyse. Weinheim:
Hoffe, O.: Einfhrung in die utilitaristische Ethik. Mn- Beltz, 1969.
chen: Beck, 1975. Linstone, H.A. & Turoff, M. (Eds.): The Delphi Method.
Hollmann, H.: Validitt in der Eignungsdiagnostik: neue London: Addison-Wesley, 1975
Anstze einer sachgerechten Bewertung und effizien- Lord, F.M. & Novik, M.R.: Statistical theories of mental test
ten Verbesserung. Gttingen: Hogrefe, 1991. scores., Reading/Mass. Addison-Wesley, 1968.
Holly, W.: Imagearbeit in Gesprchen. Tbingen: Max Nie- Lukesch, H. Schuppe, H., Dreher, E., Haenisch, H.,
meyer Verlag, 1979. Klaghofer, R.: Gesamtschule und dreigliedriges Schulsy-
Huber, K.: Einheit und Vielfalt in Denken und Sprache stem in Nordrhein-Westfalen. Paderborn: Schnigh. 1979.
Giordano Brunos. Winterthur: 1965. Lukie, M.: Evaluation, innerbetrieblicher Traineepro-
Hunter, J.E., Schmidt, F.L., Jackson, G.B.: Metaanalysis. gramme. In: Will, H., Winteler, A., Kapp, A.: Evaluati-
Cumulating research findings across studies. Beverly on in der beruflichen Aus- und Weiterbildung. Heidel-
Hills: Sage CA, 1984. berg: Sauer, 1987.
Jger, A.O.: Dimensionen der Intelligenz. Gttingen: Ho- Mason, S.F.: Geschichte der Naturwissenschaft in der Ent-
grefe, 1967. wicklung ihrer Denkweisen. Stuttgart: Krner, 1961.
Joint Committee on Standards for Educational Evaluati- Matt, G.E.: Meta-Analyse deutschsprachiger Psychothe-
on: The program evaluation standards: how to assess rapie der Jahre 1973-1982. Freiburg i. Br.: Unverffent-
evaluations of educational programms. Thousand Oaks: lichte Diplomarbeit im Fach Psychologie, 1983.
Sage, 1994. Mayer, R.E.: Denken und Problemlsen. Eine Einfhrung
Kasubek, W. & Aschenbrenner, K.M.: Optimierung sub- in menschliches Denken und Lernen. New York:
jektiver Urteile: Anwendung der Multiattributiven Springer, 1979.
Nutzentheorie bei medizinischen Therapieentschei- McClelland, D.C.: Opinions predict opinions: So what
dungen. Zeitschrift fr experimentelle und angewandte else is new? Journal of Consulting and Clinical
Psychologie 1978, 25, 594616. Psychology, (38) 1972.
Kittner, M.: Arbeits- und Sozialordnung. Kln: Bund, 1987. Meyer, W.U. & Schmalt, H.-D.: Die Attributionstheorie.
Klauer, K.L.: Kriteriumsorientierte Tests. Gttingen: Ho- In: Frey, D. & Irle M.: Theorien der Sozialspsychologie,
grefe, 1987. Bd. 1. Bern: Huber, 1984.
Klebert, K. & Schrader, W.G.: Kurzmoderation. Hamburg: Miles, M.B. & Hubermann, A.M.: Qualitative data analy-
Windmhle, 1987. sis. A sourcebook of new methods. Beverly Hills: Sage
Kleinmutz, B.: Computers in personality assessment. Morris- CA, 1984.
town: General Lerning Press, 1972. Mischel, W.: Preference for delayed reinforcement: An
Kleinmutz, B.: MMPI decision rules for the identification experimental study of a cultural observation. Journal
of college mal adjustment: A digital computer of abnormal and Social Psychology, 1958, 56, S. 5761.
approach. In: Psychological Monographs, 1963, 77. Mischel, W.: Processes in delay gratification. In: Berko-
Kopperschmidt, J.: Allgemeine Rhetorik. Stuttgart, Kohl- witz, L. (Ed.): Advances in experimental social psychology,
hammer, 1976. Vol.7. New York: Academic Press, 1974.
Knig, R.: Das Interview. Kln: Kiepenheuer & Witsch, Mittelstra, J. (Hrsg.): Enzyklopdie Philosophie und Wis-
1976. senschaftstheorie. Bd. 2. Mannheim: Wissenschafts-
Krauth, J. & Lienert, G.A.: Die Konfigurationsfrequenz- verlag, 1983.
analyse (KFA) und ihre Anwendung in Psychologie und Mitter, W. & Weishaupt, H. (Hrsg.): Anstze zur Analyse
Medizin. Ein multivariates nichtparametrisches Ver- der wissenschaftlichen Begleitung bildungspolitischer In-
fahren zur Aufdeckung von Typen und Syndromen. novationen. Weinheim, Beltz, 1977.
Freiburg: Adler, 1973. Moosbrugger, H.: Multivariate statistische Analyseverfah-
Krauth, J.: Testkonstuktion und Testtheorie. Weinheim: Psy- ren. Stuttgart: Kohlhammer, 1978.
chologie Verlags Union, 1995 Morris, L.L., Fritz-Gibbon, C.T., Freeman, M.E.: How to
Kromrey, H.: Empirische Sozialforschung: Modelle und Me- communicate evaluation findings. Beverly Hills: Sage,
thoden der Datenerhebung und Datenauswertung. Opla- 1988.
den: Leske & Budrich, 1995. Murray, H.A.: Explorations in personality. New York:
Kuhn, Th. S.: Die Struktur wissenschaftlicher Revolutionen. Oxford University Press, 1938.
Frankfurt a.M.: Suhrkamp, 1967. Offe, C. & Hinrichs, K.: Sozialkonomie des Arbeitsmark-
Lange, E.: Zur Entwicklung und Methodik der Evalua- tes und die Lage benachteiligter Gruppen von Arbeit-
tionsforschung in der Bundesrepublik Deutschland. nehmern. In: Projektgruppe Marktpolitik. Offe, C.
Zeitschrift fr Soziologie 3/1983, S. 253270. (Hrsg.): Opfer der Arbeitslosigkeit. Neuwied und
Langer, E.: The Psychology of control. Beverly Hills: Sage Darmstadt, 1977.
CA, 1983. Ortmann, R.: Zum Resozialisierungseffekt der Sozial-
Lantermann, E.D: Interaktionen. Person, Situation und therapie anhand einer experimentellen Lngsschnitt-
Handlung. Mnchen: Urban und Schwarzenberg, studie zu Justizvollzugsanstalten des Landes Nord-
1980. rhein-Westfalen. Empirische Ergebnisse und theo-
172 Literaturverzeichnis

retische Analysen. In: Mller-Dietz, H. & Walter, M. Rutmann, L.: Evaluation research methods: A basic guide.
(Hrsg.): Strafvollzug in den 90er Jahren. Perspektiven und Beverly Hills: Sage CA, 1977.
Herausforderungen. Pfaffenweiler: Zentaurus-Verlags- Sbandi, P: Gruppenpsychologie. Einfhrung in die Wirk-
gesellschaft, 1995. lichkeit der Gruppendynamik aus sozialpsycho-
Osborn, A.F.: Applied imagination. Principles and proce- logischer Sicht. Mnchen: Pfeiffer, 1973.
dures of creative problem solving. New York: Scharmberg, T., Whler, K., Finke, H.-O., Guski, R.: Be-
Scribners, 1963. eintrchtigung des Nachtschlafes durch Lrm. Um-
Osnabrgge, G. Stahlberg, D., Frey, D. & Irle, M. (Hrsg.): weltforschungsplan des Bundesministers des Inneren.
Theorien der kognizierten Kontrolle. In Frey, D. & Lrmbekmpfung. Forschungsbericht 82/10501207.
Irle, M. (Hrsg.): Theorien der Sozialpsychologie. Bern: Berlin: 1982.
Huber, 1985. Schfers, B.: Einfhrung in die Gruppensoziologie. Heidel-
Osterholt, G.: Vernderungsmanagement: Visionen und berg: Quelle & Meyer, 1980
Wege zu einer neuen Unternehmenskultur. Wiesbaden: Schein, E.H.: Unternehmenskultur: Ein Handbuch fr Fh-
Gabler, 1996. rungskrfte. Frankfurt: Campus-Verlag, 1995
Patry, J.-L. (Hrsg.): Feldforschung. Wien: Huber, 1982. Schmalt, H.-D.: Leistungsthematische Kognitionen 11,
Petermann, F. & Hehl, F.-J.: Einzelfallanalyse. Mnchen: Kausalattribuierungen, Erfolgserwartungen und Affek-
Baltimore, 1979. te. Zeitschrift fr Experimentelle und Angewandte Psycho-
Pfohl, H.-C.: Planung und Kontrolle. Stuttgart: Kohl- logie, 26,1979.
hammer, 1981. Schneider, H.-D.: Kleingruppenforschung. Stuttgart: Teub-
Pollard, W.E.: Bayesian statistics for evaluation research. ner, 1985.
An Introduction. Beverly Hills: Sage CA, 1986. Schnelle, E. (Hrsg.): Metaplan Gesprchstechnik. Kommu-
Preiser, S.: Kreativittsforschung. Darmstadt: Wissenschaft- nikationswerkzeug fr die Gruppenarbeit. Quickborn:
liche Buchgesellschaft, 1976, S. 94ff. Metaplan GmbH, 1982.
Prell, S.: Handlungsorientierte Schulbegleitforschung. Frank- Schulz, T., Muthig, K.-P., Koepller, K.: Theorie, Experiment
furt a.M.: Lang 1984.
und Versuchsplanung in der Psychologie. Stuttgart: Kohl-
Putz-Osterloh, W.: Problemlseprozesse und Intelligenzlei-
hammer, 1981.
stung. Bern: Huber, 1981.
Scriven, N.: Die Methodologie der Evaluation. In: Wulf,
Rausch, K.: Vergleichende Betrachtung psychologischer Ar-
C. (Hrsg.): Evaluation. Mnchen: Piper, 1972.
beitsanalyseverfahren vor dem Hintergrund ihrer Anwend-
Scriven, N.: The Logic of evaluation. California: Edg-Press,
barkeit zur Untersttzung komplexer militrischer Mensch-
1980.
Maschine-Systeme. BMVg P 11 4, Bonn, 1985.
Seiffke-Krenke, I.: Handbuch Psychologieunterricht. Bd. 1
REFA (Verband fr Arbeitsstudien und Betriebsorganisa-
tionen e.V.): Methodenlehre der Planung und Steuerung, & 2. Dsseldorf: Pdagogischer Verlag Schwann, 1981.
Teil 5. Mnchen: Hanser, 1985. Sherman, R.: Will goal attainment scaling solve the prob-
Reibnitz, U.v.: Die Szenario-Technik-Ein Instrument der lems of program evaluation in the mental health
Zukunftsanalyse und der strategischen Planung. In: field? In: Coursey, R.D., Specter, G.A., Murrel, S.A.,
Haase, H. & Koeppler, K. (Hrsg.): Fortschritte der Markt- Hunt, B.: Program Evaluation for mental health. Methods,
psychologie. Bd. 3. Frankfurt: Fachbuchhandlung fr strategies & participants. New York: Grunt & Stratton,
Psychologie Verlagsabteilung, 1983. 1977.
Ritter, J. & Grnder, K.: Historisches Wrterbuch der Philo- Siegel, S.: Nonparametic statistics. For the behavioral sci-
sophie. Bd. 6. Darmstadt: Wissenschaftliche Buch- ences. New York: McGraw Hill, 1956.
gesellschaft, 1982, S. 992ff. Siegward, H. & Menzel, J.: Kontrolle der Fhrungsaufgabe.
Rochel, H.: Planung und Analyse des allgemeinen linearen Bern: Haupt, 1978.
Modells. New York: Springer, 1983 Smith, M.L. & Glass, G.V.: Meta-analysis of social research.
Roethlisberger, F.J. & Dickson, U. J.: Management and the Beverly Hills: Sage CA, 1981.
worker. Cambridge: MIT-Press, 1939. Stelzel, I.: Ist der Modelltest des Rasch-Modells geeignet,
Rohn, W.E.: Methodik und Didaktik des Planspiels. Wup- Homogenittshyphothesen zu prfen? Ein Bericht
pertal: Deutsche Planspielzentrale, 1980 ber Simulationsstudien mit inhomogenen Daten.
Rohn, W.E.: Der Einsatz von Planspielen bei der Perso- Zeitschrift fr Experimentelle und Angewandte Psycholo-
nalauswahl. In: Personalfhrung 3/86, S. 117120 gie 1979, 26, S. 652672.
Rost, J.: Lehrbuch Testtheorie und Testkonstruktion. Bern: Stifel, R.Th.: Evaluierung als Chance. MAO, 1/1997, S. 27.
Huber, 1996. Stratemann, I. & Wottawa, H.: Brger als Kunden: Wie Sie
Rossi, P.H. & Freeman, H.E.: Evaluation. A systematic Reformkonzepte fr den ffentlichen Dienst mit Leben fl-
approach. Beverly Hills: Sage 1993. len. Frankfurt: Campus-Verlag, 1995.
Rossi, P.H.: Professionalisierung der Evaluationsfor- Stroebe, R.W. & Stroebe, G.H.: Grundlagen der Fhrung
schung? Beobachtungen zu Entwicklungstrends in mit Fhrungsmodellen. Heidelberg: Sauer 1984.
den USA. In: Hellstern, G.-M. & Wollman, H. ( Hrsg.): Stufflebeam, D.L.: Evaluation als Entscheidungshilfe. In:
Handbuch der Evaluationsforschung, Bd. 1. Opladen: Wulf, C. (Hrsg.): Evaluation. Mnchen: Piper, 1972.
Westdeutscher Verlag, 1984. Sturm, H.: Emotionale Wirkung des Fernsehens Jugendli-
Roth, E.: Sozialwissenschaftliche Methoden. Mnchen: Ol- che als Rezipienten. Mnchen: Verlag Dokumentatio-
denbourg, 1984. nen Saur KG, 1978.
Rust, H.: Interaktionsanalyse. Die Praxis der indirekten Sturm, U.: Erfolge durch kreative Teamarbeit. Oberhausen:
Interaktionsforschung in Psychologie und Psychothe- Verlag fr Wirtschafts- und Kartografie-Publikationen,
rapie. Mnchen: Urban & Schwarzenberg, 1983. 1979.
Literaturverzeichnis 173
Suchman, E.A.: Evaluative research: Principle and practice chronischen nicht spezifischen Atemwegserkran-
in public service and social action Programs. New kungen (CNSRD). Bericht fr den leitenden Arzt der BfA.
York: Russell. Sage, Foundation, 1967. Freiburg im Br., 1979 (unverffentlicht).
Tarpy, R.M.: Lernen. Experimentelle Grundlagen. New York: Wittrock, M.C. & Wiley, D.E.: The evaluation of instruc-
Springer, 1979. tion. New York: Holt, Rinehardt & Winston Inc., 1970.
Thiele, H.: Zur Beeinflussung des Entscheidungsverhal- Worthen, B.R. & Sanders, J.R.: Educational evaluation:
tens im Unterricht. In: Hofer, M. (Hrsg.): Informations- Theory and practice. Belmont, CA.: Wadsworth, 1973.
verarbeitung und Entscheidungsverhalten von Lehrern. Wottawa, H. & Echterhoff, K.: Formalisierung der dia-
Mnchen: Urban & Schwarzenberg 1980, S. 278311. gnostischen Urteilsfindung: Ein Vergleich von linea-
Thierau, H.: Effizienz von Evaluationsmanahmen in ren und auf Psychologenaussagen gesttzten kon-
der betrieblichen Weiterbildung. Diplomarbeit am Psy- figuralen Anstzen. Zeitschrift fr Differentielle und
chologischen Institut der Ruhr Universitt Bochum, 1987. Diagnostische Psychologie, 1982, 13, S. 301309.
Thombansen, U., Laske, M., Posseler, C. Rasmussen, B.: Wottawa, H. & Hof. A.: Individualmodelle zur Erfassung
Vertrauen durch Qualitt. Qualittsmanagement im handlungsrelevanter Strukturen als Hilfsmittel der
Weiterbildungsunternehmen. Mnchen: Verlag Neuer Verbesserung von Weiterbildungsmanahmen. In:
Merkur, 1994. Winterler, A., Krapp, A.: Evaluation in der beruflichen
Thorndike, R.L.: Personnel selection. Test and measure- Aus- und Weiterbildung. Konzepte und Strategien. Hei-
ment techniques. New York: Wiley, 1949. delberg: Sauer, 1987.
Trochim, W.N.K.: Research design for program evaluation. Wottawa, H. & Hossiep, R.: Grundlagen psychologischer
Beverly Hills: Sage CA, 1984. Diagnostik. Gttingen: Hogrefe, 1987.
Uleman, J.S.: The need for influence: development and Wottawa, H.: Evaluation. In: Weidenmann, B., Krapp,
validation or a measure and comparison with the A., Hofer, M., Haber, G.L., Mandl, H. (Hrsg.): Pdago-
need of power. Genetic Psychology Monographs, 1972. gische Psychologie. Mnchen: Urban & Schwarzenberg,
Ulmann, G.: Kreativitt. Weinheim: Beltz, 1968. 1986, S. 703733.
Wald, A.: Sequential analysis. New York: Wiley, 1966. Wottawa, H.: Die Kunst der manipulativen Bericht-
Waxweiler, R.: Psychotherapie im Strafvollzug. Eine empi- legung in der Evaluationsforschung. Zeitschrift fr
rische Erfolgsuntersuchung am Beispiel der sozial- Entwicklungspsychologie und Pdagogische Psychologie,
therapeutischen Abteilung in einer Justiz- XIII, 1, 1981, S. 4560.
vollzugsanstalt. Weinheim: Beltz, 1980. Wottawa, H.: Gesamtschule. Was sie uns wirklich bringt.
Weiner, B.: Motivationspsychologie. Weinheim: Beltz, 1984. Eine methodische Darstellung der Schulvergleiche in
Weiss, C.H.: Evaluierungsforschung. Opladen: Westdeut- Hessen, Nordrhein-Westfalen und Niedersachsen.
scher Verlag, 1974. Dsseldorf: Pdagogischer Verlag Schwann, 1982.
Weizscker, C.-F. v.: ber die moralische Verantwortung Wottawa, H.: Grundlagen und Probleme von Dimensionen
des Forschers. In: Das Parlament, 1983, 7 (2), S. 8. in der Psychologie. Meisenheim am Glan: Hain 1979.
Werbik, H.: Handlungstheorien. Stuttgart: Kohlhammer, 1978. Wottawa, H.: Hyphothesis agglutination (HYPAG): A
Will, H., Winterler, A., Krapp, A. (Hrsg): Evaluation in der method for configuration-based analysis of muti-
beruflichen Aus- und Weiterbildung. Konzepte und Strate- variate data. In: Methodika, 1, 1987, S. 6892.
gien. Heidelberg: Sauer, 1987. Wottawa, H.: Psychologische Methodenlehre. Mnchen:
Will, H., Winterler, A., Krapp, A.: Von der Erfolgskontrolle Juventa, 1988.
zur Evaluation. In: Will, H., Winterler, A., Krapp, A.: Wottawa, H.: Strategien und Modelle in der Psychologie.
Evaluation in der beruflichen Aus- und Weiterbildung. Kon- Mnchen: Urban & Schwarzenberg, 1984.
zepte und Strategien. Heidelberg: Sauer, 1987. S. 2530. Wottawa, H.: Projektmanagement. Wozu Planung, es geht
Winterfeldt, D.: Entscheidungshilfesysteme. In: Eckens- doch auch so? In: Engel, S.(Hrsg.): Die Diplomarbeit.
berger, L.H., Eckensberger, U.S. (Hrsg.): Bericht ber UTB Schfer-Poeschel, 1997.
den 20. Kongre der deutschen Gesellschaft fr Psycholo- Whe, G.: Einfhrung in die allgemeine Betriebswirtschafts-
gie in Saarbrcken 1972. Gttingen: Hogrefe 1974. lehre. Mnchen: Vahlen, 1986.
Witt, F.J.: No-Name-Produkte und Arbeitspolitik im Spie- Wulf, C. (Hrsg.): Evaluation. Beschreibung und Bewer-
gel einer empirischen Analyse des Verbraucherver- tung von Unterricht, Curricula und Schulversuchen.
haltens. Zeitschrift fr Markt-, Meinungs- & Zukunfts- Mnchen: Piper, 1972.
forschung, 1985, 28, S. 63136326. Wuing, H. (Hrsg.): Geschichte der Naturwissenschaft.
Wittmann, W.: Evaluationsforschung. Aufgaben, Probleme Kln: Aulis-Verlag Deubner, 1983.
& Anwendungen. Berlin: Springer, 1985. Zander, E.: Taschenbuch fr Fhrungstechnik. Heidelberg:
Wittmann, W.: Mglichkeiten der Evaluationsforschung Sauer, 1982.
im Rahmen des Verbandes deutscher Rentenver- Ziegenbein, K.: Controlling. Ludwigshafen: Kiehl, 1984.
sicherungstrger, dargestellt an einem empirischen Zink, F.: Wendezeit fr Manager: Wege zu einer neuen Unter-
Projekt zur Diagnostik und Schweregradeinteilung bei nehmenskultur. Ullstein, 1994.
175

9. Stichwortverzeichnis
advanced organizer 86f. Evaluationsformen 32
Arbeitsplan 116f. Evaluationsforschung 13
Arbeitsverhltnis 48f. Evaluationsmodell 62f.
Arbeitsvertrag, befristeter 49f. Evaluationsobjekt 59f.
Assoziationsketten 85ff. Evaluationsort 62f.
Auftraggeber, Rolle 20f. Feld 62f.
Auswertungsverfahren 134ff., 158ff. Labor 62f.
Evaluationsziele 29, 55f.
Balkenplantechnik 120ff. Evaluator, persnliche Voraussetzungen 51
Beobachtung 132 Evaluator, Rolle 37
Berichtlegung 159ff. Evaluator, selbststndiger 47f.
Bewertungshilfen 102ff.
Bewertungskriterien 83ff., 91f., 165f. Facettentheorie 100
Bewertungsproze 89ff. Faktorenanalyse 138
Brain-storming-Technik 87f. Fallbeispiel
Bundesdatenschutzgesetz 155f. als Methode 95
fr Evaluationsprojekte 70f.
Cherkoff-Gesichter 183 Forschung, entscheidungsorientiert 36
Controlling 70ff. Forschung, schlufolgeorientiert 36
Curriculumsentwicklung 75ff. Fragebogenkonstruktion, Probleme 133f.

Datenerhebungsverfahren 131ff. Geheimnisverrat 157f.


Datenqualittskontrolle 150 Gesamtnutzen 102
Datenschutz 154f. Goal-Attainment-Scale (GAS) 98
Delphi-Methode 108f. GUHA 140
Designfragen 124ff.
Designs, experimentelle 126ff. Handlungsmodell 18f.
Designs, quasi-Experimentelle 126ff. Handlungsoptimierung 18f.
Deskriptive Kennzahlen 136ff. HYPAG-Structure 97ff.
Dienstvertrag 48f. HYPAG/search 140ff.
DIN -EN-ISO -9000 43ff.
Ideographische Anstze 95f.
Effektstrke 135ff. Indikator 87
Entscheidungsbaumverfahren 124 Informationsverdichtung 161f.
Entscheidungshilfen 102ff. Inhaltsanalyse 140
Entscheidungsknoten 123 Inhaltsvaliditt 99
Entscheidungsnetzplan-Verfahren 123 Inkommensurabilitt 39
Erwartung-mal-Wert-Prinzip 103ff. Interview 95ff.
Evaluation, allgemeine Kennzeichen 13f., 68 Interviewerkontrolle 151f.
Evaluation, Definitionen 13 Interviewtechniken 133f.
Evaluation, formativ 32ff., 64 Itemkonstruktion, rationale 101
Evaluation, geschichtliche Entwicklung 25ff., 58 Itemkonstruktion, regelgeleitete 101
Evaluation, Interdisziplinaritt 66ff.
Evaluation, nicht-sozialwissenschaftlich 43f. Konfigurale Techniken 141f.
Evaluation, psychologische Voraussetzungen 23f. Konfigurationsfrequenzanalyse 140
Evaluation, rechtliche Bedingungen 46f. Konfliktmanagement 148f.
Evaluation, summativ 32, 64 Konstrukt 87
Evaluation, Zukunftsperspektiven 164 Kontextabhngigkeit 140
Evaluationsbereich 57ff. Kontrollkompetenz 21
176 Stichwortverzeichnis

Kontrollsysteme 70ff. Privatsphre, Schutz der 154


Koordinierte Rollenspiele 39 Programmevaluation 13
Korrelation 137f. Projektkontrolle 148ff.
Kosten- und Investitionskontrolle 71f. Projektmanagement 114ff.
Kostenabschtzung 117ff.
Kreativittstechniken 85 Qualittsmanagement 43f.
Kriteriums-Nutzen-Beziehung 103f. Qualitative Auswertungsverfahren 140
Kriteriumsvaliditt 99 Quick-Look-Plan 120
Kritischer Weg 122
Reifung 125ff.
Legalistische Position 42 Relevanz 136f.
LISREL-Modell 139 Rcklaufquote 152

Managementsubsysteme 70 Schriftliche Befragung 152


Matrix-Sampling 102 Schulbegleitforschung 75ff.
Messung, kriteriumsorientierte 99 Screening-Verfahren 106
Messung, nomothetische 96ff. Sequentialstatistik 134
Messung, per-fiat 98 Signifikanz 136f.
Meta-Analyse 138 Statistische Inferenz 136
Metaplan-Technik 93 Steuerungsmodelle 28, 167
Modellanstze, allgemein lineare 138ff. Strukturanalyse 117f.
Modelle, logistische 101f. Strukturlegetechnik 96
Modelle, probabilistische 101f. Subjektive Theorien 86
Mokken-Skalierung 101 Systematische Itemkonstruktion 100
Moralische Verantwortung 15f. Szenario-Technik 90f.
Mortalitt 125ff.
Multiattributive Nutzentechnik (MAUT) 103ff. t-Wert 137f.
multiple-cut-off-Strategien 106f. Testkonstruktion 99
Trennschrfe 101
Nebenfolgenabschtzung 92
Netzplantechnik 121f. Ultimate Criterion 19, 42
Nicht-quivalenz 125 Umsetzungsregeln fr Stoffgebiete 99
Normierte Skalenwerte 135 Untersuchungsplne 126ff.
Nutzen 83ff. belminimierung 21f.
Nutzenbestimmung 102f.
Nutzenmessung, eindimensional 103ff. Verstehen 142
Nutzenmessung, mehrdimensional 103ff.
Nutzenverrechnung 102 Weiterbildungserfolg 71f.
Werkvertrag 48f.
Operationalisierung: Fragen/Probleme 94f. Wissenschaft 15

pareto-optimale Teilmenge 106 Zeitabschtzung 117f.


Personalfhrung 146f. Zeitanalyse 117f.
Pfadanalyse 139 Zielexplikation 83ff.
Planspiel 91 Zielgruppenanalyse 160f.
Planungszelle 109ff. Zielgruppenbestimmung 85f.
Populationsabhngigkeit 138 Zielhierarchie 89ff.
Prsentationsformen 161f. Zielkonflikte 55, 85
175

9. Stichwortverzeichnis
advanced organizer 86f. Evaluationsformen 32
Arbeitsplan 116f. Evaluationsforschung 13
Arbeitsverhltnis 48f. Evaluationsmodell 62f.
Arbeitsvertrag, befristeter 49f. Evaluationsobjekt 59f.
Assoziationsketten 85ff. Evaluationsort 62f.
Auftraggeber, Rolle 20f. Feld 62f.
Auswertungsverfahren 134ff., 158ff. Labor 62f.
Evaluationsziele 29, 55f.
Balkenplantechnik 120ff. Evaluator, persnliche Voraussetzungen 51
Beobachtung 132 Evaluator, Rolle 37
Berichtlegung 159ff. Evaluator, selbststndiger 47f.
Bewertungshilfen 102ff.
Bewertungskriterien 83ff., 91f., 165f. Facettentheorie 100
Bewertungsproze 89ff. Faktorenanalyse 138
Brain-storming-Technik 87f. Fallbeispiel
Bundesdatenschutzgesetz 155f. als Methode 95
fr Evaluationsprojekte 70f.
Cherkoff-Gesichter 183 Forschung, entscheidungsorientiert 36
Controlling 70ff. Forschung, schlufolgeorientiert 36
Curriculumsentwicklung 75ff. Fragebogenkonstruktion, Probleme 133f.

Datenerhebungsverfahren 131ff. Geheimnisverrat 157f.


Datenqualittskontrolle 150 Gesamtnutzen 102
Datenschutz 154f. Goal-Attainment-Scale (GAS) 98
Delphi-Methode 108f. GUHA 140
Designfragen 124ff.
Designs, experimentelle 126ff. Handlungsmodell 18f.
Designs, quasi-Experimentelle 126ff. Handlungsoptimierung 18f.
Deskriptive Kennzahlen 136ff. HYPAG-Structure 97ff.
Dienstvertrag 48f. HYPAG/search 140ff.
DIN -EN-ISO -9000 43ff.
Ideographische Anstze 95f.
Effektstrke 135ff. Indikator 87
Entscheidungsbaumverfahren 124 Informationsverdichtung 161f.
Entscheidungshilfen 102ff. Inhaltsanalyse 140
Entscheidungsknoten 123 Inhaltsvaliditt 99
Entscheidungsnetzplan-Verfahren 123 Inkommensurabilitt 39
Erwartung-mal-Wert-Prinzip 103ff. Interview 95ff.
Evaluation, allgemeine Kennzeichen 13f., 68 Interviewerkontrolle 151f.
Evaluation, Definitionen 13 Interviewtechniken 133f.
Evaluation, formativ 32ff., 64 Itemkonstruktion, rationale 101
Evaluation, geschichtliche Entwicklung 25ff., 58 Itemkonstruktion, regelgeleitete 101
Evaluation, Interdisziplinaritt 66ff.
Evaluation, nicht-sozialwissenschaftlich 43f. Konfigurale Techniken 141f.
Evaluation, psychologische Voraussetzungen 23f. Konfigurationsfrequenzanalyse 140
Evaluation, rechtliche Bedingungen 46f. Konfliktmanagement 148f.
Evaluation, summativ 32, 64 Konstrukt 87
Evaluation, Zukunftsperspektiven 164 Kontextabhngigkeit 140
Evaluationsbereich 57ff. Kontrollkompetenz 21
176 Stichwortverzeichnis

Kontrollsysteme 70ff. Privatsphre, Schutz der 154


Koordinierte Rollenspiele 39 Programmevaluation 13
Korrelation 137f. Projektkontrolle 148ff.
Kosten- und Investitionskontrolle 71f. Projektmanagement 114ff.
Kostenabschtzung 117ff.
Kreativittstechniken 85 Qualittsmanagement 43f.
Kriteriums-Nutzen-Beziehung 103f. Qualitative Auswertungsverfahren 140
Kriteriumsvaliditt 99 Quick-Look-Plan 120
Kritischer Weg 122
Reifung 125ff.
Legalistische Position 42 Relevanz 136f.
LISREL-Modell 139 Rcklaufquote 152

Managementsubsysteme 70 Schriftliche Befragung 152


Matrix-Sampling 102 Schulbegleitforschung 75ff.
Messung, kriteriumsorientierte 99 Screening-Verfahren 106
Messung, nomothetische 96ff. Sequentialstatistik 134
Messung, per-fiat 98 Signifikanz 136f.
Meta-Analyse 138 Statistische Inferenz 136
Metaplan-Technik 93 Steuerungsmodelle 28, 167
Modellanstze, allgemein lineare 138ff. Strukturanalyse 117f.
Modelle, logistische 101f. Strukturlegetechnik 96
Modelle, probabilistische 101f. Subjektive Theorien 86
Mokken-Skalierung 101 Systematische Itemkonstruktion 100
Moralische Verantwortung 15f. Szenario-Technik 90f.
Mortalitt 125ff.
Multiattributive Nutzentechnik (MAUT) 103ff. t-Wert 137f.
multiple-cut-off-Strategien 106f. Testkonstruktion 99
Trennschrfe 101
Nebenfolgenabschtzung 92
Netzplantechnik 121f. Ultimate Criterion 19, 42
Nicht-quivalenz 125 Umsetzungsregeln fr Stoffgebiete 99
Normierte Skalenwerte 135 Untersuchungsplne 126ff.
Nutzen 83ff. belminimierung 21f.
Nutzenbestimmung 102f.
Nutzenmessung, eindimensional 103ff. Verstehen 142
Nutzenmessung, mehrdimensional 103ff.
Nutzenverrechnung 102 Weiterbildungserfolg 71f.
Werkvertrag 48f.
Operationalisierung: Fragen/Probleme 94f. Wissenschaft 15

pareto-optimale Teilmenge 106 Zeitabschtzung 117f.


Personalfhrung 146f. Zeitanalyse 117f.
Pfadanalyse 139 Zielexplikation 83ff.
Planspiel 91 Zielgruppenanalyse 160f.
Planungszelle 109ff. Zielgruppenbestimmung 85f.
Populationsabhngigkeit 138 Zielhierarchie 89ff.
Prsentationsformen 161f. Zielkonflikte 55, 85

Das könnte Ihnen auch gefallen