Sie sind auf Seite 1von 29

1.

Einführung in die psychologische Diagnostik


1.1 Begriffsbestimmung
• Psychologische Methoden sind entscheidend für die psychologische Diagnostik und
die Anwendung von diagnostischen Verfahren
• Psychologischen Methoden = Vorgehensweisen, mit deren Hilfe wir Antworten auf
Fragen aus dem Gegenstandsbereich der Psychologie erhalten können
• Diagnostik untersucht interindividuelle Unterschiede im Verhalten und Erleben als
auch intraindividuelle Merkmale und Veränderungen
Gegenstandsbereich der Psychologie = Erleben, Verhalten und Handeln des Menschen
Psychologische Diagnostik = systematisches und zielgerichtetes Sammeln von Daten
nach wissenschaftlichen Methoden

1.2 Geschichte der psychologischen Diagnostik


Ø 1879: Wilhelm Wundt eröffnet das erste psychologische Labor und dadurch
gründete er die empirische, experimentell orientierte Psychologie mit
Ø 1917/1918: Entwicklung und Einsatz des ersten Gruppentests (Army Alpha & Beta
Examination)
Ø 1917/1918: Entwicklung der ersten modernen Persönlichkeitstests (Personal Data
Sheet)
Ø 1921: Der Rorschachtest wird publiziert
Ø 1939: Der erste Wechsler-Test erscheint
Ø 1943: Das MMPI wird publiziert

Entwicklung der Intelligenzmessung


Ø 1905: Erarbeitung des ersten Intelligenztests (Alfred Binet/ Theodor Simone)
Þ Testung intellektueller Fähigkeiten auf einem höheren Komplexitätsniveau
Þ Tatsächliche Leistung eines Kindes in Relation mit der alterstypischen Leistung
Þ Bestimmung des Intelligenzalters: Kinder einer Altersstufe wurden so lange
Aufgaben unterer Altersklassen gegeben, bis die Lösung der Aufgaben gerade
noch möglich war + Vorlegung schwieriger Aufgaben aus höheren Altersklassen,
bis keine Aufgaben richtig gelöst wurden
Ø 1912: William Stern prägte den Begriff des Intelligenzquotienten (IQ)
Þ Mittelwert beträgt definitionsgemäß 100 (Standardabweichung = 15)
Ø 1939: Publikation des ersten Wechsler-Intelligenztests
Þ normierte die Testergebnisse für seinen Test innerhalb jeder Altersstufe
Intelligenzquotient = Quotient aus Intelligenzalter (IA) geteilt durch Lebensalter
(LA) multipliziert mit 100; später Quotient aus Testwert des Probanden geteilt
durch Mittelwert der Altersgruppe
Entwicklung von Persönlichkeitstests
• Rorschachtest: Tintenklecksbilder werden als mehrdeutige Reize verwendet – die
Interpretation des Tintenkleckses sagte etwas über die Persönlichkeit des
Probanden aus (heute sehr kritisch)
• Thematischer Apperzeptions-Test (TAT): Vorführung mehrdeutige Reize –
Probanden sollen hierbei eine Geschichte zu den Stimuli erzählen, um
Persönlichkeitseigenschaften und Motive aufzudecken

1.3 Klassifikationssysteme in der Diagnostik


Klassifikation = Einordnung von Phänomenen, die durch bestimmte gemeinsame
Merkmale charakterisiert sind, in ein nach Klassen gegliedertes System

Exkurs in die klinische Psychologie


• Es gilt aufgrund vorhandener Symptome die dazu adäquate Störungsklasse oder
Störungskategorie zuzuordnen
• Grundidee: aus einer möglichst reliablen Zuordnung und Diagnose auf Basis der
klassifikatorischen Diagnostik eine möglichst effektive Intervention ableiten zu
können
Þ Ohne Diagnose keine Intervention (Behandlung)
• Interpretation und Bedeutung von Symptomen, Verhalten oder Ergebnissen in
Tests/ Fragebögen
Klassifikationssysteme = dienen der zuverlässigen Zuordnung von Merkmalen und
Personen zu verschiedenen Klassen, z.B. ICD und DSM

Die ICD
• ICD-10: International Classification of Diseases in der zehnten Auflage
• dient der Codierung und Einordnung sämtlicher Krankheiten
• im deutschen Gesundheitssystem für die Diagnosestellung von
Rentenversicherungsträgern und Krankenkassen vorgesehen
• Alle Kapitel sind mit einem Buchstaben versehen
Ø Psychische Störungen sind durch F-Codes gekennzeichnet (Kapitel V)
Hauptkategorien der ICD-10
F0 Organische, einschließlich symptomatischer, psychischer Störungen

F1 Psychische und Verhaltensstörungen durch psychotrope Substanzen

F2 Schizophrenie, schizotype und wahnhafte Störungen

F3 Affektive Störungen

F4 Neurotische, Belastungs- und somatoforme Störungen

F5 Verhaltensauffälligkeiten mit körperlichen Störungen und Faktoren

F6 Persönlichkeits- und Verhaltensstörungen

F7 Intelligenzminderung

F8 Entwicklungsstörungen

F9 Verhaltens- und emotionale Störungen mit Beginn in der Kindheit und Jugend

Ø Weitere Untergliederung durch die dezimalnumerischen Untergruppen (Bsp. die


generalisierte Angststörung F41.1)

Das DSM
• Diagnostic and Statistical Manual of Mental Diseases
• amerikanisches Klassifikationssystem für psychische Erkrankungen

Historischer Exkurs DSM–IV


• Achse 1: klinische Störungen (z.B. depressive Episoden)
• Achse 2: bezieht sich u.a. auf die Diagnostik von Persönlichkeitsstörungen (z.B.
antisoziale Persönlichkeitsstörung)
• Achse 3: medizinische Krankheitsfaktoren
• Achse 4: psychosoziale Probleme (etwa im sozialen Umfeld, Arbeitsleben etc.)
• Achse 5: Erfassung des globalen Funktionsniveaus (GAF)

DSM–V
• Verzicht auf polyaxiale Gestaltung
• Diagnosekonglomerat „Demenz, Delirien und amnestische Störungen“ wird durch
die Diagnosegruppe „neurokognitive Störungen“ ersetzt
Ø Vorteil: Konzept Neurokognitive Störungen ist deutlich breiter gefasst als der
Demenzbegriff
Vorteile von Klassifikationssystemen
+ Erleichterung der Kommunikation durch eine klar definierte Nomenklatur
+ Informationsreduktion ist sinnvoll und notwendig, da eine erschöpfende
Beschreibung von Einzelfällen weder möglich noch praktikabel ist
+ Wirtschaftliche Informationsvermittlung, da von Diagnosen auf Störungsmerkmale
geschlossen werden kann
+ Feststellen von überzufälligen Syndromen, d.h., bestimmte klinische Merkmale
treten besonders häufig zusammen auf
+ Basis für Wissensakkumulation

Nachteile von Klassifikationssystemen


- Diagnostische Etiketten (Labels) fördern bzw. bewirken Stigmatisierung
- Informationsverlust durch ungenügende Beschreibung des Einzelfalls
- Risiko des Vertauschens von Deskription und Erklärung
- Künstliche Klassen erhalten einen unangemessenen Realitätsgehalt
- Klassen verdecken zugrunde liegende Dimensionen
- Mangelnder praktischer Nutzen, da keine spezifische Therapie aus Diagnosen
folgt

1.4 Arten psychologischer Diagnostik


Unterscheidungsmerkmale:
Status- vs. Veränderungsdiagnostik:
• Statusdiagnostik: Erfassung des Ist-Zustandes, etwa des aktuellen
Leistungsgrades (Eingangsdiagnostik z.B. vor einer psychologischen Intervention)
• Veränderungsdiagnostik: Vergleich zweier Zustände im Zeitverlauf

Norm- vs. kriteriumsorientierte Diagnostik:


• Normorientiert: individuelle Merkmalswerte werden mit einer Bezugsgruppe
(Normgruppe) verglichen
• Kriteriumsorientiert: Vergleich mit einem Kriterium, z.B. Studienabschluss, Gehalt
etc.

Dimensionale vs. klassifikatorische bzw. kategoriale Diagnostik:


• Dimensional: Merkmalsausprägungen werden auf kontinuierlichen Dimensionen
abgebildet, z.B. psychische Leistungstests, welche es ermöglichen, die Leistung
einer Person auf verschiedenen Leistungsdimensionen festzustellen
• Klassifikatorisch/Kategorial: Tendenz, Sachverhalte aufgrund gemeinsamer
charakteristischer Merkmale in diskrete Gruppen einzuteilen (erfolgt mithilfe von
Klassifizierungssystemen)
1.5 Anwendungsbereiche psychologischer Diagnostik
Bereich Zweck psychologischer Diagnostik Gesellschaftlicher Nutzen

Pädagogische Schullaufbahnbetreuung höhere Lebenszufriedenheit der richtig


Psychologie platzierten Schüler, eventuell später
bessere Berufschancen, effizienter
Einsatz der Ressource Schule

Klinische Erkennen und genaue Bestimmung Patienten werden einer Therapie


Psychologie von psychischen Störungen zugeführt, die ihre Lebenszufriedenheit
und eventuell ihre berufliche
Leistungsfähigkeit verbessert und ihre
Suizidgefährdung reduziert

Forensische Straftäter erkennen, die ein hohes Gesellschaft wird vor schweren
Psychologie Risiko aufweisen, nach ihrer Straftaten geschützt; eventuell
Entlassung wieder schwere weitere Behandlung, die ihm später ein
Straftaten zu begehen straffreies Leben ermöglicht

Personal- Potenzialanalyse (Stärken und gezielte Förderung der Mitarbeiter


psychologie Schwächen von Mitarbeitern durch Einsatz, der ihren Fähigkeiten
erkennen) gerecht wird;
Personalentwicklungsmaßnahmen zur
Behebung von Schwächen

Verkehrs- Verkehrseignung von Personen Gesellschaft wird vor gefährlichen


psychologie überprüfen, die wegen Trunkenheit Verkehrsteilnehmern geschützt;
am Steuer oder anderer Delikte Betroffenen wird eventuell ein Weg
ihren Führerschein verloren haben aufgezeigt, wie sie an sich arbeiten
können, um wieder eine Fahrerlaubnis
zu erhalten.

1.6 Der diagnostische Prozess


• personale, zeitliche, strategische und organisatorische Erstreckung zwischen
vorgegebenen Fragestellungen sowie Beantwortung dieser
• zuerst eher allgemeine und später immer spezifischere Fragestellungen
• Beantwortung findet in Form einer Pro- oder Diagnose statt
Schritte des diagnostischen Handelns
Ø Kontakt mit dem Auftraggeber (Interaktionsprozess (v.a. mit dem Auftragsgeber
und Proband))
Ø Unspezifische Fragestellung wird konkretisiert und operationalisiert, um einen
möglichst klaren, eindeutigen Auftrag zu bekommen (hypothesengeleitetes
Vorgehen)
Ø Welche Daten und Quellen zur Beantwortung der Fragestellung? (Oft eine
Kombination aus Verfahren wie Interviews, Beobachtungen und psychologischen
Tests)
Ø Diagnostische Untersuchung: relevante Daten werden erhoben (auch
Nacherhebungen oder Wiederholungen)
Ø Diagnostische Urteilsbildung, in der die Ergebnisse integriert werden
Ø Rückmeldung der Ergebnisse an den Auftraggeber (meist auch Probanden) im
Rahmen eines psychologischen Gutachtens

1.7 Testarten
Test = wissenschaftlich begründetes methodisches Verfahren zur Erfassung eines
oder mehrerer Merkmale, um eine möglichst genaue quantitative Aussage über den
relativen Grad einer individuelle Merkmalsausprägung treffen zu können (Echterhoff)

• Bestandteile sind i.d.R. mehrere Fragen/Aufgaben (Items)


• Werden von verschiedenen Menschen mit unterschiedlichen Eigenschaften oder
Fähigkeiten nicht gleich beantwortet
Þ „standardisierte Verhaltensstichprobe, die aus Antworten auf eine Mehrzahl
von Items besteht. Aus den Antworten wird der Testwert der untersuchten
Person aggregiert.“

Leistungstests
Leistungstests = Tests, die (v. a. kognitive) Merkmale zu einem objektiven
Gütestandard in Beziehung setzen

Intelligenztest HAWIE (Hamburg-Wechsler-Intelligenztest)


• Von historischem Interesse, v. a. da heutzutage neuere Entwicklungen (Wechsler
Adult Intelligence Scales – Revision IV/WAIS IV) existieren
• Aufgaben des neueren WAIS–IV bauen auf den Aufgaben des HAWIE auf
• Besteht aus einem Verbal- und einem Handlungsteil
Skala Beispiel einer mittelschweren Aufgabe

Allgemeines Wissen Was ist der Koran?

Zahlen die Zahlen 6-1-9-4-7-3 vorwärts und rückwärts nachsprechen


nachsprechen

Wortschatztest die Bedeutung des Wortes „Parlament“ erklären

Rechnerisches 2 Bananen kosten 31 Pfennige. Wie viel müssen Sie für ein Dutzend
Denken Bananen bezahlen?

Allgemeines 2 Begründungen für das gesetzliche Arbeitsverbot für Kinder geben


Verständnis

Gemeinsamkeiten Was haben Auge und Ohr gemeinsam?


finden

Bilder ergänzen herausfinden, dass bei einer Brillen-Zeichnung der Nasenflügel fehlt

Bilder ordnen Bilder so ordnen, dass sich daraus eine sinnvolle Geschichte ergibt

Mosaiktest die Teile eines Mosaiks nach einem Vorbild richtig anordnen

Figuren legen ein Puzzle aus 7 Teilen innerhalb von 35 Sekunden zusammensetzen

Zahlen-Symbol- innerhalb von 90 Sekunden möglichst viele Symbole zu Zahlen nach


Test einer Zahl-Symbole-Liste zuordnen

Ø Ersten sechs Subtests zählen zum Verbalteil, die letzten fünf zum Handlungsteil

Aufmerksamkeits-Belastungs-Test (d2-Revision)
• Allgemeiner Leistungstest zur Erfassung von Aufmerksamkeitsleistung und
Konzentrationsfähigkeit
• Leistung kann durch Schnelligkeit und Fehlerrate beschrieben werden
• Unter Zeitdruck müssen einfach visuelle Reize diskriminiert werden
• Testblatt, bei dem d oder p und ein bis vier Striche möglich sind
• Drei Zielobjekte (d mit zwei Strichen) und zehn Distraktoren (Pro Zeile gibt es
ein Zeitlimit von 20 Sekunden)
Ausschnitt aus dem Testbogen des d2-R

Persönlichkeitstests – NEO–Fünf-Faktoren-Inventar (NEO–FFI)


• Dient der Erfassung der „Big–Five“–Persönlichkeitseigenschaften (Extraversion,
Offenheit für neue Erfahrungen, Gewissenhaftigkeit, Neurotizismus,
Verträglichkeit)
• Erfasst fünf Eigenschaftsdimensionen anhand von jeweils zwölf Items

(1) Ich bin nicht leicht beunruhigt.

(2) Ich habe gerne viele Leute um mich herum.

(3) Ich mag meine Zeit nicht mit Tagträumereien verschwenden.

(4) Ich versuche, zu jedem, dem ich begegne, freundlich zu sein.

(5) Ich halte meine Sachen ordentlich und sauber.

(6) Ich fühle mich anderen oft unterlegen.

(7) Ich bin leicht zum Lachen zu bringen.

(8) Ich finde philosophische Diskussionen langweilig.

Freiburger Persönlichkeitsinventar (FPI-R)


• Anwendungsmöglichkeiten: z.B. Psychotherapie, Rehabilitation, Psychosomatik,
chronische Erkrankungen etc.
• Besteht aus zwölf Skalen: Gehemmtheit, Soziale Orientierung,
Leistungsorientierung, Erregbarkeit, Aggressivität, Beanspruchung, Körperliche
Beschwerden, Lebenszufriedenheit, Gesundheitssorgen, Offenheit, Extraversion
und Emotionalität
Jede Skala besteht aus mehreren Items (zu beobachtenden Verhaltensweisen) die
idealerweise den Fragebogenitems inhaltlich ähnlich sind
2. Testtheorien
2.1 Klassische Testtheorien (KTT)
Testtheorien schaffen die Grundlage für eine möglichst präzise Messung der
Merkmalsausprägungen durch Testverfahren

Axiome der Klassischen Testtheorie (KTT)


KTT besteht aus einer Reihe von Axiomen (erlauben praktisch sinnvolle Ableitungen,
die im Rahmen der Testkonstruktion nutzbar gemacht werden)

Axiome der Klassischen Testtheorie


1. Axiom Der Testwert setzt sich zusammen aus dem wahren Wert (T) und dem Fehler (E).
X = T+ E

2. Axiom Jede Messung setzt sich aus einem wahren Wert (T) und einem zufälligen
Messfehler (E) zusammen.

3. Axiom Die Korrelation zwischen dem Messfehler (E) und den wahren Werten (T) bei
beliebigen Personen und Items beträgt null.

Ø Zufällige Messfehler können einem Intelligenztest z.B. Müdigkeit,


Kopfschmerzen, Leichtsinnsfehler etc. sein
Ø (2. Axiom): Testwert (X) ist ein erwartungstreuer Schätzer vom „wahren“ Wert
(T)
Ø Mittelwert des Messfehlers ist Null
Ø 3. Axiom bezieht sich auf die Unabhängigkeit von Fehler (E) und wahrem Wert (T)
Ø Zusatzannahmen, die auch als 4. Und 5. Axiom bezeichnet werden: die
Unabhängigkeit des Fehlers (E) einer Messung vom wahren Wert (T) einer anderen
Messung – im „4. Axiom“ postuliert – sowie – als „5. Axiom“ – die
Unabhängigkeit von Fehler (E) aus zwei Messungen

Interpretation des Testwertes


• Standardmessefehler beschreibt die zu erwartende Streuung der beobachteten
Testwerte um den wahren Wert des Probanden herum
• Hauptanliegen der KTT: Abschätzung dieses Messfehlers und somit der
Zuverlässigkeit (Reliabilität) der Messung
Þ Diese ist der Quotient aus wahrer und beobachteter Varianz bzw. der Anteil
der Variation der wahren Werte an den beobachteten Werten oder
beispielsweise die Korrelation zweier Paralleltests
Grenzen der KTT
• Reine Messfehlertheorie
• Ähnelt einer rein physikalischen Messung
• Messfehler ist zentral und es wird davon ausgegangen, dass er unsystematisch ist
Þ Jedoch sind nicht alle Fehlereinflüsse unsystematisch
• Axiome sind nicht wirklich prüfbar bzw. nur schwer haltbar
Þ sie ergeben sich logisch aus der Festsetzung des beobachteten Wertes als
wahrer Wert plus Messfehler

2.2 Item–Response–Theorien (IRT)


• sehen systematische Anteile in der Messfehlervarianz (z.B. Übungs- und
Transfereffekte, systematisch Wechselwirkungen zwischen Person und Situation)
• beschäftigt sich mit der Begründung des Rückschlusses von manifestem Verhalten
(beobachtbaren testwerten und Indikatoren) auf latente Variablen
(psychologische Konstrukte)
Þ untersuchte Merkmale, z.B. Persönlichkeitseigenschaften oder
Leistungsparameter, werden als latente Variablen angesehen, die
beobachtbaren Testwerte als Indikatoren dieser

Jede beobachtbare Reaktion eines Probanden auf ein Item besteht aus drei
Anteilen:
1. Eigenschaft der Person (z.B. Fähigkeit) -> Personenparameter
2. Eigenschaft des Items (z.B. Schwierigkeit) -> Itemparameter
3. Zufall (unkontrollierbare Einflüsse)
Þ Personenparameter: Wahrscheinlichkeit, mit der eine Person Items in einem
Testverfahren lösen kann
Þ Itemparameter: Wahrscheinlichkeit, mit der ein Item von den Personen, die den
Test absolvieren, gelöst wird
Þ Die Wahrscheinlichkeit, dass Person w Item j richtig löst, hängt sowohl davon ab
wie schwer das Item, als auch davon, wie fähig die Person ist

Ø Die Wahrscheinlichkeit, dass Person w Item j richtig löst, hängt sowohl davon ab
wie schwer das Item, als auch davon, wie fähig die Person ist
Die Item-Response-Funktion bildet das Verhältnis zur latenten Variable ab. Ihre
Steigung repräsentiert an ihrem Wendepunkt jene Stelle, an welcher ein Item am
stärksten zwischen Personen mit niedrigeren und höheren Merkmalsausprägungen
unterscheidet

Parameterschätzung
• Ziel der IRT: Schätzung der vorher unbekannten Parameter des Items (durch
Anwendung der Maximum-Likelihood-Schätzung: aufwendige Berechnung ist nur
computergestützt möglich)

Rasch-Modell
• Modelle der IRT, das versucht, den Rückschluss vom manifesten
Antwortverhalten auf latente Variablen zu begründen
• Nur bei Items mit dichotomen Antwortmöglichkeiten (z.B. „stimmt“/“stimmt
nicht“) anwendbar
• Alle Items einer Skala/Tests erfassen dieselbe latente Dimension (z.B. Fähigkeit,
Einstellung, Persönlichkeitseigenschaft) mit unterschiedlichen
Itemschwierigkeiten, aber jeweils identischer Trennschärfe

Birnbaum-Modell (2PL-Modell)
• Hierbei findet die logistische IC-Funktion Anwendung
• Erlaubt unterschiedliche Steigung, indem es neben dem Schwierigkeitsparameter
zusätzlich als zweiten Itemparameter einen Diskriminationsparameter enthält
Þ Verschiedene Items können unterschiedlich gut zwischen schwächeren und
stärkeren Merkmalsausprägungen trennen (drückt sich in unterschiedlichen
Steilheiten der IC-Funktion aus)

2.3 Kombination aus KTT und IRT


> IRT verfügen über viel fundiertere theoretische Grundlagen
> IRT stellt eine sinnvolle Ergänzung dar, da in der Praxis gewisse Grenzen gesetzt
sind
Þ Itemanalysen sollten getrennt nach KTT und IRT unabhängig voneinander
durchgeführt werden
Þ Es werden jeweils nach KTT/IRT entsprechend die besten Items ausgewählt,
zusammengeführt und verglichen
3. Methoden der diagnostischen Informationsgewinnung
3.1 Ausgewählte Methoden der diagnostischen Informationsgewinnung
Interview

Definition Test (Psychologisches Testen)


> Wissenschaftliches Routineverfahren zur Untersuchung eines oder mehrerer
empirisch unterscheidbarer Merkmale
> Ziel: Möglichst genaue quantitative Aussage über relativen Grad der individuellen
Merkmalsausprägung

Interview
• Gespräch, in dem die Rollen per Konvention meist asymmetrisch verteilt sind
(Forschende und Teilnehmende)
• Zwei Arten: das Leitfaden- und das nonstandardisierte Interview
Þ Leitfadeninterview: auf Basis eines vorher erstellten Leitfadens – vereint
dadurch Systematik und Flexibilität, da im Interviewverlauf auch spontane
Ad-hoc-Fragen zulässig sind
Þ Nonstandardisiertes Interview: großer Spielraum durch ledigliche Festlegung
grober Themenkomplexe (besondere Form: narratives Interview)
Narratives Interview: wurde für die Untersuchung lebensgeschichtlich-biografischer
Fragestellungen entwickelt (Erzählanstoß, Haupterzählung, Nachfrage- und
Bilanzierungsphase)

• SKID = Strukturiertes Klinisches Interview für Psychische Störungen


• Orientiert sich am DSM: SKID I bezieht sich auf psychische, SKID II auf
Persönlichkeitsstörungen
• Zielgruppe: ambulante als auch stationäre psychiatrische Patienten
• In Reinform für Erwachsene, mit Modifikation auch für Jugendliche anwendbar
• SKID–I–Interviewheft: kurze Angaben zum Patienten -> kurzer
Explorationsleitfaden mit Überblick über die derzeitigen Hauptprobleme
> Hauptteil besteht aus zehn Sektionen:

• Affektive Störungen (Sektion A)


• Psychotische Störungen (Sektion B)
• Differentialdiagnose Psychotische Störungen (Sektion C)
• Differentialdiagnose Affektive Störungen (Sektion D)
• Substanzmissbrauch und Substanzabhängigkeit (Sektion E)
• Angststörungen (Sektion F)
• Somatoforme Störungen (Sektion G)
• Essstörungen (Sektion H)
• Anpassungsstörungen und andere DSM-IV Störungen (Sektion I)
• Optionale Störungen (Sektion J)

Þ Screening-Fragen (damit nicht alle Sektionen mit dem Patienten


durchgearbeitet werden müssen) bezieht sich auf eine oder mehrere
Sektionen

• Voraussetzungen für die Durchführung des SKID sind klinisch-psychiatrische


Erfahrungen und Kenntnisse über das DSM–V–Manual
Þ Interviewverfahren kann nur von Psychologen mit klinischer Erfahrung
angewendet werden, nicht von Laien

Beobachtung
Beobachtungplan mit folgenden Aspekten:
• Was beobachtet werden soll;
• welche Aspekte weniger oder nicht relevant sind;
• welchen Interpretationsspielraum der Beobachter hat;
• wann, wie lange und wo die Beobachtung erfolgt;
• auf welche Weise das Beobachtete registriert und protokolliert wird

Verschiedene Arten:
• Selbstbeobachtung vs. Fremdbeobachtung
• Natürliches vs. stimuliertes Verhalten zur Beobachtung
• Offene vs. verdeckte Beobachtung
• Teilnehmende vs. nicht-teilnehmende Beobachtung (präsent aber nicht aktiv vs.
ist nicht präsent -> Auswertung und Analyse erfolgt später)
Erfassung physiologischer Daten
• Elektroenzephalogramm (EEG): Messung elektrischer Aktivität des Gehirns (nicht-
invasiv, da lediglich Elektroden auf der Kopfhaut angebracht werden)
• Magnetresonanztomografie (MRT): funktioniert mit Radiowellen und einem
starken Magnetfeld
• funktionelle Kernspintomografie (fMRT): wie MRT + Erfassung der
Stoffwechselaktivität des Gehirns (das Gehirn wird bei höherer Neuronenaktivität
stärker durchblutet – Es kommt zu einer Überversorgung des aktivierten
Hirnareals mit Sauerstoff und dieses kann im fMRT sichtbar gemacht werden)

Ecological momentary Assessment (EMA) / ambulantes Assessment


• Erhebungsstrategie, die das Ziel verfolgt, relevante Phänomene unverzerrt und
unmittelbar in der natürlichen Umgebung zu erfassen
• Zwei wichtige Aspekte: die Unmittelbarkeit und Messung in der „natürlichen“
Umgebung
• Verantwortung wird den Probanden selbst übertragen und liegt nicht beim
Diagnostiker
• Vorteile: die sich daraus ergebenden technischen Möglichkeiten
Þ Beispiel: Smartphone zur Erfassung der Daten
Þ Höhere Compliance als bei schriftlichen, papierbasierten Erhebungen
Þ Direkte Weiterleitung ins elektronische Dokumentensystem oder
Auswertungsprogramm -> sehr ökonomisch
Þ Evtl. wird akustischer Reiz zur Aufforderung zur nächsten Dateneingabe
gegeben

Inhaltliche Überlegungen in Bezug auf die Methodenwahl


• Unterscheidung zwischen objektiven (eher standardisierte Methoden) und
subjektiven Daten (aus der Perspektive der Betroffenen)
• Untergliederung in Fremd- und Selbstbeurteilung

Objektive Daten
• Beispiel: soziodemografische Daten
• Demografie (Bevölkerungswissenschaft) = statistische Erfassung und Beschreibung
einer Bevölkerungsgruppe nach Merkmalen des Geschlechts, Alters, Einkommen
etc.
• In der medizinischen Diagnostik werden eher „objektivere“ Daten mit möglichst
standardisierten Verfahren erfasst
Erfassung von Personenmerkmalen: Biografie und aktuelle Lebenssituation
Subjektivere Daten zur Erfassung von Personenmerkmalen aus Sichtweise der
Betroffenen

Hauptpunkte der biografischen Anamnese


• „Familienanamnese“
o Psychosoziale Situation
o Familiengröße und Familienmilieu
o Erziehungsstil
o Familiäre Auffälligkeiten/Erkrankungen bei Verwandten 1. und 2. Grades

• Biographie des Patienten


o Besonderheiten bei der Geburt
o Frühkindliche Entwicklung
o Beziehung zu Eltern/Geschwistern
o Schulische/berufliche Entwicklung
o Sexuelle Entwicklung
o Ehe und Familie
o Lebensgewohnheiten, Werthaltungen
o Persönlichkeitszüge
o Aktuelle Lebenssituation
Þ Wichtig für Unterscheidung zwischen äußere (Lebenslauf des Klienten) und innere
(Darstellung der Daten aus Sicht des Klienten) Lebensgeschichte

Selbst- und Fremdbeurteilung


• Fremdbeurteilung: andere Personen übernehmen die Messung und Dokumentation
der Daten
• Selbstbeurteilung: Untersuchungsteilnehmer berichten über ihr eigenes
psychisches Geschehen, über innere Vorgänge (Gefühle, Denkprozesse, Motive,
Erinnerungen etc.)

3.2 Kriterien zur Methodenwahl


Aspekte einer multimethodalen Diagnostik
• Erhebungsdimensionen (biologisch, sozial, psychologisch),
• Datenquellen (Therapeut, Patienten, Institutionen),
• Beobachtungsperspektive (Selbst- und Fremdbeurteilung)
• Ziel- oder Funktionsbereiche (kognitive Funktionsfähigkeit, Verhalten, Erleben,
soziale Integration, Lebensqualität) und
• Untersuchungsmethoden (apparative Verfahren, Tests, Fragebögen,
Selbstangaben, Fremdratings)
4. Stufen der Testkonstruktion
4.1 1.-4. Stufe

1. Stufe: Fragestellung mit Problem- und Anforderungsanalyse


Geltungsbereich und Zielgruppe
• Auseinandersetzung mit dem Personenkreis, für den mit dem Test Aussagen
getroffen werden sollen
• Geltungsbereich = Für wen soll ein diagnostischer Test gelten? (z.B. Kinder,
Jugendliche, Erwachsene, Senioren, Patienten o.ä.)
• Formulierung der Items, Schwierigkeit und Testformat stehen in Beziehung dazu
Þ „Je breiter die Zielgruppe, desto mehr müssen die Aufgaben über einen
breiteren Schwierigkeitsbereich streuen“
• Auswirkung des Alters der Zielgruppe auf das Testformat:
Þ Belohnungsaufschub bei Kindern kann man nicht wie bei Erwachsenen über einen
schriftlichen Fragebogen erfassen, sondern über ein Beobachtungsverfahren

2. Stufe: Planung und Literaturrecherche


• Literaturrecherche zum Untersuchungsgegenstand (einschlägige Theorien und
empirische Arbeiten)
• Arbeitsaufwand hält sich in Grenzen bei aktuellen Übersichtsarbeiten (z.B.
Metaanalysen oder Expertenbefragung in Form von Interviews oder Beobachtung
einer kleinen ausgewählten Stichprobe)

3. Stufe: Merkmalsbestimmung und Arbeitsdefinition


Þ Psychologische Merkmalsausprägung
• Sammlung und Analyse von Informationen zum Themenbereich
• Aufgabe: die in der Literatur gefundenen Beschreibungen und Definitionen des zu
untersuchenden Merkmals zu sichten um bestimmten zu können, welches Merkmal
man mithilfe des Testverfahrens erfassen möchte
• (Arbeits-)Definition des zu erheben Konstruktes finden
• Strukturierung des Merkmals und Differenzierung von spezifischeren
Verhaltenskategorien, gewährleisten bei der Itemkonstruktion inhaltliche
Vollständigkeit und Ausgewogenheit
• Analyse kann stark an theoretischen Modellen zum Konstrukt orientiert sein und
Quellen können variieren
4. Stufe: Testentwurf
• Erkenntnisse der ersten drei Schritten fließen mit ein (Das interessierenden
Merkmal, der Geltungsbereich und die Zielgruppe)
• Wahl einer Konstruktionsstrategie:
1. intuitive Konstruktionsstrategie:
- wenn zum interessierenden Merkmal noch recht wenig theoretischer
Kenntnisstand vorliegt
- Konstruktion steht und fällt hier mit der Intuition und Erfahrung des
Testkonstrukteurs
- kommt zum Einsatz, wenn ein neuer Forschungszweig seinen Anfang nimmt
2. rationale Konstruktionsstrategie
- Formulierung von Items, die weiteren Prüfungen unterzogen werden
(bereits vorhandene, elaborierte Theorie notwendig)
- Voraussetzung guter theoretischer Vorkenntnisse beim
Testentwicklungsteam
3. kriteriumsorientierte Strategie
- Auswahl der Items erfolgt unter Bezugnahme auf externe Kriterien
-> es werden Items ausgewählt, die zwischen Gruppen mit
unterschiedlichen Ausprägungen eines Kriteriums sicher unterscheiden
können

1.2 5.-9. Stufe


5. Stufe: Pre-Test
• Pre-test: Erprobung vorläufiger Testvorform – Ziel: Item entdecken, die nicht
mit den Konstruktionsansprüchen vereinbar sind
• Stichprobe von mindestens 100 Probanden, die der Zielgruppe entsprechen
sollten
• Gewährleistung realistischer Testbedingungen
• einfachste und zeitlich effektivste Erprobungsmethode besteht in der
retrospektiven Befragung der Probanden (nach vorläufiger Bearbeitung der
Testversion, werden Probanden befragt, bei welchen Items die Bearbeitung
problematisch war)

6. Stufe: Verteilungsanalyse
• Ziel: Items an einer repräsentativen Stichprobe einer deskriptivstatistischen
Evaluation unterziehen
• Entscheidung für KTT oder IRT
Þ Ziel KTT: Testwertverteilung wird mittels der Bestimmung von Mittelwert,
Median, Modalwert, Testwertvarianz und Spannweite sowie Schiefe und
Exzess untersucht
Þ Unterschied zu IRT: In den IRT wird die Trennschärfe als Steigung am
steilsten Punkt der logistischen Funktion betrachtet (Trennschärfe kann einen
hohen Wert annehmen und ist nicht wie bei den KTT auf maximal eins
beschränkt)

7. Stufe: Itemanalyse und Itemselektion


• Ziel der Itemanalyse: deskriptivstatistische Evaluation – anschließend werden
geeignete Items selektiert
• Itemschwierigkeit und -varianz sowie Trennschärfe = Parameter, die hierfür
relevant sind und Hauptbestandteile der Itemanalyse

Schwierigkeitsanalyse
• Item sollten so entwickelt sein, dass nicht alle Personen ein Item gleich
beantworten; weder zu leicht noch zu schwierig
Þ Aussagekraft ist für den diagnostischen Prozess bei Items extremer
Schwierigkeit gering
Schwierigkeitsindex P eines Items i ist der bei diesem Item tatsächlich erreichten
Punktsumme aller n Probanden und der maximal erreichbaren Punktsumme,
multipliziert mit 100
Þ Steigt an, je mehr Personen ein Item richtig beantworten konnten (bezieht
sich eigentlich auf seine Leichtigkeit)

Itemvarianzanalyse
• Differenzierungsfähigkeit von Items in Bezug auf die getestete Stichprobe

Trennschärfeanalyse
• Berechnung der Korrelation eines Items mit der Skala zu welcher es gehört
• Gibt an, wie stark die Differenzierung zwischen den Probanden auf Basis des
jeweiligen Items gebildeten Testwertes übereinnimmt
• Hohe positive Trennschärfe: Differenzierung der einzelnen Probanden

Schlussfolgerungen:
> Item mit hohem Trennschärfeparameter ist weniger geeignet bzw. gar nicht
geeignet zwischen Probanden mit hoher Merkmalsausprägung und Probanden mit
niedriger Merkmalsausprägung zu unterscheiden
> Item wird von Personen mit geringer Merkmalsausprägung richtig beantwortet,
von solchen mit starker Ausprägung nicht (z.B. wegen Mängel in der Formulierung
der Items oder auch in der Instruktion)
Þ Gleichzeitige Betrachtung von Itemschwieirgkeit, -varianz und -trennschärfe
für die Itemselektion zu empfehlen – Betrachtung nur jener Items, die über
eine geeignete Schwierigkeit, eine hohe Varianz und eine hinreichende
Trennschärfe verfügen

8. Stufe: Kriterienkontrolle
• Eliminierung oder Umformulierung der Items, die den vorher festgelegten
Kriterien nicht entsprechen

9. Stufe: Testrevision
• Erstellung einer tragfähigen Testendfassung – revidierte Testversion wird
erneut einer Stichprobe zur Testung vorlegt

4.3 10. Stufe: Eichung/Cut-off-Werte


• Zentrale Aufgabe: Normierung oder „Eichung“
• Nicht nötig, wenn ein Test für die Forschung verwendet werden soll
• Besonders für die Messung einer einzelnen Person wichtig, um deren Testwert
valide interpretieren zu können (Wie hoch ist die Merkmalsausprägung eines
Probanden in Relation zu anderen?)

Þ Testergebnis liegt nur als Rohwert vor (Summe aller Itemwerte z.B. Anzahl
gelöster Aufgaben) – Problem bei der Interpretation: Testrohwerte sind nicht
unbedingt direkt interpretierbar
Þ Zur Beurteilung wird ein sinnvoller Vergleichsmaßstab benötigt: Testrohwerte bei
vergleichbaren Personen (normorientierte Interpretation) oder Abgleich mit
psychologisch-inhaltlichen Beschreibungen, die die Bedeutung der Testrohwerte
charakterisieren (kriteriumsorientierte Interpretation)

Þ Beispiel kriteriumsorientierte Interpretation: Screeningverfahren: Das Nicht-


Erreichen einer bestimmten Punktzahl (Cut-off-Wert; Summenscore <26) gilt als
Hinweis darauf, dass ein bestimmtes Syndrom vorliegt bzw. bei Erreichen nicht
vorliegt
Normierung von Testverfahren
• Liegt vor, wenn ein individueller Testrohwert zum durchschnittlichen Rohwert
(Mittelwert) einer Vergleichsgruppe in Bezug gesetzt wird
• Normorientierte Interpretation wird in einen Normwert übersetzt, der dann
mit anderen Testleistungen vergleichbar ist:
> Normwert positioniert diese Person innerhalb eines Bezugsgruppe
> Grundlage für die Ermittlung eines Normwertes ist die Normierung des
Testverfahrens
> Normierung erfolgt üblicherweise anhand einer eigens gezogenen
Eichstichprobe

5. Testgütekriterien
5.1 Hauptgütekriterien
(Test-)diagnostische Verfahren können bezüglich verschiedener Kriterien beurteilt
und überprüft werden
-> Hauptgüter: Objektivität, Reliabilität und Validität

Objektivität
• Bezieht sich auf die Unabhängigkeit der Untersuchung vom Diagnostiker
• Verschiedene Testauswertungen beim gleichen Probanden kommen zu identischen
Ergebnissen

> Durchführungsobjektivität (Testleiterunabhängigkeit): bezieht sich auf die


Unabhängigkeit der Testdurchführung vom Diagnostiker (kann überprüft werden,
indem mehrere Testleiter gleiche Personen zu verschiedenen Zeitpunkten testen
können)
Þ Mögliche Probleme: weitere Bedingungen können variieren – hohe
Standardisierung der Durchführung ist besonders wichtig
> Auswertungsobjektivität (Verrechnungssicherheit): abhängig von der „Freiheit“
der Antworten und der Reglementierung bei der Beurteilung der Testreaktionen
> Interpretationsobjektivität (Interpretationseindeutigkeit): verschiedene
Beurteiler sollten zur gleichen Interpretation der Antworten kommen
Þ Sicherstellung durch Normierung (liegt vor, wenn ein individueller Testrohwert
zum durchschnittlichen Rohwert (Mittelwert) einer Vergleichsgruppe in Bezug
gesetzt wird)
Reliabilität
• Gilt als Messgenauigkeit des Instrumentes
• Bestimmung des Messfehlers, mit dem die Testwerte behaftet sind, und zwar
unabhängig davon, ob die Werte auch valide sind
• Quotient aus wahrer und beobachteter Varianz bzw. als Anteil der Variation der
wahren Werte an den beobachteten Werten

> Testwiederholung (Retest-Reliabilität)


- Denselben Probanden wird derselbe Test unter vergleichbaren Bedingungen
mindestens zweimal vorgegeben
- Mögliche Probleme: Lerneffekte, Übungseffekte, Erinnerungseffekte,
Merkmalsfluktuation
- Voraussetzung: Zielmerkmal bleibt relativ stabil (Stabilität)
Þ Dilemma: es gilt die vorher erwähnten Übungs- und Erinnerungseffekte zu
vermeiden und die wahren Werte der Probanden sollen sich zwischen den beiden
Testungen möglichst wenig verändern
Þ Kann künstlich erhöht werden, wenn Testpersonen bei der zweiten Messung
absichtlich ähnlich antworten wie beim ersten Mal

> Paralleltestmethode
- Häufig bei Niveautests (Powertests) und Schnelligkeitstests (Speedtests)
angewendet
- Je zwei Items müssen einander auf eine nicht triviale Art sehr ähnlich sein
- Äquivalenz bezieht sich auf gleiche Mittelwerte und Streuungen
Þ Die gleichen Probanden bearbeiten zwei Parallelformen des gleichen Tests
(eine Hälfte der Probanden bearbeitet zuerst Form A, dann Form B, die
andere umgekehrt)
Þ Kennwert wird durch die Korrelation der beiden Testformen ermittelt
Þ Vorteile: keine Lern-/Erinnerungseffekte; kein langer Testabstand
notwendig; auch bei eher instabilen Merkmalen anwendbar
Þ Mögliche Probleme:
> Hoher Aufwand bei Erstellung von Parallelformen
> Teils gar nicht möglich, z.B. bei sehr eng begrenzten Merkmalen
> Parallelformen sind praktisch nie vollkommen äquivalent
> Übungseffekte sind auch bei Paralleltests möglich (gleiche
Lösungsstrategie)
> Testhalbierung (split-half-Reliabilität)
- Aufteilung in zwei gleichwertig Hälften (=Quasi-Parallelform)
- Vorteil: Test muss nur einmal einer Stichprobe vorlegt und dann in zwei
Hälften aufgeteilt werden
- Testhälften sollen der Äquivalenzforderung von Paralleltests entsprechen
- Jede Testhälfte liefert pro Proband einen „Testwert“
- Testwerte der Testhälften werden korreliert
- Höhe der Übereinstimmung gilt als Indikator der Messgenauigkeit

> Interne Konsistenz


- Gilt als Erweiterung der Halbierungsrealibität
- Test wird statistisch in so viele Teile geteilt, wie er Items hat
- Überprüfung des inneren Zusammenhangs der Items oder Testteile, wobei
auch die Testlänge Berücksichtigung findet
- Maßeinheit: Cronbach–α

Validität
• Zentrales Testgütekriterium, das Objektivität und Reliabilität übergeordnet (Ein
Test muss zuallererst valide sein)
• Test kann nicht generell valide sein, sondern nur valide für bestimmte
diagnostische Fragen
• Ein Test ist erst valide, wenn dies durch entsprechende Untersuchungsergebnisse
belegt ist
Þ Ein Test gilt als valide (gültig), wenn er das Merkmal, das er messen soll, auch
wirklich misst und nicht irgendein anderes

> Inhaltliche Validität (Augenschein-Validität)


- Möglichkeit, das Testergebnis über die konkreten Aufgaben hinaus auf das
Universum möglicher Aufgaben zu verallgemeinern
- Gilt v. a. für operational definierte Merkmale (Aufgaben entsprechen
direkt dem zu messenden Konstrukt)
- Bei theoretisch definierten Konstrukten: inwieweit können mithilfe des
betreffenden Konstruktes unterschiedliche Antworten erklärt werden?

> Kriterienbezogene Validität


- Von Bedeutung, wenn der Test als Grundlage für praktische
Entscheidungen dient
- Betreffende Konstrukt kann durch eine Kriteriumsmessung direkt sichtbar
gemacht werden
- Konstrukt wird anhand eines externen Kriteriums operationalisiert
> Inkrementelle Validität
- Beitrag, den ein weiterer Test zur Vorhersage eines Kriteriums zu leisten
vermag (ein Intelligenztest trägt über das strukturierte Interview hinaus
zur Vorhersage des Ausbildungserfolgs bei)

> Konstruktvalidität
- Bezieht sich zunächst auf latente, theoretische Konstrukte
- Idee: das zu messende latente Konstrukt steht mit anderen Konstrukten in
systematischer Verbindung
- Ziel: Einbettung des mit dem Test erfassten Konstruktes in das Netzwerk
anderer, teil verwandter (konvergente Validität), teils fremder
Konstrukte (diskriminante Validität)

Þ Exkurs Multitrait-Multimethod-Analyse
- befasst sich mit der Frage, wie die Konstruktvalidität erfasst und berechnet
wird
- Verfahren zum Nachweis der diskriminanten und der konvergenten Validität
- konvergenter Validität = Messungen des ein und desselben Konstrukts, das mit
verschiedenen Methoden erfasst wird, hoch miteinander korrelieren
- Ziel: Isolation von Methodeneffekten anhand der Kontrolle des
methodenspezifischen Bias durch die Verwendung unterschiedlicher
Messmethoden.

Höhe der Validität


• Reliabilität der verschiedenen Verfahren kann sehr unterschiedlich ausfallen
und so die Höhe der Validitätskoeffizienten verzerren
• Je höher die Reliabilität, umso größer kann dessen Validitätskoeffeizient
ausfallen
• Jede Ausweichung der Reliabilität resultiert vom Idealwert 1 in einer
Reduzierung der Korrelation mit einem anderen Kennwert
5.2 Nebengütekriterien
• Skalierung (Eindeutigkeit der Messung)
• Normierung (Eichung)
• Testökonomie (Aufwendigkeit des Tests, z.B. Aufwand für den Probanden und den
Diagnostiker)
• Nützlichkeit
• Zumutbarkeit
• Unverfälschbarkeit (Möglichkeiten der (Dis-)Simulation möglichst gering halten)
• Fairness (Merkmal muss unabhängig von anderen Einflüssen gemessen werden –
Es darf zu keiner Benachteiligung aufgrund von Geschlecht, Kultur oder
ethnischer Zugehörigkeit kommen)

5.3 Empfehlungen des Testkuratoriums zu Beurteilungskriterien


• Testkuratorium hat ein System zur Beurteilung der Güte von Tests konzipiert
• Aufgabe: die Öffentlichkeit vor unzureichenden diagnostischen Verfahren und vor
unqualifizierter Anwendung diagnostischer Verfahren schützen und verbindliche
Qualitätsstandards formulieren
• Grundlage der DIN33430
• Beurteilungsprozess in welchem Testrezensenten in Bezug auf einen
psychologischen Test in drei Schritten ...
- die Verfahrenshinweise auf grundsätzliche Erfüllung der in der DIN 33430
formulierten Anforderungen prüfen, und wenn ja,
- eine Testkategorisierung nach ZPID und Merkmalen aus EFPA vornehmen und
- den Test anhand der Besprechungs- und Beurteilungskategorien des
Testkuratoriums bewerten

• Die Besprechungs- und Beurteilungskategorien des Testkuratoriums (TK) sind:

- Allgemeine Informationen über den Test, Beschreibung des Tests und seiner
diagnostischen Zielsetzung
- Theoretische Grundlagen als Ausgangspunkt der Testkonstruktion
- Objektivität
- Normierung (Eichung)
- Zuverlässigkeit (Reliabilität, Messgenauigkeit)
- Gültigkeit (Validität)
- Weitere Gütekriterien (Störanfälligkeit, Unverfälschbarkeit und Skalierung)
- Abschlussbewertung/Empfehlung
6. Der diagnostische Prozess
6.1 Der diagnostische Prozess: ein Modell (Jäger 2006)
• Abfolge von Maßnahmen zur Gewinnung diagnostischer relevanter Informationen
und deren Integration zur Beantwortung einer Fragestellung
• Personale, zeitliche, strategische und organisatorische Erstreckung zwischen
vorgegebenen sowie als Beantwortung dieser zuerst eher allgemeinen und später
bereits spezifischeren Fragestellungen
• Beantwortung findet in der Form einer Prognose oder Diagnose statt
Þ Ausgangslage bzw. Hilfestellung für eine Entscheidung durch den
Auftraggeber

1.+2. Auftragsgeber und Fragestellung


• Ein potenzieller Auftragsgeber nennt einem Psychologen seine Fragestellung
• Dieser entscheidet, ob er den Auftrag übernehmen und die Fragestellung
bearbeiten kann (z.B. ob er über die nötigen Kompetenzen in einem bestimmten
Bereich verfügt)

3. Hypothesen
• Fragestellungen sollen als Hypothesen überprüft werden
• „Vorläufige“ (vermutete) Antworten, die Forscher auf ihre Fragen geben
• Diagnostischer Prozess: Kombination aus Hypothesen generierenden und
Hypothesen testenden Vorgehen

4. Operationalisierung
Wie man einen bestimmten psychologischen Gegenstand empirisch messbar machen
möchte, sodass die innerpsychischen Prozesse und Vorgänge beim Erleben von Angst
nicht direkt beobachtbar sind und somit gemessen werden können

5. Datenerhebung
• Diagnostische Untersuchung (wer wann wo bei wem welche Daten erhebt)
• Nacherhebungen können sinnvoll sein (bei widersprüchlichen, uneindeutigen oder
ungültigen Antworten)
6. Ergebnisinterpretation und -integration
Kompensatorische Entscheidungsstrategie:
• die Prädiktoren (Vorhersagevariablen) gleich sich gegenseitig aus/können sich
kompensieren
• immer dort dysfunktional, wo in jedem Teilbereich bestimmte Mindestleistungen
unabdingbar vorliegen müssen, um eine Tätigkeit erfolgreich ausführen zu müssen
Þ „Und-Strategie“ ist gefordert – auch konjunktive Entscheidungsstrategie

Statistisches versus Klinisches Urteil


Diagnostische Urteil: Beantwortung einer Fragestellung unter Verwendung von
bereits vorliegenden diagnostischen Informationen
• Klinische Urteilsbildung: individuelle Urteile von Diagnostiker als Grundlage
• Statisches Urteil: Statistische Analyse der Daten von vielen ähnlichen Fällen
Þ Statistisches Urteil ist dem klinischen Urteil überlegen

Entscheidung/Rückmeldung/Gutachten
• dient zur Entscheidungsberatung, damit der Auftragsgeber keine Entscheidung
unter Unsicherheit fällen muss und nichts Wichtiges übersieht
• Inhaltliches und methodisches Vorgehen soll auch für Laien verständlich und
nachvollziehbar sein
• Kann fehlerhaft sein, da menschliche Urteile Fehlern und bestimmten
Irrtumswahrscheinlichkeiten unterliegt
Þ Der diagnostische Prozess kommt zum Ende, wenn der Diagnostiker seine
professionelle Beziehung mit dem Auftraggeber und dem Probanden in Bezug auf
die diagnostische Aufgabe beendet

7. Güte diagnostischer Prozesse


7.1 Empirische Ermittlungen der Qualität diagnostischer Instrumente

Kritische Rezeption von Originalarbeiten


Reflektionskriterien nach Barker und Pistrang

Ausführung von Zweck und Inhalt der wissenschaftlichen Arbeit

Verwendung von geeigneten wissenschaftlichen Methoden

Transparenz/Klarheit des Vorgehens und der Methode

Ethische Prinzipien in Bezug auf die Versuchsteilnehmer

Relevanz und Bedeutung der gefundenen Ergebnisse


7.2 Identifikation diagnostischer Fehlerquellen
Bei Beurteilungsfehler wird ein Befund durch persönliche Motive, Erwartungen und
Wahrnehmungen des Diagnostikers verzerrt
• Ziel: im Sinne eines Kompetenzerwerbes eine Sensibilität für Beurteilungsfehler
zu entwickeln
• Man kann sich schwer von dem zu beurteilenden Sachverhalt bzw. der zu
beurteilenden Person isolieren
• Menschen glauben, objektive Schlüsse zu ziehen und wählen doch die
Schlussfolgerungen, die ihnen am vorteilhaftesten erscheinen
• Wichtig, dass man nicht vorschnell urteilt und sich nicht ausschließlich auf den
ersten Eindruck verlässt
• Hilfreiche Maßnahme: Austausch mit Kollegen über Diagnostikfälle um
Hypothesen abzusichern und neue Sichtweisen erhalten
• Testperson kann in ihrem Antwortverhalten verzerrt sein (soziale Erwünschtheit)
Þ Tendenz, sich selbst „durch eine rosa Brille zu betrachten“
Þ Tendenz, andere absichtlich zu täuschen
• Hawthorne-Effekt: Veränderung des Verhaltens von Mitarbeitern nach
Erkenntnis, dass sie beobachtet werden und sich so die Produktivität steigerte
(unabhängig davon, ob bessere oder schlechtere Arbeitsbedingungen herrschten)

7.3 Angewandte diagnostische Forschung


Metaanalyse = statistische Technik zur Hypothesenprüfung durch eine formale
Vorgehensweise zur Entdeckung übergreifender Schlussfolgerungen aus Datensätzen
vieler verschiedener Experimente
• Ziel: Aussagen darüber treffen, welchen zusätzlichen Nutzen das Hinzufügen
eines weiteren Verfahrens bei der Auswahl von Bewerbern hat

7.4 Urteilsfehler
• Halo-Effekt: „Heiligenschein“ – „Wer schön ist, wird eher für intelligent
gehalten, wer aggressiv ist, eher für wenig ängstlich“
Þ Es besteht in der Urteilsbildung eine Art Scheinkorrelation (Einzelne
Eigenschaften der PatientInnen erzeugen einen Gesamteindruck, der die weitere
Wahrnehmung überstrahlt)
• Primacy-Receny-Effekt – Reihenfolgefehler
Þ Primacy- Effekt: Erste Ifnormation wird am höchsten eingeschätzt
Þ Receny-Effekt: Letzte Information bleibt am besten haften
• Interferenzfehler – „Menschen übertragen und schlussfolgern permanent aus
dem, was sie erleben, um sich die Welt erklärbar zu machen“
• Attributionsfehler – Beurteiler neigen stark zu internalen Attributionen
(Ursachenzuschrieben in der Person selbst) während die zu beurteilenden
Probanden eher zu situativen Erklärungen tendieren
• Tendenz zur Mitte – nur mittlere Beurteilungen oder besonders gute oder
schlechte Beurteilungen

8. Qualitätssicherung & Evaluation

8.2 Berufsethik und Ethik in der Psychologie


Ethische und fachliche Grundhaltung

„Psychologinnen und Psychologen:


(1) achten die Würde des Menschen und respektieren diese in ihrem Handeln;
(2) erkennen das Recht des Einzelnen an, in eigener Verantwortung und nach eigenen Überzeugungen
zu leben;
(3) handeln mit besonderer Verantwortung gegenüber den Menschen, mit denen sie umgehen;
(4) gehen sensibel mit der Bereitschaft von Menschen um, sich anzuvertrauen, und klären über
mögliche Grenzen der Vertraulichkeit auf;
(5) fördern Möglichkeiten der selbstbestimmten Persönlichkeitsentwicklung und tragen zur
Gewährleistung fördernder Rahmenbedingungen bei;
(6) fördern die Verständigung im sozialen Zusammenleben und den gegenseitigen Respekt;
(7) handeln im Sinne des Wohls und Wohlbefindens der Menschen;
(8) setzen sich ein für gute natürliche, sozioökonomische und kulturelle Lebensbedingungen von
Einzelnen und Gemeinschaften;
(9) fördern ein redliches Miteinander und gehen in ihrem Handeln mit gutem Bei- spiel voran;
(10) vermehren das Wissen über den Menschen durch Forschung und Lehre;
(11) bewirken durch Reflexion und durch einen offenen Austausch über Einstellungen, Orientierungen
und Menschenbilder Veränderungen bei Einzelnen, Institutionen und in der Gesellschaft;
(12) üben ihren Beruf auf der Basis ihrer wissenschaftlichen Fachkompetenz aus;
(13) bilden sich kontinuierlich fort und halten ihre Kenntnisse auf aktuellem Stand;
(14) achten besonders auf die eigenen psychischen und körperlichen Voraussetzungen, die eine
kompetente Berufsausübung erlauben;
(15) erbringen Dienstleistungen eigenständig nur in den Tätigkeitsfeldern, für die sie durch eine
wissenschaftlich fundierte Ausbildung, fachliche Fortbildung und berufliches Handeln qualifiziert sind;
(16) orientieren sich bei neuen beruflichen Ansätzen und Methoden am Grundsatz wissenschaftlicher
Redlichkeit, überprüfen systematisch die Wirkungen ihres Handelns;
(17) sind wachsam gegenüber persönlichen, sozialen, institutionellen, wirtschaftlichen und politischen
Einflüssen, die zu einem Missbrauch bzw. zu einer falschen Anwendung von psychologischen
Kenntnissen und Fähigkeiten führen könnten;
(18) sind sich über das Ungleichgewicht der Machtverteilung in beruflichen Beziehungen bewusst;
(19) zeigen in beruflichen Beziehungen Aufmerksamkeit für mögliche Gefahren des
Machtmissbrauches und vermeiden Handlungen im Sinne eines Machtmissbrauches.“
8.3 Rechtliche Grundlagen & berufsethische Richtlinien (BER) der
Diagnostik

DIN 33430

• Veröffentlichung: Juni 2016 (besteht aus 35 Seiten und berücksichtigt


eignungsdiagnostische Verfahren)
• Untersuchung in Soll- und Muss-Formulierung ist für das Verständnis relevant –
Es werden viele Empfehlungen („Soll“) und insgesamt weniger direkt bindende
Gesetze formuliert („Muss“)
• Ziel: aktuellen Stand der Wissenschaft widerspiegeln – bzw. einen Leitfaden für
Planung und Durchführung von Eignungsbeurteilungen bereitzustellen, und dient
so der Qualitätssicherung von Personalentscheidungen
• Inhalte: Begriffserklärungen, Leitsätze für die Vorgehensweise bei
berufsbezogenen Eignungsbeurteilungen, Qualitätskriterien und -standards für
Verfahren zur berufsbezogenen Eignungsbeurteilung und Klärung von
Verantwortlichkeiten
• Fünf Kategorien von eigendiagnostischen Verfahren:
(1) Dokumentenanalysen z.B. Analyse von Bewerbungsunterlagen
(2) Verfahren zur Verhaltensbeobachtung und -beurteilung z.B. Rollenspiele
(3) direkte mündliche Befragungen z.B. Interview
(4) messtheoretisch fundierte Fragebögen z.B. Persönlichkeitsfragebögen
(5) messtheoretisch fundierte Tests z.B. Intelligenztests
• Vorteil: transparente und partizipative Entwicklung (bereits der Plan, eine DIN
zu entwickeln, muss veröffentlicht werden)

Schweigepflicht und Offenbarungspflicht

• Patientendaten und -geheimnisse sollen bei ihrem behandelnden Arzt/Psychologen


sicher sein
• Schweigepflicht besteht als schützendes Gut vor Gericht
• „Berufspsychologen haben das Recht, Aussagen über ihnen anvertraute
Geheimnisse zu verweigern“
• Offenbarungspflicht: „Wer von bestimmten Straftaten erfährt, die geplant sind
oder gerade ausgeführt werden, kann mit bis zu fünf Jahren Haft bestraft
werden, wenn er diese Kenntnis nicht offenbart“

Powered by TCPDF (www.tcpdf.org)