Sie sind auf Seite 1von 22

DEUTSCHE NORM Dezember 2004

DIN EN ISO 10075-3


X
ICS 13.180

Ergonomische Grundlagen bezüglich psychischer Arbeitsbelastung –


Teil 3: Grundsätze und Anforderungen an Verfahren zur Messung und
Erfassung psychischer Arbeitsbelastung (ISO 10075-3:2004);
Deutsche Fassung EN ISO 10075-3:2004
Ergonomic principles related to mental workload –
Part 3: Principles and requirements concerning methods for measuring and assessing
mental workload (ISO 10075-3:2004);
German version EN ISO 10075-3:2004
Principes ergonomiques relatifs à la charge de travail mental –
Partie 3: Principes et exigences concernant les méthodes de mesurage et d’évaluation de
la charge de travail mental (ISO 10075-3:2004);
Version allemande EN ISO 10075-3:2004

Gesamtumfang 22 Seiten

Normenausschuss Ergonomie (FNErg) im DIN


DIN EN ISO 10075-3:2004-12

Nationales Vorwort

Die vorliegende Europäische Norm wurde von der Arbeitsgruppe 2 „Ergonomische Grundlagen bezüglich
psychischer Arbeitsbelastung“ des Technischen Komitees ISO/TC 159 „Ergonomie“, Unterkomitee 1
„Ergonomische Leitsätze“ erarbeitet. Die Sekretariatsführung liegt bei Deutschland.

Das zuständige nationale Spiegelgremium ist der Arbeitsausschuss 5 „Psychische Belastung“ des
Normenausschusses Ergonomie (FNErg) im DIN e.V.

Die DIN EN ISO 10075-3 legt keine verbindlichen Anforderungen für die nach dem Arbeitsschutzgesetz
vorgesehene Gefährdungsbeurteilung fest (vgl. hierzu auch die Anmerkung in 4.3.8), weil Form und Inhalt
der Gefährdungsbeurteilung gesetzlich nicht festlegt sind.

Die DIN EN ISO 10075-3 ist als Grundlage für die Zertifizierung von Verfahren zur Messung und Bewertung
der psychischen Arbeitsbelastung weder vorgesehen noch geeignet. Die Zertifizierung der Eignung eines
nach dieser Norm entwickelten und überprüften Verfahrens für bestimmte Einsatzzwecke ist nicht möglich
(siehe hierzu auch 4.1) und daher ausgeschlossen.

Für die in diesem Dokument zitierten Internationalen Normen wird im Folgenden auf die entsprechenden
Deutschen Normen hingewiesen:

ISO 6385 siehe DIN EN ISO 6385


ISO 9241-11 siehe DIN EN ISO 9241-11
ISO 10075 siehe DIN EN ISO 10075-1
ISO 10075-2 siehe DIN EN ISO 10075-2

Nationaler Anhang NA
(informativ)

Literaturhinweise

DIN EN ISO 6385, Grundsätze der Ergonomie für die Gestaltung von Arbeitssystemen (ISO 6385:2004);
Deutsche Fassung EN ISO 6385:2004.

DIN EN ISO 9241-11, Ergonomische Anforderungen für Bürotätigkeiten mit Bildschirmgeräten — Teil 11:
Anforderungen an die Gebrauchstauglichkeit; Leitsätze (ISO 9241-11:1998); Deutsche Fassung
EN ISO 9241-11:1998.

DIN EN ISO 10075-1, Ergonomische Grundlagen bezüglich psychischer Arbeitsbelastung — Teil 1:


Allgemeines und Begriffe (ISO 10075:1991); Deutsche Fassung EN ISO 10075-1:2000.

DIN EN ISO 10075-2, Ergonomische Grundlagen bezüglich psychischer Arbeitsbelastung — Teil 2:


Gestaltungsgrundsätze (ISO 10075-2:1996); Deutsche Fassung EN ISO 10075-2:2000.

2
EUROPÄISCHE NORM EN ISO 10075-3
EUROPEAN STANDARD
NORME EUROPÉENNE August 2004

ICS 13.180

Deutsche Fassung

Ergonomische Grundlagen bezüglich psychischer


Arbeitsbelastung
Teil 3: Grundsätze und Anforderungen an Verfahren zur
Messung und Erfassung psychischer Arbeitsbelastung
(ISO 10075-3:2004)

Ergonomic principles related to mental workload — Principes ergonomiques relatifs à la charge de travail mental —
Part 3: Principles and requirements concerning methods Partie 3: Principes et exigences concernant les méthodes de
for measuring and assessing mental workload mesurage et d'évaluation de la charge de travail mental
(ISO 10075-3:2004) (ISO 10075-3:2004)

Diese Europäische Norm wurde vom CEN am 16. Juli 2004 angenommen.

Die CEN-Mitglieder sind gehalten, die CEN/CENELEC-Geschäftsordnung zu erfüllen, in der die Bedingungen festgelegt sind, unter denen
dieser Europäischen Norm ohne jede Änderung der Status einer nationalen Norm zu geben ist. Auf dem letzten Stand befindliche Listen
dieser nationalen Normen mit ihren bibliographischen Angaben sind beim Management-Zentrum oder bei jedem CEN-Mitglied auf Anfrage
erhältlich.

Diese Europäische Norm besteht in drei offiziellen Fassungen (Deutsch, Englisch, Französisch). Eine Fassung in einer anderen Sprache,
die von einem CEN-Mitglied in eigener Verantwortung durch Übersetzung in seine Landessprache gemacht und dem Management-
Zentrum mitgeteilt worden ist, hat den gleichen Status wie die offiziellen Fassungen.

CEN-Mitglieder sind die nationalen Normungsinstitute von Belgien, Dänemark, Deutschland, Estland, Finnland, Frankreich, Griechenland,
Irland, Island, Italien, Lettland, Litauen, Luxemburg, Malta, den Niederlanden, Norwegen, Österreich, Polen, Portugal, Schweden, der
Schweiz, der Slowakei, Slowenien, Spanien, der Tschechischen Republik, Ungarn, dem Vereinigten Königreich und Zypern.

EUROPÄISCHES KOMITEE FÜR NORMUNG


EUROPEAN COMMITTEE FOR STANDARDIZATION
COMITÉ EUROPÉEN DE NORMALISATION

Management-Zentrum: rue de Stassart, 36 B-1050 Brüssel

© 2004 CEN Alle Rechte der Verwertung, gleich in welcher Form und in welchem Ref. Nr. EN ISO 10075-3:2004 D
Verfahren, sind weltweit den nationalen Mitgliedern von CEN vorbehalten.
EN ISO 10075-3:2004 (D)

Inhalt

Seite

Vorwort................................................................................................................................................................ 3
Einleitung ............................................................................................................................................................ 4
1 Anwendungsbereich ............................................................................................................................. 5
2 Normative Verweisungen ..................................................................................................................... 5
3 Begriffe................................................................................................................................................... 5
4 Messung und Erfassung der psychischen Arbeitsbelastung .......................................................... 7
4.1 Allgemeine Grundlagen........................................................................................................................ 7
4.2 Anforderungen an die Vorgehensweise ........................................................................................... 10
4.3 Quantitative Anforderungen an Messverfahren............................................................................... 13
4.4 Anforderungen an die Dokumentation ............................................................................................. 16
Anhang A (informativ) Zusätzliche Information zur Generalisierbarkeit .................................................... 18
Anhang B (informativ) Prüfliste zur Auswahl eines Messverfahrens.......................................................... 19
Literaturhinweise.............................................................................................................................................. 20

2
EN ISO 10075-3:2004 (D)

Vorwort
Dieses Dokument (EN ISO 10075-3:2004) wurde vom Technischen Komitee ISO/TC 159 „Ergonomics“ in
Zusammenarbeit mit dem Technischen Komitee CEN/TC 122 „Ergonomie“ erarbeitet, dessen Sekretariat vom
DIN gehalten wird.

Diese Europäische Norm muss den Status einer nationalen Norm erhalten, entweder durch Veröffentlichung
eines identischen Textes oder durch Anerkennung bis Februar 2005, und etwaige entgegenstehende
nationale Normen müssen bis Februar 2005 zurückgezogen werden.

Entsprechend der CEN/CENELEC-Geschäftsordnung sind die nationalen Normungsinstitute der folgenden


Länder gehalten, diese Europäische Norm zu übernehmen: Belgien, Dänemark, Deutschland, Estland,
Finnland, Frankreich, Griechenland, Irland, Island, Italien, Lettland, Litauen, Luxemburg, Malta, Niederlande,
Norwegen, Österreich, Polen, Portugal, Schweden, Schweiz, Slowakei, Slowenien, Spanien, Tschechische
Republik, Ungarn, Vereinigtes Königreich und Zypern.

Anerkennungsnotiz

Der Text von ISO 10075-3:2004 wurde vom CEN als EN ISO 10075-3:2004 ohne irgendeine Abänderung
genehmigt.

3
EN ISO 10075-3:2004 (D)

Einleitung
Dieser Teil der ISO 10075 enthält technische Informationen, die bei der Entwicklung, Bewertung und Auswahl
von Messverfahren zur Erfassung der psychischen Arbeitsbelastung, wie sie in ISO 10075 und ISO 10075-2
definiert und dargestellt ist, von Bedeutung sind. Vertrautheit mit den in diesen Teilen von ISO 10075
dargestellten Konzepten ist für das Verständnis der Festlegungen von ISO 10075-3 erforderlich.

Da die psychische Arbeitsbelastung ein Teil der gesamten Arbeitsbelastung ist, sollten die Anwender dieses
Teils der ISO 10075 auch mit den in ISO 6385 dargestellten Konzepten und Festlegungen vertraut sein.

Ziel dieses Teils der ISO 10075 ist die Bereitstellung von Informationen darüber, welche Spezifikationen bei
der Entwicklung von Messverfahren erforderlich sind, damit ein gegebenes Verfahren hinsichtlich seiner
Gebrauchstauglichkeit als Messverfahren für die Erfassung der psychischen Arbeitsbelastung bewertet
werden kann.

Dieser Teil der ISO 10075 beschreibt Anforderungen an Instrumente, die unterschiedliche Aspekte der
psychischen Arbeitsbelastung messen; sie legt hingegen nicht fest, welche Instrumente, z. B. psychologische
Skalierungsverfahren oder psychophysiologische Verfahren, verwendet werden sollten. Die Auswahl, welche
Instrumente jeweils anzuwenden sind, kann durch die Bereitstellung geeigneter Informationen erleichtert
werden.

4
EN ISO 10075-3:2004 (D)

1 Anwendungsbereich

Dieser Teil der ISO 10075 legt Grundsätze und Anforderungen für die Messung und Erfassung der
psychischen Arbeitsbelastung fest und spezifiziert die Anforderungen an Messverfahren. Dieser Teil der
ISO 10075 stellt Informationen zur Auswahl geeigneter Verfahren bereit und enthält Informationen zu
Aspekten der Erfassung und Messung der psychischen Arbeitsbelastung, um damit zur Verbesserung der
Kommunikation zwischen den beteiligten Parteien beizutragen.

Dieser Teil der ISO 10075 ist hauptsächlich für die Anwendung durch Fachleute der Ergonomie vorgesehen,
z. B. Psychologen, Arbeitsmediziner, Arbeitsphysiologen und andere medizinische Fachkräfte, mit einer
angemessenen Ausbildung in den theoretischen Grundlagen und der Anwendung dieser Messverfahren
sowie der Interpretation der Ergebnisse. Diese Fachleute werden die für die Entwicklung oder Bewertung von
Verfahren zur Erfassung der psychischen Arbeitsbelastung benötigten Informationen finden.

Nichtfachleute, z. B. Arbeitgeber, Beschäftigte und deren Vertreter, Systemverantwortliche und -gestalter wie
auch Behörden können nützliche Informationen zur Orientierung auf dem Gebiet der Erfassung und Messung
der psychischen Arbeitsbelastung finden; z. B. darüber, welche Arten von Verfahren zur Verfügung stehen,
welche Kriterien für die Bewertung von Messverfahren wesentlich sind und welche Art von Informationen sie
für die Entscheidung, welches Instrument für ihren Zweck geeignet ist, fordern und beachten sollten.

ANMERKUNG Ein Technischer Bericht mit weiteren Informationen über die Terminologie und die Anwendung dieses
Teils der ISO 10075 wird für Nichtfachleute zur Verfügung gestellt werden.

Dieser Teil der ISO 10075 enthält Informationen, die eine begründete Auswahl eines der jeweiligen
Untersuchungssituation angemessenen Verfahrens erlauben. Es existiert eine große Anzahl verschiedener
Verfahren, die sich für unterschiedliche Zwecke, Situationen und Stufen der Messgenauigkeit eignen.
Allgemein besteht ein Bedarf an effektiv und effizient einsetzbaren Messverfahren. Die in diesem Teil der
ISO 10075 enthaltenen Informationen ermöglichen es den Anwendern, die verschiedenen Verfahren danach
zu bewerten, welche Art von Messverfahren sich für ihre besonderen Zwecke am besten eignet.

Der Nachweis der Übereinstimmung mit den Festlegungen dieses Teils der ISO 10075 ist durch die
geforderte Dokumentation zu erbringen.

2 Normative Verweisungen
Die folgenden zitierten Dokumente sind für die Anwendung dieses Dokuments erforderlich. Bei datierten
Verweisungen gilt nur die in Bezug genommene Ausgabe. Bei undatierten Verweisungen gilt die letzte
Ausgabe des in Bezug genommenen Dokuments (einschließlich aller Änderungen).

ISO 6385:2004, Ergonomic principles in the design of work systems

ISO 10075:19911), Ergonomic principles related to mental workload — General terms and definitions

ISO 10075-2:1996, Ergonomic principles related to mental workload — Part 2: Design principles

3 Begriffe
Für die Anwendung dieses Dokumentes gelten die Begriffe nach ISO 6385:2004, ISO 10075:1991 und
ISO 10075-2:1996 und die folgenden Begriffe.

1) Nach ihrer Überarbeitung wird diese Internationale Norm ISO 10075-1 werden.

5
EN ISO 10075-3:2004 (D)

3.1
Objektivität
der Grad, in dem die mit einem Messinstrument gewonnenen Ergebnisse unabhängig davon sind, welche
Person die Messung durchführt, die Daten analysiert und interpretiert

3.2
Zuverlässigkeit
Reliabilität
die Genauigkeit, mit der ein Messinstrument das misst, was es messen soll

ANMERKUNG Die Zuverlässigkeit kann als Homogenität, Konsistenz oder Stabilität der Messung ermittelt werden,
oder bei zwei oder mehr Beurteilern als Beurteilerübereinstimmung (Inter-Rater-Reliabilität). Die Zuverlässigkeit hat einen
engen Bezug zur Generalisierbarkeit.

3.2.1
Homogenität
der Grad, in dem alle Teile oder Einzelmerkmale (Items) eines Messverfahrens das gleiche Merkmal messen

3.2.2
Konsistenz
der Grad, in dem unterschiedliche Teile oder Parallelformen eines Messverfahrens zu identischen
Ergebnissen führen, z. B. bei Teilung eines Messverfahrens in zwei oder mehr Teile oder bei Anwendung von
zwei oder mehr parallelen Formen eines Verfahrens

3.2.3
Stabilität
der Grad, in dem eine (im Allgemeinen zeitversetzte) wiederholte Anwendung eines Messverfahrens zu
identischen Ergebnissen führt

3.2.4
Beurteilerübereinstimmung
Inter-Rater-Reliabilität
der Grad, in dem zwei oder mehr Beurteiler bei der Messung der gleichen Merkmale die gleichen Ergebnisse
erzielen

3.3
Gültigkeit
Validität
der Grad, in dem ein Verfahren oder Instrument tatsächlich das misst, was es messen soll

ANMERKUNG Gültigkeit kann über Verfahren der konkurrierenden Validierung (z. B. durch Übereinstimmung mit den
Ergebnissen eines gleichzeitig eingesetzten Verfahrens, von dem bekannt ist, dass es das zu erfassende Merkmal
tatsächlich erfasst), der kriterienorientierten Validierung (z. B. durch den Nachweis einer Beziehung zu einem relevanten
Kriterium) oder faktorielle Validierung (z. B. durch den Nachweis, dass ein Messverfahren spezifische Aspekte eines
Konstrukts abbildet) bestimmt werden.

3.4
Messempfindlichkeit
Sensitivität
der Grad, in dem ein Verfahren oder Instrument zwischen unterschiedlichen Ausprägungen des Messgegen-
standes zu unterscheiden erlaubt, z. B. unterschiedliche Grade der psychischen Beanspruchung oder
Ermüdung

3.5
diagnostische Aussagekraft
Diagnostizität
der Grad, mit dem ein Verfahren oder Instrument zwischen unterschiedlichen Arten oder Quellen der
psychischen Arbeitsbelastung, z. B. Anforderungen an die Wahrnehmung usw., oder ihren Auswirkungen,
z. B. Ermüdung, Monotonie, Sättigung oder herabgesetzte Wachheit, zu unterscheiden erlaubt

6
EN ISO 10075-3:2004 (D)

3.6
Generalisierbarkeit
der Grad, in dem ein Beobachtungswert (als Messwert) auf eine definierte Grundgesamtheit von Situationen
(Belastungsbedingungen) und/oder Population von Beschäftigten verallgemeinert werden kann

3.6.1
relative Generalisierbarkeit
der Grad, mit dem eine Rangordnung von Belastungsbedingungen bzw. Personen, z. B. von niedrig bis hoch
(bei Entscheidungen auf der Grundlage von relativen Positionen), wiederholbar ist

3.6.2
absolute Generalisierbarkeit
der Grad, mit dem ein Messwert, der ein mit bestimmten Arbeitsbedingungen/Personen verbundenes
absolutes Niveau der Belastung bzw. Beanspruchung kennzeichnet, ohne Berücksichtigung der mit anderen
Bedingungen/Personen verbundenen Belastung bzw. Beanspruchung (bei Entscheidungen über absolute
Werte), wiederholbar ist

ANMERKUNG Für weitere Erklärungen über die Generalisierbarkeit siehe Anhang A.

3.7
Gebrauchstauglichkeit
das Ausmaß, in dem ein Produkt durch bestimmte Benutzer in einem bestimmten Nutzungskontext genutzt
werden kann, um bestimmte Ziele effektiv, effizient und zufrieden stellend zu erreichen

[ISO 9241-11:1998, Definition 3.1]

ANMERKUNG Im Fall dieses Teils der ISO 10075 ist ein Messverfahren bzw. Instrumentarium ein Produkt.

3.8
kritische Werte
der Referenzstandard für die Bewertung der ermittelten Messwerte und/oder Entscheidungen über Bestehen
oder Nichtbestehen

ANMERKUNG Die Festlegung kritischer Werte setzt voraus, dass die durch das in Frage stehende Messverfahren zu
ermittelnden Messwerte absolute Entscheidungen mit hoher Präzision ermöglichen. Weiterhin ist anzugeben, unter
welchen Bedingungen die kritischen Werte gültig sind (zum Beispiel für Messungen nach vorausgegangener Belastung
usw.).

4 Messung und Erfassung der psychischen Arbeitsbelastung

4.1 Allgemeine Grundlagen


Psychische Arbeitsbelastung ist kein einheitliches und eindimensionales Konzept, daher können die
Erfassung und Messung der psychischen Arbeitsbelastung keinem einheitlichen Vorgehen folgen. Es gibt
nicht den einen besten Weg zur Erfassung der psychischen Arbeitsbelastung, da die jeweils geeignetste
Weise der Erfassung oder Messung der psychischen Arbeitsbelastung vom Zweck der Erfassung abhängt,
der die Erfassung unterschiedlicher Aspekte der psychischen Arbeitsbelastung, die Anwendung
unterschiedlicher Messtechniken und unterschiedlicher Präzisionsgrade erforderlich machen kann.

Daher hat das in diesem Teil von ISO 10075 verwendete Modell der Erfassung der Arbeitsbelastung eine
dreidimensionale Struktur. Es berücksichtigt:

 unterschiedliche Aspekte der psychischen Arbeitsbelastung, z. B. psychische Belastung, psychische


Beanspruchung, psychische Ermüdung usw.,

 unterschiedliche Messtechniken, z. B. Aufgabenanalyse, Leistungserfassung, subjektive Einschätzungen


oder psychophysiologische Messungen, und

 unterschiedliche Grade der Genauigkeit, z. B. Messungen auf orientierendem, Übersichts- oder genauem
Messniveau.

7
EN ISO 10075-3:2004 (D)

Nach ISO 10075:1991 müssen unterschiedliche Aspekte differenziert werden: psychische Belastung,
psychische Beanspruchung und die Auswirkungen der psychischen Beanspruchung auf das Individuum.
Erfassung und Messung müssen sich daher auf diese unterschiedlichen Stufen im Wirkungsgefüge
Belastung-Beanspruchung-Auswirkungen beziehen, d. h.:

 Erfassung der psychische Belastung hervorrufenden Arbeitsbedingungen, wie bei der Gestaltung von
Arbeitssystemen und der Bewertung ihrer Gestaltung,

 Erfassung und Messung der durch die psychische Belastung ausgelösten psychischen Beanspruchung,
z. B. um die Erträglichkeit der Beanspruchung zu bewerten,

 Messung der Auswirkungen der Beanspruchung auf den Arbeitenden, z. B. Ermüdung, Monotonie,
Sättigung oder herabgesetzte Wachsamkeit,

die Auswirkungen auf Gesundheit und Sicherheit, Wohlbefinden, Leistung und Produktivität der/des
Arbeitenden haben können

Unterschiedliche Zwecke, z. B. eine Risikoanalyse beim Einsatz von Technologien mit Gefährdungspotential
im Gegensatz zu einer Übersichtsuntersuchung, die einen allgemeinen Überblick über verschiedene
Arbeitssysteme geben soll, können unterschiedliche Arten des Herangehens und/oder Grade der Genauigkeit
erfordern. Dieser Teil der ISO 10075 schreibt nicht vor, welcher Grad der Genauigkeit anzuwenden ist, da
sich dieser aus dem Zweck und den Bedingungen der Messung ergibt, in Abhängigkeit z. B. von gesetzlichen
Anforderungen, vertraglichen Regelungen oder Kosten-Nutzen-Überlegungen.

Die Verfahren für die Messung und Erfassung der psychischen Arbeitsbelastung werden in diesem Teil der
ISO 10075 — unabhängig von der anzuwendenden Technik — in drei Präzisionsstufen eingeteilt:

 Stufe 1 für Zwecke der genauen Messung. Der Zweck der Erfassung der psychischen Arbeitsbelastung
auf dieser hohen Präzisionsstufe ist es, zuverlässige und gültige Angaben über die Art der Ursache von
Unter- bzw. Überforderung zu erhalten, um eine Optimierung der Arbeitsbedingungen vornehmen zu
können. Die Verfahren auf dieser Stufe sind sehr wahrscheinlich nur von Fachleuten anwendbar, z. B.
Psychologen, Arbeitswissenschaftlern, Arbeitsmedizinern und Arbeitsphysiologen sowie sonstigen
arbeitsmedizinischen Fachkräften, mit einer angemessenen Ausbildung in den theoretischen Grundlagen
und der Anwendung dieser Verfahren sowie in der Interpretation der Ergebnisse.

 Stufe 2 für Übersichtszwecke (Screening). Die Messung auf dieser Stufe entspricht einem mittleren
Präzisionsniveau und wird in der Regel dazu verwendet, eine Gesamtübersicht zu gewinnen, die eine
höhere Präzision als orientierende Messungen erfordert, z. B. dort, wo Probleme bezüglich der
psychischen Arbeitsbelastung zu erwarten sind oder wo den Ursachen einer unangemessenen
Arbeitsbelastung nachzugehen ist. Auf dieser Stufe anzuwendende Verfahren haben höhere
Zuverlässigkeiten, nachgewiesene Validitäten und sollten in der Lage sein anzuzeigen, ob korrektive
Maßnahmen erfolgen sollten.

 Stufe 3 für Orientierungszwecke. Verfahren auf dieser Stufe ermöglichen dem Anwender, auf einem
niedrigen Präzisionsniveau Informationen über die psychische Arbeitsbelastung zu gewinnen. Sie liefern,
ohne übermäßig hohen Einsatz von Ressourcen, allgemeine Informationen über die jeweiligen
Arbeitsbedingungen, subjektive und psychophysiologische Zustände des Arbeitenden bezüglich
psychischer Arbeitsbelastung. Informationen auf dieser Stufe sollten es ermöglichen, negativen
Auswirkungen vorzubeugen, indem die jeweiligen Ergebnisse Managemententscheidungen auf einer
operativen Ebene zulassen — wie etwa die Veränderung der Arbeitsaufgaben und/oder der Arbeitsver-
fahren und Arbeitsbedingungen. Messungen auf dieser Stufe sind üblicherweise auf orientierende
Messungen beschränkt, bei denen nur sehr grobe Methoden (mit mäßigenden Graden an
Zuverlässigkeit, Validität usw.) zur Analyse von Arbeitsaufgaben, der subjektiven Einschätzung der
Akzeptanz von Arbeitsbedingungen und des subjektiven Erlebens in Bezug auf alle Aspekte der
psychischen Arbeitsbelastung zum Einsatz kommen.

8
EN ISO 10075-3:2004 (D)

Bei der Festlegung, mit welcher Genauigkeitsstufe ein Verfahren angewendet werden kann, ist das
Messobjekt anzugeben. Es sollte angegeben werden, ob der Messgegenstand eine Person oder ein
Situationsmerkmal ist. Wenn der vorgesehene Messgegenstand eine Einzelperson ist, müssen die
psychometrischen Eigenschaften für die Bewertung von Personen erhoben und festgelegt werden. Wenn der
vorgesehene Messgegenstand ein Merkmal einer Arbeitssituation ist, müssen sich die psychometrischen
Eigenschaften auf die Erfassung von Arbeitsbedingungen beziehen. Dies wird im Zusammenhang mit der
Prüfung der Generalisierbarkeit genauer dargelegt (siehe 4.2.7).

Bei der Festlegung auf welcher Genauigkeitsstufe ein Verfahren angewendet werden kann ist weiterhin anzu-
geben, ob die Messung auf einem Einzelwert/einer einzelnen Beobachtung oder auf gemittelten Werten/Be-
obachtungen beruht. Alle Messverfahren beinhalten zwangsläufig Messfehler, die sich durch Mittelwertbildung
über eine Anzahl von Werten oder Beobachtungen verringern lassen. Ein Verfahren, das für Einzelmess-
werte/-beobachtungen das Niveau orientierender Messungen erreicht, kann für Mittelwerte von Messungen/
Beobachtungen das Niveau von Übersichtsmessungen erreichen, wenn eine hinreichende Anzahl von
Werten/Beobachtungen herangezogen wird. Die zum Erreichen einer höheren Genauigkeitsstufe erforderliche
Anzahl von Messwerten/Beobachtungen muss daher ebenfalls angegeben werden.

Ein Verfahren, das den Anspruch erhebt, psychische Arbeitsbelastung zu erfassen, muss nachgewiesene
Validität für die Erfassung der Aspekte haben, für die die Validität behauptet wird, und die jeweiligen
Messbereiche, für die die Validität behauptet wird, müssen eindeutig angegeben sein (z. B. psychische
Ermüdung oder Monotonie). Wenn Validität für mehr als einen Aspekt beansprucht wird, muss die
Dokumentation der Validität die Nachweise für jeden Messbereich enthalten.

Zur Erfassung der psychischen Arbeitsbelastung können unterschiedliche Techniken verwendet werden,
wobei einige Techniken sich für einige Messbereiche besser eignen als für andere. Im Einzelnen können
folgende Techniken angewendet werden:

 physiologische Messungen: diese Verfahren liefern Angaben über physiologische Zustände von
Arbeitenden unter gegebenen Arbeitsbedingungen;

 subjektive Skalierung: diese Verfahren liefern Angaben darüber, wie die Arbeitenden unterschiedliche
Aspekte der psychischen Arbeitsbelastung an ihrem Arbeitsplatz subjektiv einschätzen, z. B. unter
Anwendung psychometrischer Skalen, und wie sie ihre Arbeitsbedingungen erleben;

 Erfassung der Leistung: diese Verfahren bieten die Möglichkeit der Beurteilung der menschlichen
psychischen und psychomotorischen Leistung unter den jeweils gegebenen Arbeitsbedingungen, um
z. B. belastungsbedingte Leistungsbeeinträchtigungen oder -schwankungen zu erfassen;

 Aufgaben- und Tätigkeitsanalyse: mit diesen Verfahren werden Bestandteile der Arbeitsaufgabe,
körperliche und psychosoziale Arbeitsbedingungen, Umgebungsbedingungen und die Organisation des
Arbeitsablaufes als Ursachen psychischer Arbeitsbelastung erfasst.

Um unterschiedliche Grade der Zuverlässigkeit erreichen zu können, sind unterschiedliche Verfahren


erforderlich; so kann z. B. ein kurzer Fragebogen für eine Messung auf orientierendem Niveau ausreichend
sein, während für den Nachweis, dass eine bestimmte Systemgestaltung nicht zu Monotonie führt, Skalen mit
ausreichender Zuverlässigkeit für genau diesen Zweck erforderlich sein werden. Um sicherheitskritische
Systeme oder Systeme mit Gefahrenpotenzial gegen alle negativen Auswirkungen der psychischen
Arbeitsbelastung abzusichern, werden die höchsten Grade an Zuverlässigkeit und Validität der Messung
erforderlich sein. Wo solche Instrumente noch nicht zur Verfügung stehen, sollten sie entwickelt werden. Bis
dahin sind für solche Zwecke von den verfügbaren Verfahren die mit dem höchsten Erfüllungsgrad der
psychometrischen Kriterien anzuwenden. Die Präzision wird nicht durch die Messtechnik selbst bestimmt,
sondern durch die Entwicklung, die psychometrischen Eigenschaften und die sachgerechte Anwendung des
Verfahrens oder Instrumentes.

9
EN ISO 10075-3:2004 (D)

Falls Messverfahren angewendet werden müssen, die nicht den Anforderungen entsprechen, sind spezielle
Fachkenntnisse auf dem Gebiet der psychischen Arbeitsbelastung und ihrer Messung erforderlich,

 um die Risiken der Verwendung eines nicht völlig hinreichenden Verfahrens abzuschätzen, und

 um zu einer sachgerechten Bewertung der Ergebnisse zu gelangen.

Die Wahl eines geeigneten Instrumentes wird jedoch auch immer von rechtlichen oder vertraglichen
Regelungen sowie von Kosten-Nutzen Überlegungen beeinflusst.

4.2 Anforderungen an die Vorgehensweise

4.2.1 Allgemeines

Die Ermittlung der Objektivität, Zuverlässigkeit, Gültigkeit, Messempfindlichkeit und diagnostischen


Aussagekraft eines Messverfahrens kann durch jedes geeignete und wissenschaftlich anerkannte Verfahren
erfolgen. Dieser Teil der ISO 10075 legt nicht einen einzigen besten, bei diesem Vorgehen zu verfolgenden
Weg fest. Erforderlich ist jedoch eine klare Darstellung der bei der Ermittlung der psychometrischen
Eigenschaften eines Messverfahrens angewendeten Strategie, um eine Bewertung der Eignung der
gewählten Vorgehensweise und der erzielten Ergebnisse zu ermöglichen. Faktisch hängt das Vorgehen bei
der Validierung vom angenommenen Messmodell ab, z. B. erfordert die Annahme eines probabilistischen
Messmodells den Einsatz probabilistischer psychometrischer Techniken, wohingegen ein
generalisierbarkeitstheoretischer Ansatz die Abschätzung von Varianzkomponenten und die Berechnung von
Generalisierbarkeits-Koeffizienten erfordert (siehe 4.2.7). Für die Ermittlung der psychometrischen
Eigenschaften von solchen Instrumente gibt es nicht den einen einzigen besten Weg, da dieser zum Teil von
den dem jeweiligen Instrument zu Grunde liegenden Konstruktionsprinzipien abhängt. Ein
generalisierbarkeitstheoretischer Ansatz erlaubt jedoch effektive und effiziente Vorgehensweisen zur
Abschätzung der Kennwerte für die Objektivität, Zuverlässigkeit, Gültigkeit, Messempfindlichkeit und
diagnostische Aussagekraft mit einem vertretbaren Aufwand. In jedem Fall müssen die Vorgehensweisen so
beschrieben werden, dass eine Replikationsstudie der Ermittlung der psychometrischen Eigenschaften
möglich ist.

4.2.2 Objektivität

Für den Nachweis der Objektivität eines Messverfahrens müssen Ergebnisse vorgelegt werden, die belegen,
dass die Person, die die Erfassung oder Messung vornimmt, keinen Einfluss auf die Messwerte/Be-
obachtungen hat. Dies kann am besten dadurch erreicht werden, dass mehr als zwei vorgesehene Anwender
des Messverfahrens Messungen mit dem Verfahren durchführen und die gewonnenen Daten durch geeignete
varianzanalytische Verfahren (ANOVA, analysis of variance) auf Haupt- oder Wechselwirkungseffekte für die
Anwender des Instrumentes analysiert werden. Die Ergebnisse müssen belegen, dass derartige Effekte nicht
bestehen bzw. dass die Schätzwerte dieser Varianzkomponenten nicht signifikant von 0 abweichen. Bei der
Prüfung auf das Vorhandensein solcher Effekte muss sichergestellt werden, dass tatsächlich vorhandene
Effekte der die Messung durchführenden Person nicht unentdeckt bleiben. Für diesen Zweck sollte die
Irrtumswahrscheinlichkeit β auf 0,05 festgesetzt werden und die Irrtumswahrscheinlichkeit α sollte zumindest
auf 0,20 festgesetzt werden. Wenn Effekte der die Messung/Erfassung durchführenden Person nicht
ausgeschlossen werden können, kann das Messverfahren nicht als objektiv angesehen werden.

4.2.3 Zuverlässigkeit

Die Zuverlässigkeit lässt sich über Korrelationsberechnungen bestimmen, wobei beide, die Arbeitenden
und/oder die Situationen, die Messgegenstände sein können, deren jeweilige relative Stellung (innerhalb ihrer
Population oder der Gesamtheit der Bedingungen, auf die generalisiert werden soll) zuverlässig reproduziert
werden muss.

10
EN ISO 10075-3:2004 (D)

Korrelationskoeffizienten vermitteln keine Informationen über absolute Unterschiede zwischen zwei


Datensätzen. Solche Informationen können über varianzanalytische Verfahren gewonnen werden, die auch
die Berechnung von Konsistenz-Koeffizienten erlauben, z. B. über Intra-Class-Korrelations-Koeffizienten. So
kann zum Beispiel die Berechnung von Inter-Rater-Korrelationen für eine Prüfliste zu hohen Korrelationen und
somit auch zu positiven Zuverlässigkeitsschätzungen führen, wenn die Beurteiler in ihren relativen
Beurteilungen übereinstimmen, obgleich zwischen den Beurteilern erhebliche Unterschiede in den jeweiligen
absoluten Werten bestehen. Der Einsatz eines ANOVA-Ansatzes würde zur selben Korrelation führen, aber
einen auf Unterschiede zwischen den Beurteilern zurückgehenden Effekt anzeigen.

Die Homogenität und/oder Konsistenz eines Messverfahrens wird üblicherweise über Inter-Item-Korrelationen
oder Korrelationen von Teilwerten mit dem Gesamtwert beurteilt oder über Korrelationen zwischen
äquivalenten Formen eines Messverfahrens. Strengere Messmodelle können strengere Prüfungen erfordern,
wie z. B. Skalogramm-Analysen. Zum Nachweis der Homogenität eines Instrumentes können auch
Faktorenanalysen, die die Eindimensionalität der Messung belegen, verwendet werden.

4.2.4 Gültigkeit

Die Gültigkeit eines Messverfahrens ist durch konkurrierende Validierung mit einem anderen Verfahren
nachzuweisen, dessen Validität für die vorgesehene Anwendung belegt ist.

Stehen solche Verfahren nicht zur Verfügung, ist die Gültigkeit (quasi-)experimentell nachzuweisen, indem die
Bedingungen/Arbeitsaufgaben, von denen erwartet wird, dass sie zu den zu messenden Phänomenen/
Effekten führen, variiert werden, z. B. eine Veränderung des Ausmaßes der Arbeitsbelastung, die zu
unterschiedlichen Ermüdungsgraden führt, wenn Ermüdung den Messgegenstand darstellt. In diesem Fall
müssen die Intensität der Arbeitsbelastung (z. B. die Schwierigkeit der Aufgabendurchführung) und deren
Dauer variiert werden, eine einfache Variation der Intensität oder der Dauer alleine ist für den Nachweis der
Validität nicht ausreichend. Dazu ist eine geeignete Zusammenstellung von Aufgaben (unter Feld- oder
Laborbedingungen) einzusetzen, in Verbindung mit einer ausreichenden zeitlichen Arbeitsdauer, um additive
oder interaktive Effekte zu erzeugen.

ANMERKUNG Solche Zusammenstellungen geeigneter Aufgaben sind in der AGARD2) STRES Batterie („Standardised
task set for research on environmental stressors“; Standardisierter Aufgabensatz zur Erforschung von Umwelt-Stressoren)
[1] oder im CTS („Criterion Task Set“; Kriterienorientierter Aufgabensatz) [4] zu finden. Wenn emotionale Beanspruchung
oder Beanspruchungswirkungen den Messgegenstand bilden, können für den Nachweis der Validität Gruppen mit
unterschiedlichen Graden emotionaler Arbeitsbelastung verwendet werden.

4.2.5 Messempfindlichkeit (Sensitivität)

Die Messempfindlichkeit eines Verfahrens ist nachzuweisen, indem eine experimentell vorgenommene
Veränderung der psychischen Arbeitsbelastung (bzw. -beanspruchung) in Bezug auf Intensität und Dauer
und deren Wechselwirkung in den Messergebnissen reproduziert wird, z. B. über die Anzahl zu lernender
Einheiten, die Anzahl durchzuführender geistiger Operationen oder die Zeitbegrenzung, unter der die Aufgabe
durchgeführt wird. Unter Feldbedingungen können solche Bedingungsvariationen erreicht werden, indem
Bedingungen gewählt werden, bei denen nachgewiesen ist oder die durch mehrere Beurteiler mit hoher Inter-
Rater-Reliabilität so eingestuft wurden, dass sie unterschiedliche Grade der psychischen Arbeitsbelastung
bewirken.

Die in der Untersuchung der Messempfindlichkeit zu verwendenden Belastungsabstufungen müssen für den
vorgesehenen Anwendungsbereich des Messverfahrens repräsentativ sein.

2) AGARD: Advisory Group for Aerospace Research and Development.

11
EN ISO 10075-3:2004 (D)

4.2.6 Diagnostische Aussagekraft (Diagnostizität)

Die diagnostische Aussagekraft eines Verfahrens ist dadurch nachzuweisen, dass das Verfahren zwischen
unterschiedlichen Arten der psychischen Arbeitsbelastung differenziert, z. B. auf dem Gebiet psychischer
Beanspruchungsfolgen zwischen Ermüdung, Monotonie, Sättigung und herabgesetzter Wachsamkeit. Die
Prüfung der diagnostischen Aussagekraft kann experimentell durch Veränderung der Bedingungen oder unter
Feldbedingungen durch die Auswahl solcher Bedingungen erfolgen, von denen bekannt ist, dass sie zu
unterschiedlichen Arten der psychischen Arbeitsbelastung führen — nachgewiesen z. B. durch Verfahren der
Aufgabenanalyse oder übereinstimmende Einstufungen durch Fachleute, die mit den Arbeitsaufgaben vertraut
sind.

Die in die Untersuchung zur diagnostischen Aussagekraft einzubeziehenden Arten der Arbeitsbelastung
müssen für den vorgesehenen Anwendungsbereich des Messverfahrens repräsentativ sein.

4.2.7 Generalisierbarkeit

Erfolgt die Untersuchung eines Messverfahrens auf Grundlage der Generalisierbarkeitstheorie, ist die Prüfung
der Generalisierbarkeit im Rahmen experimenteller oder quasi-experimenteller Ansätze, im Labor- und/oder
unter Feldbedingungen vorzunehmen, mit einer Variation von Bedingungen, die die unterschiedlichen
Anwendungsbereiche des Messverfahrens repräsentieren (z. B. Messwerte der psychischen Arbeitsbe-
lastung), sowie von solchen, von denen bekannt ist, dass sie Messfehler bewirken bzw. möglicherweise zu
relevanten Messfehlern beitragen, wie etwa die Tageszeit, Populationszugehörigkeit, Grade der Vorbelastung,
Erfahrung. Die Schätzung der Generalisierbarkeit beinhaltet üblicherweise die Schätzung von Varianz-
komponenten mit Hilfe einer Varianzanalyse, die vom Strukturmodell des Messwertes abhängt, z. B. seiner
Aufgliederung in unterschiedliche Quellen der Variation. Daher muss im Messmodell im Voraus festgelegt
werden, was als Fehler- und was als Zielvarianz der Messung anzusehen ist. Anschließend können dann
Generalisierbarkeitskoeffizienten berechnet werden, indem die Ziel- und die relevante Fehlervarianz mit
einander in Beziehung gesetzt werden.

4.2.8 Gebrauchstauglichkeit

4.2.8.1 Allgemeines

Messverfahren müssen effektiv und effizient sein und die Anforderungen der Anwender erfüllen, d. h., sie
müssen bei minimalem Aufwand oder Mitteleinsatz das erwartete Präzisionsniveau im beabsichtigten
Messbereich erreichen und zu den gewünschten Ergebnissen führen.

4.2.8.2 Effektivität

Die Effektivität des Messverfahrens wird durch dessen psychometrische Eigenschaften bestimmt,
insbesondere durch seine Zuverlässigkeit, Gültigkeit, Sensitivität und Diagnostizität.

4.2.8.3 Effizienz

Die Effizienz eines Messverfahrens ist ein relatives Konzept, abhängig von seiner Effektivität (z. B. dem
Präzisionsniveau) und dem Aufwand, der zur Durchführung, Analyse und Interpretation der Messung und ihrer
Ergebnisse erforderlich ist. Messverfahren mit vergleichbarer Effektivität sollten daher bezüglich des mit der
Durchführung einer Messung jeweils verbunden Aufwandes verglichen werden. Aus diesem Grund können
hierfür keine allgemeinen quantitativen Anforderungen festgelegt werden.

4.2.8.4 Zufriedenheit

Ein Messverfahren sollte nicht nur effektiv und effizient sein, sondern darüber hinaus auch die Anforderungen
der jeweiligen Anwender erfüllen. Beschwerden über das Messverfahren sind ein Hinweis auf mangelnde
Zufriedenheit, wohingegen das Ausbleiben von Beschwerden nicht zwingend als Zufriedenheit ausgelegt
werden kann. Unter der Zielsetzung der Verfahrensverbesserung ist es daher wichtig, Messverfahren im
Hinblick auf die Anforderungen der Anwender zu bewerten und die dabei gewonnenen Ergebnisse zu
dokumentieren. Quantitative Anforderungen lassen sich hier nicht festlegen, weil diese von den Erwartungen
der (unterschiedlichen) Anwender in unterschiedlichen Anwendungszusammenhängen abhängig wären.

12
EN ISO 10075-3:2004 (D)

4.3 Quantitative Anforderungen an Messverfahren

4.3.1 Allgemeines

Im Allgemeinen sollten die Verfahren gewählt werden, die die in diesem Teil der ISO 10075 festgelegten
psychometrischen Kriterien für eine gegebene Zielstellung und vorgesehene Anwendung am besten erfüllen.

4.3.2 Anforderungen an die Objektivität

Die Messergebnisse müssen frei von jeglichen signifikanten Effekten der die Erhebung durchführenden,
auswertenden und berichtenden Person sein. Dies ist in der Validierungsstudie nachzuweisen, z. B. mittels
Varianzanalyse, bei der keine Haupt- oder Wechselwirkungseffekte für die die Messung durchführenden
Personen gefunden werden dürfen.

4.3.3 Anforderungen an die Zuverlässigkeit

Für die unterschiedlichen Präzisionsstufen einer Messung müssen mindestens die in Tabelle 1 angegebenen
Homogenitäts- oder Übereinstimmungskoeffizienten erreicht werden (z. B. bestimmt über Cronbach's α als
Maß für die Homogenität oder über eine Korrelation zwischen parallelen Formen als Maß für die Überein-
stimmung(srealiabilität).

ANMERKUNG Die Forderung einer Zuverlässigkeit von 0,7 (erfasst über einen Korrelationskoeffizienten) entspricht
einem Verhältnis von etwa 50 % Fehlervarianz und 50 % Zielvarianz, was als Minimalanforderung für eine zuverlässige
Messung festgesetzt wird.

Für die Inter-Rater-Reliabilität gelten dieselben Anforderungen wie für die Übereinstimmungsreliabilität.

Die Stabilität hängt vom zeitlichen Abstand der Messungen und den dazwischen liegenden Ereignissen/Ver-
änderungen ab. Daher sollte die Stabilität zwischen Messungen in unmittelbar aufeinander folgenden
Messzeitintervallen mit den oben angegebenen Anforderungen an die Homogenität und Übereinstimmung
vergleichbar sein (außer bei subjektiver Skalierung, wo diese Anforderungen nur für parallele Formen gelten).

4.3.4 Anforderungen an die Gültigkeit (Validität)

Bei konkurrierender Validierung (d. h. durch zwei oder mehrere unabhängige parallele Messansätze, z. B.
zwei unterschiedliche psychometrische Skalen) sind die in Tabelle 1 angegeben Validitätskoeffizienten zu
erreichen. Diese Werte beziehen sich auf Messungen innerhalb desselben Abschnittes im Belastungs-
Beanspruchungs-Folgen-Prozess (siehe ISO 10075:1991) und innerhalb derselben Art der Messtechnik.

Die Berechnung von Validitätskoeffizienten über mehrere Abschnitte des Belastungs-Beanspruchungs-


Folgen-Prozesses stellt eine Form der Vorhersage-Validität dar und wird üblicherweise zu niedrigeren
Validitätskoeffizienten führen, als die Berechnung von Validitätskoeffizienten innerhalb desselben Abschnittes.
Dennoch gelten für die Validierung dieselben Grenzwerte.

Wenn für ein multidimensionales Verfahren faktorielle Validität beansprucht wird, sind Korrelationen zwischen
Faktoren/Faktorenskalen von < 0,4 erforderlich.

Wenn für ein Messverfahren Validität für mehr als einen Abschnitt des Belastungs-Beanspruchungs-Folgen-
Prozesses beansprucht wird, ist die Gültigkeit für alle diese Abschnitte nachzuweisen und in Form getrennter
Validitätsschätzungen anzugeben.

4.3.5 Anforderungen an die Messempfindlichkeit (Sensitivität)

Messverfahren müssen in der Lage sein, im vorgesehenen Bereich des Belastungs-Beanspruchungs-Folgen-


Prozesses so weit wie möglich zwischen unterschiedlichen Graden der Arbeitsbelastung zu differenzieren,
z. B. zwischen unterschiedlichen Graden der Aufgabenschwierigkeit im CTS [4] oder der AGARD STRES
Batterie [1] und nicht nur zwischen Extremzuständen.

13
EN ISO 10075-3:2004 (D)

Eine höhere Anzahl von unterschiedlichen Ausprägungen, die ein Verfahren im vorgesehenen Messbereich
zu differenzieren erlaubt, führt zu einer höheren Messempfindlichkeit (d. h., eine höhere Messempfindlichkeit
ermöglicht eine Differenzierung zwischen einer größeren Anzahl von Zuständen in der jeweiligen
Merkmalsausprägung). Tabelle 1 zeigt die Anzahl der Ausprägungen, die auf der jeweiligen Präzisionsstufe
zu unterscheiden sind.

4.3.6 Anforderungen an die diagnostische Aussagekraft (Diagnostizität)

Messverfahren müssen in der Lage sein, zwischen unterschiedlichen Quellen der Arbeitsbelastung und
unterschiedlichen Arten von Folgen psychischer Beanspruchung zu differenzieren, z. B. zwischen
verschiedenen Aufgaben der AGARD STRES Batterie. Daher muss ein Messverfahren für den vorgesehenen
Messgegenstand spezifisch sein und nicht noch durch andere Messgegenstände beeinflusst werden.
Korrelationen mit anderen Messgegenständen müssen so niedrig wie möglich sein (z. B. zwischen Ermüdung
und Sättigung). Korrelationen von > 0,40 weisen auf eine wesentliche Überlappung und damit mangelnde
diagnostische Aussagekraft hin. Tabelle 1 zeigt die auf den jeweiligen Präzisionsstufen erforderlichen
Korrelationen.

Zum Nachweis der diagnostischen Aussagekraft muss das Verfahren in Situationen mit unterschiedlichen
Arten der Arbeitsbelastung angewendet werden (z. B. unterschiedliche Arten von Belastungsbedingungen,
unterschiedliche Arten von Auswirkungen), und es muss gezeigt werden, dass das Verfahren nur die Aspekte
der Arbeitsbelastung erfasst, für die seine Anwendung vorgesehen ist.

Ein bekannter Ansatz zur Überprüfung der Diagnostizität ist die Multitrait-Multimethod-Technik, bei der
mehrere Messverfahren auf mehrere Messgegenstände angewendet werden, wobei diagnostische
Aussagekraft durch höhere Korrelationen innerhalb des gleichen Messgegenstandes als zwischen
unterschiedlichen Messgegenständen nachgewiesen wird.

4.3.7 Anforderungen an die Generalisierbarkeit

Wenn ein generalisierbarkeitstheoretischer Ansatz angewendet wird, müssen die Generalisierbarkeitsstudien


(G-Studien) für den vorgesehenen Anwendungsbereich so repräsentativ wie möglich sein, das heißt, alle
Bedingungen, die im Zusammenhang mit der Messung von Bedeutung sein könnten, sollten in der Studie
vertreten sein, so dass es möglich ist, die relevanten Fehlervarianzen und so die Generalisierbarkeit des
angezielten Messwertes abzuschätzen.

Zuverlässigkeit erfordert unter der Perspektive der Generalisierbarkeitstheorie eine hohe Generalisierbarkeit
des Messwertes unter Berücksichtigung unterschiedlicher Messbedingungen (z. B. Zeit, Einzelmerkmale,
Messwiederholungen). Daher müssen die in Tabelle 2 angegebenen G-Koeffizienten für den Messwert auf
den Stufen 3 bis 1 erreicht werden.

Eine konkurrierende Validierung unter Verwendung unterschiedlicher Verfahren, die denselben Messgegen-
stand erfassen, verlangt unter einem generalisierbarkeitstheoretischen Ansatz im Rahmen einer multivariaten
Analyse den Nachweis hoher Faktorenladungen für den Messgegenstand auf allen Instrumenten. Konstrukt-
Validität kann durch hohe G-Koeffizienten bei Anwendung eines strengen experimentellen Versuchsplanes
nachgewiesen werden. Dazu müssen die in Tabelle 2 dargestellten G-Koeffizienten erreicht werden.

Zum Nachweis der Messempfindlichkeit muss die in Tabelle 2 angegebene Anzahl von Ausprägungen des
jeweils relevanten Merkmals differenziert werden. Das erfordert eine hohe Generalisierbarkeit über die zu
unterscheidenden Merkmalsstufen. Zusätzlich muss gezeigt werden, dass sämtliche Stufen zuverlässig
voneinander zu unterscheiden sind (nicht nur die extremen, wenn mehr als zwei Stufen zu differenzieren
sind), indem für jede Stufe die 95 %-Konfidenzintervalle angegeben werden.

Zum Nachweis der diagnostischen Aussagekraft sollte das Messinstrument in mehreren unterschiedlichen
Situationen oder unter experimentellen Bedingungen angewandt werden, die sich in der Art der
Arbeitsbelastung unterscheiden. Dabei sind die in Tabelle 2 angegebenen G-Koeffizienten für den
beabsichtigten Messgegenstand des Verfahrens zu erreichen, wenn das Verfahren in Situationen oder unter
experimentellen Bedingungen angewandt wird, die den intendierten Messgegenstand einschließen. Wird das
Instrument in anderen Situationen angewandt, sollten sich erheblich geringere G-Koeffizienten ergeben (z. B.

14
EN ISO 10075-3:2004 (D)

nahe 0). Unter Verwendung eines multimethodalen Messansatzes und multivariater Analysetechniken
müssen für alle Messinstrumente, die die beabsichtigten Messgegenstände erfassen sollen oder diese
bekanntermaßen erfassen, hohe Faktorenladungen auf den Messgegenständen erreicht werden, während für
Messverfahren, die andere Messgegenstände erfassen sollen, Ladungen nahe 0 erreicht werden müssen,
ebenso wie bei dem zu untersuchenden Messverfahren auf den nicht intendierten Messgegenständen.

4.3.8 Zusammenfassung der quantitativen Anforderungen

Tabelle 1 zeigt eine Zusammenfassung der quantitativen Anforderungen bei einem der klassischen
Testtheorie folgenden Vorgehen. Tabelle 2 zeigt diese Informationen für ein der Generalisierbarkeitstheorie
folgendes Vorgehen.

Tabelle 1 — Quantitative Anforderungen an Messverfahren für unterschiedliche Präzisionsstufen bei


Ansätzen der klassischen Testtheorie

Mess- diagnostische
Präzisionsstufe Objektivität Zuverlässigkeit Validität
empfindlichkeit Aussagekraft
1 für Zwecke genauer
kein Effekt ≥ 0,9 ≥ 0,5 ≥ 5 Stufen < 0,10
Messungen
2 für Zwecke von
kein Effekt ≥ 0,8 ≥ 0,4 ≥ 3 Stufen < 0,20
Übersichtsmessungen
3 für Zwecke
orientierender kein Effekt ≥ 0,7 ≥ 0,3 ≥ 2 Stufen < 0,40
Messungen

Tabelle 2 — Quantitative Anforderungen an Messverfahren für unterschiedliche Präzisionsstufen


unter Einsatz der Generalisierbarkeitstheorie

G-Koeffizienten
Präzisionsstufe Mess- diagnostische
Objektivität Zuverlässigkeit Validität
empfindlichkeit Aussagekraft
1 für Zwecke genauer
0 ≥ 0,9 ≥ 0,9 ≥ 5 Stufen ≥ 0,90
Messungen
2 für Zwecke von
0 ≥ 0,8 ≥ 0,8 ≥ 3 Stufen ≥ 0,80
Übersichtsmessungen
3 für Zwecke
orientierender 0 ≥ 0,7 ≥ 0,7 ≥ 2 Stufen ≥ 0,70
Messungen

Dort wo es noch keine Messverfahren gibt, die diese Kriterien erreichen, sollten sie entwickelt werden. Bis
dahin sollten die Methoden mit den höchsten psychometrischen Kriterien verwendet werden (siehe 4.1).
Instrumente mit Reliabilitäten < 0,5 dürfen in keinem Fall benutzt werden.

ANMERKUNG Die Anforderungen in Tabelle 1 oder Tabelle 2 gelten nicht für gesetzlich vorgeschriebene
Risikobeurteilungen.

15
EN ISO 10075-3:2004 (D)

4.4 Anforderungen an die Dokumentation

4.4.1 Anforderungen an die Dokumentation für die Entwicklung eines Verfahrens zur Messung der
psychischen Arbeitsbelastung

Die Dokumentation zur Entwicklung eines Verfahrens, mit dem die psychische Arbeitsbelastung gemessen
werden soll, muss die folgenden Angaben enthalten:

 Jahr der Entwicklung;


 Name und Institutionszugehörigkeit des Entwicklers;
 vorgesehener Messgegenstand (z. B. psychische Belastung, Beanspruchung, Ermüdung, siehe
ISO 10075:1991);
 Präzisionsstufe und psychometrische Kriterien des Verfahrens hinsichtlich Zuverlässigkeit, Validität,
Sensitivität und Diagnostizität;
 theoretische Grundlage des Messansatzes;
 zur Messung vorgesehene Populationen/Bedingungen/Universa;
 Populationen/Bedingungen/Universa, an denen die psychometrischen Kriterien bestimmt worden sind;
 psychometrische Eigenschaften des Verfahrens, z. B. Zuverlässigkeiten, Validitäten, Generalisierbar-
keitskoeffizienten;
 der Untersuchungsplan der Studie für die Bestimmung der psychometrischen Eigenschaften;
 die Aufgaben/Bedingungen (und deren Variationen), die zur Bestimmung der Validität verwendet worden
sind;
 die Dauer der Arbeits- und der Ruheperioden (und deren zeitliche Abfolge), die zur Bestimmung der
Validität verwendet worden sind;
 Anforderungen/Einschränkungen hinsichtlich der Bedingungen, unter denen die Messung durchgeführt
werden muss;
 Anforderungen/Einschränkungen hinsichtlich der apparativen Ausstattung;
 Anforderungen/Einschränkungen hinsichtlich der Ausbildung und der Qualifikationen der Person, die die
Messung durchführt (z. B. Psychologe, Arbeitswissenschaftler, Physiologe, Führungskräfte, Arbeits-
mediziner sowie sonstige arbeitsmedizinische Fachkräfte usw.);
 falls vorhanden, Referenznormen für Populationen, Aufgabenstellungen oder Universa von Bedingungen;
 Verfahrensabläufe/Bedingungen, die bei der Durchführung der Messung zu beachten sind;
 Verfahrensabläufe/Bedingungen, die bei der Datenanalyse zu beachten sind;
 Verfahrensabläufe/Bedingungen, die bei der Interpretation der Daten zu beachten sind;
 Abschätzung des Aufwands (Zeit, Personen, Arbeitsmittel), der zur Durchführung der Messung
erforderlich ist;
 Rücklaufquote der Stichprobe bei Fragebogenuntersuchungen;
 Beschreibung des Entwicklungsverfahrens, einschließlich der Ergebnisse zur Effizienzeinschätzung und
Zufriedenheit der Anwender aus Evaluationsstudien;
 Bereitstellung der benötigten Informationen zum Ausfüllen einer Tabelle wie in Anhang B dargestellt.

16
EN ISO 10075-3:2004 (D)

4.4.2 Anforderungen an die Dokumentation für Berichte über Messungen und die Erfassung der
psychischen Arbeitsbelastung

Der Messbericht muss die folgenden Angaben enthalten:

 Zielsetzung der Messung;

 Beschreibung der Messinstrumente [einschließlich einer kurzen Beschreibung des theoretischen


Hintergrundes, des Messgegenstandes (z. B. psychische Belastung, psychische Beanspruchung,
psychische Ermüdung), Präzisionsstufe];

 Name und formale Qualifikation der für die Durchführung der Messung verantwortlichen Person;

 Datum und Zeitpunkt der Messung;

 Anzahl, Alter, Geschlecht und Erfahrung der Teilnehmer oder Arbeitenden, wenn das Ziel der Messung
Bedingungen sind (Beschreibung der Stichprobe für die Untersuchung);

 Beschreibung der Rücklaufquote und Repräsentativität der antwortenden Gruppe(n) bei Fragebogen-
untersuchungen;

 Maßnahmen, die zur Sicherstellung der Objektivität der durchgeführten Messung getroffen wurden;

 Maßnahmen, die zur Sicherstellung der Anonymität/Vertraulichkeit getroffen wurden (falls anwendbar);

 Maßnahmen, die zur Erreichung eines informierten Einverständnisses getroffen wurden;

 Beantwortung der Prüfliste in Anhang B;

 Beschreibung des Ablaufs der Messungen;

 Beschreibung der Belastungsbedingungen (Arbeitsplatz, Aufgabe usw.);

 Einschränkungen beim Ablauf der Messung;

 Bemerkungen der Teilnehmer oder Mitarbeiter;

 während der Messungen aufgetretene Besonderheiten;

 Beschreibung der Ergebnisse, falls anwendbar, je Verfahren;

 Diskussion und Interpretation der Ergebnisse und Schlussfolgerungen für weitere Maßnahmen;

 Unterschrift und Datum.

17
EN ISO 10075-3:2004 (D)

Anhang A
(informativ)

Zusätzliche Information zur Generalisierbarkeit

Die Generalisierbarkeit beschreibt die Zuverlässigkeit, mit der die mit einem Messinstrument gewonnenen
Ergebnisse auf eine Population von Personen und/oder auf eine Grundgesamtheit oder mehrere
Grundgesamtheiten von Bedingungen übertragen werden können. Eine Grundgesamtheit umfasst dabei all
die Bedingungen, die für die Messung als relevant betrachtet werden (z. B. unterschiedliche Tageszeiten,
verschiedene Gestaltungsvarianten einer Anzeige) und für die die am Arbeitsplatz und dessen Gestaltung
vorzufindenden als eine repräsentative Stichprobe betrachtet werden.

In der Regel wird der mit einem Messinstrument oder Verfahren gewonnene Wert für Entscheidungen über
die Gestaltungsgüte eines Arbeitsplatzes oder die Notwendigkeit korrektiver Maßnahmen benutzt. Dabei sind
zwei Arten von Entscheidungen möglich, nämlich relative und absolute Entscheidungen. Relative
Entscheidungen setzen eine vergleichende Untersuchung voraus, z. B. unterschiedliche Gestaltungs-
varianten. In diesem Fall beruht die Entscheidung auf einer relativen Position oder einer Rangordnung der
Gestaltungsvarianten. Das bedeutet, dass Relativurteile sich auf eine Entscheidung darüber beziehen,
inwieweit eine Gestaltungsvariante besser ist im Vergleich zu anderen. Wenn keine Gestaltungsalternativen
vorhanden sind, sondern nur eine einzige Lösung existiert, bedeutet dies, dass die Entscheidung auf einem
absoluten Wert beruht. Absoluturteile beziehen sich also auf Entscheidungen darüber, wie gut z. B. ein
Arbeitsplatz bezüglich der psychischen Arbeitsbelastung gestaltet ist, unabhängig von anderen Gestaltungs-
varianten. Im Rahmen der Generalisierbarkeitstheorie existieren zwei einem Zuverlässigkeits-Koeffizienten
vergleichbare Kenngrößen, die die Genauigkeit jeder dieser beiden Entscheidungen wiedergeben, nämlich:

a) ρ δ2 relativer G-Koeffizient

b) Φ oder ρ 2! absoluter G-Koeffizient

Die G-Koeffizienten beschreiben die Genauigkeit, mit der es möglich ist, ausgehend von einem an einer
Stichprobe von Messungen gewonnenen Messwert auf den tatsächlichen Messwert aus der Grundgesamtheit
der Messungen zu verallgemeinern.

Die Theorie der Generalisierbarkeit geht in folgenden Punkten über die klassische Testtheorie hinaus, indem
sie:

a) in der Lage ist, multiple Fehlerquellen für den Messfehler zu berücksichtigen;

b) in der Lage ist, systematische Fehlerkomponenten zu berücksichtigen;

c) für den vorgesehenen Anwendungsbereich eines Messinstruments zugeschnittene Zuverlässigkeits-


Koeffizienten zur Verfügung stellt;

d) zwischen relativen und absoluten Entscheidungen zu differenzieren erlaubt.

Weiterhin können innerhalb einer einzigen Studie viele der oben erwähnten Parameter wie interne Konsistenz
(Übereinstimmung), Stabilität und Objektivität bestimmt werden, wenn der Versuchsplan entsprechend
konzipiert ist und z. B. als unabhängige Variablen die Faktoren „Items“, „Messzeitpunkt“ und „Anwender des
Messinstruments“ berücksichtigt. In ähnlicher Weise lässt sich die Generalisierbarkeitstheorie auch zur
Untersuchung der Sensitivität und Diagnostizität eines Messinstruments nutzen, mit der Art und dem Niveau
der Arbeitsbelastung als unabhängige Variablen des experimentellen Designs.

18
EN ISO 10075-3:2004 (D)

Anhang B
(informativ)

Prüfliste zur Auswahl eines Messverfahrens

Um bei der Auswahl eines Messverfahrens eine informierte Entscheidung zu treffen, kann die Prüfliste in
Tabelle B.1 eine Hilfe darstellen.

Die benötigten Daten, die im Handbuch oder in Veröffentlichungen über das Messverfahren bereitgestellt
werden, werden eingetragen. Relevante Anforderungen werden eingekreist und es wird geprüft, ob die
Anforderung erfüllt ist. Wo keine quantitativen Anforderungen angegeben sind, wird geprüft, ob das
Messverfahren für den beabsichtigten Zweck geeignet ist.

Tabelle B.1 — Prüfliste zur Auswahl eines Messverfahrens

Merkmal Anforderun-
Abschnitt Anforderungen auf Nicht
gen erfüllt Bemer-
in anwend-
kungen
ISO 10075-3 Präzisions- Präzisions- Präzisions- ja nein bar
stufe 1 stufe 2 stufe 3
klassische
1
Testtheorie
1.1 Objektivität 4.3.2 kein Effekt kein Effekt kein Effekt
1.2 Zuverlässig- 4.3.3 ≥ 0,9 ≥ 0,8 ≥ 0,7
keit
1.3 Gültigkeit 4.3.4 ≥ 0,5 ≥ 0,4 ≥ 0,3
Messempfind-
1.4 4.3.5 ≥ 5 Stufen ≥ 3 Stufen ≥ 2 Stufen
lichkeit
Diagnostische
1.5 4.3.6 < 0,10 < 0,20 < 0,40
Aussagekraft
2 Generalisier-
barkeitstheorie
2.1 Objektivität 0 0 0
2.2 Zuverlässigkeit ≥ 0,9 ≥ 0,8 ≥ 0,7
2.3 Gültigkeit 4.3.7 ≥ 0,9 ≥ 0,8 ≥ 0,7
Messempfind-
2.4 ≥ 5 Stufen ≥ 3 Stufen ≥ 2 Stufen
lichkeit
Diagnostische
2.5 ≥ 0,9 ≥ 0,8 ≥ 0,7
Aussagekraft
Gebrauchs- 4.2.8
3
tauglichkeit
3.1 Effektivität 4.2.8.2
3.2 Effizienz 4.2.8.3
3.3 Zufriedenheit 4.2.8.4

19
EN ISO 10075-3:2004 (D)

Literaturhinweise

[1] AGARD, Human performance assessment methods, AGARD-AGARDograph-308, Neuilly sur Seine:
NATO-AGARD, 1989.

[2] BRENNAN, R. L., Generalizability theory, New York, Springer, 2001.

[3] CROCKER, L. & ALGINA, J., Introduction to classical and modern test theory. Chicago, Ill.: Holt, Rinehart
and Winston, 1986.

[4] SHINGELDECKER, C. A., A task battery for applied human performance assessment research. AFAMRL
Technical Report 84-071; Dayton: Air Force Aerospace Medical research Laboratory, 1984.

[5] ISO 9241-11:1998, Ergonomic requirements for office work with visual display terminals (VDTs) —
Part 11: Guidance on usability.

20

Das könnte Ihnen auch gefallen