Sie sind auf Seite 1von 7

2 Sozialwissenschaftlich relevante Variablen und ihre Messung

Quantitative und qualitative Variablen. Objekte konnen sich der Quan- titat Oder Qualitat nach unterscheiden. Dem entspricht eine herkomm- liche Unterscheidung von quantitativen und qualitativen Variablen. Wir werden diese Unterscheidung nicht verwenden. Eine differenziertere, an vier Skalenniveaus orientierte Klassifikation von Variablen ist in Ab- schnitt 2.1 beschrieben.

Kann man Objekte im Hinblick auf eine bestimmte Eigenschaft der GroBe nach unterscheiden, d. h., konnen Objekte im Hinblick auf eine bestimmte Eigenschaft groBer oder kleiner, hoher oder niedriger oder mehr oder weniger sein, so spricht man von einer quantitativen Varia- blen. Beispiele quantitativer Variablen sind die Variablen Lebensalter, KorpergroBe, Einkommen, FamiliengroBe, Geburtenrate, Religiositat, soziale Distanz, Arbeitszufriedenheit und Anzahl vollendeter Schul- jahre.

Kann man Objekte im Hinblick auf eine bestimmte Eigenschaft der Art oder Qualitat nach unterscheiden, so spricht man von einer qualitativen Variablen. Beispiele qualitativer Variablen sind die Variablen Ge- schlechtszugehOrigkeit mit den Auspragungen (den Kategorien) mann- lich und weiblich, Nationalitat mit den Auspragungen britisch, deutsch, franzosisch, italienisch, andere, keine, und Konfessionszugehorigkeit mit den Auspragungen evangelisch, katholisch, andere, keine. Da die Aus- pragungen qualitativer Variablen nicht groBenmaBig geordnet sind, kann ein Objekt beztiglich einer qualitativen Variablen nicht groBer, hoher oder mehr sein als ein anderes Objekt; die Objekte sind entweder gleich oder ungleich. Dennoch sind auch qualitative Variablen der statistischen Analyse zuganglich.

2

Sozialwissenschaftlich relevante Variablen und ihre Messung

2 1

Kontinuierliche und diskrete Variablen. Quantitative Variablen werden des weiteren danach unterschieden, ob sie kontinuierliche (stetige) oder diskrete (diskontinuierliche) Variablen sind. Kontinuierliche konnen in einem bestimmten Bereich jeden beliebigen Wert annehmen, z. B. die Variablen Entfemung, Lebensalter und KorpergroBe. Der Ausdehnungs- bereich einer kontinuierlichen Variablen kennt keine Liicken oder Sprungstellen. Diskrete Variablen konnen nur ganz bestimmte Werte annehmen, z. B. die Variablen Anzahl eigener Kinder oder Haushalts- groBe in Personen. Obwohl die Werte einer diskreten Variablen eben- falls einen groBen Bereich abdecken konnen (siehe z. B. die Variable Einwohner), sind sie stets isolierte Werte, zwischen denen Liicken bzw. Sprungstellen bestehen. Diskrete Variablen beruhen im allgemeinen auf einem Zahlvorgang, kontinuierliche Variablen auf einem MeBvorgang.

Die Unterscheidung von kontinuierlichen und diskreten Variablen ist je- doch eher eine graduelle als prinzipielle. So ist beispielsweise das - in kleinsten Zeiteinheiten gemessene - Lebensalter eine kontinuierliche Variable, das Einkommen hingegen eine diskrete Variable, weil es - auch in kleinsten Wahrungseinheiten ausgedriickt - nur ganzzahlige Werte annehmen kann. In der statistischen Behandlung besteht zwischen derart fein abgestuften diskreten und kontinuierlichen Variablen kein Unterschied. So werden mitunter diskrete Variablen wie kontinuierliche Variablen behandelt, etwa wenn die durchschnittliche GroBe der Privat- haushalte einer bestimmten Region mit, sagen wir, 2.73 Personen ange- geben wird, mit einem Wert also, der in der Realitat nicht vorkommt, der aber einen bestimmten Aspekt der Realitat sehr gut beschreibt.

Kontinuierliche Variablen werden im ubrigen haufig durch Zusammen- fassung benachbarter Werte klassiert, man sagt auch gruppiert, und dadurch fur die statistische Behandlung zu diskreten Variablen mit einer (meist drastisch) reduzierten Anzahl von Auspragungen.

2 2

2 Sozialwissenschaftlich relevante Variablen und ihre Messung

2.1 MeBniveaus bzw. Skalentypen

Die verbreitetste Klassifikation sozialwissenschaftlich relevanter Varia- blen folgt der von dem Psychophysiker STEVENS vorgeschlagenen Klassifikation nach Mafigabe formaler Relationen zwischen den Varia- blenauspragungen bzw. Skalenwerten. Nach STEVENS (1946) besteht Messen in der Zuordnung von Zahlen zu Objekten oder Ereignissen gemafi Regeln, so da6 bestimmte Relationen zwischen den Zahlen ana- loge Relationen zwischen den Objekten oder Ereignissen reflektieren. Je nachdem, welche Relationen zwischen den Zahlen im gegebenen Fall empirischen Sinn haben, kann man vier MeBniveaus bzw. Typen von Skalen (oder Variablen) unterscheiden, namlich Nominal-, Ordinal-, Intervall- und Ratioskalen.

Nominalskalen. Die grundlegendste und zugleich simpelste Operation in jeder Wissenschaft ist die der Klassifizierung oder Klassifikation. Klassi- fizieren bedeutet Einordnen von Objekten oder Ereignissen in Klassen oder Kategorien im Hinblick auf eine bestimmte Eigenschaft oder Dimension. Alle anderen MeBoperationen, gleichgtlltig wie prazise sie sind, schlieBen die Klassifizierung als Minimaloperation ein. Nominal- skalen, auch qualitative Klassifikationen genannt, bestehen lediglich aus einem Satz rangmaBig nicht geordneter Kategorien; sie reprasentieren das niedrigste MeBniveau.

Fur Nominalskalen ist konstitutiv, daB die Kategorien vollstandig sind (d. h. alle Falle einschlieBen) und sich gegenseitig ausschlieBen (d. h., kein Fall darf in mehr als eine Kategorie gelangen). Beispielsweise ist die Variable Geschlechtszugehorigkeit eine nominale Variable oder Nominalskala: Fersonen konnen entweder der Kategorie mannlich oder der Kategorie weiblich zugeordnet werden; keine Person kann beiden Kategorien zugeordnet werden. Weitere Beispiele solcher Altemativ- klassifikationen sind: berufstatig / nicht berufstatig, unter 18 Jahre alt / 18 Jahre und alter, Ja- / Nein-Antworten auf eine Frage. Die Varia- blen konnen beliebig viele Auspragungen oder Kategorien haben, z. B.

2.1 Mef3.niveaus bzw. Skalentypen

23

Berufsstatus: Arbeiter / Angestellter / Beamter / Selbstandiger, oder Familienstand: ledig / verheiratet / verwitwet / getrennt lebend / ge- schieden, oder Nationalitat: Belgier / Brite / Franzose / Italiener / son- stige / keine. (Hat eine Variable zwei Auspragungen, so spricht man von einer dichotomen (zweistufigen) Variablen oder Dichotomie, hat sie drei Auspragungen, von einer trichotomen (dreistufigen) Variablen oder Trichotomie, generell, bei mehr als zwei Auspragungen, von einer polytomen (mehrstufigen) Variablen oder Polytomie.) Wenn die Kate- gorien vollstandig sind und sich gegenseitig ausschlieBen, sind die minimalen Voraussetzungen filr die Anwendung bestimmter statisti- scher Verfahren gegeben. Fur die Benennung der Kategorien benotigen wir keine Zahlen, sondem nur eindeutige Zeichen. Diese konnen natilr- lich auch Zahlen sein, ebensogut aber auch Buchstaben, Worter oder geometrische Figuren. Zahlen v^erden hier nur in ihrer Zeichenfunktion zugeordnet.

Nehmen wir als Beispiel einen intemationalen Sportwettbewerb, dessen aktive Teilnehmer Ruckennummem tragen, etwa die Teilnehmer der Nation A die Nummern 1 bis 17, die Teilnehmer der Nation B die Nummem 18 bis 43, die Teilnehmer der Nation C die Nummern 44 bis 57 usw. Normalerweise implizieren diese Zahlen weder eine Rangord- nung der Nationen noch eine Rangordnung der teilnehmenden Sportier; sie sind nichts weiter als Namen, die Kategorien bezeichnen bzw. der Identifizierung der Aktiven dienen. Wenn Zahlen lediglich dem Zweck dienen, Kategorien voneinander zu unterscheiden, ist es nicht sinnvoll, sie den iiblichen arithmetischen Operationen zu unterwerfen. Die Ruckennummem von Sportlem oder die Nummem von Autoschildem, Personalausweisen, Hotelzimmem usw. zu addieren, ware offensicht- licher Unsinn.

Ordinalskalen. Haufig ist es moglich, Objekte im Hinblick auf den Grad, in dem sie eine bestimmte Eigenschaft besitzen, zu ordnen, obwohl wir nicht genau wissen, in welchem MaUe sie diese Eigenschaft besitzen. In solchen Fallen kann man sich die Objekte auf einem Kontinuum ange-

2.1 MeBniveaus bzw. Skalentypen

25

alle Eigenschaften einer Intervallskala und uberdies einen absoluten (invarianten) Nullpunkt, so ist sie eine Ratioskala, auch Verhaltnisskala genannt. Eigenschaften, die mit Skalen gemessen werden, bei denen die Distanz zwischen den Skalenpositionen 0 und 1, 1 und 2, 2 und 3 usw. gleich sind, werden haufig Intervallvariablen (oder metrische Variablen) und die erlangten Messungen intervallskalierte (oder metrische) Daten genannt. Diese Bezeichnungen bringen die sogenannte Aquidistanz der Intervalle zum Ausdruck. So ist z. B. die Entfemung von einem Kilo- meter stets dieselbe Distanz, gleichgtiltig ob es sich um den ersten oder letzten Kilometer einer Reise handelt. Gleicherweise ist die Differenz zwischen 110 und 100 Euro dieselbe wie die Differenz zwischen 20 und 10 Euro. In beiden Fallen, Kilometer und Euro, ist der Abstand zwischen nebeneinanderliegenden Werten an jedem Ort der Skala gleich. Der mit der Erreichung metrischen MeBniveaus verbundene Vorteil besteht darin, daB die elementaren Rechenoperationen der Addition, Subtraktion, Multiplikation und Division sinnvoU auf die Differenzen zwischen den MeBwerten angewendet werden konnen.

Bei Intervallskalen gibt es zwei willkiirliche Momente, namlich die Wahl der IntervallgroBe (der MaBeinheit) und die Wahl des Nullpunktes. Beispielsweise ist unsere Kalenderrechnung eine Intervallskala, deren IntervallgroBe ein Jahr (oder zwOlf Monate) und deren Nullpunkt das Geburtsjahr Christi (nicht etwa das Geburtsjahr Mohammeds) ist. Die Eigenschaften von Intervallskalen werden gewohnlich am Beispiel der Temperaturmessung illustriert. Betrachten wir dazu die folgenden drei Skalen:

Temperaturskala nach

 

Celsius

Fahrenheit

Kelvin

Gefrierpunkt des Wassers

32°

273°

Siedepunkt des Wassers

100°

212°

373°

2 6

2 Sozialwissenschaftlich relevante Variablen und ihre Messung

Die Verhaltnisse der TQmpQmtxrdifferenzen (Intervalle) sind unabhangig von der Einheit der Skala und der Lage des Nullpunktes. Der Gefrier- punkt des Wassers (nicht der Gefrierpunkt des Athylalkohols) liegt auf der Celsiusskala bei 0° und der Siedepunkt bei 100°, auf der Fahren- heitskala bei 32° und 212°. Wenn wir dieselben Temperaturen auf beiden Skalen ablesen, erhalten wir zum Beispiel

c

10°

30°

100°

F

32°

50°

86°

212°

Das Verhaltnis der Differenzen zwischen den Temperaturwerten der einen Skala ist gleich dem Verhaltnis der entsprechenden Differenzen der anderen Skala. Auf der Celsiusskala ist z. B. das Verhaltnis der Diflferenz zwischen 30 und 10 und der zwischen 10 und 0 gleich (30 - 10) / (10 - 0) = 2, und auf der Fahrenheitskala gleich (86 - 50) / (50 - 32) = 2. Es ware allerdings nicht sinnvoll zu sagen, dafi es bei einer Temperatur von 10° C halb so warm sei wie bei einer Temperatur von 20° C. Das leuchtet sofort ein, wenn man die Celsiuswerte in Fahren- heitwerte transformiert: 20° C entsprechen 68° F, und 10° C entsprechen 50° F. Zwar ist 10/20 = 0.5, aber 50/68 = 0.74 :7^ 0.5. Es hat also keinen Sinn, hier Verhaltnisse (Quotienten) zu bilden. Das ist erst sinnvoll beim hochstwertigen Skalentyp, der Ratioskala.

Wenn, wie erwahnt, eine Skala alle Eigenschaften der Intervallskala und auBerdem einen invarianten Nullpunkt hat, dann ist sie eine Ratioskala (Verhaltnisskala). Beispiele von Ratioskalen sind das Lebensalter, das Einkommen, die Kelvinsche Temperaturskala (mit dem absoluten Null- punkt bei -273° C), die KorpergroBe und das Korpergewicht. Auch die Skala der Kardinalzahlen ist eine Ratioskala, jene Skala, die wir be- nutzen, um Individuen, Objekte oder Ereignisse zu zahlen, z. B. die Anzahl der Personen des Haushalts, die Anzahl eigener Blicher oder die Anzahl der Verwandtenbesuche. (Die auf Abzahlen basierende Skala

2 8

2 Sozialwissenschaftlich relevante Variablen und ihre Messung

wird, da6 B mehr als A verdient, verzichtet man auf die verfilgbare Information, daB die Differenz 2000 Euro betragt. Im allgemeinen ist es deshalb von Vorteil, das erzieite MeBniveau bzw. den Informations- gehalt der Daten nicht zu „verschenken". Wenn wir den umgekehrten Weg gehen und z. B. ordinalskalierte Daten wie intervallskalierte Daten behandeln, miissen wir uns daruber im klaren sein, daB dieser Schritt nicht durch die arithmetischen Operationen, die wir durchfuhren, iegitimiert wird. Vielmehr setzt die Anwendung bestimmter Verfahren schon voraus, daB ein bestimmtes MeBniveau erreicht wurde. Wie er- wahnt, sind die iiblichen arithmetischen Operationen nur bei intervall- und ratioskalierten (bei metrischen bzw. quantitativen) Daten sinnvoll. Andererseits sind gerade nominales und ordinales Messen die am haufig- sten erreichten Typen in der empirischen Sozialforschung. Infolge- dessen kommt jenen Methoden und MaBzahlen, die fur nominale und ordinale Daten konzipiert wurden, in der Analyse sozialwissenschaft- licher Daten eine besondere Bedeutung zu.