Sie sind auf Seite 1von 3

S oder: Standardabweichung ist

nicht gleich Standardabweichung Dr. Guido Pinkernell

Einige Notizen zum Gebrauch der TI-83 und TI-89 bei der
Bestimmung von Verteilungskennwerten.
Wozu zwei Standardabweichungen?
Zwei Werte fr die Standardabweichung Der Schlssel zur Lsung des Problems liegt darin, dass die
GTR sowie CAS erlauben, auf Knopfdruck die wesentlichen beiden beschriebenen Prozeduren die Kennwerte von Hufig-
Kennwerte einer Verteilung festzustellen. Am Beispiel der keits- und nicht Wahrscheinlichkeitsverteilungen ermitteln.
folgenden Liste, die die Krpergren von zehn zufllig aus- Genauer sind es Stichproben, deren Verteilungskennwerte
gewhlten Sechsjhrigen im cm darstellen soll berechnet werden. Stichproben werden erhoben, um Aussa-
gen ber die Grundgesamtheit machen zu knnen. Im Bei-
L1 = { 123,8; 115,2; 120,9; 112,4; 115,8; 115,4;
spiel knnte die Stichprobe deshalb erhoben worden sein, um
118,9; 111,9; 108,5; 121,6 },
eine Verteilung der Krpergren bei sechsjhrigen Jungen
sieht das so aus: zu erstellen. Da man annehmen kann, dass die betrachtete
Gre normalverteilt ist, reicht es, den Mittelwert und die
Streuung zu beziffern. (Dabei ist der Stichprobenumfang von
10 Jungen ziemlich klein. Mit wachsendem Stichprobenum-
fang darf man Kennwerte erwarten, die die wirkliche Grund-
gesamtheit immer besser beschreiben. Wir kommen darauf
zurck.)

Abb. 1 Abb. 2 Der Mittelwert der Stichprobe wird genau so berechnet wie
der Mittelwert der Grundgesamtheit, wenn man letzteren an-
gesichts der Millionen Sechsjhrigen tatschlich vollstndig
erfassen knnte. Nmlich als
n
xi
= (2)
i =1 n
Was die Standardabweichung betrifft, so bietet der TI-83 wie
Abb. 3 Abb. 4 gesagt zwei Werte an, whrend der TI-89 sich gar nur noch
auf den S-Wert beschrnkt, was die Vermutung nahe legt,
Der TI-83 bietet mit S 4,828 und 4,58 zwei Standard-
dass als Ma der Streuung einer Stichprobe womglich
abweichungswerte an, von denen der zweite Wert aufgrund
ungeeignet ist. Und tatschlich ergibt ein Blick in ein Statistik-
seiner Bezeichnung und durch Nachrechnen als die gelufige
lehrbuch (Lienert 1994), dass der S-Wert die erste Wahl dafr
Standardabweichung
ist, auf Grundlage von Stichproben die Standardabweichung
n
( xi )2
= (1) der Grundgesamtheit zu bestimmen. Er heit empirische
i =1 n Standardabweichung und wird berechnet wird als
identifiziert werden kann. Welche Bedeutung hat dagegen der
n
( xi )2
Wert S? Er muss eine wichtigere Rolle als spielen, denn der S= (3)
TI-89 gibt im Gegensatz zum TI-83 unter den Verteilungs- i =1 n 1
kennwerten nur noch S aus. fehlt hier ganz: Die empirische Standardabweichung S ist also wegen des
Teilers n-1 grundstzlich etwas grer als . Whrend mit
der Formel (3) das Streuungsma der Stichprobe berechnet
wird, liegt der Streuung der Grundgesamtheit die Formel (1)
zugrunde. Dass man nun bei Stichproben die empirische
Standardabweichung der -Standardabweichung vorzieht
liegt daran, dass hier in der Regel die wirkliche Streuung
unterschtzt wird. Im Beispiel der Krpergren kann man
Abb. 5 Abb. 6 also sagen, dass der der tatschliche Mittelwert mit 116,44
wohl ganz gut beschrieben wird, whrend die tatschliche
Streuung besser mit S 4,828 anzugeben ist als mit 4,58.
Man ist also meistens nher an der wirklichen Standardab-
weichung, wenn man in der Stichprobe die Summe der Ab-
weichungsquadrate durch n-1 teilt. Bei umfangreicheren
Stichproben, also bei wachsendem n, nhern sich die empiri-
Abb. 7
sche Standardabweichung und die - Standardabweichung

Seite 1 / 3 aus: TI Nachrichten 1/06


S oder: Standardabweichung ist nicht gleich Standardabweichung Dr. G. Pinkernell

einander an. Und das macht Sinn, denn je umfangreicher die


Stichprobe ist, desto hnlicher wird diese der Grundgesamt-
heit.

Woher kommt der Teiler n-1?


Warum S besser geeignet ist als wird in der Fachliteratur
mithilfe des Begriffs Erwartungstreue erklrt und kann mit
schtztheoretischen Mitteln bewiesen werden (Bchter und
Henn 2005, S. 315). Ein anderer Erklrungsansatz nimmt Abb. 8 Abb. 9
Bezug auf die Freiheitsgrade einer Gleichung (Lienert 1994,
S. 42). Soll nmlich eine Stichprobe die wirklichen Kennwer-
te der Grundgesamtheit liefern was man als Idealfall ja von
ihr erwartet dann ist in der Gleichung des Mittelwertes (2)
der Parameter als Mittelwert der Grundgesamtheit schon
festgelegt. Die Stichprobenwerte xi knnen bis auf den letzten
zufllig gezogen werden. Der letzte Wert xn dagegen muss Abb. 10
einen bestimmten Wert annehmen, damit die Gleichung bei Die Screenshots zeigen fr die erste Stichprobe einen Mittel-
der idealen Stichprobe auch erfllt ist. Es sind also n-1 Stich- wert von 111,23, was dem tatschlichen Mittelwert von 116,5
probenwerte, die frei gewhlt werden knnen. n-1 heit dem- relative nahe kommt. Die empirische Standardabweichung
nach auch die Anzahl der Freiheitsgrade dieser Stichprobe. liegt mit etwa 4,132 der tatschlichen Standardabweichung
Da nun nur n-1 der Stichprobenwerte in der idealen Stichpro- von 5,3 nher als =3,92.
be wirklich frei sind, tut man bei der Berechnung der Stan-
dardabweichung so, als wenn der Stichprobenumfang nur n-1 Eine bersicht ber die Kennwerte weiterer simulierter zuflli-
betrgt. Deshalb wird die Summe der Abweichungsquadrate ger Stichproben zeigt keine Prferenz fr die empirische
durch n-1 geteilt. Der n-te Stichprobenwert fllt dabei nicht Standardabweichung:
unter Tisch, sondern wird in der Formel (3) weiter bercksich- Empirische
tigt. Ihre Abweichung vom Mittelwert wird, so kann man das Standard- Standard-
sich erklren, auf die brigen n-1 Abweichungen verteilt, da abweichung abweichung S besser als
die brigen n-1 Stichprobenwerte diese letzte Abweichung ja Mittelwert S
verursacht haben. 116,21 5,381 5,105 X
Die Erklrung ist in dieser Krze zugegebenermaen unbe- 114,83 6,018 5,709
friedigend. Der Autor hat sich stattdessen einmal den Spa 117,69 7,314 6,938
gemacht, mittels des Rechners das Messen der Krpergre
117,14 3,635 3,449 X
von zehn zufllig ausgewhlten Sechsjhrigen zu simulieren.
Zu jeder Stichprobe werden Mittelwert und sowie S berech- 120,03 5,473 5,192
net und mit den entsprechenden Kennwerten der normalver- 115,69 5,335 5,061 X
teilten Grundgesamtheit gegenber gestellt. Diese sind be-
kannt und lauten fr sechsjhrige Jungen =116,5 (cm) und Bei insgesamt 50 Stichproben sind es sogar nur 22 Flle, in
=5,3 (Elemente d. Mathematik: LK Stochastik 2003 S. 229). denen die empirische Standardabweichung als Nherungs-
wert der tatschlichen Standardabweichung besser geeignet
Eine statistische berprfung war als der -Wert. Das ist weniger als die Hlfte. Besttigt
Der Befehl randNorm(116.5,5.3) erzeugt eine normalver- hat sich damit die Prferenz fr den S-Wert bei Stichproben-
teilte Zufallszahl mit den genannten Kennwerten. Der Befehl erhebungen nicht. Wrde dieses Thema im Unterricht bespro-
round(randNorm(116.5,5.3),1) rundet diese Zahl auf chen werden, dann knnte man eine grere Anzahl an Simu-
eine Dezimalstelle. lationen in der Lerngruppe durchfhren und zum Gegenstand
Und seq(round(randNorm(116.5,5.3),1),i,1,10) eines Hypothesentests machen.
erzeugt eine Liste von zehn solchen Zufallszahlen. Das sind
also die Krpergren der zehn aus der normalverteilten Konsequenzen fr den Mathematikunterricht
Grundgesamtheit zufllig ausgewhlten Jungen. Diese Liste Kaum ein Schulbuch, das ich berprfen konnte, weist darauf
wird zur Bestimmung der Kennwerte mittels STO als liste hin, dass bei der Beschreibung von Grundgesamtheiten durch
abgespeichert. Die Befehle mean(liste) und Stichproben die empirische Standardabweichung zu verwen-
stdDev(liste) geben den Mittelwert und die empirische den ist. In einem Buch ist die empirische Standardabweichung
Standardabweichung (also S) aus. Auf dem TI-89 muss der sogar sinngem als -Standardabweichung fr Stichpro-
-Wert nachprogrammiert werden, und zwar wie folgt: ben falsch definiert. Was ist also im Unterricht zu tun, wenn
sqrt(sum((mean(t)-t)^2,1,dim(t))/dim(t)) einerseits die empirische Standardabweichung nicht vor-
(t). kommt, andererseits Rechner wie der TI-89 ein anderes
Streuungsma gar nicht erst anbietet? Meine Vorschlge:

Seite 2 / 3 aus: TI Nachrichten 1/06


S oder: Standardabweichung ist nicht gleich Standardabweichung Dr. G. Pinkernell

Bei Problemstellungen, in denen mittels der Kennwerte Literatur


von Stichproben auf die Grundgesamtheit geschlossen Andreas Bchter und Hans-Wolfgang Henn (2005):
werden soll, sind ggf. beide Standardabweichungen zu- Elementare Stochastik. Berlin, Heidelberg, New York:
Springer
lssig. Lienert (1994, S. 42) schreibt, dass beide Werte
Beat Eicke (2003): Statistik. Glarus: Pythagoras Lehrmittel
in der wissenschaftlichen Literatur diskutiert werden. H. Griesel, H. Postel, F. Suhr (Hrsg.)(2003): Elemente der
Mathematik. Leistungskurs Stochastik. Hannover:
Bei der Bestimmung der Kennwerte von diskreten Wahr-
Schroedel
scheinlichkeitsverteilungen dagegen ist die Verwendung Gustav Lienert, Alexander von Eye (1994):
der empirischen Standardabweichung S unzulssig. Die Erziehungswissenschaftliche Statistik. Weinheim und
Formel (3) wrde im Vergleich zur korrekten Formel (1) Basel: Beltz
zu niedrig sein. Wo er wie beim TI-89 nicht angeboten
wird, ist es u. U. sinnvoll, wie oben fr den TI-89 be- Autor:
schrieben nachzuprogrammieren. Dr. Guido Pinkernell
Gymnasium Johanneum Lingen
http://qnetz.johanneum-lingen.de
E-Mail: guido.pinkernell@gmx.de

Seite 3 / 3 aus: TI Nachrichten 1/06