Sie sind auf Seite 1von 2

Wichtige statistische Kennzahlen: Eine und zwei Stichproben

Stichprobe: 14, 17, 52; Population: 𝜎𝑥 = 7, 𝜇𝑥 = 25

Bezeichnung Abkürzung Formel Beispiel Beschreibung


14 + 52 + 17 Der Mittelwert ist die Summe aller Werte geteilt
Mittelwert 𝑥̅ 𝑥̅ = = 27.7
3 durch die Anzahl der Werte.
Der Medianwert ist der Wert, der die Stichprobe in
zwei Teile mit gleich vielen Elementen teilt. Er ist der
„mittlere“ Wert. Man erhält ihn, indem man die
Werte der Stichprobe der Grösse nach ordnet und
Median 𝑥̃ 𝑥̃ = 17
a) bei einer ungeraden Anzahl den Wert in der Mitte
auswählt.
b) bei einer geraden Anzahl den Mittelwert aus den
beiden Werten in der Mitte berechnet.
Der Modalwert wird auch Modus genannt. Er
Modalwert oder
- - - entspricht bei einer Häufigkeitsverteilung dem Wert
Modus
bzw. der Grössenklasse mit der grössten Häufigkeit.
Die Spannweite (eng. range) ist die Differenz
Spannweite - 14 bis 52 zwischen dem kleinsten (Minimum) und dem
grössten (Maximum) Wert.
𝑠𝑥2 (𝑆𝑡𝑖𝑐ℎ𝑝𝑟𝑜𝑏𝑒) (14 − 27.7)2 + (52 − 27.7)2 + (17 − 27.7)2 Die Varianz ist ein Mass für die mittlere quadratische
Varianz 𝑠𝑥2 = = 446.3
𝜎𝑥2 (𝑃𝑜𝑝𝑢𝑙𝑎𝑡𝑖𝑜𝑛) 3−1 Abweichung der Daten zu ihrem Mittelwert.
Die Standardabweichung gibt die mittlere
Standard- 𝑠𝑥 (𝑃𝑜𝑝𝑢𝑙𝑎𝑡𝑖𝑜𝑛)
𝑠𝑥 = √446.3 = 21.1 (durchschnittliche) Abweichung der Einzelwerte vom
abweichung 𝜎𝑥 (𝑃𝑜𝑝𝑢𝑙𝑎𝑡𝑖𝑜𝑛)
Mittelwert an.
Der Variationskoeffizient drückt die Streuung in
Variations- 21.1
VK 𝑉𝐾 = = 0.76 Prozenten des Mittelwerts aus.
koeffizient 27.7
Standardfehler 7 Man kann den Standardfehler für verschiedene
des Mittelwerts, 𝜎𝑥̅ 𝜎𝑥̅ = = 4.04 Parameter berechnen. Am allermeisten wird der
wenn σx bekannt √3 Standardfehler des Mittelwerts verwendet (Standard
Standardfehler Error of the mean, meist wird nur SE abgekürzt). Der
des Mittelwerts, 21.1 Standardfehler des Mittelwerts ist ein
𝑠𝑥̅ 𝑠𝑥̅ = = 12.18
wenn σx √3 Streuungsmass für die Verteilung der Stichproben-
unbekannt mittelwerte.
Einen x-Wert einer beliebigen Normalverteilung in
z-Wert für 14 − 25
z 𝑧= = −0.22 einen z-Wert der Standard-Normalverteilung
Einzelwerte 7 umwandeln.
z-Wert für 27.7 − 25 Einen Stichprobenmittelwert einer beliebigen
Stichproben- z 𝑧= = 0.67 Normalverteilung in einen z-Wert der Standard-
7
mittelwerte √3 Normalverteilung umwandeln.
t-Wert für 27.7 − 25 Berechnen eines t-Werts für den Mittelwert einer
Mittelwerte von t 𝑡= = 4.04 Stichprobe. Achtung: 𝜎𝑥 ist unbekannt, weshalb man
21.1
Stichproben √3 𝑠𝑥 in die Formel einsetzt → t-Verteilung.
Wichtige statistische Kennzahlen: Mehrere Stichproben (Anova + Kruskal-Wallis Test)
Weizensorten: Arina(62.9, 68.7, 65.2), Boval(60.7, 64.2, 58.1, 61.7, 63.3), Obelisk(72.2, 75.6, 74.4, 69.8); 𝑦̅ = 66.4, 𝑆𝑄𝑇𝑜𝑡 = 350.74, 𝑆𝑄𝐹𝑎𝑘𝑡 = 291.36, 𝑆𝑄𝑅𝑒𝑠 = 59.38

Bezeichnung Abkürzung Formel Beispiel Beschreibung


Zielvariable Zunahme des Körpergewichts in kg, Den Parameter, von dem wir erwarten, dass er sich unter den verschiedenen
- - Grösse des Ertrags in dt, Wachstum Bedingungen verändert, nennen wir Zielvariable (auch Abhängige Variable, Response
in cm Variable oder Dependent Variable).
Unabhängige Variable Geschlecht Die Parameter, von denen wir annehmen, dass sie die Zielvariable beeinflussen nennen
(Faktor) - - Sorte wir Unabhängige Variablen (auch Erklärende Variablen, Independent Variables oder
Düngung Faktoren). Sie müssen kategoriell (nominal oder ordinal) sein.
Faktorstufe Geschlecht: männlich, weiblich Als Faktorstufen bezeichnet man die Ausprägungen (verschiedene Levels) eines Faktors.
- - Sorte: Boval, Obelisk und Arina
Düngung: wenig, mittel, viel
Gesamtmittelwert Der Mittelwert ist die Summe aller Werte geteilt durch die Anzahl der Werte.
𝑦̅

Summe der Quadrate n Gesamte Streuung die in einem Datensatz vorhanden ist.
Total SQTot SQ Total =  ( y n − y ) 2
n =1 Siehe Dokument
Summe der Quadrate k r „SQ berechnen.pdf“ Anteil an der Gesamtstreuung der durch den Faktor verursacht wird.
SQ Faktor =  ( yi. − y..)
2
des Faktors SQFakt
i =1 j =1

SQ Rest =   ( yij − yi. )


Summe der Quadrate k r
2
Zufällige Streuung
des Rests SQRes
i =1 j =1

Durchschnittliches 𝑆𝑄𝑇𝑜𝑡𝑎𝑙 350.74 Durchschnittliches Quadrat Total


DQTot 𝐷𝑄𝑇𝑜𝑡𝑎𝑙 = 𝐷𝑄𝑇𝑜𝑡𝑎𝑙 = = 31.89
Quadrat Total (𝑛 − 1) 11 n=Anzahl Datenpunkte
Durchschnittliches 𝑆𝑄𝐹𝑎𝑘𝑡𝑜𝑟 291.36 Durchschnittliches Quadrat des Faktors
DQFakt 𝐷𝑄𝐹𝑎𝑘𝑡𝑜𝑟 = 𝐷𝑄𝐹𝑎𝑘𝑡𝑜𝑟 = = 145.68
Quadrat des Faktors (𝑘 − 1) 2 k=Anzahl Gruppen (Faktorstufen)
Durchschnittliches 59.38 Durchschnittliches Quadrat der Reststreuung
𝑆𝑄𝑅𝑒𝑠𝑡 𝐷𝑄𝑅𝑒𝑠𝑡 = = 6.60
Quadrat der DQRest 𝐷𝑄𝑅𝑒𝑠𝑡 = 9 n=Anzahl Datenpunkte; k=Anzahl Gruppen (Faktorstufen)
(𝑛 − 𝑘)
Reststreuung
F-Wert 𝐷𝑄𝐹𝑎𝑘𝑡𝑜𝑟 145.68 Wert der F-Verteilung
- 𝐹 − 𝑊𝑒𝑟𝑡 = 𝐹 − 𝑊𝑒𝑟𝑡 = = 22.08
𝐷𝑄𝑅𝑒𝑠𝑡 6.60
Bestimmtheitsmass • R2=1 bedeutet, dass die abhängige Variable y vollständig durch die unabhängige
Variable x beschrieben wird.
• R2=0 bedeutet, dass die Variable y nicht von der Variable x abhängt.
𝑆𝑄𝐹𝑎𝑘𝑡𝑜𝑟 291.36
B% = R2 𝑅2 = 𝑅2 = = 0.8307 = 83.07% • Man interpretiert R2 auch als Anteil der Variabilität von y, der durch die unabhängige
𝑆𝑄𝑇𝑜𝑡𝑎𝑙 350.74
Variable erklärt wird.
• Ist R2 > 0.5, spricht man meistens von einem starken Zusammenhang und von einer
starken Reduktion der Variabilität.
Versuchsfehler Die übrigen Einflussgrößen, welche man nicht im Versuch erfassen konnte oder wollte,
werden zum sogenannten Versuchsfehler zusammengefasst. Wenn man z.B. bei einem
ε 𝜀 = √𝐷𝑄𝑅𝑒𝑠𝑡 𝜀 = √6.60 = 2.57 Weizenversuch nur die Sorten berücksichtigt, können die Bewässerung oder die Düngung
Teil vom Versuchsfehler sein.
Variationskoeffizient Der Variationskoeffizient drückt den Versuchsfehler in Prozenten des Gesamtmittelwerts
VK √𝐷𝑄𝑅𝑒𝑠𝑡 √2.568 aus. Er dient dazu, dass man die Versuchsfehler verschiedener Untersuchungen direkt
𝑉𝐾 = 𝑉𝐾 = = 0.0387 = 3.87%
𝐺𝑒𝑠𝑎𝑚𝑡𝑚𝑖𝑡𝑡𝑒𝑙𝑤𝑒𝑟𝑡 66.4 miteinander vergleichen kann. Die englische Bezeichnung ist coefficient of variation (CV).

Das könnte Ihnen auch gefallen