Statistik Klausurzettel

Datenlage Deskriptive Statistik
Absolute Häufigkeit : Anzahl pro Klasse
Relative Häufigkeit Anzahl Klasse durch Gesamtzahl

geteilt
-
:
pro
Wahrscheinlichkeit schickte durch Klassenbreite

rd
Häufigkeit geteilt
-
: .
Kumulative Wahrscheinlichkeit :
Summe der relativen
Häufigkeit :
Integral der Waters dichte
.
:
sigrid : Waters . summe
Variablen typen
ii
Nomina ( Variable
Eigenschaften
-
Abstand
:
weder
Reihenfolge noch definiert z B. Berufe Konfession Geschlecht , Ja Nein Entscheidungen
-
, .
, ,
.
:: ÷::: :
.
: : ÷: ±:: ÷: :::*
Umwandlung
→
Intervall Ordinaluariabk Intervall werte der Größe nach ordnen und verteilen
in
Ränge mittlere
Rangzahlen möglich
:
von
-
kontinuierliche diskrete Variable

zeigen Anstieg
Variable Zuwachs Stufen
schräge Verbindungslinien
-
vs
=
zeigen
.
=
Klassen
Integer ( Ganzzahl) character ( Zeichen )
-
:
, nun eric (Dezimalzahl) ,
Maß zahlen der zentralen

Tendenzen
↳)
Anzahl Wertete lassen
arithmetisches Mittel I f) fis absolute Häufigkeit Eigenschaften Summe der

Abweichungen aller Einzelworte ist Null
-
[ =
:
abhängig von Extremwerten

"
a¥¥t|
-
→ Anzahl aller Mittelwerte starke Variation bei kleinem N

-
gewogener
arithm Mittelwert E- ¥ III.
µ=E]
:
Ei
.
k
.
zander Werte in
das
dazu rechnen
Bsp Durchschnittseinkommen bei asymmetrischer Verteilung ist das arithm Mittel ungeeignet für die Stichprobe gibt systematische
-
:
: .
,
es
Verschiebungen
-
Median (Zentral wert F)
↳
gleich viele und unterhalb des Median Median halbiert die Fläche der Häufigkeits verteilung
Eigenschaften Werte
liegen ober
: -
extremwert
unabhängig
-
Modalwert Ä :
gibt Lage des Maximums der Häufigkeitsverteilung an
extremwert unabhängig nach

Klasseneinteilung möglich abhängig Klassen breite
-
nur von
, , _
/×H=§?
ne
harmonisches Mittel Kehrwert des arithm Mittels der Kehrwerte die Variable im Nenner steht
-
; wenn
:
.
Z .
B .
bei Geschwindigkeiten
geometrisches Mittel Prozess ist nicht

-
wenn ein multiplikativer additiv
IXG-nn-f.FI?=CxiXzi...Xn)F-/
-
: es ,
z.B .
Populationsgröße
Streuung Maße Varianz ,

Variationsbreite ,
Stand -
abweichung ,
IQR ,
Indices H u .
E ,
Variations Koeffizient
Varianz Ausmaß über ( sum of

square )
der
der Streuung Summe der Quadrate
Abweichungen Quadratsumme SSQ
-
: = =
die Fläche
unabhängig vom Mittelwert , wenn Messgröße eine Strecke ist
-
,
dann ist die Varianz eine
ö§E/
|↳AnzahlWer
dann
s :
2 Summen bilden und verrechnen

/ in R : varcxs
→ erst Mittelwert berechnen ,

SSQ →
Freiheitsgrade Summe der Werte 4.5=20 die ersten 4 Werte kann frei festgelegt
-
:
n = 5 :
muss sein man wählen ,
der 5. ist
,
also 4 Freiheitsgrade : n -
Standardabweichung Quadratwurzel gibt Streuung in R : Sdk)

-
: der Varianz an
,
Mittelwert und St der Grundgesamtheit

abweichung sind Schätzwert
-
fsn-F.fr/xi-FJ-/
-
bei einer
Normalverteilung
liegen
68% der Werte in ts
, -
t.n-tt.fi
95% in ± ZS
-
Box -
Whistler -
Plot :
wenn Mittelwert und Varianz keine
gute Beschreibung sind : sind Quarzite oder Perzentile informativer
ÄH.tt#fH.............../:t:::::-:
Mied
Häufigkeit
f-
µ -
xnax : Extremwert
Quartier 74 : 25% -
Schritte
-
a.
= Perzentik : 1% -
Schritte in R : Median 4)
. . .
-
-
min
→ 5 Werte
_
' Merkmal
Ausreißer Wert der Mehr als das 75 fache

( ariationsbreite
V
la as
= ,
in R Cxs (x) des

max min
lnterquortil abstandes
:
von
-
Median entfernt ist
Diversität Index
Streuung maß bei Nominal variablen
-
|H=-;§Piih|
-
k
'
-
Shannon sehe Diversität index :
gewichtet jede Klasse mit ihrer relativen Häufigkeit pi
→
Extremfall 1: nur eine Klasse bei Amin =
-
Ä ? Ln = O
|E=h
→
Extremfall 2 : k
gleich häufige Klassen : Am a. ×
=
-
E. In (E) = -
k .
¥ Lnl ? )
.
= Lnlk )
,
Eueness
Gleichförmigkeit der
Verteilung durch Normierung auf theor Maximum
-
: .
Wahrscheinlichkeitsverteilungen Wahrlich
EFFIE! !!
"
e-
Normalverteilung
:
bei vielen Einflussfaktoren f, =
(
Standardabweichung
Verteilung sieht immer gleich aus
Mittelwerte sind bei

großen n annähernd normalverteilt in R : dnornlx , µ ,
o )
Standardnormaler teilung : Transformation

Z
Wiahrsdichtefür
-
¥Ä6%|
l↳
jeden Wert durchführen
:
{ zz
dnorn ( z 0,1 )
f Cz ) =
¥ .
e in R : ,
wie viele Werte

liegen im 95% Bereich der .
Normalverteilung ?
↳
für ⇐ = 5% in z -
Tabelle nachschauen die ,
Daten müssen in dem Bereich
lieg
Binoreialuer teilung Entweder oder
:
Ereignisse abhängig und
-
n
p
-
.
,
von
dichotom er
3
Bedingungen : Ja -
Nein Wate :
Ausgang mit
genau
2
Möglichkeiten
voneinander
unabhängige Messungen in R : dbnonlx ,
n .
p
)
dieselbe Wahrscheinlichkeit
bei kleinem / asymmetrisch

großem p ist
Verteilung , wenn n klein ist
bei
gropemnwirdNornalngangena50.ae
fpcky.tk/'pkiqn-k(E)=5.kY!p--Wahrs
fürsorgerischer
" "
= 1- P k =
Anzahl günstig
„
(f) se.IT II
8 !
Beispiel
=
:
bleibt
gleich
=
!
=
.
z immer
p
=
.
( KZ 4)
mindestens 4 (also 456,7 8) 100%
plk :O) plh 1) plh 2)
plh =3 ) Gegenteil berechnen
= →
-
: - = -
p
, = -
Aufgabenstellung : Wah
.rs .
für Stipendien an
1<=7 Männer von n -10 Stipendien mit 200 Männern von 1000 Personen Cp )
Erfolgsquote von
Experimenten : 8 weitere
Experimente n = 8
,
und 1<=4
"
"
in R : binom testeten p , alternative

-
,
=
two .
sided )
z.B binom Test Cc ( Häufigkeit 1
Häufigkeit 2) 314 ) oder binom Lest C
Häufigkeit ? h 314 )
p p
-
= =
,
- .
,
.
Theoretische vs
Empirische Verteilungen
:
.
Grundgesamtheit alle möglichen Messwerte Stichprobe Teil der

möglichen Messwerte
-
Maß zahlen Stichproben Standard fehler

→
ve rs .
variieren : wie stark gibt an
/se
=
Standard fehler gibt Schwankung bereich der Mittelwert schätzung

-
: > an
-
die desto ist der Mittelwert

je
größer Stichprobe zuverlässiger
-
für
,
normalverteilte variablen
?
anti ab
proportional 30
gilt
-
se zu n n > :
→ Sta abci
Vertrauensbereich
¢
des
.
Mittelwerts kleiner
Is]
wird bei
großen n
-
±
schwankt kleinen stark stabil ? gg
Varianz bei sehr ab -30
-
n , n
-
bei ändert sich nichts gleich

-
einer
Gleichverteilung :
,
bleibt -
wie bei einer

Normalverteilung weil der Mittelwert immer
variiert und normalverteilt ist

Schleifen :
für wiederholte
Ausführungen Stichprobe ziehen und Bereich bestimmen denen 95%
-
,
in aller Mittelwerte
liegen
⑦ Flussdiagramm ② /Wähk1Stichprobengöße -
for (k in seq(3,30,3){
|
als in R :
a<- numeric (10000)

±
/Eüheitsg
-
Wähle die Anzahl der - for (i in 1:10000) {
|
for (df in seq(3,31,2)){
-
Stichprobe ziehe 7 Stichprobe und a [i] <- mean (sample (Gr, k, replace = T)
x <- rnorm (df+1, mean= 10, sd = 2) ← }
/
berechne
points (df+1, var(x)) µ }
•
Zeus " und
liebeskranken ←
}
jgna.no/
} Schleife 1: Stichprobengröße k, leeren Vektor
!ö
varianz besinnen erzeugen
Schleife 1 mit Freiheitsgraden, Schleife 2: Stichprobe ziehen und Mittelwert
berechnen
Schleife 2: 30 Stichproben ziehen,
95% Konfidenzintervall bestimmen
Varianz berechnen und als Punkt einzeichnen
¥
¥
#irgend /-
¥5 s
)
nein
¥
¥
Ende
Ende
Kovarianz :
Pr
↳ oduktden Mittelwerten .
fows-n.IE?icxi-xs.ci-F)-I=ss Ä""ÄÄ?!¥
-
" oder
an.
Korrelation Kovarianz Mittel der
:
geteilt durch
geom
.
Varianzen nx oder n ,
couC in R corl )
korlxiyj-x-y-SF.TT
SSX t
: . .
.
. . .
.
Pearson sehe Korrelations Koeffizient

'
:
Maß für Stärke des linearen Zusammenhangs beider Variablen
parametrischer teilung zwischen 1 :
hohe positive Korrelation ,
O : keine Korrelation
| und -1 : hohe
neg .
Korrelation : tntkorrelation
↳ " "
Maß Korrelations koeffizient in R : Cor ( X ,

Y ,
method =
pearson )
Bestimmtheit > Maß ?
r .
Anteil der erklärten Varianz ,
des erklärt werden kann

Anteil der Veränderung der allein aus
Änderungen anderen Merkmals
|r?6r4/
-
Ö nichts wird erklärt und

zwischen : 1 :
gesamte Varianz wird erklärt
°"
""
"
-
Nicht Linearität erzeugt scheinbare Korrelation

Ausreißer stören perfekte Korrelation oder scheinbare Korrelation
erzeugt
-
ein; → Varianz und Kovarianz betonen Ausreißer

nur
homogene Daten zufassen
-
gruppen
keine formale Korrelation sich Größen
-
wenn 2 100% müssen

ergänzen
: zu
keine kausale
Abhängigkeit der 2
Größen trotz echter Korrelation , sondern
-
gemeinsame Abhängigkeit von 3 .
Größe möglich .
" "
Kontingenz : Korrelation bei Nominal variablen , zsn fallen
den für stochastisch

Berechnung gibt wie stark die an ,
Messwerte von abweichen , was man
,
unabhängige Ereignisse erwarten würde :
unabhängig voneinander ?
ändert sich mit Stichproben umfang Anzahl der und Zeiten F- Werte nicht miteinander vergleichbar
,
Spalten :
① ②
X Y Geilen Plz )
Tabelle
Kontingenz -
: -
Esse ¥0 0,54
1- Rand sannen bilden
Z
erwartete
Häufigkeit
.
.
Erwartet
- -
2- berechnen
gegebene werte sind , .

3 .
µ .
Berechnung , summe der # bsfandsquadra.ge

-
Beobachteten E -
-
7
z
. -
.
-
spalten
)
pcssfo.se/-./-./-
(B
T
in R :
chisq .
fest CB df ) ,
qchisq ,
pchisq
°
Anzahl Freiheitsgrade :( Zeilen anzahl 1) -
.
( Spalten anzahl
-
1)
°
Irrtums wahrscheinlichkeit 5% °
Ho :
Variablen sind unabhängig
Tabelle 55.7
°
f) it :
X ( df ,
a
)
Hst >
XI.it : Hs annehmen Niest < X
?
nit :
Ho beibehalten
Vergleich Kontingenzwerfen Kontingenz Koeffizienten
-
von . über
| Teilen
-
×
? m spaeten
,
m =
minlzcs ) zwischen 0 und 1
'
/a=µ¥
Cramer sehe Index
-
Nicht -
parametrische Korrelations maße : ohne geschätzte Parameter
Spearman 's p : KorrelationsKoeffizient rs
je ähnlicher die
Fangreihenfolge desto stärker die Korrelation
-
Vorgehen 1.
Ränge vergeben gleiche Werte erhalten mittleren
-
: :
Rang
2.
Rang differenzen bestimmen
3. Quadrate der Differenzen bestimmen und Sonne daraus bilden
4. Formel verwenden
|rs=1
-
'
einmal betrachten
Edi
: n nur
G.
,
" "
nicht n > taz in R : corEX.Y.nethoch spearnan )

↳ RangKorrelations Koeffizient
Kendall 's ) kordanz aller

T : misst ④ is
Wertepaare
20 30
20 40
grafisch bestimmen ?
-
: n
Wertepaare verbinden
2. Über No ( diskordant
Kreuzungen zählen Paare)
% to
-
80 zoo
3. n und ND einsetzen
)
" "
in R
4.NO/T--1-n-ln-X/n
-
werden : ( X Y Method Kendall

Bindungen
-
cor
mit 0,5
gezählt
=
,
,
nur einmal nehmen
lineare
Regression :
Abringen
abhängige unabhängige und Variabkimanschließtvonderllnabhängigenaufdie
-
× :
y :
Mittelwert
sunmederfehlerquadrate.in
,
¥÷÷i'
byx ←
E- I f) Xi F- LE
F- 1
*
§ ( E -
^5 rein .
÷ . . i. ⇐ st :
=
→ /
↳y - Achsen abschnitt ↳ „ =
a
, Regression Koeffizient von y nach X
→ -
F
¥ E ( E F)
'
erklärte Varianz Varianz der Werte für Ii kann auf werden

vorhergesagten zurückgeführt
-
sj
-
: Xi =
Bestimmtheit snaß
-
ß =
2 Modellvarianten fehlerhaft
abhängige Variable richtig
-
Y nach
Regression ist
: : von ×
beide Variablen sind mit Fehlern behaftet b = LEE Ist in 2

Richtungen
von × nach y
Steigung SS Kovarianz
-
:
=
Varianz
SSX ×
in R : ( m ( Y -
X) # Twitch modelliert als Funktion von X
XD # berechnet
pnedictllm ( Y -
vorhergesagte
Werte für Y
Anzahl bei Zahlen sind

Ränge 100 denen keine zwei
gleich :
0,5 Cnt 1)
-
von n
.
-
,
Urteilende Statistik
Hypothesen :
Nullhypothese Ho vorhandene Unterschied Stichproben keinen der

zwischen ist
zufälliger Natur und
gibt Unterschied
Grundgesamtheit
-
: in
Alternativhypothese Unterschied
H> : vorhandene ist
größer als man
aufgrund zufälliger Variation erwarten kann
Signifikanz grenzen Irrtums wahrscheinlichkeit

-
=
p oder a
5%10,05 schwach Nullhypothese Ho

signifikant → wird
angenommen
7%10,01 signifikant
Verschiedenheit der
0,7%10,007 hoch signifikant - P Ho
abgelehnt ,
weil
signifikanter Unterschied ein Beweis für Größen , ist
Unterschied und Unterschiede nicht signifikant

Signifikanz abhängig Streuung große Streuung große
-
:
von =
€ -
Statistik Verhältnis
:
von Maßzahl zu ihrem Standard fehler : kann man auf Mittelwert ,
r , rs , m und µ beziehen
>
Stichprobe :
tU
yg.ch#zweutdergfandardab
teilt Abstand von theor Wert durch .
den Standard fehler des Schätzwert
g £ T Standard normalverteilung an
-
je größer n desto stärker nähert sich t -
Verteilung an
e
p
df
Freiheitsgrade der df nicht ist , nimmt nächst kleineren df
1
eingetragen den
° =
n -
wenn man
a
°
Tabelle : E -
Tabelle S 1 -
exakter Emt :
über Quantil der Prüfer
Teilung
a
Ho Mittel unterscheidet Verteilung nicht Normalverteilung qtlp
°
: im sich von in R :
df ) =
,
r
t test ( X
"
in R
"
:
.
, f. alternative = two sided .
t
ttest >
tkr.it : Ho verwerfen ,
A1 annehmen pa-ired-TRUE.var.egua-l-FAL.SE)
tTest <
tkr.it Ho annehmen A1
:
,
verwerfen war .
equal = TRUE ,
Korrektur berechnung abschaltet
2
unabhängige Stichproben : Differenz
geteilt durch Standard fehler der Differenzen
Schätzer der Standardabweichung

-
|
s>
-
:
, z
so
=
§.(I{z-K Ä :
Schätzer der Mittelwerte
5) Varianz
s
gemeint
°
df =
n > tnz
-
o Ho : im Mittel unterscheiden sich die Stichproben nicht

„
C-Test >
tkr.it to ablehnen H>
¥
.
, annehmen in R : t .
Test ( x , Y , paired = FALSE vor

equal ) =
n
,
-
tTest <
tkr.it beibehalten , Hp ablehnen
g Test
Voraussetzung für parametrischer Test für
→
t - :
normalverteilte Variablen
e.
Varianzen
homogenität gleiche : Varianzen
:
F Test Fisher Test auf Varianzen homogenität Fla
Verteilung
→
in R df1 dfz )
-
: : :
-
, ,
Ho : Varianzen unterscheiden sich nicht war .

fest lxn ,
Xz )
r
/f=←/
-
Ftest Fkiit H> annehmen Zähler Fkrit

f Varianz
°
> : o
größere in :
qfc ←
, n > ,
n
)
war ,
CXZ) o
df =
n
-
5
Fragen t Test
Stichproben gleich Stichproben
→
vor einem
-
: 1. ein oder zwei 2.

einseitig oder zweiseitig 3 .
Varianzen bei 2
4.
unabhängige oder
abhängige Stichproben
5-
Normalverteilung gegeben ?
abhängige Stichproben
}
für
Bedingungen
°
mehrere die
: Daten einen Ort ,
wegen
der
speziellen zsn
hängen Differenzen
weil Korrelation
streuen
die
weniger
Streuung
geriet Identität bei Messwert kontrolliert

.
Zwillingen ,
mit
jeweiligen verringern
Z
abhängige Stichproben :
-
•
df =
n -
YSdct-F.EC/i-Yisd=
e
Ä d- mittlere Differenz °
ttesf > tkrit Hz annehmen
p
=
f
.
P
stand .
abweichung aller d 's : normale Formel
a
Ho mittlere Differenz Null Mittel unterscheiden sich die in R t test ( Y paired TRUE )
ist in Stichproben nicht x
: '
=
:
: , ,
bei
parameter freien Methoden Normalverteilung vorausgesetzt
-
r
ist
→
Median bestimmen *
( pt CK df ) )
zweiseitiger Test 2 1-
+
c-
p
:
,
Rangsunnen -
Tests :
in R : Wikonlest CEM ,
paired =
F)
Mann Whitney Test U Test testet auf

: :
Lageunterschied der Mediane
- -
-
n nur einmal nehmen , nicht nstnz
|U=nincn,Uz|
-
U An =
100 -
R > Uz = 100 -
Rz
n> (m t 1) ( nzt 1 )
nz
h ns.nzt-z Rs ns.nzt-z Rz
-
= -
!
P
Vorgehen 1. alle Daten der Reihe nach aufreihen 2. gemeinsam

Ränge vergeben Rang sannen bilden
-
a : 3- einzelne
4 Ü 's kleineres und

a .
bilden 5. U nehmen mit kritischen Wert
vergleichen Unit cnn.az ,
a
)
r o Tabelle :
S .
5
t Ao sind gleich
°
: Median
U
Test
>
Ukrit : Ho beibehalten ,
Hs ablehnen in R : wilcox testlx > .
, Xz ,
paired = F)
niest <
Umit : Ho ablehnen An , annehmen
Wilcoxon Test : W -
-
Test :
für Paar differenzen
,
fested ob Median der Differenzen Null ist
g
l
Vorgehen 1. Differenzen der Wertepaare bilden 2
Ränge vergeben Beträge beachten 0
weglassen
-
: .
: ,
P 4. kleineres
Rang bilden
3.
Wt und W
W nehmen und mit krit Wert berechnen
-
summen -
a o
Tabelle :
5.6
9 Otto
Stichproben unterscheiden sich Mittel nicht
vergleich
-
:
im paired = TRUE
gibt an ,
dass man Paar möchte
r Wtest Wkrit Ho Hs FALSE gibt Korrektur berechnung abschaltet

-
7
:
annehmen verwerfen Corre d- =
an dass man
, ,
£ Wtest <
Wkrit : Ho verwerfen ,
Hs annehmen
↳ W ( n .
a)
TRUE connect FALSE)

'
in R wilcox Test ( x
"
:
. , y ,
alternative = two sided . , p red =
,
=
wenn bei Wertepaaren Differenz 0 rauskommt ,

wird es bei Wkrit als n nicht mit ein.be rechnet
Abweichung Richtung möglich

einseitiger
4%3
Test
-
:
nur in eine
einseitig zweiseitig
Test Irrtums wahr

-
Zweiseitiger : .
verdoppeln oder ← halbieren :
Regelfall
in R :
p c- 2. ( 1- pt ( K ,
df ))
Fehler
}
:
erster Art Alpha -
Fehler :
Ho verwerfen "
obwohl sie
richtig ist
unt .
Konsumenten
Zweiter Art / Beta Fehler Ho beibehalten obwohl falsch ist
-
-
:
.
sie
→
je größer desto kleiner ist
ß weil die Mittelwert schätzung ist
n , ,
genauer
Güte (Power 1- ß Waters Güte
Tests gibt dass Ho zurecht
abgelehnt wird steigt mit
-
eines : .
an , ,
n
abhängig Stichprobenanfange Signifikanz niveau Unterschied zwischen

Grundgesamtheit
→
von en ,
,
Effekt stärke zB .
Cohen 's d :
|d=ÄJ|
Funktionen in R :
Funktion snane function (

Argument ) { Anweisung }
-
c-
das Funktion definiert wird wird nicht Work

gespeichert
-
in in
wa s ,
space ,
Funktion snane nicht definiert ist wird Fehler

wenn ,
ausgegeben ,
Variablen im Work space werden nicht überschrieben durch Definition innerhalb der Funktion
Std c- function Lx ) {
Bsp {
-
varianz function ( x)
Lengthlx)
'
c- c-
n
^
( sum ( × 12 ) -
sum ( x)
Zllengthlx ) ) lllengthlx ) -
1) mean c- sum ( × ) In
}
*
Z ))
"
sqrt ( Nn 1) -
sum (( x -
mean )
}
Korrelations Test ist Korrelation
signifikant und
groß parametrisch I
genug?
:
wann r
Ho ist nicht signifikant 0 verschieden

-
: r von
|t= -nF
_
Irl
t Test für Maß Korrelations Koeffizienten ist df
-
: = n -2
Vergleich vo n t mit kritischen Wert K = Hast .
. df = n
-
2)
t > K : Ho verwerfen , Hs annehmen

o
t -
Tabelle
t < K : Ho annehmen H > verwerten .
)
?
der durch lineare Korrelation erklärt werden
Beispiel Frage welcher Anteil Varianz eine können Cr damit
-
: : m u ss
,
die Korrelation mit ← = 1% statistisch signifikant ist ?

Erz
?
→
f-
-
NF umstellen nach r :
En ) =
↳ tkrit ausrechnen und einsetzen ,

dann umstellen
0,46 = ¥! ?
I -
1- r
'
0,46-0,463 -
r
'
= 0 I -
0,46
0,46 .
K -
r
?
) = Ir I -
0,465 -
r
?
= -0,46
? ?
0,46-0,46 r =\ r I I -
r r
?
C- 0,46 -
7) = -
0,46 I : C- 0,46-1 )
i =
Schiefe & Kuitosis :

weicht Verteilung signifikant von Normalverteilung ab ?
-
? Moment :
Mittelwert ,
2. M .
Varianz 3. M Schiefe 4M Wölbung , .
,
.
Schiele Cskew) Moment der Verteilung

-
= 3.
Ao
gemessenen Verteilung entspricht Eigenschaft Normalverteilung
→
:
Eigenschaft X der der X der .
→ 3
.
M .
der Verteilung : Stand -
aber .
ßs=)d!
/p
-
ls.e.pt#-/-Kurt-osis
M3
→
Schiefe : Stan Center .

der schiefe :
E. ( E)
abw.IS:44?uarlxj!
-
× -
4. M der Stand
Verteilung
→
.
: .
t.IT/
-
→
Kurt Stan lehkr der Wölbung
!!
.
:
t Test
-
auf Schiefe und Kurtosis
Ho
Eigenschaft rslgz der
Verteilung entspricht der
Eigenschaft In der
Normalverteilung
-
t>
gemessenen
:
ftp..fi?).IR-/
-
-
twitter.si .
.
d. f. =
n
-
z )
t >
tkrit :
Ho verwerfen .
An annehmen
t <
tkrit : Ho annehmen H> verwerfen
.
Test auf Normalverteilung

Ho Messdaten sind
-
:
× normalverteilt
Kolmogorow Smirnow bestimmt

größten Abstand kumulativer Waters Verteilungen liegt zwischen
-
-
Test : zweier .
: 0 und 7=200 %
" "
in R: Ks lest C x. meanlx ) sdlx ) )

.
pnorm , ,
Shapiro Wilk Test Test auf Normalverteilung

-
-
:
in R :
shapiro .
Test ( x )
?
X
Anpassungsfest
-
in R : chisq .
testlx , p =p -
x )
Konfidenzinterv alle
Punkt Maß zahlen

schätzung für Stichprobe berechneter
-
Wert Schätzwert für

: aus z.B .
Varianz dient als eine
Eigenschaft der
Grundgesamtheit
Intervall Konfident intervall : wahre Wert Irrtums wahrscheinlichkeit
-
schätzung :
liegt innerhalb des Intervalls um den Schätzwert ,
Intervall
grenzen abhängig von
( je schmaler das Intervall desto ist die Irrtums wahrscheinlichkeit)

,
größer
ist Vielfaches des Standard fehlers durch Ober
Abweichung Mittelwert
-
,
wird -
und Untergrenze festgelegt ,

als
pos . a.
neg .
von ,
von relativen Häufigkeiten asymmetrisch faußer bei f- 0.5

und sehr
großen n ) , z.B . Zielwahl eines Insekts
- Stan aber
/
.
.
tk.it = tlx = 5%
,
d. f. = n -
1) E ±
196 .
In
→
bei
großen normalverteilten kann EL 5% ) durch Skalierungsfaktor aus z Tabelle ersetzen z ? 6 bei 4=51
-
n : n > 30 man , n =
bei relativen Häufigkeiten

-
„
Fz ,
( Int
p t ± z -
P-%¥ ) f-
rel .
Häufigkeit ⇐ Quant :L der Stand

normalverteilung
-
p C1 p)
-
-
fürn bei 0 und reicht K intervall

200 : F- p 1
nach einer Seite
=
> .
nur
für K.in/eruaUe von relativen Häufigkeiten andere Formel als für Intervallvariablen :
Gründe : unt .
Wertebereich : bei Nominal . nur von 0-1 und Intervallen .
jeden Bereich
Fehler sind bei rd .
Häufigkeiten nicht normalverteilt :
Abweichungen zu beiden Seiten sind unt .
Bsp welche.
Grenzen hat das Konfident intervall mit p

> ¥00
① I ± 796 sd .
sdzn.p.am ② ± 1, go.PL?O#T
p 100
-
>
→
einsetzen und für t und -
berechnen
"
Ho
"
prop test TRUE )

-
in R :
. ( × , n alternative =
two sided ,
correet = : rel .
Häufigkeiten des Merkmals sind in allen

,
.
Stichproben gleich
IF
Anweisungen :
ermöglichen Fallunterscheidungen für mehr Varianten

-
if (
logischer Ausdruck ) { # wenn der Ausdruck wahr ist
Anweisung }
# Klammern
geschweifte nur , wenn der Teil
Länger als 1 Zeile
else { # ohne
Argument # wenn Ausdruck falsch ist
Anweisung }
"
"
Bsp
"
"
cat L Monat Monat Ci ] )

-
:
monat ( 1,12 ) mehr als
c- 30
Tage
.
seq , ,
tage c-
cc . . .
) }
Jahrestage c-
nun eric ( 12 ) else cat (
"
Monat ! monat Li] ,

"
ist kürzer In .
"
for Ci im Monat ) { if (i > 1) Jahrestage (i ] =
Jahrestage Ci
-
1) +
tage ( i -
1 ]
( i] ) {
if (
Jahrestage
30 else
tage E)
> = 0
Verteilungen :
Gleichverteilung : Binomialuer teilung :
Normalverteilung :
+ Er
unif binom nor m
Standardnormalverteilung Cp , µ =
0,0=1 )
Varian zanaly.se :
Fragen :
Herkunft der Varianz untersuchen : Faktoreneffekte vs . Zufall
welcher Anteil der Gesamt uarianz Messfehler zurückzuführen welcher auf Effekt des variierten Faktors ?
-
ist auf ,
unt
Parameter
tragen Varianz bei und (u n ) systematische Abweichungen
→
viel zur
erzeugen
.
bei mehr als 2

Stichproben
-
Ablauf :
Schätzwert :
Wertebereich des Faktors wird in diskrete Stufen unterteilt e.

Faktor 2- 3 .
4. xij -
Etäitäj
Annahme Faktor bedingt systematische Abweichungen pro Stufe
-
äi
geschätzte Abweichung
: :
es
gibt Variabilität zwischen den Faktor stufen : durch den
/-1-1/ äü geschätzter Fehler
E
:
arith
Faktor bedingt und innerhalb der Stufen
zufallsbedingt Mittel aller
:
: .
-
"
wahrer Sachverhalt 3
Gesamt variabilität
:
SQT Werte
zerlegen SQZ SQI
-
in t
#(wert
" "
SQT =
Summe der Quadrate total Ei arith M der ten Stufe
aller Gg .
:
.
- i -
der Faktor stufe

" "
Faktor stufen
ai : wahre Abweichung i -
ten
SQZ =
Summe der Quadrate zwischen den
"
"
eij : wahrer Fehler des j -
ten Messpunkts in inter

SQI =
Summe der Quadrate innerhalb der Faktorstufen Faktors tute
-
-
' '
§
?
§ § SQT : ( xij -
E) =
SQZ (Ii -
E) t SQI
lxij
-
Fi )
|
.
|
K
k Faktorstufen , ni Messwerte Gesamtzahl aller Messwerte :

µ =
E ni
"
Summe der iien Faktor stufe : Ti =
Ä Xii Gesamtsumme ner Messwerte :

F-
ÄST
Sat :
xii ) ¥) -
Saz :
(§ -
Ä) Sat : Sat -
saz
D-
Ho Faktor stufen sind

alle
gleich alle Variabilität kann durch Zufalls Komponente erklärt werden
-
: :
Parameter einfahtoridle
-
ein = Varianz analyse
F- Test der mittleren Fehler

Quotient quadrat summen
wenn
zufallsbedingte Variabilität größer als faktor -
bedingte V. ist ,
gibt es keine systematischen
Abweichungen zwischen den Faktor stufen

→
Vergleich MQZ und MQI von

-
MQZ
-
/uaz=I¥ua=
F =
• Ho : Faktor stufen weichen nicht von den anderen ab
°
F Tabelle -
:
einseitig
→
Ein.it = FI (a)
→
Ftest > Flut :
Ho verwerfen Hr annehmen ,
-
- mind . 1 Faktor stufe weicht von den anderen ab
Ftest < Fkrit : Ho annehmen ,

Hs verwerfen
-
abhängige "
"
in R: Syntax von Modellen : a- ( alle sorte)

-
, Faktor muss
Typ factor sein
Tabelle
-
von sunnart C)
Mittlere
✓
KÄME
y.gn.coqo.io#ao*o,os.qyuwaa,/.u.| a.au
-
Df Sunsq Mean Sg Fualue Pr ( SF )
ÄH
"" -
-
"
SQZ
Faktor ^ " -
1 MQZ
Residual N k -
SQI MQI
Fehler innerhalb
Fehler .ae#pc 0,05 ,
=
schwach signifikant
p
← 1- pf LIEF ,
Cm -
1) (N ,
-
n - k ))
4. Faktor stufen
Voraussetzungen 1. sinnvolle 2.
Unabhängigkeit der Stichproben entnahme Randomisierung des
Experiments
-
: :
,
3. No der
teilung 4
homogene Varianzen
3. Test QQ Plot 99 line x )

( Wilk Test
auf Shapiro
→
Normalverteilung :
-
:
qqnornlx) ,
,
-
-
shapiro . lestlx)
H
Kurt osis
)
'
Csunccx 4) Ilengthlxsluarlxsiz 3D
If
:
-
neanc xD -
>
.
.
tgz sqrtczullengthlx ) )
=
Schiele Elx E3 Sankt

^
3) Ihn
tg If
gth.CH/sdLx53/sartL6/leng-thLxJ
( xD
-
:
= -
Mean
> .
qq.sn )
4. Test auf Varianzen

homogenität :
Hartley -
Test (Fnax ) :
wenn sich Fnax und Emin nicht unterscheiden dann unterscheiden , sich die anderen Paare auch nicht
Voraussetzung :
gleiches n für alle Stufen ,
normalverteilte Stichproben
-
F =
Sma ×
Fruit :
En ! (Q) o
F -
Tabelle
Guerre - Test :
Wenn Varianzen aller Faktorstuten gleich sind ,
sollten die absoluten Differenzen von
Stufenrüttel werten gleich verteilt sein
keine
Voraussetzungen
ldij-lxij-x.CI
-
Zwei faktoren ANOVA :

mit mehr als 1 variiertem Parameter rospalteneffeht
Zufalls effekte
-
Einfluss mehrerer Faktoren testen

-
Xijr = Et dit ßj tccß ) +

ejr
-
Wah
/
↳ Zeileneffeht
Wechselwirkung
Block
ideal
design gleiche Anzahl
Wiederholungen Stufe pro
- -
von
pro
:
,
state
3
Nullhypothese
-
7- Ht : Stufen mittel werde von Faktor A sind

gleich 2. HB : Stufen mittel werde von Faktor B sind
gleich
3. HAB :
Es
gibt keine Wechselwirkung zwischen Faktor A und Faktor B
facebook.Fahtorbw.w.Rest-SQT-SQATSQ.rs
| |
SQWTSQI ER Äj E) ( Ii F) # E )] t SQW =
- -
-
-
-
Sij =
r
xijr Zi =
f) Sis Tj =
f) Sij F-
f) Tj
⇐iii)
÷! EI!
-
⇐ -
"" ""
SQW = ( Fr ! Sis )
-
(E) -
SQA -
SQB sah SQT -
SQA -
SQB -
SQW
Restfehler
wenn SQA = SQB : keine Interaktion
-
MQA-n.sk#FLestlAJ=MuIFFkrit(A)--FuII
t.no :)
SI
MQ D=
÷:: :
SQL
MQ , =
µ -
n . K
-
÷
#
.
|
Df Sunsq Mean Sg Fahne Prl F) >
* mit Interaktion
-
Interaktion
-
MQAIMQI
i
A Faktor 1 k -
1 SQA o2 - Mat t ohne
- -
• vor z m
.
> .
? ←
was
man
,
Au In ( aovl ))
°
SQW
W -
B .
µ w
www.a , in R :
summiert . .
-
.
.
F - - .
\
Isis pc
-
1- pf # -
value ,
df Residual )
,
s
ohne Wechselwirkung Mittelwerte der Stufe sind für alle anderen

äquidistant Stufen
-
: einen
Mittelwerte der Stufe sind nicht äquidistant

mit
Wechselwirkung : einen
6 für die ANOVA

Regeln Planung
-
einer
konstant
7. Ceteris
paribas Prinzip -
: unbekannte Faktoren halten
2.
Wiederholungen :
Schätzwert werden
genauer
3. Randomisierung verringert : systematische Fehler
4.
Blockbildung verringert : Variabilität innerhalb der Stufen
5.
Faktorielk Experimente
6.
Symmetrischer Aufbau :
verringert
Chance für falsche
Schlussfolgerungen
" "
nach ANOVA Test

Vorgehen post hoc priori bei Versuchs planung konzipiert
-
: - : a :
II.IT/tIuitCa.N-k
-
- tposthoc =
-
¥Ä(¥) IMQuergl.tn
-
SQv
Zerlegung
-
von saz :
M vergl .
F =
-
Tikrit (a ,
m -
1 ,
N k)
-
MQI
"
ho
post Test : a
posteriori :
nach Versuch ,
erst anhand von
Ergebnis konzipiert
Bon ferrari Korrektur
"
Risiken
-
2
vergleichs bezogenes Risiko a und multiples Risiko a
-
: :
E
'
a =
µ=j|
-
Bonlerri Holm Korrektur

-
:
-
Wichtiges aus den Lektionen
Allgemeines
°
Verlauf Befehle
Workspaa Liste aller Objekte abrufen der abrufen history ( )
-
( sc )
-
:
: : :
"
"
alles löschen : rm Cz ) speichern als Textdatei : savehistory.cn °

- txt )
" '
alles löschen in Liste List : rm ( List = Lsc ) ) Verlauf laden : Load history C . .
. fxf
Klein und
Großschreibung beachten kein Leerzeichen Variablen nahe Länge lengt.tn )
-
in Cz
-
-
:
,
Zsntassung der Daten : swn.mar.tl )

-
Hilfe :
helplmean ) oder ? Mean
Auflisten der Tabelle C )

-
: nahes
•
Datentypen :
Rechnen Objektklasse class C )

-
° :
Potenz 10^2 Datentabelle data frame

-
Wurzel 10^0.5
-
:
x. + c-
-
: c- :
.
Funktion Dezimalzahl
-
(1) Summe Vektoren ) numeri

-
( :
-
e e
xp sum vec
-
: von :
Ganzzahl : integer
-
Median : Median Cuec ) arith Mittel ( )

-
-
.
:
Mean ve
Boolesche Variable :
Logic al
Cognac 8)
-
Logarithmus Log ( 10)

Log2C 8) Basis 10
--
runden : round ( Variable .

wievielte Stelle nach Komma )
°
Grafiken
Histogramm histlx )
-
Klassen anzahl : bist ( x

.
breahs = 10)
Waters dichte Klasse histcx frag TRUE )

-
=
:
.
pro ,
abs Häufigkeit Klasse : histlx frag = FALSE )

.
pro ,
Farben : O :
weiß 1 : schwarz 2 : rot 3:
grün
4 :
blau
5 6: 7
Magenta gelb
: :
cyan
: hist ( x .
freq = FALSE ,
col =3 )
" "
" "
freq Unterschrift
Beschriftungen hist ( × 4 Titel
-
:
,
= FALSE , col =
,
Main =
,
sub =
" " " "
Häufigkeit ) gezielter Zugriff auf

Hab Werte in mm Hab rel
Ausgabe wert
= =
.
Ausgabe Werte Anzahl Werte Klasse histlx breahs 10

plot FALSE ) $ count
-
:
s
pro
= =
:
, ,
oder Klassen mitten : $ mids ↳ Grafik wird nicht

gezeichnet
kumulative Summe der Werte :
µ
-
curssumlx )
gegeneinander auftragen plotlx )

-
:
, t
" " "
"
" " " "
Wertet ) # Punkte L # Linien b # Linien stnbok # nichts

xp
:
plotlx , f. typen =
p nur ,
. nur .
.
und ,
n
" " "

"
Punkt symbol :
plot LX , Y ,
ttpe =
b
,
pch = t )
" " "
"
Linien ttp b 1)
:
plot ( × , y ,
t.pe =
, p.ch = *
.
lty =
" " "

"
b
Linien dicke : plot LX , y ,
t.pe =
, pch = *
.
lty = 1
,
lud =3)
" " "

"
Achsen b
Skalierung der : plot ( × , y ,
t.pe =
, p.ch = *
.
lty = 1. ( wd =3 ,
xlin =
( ( O . 95,725) # oder Hin
Histogramm dazu zeichnen : bist ( × , col = 2

, freq = FALSE ,
add - TRUE )
Koordinatensystem :
plot ( do ,
10J ,
< ( Q1 ) )
"
"
-
leeres K -
s :
plot ( < CO ,
10J ,
< ( 0,1 ) ,
t.pe = n )
" "
× -
Achse y-Achse
-
Titel : fitte ( .
. . )
"
"
Position text ( Text Stelle ( 2 0.8 ) 4 4)

-
: Z ,
0.8 . an
, ,
Col =
, pos
= # rechts
Linie zeichnen Lines ( 6) ))

-
: cc 2 , ,
c ( 0.15 , 0.24
" "
Größe der Achsenbeschriftung : green )

# Ziffern
größer # ce Zahlen Lab Labels
--
( aol.a.us 2x mal
par ( Ex axis 2 #
-
=
=
,
-
" "
Geraden Achsenabschnitt rote horizontale Linie : abline

ablinecy
Steigung) ) #
-
: -
,
, ( h =3 , cool > red u für vertikale
Torten ( cc ))
diagramm
-
:
pie
- -
.
.
.
.
. _ . .
, .
" " " "

"
"
D
"
)
"
( CC Labels cc
Beschriftung :
pie =
- - -
-
.
i
_ . .
.
.
, .
, .
.
.
.
.
.
.
,
.
.
" " " "

"
(I
"
) ) ))
"
( cc
"
Farbe Labels
" " " " " "
"
'
-
:
pie
.
.
.
. _
,
- -
.
. . .
,
=
c .
.
.
. .
.
,
.
.
,
.
.
. ←⇐ cc .
.
, .
.
,
.
. . . .
Balken barplot CCC ))

diagramm
-
. .
.
. . .
.
. .
. .
:
Beschriftung barplot
" "
CCC ))
" " "
) ! :
"
cc
-
nam.es
:
arg =
. .
.
. .
.
. . .
.
. .
.
.
.
. .
.
. . .
.
"
Legende
" " " " " "
)
"
text (
mit
Legend
:
-
.
= < . .
, .
.
.
. .
. .
.
Box -
Whistler -
Plot :
7. Wertebereich erzeugen : +1=1 :
700 +2=50 : 150
))
" " "
"
2.
Beschriftung : boxplot ( x ? xz , namens = < ( . .
.
. .
•
Daten einlesen bei txt :
read .
table bei R .
Data : Load .
immer einer Variable zuordnen
"
X
"
) oder /
" "
-
im Arbeits uerzeichnis : Load C .

R Data ) mit Pfad : Load C Verzeichnis H R Data . oder
"
"
Tabelle readtabkc Verzeichnis X dat header )

-
:
.
,
- T
in Kopfzeile sind Überschriften : header > T
erste der Tabelle enthält Zeilenenden

Spalte
-
:
row.name s = 1
Variablen kennzeichnen direkt aufrufbar Hach C)

Spalten als oder Spaltenüberschritten als Variablen erkennbar machen
-
und ,
: a-
7 einlesen attack
-
2 3. 4.
-
nahes sunnary
Daten Hand einlesen Möglichkeiten Textdatei

-
3 Variable ) 3 Daten mit readtabk

7.
eingeben und
von : :
← cc . . -
als einlesen
2. Variable )
c- Scan C . .
Variable
Eingabe
-
c-
rep ( Zahl , Anzahl ) # replicate wiederholt die
Datenzugriff
•
Worms [ Zeile , Spalte ] oder Worms [4 ] # , Zeile 4- oder worms C ,

2] #
Spalte 2
bis [5 75 , ] # Zeile
-
von -
: worms : 5 bis 15
Logischer Zugriff ( Area 3 & Slope 3 ]

-
:
Worms > <
,
Sortieren oraler ( Worms [ 13 )

Rangfolge rank C) Argument sortiert
zurückgeben sort C )
-
: : :
,
Variablen frei setzen detach C)

-
Lücken Daten Data frame Punkt setzen bei Zahlen NA schreiben

-
in : in .
: :
7. Option : Mean ( Slope , na .

rm = T) 2. Option :
is . na ( Slope ) : TRUE bedeutet : Wert ist NA
bei Mean und sum oder / is . na L ) : TRUE : Wert ist kein NA
( ( !
Slope ) ))
Slope
↳ mean is (
. na
"
"
Bsp bngth ( poll ( Gesch 3J)

-
: = = m
,
"
"
Stichprobe ziehen Sample 33,500 replaa ) # mit

zurücklegen
-
( [ Gesch TRUE
:
poll m
replace
-
wegen
= = _
, ,
Werte which ( Variable Eigenschaft)

ausgeben lassen die
Eigenschaft besitzen mit
-
<
:
,
°
Schleifen : o
Klammern :
for Cdf )) C ) enthält Funktion

in seq C
Argumente
-
:
-
. .
.
. .
.
. .
einer
for ( i 1:30 )
{ × c- r nor m C) [ ] der
-
enthält
Komponenten
:
in Indices von
point sc ) } } Vektoren , Matrizen , Tabellen
leerer Vektor
nunericckngthc ))
{ } bezeichnet Beginn
Zsnhängender
-
Xc
und Ende
-
:
-
. .
:
for ( Variable Wertebereich ) {

Anweisungen
in : bei Schleifen und Funktionen
Anweisung }
•
Funktionen .
Bsp Varianz Varianz function ( x) Quadrat sammelt) llengthlx) 1)

-
. : c- -
bsp < -
< ( 12,3 )
Varianz ( bsp )
t Test erstellen CD
° -
o
Matrix
[1 ] . .
. .
qt CO 99 af ) # 99% Quantil der t

-
,
-
Verteilung Vektor : Bc -
< ( 12,3 , 4) Es . .
.
.
pt ( t df ) # kumulative Wahrscheinlichkeit t umwandeln Bc matrix ( B

spalten
von
, :
2) # 2 Zeilen und
-
, n row =
1- pt ( t , df ) # Irrtums wahrscheinlichkeit einseitig

-
Band summen :X tabk CB , 1) # für Zeiten

margin 1
für
:
<
Spalten
c- .
,
2 pt ( t, df )) # zweiseitig
-
-
.
"
t .
fest ( Werte alternative

"
two sided .
)
,
d Wahrs küitsdichle Waters random

:
piken q
: Quant il r :
.
. .
Lösungen der Aufgaben zettel
7 Wahres berechnen Messwerten oder Null ?

. in R für das Auftreten von
negativen
CO mü
Sigma)
→
pnorm
"
, ,
"
2. für positive Messwerte bei normalverteilter Gg ?
17=901
⇐ 1
=
1-
pnorn ( ) Z
=
→ O , µ ,
o z z
kritischen für
3. Wert bestimmen für f-
Verteilung und df 0,0005
=
in R ,
eine ← =
0,1% =
22
qf ( O .
99995 ,
22 )
A - E =
0,9995 ,
¢
Anweisung 95% F- Freiheitsgrade auszugeben ?
um Quantile einer
Verteilung mit 75 oder 10
qchisq ( 0.95 ( 15,20 ) )

→
, <
5- 99% Standard
Anweisung um 95% , ,
99,9T .
Quantico einer
normalverteilung ausgeben
→
qnorm ( c ( 0.95 ,
0.99 ,
0-999 )
,
0
,
1)
6.
gleicher teilte Zufallsvariable im
Umfang von 1000 Werten in Intervall von ( O
,
10] in R erstellen
→
vunif ( 1000 ,
0 ,
10)
7. Wortes einlesen Unterverzeichnis

pace Datei
-
: in
"
)
"
→
Load ( Verzeichnis ( Name .
R Data
Anweisung sind die

8. um Datei so einzulesen ,
dass die
Spalten als Variablen
verfügbar über
Spalten überschriften werden können ?

-
"
"
→
× c- read tabk ( -
Name .
txt ,
header = T)
attack Lx )
9 Warum
gibt Sc sum C- ) eine
Fehlermeldung aus ?
-
-
-
funktioniert Variablen mit den Typ und nicht bei character

integer
→
sum c ) nur bei numeri und
die
gesamten
Wie kann Variable ersetzen ohne Variable
70 .
man einen
Eintrag in einer neu zuzuweisen
→
Variable [1] c- neuer
Eintrag
1? Wie kann Einträge Variable 2 die auf der
man alle von Variablen mit ,
die
Eigenschaft besitzen ,
R Konsole lassen verwenden ?

ausgeben ohne Zahlen zu
-
" "
Variable [
Eigenschaft ]
→
1 Variable = =
Kumulative Summe = Wahrscheinlichkeits summe der Relative

Häufigkeit =
Statistische Wahrsch .
rel Häufigkeiten Klassen breite ergibt Waters dichte

Einbeziehung
der
-
^
-
¥
Är !
Fläche ist 1 -
.
T
×
-
-
Lösungen aus
Übungen
7 2
gegenteilige Aussagen aber beide richtig ,
warum ?
erste
Aussage ist absolute und die relative Absolute und relativen Häufigkeiten
→
eine zweite eine .
können sich voneinander

unabhängig ändern
2. für werden für Nominalvariablen kann

Variablen : alle
Typen können relative Häufigkeiten bestimmt , Man
keinen Mittelwert bilden
3. Mittlere Änderung der Variable ?

→
Differenz der Variablen bilden und dann daraus das arithn Mittel -
4. 2 Zahlen ausdenken 5 und unt

mit 8 mit Mittelwert Varianz
Mengen
n =
. von
.
→
Summe muss 40 sein 5 8 die ersten 7 Zahlen sind frei wählbar und die
wegen
.
8. Zahl Mittelwert
vorgegeben
ist durch den
5. eine Zahlen
Menge
so verändern , dass I = 7 ist und die Varianzen gleich bleibt
→
alle Zahlen der Zahlern
engen tz rechnen : Mittelwert erhöht aber Varianz gleichbleibend
6. In welchem Bereich der Personen normalverteilter Variable ?
'
liegen 95% bei F und s

gegeben
→
t und -
2 * s auf den Mittelwert der Menschen rechnen
7. Erkennen einer asymmetrischen Verteilung ohne Mittelwertbestimmung

Mitte Wert und der
symmetrisch ist sollte die bei der Sonne den
niedrigsten
→ es
wenn aus
Hälfte der Variationsbreite

liegen
8. Wie hoch ist die Wahrscheinlichkeit ,

dass bei
gleichbleibender Erfolgsquote nach vier weiteren
Experimenten die gewünschten 4 zusätzliche erzielt

Ergebnisse werden ?
Binovüal
verteilung mit 4 k 4
→
n =
und =
9. Korrelieren die beiden Größen signifikant miteinander ?

→
parametrische oder nicht -
parametrische Korrelation .
Test durch Kovarianz
10 Work Datei einlesen im Unterverzeichnis

space
-
.
.
"
)
"
→
Load C Verzeichnis Name .
R Data
1? Datei so einlesen ,
dass
Spalten als Variablen verfügbar sind über die
Spalten überschriften
direkt werden können
abgerufen
"
"
→
× c- read . tabkc Name .
txt ,
header = T
)
attack ( x)
K .
Wahrscheinlichkeit berechnen ,
dass aus einer normalverteilten Gg mit µ = Mittelwert und
sd Zahlen werden
• =
negative gezogen
→
pnorn
CO ,
µ ,
o )
13 .
Standard abw .
der 100 Mittelwerte berechnen und mittlere nel .
Häufigkeit der neg .
Zahlen
sd ( mean )
→
Mean Cr H )
-
14 For .
-
Schleife : for Ci in
length ( Variable ) {
T c- cum sum ( Variable)
" " " "
)
" "
cat C .
. .
,
i , .
.
.
FC ;] ,
s
In
15 .
kam .
Waters Kurve .
für 8 Klassen ohne Fht . < uns um : Canal c- nuneric CD # leerer Vektor
for ( i in 7: 8) {
( und Li ] c- sum
Ch Ft : i ] ) # Häuf , von 1 bis i
} addieren
16 .
gleichgestellte Menge aus 50 Elementen

erzeugen von 0 bis 10
→ × c-
vunif ( 50
,
0,10 )
ziehen bestimmen wiederholen
daraus n -5
Stichprobe und F das 500 X
-
→
Mean 5 c- numeric ( 500 ) # Leerer Vektor
for ( i in 7- 500 ) {
neun 5 (i ] c- mean ( Sample (× ,
5 )) # 5 Werte ziehen
77 700 mal nacheinander eine Stichprobe aus normalverteilter Gg .

mit
µ =
10 und a- G- ziehen ,
mit
für jede Stichprobe berechnet werden

I
Häufigkeit negativen Zahlen
a- 20 ,
soll , sd und nel .
der
→
Mean c- nun eric ( 100 )
Std c- numeri ( 100 )
v. H .
c- nun eric ( 100)
for (i in 1 :
700 ) {
Sample c-
rnorn ( 20,10 , 6)
mean Li ] c-
mean (
Sample )
std c- sd (
sample )
# c- sum ( sample <
03120
gg
. .
Übersicht Tests
2
Stichproben
^
gepaart ungepaart-
a
/ I =
Normalverteilung ? Normalverteilung ?
% Yun % Ein
←
I I
t Test für W Test

gepaarte s
Varianzen vgl U Test
-
-
-
-
.
¥
""
t Test für
-
ungers .
Welch -
Test
-
>
Stichprobe
2
Stichproben bei Nominal variablen :
lnleruauuariabk t -
Test t Test F Test ( war lest )

Zähl variable binom test
-
-
-
.
-
: -
Korrelation
-
unabhängig Cor .
test :
Wilcox -
Test
ist TEE er
: wenn :-. -
/
-
unabhängig cor . Test
Rangvariabk Wilcox -
Test
Hass #
pained T con
-
= .
Nominal variable Binorüaltest

proptest
? ?
Test
X Test X -
ko-orow.si
Wilcox Test T test : Test für Lage parameter (Mediane. Mittelwert)

-
-
,
Test ( wartest ) Test für

F - :
Streuung
F- Test contest
.
: Test für Korrelation und
Kontingenz
(m : lineares Modell
Binomial , X ? lest Test für Zahl variablen und Verhältnisse

prop
. :
'
Shapiro -
Test ,
Ks -
Test ,
X : Test auf
Verteilung
Abhängig ,
Unabhängig ?
abhängig: -
je 2 Mäuse von jeder Rasse werden verschieden

gefüttert
: senktest
Parallelklassen mit Unterrichtsmethoden Noten

gleiche Bedingung Umgebung
-
vers .
: , man nimmt , an
Vorder u
Hinterflügel Tier
-
pro
.
2 Verfahren Lieferungen getestet Verfahren

-
7 beide
, an :
pro Lieferung jeweils angewendet

unabhängig Gewichte
-
von Kindern ( weiblich ,

männlich )
Test flächen die
zufällig ausgewählt
-
Vers .
,
werden
Trauben sorten
unt und deren
Zuckergehalt
-
Zufällige Paare männlichen und weiblichen Tiere deren

Wurfgröße wird untersucht
-
von :
Versuchs felder mit und

Genmanipulation
ohne
gleiche Bedingungen
-
,
sonst
Powered by TCPDF (www.tcpdf.org)

Statistik Klausurzettel

Hochgeladen von

Dokumentinformationen

Copyright

Verfügbare Formate

Dieses Dokument teilen

Dokument teilen oder einbetten

Freigabeoptionen

Stufen Sie dieses Dokument als nützlich ein?

Sind diese Inhalte unangemessen?

Copyright:

Verfügbare Formate

Statistik Klausurzettel

Hochgeladen von

Copyright:

Verfügbare Formate

Datenlage Deskriptive Statistik

Absolute Häufigkeit : Anzahl pro Klasse

Relative Häufigkeit Anzahl Klasse durch Gesamtzahl

Wahrscheinlichkeit schickte durch Klassenbreite

kontinuierliche diskrete Variable

Maß zahlen der zentralen

arithmetisches Mittel I f) fis absolute Häufigkeit Eigenschaften Summe der

abhängig von Extremwerten

→ Anzahl aller Mittelwerte starke Variation bei kleinem N

extremwert unabhängig nach

geometrisches Mittel Prozess ist nicht

wenn ein multiplikativer additiv

Streuung Maße Varianz ,

Varianz Ausmaß über ( sum of

2 Summen bilden und verrechnen

→ erst Mittelwert berechnen ,

Standardabweichung Quadratwurzel gibt Streuung in R : Sdk)

Mittelwert und St der Grundgesamtheit

Ausreißer Wert der Mehr als das 75 fache

in R Cxs (x) des

Median entfernt ist

Shannon sehe Diversität index :

gewichtet jede Klasse mit ihrer relativen Häufigkeit pi

Mittelwerte sind bei

Standardnormaler teilung : Transformation

wie viele Werte

bei kleinem / asymmetrisch

in R : binom testeten p , alternative

Grundgesamtheit alle möglichen Messwerte Stichprobe Teil der

Maß zahlen Stichproben Standard fehler

Standard fehler gibt Schwankung bereich der Mittelwert schätzung

die desto ist der Mittelwert

bei ändert sich nichts gleich

wie bei einer

variiert und normalverteilt ist

a<- numeric (10000)

Wähle die Anzahl der - for (i in 1:10000) {

Pearson sehe Korrelations Koeffizient

Maß Korrelations koeffizient in R : Cor ( X ,

des erklärt werden kann

Ö nichts wird erklärt und

gesamte Varianz wird erklärt

Nicht Linearität erzeugt scheinbare Korrelation

ein; → Varianz und Kovarianz betonen Ausreißer

wenn 2 100% müssen

gemeinsame Abhängigkeit von 3 .

Kontingenz : Korrelation bei Nominal variablen , zsn fallen

den für stochastisch

gegebene werte sind , .

Berechnung , summe der # bsfandsquadra.ge

parametrische Korrelations maße : ohne geschätzte Parameter

Spearman 's p : KorrelationsKoeffizient rs

nicht n > taz in R : corEX.Y.nethoch spearnan )

Kendall 's ) kordanz aller

werden : ( X Y Method Kendall

nur einmal nehmen

erklärte Varianz Varianz der Werte für Ii kann auf werden

beide Variablen sind mit Fehlern behaftet b = LEE Ist in 2

Anzahl bei Zahlen sind

Nullhypothese Ho vorhandene Unterschied Stichproben keinen der

Signifikanz grenzen Irrtums wahrscheinlichkeit

5%10,05 schwach Nullhypothese Ho

Unterschied und Unterschiede nicht signifikant

je größer n desto stärker nähert sich t -