Sie sind auf Seite 1von 18

Datenlage Deskriptive Statistik

Absolute Häufigkeit : Anzahl pro Klasse

Relative Häufigkeit Anzahl Klasse durch Gesamtzahl


geteilt
-

:
pro

Wahrscheinlichkeit schickte durch Klassenbreite


rd
Häufigkeit geteilt
-

: .

Kumulative Wahrscheinlichkeit :
Summe der relativen
Häufigkeit :
Integral der Waters dichte
.
:
sigrid : Waters . summe

Variablen typen

ii
Nomina ( Variable
Eigenschaften
-

Abstand
:
weder
Reihenfolge noch definiert z B. Berufe Konfession Geschlecht , Ja Nein Entscheidungen
-

, .

, ,
.

:: ÷::: :
.
: : ÷: ±:: ÷: :::*
Umwandlung

Intervall Ordinaluariabk Intervall werte der Größe nach ordnen und verteilen
in
Ränge mittlere
Rangzahlen möglich
:
von
-

kontinuierliche diskrete Variable


zeigen Anstieg
Variable Zuwachs Stufen
schräge Verbindungslinien
-

vs
=

zeigen
.
=

Klassen
Integer ( Ganzzahl) character ( Zeichen )
-

:
, nun eric (Dezimalzahl) ,

Maß zahlen der zentralen


Tendenzen
↳)
Anzahl Wertete lassen

arithmetisches Mittel I f) fis absolute Häufigkeit Eigenschaften Summe der


Abweichungen aller Einzelworte ist Null
-

[ =
:

abhängig von Extremwerten


"

a¥¥t|
-

→ Anzahl aller Mittelwerte starke Variation bei kleinem N


-

gewogener
arithm Mittelwert E- ¥ III.
µ=E]
:
Ei
.

k
.

zander Werte in

das
dazu rechnen

Bsp Durchschnittseinkommen bei asymmetrischer Verteilung ist das arithm Mittel ungeeignet für die Stichprobe gibt systematische
-

:
: .

,
es

Verschiebungen
-
Median (Zentral wert F)

gleich viele und unterhalb des Median Median halbiert die Fläche der Häufigkeits verteilung
Eigenschaften Werte
liegen ober
: -

extremwert
unabhängig
-

Modalwert Ä :
gibt Lage des Maximums der Häufigkeitsverteilung an

extremwert unabhängig nach


Klasseneinteilung möglich abhängig Klassen breite
-

nur von
, , _

/×H=§?
ne

harmonisches Mittel Kehrwert des arithm Mittels der Kehrwerte die Variable im Nenner steht
-

; wenn
:
.

Z .
B .
bei Geschwindigkeiten

geometrisches Mittel Prozess ist nicht


-

wenn ein multiplikativer additiv

IXG-nn-f.FI?=CxiXzi...Xn)F-/
-

: es ,

z.B .

Populationsgröße

Streuung Maße Varianz ,


Variationsbreite ,
Stand -

abweichung ,
IQR ,
Indices H u .
E ,
Variations Koeffizient

Varianz Ausmaß über ( sum of


square )
der
der Streuung Summe der Quadrate
Abweichungen Quadratsumme SSQ
-

: = =

die Fläche
unabhängig vom Mittelwert , wenn Messgröße eine Strecke ist
-
,
dann ist die Varianz eine

ö§E/
|↳AnzahlWer
dann
s :

2 Summen bilden und verrechnen


/ in R : varcxs

→ erst Mittelwert berechnen ,


SSQ →

Freiheitsgrade Summe der Werte 4.5=20 die ersten 4 Werte kann frei festgelegt
-

:
n = 5 :
muss sein man wählen ,
der 5. ist
,

also 4 Freiheitsgrade : n -

Standardabweichung Quadratwurzel gibt Streuung in R : Sdk)


-

: der Varianz an
,

Mittelwert und St der Grundgesamtheit


abweichung sind Schätzwert
-

fsn-F.fr/xi-FJ-/
-

bei einer
Normalverteilung
liegen
68% der Werte in ts
, -

t.n-tt.fi
95% in ± ZS
-

Box -

Whistler -
Plot :
wenn Mittelwert und Varianz keine
gute Beschreibung sind : sind Quarzite oder Perzentile informativer

ÄH.tt#fH.............../:t:::::-:
Mied
Häufigkeit

f-
µ -

xnax : Extremwert

Quartier 74 : 25% -

Schritte
-
a.

= Perzentik : 1% -

Schritte in R : Median 4)

. . .

-
-
min
→ 5 Werte

_
' Merkmal

Ausreißer Wert der Mehr als das 75 fache


( ariationsbreite
V
la as
= ,

in R Cxs (x) des


max min
lnterquortil abstandes
:
von
-

Median entfernt ist

Diversität Index
Streuung maß bei Nominal variablen
-

|H=-;§Piih|
-

k
'
-

Shannon sehe Diversität index :

gewichtet jede Klasse mit ihrer relativen Häufigkeit pi


Extremfall 1: nur eine Klasse bei Amin =
-

Ä ? Ln = O

|E=h

Extremfall 2 : k
gleich häufige Klassen : Am a. ×
=
-
E. In (E) = -

k .

¥ Lnl ? )
.
= Lnlk )
,

Eueness
Gleichförmigkeit der
Verteilung durch Normierung auf theor Maximum
-

: .

Wahrscheinlichkeitsverteilungen Wahrlich

EFFIE! !!
"
e-
Normalverteilung
:
bei vielen Einflussfaktoren f, =

(
Standardabweichung
Verteilung sieht immer gleich aus

Mittelwerte sind bei


großen n annähernd normalverteilt in R : dnornlx , µ ,
o )

Standardnormaler teilung : Transformation


Z
Wiahrsdichtefür
-

¥Ä6%|
l↳
jeden Wert durchführen
:

{ zz
dnorn ( z 0,1 )
f Cz ) =
¥ .

e in R : ,

wie viele Werte


liegen im 95% Bereich der .
Normalverteilung ?


für ⇐ = 5% in z -
Tabelle nachschauen die ,
Daten müssen in dem Bereich
lieg
Binoreialuer teilung Entweder oder
:
Ereignisse abhängig und
-

n
p
-

.
,
von

dichotom er
3
Bedingungen : Ja -
Nein Wate :
Ausgang mit
genau
2
Möglichkeiten
voneinander
unabhängige Messungen in R : dbnonlx ,
n .

p
)

dieselbe Wahrscheinlichkeit

bei kleinem / asymmetrisch


großem p ist
Verteilung , wenn n klein ist

bei

gropemnwirdNornalngangena50.ae
fpcky.tk/'pkiqn-k(E)=5.kY!p--Wahrs
fürsorgerischer
" "

= 1- P k =
Anzahl günstig

(f) se.IT II
8 !

Beispiel
=
:
bleibt
gleich
=

!
=
.
z immer
p
=
.

( KZ 4)
mindestens 4 (also 456,7 8) 100%
plk :O) plh 1) plh 2)
plh =3 ) Gegenteil berechnen
= →
-

: - = -

p
, = -

Aufgabenstellung : Wah
.rs .
für Stipendien an
1<=7 Männer von n -10 Stipendien mit 200 Männern von 1000 Personen Cp )

Erfolgsquote von
Experimenten : 8 weitere
Experimente n = 8
,
und 1<=4
"
"

in R : binom testeten p , alternative


-

,
=
two .
sided )
z.B binom Test Cc ( Häufigkeit 1
Häufigkeit 2) 314 ) oder binom Lest C
Häufigkeit ? h 314 )
p p
-

= =
,
- .

,
.

Theoretische vs
Empirische Verteilungen
:
.

Grundgesamtheit alle möglichen Messwerte Stichprobe Teil der


möglichen Messwerte
-

Maß zahlen Stichproben Standard fehler



ve rs .
variieren : wie stark gibt an

/se
=

Standard fehler gibt Schwankung bereich der Mittelwert schätzung


-

: > an
-

die desto ist der Mittelwert


je
größer Stichprobe zuverlässiger
-

für
,

normalverteilte variablen
?
anti ab
proportional 30
gilt
-

se zu n n > :

→ Sta abci
Vertrauensbereich
¢
des
.

Mittelwerts kleiner
Is]
wird bei
großen n
-

±
schwankt kleinen stark stabil ? gg
Varianz bei sehr ab -30
-

n , n
-

bei ändert sich nichts gleich


-

einer
Gleichverteilung :
,
bleibt -

wie bei einer


Normalverteilung weil der Mittelwert immer

variiert und normalverteilt ist


Schleifen :
für wiederholte
Ausführungen Stichprobe ziehen und Bereich bestimmen denen 95%
-
,
in aller Mittelwerte
liegen
⑦ Flussdiagramm ② /Wähk1Stichprobengöße -
for (k in seq(3,30,3){

|
als in R :

a<- numeric (10000)


±

/Eüheitsg
-

Wähle die Anzahl der - for (i in 1:10000) {

|
for (df in seq(3,31,2)){
-

Stichprobe ziehe 7 Stichprobe und a [i] <- mean (sample (Gr, k, replace = T)
x <- rnorm (df+1, mean= 10, sd = 2) ← }

/
berechne
points (df+1, var(x)) µ }

Zeus " und
liebeskranken ←
}

jgna.no/
} Schleife 1: Stichprobengröße k, leeren Vektor


varianz besinnen erzeugen
Schleife 1 mit Freiheitsgraden, Schleife 2: Stichprobe ziehen und Mittelwert
berechnen
Schleife 2: 30 Stichproben ziehen,
95% Konfidenzintervall bestimmen
Varianz berechnen und als Punkt einzeichnen
¥
¥
#irgend /-
¥5 s
)
nein

¥
¥
Ende
Ende

Kovarianz :
Pr
↳ oduktden Mittelwerten .

fows-n.IE?icxi-xs.ci-F)-I=ss Ä""ÄÄ?!¥
-

" oder

an.
Korrelation Kovarianz Mittel der
:

geteilt durch
geom
.
Varianzen nx oder n ,

couC in R corl )
korlxiyj-x-y-SF.TT
SSX t
: . .

.
. . .
.

Pearson sehe Korrelations Koeffizient


'
:
Maß für Stärke des linearen Zusammenhangs beider Variablen
parametrischer teilung zwischen 1 :
hohe positive Korrelation ,
O : keine Korrelation
| und -1 : hohe
neg .
Korrelation : tntkorrelation
↳ " "

Maß Korrelations koeffizient in R : Cor ( X ,


Y ,
method =

pearson )
Bestimmtheit > Maß ?
r .
Anteil der erklärten Varianz ,

des erklärt werden kann


Anteil der Veränderung der allein aus
Änderungen anderen Merkmals

|r?6r4/
-

Ö nichts wird erklärt und


zwischen : 1 :

gesamte Varianz wird erklärt

°"
""
"
-

Nicht Linearität erzeugt scheinbare Korrelation


Ausreißer stören perfekte Korrelation oder scheinbare Korrelation
erzeugt
-

ein; → Varianz und Kovarianz betonen Ausreißer


nur
homogene Daten zufassen
-

gruppen
keine formale Korrelation sich Größen
-

wenn 2 100% müssen


ergänzen
: zu

keine kausale
Abhängigkeit der 2
Größen trotz echter Korrelation , sondern
-

gemeinsame Abhängigkeit von 3 .

Größe möglich .

" "

Kontingenz : Korrelation bei Nominal variablen , zsn fallen

den für stochastisch


Berechnung gibt wie stark die an ,
Messwerte von abweichen , was man

,
unabhängige Ereignisse erwarten würde :

unabhängig voneinander ?
ändert sich mit Stichproben umfang Anzahl der und Zeiten F- Werte nicht miteinander vergleichbar
,
Spalten :

① ②
X Y Geilen Plz )
Tabelle
Kontingenz -
: -

Esse ¥0 0,54
1- Rand sannen bilden
Z
erwartete
Häufigkeit
.
.

Erwartet
- -
2- berechnen

gegebene werte sind , .


3 .

µ .

Berechnung , summe der # bsfandsquadra.ge


-

Beobachteten E -
-

7
z
. -
.
-

spalten
)

pcssfo.se/-./-./-
(B
T

in R :
chisq .
fest CB df ) ,

qchisq ,
pchisq
°
Anzahl Freiheitsgrade :( Zeilen anzahl 1) -
.

( Spalten anzahl
-

1)
°
Irrtums wahrscheinlichkeit 5% °
Ho :
Variablen sind unabhängig
Tabelle 55.7
°

f) it :
X ( df ,
a
)

Hst >
XI.it : Hs annehmen Niest < X
?

nit :
Ho beibehalten
Vergleich Kontingenzwerfen Kontingenz Koeffizienten
-

von . über

| Teilen
-

×
? m spaeten
,
m =
minlzcs ) zwischen 0 und 1
'

/a=µ¥
Cramer sehe Index
-

Nicht -

parametrische Korrelations maße : ohne geschätzte Parameter

Spearman 's p : KorrelationsKoeffizient rs

je ähnlicher die
Fangreihenfolge desto stärker die Korrelation
-

Vorgehen 1.
Ränge vergeben gleiche Werte erhalten mittleren
-

: :
Rang
2.
Rang differenzen bestimmen
3. Quadrate der Differenzen bestimmen und Sonne daraus bilden

4. Formel verwenden

|rs=1
-

'
einmal betrachten
Edi
: n nur
G.
,

" "

nicht n > taz in R : corEX.Y.nethoch spearnan )


↳ RangKorrelations Koeffizient

Kendall 's ) kordanz aller


T : misst ④ is
Wertepaare
20 30
20 40

grafisch bestimmen ?
-

: n
Wertepaare verbinden

2. Über No ( diskordant
Kreuzungen zählen Paare)
% to
-
80 zoo

3. n und ND einsetzen

)
" "

in R

4.NO/T--1-n-ln-X/n
-

werden : ( X Y Method Kendall


Bindungen
-

cor
mit 0,5
gezählt
=
,
,

nur einmal nehmen

lineare
Regression :

Abringen
abhängige unabhängige und Variabkimanschließtvonderllnabhängigenaufdie
-

× :
y :

Mittelwert
sunmederfehlerquadrate.in
,

¥÷÷i'
byx ←
E- I f) Xi F- LE
F- 1
*
§ ( E -

^5 rein .

÷ . . i. ⇐ st :
=

→ /
↳y - Achsen abschnitt ↳ „ =

a
, Regression Koeffizient von y nach X

→ -
F

¥ E ( E F)
'

erklärte Varianz Varianz der Werte für Ii kann auf werden


vorhergesagten zurückgeführt
-

sj
-

: Xi =

Bestimmtheit snaß
-

ß =

2 Modellvarianten fehlerhaft
abhängige Variable richtig
-

Y nach
Regression ist
: : von ×

beide Variablen sind mit Fehlern behaftet b = LEE Ist in 2


Richtungen
von × nach y

Steigung SS Kovarianz
-

:
=

Varianz
SSX ×

in R : ( m ( Y -
X) # Twitch modelliert als Funktion von X

XD # berechnet
pnedictllm ( Y -

vorhergesagte
Werte für Y

Anzahl bei Zahlen sind


Ränge 100 denen keine zwei
gleich :
0,5 Cnt 1)
-

von n
.
-

,
Urteilende Statistik

Hypothesen :

Nullhypothese Ho vorhandene Unterschied Stichproben keinen der


zwischen ist
zufälliger Natur und
gibt Unterschied
Grundgesamtheit
-

: in

Alternativhypothese Unterschied
H> : vorhandene ist
größer als man
aufgrund zufälliger Variation erwarten kann

Signifikanz grenzen Irrtums wahrscheinlichkeit


-

=
p oder a

5%10,05 schwach Nullhypothese Ho


signifikant → wird
angenommen
7%10,01 signifikant
Verschiedenheit der
0,7%10,007 hoch signifikant - P Ho
abgelehnt ,
weil
signifikanter Unterschied ein Beweis für Größen , ist

Unterschied und Unterschiede nicht signifikant


Signifikanz abhängig Streuung große Streuung große
-

:
von =

€ -

Statistik Verhältnis
:
von Maßzahl zu ihrem Standard fehler : kann man auf Mittelwert ,
r , rs , m und µ beziehen

>
Stichprobe :

tU
yg.ch#zweutdergfandardab
teilt Abstand von theor Wert durch .
den Standard fehler des Schätzwert
g £ T Standard normalverteilung an
-

je größer n desto stärker nähert sich t -

Verteilung an
e

p
df
Freiheitsgrade der df nicht ist , nimmt nächst kleineren df
1
eingetragen den
° =
n -

wenn man
a
°
Tabelle : E -

Tabelle S 1 -

exakter Emt :
über Quantil der Prüfer
Teilung
a
Ho Mittel unterscheidet Verteilung nicht Normalverteilung qtlp
°
: im sich von in R :
df ) =
,

r
t test ( X
"

in R
"
:
.

, f. alternative = two sided .

t
ttest >
tkr.it : Ho verwerfen ,
A1 annehmen pa-ired-TRUE.var.egua-l-FAL.SE)
tTest <
tkr.it Ho annehmen A1
:
,
verwerfen war .

equal = TRUE ,
Korrektur berechnung abschaltet

2
unabhängige Stichproben : Differenz
geteilt durch Standard fehler der Differenzen

Schätzer der Standardabweichung


-

|
s>

-
:
, z

so
=

§.(I{z-K Ä :
Schätzer der Mittelwerte

5) Varianz
s
gemeint
°
df =
n > tnz
-

o Ho : im Mittel unterscheiden sich die Stichproben nicht



C-Test >
tkr.it to ablehnen H>

¥
.
, annehmen in R : t .

Test ( x , Y , paired = FALSE vor


equal ) =

n
,
-

tTest <
tkr.it beibehalten , Hp ablehnen
g Test
Voraussetzung für parametrischer Test für

t - :
normalverteilte Variablen
e.

Varianzen
homogenität gleiche : Varianzen

:
F Test Fisher Test auf Varianzen homogenität Fla
Verteilung

in R df1 dfz )
-

: : :
-

, ,

Ho : Varianzen unterscheiden sich nicht war .


fest lxn ,
Xz )
r

/f=←/
-

Ftest Fkiit H> annehmen Zähler Fkrit


f Varianz
°
> : o
größere in :
qfc ←
, n > ,
n
)

war ,
CXZ) o
df =
n
-

5
Fragen t Test
Stichproben gleich Stichproben

vor einem
-

: 1. ein oder zwei 2.


einseitig oder zweiseitig 3 .
Varianzen bei 2

4.
unabhängige oder
abhängige Stichproben
5-
Normalverteilung gegeben ?

abhängige Stichproben
}
für
Bedingungen
°
mehrere die
: Daten einen Ort ,
wegen
der
speziellen zsn
hängen Differenzen
weil Korrelation
streuen
die
weniger
Streuung

geriet Identität bei Messwert kontrolliert


.

Zwillingen ,
mit
jeweiligen verringern

Z
abhängige Stichproben :

-

df =
n -

YSdct-F.EC/i-Yisd=
e
Ä d- mittlere Differenz °
ttesf > tkrit Hz annehmen
p
=

f
.

P
stand .
abweichung aller d 's : normale Formel
a

Ho mittlere Differenz Null Mittel unterscheiden sich die in R t test ( Y paired TRUE )
ist in Stichproben nicht x
: '
=
:
: , ,

bei
parameter freien Methoden Normalverteilung vorausgesetzt
-

r
ist

Median bestimmen *
( pt CK df ) )
zweiseitiger Test 2 1-
+
c-
p
:
,
Rangsunnen -

Tests :

in R : Wikonlest CEM ,
paired =
F)

Mann Whitney Test U Test testet auf


: :
Lageunterschied der Mediane
- -
-

n nur einmal nehmen , nicht nstnz

|U=nincn,Uz|
-

U An =
100 -

R > Uz = 100 -

Rz
n> (m t 1) ( nzt 1 )
nz
h ns.nzt-z Rs ns.nzt-z Rz
-

= -

!
P

Vorgehen 1. alle Daten der Reihe nach aufreihen 2. gemeinsam


Ränge vergeben Rang sannen bilden
-

a : 3- einzelne

4 Ü 's kleineres und


a .
bilden 5. U nehmen mit kritischen Wert
vergleichen Unit cnn.az ,
a
)

r o Tabelle :
S .
5

t Ao sind gleich
°
: Median

U
Test
>
Ukrit : Ho beibehalten ,
Hs ablehnen in R : wilcox testlx > .

, Xz ,
paired = F)

niest <
Umit : Ho ablehnen An , annehmen

Wilcoxon Test : W -
-

Test :
für Paar differenzen
,
fested ob Median der Differenzen Null ist

g
l
Vorgehen 1. Differenzen der Wertepaare bilden 2
Ränge vergeben Beträge beachten 0
weglassen
-

: .

: ,

P 4. kleineres
Rang bilden
3.
Wt und W
W nehmen und mit krit Wert berechnen
-

summen -

a o
Tabelle :
5.6

9 Otto
Stichproben unterscheiden sich Mittel nicht
vergleich
-

:
im paired = TRUE
gibt an ,
dass man Paar möchte

r Wtest Wkrit Ho Hs FALSE gibt Korrektur berechnung abschaltet


-

7
:
annehmen verwerfen Corre d- =
an dass man
, ,

£ Wtest <
Wkrit : Ho verwerfen ,
Hs annehmen

↳ W ( n .
a)

TRUE connect FALSE)


'

in R wilcox Test ( x
"

:
. , y ,
alternative = two sided . , p red =
,
=

wenn bei Wertepaaren Differenz 0 rauskommt ,


wird es bei Wkrit als n nicht mit ein.be rechnet

Abweichung Richtung möglich


einseitiger
4%3
Test
-

:
nur in eine
einseitig zweiseitig

Test Irrtums wahr


-

Zweiseitiger : .

verdoppeln oder ← halbieren :

Regelfall
in R :
p c- 2. ( 1- pt ( K ,
df ))

Fehler

}
:

erster Art Alpha -

Fehler :
Ho verwerfen "
obwohl sie
richtig ist
unt .

Konsumenten
Zweiter Art / Beta Fehler Ho beibehalten obwohl falsch ist
-

-
:
.
sie


je größer desto kleiner ist
ß weil die Mittelwert schätzung ist
n , ,
genauer
Güte (Power 1- ß Waters Güte
Tests gibt dass Ho zurecht
abgelehnt wird steigt mit
-

eines : .
an , ,
n

abhängig Stichprobenanfange Signifikanz niveau Unterschied zwischen


Grundgesamtheit

von en ,
,

Effekt stärke zB .
Cohen 's d :

|d=ÄJ|
Funktionen in R :

Funktion snane function (


Argument ) { Anweisung }
-

c-

das Funktion definiert wird wird nicht Work


gespeichert
-

in in
wa s ,
space ,

Funktion snane nicht definiert ist wird Fehler


wenn ,

ausgegeben ,

Variablen im Work space werden nicht überschrieben durch Definition innerhalb der Funktion

Std c- function Lx ) {
Bsp {
-

varianz function ( x)
Lengthlx)
'

c- c-
n
^

( sum ( × 12 ) -

sum ( x)
Zllengthlx ) ) lllengthlx ) -

1) mean c- sum ( × ) In

}
*
Z ))
"

sqrt ( Nn 1) -

sum (( x -

mean )

}
Korrelations Test ist Korrelation
signifikant und
groß parametrisch I
genug?
:
wann r

Ho ist nicht signifikant 0 verschieden


-

: r von

|t= -nF
_

Irl
t Test für Maß Korrelations Koeffizienten ist df
-

: = n -2

Vergleich vo n t mit kritischen Wert K = Hast .

. df = n
-

2)

t > K : Ho verwerfen , Hs annehmen


o
t -

Tabelle

t < K : Ho annehmen H > verwerten .

)
?
der durch lineare Korrelation erklärt werden
Beispiel Frage welcher Anteil Varianz eine können Cr damit
-

: : m u ss
,

die Korrelation mit ← = 1% statistisch signifikant ist ?


Erz
?


f-
-

NF umstellen nach r :
En ) =

↳ tkrit ausrechnen und einsetzen ,


dann umstellen

0,46 = ¥! ?
I -

1- r
'

0,46-0,463 -
r
'
= 0 I -

0,46

0,46 .

K -
r
?
) = Ir I -

0,465 -
r
?
= -0,46

? ?
0,46-0,46 r =\ r I I -

r r
?
C- 0,46 -

7) = -

0,46 I : C- 0,46-1 )

i =

Schiefe & Kuitosis :


weicht Verteilung signifikant von Normalverteilung ab ?
-

? Moment :
Mittelwert ,
2. M .
Varianz 3. M Schiefe 4M Wölbung , .

,
.

Schiele Cskew) Moment der Verteilung


-

= 3.

Ao
gemessenen Verteilung entspricht Eigenschaft Normalverteilung

:
Eigenschaft X der der X der .

→ 3
.
M .
der Verteilung : Stand -
aber .

ßs=)d!
/p
-

ls.e.pt#-/-Kurt-osis
M3

Schiefe : Stan Center .


der schiefe :

E. ( E)
abw.IS:44?uarlxj!
-

× -

4. M der Stand
Verteilung

.
: .

t.IT/
-


Kurt Stan lehkr der Wölbung
!!
.
:

t Test
-

auf Schiefe und Kurtosis

Ho
Eigenschaft rslgz der
Verteilung entspricht der
Eigenschaft In der
Normalverteilung
-

t>
gemessenen
:

ftp..fi?).IR-/
-
-

twitter.si .

.
d. f. =
n
-
z )
t >
tkrit :
Ho verwerfen .
An annehmen

t <
tkrit : Ho annehmen H> verwerfen
.

Test auf Normalverteilung


Ho Messdaten sind
-

:
× normalverteilt

Kolmogorow Smirnow bestimmt


größten Abstand kumulativer Waters Verteilungen liegt zwischen
-

-
Test : zweier .
: 0 und 7=200 %

" "

in R: Ks lest C x. meanlx ) sdlx ) )


.

pnorm , ,

Shapiro Wilk Test Test auf Normalverteilung


-

-
:

in R :
shapiro .
Test ( x )
?
X
Anpassungsfest
-

in R : chisq .
testlx , p =p -
x )
Konfidenzinterv alle

Punkt Maß zahlen


schätzung für Stichprobe berechneter
-

Wert Schätzwert für


: aus z.B .
Varianz dient als eine
Eigenschaft der
Grundgesamtheit
Intervall Konfident intervall : wahre Wert Irrtums wahrscheinlichkeit
-

schätzung :
liegt innerhalb des Intervalls um den Schätzwert ,
Intervall
grenzen abhängig von

( je schmaler das Intervall desto ist die Irrtums wahrscheinlichkeit)


,
größer
ist Vielfaches des Standard fehlers durch Ober
Abweichung Mittelwert
-

,
wird -

und Untergrenze festgelegt ,


als
pos . a.
neg .
von ,

von relativen Häufigkeiten asymmetrisch faußer bei f- 0.5


und sehr
großen n ) , z.B . Zielwahl eines Insekts

- Stan aber

/
.
.

tk.it = tlx = 5%
,
d. f. = n -

1) E ±
196 .

In

bei
großen normalverteilten kann EL 5% ) durch Skalierungsfaktor aus z Tabelle ersetzen z ? 6 bei 4=51
-

n : n > 30 man , n =

bei relativen Häufigkeiten


-


Fz ,
( Int
p t ± z -

P-%¥ ) f-
rel .

Häufigkeit ⇐ Quant :L der Stand


normalverteilung
-

p C1 p)
-
-

fürn bei 0 und reicht K intervall


200 : F- p 1
nach einer Seite
=
> .

nur

für K.in/eruaUe von relativen Häufigkeiten andere Formel als für Intervallvariablen :

Gründe : unt .

Wertebereich : bei Nominal . nur von 0-1 und Intervallen .

jeden Bereich
Fehler sind bei rd .

Häufigkeiten nicht normalverteilt :

Abweichungen zu beiden Seiten sind unt .

Bsp welche.

Grenzen hat das Konfident intervall mit p


> ¥00
① I ± 796 sd .
sdzn.p.am ② ± 1, go.PL?O#T
p 100
-

>


einsetzen und für t und -

berechnen

"

Ho
"

prop test TRUE )


-

in R :
. ( × , n alternative =
two sided ,
correet = : rel .

Häufigkeiten des Merkmals sind in allen


,
.

Stichproben gleich
IF
Anweisungen :

ermöglichen Fallunterscheidungen für mehr Varianten


-

if (
logischer Ausdruck ) { # wenn der Ausdruck wahr ist

Anweisung }
# Klammern
geschweifte nur , wenn der Teil
Länger als 1 Zeile

else { # ohne
Argument # wenn Ausdruck falsch ist

Anweisung }

"
"

Bsp
"
"

cat L Monat Monat Ci ] )


-

:
monat ( 1,12 ) mehr als
c- 30
Tage
.

seq , ,

tage c-
cc . . .
) }

Jahrestage c-
nun eric ( 12 ) else cat (
"

Monat ! monat Li] ,


"

ist kürzer In .
"

for Ci im Monat ) { if (i > 1) Jahrestage (i ] =

Jahrestage Ci
-

1) +
tage ( i -

1 ]
( i] ) {
if (
Jahrestage
30 else
tage E)
> = 0

Verteilungen :

Gleichverteilung : Binomialuer teilung :

Normalverteilung :

+ Er
unif binom nor m

Standardnormalverteilung Cp , µ =
0,0=1 )
Varian zanaly.se :

Fragen :

Herkunft der Varianz untersuchen : Faktoreneffekte vs . Zufall

welcher Anteil der Gesamt uarianz Messfehler zurückzuführen welcher auf Effekt des variierten Faktors ?
-

ist auf ,

unt
Parameter
tragen Varianz bei und (u n ) systematische Abweichungen

viel zur
erzeugen
.

bei mehr als 2


Stichproben
-

Ablauf :

Schätzwert :

Wertebereich des Faktors wird in diskrete Stufen unterteilt e.


Faktor 2- 3 .
4. xij -
Etäitäj
Annahme Faktor bedingt systematische Abweichungen pro Stufe
-

äi
geschätzte Abweichung
: :

es
gibt Variabilität zwischen den Faktor stufen : durch den
/-1-1/ äü geschätzter Fehler

E
:

arith
Faktor bedingt und innerhalb der Stufen
zufallsbedingt Mittel aller
:
: .
-

"
wahrer Sachverhalt 3

Gesamt variabilität
:

SQT Werte
zerlegen SQZ SQI
-

in t

#(wert
" "

SQT =
Summe der Quadrate total Ei arith M der ten Stufe
aller Gg .
:
.
- i -

der Faktor stufe


" "

Faktor stufen
ai : wahre Abweichung i -

ten
SQZ =
Summe der Quadrate zwischen den
"
"
eij : wahrer Fehler des j -

ten Messpunkts in inter


SQI =
Summe der Quadrate innerhalb der Faktorstufen Faktors tute

-
-

' '

§
?

§ § SQT : ( xij -

E) =
SQZ (Ii -

E) t SQI
lxij
-

Fi )

|
.

|
K

k Faktorstufen , ni Messwerte Gesamtzahl aller Messwerte :


µ =
E ni

"

Summe der iien Faktor stufe : Ti =

Ä Xii Gesamtsumme ner Messwerte :


F-
ÄST
Sat :
xii ) ¥) -

Saz :
(§ -

Ä) Sat : Sat -

saz

D-

Ho Faktor stufen sind


alle
gleich alle Variabilität kann durch Zufalls Komponente erklärt werden
-

: :

Parameter einfahtoridle
-

ein = Varianz analyse

F- Test der mittleren Fehler


Quotient quadrat summen

wenn
zufallsbedingte Variabilität größer als faktor -

bedingte V. ist ,
gibt es keine systematischen

Abweichungen zwischen den Faktor stufen


Vergleich MQZ und MQI von


-

MQZ
-

/uaz=I¥ua=
F =

• Ho : Faktor stufen weichen nicht von den anderen ab

°
F Tabelle -

:
einseitig

Ein.it = FI (a)

Ftest > Flut :
Ho verwerfen Hr annehmen ,
-

- mind . 1 Faktor stufe weicht von den anderen ab

Ftest < Fkrit : Ho annehmen ,


Hs verwerfen

-
abhängige "
"

in R: Syntax von Modellen : a- ( alle sorte)


-
, Faktor muss
Typ factor sein

Tabelle
-

von sunnart C)
Mittlere

KÄME

y.gn.coqo.io#ao*o,os.qyuwaa,/.u.| a.au
-

Df Sunsq Mean Sg Fualue Pr ( SF )

ÄH
"" -
-
"

SQZ
Faktor ^ " -

1 MQZ

Residual N k -

SQI MQI

Fehler innerhalb
Fehler .ae#pc 0,05 ,

=
schwach signifikant
p
← 1- pf LIEF ,
Cm -

1) (N ,
-

n - k ))
4. Faktor stufen
Voraussetzungen 1. sinnvolle 2.
Unabhängigkeit der Stichproben entnahme Randomisierung des
Experiments
-

: :
,

3. No der
teilung 4
homogene Varianzen

3. Test QQ Plot 99 line x )


( Wilk Test
auf Shapiro

Normalverteilung :
-

:
qqnornlx) ,
,
-
-

shapiro . lestlx)
H
Kurt osis
)
'
Csunccx 4) Ilengthlxsluarlxsiz 3D
If
:
-
neanc xD -

>
.
.

tgz sqrtczullengthlx ) )
=

Schiele Elx E3 Sankt


^
3) Ihn
tg If
gth.CH/sdLx53/sartL6/leng-thLxJ
( xD
-

:
= -
Mean
> .

qq.sn )

4. Test auf Varianzen


homogenität :

Hartley -
Test (Fnax ) :
wenn sich Fnax und Emin nicht unterscheiden dann unterscheiden , sich die anderen Paare auch nicht

Voraussetzung :
gleiches n für alle Stufen ,
normalverteilte Stichproben
-

F =
Sma ×
Fruit :
En ! (Q) o
F -

Tabelle

Guerre - Test :
Wenn Varianzen aller Faktorstuten gleich sind ,
sollten die absoluten Differenzen von

Stufenrüttel werten gleich verteilt sein

keine
Voraussetzungen

ldij-lxij-x.CI
-

Zwei faktoren ANOVA :


mit mehr als 1 variiertem Parameter rospalteneffeht
Zufalls effekte
-

Einfluss mehrerer Faktoren testen


-

Xijr = Et dit ßj tccß ) +


ejr
-
Wah
/
↳ Zeileneffeht
Wechselwirkung
Block
ideal
design gleiche Anzahl
Wiederholungen Stufe pro
- -

von
pro
:
,
state
3
Nullhypothese
-

7- Ht : Stufen mittel werde von Faktor A sind


gleich 2. HB : Stufen mittel werde von Faktor B sind
gleich
3. HAB :
Es
gibt keine Wechselwirkung zwischen Faktor A und Faktor B

facebook.Fahtorbw.w.Rest-SQT-SQATSQ.rs

| |
SQWTSQI ER Äj E) ( Ii F) # E )] t SQW =
- -
-
-
-

Sij =

r
xijr Zi =

f) Sis Tj =

f) Sij F-
f) Tj

⇐iii)
÷! EI!
-

⇐ -

"" ""

SQW = ( Fr ! Sis )
-

(E) -

SQA -
SQB sah SQT -

SQA -

SQB -

SQW
Restfehler
wenn SQA = SQB : keine Interaktion
-

MQA-n.sk#FLestlAJ=MuIFFkrit(A)--FuII

t.no :)
SI
MQ D=

÷:: :
SQL
MQ , =
µ -
n . K
-
÷

#
.

|
Df Sunsq Mean Sg Fahne Prl F) >
* mit Interaktion
-

Interaktion
-

MQAIMQI
i

A Faktor 1 k -
1 SQA o2 - Mat t ohne
- -

• vor z m
.
> .
? ←
was
man
,

Au In ( aovl ))
°

SQW
W -
B .

µ w
www.a , in R :
summiert . .
-
.
.
F - - .

\
Isis pc
-
1- pf # -

value ,
df Residual )
,
s

ohne Wechselwirkung Mittelwerte der Stufe sind für alle anderen


äquidistant Stufen
-

: einen

Mittelwerte der Stufe sind nicht äquidistant


mit
Wechselwirkung : einen

6 für die ANOVA


Regeln Planung
-

einer

konstant
7. Ceteris
paribas Prinzip -
: unbekannte Faktoren halten

2.
Wiederholungen :
Schätzwert werden
genauer
3. Randomisierung verringert : systematische Fehler

4.
Blockbildung verringert : Variabilität innerhalb der Stufen

5.
Faktorielk Experimente
6.
Symmetrischer Aufbau :

verringert
Chance für falsche
Schlussfolgerungen
" "

nach ANOVA Test


Vorgehen post hoc priori bei Versuchs planung konzipiert
-

: - : a :

II.IT/tIuitCa.N-k
-

- tposthoc =
-

¥Ä(¥) IMQuergl.tn
-

SQv

Zerlegung
-

von saz :

M vergl .

F =
-

Tikrit (a ,
m -

1 ,
N k)
-

MQI

"

ho
post Test : a
posteriori :
nach Versuch ,
erst anhand von
Ergebnis konzipiert
Bon ferrari Korrektur
"

Risiken
-

2
vergleichs bezogenes Risiko a und multiples Risiko a
-

: :

E
'

a =

µ=j|
-

Bonlerri Holm Korrektur


-

:
-
Wichtiges aus den Lektionen

Allgemeines
°

Verlauf Befehle
Workspaa Liste aller Objekte abrufen der abrufen history ( )
-

( sc )
-
:
: : :

"
"

alles löschen : rm Cz ) speichern als Textdatei : savehistory.cn °


- txt )
" '

alles löschen in Liste List : rm ( List = Lsc ) ) Verlauf laden : Load history C . .

. fxf

Klein und
Großschreibung beachten kein Leerzeichen Variablen nahe Länge lengt.tn )
-

in Cz
-
-

:
,

Zsntassung der Daten : swn.mar.tl )


-

Hilfe :
helplmean ) oder ? Mean

Auflisten der Tabelle C )


-

: nahes


Datentypen :

Rechnen Objektklasse class C )


-

° :

Potenz 10^2 Datentabelle data frame


-

Wurzel 10^0.5
-
:
x. + c-
-

: c- :
.

Funktion Dezimalzahl
-

(1) Summe Vektoren ) numeri


-

( :
-

e e
xp sum vec
-

: von :

Ganzzahl : integer
-

Median : Median Cuec ) arith Mittel ( )


-
-

.
:
Mean ve

Boolesche Variable :
Logic al
Cognac 8)
-

Logarithmus Log ( 10)


Log2C 8) Basis 10
--

runden : round ( Variable .


wievielte Stelle nach Komma )
°
Grafiken

Histogramm histlx )
-

Klassen anzahl : bist ( x


.
breahs = 10)

Waters dichte Klasse histcx frag TRUE )


-

=
:
.

pro ,

abs Häufigkeit Klasse : histlx frag = FALSE )


.

pro ,

Farben : O :
weiß 1 : schwarz 2 : rot 3:
grün
4 :
blau

5 6: 7
Magenta gelb
: :
cyan

: hist ( x .
freq = FALSE ,
col =3 )
" "
" "

freq Unterschrift
Beschriftungen hist ( × 4 Titel
-

:
,
= FALSE , col =
,
Main =
,
sub =

" " " "

Häufigkeit ) gezielter Zugriff auf


Hab Werte in mm Hab rel
Ausgabe wert
= =
.

Ausgabe Werte Anzahl Werte Klasse histlx breahs 10


plot FALSE ) $ count
-

:
s
pro
= =
:
, ,

oder Klassen mitten : $ mids ↳ Grafik wird nicht


gezeichnet
kumulative Summe der Werte :
µ
-

curssumlx )

gegeneinander auftragen plotlx )


-

:
, t
" " "
"
" " " "

Wertet ) # Punkte L # Linien b # Linien stnbok # nichts


xp
:

plotlx , f. typen =

p nur ,
. nur .
.
und ,
n

" " "


"

Punkt symbol :
plot LX , Y ,
ttpe =
b
,
pch = t )
" " "
"

Linien ttp b 1)
:
plot ( × , y ,
t.pe =
, p.ch = *
.
lty =

" " "


"

b
Linien dicke : plot LX , y ,
t.pe =
, pch = *
.
lty = 1
,
lud =3)

" " "


"

Achsen b
Skalierung der : plot ( × , y ,
t.pe =
, p.ch = *
.
lty = 1. ( wd =3 ,
xlin =
( ( O . 95,725) # oder Hin

Histogramm dazu zeichnen : bist ( × , col = 2


, freq = FALSE ,
add - TRUE )

Koordinatensystem :
plot ( do ,
10J ,
< ( Q1 ) )
"
"
-

leeres K -
s :
plot ( < CO ,
10J ,
< ( 0,1 ) ,
t.pe = n )
" "
× -
Achse y-Achse
-

Titel : fitte ( .
. . )
"
"

Position text ( Text Stelle ( 2 0.8 ) 4 4)


-

: Z ,
0.8 . an
, ,
Col =
, pos
= # rechts

Linie zeichnen Lines ( 6) ))


-

: cc 2 , ,
c ( 0.15 , 0.24
" "

Größe der Achsenbeschriftung : green )


# Ziffern
größer # ce Zahlen Lab Labels
--

( aol.a.us 2x mal
par ( Ex axis 2 #
-
=
=
,
-

" "

Geraden Achsenabschnitt rote horizontale Linie : abline


ablinecy
Steigung) ) #
-

: -
,
, ( h =3 , cool > red u für vertikale

Torten ( cc ))
diagramm
-

:
pie
- -
.
.
.

.
. _ . .

, .

" " " "


"
"

D
"

)
"

( CC Labels cc
Beschriftung :
pie =
- - -
-
.

i
_ . .
.
.

, .
, .
.
.
.

.
.
.
,
.
.

" " " "


"

(I
"

) ) ))
"

( cc
"

Farbe Labels
" " " " " "
"
'
-

:
pie
.
.

.
. _

,
- -

.
. . .

,
=
c .
.
.
. .
.

,
.
.
,
.
.

. ←⇐ cc .
.
, .
.
,
.
. . . .

Balken barplot CCC ))


diagramm
-

. .
.
. . .

.
. .
. .
:

Beschriftung barplot
" "

CCC ))
" " "

) ! :
"

cc
-

nam.es
:
arg =
. .
.
. .
.
. . .
.
. .
.
.

.
. .
.

. . .
.

"

Legende
" " " " " "

)
"

text (
mit
Legend
:
-

.
= < . .
, .
.
.
. .
. .
.

Box -

Whistler -
Plot :
7. Wertebereich erzeugen : +1=1 :
700 +2=50 : 150

))
" " "
"

2.
Beschriftung : boxplot ( x ? xz , namens = < ( . .

.
. .

Daten einlesen bei txt :
read .
table bei R .
Data : Load .
immer einer Variable zuordnen

"

X
"

) oder /
" "
-

im Arbeits uerzeichnis : Load C .


R Data ) mit Pfad : Load C Verzeichnis H R Data . oder

"
"

Tabelle readtabkc Verzeichnis X dat header )


-

:
.

,
- T

in Kopfzeile sind Überschriften : header > T

erste der Tabelle enthält Zeilenenden


Spalte
-

:
row.name s = 1

Variablen kennzeichnen direkt aufrufbar Hach C)


Spalten als oder Spaltenüberschritten als Variablen erkennbar machen
-

und ,
: a-

7 einlesen attack
-

2 3. 4.
-
nahes sunnary

Daten Hand einlesen Möglichkeiten Textdatei


-

3 Variable ) 3 Daten mit readtabk


7.
eingeben und
von : :
← cc . . -
als einlesen

2. Variable )
c- Scan C . .

Variable
Eingabe
-

c-
rep ( Zahl , Anzahl ) # replicate wiederholt die

Datenzugriff

Worms [ Zeile , Spalte ] oder Worms [4 ] # , Zeile 4- oder worms C ,


2] #
Spalte 2

bis [5 75 , ] # Zeile
-

von -

: worms : 5 bis 15

Logischer Zugriff ( Area 3 & Slope 3 ]


-

:
Worms > <
,

Sortieren oraler ( Worms [ 13 )


Rangfolge rank C) Argument sortiert
zurückgeben sort C )
-

: : :
,

Variablen frei setzen detach C)


-

Lücken Daten Data frame Punkt setzen bei Zahlen NA schreiben


-

in : in .
: :

7. Option : Mean ( Slope , na .


rm = T) 2. Option :
is . na ( Slope ) : TRUE bedeutet : Wert ist NA

bei Mean und sum oder / is . na L ) : TRUE : Wert ist kein NA

( ( !
Slope ) ))
Slope
↳ mean is (
. na
"
"

Bsp bngth ( poll ( Gesch 3J)


-

: = = m
,

"
"

Stichprobe ziehen Sample 33,500 replaa ) # mit


zurücklegen
-

( [ Gesch TRUE
:
poll m
replace
-

wegen
= = _

, ,

Werte which ( Variable Eigenschaft)


ausgeben lassen die
Eigenschaft besitzen mit
-
<
:
,

°
Schleifen : o
Klammern :

for Cdf )) C ) enthält Funktion


in seq C
Argumente
-

:
-

. .

.
. .

.
. .

einer

for ( i 1:30 )
{ × c- r nor m C) [ ] der
-

enthält
Komponenten
:

in Indices von

point sc ) } } Vektoren , Matrizen , Tabellen

leerer Vektor
nunericckngthc ))
{ } bezeichnet Beginn
Zsnhängender
-

Xc
und Ende
-

:
-
. .
:

for ( Variable Wertebereich ) {


Anweisungen
in : bei Schleifen und Funktionen

Anweisung }


Funktionen .

Bsp Varianz Varianz function ( x) Quadrat sammelt) llengthlx) 1)


-

. : c- -

bsp < -

< ( 12,3 )

Varianz ( bsp )

t Test erstellen CD
° -

o
Matrix
[1 ] . .
. .

qt CO 99 af ) # 99% Quantil der t


-

,
-

Verteilung Vektor : Bc -

< ( 12,3 , 4) Es . .
.
.

pt ( t df ) # kumulative Wahrscheinlichkeit t umwandeln Bc matrix ( B


spalten
von
, :
2) # 2 Zeilen und
-

, n row =

1- pt ( t , df ) # Irrtums wahrscheinlichkeit einseitig


-

Band summen :X tabk CB , 1) # für Zeiten


margin 1
für
:
<
Spalten
c- .
,

2 pt ( t, df )) # zweiseitig
-

-
.

"

t .

fest ( Werte alternative


"
two sided .
)
,

d Wahrs küitsdichle Waters random


:
piken q
: Quant il r :
.
. .
Lösungen der Aufgaben zettel

7 Wahres berechnen Messwerten oder Null ?


. in R für das Auftreten von
negativen
CO mü
Sigma)

pnorm
"
, ,

"
2. für positive Messwerte bei normalverteilter Gg ?
17=901

⇐ 1
=

1-
pnorn ( ) Z
=

→ O , µ ,
o z z

kritischen für
3. Wert bestimmen für f-
Verteilung und df 0,0005
=

in R ,
eine ← =
0,1% =
22

qf ( O .
99995 ,
22 )
A - E =
0,9995 ,

¢
Anweisung 95% F- Freiheitsgrade auszugeben ?
um Quantile einer
Verteilung mit 75 oder 10

qchisq ( 0.95 ( 15,20 ) )



, <

5- 99% Standard
Anweisung um 95% , ,
99,9T .
Quantico einer
normalverteilung ausgeben

qnorm ( c ( 0.95 ,
0.99 ,
0-999 )
,
0
,
1)
6.
gleicher teilte Zufallsvariable im
Umfang von 1000 Werten in Intervall von ( O
,
10] in R erstellen

vunif ( 1000 ,
0 ,
10)

7. Wortes einlesen Unterverzeichnis


pace Datei
-
: in
"

)
"

Load ( Verzeichnis ( Name .
R Data

Anweisung sind die


8. um Datei so einzulesen ,
dass die
Spalten als Variablen
verfügbar über

Spalten überschriften werden können ?


-

"
"

× c- read tabk ( -

Name .
txt ,
header = T)

attack Lx )

9 Warum
gibt Sc sum C- ) eine
Fehlermeldung aus ?
-
-
-

funktioniert Variablen mit den Typ und nicht bei character


integer

sum c ) nur bei numeri und

die
gesamten
Wie kann Variable ersetzen ohne Variable
70 .
man einen
Eintrag in einer neu zuzuweisen


Variable [1] c- neuer
Eintrag
1? Wie kann Einträge Variable 2 die auf der
man alle von Variablen mit ,
die
Eigenschaft besitzen ,

R Konsole lassen verwenden ?


ausgeben ohne Zahlen zu
-

" "

Variable [
Eigenschaft ]

1 Variable = =

Kumulative Summe = Wahrscheinlichkeits summe der Relative


Häufigkeit =
Statistische Wahrsch .

rel Häufigkeiten Klassen breite ergibt Waters dichte


Einbeziehung
der
-

^
-

¥
Är !
Fläche ist 1 -

.
T

×
-

-
Lösungen aus
Übungen

7 2
gegenteilige Aussagen aber beide richtig ,
warum ?

erste
Aussage ist absolute und die relative Absolute und relativen Häufigkeiten

eine zweite eine .

können sich voneinander


unabhängig ändern

2. für werden für Nominalvariablen kann


Variablen : alle
Typen können relative Häufigkeiten bestimmt , Man

keinen Mittelwert bilden

3. Mittlere Änderung der Variable ?



Differenz der Variablen bilden und dann daraus das arithn Mittel -

4. 2 Zahlen ausdenken 5 und unt


mit 8 mit Mittelwert Varianz
Mengen
n =
. von
.


Summe muss 40 sein 5 8 die ersten 7 Zahlen sind frei wählbar und die
wegen
.

8. Zahl Mittelwert
vorgegeben
ist durch den

5. eine Zahlen
Menge
so verändern , dass I = 7 ist und die Varianzen gleich bleibt

alle Zahlen der Zahlern
engen tz rechnen : Mittelwert erhöht aber Varianz gleichbleibend
6. In welchem Bereich der Personen normalverteilter Variable ?
'

liegen 95% bei F und s


gegeben

t und -

2 * s auf den Mittelwert der Menschen rechnen

7. Erkennen einer asymmetrischen Verteilung ohne Mittelwertbestimmung


Mitte Wert und der
symmetrisch ist sollte die bei der Sonne den
niedrigsten
→ es
wenn aus

Hälfte der Variationsbreite


liegen

8. Wie hoch ist die Wahrscheinlichkeit ,


dass bei
gleichbleibender Erfolgsquote nach vier weiteren

Experimenten die gewünschten 4 zusätzliche erzielt


Ergebnisse werden ?

Binovüal
verteilung mit 4 k 4

n =
und =

9. Korrelieren die beiden Größen signifikant miteinander ?



parametrische oder nicht -

parametrische Korrelation .
Test durch Kovarianz

10 Work Datei einlesen im Unterverzeichnis


space
-

.
.

"

)
"

Load C Verzeichnis Name .
R Data

1? Datei so einlesen ,
dass
Spalten als Variablen verfügbar sind über die
Spalten überschriften
direkt werden können
abgerufen
"
"

× c- read . tabkc Name .
txt ,
header = T
)
attack ( x)

K .
Wahrscheinlichkeit berechnen ,
dass aus einer normalverteilten Gg mit µ = Mittelwert und
sd Zahlen werden
• =

negative gezogen

pnorn
CO ,
µ ,
o )

13 .
Standard abw .
der 100 Mittelwerte berechnen und mittlere nel .

Häufigkeit der neg .

Zahlen
sd ( mean )

Mean Cr H )
-
14 For .
-

Schleife : for Ci in
length ( Variable ) {
T c- cum sum ( Variable)
" " " "

)
" "
cat C .
. .

,
i , .
.
.
FC ;] ,
s
In

15 .
kam .
Waters Kurve .
für 8 Klassen ohne Fht . < uns um : Canal c- nuneric CD # leerer Vektor

for ( i in 7: 8) {
( und Li ] c- sum
Ch Ft : i ] ) # Häuf , von 1 bis i

} addieren

16 .

gleichgestellte Menge aus 50 Elementen


erzeugen von 0 bis 10

→ × c-
vunif ( 50
,
0,10 )
ziehen bestimmen wiederholen
daraus n -5
Stichprobe und F das 500 X
-


Mean 5 c- numeric ( 500 ) # Leerer Vektor
for ( i in 7- 500 ) {
neun 5 (i ] c- mean ( Sample (× ,
5 )) # 5 Werte ziehen

77 700 mal nacheinander eine Stichprobe aus normalverteilter Gg .


mit
µ =
10 und a- G- ziehen ,
mit

für jede Stichprobe berechnet werden


I
Häufigkeit negativen Zahlen
a- 20 ,
soll , sd und nel .
der

Mean c- nun eric ( 100 )

Std c- numeri ( 100 )

v. H .
c- nun eric ( 100)

for (i in 1 :
700 ) {
Sample c-
rnorn ( 20,10 , 6)
mean Li ] c-
mean (
Sample )
std c- sd (
sample )
# c- sum ( sample <
03120
gg
. .
Übersicht Tests

2
Stichproben
^
gepaart ungepaart-

a
/ I =

Normalverteilung ? Normalverteilung ?

% Yun % Ein

I I

t Test für W Test


gepaarte s
Varianzen vgl U Test
-
-
-
-
.

¥
""

t Test für
-

ungers .

Welch -
Test

-
>
Stichprobe
2
Stichproben bei Nominal variablen :

lnleruauuariabk t -

Test t Test F Test ( war lest )


Zähl variable binom test
-

-
-
.
-

: -

Korrelation
-

unabhängig Cor .
test :

Wilcox -
Test

ist TEE er
: wenn :-. -

/
-

unabhängig cor . Test

Rangvariabk Wilcox -
Test

Hass #
pained T con
-

= .

Nominal variable Binorüaltest


proptest
? ?
Test
X Test X -

ko-orow.si

Wilcox Test T test : Test für Lage parameter (Mediane. Mittelwert)


-

-
,

Test ( wartest ) Test für


F - :
Streuung
F- Test contest
.
: Test für Korrelation und
Kontingenz
(m : lineares Modell

Binomial , X ? lest Test für Zahl variablen und Verhältnisse


prop
. :

'

Shapiro -

Test ,
Ks -

Test ,
X : Test auf
Verteilung
Abhängig ,
Unabhängig ?

abhängig: -

je 2 Mäuse von jeder Rasse werden verschieden


gefüttert
: senktest

Parallelklassen mit Unterrichtsmethoden Noten


gleiche Bedingung Umgebung
-

vers .
: , man nimmt , an

Vorder u
Hinterflügel Tier
-

pro
.

2 Verfahren Lieferungen getestet Verfahren


-

7 beide
, an :

pro Lieferung jeweils angewendet


unabhängig Gewichte
-

von Kindern ( weiblich ,


männlich )
Test flächen die
zufällig ausgewählt
-

Vers .

,
werden

Trauben sorten
unt und deren
Zuckergehalt
-

Zufällige Paare männlichen und weiblichen Tiere deren


Wurfgröße wird untersucht
-

von :

Versuchs felder mit und


Genmanipulation
ohne
gleiche Bedingungen
-

,
sonst

Powered by TCPDF (www.tcpdf.org)

Das könnte Ihnen auch gefallen