Beruflich Dokumente
Kultur Dokumente
:
pro
: .
Kumulative Wahrscheinlichkeit :
Summe der relativen
Häufigkeit :
Integral der Waters dichte
.
:
sigrid : Waters . summe
Variablen typen
ii
Nomina ( Variable
Eigenschaften
-
Abstand
:
weder
Reihenfolge noch definiert z B. Berufe Konfession Geschlecht , Ja Nein Entscheidungen
-
, .
, ,
.
:: ÷::: :
.
: : ÷: ±:: ÷: :::*
Umwandlung
→
Intervall Ordinaluariabk Intervall werte der Größe nach ordnen und verteilen
in
Ränge mittlere
Rangzahlen möglich
:
von
-
vs
=
zeigen
.
=
Klassen
Integer ( Ganzzahl) character ( Zeichen )
-
:
, nun eric (Dezimalzahl) ,
[ =
:
a¥¥t|
-
gewogener
arithm Mittelwert E- ¥ III.
µ=E]
:
Ei
.
k
.
zander Werte in
das
dazu rechnen
Bsp Durchschnittseinkommen bei asymmetrischer Verteilung ist das arithm Mittel ungeeignet für die Stichprobe gibt systematische
-
:
: .
,
es
Verschiebungen
-
Median (Zentral wert F)
↳
gleich viele und unterhalb des Median Median halbiert die Fläche der Häufigkeits verteilung
Eigenschaften Werte
liegen ober
: -
extremwert
unabhängig
-
Modalwert Ä :
gibt Lage des Maximums der Häufigkeitsverteilung an
nur von
, , _
/×H=§?
ne
harmonisches Mittel Kehrwert des arithm Mittels der Kehrwerte die Variable im Nenner steht
-
; wenn
:
.
Z .
B .
bei Geschwindigkeiten
IXG-nn-f.FI?=CxiXzi...Xn)F-/
-
: es ,
z.B .
Populationsgröße
abweichung ,
IQR ,
Indices H u .
E ,
Variations Koeffizient
: = =
die Fläche
unabhängig vom Mittelwert , wenn Messgröße eine Strecke ist
-
,
dann ist die Varianz eine
ö§E/
|↳AnzahlWer
dann
s :
Freiheitsgrade Summe der Werte 4.5=20 die ersten 4 Werte kann frei festgelegt
-
:
n = 5 :
muss sein man wählen ,
der 5. ist
,
also 4 Freiheitsgrade : n -
: der Varianz an
,
fsn-F.fr/xi-FJ-/
-
bei einer
Normalverteilung
liegen
68% der Werte in ts
, -
t.n-tt.fi
95% in ± ZS
-
Box -
Whistler -
Plot :
wenn Mittelwert und Varianz keine
gute Beschreibung sind : sind Quarzite oder Perzentile informativer
ÄH.tt#fH.............../:t:::::-:
Mied
Häufigkeit
f-
µ -
xnax : Extremwert
Quartier 74 : 25% -
Schritte
-
a.
= Perzentik : 1% -
Schritte in R : Median 4)
. . .
-
-
min
→ 5 Werte
_
' Merkmal
Diversität Index
Streuung maß bei Nominal variablen
-
|H=-;§Piih|
-
k
'
-
→
Extremfall 1: nur eine Klasse bei Amin =
-
Ä ? Ln = O
|E=h
→
Extremfall 2 : k
gleich häufige Klassen : Am a. ×
=
-
E. In (E) = -
k .
¥ Lnl ? )
.
= Lnlk )
,
Eueness
Gleichförmigkeit der
Verteilung durch Normierung auf theor Maximum
-
: .
Wahrscheinlichkeitsverteilungen Wahrlich
EFFIE! !!
"
e-
Normalverteilung
:
bei vielen Einflussfaktoren f, =
(
Standardabweichung
Verteilung sieht immer gleich aus
¥Ä6%|
l↳
jeden Wert durchführen
:
{ zz
dnorn ( z 0,1 )
f Cz ) =
¥ .
e in R : ,
↳
für ⇐ = 5% in z -
Tabelle nachschauen die ,
Daten müssen in dem Bereich
lieg
Binoreialuer teilung Entweder oder
:
Ereignisse abhängig und
-
n
p
-
.
,
von
dichotom er
3
Bedingungen : Ja -
Nein Wate :
Ausgang mit
genau
2
Möglichkeiten
voneinander
unabhängige Messungen in R : dbnonlx ,
n .
p
)
dieselbe Wahrscheinlichkeit
bei
gropemnwirdNornalngangena50.ae
fpcky.tk/'pkiqn-k(E)=5.kY!p--Wahrs
fürsorgerischer
" "
= 1- P k =
Anzahl günstig
„
(f) se.IT II
8 !
Beispiel
=
:
bleibt
gleich
=
!
=
.
z immer
p
=
.
( KZ 4)
mindestens 4 (also 456,7 8) 100%
plk :O) plh 1) plh 2)
plh =3 ) Gegenteil berechnen
= →
-
: - = -
p
, = -
Aufgabenstellung : Wah
.rs .
für Stipendien an
1<=7 Männer von n -10 Stipendien mit 200 Männern von 1000 Personen Cp )
Erfolgsquote von
Experimenten : 8 weitere
Experimente n = 8
,
und 1<=4
"
"
,
=
two .
sided )
z.B binom Test Cc ( Häufigkeit 1
Häufigkeit 2) 314 ) oder binom Lest C
Häufigkeit ? h 314 )
p p
-
= =
,
- .
,
.
Theoretische vs
Empirische Verteilungen
:
.
/se
=
: > an
-
für
,
normalverteilte variablen
?
anti ab
proportional 30
gilt
-
se zu n n > :
→ Sta abci
Vertrauensbereich
¢
des
.
Mittelwerts kleiner
Is]
wird bei
großen n
-
±
schwankt kleinen stark stabil ? gg
Varianz bei sehr ab -30
-
n , n
-
einer
Gleichverteilung :
,
bleibt -
|
als in R :
/Eüheitsg
-
|
for (df in seq(3,31,2)){
-
Stichprobe ziehe 7 Stichprobe und a [i] <- mean (sample (Gr, k, replace = T)
x <- rnorm (df+1, mean= 10, sd = 2) ← }
/
berechne
points (df+1, var(x)) µ }
•
Zeus " und
liebeskranken ←
}
jgna.no/
} Schleife 1: Stichprobengröße k, leeren Vektor
!ö
varianz besinnen erzeugen
Schleife 1 mit Freiheitsgraden, Schleife 2: Stichprobe ziehen und Mittelwert
berechnen
Schleife 2: 30 Stichproben ziehen,
95% Konfidenzintervall bestimmen
Varianz berechnen und als Punkt einzeichnen
¥
¥
#irgend /-
¥5 s
)
nein
¥
¥
Ende
Ende
Kovarianz :
Pr
↳ oduktden Mittelwerten .
fows-n.IE?icxi-xs.ci-F)-I=ss Ä""ÄÄ?!¥
-
" oder
an.
Korrelation Kovarianz Mittel der
:
geteilt durch
geom
.
Varianzen nx oder n ,
couC in R corl )
korlxiyj-x-y-SF.TT
SSX t
: . .
.
. . .
.
pearson )
Bestimmtheit > Maß ?
r .
Anteil der erklärten Varianz ,
|r?6r4/
-
°"
""
"
-
gruppen
keine formale Korrelation sich Größen
-
keine kausale
Abhängigkeit der 2
Größen trotz echter Korrelation , sondern
-
Größe möglich .
" "
,
unabhängige Ereignisse erwarten würde :
unabhängig voneinander ?
ändert sich mit Stichproben umfang Anzahl der und Zeiten F- Werte nicht miteinander vergleichbar
,
Spalten :
① ②
X Y Geilen Plz )
Tabelle
Kontingenz -
: -
Esse ¥0 0,54
1- Rand sannen bilden
Z
erwartete
Häufigkeit
.
.
Erwartet
- -
2- berechnen
µ .
Beobachteten E -
-
7
z
. -
.
-
spalten
)
pcssfo.se/-./-./-
(B
T
in R :
chisq .
fest CB df ) ,
qchisq ,
pchisq
°
Anzahl Freiheitsgrade :( Zeilen anzahl 1) -
.
( Spalten anzahl
-
1)
°
Irrtums wahrscheinlichkeit 5% °
Ho :
Variablen sind unabhängig
Tabelle 55.7
°
f) it :
X ( df ,
a
)
Hst >
XI.it : Hs annehmen Niest < X
?
nit :
Ho beibehalten
Vergleich Kontingenzwerfen Kontingenz Koeffizienten
-
von . über
| Teilen
-
×
? m spaeten
,
m =
minlzcs ) zwischen 0 und 1
'
/a=µ¥
Cramer sehe Index
-
Nicht -
je ähnlicher die
Fangreihenfolge desto stärker die Korrelation
-
Vorgehen 1.
Ränge vergeben gleiche Werte erhalten mittleren
-
: :
Rang
2.
Rang differenzen bestimmen
3. Quadrate der Differenzen bestimmen und Sonne daraus bilden
4. Formel verwenden
|rs=1
-
'
einmal betrachten
Edi
: n nur
G.
,
" "
grafisch bestimmen ?
-
: n
Wertepaare verbinden
2. Über No ( diskordant
Kreuzungen zählen Paare)
% to
-
80 zoo
3. n und ND einsetzen
)
" "
in R
4.NO/T--1-n-ln-X/n
-
cor
mit 0,5
gezählt
=
,
,
lineare
Regression :
Abringen
abhängige unabhängige und Variabkimanschließtvonderllnabhängigenaufdie
-
× :
y :
Mittelwert
sunmederfehlerquadrate.in
,
¥÷÷i'
byx ←
E- I f) Xi F- LE
F- 1
*
§ ( E -
^5 rein .
÷ . . i. ⇐ st :
=
→ /
↳y - Achsen abschnitt ↳ „ =
a
, Regression Koeffizient von y nach X
→ -
F
¥ E ( E F)
'
sj
-
: Xi =
Bestimmtheit snaß
-
ß =
2 Modellvarianten fehlerhaft
abhängige Variable richtig
-
Y nach
Regression ist
: : von ×
Steigung SS Kovarianz
-
:
=
Varianz
SSX ×
in R : ( m ( Y -
X) # Twitch modelliert als Funktion von X
XD # berechnet
pnedictllm ( Y -
vorhergesagte
Werte für Y
von n
.
-
,
Urteilende Statistik
Hypothesen :
: in
Alternativhypothese Unterschied
H> : vorhandene ist
größer als man
aufgrund zufälliger Variation erwarten kann
=
p oder a
:
von =
€ -
Statistik Verhältnis
:
von Maßzahl zu ihrem Standard fehler : kann man auf Mittelwert ,
r , rs , m und µ beziehen
>
Stichprobe :
tU
yg.ch#zweutdergfandardab
teilt Abstand von theor Wert durch .
den Standard fehler des Schätzwert
g £ T Standard normalverteilung an
-
Verteilung an
e
p
df
Freiheitsgrade der df nicht ist , nimmt nächst kleineren df
1
eingetragen den
° =
n -
wenn man
a
°
Tabelle : E -
Tabelle S 1 -
exakter Emt :
über Quantil der Prüfer
Teilung
a
Ho Mittel unterscheidet Verteilung nicht Normalverteilung qtlp
°
: im sich von in R :
df ) =
,
r
t test ( X
"
in R
"
:
.
t
ttest >
tkr.it : Ho verwerfen ,
A1 annehmen pa-ired-TRUE.var.egua-l-FAL.SE)
tTest <
tkr.it Ho annehmen A1
:
,
verwerfen war .
equal = TRUE ,
Korrektur berechnung abschaltet
2
unabhängige Stichproben : Differenz
geteilt durch Standard fehler der Differenzen
|
s>
-
:
, z
so
=
§.(I{z-K Ä :
Schätzer der Mittelwerte
5) Varianz
s
gemeint
°
df =
n > tnz
-
¥
.
, annehmen in R : t .
n
,
-
tTest <
tkr.it beibehalten , Hp ablehnen
g Test
Voraussetzung für parametrischer Test für
→
t - :
normalverteilte Variablen
e.
Varianzen
homogenität gleiche : Varianzen
:
F Test Fisher Test auf Varianzen homogenität Fla
Verteilung
→
in R df1 dfz )
-
: : :
-
, ,
/f=←/
-
war ,
CXZ) o
df =
n
-
5
Fragen t Test
Stichproben gleich Stichproben
→
vor einem
-
4.
unabhängige oder
abhängige Stichproben
5-
Normalverteilung gegeben ?
abhängige Stichproben
}
für
Bedingungen
°
mehrere die
: Daten einen Ort ,
wegen
der
speziellen zsn
hängen Differenzen
weil Korrelation
streuen
die
weniger
Streuung
Zwillingen ,
mit
jeweiligen verringern
Z
abhängige Stichproben :
-
•
df =
n -
YSdct-F.EC/i-Yisd=
e
Ä d- mittlere Differenz °
ttesf > tkrit Hz annehmen
p
=
f
.
P
stand .
abweichung aller d 's : normale Formel
a
Ho mittlere Differenz Null Mittel unterscheiden sich die in R t test ( Y paired TRUE )
ist in Stichproben nicht x
: '
=
:
: , ,
bei
parameter freien Methoden Normalverteilung vorausgesetzt
-
r
ist
→
Median bestimmen *
( pt CK df ) )
zweiseitiger Test 2 1-
+
c-
p
:
,
Rangsunnen -
Tests :
in R : Wikonlest CEM ,
paired =
F)
|U=nincn,Uz|
-
U An =
100 -
R > Uz = 100 -
Rz
n> (m t 1) ( nzt 1 )
nz
h ns.nzt-z Rs ns.nzt-z Rz
-
= -
!
P
a : 3- einzelne
r o Tabelle :
S .
5
t Ao sind gleich
°
: Median
U
Test
>
Ukrit : Ho beibehalten ,
Hs ablehnen in R : wilcox testlx > .
, Xz ,
paired = F)
niest <
Umit : Ho ablehnen An , annehmen
Wilcoxon Test : W -
-
Test :
für Paar differenzen
,
fested ob Median der Differenzen Null ist
g
l
Vorgehen 1. Differenzen der Wertepaare bilden 2
Ränge vergeben Beträge beachten 0
weglassen
-
: .
: ,
P 4. kleineres
Rang bilden
3.
Wt und W
W nehmen und mit krit Wert berechnen
-
summen -
a o
Tabelle :
5.6
9 Otto
Stichproben unterscheiden sich Mittel nicht
vergleich
-
:
im paired = TRUE
gibt an ,
dass man Paar möchte
7
:
annehmen verwerfen Corre d- =
an dass man
, ,
£ Wtest <
Wkrit : Ho verwerfen ,
Hs annehmen
↳ W ( n .
a)
in R wilcox Test ( x
"
:
. , y ,
alternative = two sided . , p red =
,
=
:
nur in eine
einseitig zweiseitig
Zweiseitiger : .
Regelfall
in R :
p c- 2. ( 1- pt ( K ,
df ))
Fehler
}
:
Fehler :
Ho verwerfen "
obwohl sie
richtig ist
unt .
Konsumenten
Zweiter Art / Beta Fehler Ho beibehalten obwohl falsch ist
-
-
:
.
sie
→
je größer desto kleiner ist
ß weil die Mittelwert schätzung ist
n , ,
genauer
Güte (Power 1- ß Waters Güte
Tests gibt dass Ho zurecht
abgelehnt wird steigt mit
-
eines : .
an , ,
n
von en ,
,
Effekt stärke zB .
Cohen 's d :
|d=ÄJ|
Funktionen in R :
c-
in in
wa s ,
space ,
ausgegeben ,
Variablen im Work space werden nicht überschrieben durch Definition innerhalb der Funktion
Std c- function Lx ) {
Bsp {
-
varianz function ( x)
Lengthlx)
'
c- c-
n
^
( sum ( × 12 ) -
sum ( x)
Zllengthlx ) ) lllengthlx ) -
1) mean c- sum ( × ) In
}
*
Z ))
"
sqrt ( Nn 1) -
sum (( x -
mean )
}
Korrelations Test ist Korrelation
signifikant und
groß parametrisch I
genug?
:
wann r
: r von
|t= -nF
_
Irl
t Test für Maß Korrelations Koeffizienten ist df
-
: = n -2
. df = n
-
2)
Tabelle
)
?
der durch lineare Korrelation erklärt werden
Beispiel Frage welcher Anteil Varianz eine können Cr damit
-
: : m u ss
,
→
f-
-
NF umstellen nach r :
En ) =
0,46 = ¥! ?
I -
1- r
'
0,46-0,463 -
r
'
= 0 I -
0,46
0,46 .
K -
r
?
) = Ir I -
0,465 -
r
?
= -0,46
? ?
0,46-0,46 r =\ r I I -
r r
?
C- 0,46 -
7) = -
0,46 I : C- 0,46-1 )
i =
? Moment :
Mittelwert ,
2. M .
Varianz 3. M Schiefe 4M Wölbung , .
,
.
= 3.
Ao
gemessenen Verteilung entspricht Eigenschaft Normalverteilung
→
:
Eigenschaft X der der X der .
→ 3
.
M .
der Verteilung : Stand -
aber .
ßs=)d!
/p
-
ls.e.pt#-/-Kurt-osis
M3
→
E. ( E)
abw.IS:44?uarlxj!
-
× -
4. M der Stand
Verteilung
→
.
: .
t.IT/
-
→
Kurt Stan lehkr der Wölbung
!!
.
:
t Test
-
Ho
Eigenschaft rslgz der
Verteilung entspricht der
Eigenschaft In der
Normalverteilung
-
t>
gemessenen
:
ftp..fi?).IR-/
-
-
twitter.si .
.
d. f. =
n
-
z )
t >
tkrit :
Ho verwerfen .
An annehmen
t <
tkrit : Ho annehmen H> verwerfen
.
:
× normalverteilt
-
Test : zweier .
: 0 und 7=200 %
" "
pnorm , ,
-
:
in R :
shapiro .
Test ( x )
?
X
Anpassungsfest
-
in R : chisq .
testlx , p =p -
x )
Konfidenzinterv alle
schätzung :
liegt innerhalb des Intervalls um den Schätzwert ,
Intervall
grenzen abhängig von
,
wird -
- Stan aber
/
.
.
tk.it = tlx = 5%
,
d. f. = n -
1) E ±
196 .
In
→
bei
großen normalverteilten kann EL 5% ) durch Skalierungsfaktor aus z Tabelle ersetzen z ? 6 bei 4=51
-
n : n > 30 man , n =
„
Fz ,
( Int
p t ± z -
P-%¥ ) f-
rel .
p C1 p)
-
-
nur
für K.in/eruaUe von relativen Häufigkeiten andere Formel als für Intervallvariablen :
Gründe : unt .
jeden Bereich
Fehler sind bei rd .
Bsp welche.
>
→
einsetzen und für t und -
berechnen
"
Ho
"
in R :
. ( × , n alternative =
two sided ,
correet = : rel .
Stichproben gleich
IF
Anweisungen :
if (
logischer Ausdruck ) { # wenn der Ausdruck wahr ist
Anweisung }
# Klammern
geschweifte nur , wenn der Teil
Länger als 1 Zeile
else { # ohne
Argument # wenn Ausdruck falsch ist
Anweisung }
"
"
Bsp
"
"
:
monat ( 1,12 ) mehr als
c- 30
Tage
.
seq , ,
tage c-
cc . . .
) }
Jahrestage c-
nun eric ( 12 ) else cat (
"
ist kürzer In .
"
Jahrestage Ci
-
1) +
tage ( i -
1 ]
( i] ) {
if (
Jahrestage
30 else
tage E)
> = 0
Verteilungen :
Normalverteilung :
+ Er
unif binom nor m
Standardnormalverteilung Cp , µ =
0,0=1 )
Varian zanaly.se :
Fragen :
welcher Anteil der Gesamt uarianz Messfehler zurückzuführen welcher auf Effekt des variierten Faktors ?
-
ist auf ,
unt
Parameter
tragen Varianz bei und (u n ) systematische Abweichungen
→
viel zur
erzeugen
.
Ablauf :
Schätzwert :
äi
geschätzte Abweichung
: :
es
gibt Variabilität zwischen den Faktor stufen : durch den
/-1-1/ äü geschätzter Fehler
E
:
arith
Faktor bedingt und innerhalb der Stufen
zufallsbedingt Mittel aller
:
: .
-
"
wahrer Sachverhalt 3
Gesamt variabilität
:
SQT Werte
zerlegen SQZ SQI
-
in t
#(wert
" "
SQT =
Summe der Quadrate total Ei arith M der ten Stufe
aller Gg .
:
.
- i -
Faktor stufen
ai : wahre Abweichung i -
ten
SQZ =
Summe der Quadrate zwischen den
"
"
eij : wahrer Fehler des j -
-
-
' '
§
?
§ § SQT : ( xij -
E) =
SQZ (Ii -
E) t SQI
lxij
-
Fi )
|
.
|
K
"
Saz :
(§ -
Ä) Sat : Sat -
saz
D-
: :
Parameter einfahtoridle
-
wenn
zufallsbedingte Variabilität größer als faktor -
bedingte V. ist ,
gibt es keine systematischen
MQZ
-
/uaz=I¥ua=
F =
°
F Tabelle -
:
einseitig
→
Ein.it = FI (a)
→
Ftest > Flut :
Ho verwerfen Hr annehmen ,
-
-
abhängige "
"
Tabelle
-
von sunnart C)
Mittlere
✓
KÄME
y.gn.coqo.io#ao*o,os.qyuwaa,/.u.| a.au
-
ÄH
"" -
-
"
SQZ
Faktor ^ " -
1 MQZ
Residual N k -
SQI MQI
Fehler innerhalb
Fehler .ae#pc 0,05 ,
=
schwach signifikant
p
← 1- pf LIEF ,
Cm -
1) (N ,
-
n - k ))
4. Faktor stufen
Voraussetzungen 1. sinnvolle 2.
Unabhängigkeit der Stichproben entnahme Randomisierung des
Experiments
-
: :
,
3. No der
teilung 4
homogene Varianzen
:
qqnornlx) ,
,
-
-
shapiro . lestlx)
H
Kurt osis
)
'
Csunccx 4) Ilengthlxsluarlxsiz 3D
If
:
-
neanc xD -
>
.
.
tgz sqrtczullengthlx ) )
=
:
= -
Mean
> .
qq.sn )
Hartley -
Test (Fnax ) :
wenn sich Fnax und Emin nicht unterscheiden dann unterscheiden , sich die anderen Paare auch nicht
Voraussetzung :
gleiches n für alle Stufen ,
normalverteilte Stichproben
-
F =
Sma ×
Fruit :
En ! (Q) o
F -
Tabelle
Guerre - Test :
Wenn Varianzen aller Faktorstuten gleich sind ,
sollten die absoluten Differenzen von
keine
Voraussetzungen
ldij-lxij-x.CI
-
von
pro
:
,
state
3
Nullhypothese
-
facebook.Fahtorbw.w.Rest-SQT-SQATSQ.rs
| |
SQWTSQI ER Äj E) ( Ii F) # E )] t SQW =
- -
-
-
-
Sij =
r
xijr Zi =
f) Sis Tj =
f) Sij F-
f) Tj
⇐iii)
÷! EI!
-
⇐ -
"" ""
SQW = ( Fr ! Sis )
-
(E) -
SQA -
SQB sah SQT -
SQA -
SQB -
SQW
Restfehler
wenn SQA = SQB : keine Interaktion
-
MQA-n.sk#FLestlAJ=MuIFFkrit(A)--FuII
t.no :)
SI
MQ D=
÷:: :
SQL
MQ , =
µ -
n . K
-
÷
#
.
|
Df Sunsq Mean Sg Fahne Prl F) >
* mit Interaktion
-
Interaktion
-
MQAIMQI
i
A Faktor 1 k -
1 SQA o2 - Mat t ohne
- -
• vor z m
.
> .
? ←
was
man
,
Au In ( aovl ))
°
SQW
W -
B .
µ w
www.a , in R :
summiert . .
-
.
.
F - - .
\
Isis pc
-
1- pf # -
value ,
df Residual )
,
s
: einen
einer
konstant
7. Ceteris
paribas Prinzip -
: unbekannte Faktoren halten
2.
Wiederholungen :
Schätzwert werden
genauer
3. Randomisierung verringert : systematische Fehler
4.
Blockbildung verringert : Variabilität innerhalb der Stufen
5.
Faktorielk Experimente
6.
Symmetrischer Aufbau :
verringert
Chance für falsche
Schlussfolgerungen
" "
: - : a :
II.IT/tIuitCa.N-k
-
- tposthoc =
-
¥Ä(¥) IMQuergl.tn
-
SQv
Zerlegung
-
von saz :
M vergl .
F =
-
Tikrit (a ,
m -
1 ,
N k)
-
MQI
"
ho
post Test : a
posteriori :
nach Versuch ,
erst anhand von
Ergebnis konzipiert
Bon ferrari Korrektur
"
Risiken
-
2
vergleichs bezogenes Risiko a und multiples Risiko a
-
: :
E
'
a =
µ=j|
-
:
-
Wichtiges aus den Lektionen
Allgemeines
°
Verlauf Befehle
Workspaa Liste aller Objekte abrufen der abrufen history ( )
-
( sc )
-
:
: : :
"
"
alles löschen in Liste List : rm ( List = Lsc ) ) Verlauf laden : Load history C . .
. fxf
Klein und
Großschreibung beachten kein Leerzeichen Variablen nahe Länge lengt.tn )
-
in Cz
-
-
:
,
Hilfe :
helplmean ) oder ? Mean
: nahes
•
Datentypen :
° :
Wurzel 10^0.5
-
:
x. + c-
-
: c- :
.
Funktion Dezimalzahl
-
( :
-
e e
xp sum vec
-
: von :
Ganzzahl : integer
-
.
:
Mean ve
Boolesche Variable :
Logic al
Cognac 8)
-
Histogramm histlx )
-
=
:
.
pro ,
pro ,
Farben : O :
weiß 1 : schwarz 2 : rot 3:
grün
4 :
blau
5 6: 7
Magenta gelb
: :
cyan
: hist ( x .
freq = FALSE ,
col =3 )
" "
" "
freq Unterschrift
Beschriftungen hist ( × 4 Titel
-
:
,
= FALSE , col =
,
Main =
,
sub =
:
s
pro
= =
:
, ,
curssumlx )
:
, t
" " "
"
" " " "
plotlx , f. typen =
p nur ,
. nur .
.
und ,
n
Punkt symbol :
plot LX , Y ,
ttpe =
b
,
pch = t )
" " "
"
Linien ttp b 1)
:
plot ( × , y ,
t.pe =
, p.ch = *
.
lty =
b
Linien dicke : plot LX , y ,
t.pe =
, pch = *
.
lty = 1
,
lud =3)
Achsen b
Skalierung der : plot ( × , y ,
t.pe =
, p.ch = *
.
lty = 1. ( wd =3 ,
xlin =
( ( O . 95,725) # oder Hin
Koordinatensystem :
plot ( do ,
10J ,
< ( Q1 ) )
"
"
-
leeres K -
s :
plot ( < CO ,
10J ,
< ( 0,1 ) ,
t.pe = n )
" "
× -
Achse y-Achse
-
Titel : fitte ( .
. . )
"
"
: Z ,
0.8 . an
, ,
Col =
, pos
= # rechts
: cc 2 , ,
c ( 0.15 , 0.24
" "
( aol.a.us 2x mal
par ( Ex axis 2 #
-
=
=
,
-
" "
: -
,
, ( h =3 , cool > red u für vertikale
Torten ( cc ))
diagramm
-
:
pie
- -
.
.
.
.
. _ . .
, .
D
"
)
"
( CC Labels cc
Beschriftung :
pie =
- - -
-
.
i
_ . .
.
.
, .
, .
.
.
.
.
.
.
,
.
.
(I
"
) ) ))
"
( cc
"
Farbe Labels
" " " " " "
"
'
-
:
pie
.
.
.
. _
,
- -
.
. . .
,
=
c .
.
.
. .
.
,
.
.
,
.
.
. ←⇐ cc .
.
, .
.
,
.
. . . .
. .
.
. . .
.
. .
. .
:
Beschriftung barplot
" "
CCC ))
" " "
) ! :
"
cc
-
nam.es
:
arg =
. .
.
. .
.
. . .
.
. .
.
.
.
. .
.
. . .
.
"
Legende
" " " " " "
)
"
text (
mit
Legend
:
-
.
= < . .
, .
.
.
. .
. .
.
Box -
Whistler -
Plot :
7. Wertebereich erzeugen : +1=1 :
700 +2=50 : 150
))
" " "
"
2.
Beschriftung : boxplot ( x ? xz , namens = < ( . .
.
. .
•
Daten einlesen bei txt :
read .
table bei R .
Data : Load .
immer einer Variable zuordnen
"
X
"
) oder /
" "
-
"
"
:
.
,
- T
:
row.name s = 1
und ,
: a-
7 einlesen attack
-
2 3. 4.
-
nahes sunnary
2. Variable )
c- Scan C . .
Variable
Eingabe
-
c-
rep ( Zahl , Anzahl ) # replicate wiederholt die
Datenzugriff
•
bis [5 75 , ] # Zeile
-
von -
: worms : 5 bis 15
:
Worms > <
,
: : :
,
in : in .
: :
( ( !
Slope ) ))
Slope
↳ mean is (
. na
"
"
: = = m
,
"
"
( [ Gesch TRUE
:
poll m
replace
-
wegen
= = _
, ,
°
Schleifen : o
Klammern :
:
-
. .
.
. .
.
. .
einer
for ( i 1:30 )
{ × c- r nor m C) [ ] der
-
enthält
Komponenten
:
in Indices von
leerer Vektor
nunericckngthc ))
{ } bezeichnet Beginn
Zsnhängender
-
Xc
und Ende
-
:
-
. .
:
Anweisung }
•
Funktionen .
. : c- -
bsp < -
< ( 12,3 )
Varianz ( bsp )
t Test erstellen CD
° -
o
Matrix
[1 ] . .
. .
,
-
Verteilung Vektor : Bc -
< ( 12,3 , 4) Es . .
.
.
, n row =
2 pt ( t, df )) # zweiseitig
-
-
.
"
t .
"
2. für positive Messwerte bei normalverteilter Gg ?
17=901
⇐ 1
=
1-
pnorn ( ) Z
=
→ O , µ ,
o z z
kritischen für
3. Wert bestimmen für f-
Verteilung und df 0,0005
=
in R ,
eine ← =
0,1% =
22
qf ( O .
99995 ,
22 )
A - E =
0,9995 ,
¢
Anweisung 95% F- Freiheitsgrade auszugeben ?
um Quantile einer
Verteilung mit 75 oder 10
5- 99% Standard
Anweisung um 95% , ,
99,9T .
Quantico einer
normalverteilung ausgeben
→
qnorm ( c ( 0.95 ,
0.99 ,
0-999 )
,
0
,
1)
6.
gleicher teilte Zufallsvariable im
Umfang von 1000 Werten in Intervall von ( O
,
10] in R erstellen
→
vunif ( 1000 ,
0 ,
10)
)
"
→
Load ( Verzeichnis ( Name .
R Data
"
"
→
× c- read tabk ( -
Name .
txt ,
header = T)
attack Lx )
9 Warum
gibt Sc sum C- ) eine
Fehlermeldung aus ?
-
-
-
die
gesamten
Wie kann Variable ersetzen ohne Variable
70 .
man einen
Eintrag in einer neu zuzuweisen
→
Variable [1] c- neuer
Eintrag
1? Wie kann Einträge Variable 2 die auf der
man alle von Variablen mit ,
die
Eigenschaft besitzen ,
" "
Variable [
Eigenschaft ]
→
1 Variable = =
^
-
¥
Är !
Fläche ist 1 -
.
T
×
-
-
Lösungen aus
Übungen
7 2
gegenteilige Aussagen aber beide richtig ,
warum ?
erste
Aussage ist absolute und die relative Absolute und relativen Häufigkeiten
→
eine zweite eine .
→
Summe muss 40 sein 5 8 die ersten 7 Zahlen sind frei wählbar und die
wegen
.
8. Zahl Mittelwert
vorgegeben
ist durch den
5. eine Zahlen
Menge
so verändern , dass I = 7 ist und die Varianzen gleich bleibt
→
alle Zahlen der Zahlern
engen tz rechnen : Mittelwert erhöht aber Varianz gleichbleibend
6. In welchem Bereich der Personen normalverteilter Variable ?
'
Binovüal
verteilung mit 4 k 4
→
n =
und =
parametrische Korrelation .
Test durch Kovarianz
.
.
"
)
"
→
Load C Verzeichnis Name .
R Data
1? Datei so einlesen ,
dass
Spalten als Variablen verfügbar sind über die
Spalten überschriften
direkt werden können
abgerufen
"
"
→
× c- read . tabkc Name .
txt ,
header = T
)
attack ( x)
K .
Wahrscheinlichkeit berechnen ,
dass aus einer normalverteilten Gg mit µ = Mittelwert und
sd Zahlen werden
• =
negative gezogen
→
pnorn
CO ,
µ ,
o )
13 .
Standard abw .
der 100 Mittelwerte berechnen und mittlere nel .
Zahlen
sd ( mean )
→
Mean Cr H )
-
14 For .
-
Schleife : for Ci in
length ( Variable ) {
T c- cum sum ( Variable)
" " " "
)
" "
cat C .
. .
,
i , .
.
.
FC ;] ,
s
In
15 .
kam .
Waters Kurve .
für 8 Klassen ohne Fht . < uns um : Canal c- nuneric CD # leerer Vektor
for ( i in 7: 8) {
( und Li ] c- sum
Ch Ft : i ] ) # Häuf , von 1 bis i
} addieren
16 .
→ × c-
vunif ( 50
,
0,10 )
ziehen bestimmen wiederholen
daraus n -5
Stichprobe und F das 500 X
-
→
Mean 5 c- numeric ( 500 ) # Leerer Vektor
for ( i in 7- 500 ) {
neun 5 (i ] c- mean ( Sample (× ,
5 )) # 5 Werte ziehen
v. H .
c- nun eric ( 100)
for (i in 1 :
700 ) {
Sample c-
rnorn ( 20,10 , 6)
mean Li ] c-
mean (
Sample )
std c- sd (
sample )
# c- sum ( sample <
03120
gg
. .
Übersicht Tests
2
Stichproben
^
gepaart ungepaart-
a
/ I =
Normalverteilung ? Normalverteilung ?
% Yun % Ein
←
I I
¥
""
t Test für
-
ungers .
Welch -
Test
-
>
Stichprobe
2
Stichproben bei Nominal variablen :
lnleruauuariabk t -
-
-
.
-
: -
Korrelation
-
unabhängig Cor .
test :
Wilcox -
Test
ist TEE er
: wenn :-. -
/
-
Rangvariabk Wilcox -
Test
Hass #
pained T con
-
= .
ko-orow.si
-
,
'
Shapiro -
Test ,
Ks -
Test ,
X : Test auf
Verteilung
Abhängig ,
Unabhängig ?
abhängig: -
vers .
: , man nimmt , an
Vorder u
Hinterflügel Tier
-
pro
.
7 beide
, an :
Vers .
,
werden
Trauben sorten
unt und deren
Zuckergehalt
-
von :
,
sonst