Sie sind auf Seite 1von 20

Deskriptive Statistik

Kap Einführung
1 :

① variablen
Merkmalsträger
Merkmale
9
1 1 Melemat (2 B Intelligenz)
-
.
.

. .

12
Merkmal- isolierte
Eigenschaft eines
größeren Ganzen, z B
Intelligenz Farbe
·

,
Feststellung der
.

um

Beobachtung
&
mind 2
Ausprägungen
-

Ausprägung
=

hat Zustand Farbe


Ausprägung
>
z B IQ 115 -n
-
=

ga
= =
. .

, ,
-

> hat mind


. 2
Ausprägungen
-

kann
Objekte , bei Ausprägung feststellen Merkmalsträger
-

alle denen man die =

auch echte
Beobachtung Verhaltensbeobachtung
- =

Feststellung der
Ausprägung ,
z .
B .
Auskünfte in
Fragebögen oder

↳ sämtliche bei
Beobachtungen Informationssammlung-Daten
Statistik Methoden zur Sammlung &
Analyse Daten
·

=
von

. 2
1 . Variable

Merkmals werden Zahlen Realisations/werte (symbolisiert mit Kleinbuchstaben y)


Zugeordnet
Prägungen
·

eines =
X
,

Definition einer Variablen

Großbuchstaben
>
symbolisiert mit (X, Y)
-

Menge aller
möglichen Realisationen-Wertebereich
·

2
mögliche Definitionen
Realisatione der Variable & spezifiziert
① extensional zählt alle
auf intentional gibt eine
Vorschrift an die die Variable
eindeutig
: :
,

braucht Merkmal viele die nicht


- man immer wenn
,
zu
Ausprägungen hat
,
man

mehr sinnvoll
aufzählen kann

empirische Feststellung der Realisation eine


Variablen-Messung gemessene Zahlen Messwerte/Ergebnisse
·

- =

Beobachtung Feststellung
der
:
Ausprägung eines Mehmals
, Ausprägung kann beliebige Natu
sein

weiter Cuerbal,
Messung Feststellung des :

bildlich)
einer Variablen we immer numerisch (Musswerte
, , Ergebnisse)

Variablen
2
Typen von

. diskrete Variable
1 : besitzt endlich
viele
feste Werk - werden über Ganzzahlen beschrieben
-

> dichotome Variable : Variablen mit


Genau zwei diskreten Werfen z B Geschlecht (m/w), Bestehen einer
Prüfung (ia(nein)
-

. .

Variablen 2 diskrete Werte Parteizugehörigkeit


polytome mehr als B
- : z
,
.
.

2
. stetige (Kontinuierliche) Variable : kann lunendlich viele beliebige Werte annehme -D werden über relezahlen beschrieben ,
z B
.
.

Körpertemp .

↑ unterscheiden zwischen
Typen von Merkmalen & Typen von Variablen
&
-

stetige Merkmale können


oft nicht beliebig genau gemessen werden :
Diskretisierung durch
Messung ,
z B
.
.
Alter
,
1Q
, Schulleistung ete .

>
Messgerät hinreichend kann, werden empirischer Forschung diskrete Variablen oft als stetig
-

wenn
genau messen in
angenommen

② Shala (Shale)
·

Skale =
Festlegung von Einheiten
,
in denen ein
gegebenes Merkmal
gemessen
wird (Einheiten meist numerisch)
> nur Variablen die auf derselben Shala
gemessen werden sind direkt miteinander vergleichbar , sonst Skalentransformation notwendig
-

, ,

Typen von Skalen

in
qualitativ : Nominalskala
Lunterschiede
aufzeigen Ordinalskala
quantitativ Intervallshala
:

vordernissak
ZahlenSage
eine
GBe
Absolutskala
der unterschiede
aus
Kap 3 :
Ordinalskala -bjektiv selten
Intervacestala ? Ordinalskala
① Definition
-Realisatione
& der Skala sind
Variablen können (natürlich)
Realisationen eine
geordnet werden unterscheidbar
·

·
lassen sich der Größe nach sortieren
Zuordnung
-
der Zahl des Merkmals deren
Ordnung
zu den
Ausprägungen =

. Abstände nicht interpretierbar !


numerische Abstände zwischen Realisationen nicht interpretiebor
·

unter bestimmten
Anwendung von Rechenoperationen Voraussetzungen daubt im Allgemeinen nicht sinnvoll
·

,
-

unterschiedlich
große Realisatione könne als
größer/kleiner interpretict werden Richtung des Unterschieds - wird kodict
·

Beispiel

S I
jehche die Realisation, derto später im
Beziehungsstadium me
6
i

Realisation, desto
je niedrige
"
oder die

(ginge beiden
Zi
zz : 2 -

3 3
Zy : -

75 i 4 -
4

② Zulässige Operationen
·

Aprivalenzrelatione (gleich/ungleich)
qualitative Vergleichsrelationen (größer/kleiner
·

> alleArtenqualitativerVergleich-
ist emaesgroß
ist
-

*
③ Zulässige Transformationen jede beliebige Transformation :
,
so
lang? Transformationsrelation :

und XI
streng monotonen Transformationen Rangordnung Ordnung in
·

alle -D mun erhalten bleiben ! X


mun erhalten bleiben
& -

eng monoton
=

⑪ kritische
Betrachtung -
Zahlenmäßige
bei Ordinalskala e höheren Skalenniveaus könne Intransitivitäten
auftreten Abstände veränderte
uninformativ
·

Intransitivität= nicht bestimmte einzelne Paarunge


Ordnung gilt für
·

angenommene

Beispiel Mensch Hund Ratte Mensch (nach


-> >
Glutamatvergiftung)
: -

Lösung :

Transitivität
-
=
As3

&
Shalenniveaus
Annahme eines
niedrigeren B > C
·

- natürliche
Ordnun unmittelbar caraus

=
mus
Einführung Shalenstufen
·

neuer Voraussetzung
folgen
für Aca
=> wenn das nicht
ist
⑤ gegeben
> Intransitivität
numerische Beschreibung -

5 1 . .

Häufigkeiten
ord Variablen
häufig diskret e endlich
·

Häufigkeitsverteilung n empirische Verteilungsfunktion können bestimmt werden


·


gibt , wie viele Beobachtungen kleiner oder gleich an einer bestimmten Realisation sind

Berechnung :

① Realisationen der Größe nach ordnen

aufsummierte Häufigkeiten
Wert von
X(geordnet) f(X =

Xi) F(X[xi)
X1 f(x) f(xy)
X
2
f(x2) f(x1) f(xz) +

...

YK fi f(x +
f(xz)
+
...
+
f(xy)

Wofür braucht man die


Verteilungsfunktion ?
beantwortet viele Personen haben höchstens oder mind bestimmte Realisation der Variablen erreichen
Frage Wie eine
:
-

↑ (XXi) F(0 6) =
0 768
Vorteilungsfunktion ablesen I ?
=
aus
, .
verhalten sich kompermentär zueinander komplementär zu
#(X >,6) =

C1 -

0, 768 =
0 232
.
↳ Komplemata zu .

F(X = 0
,
6) =
1 -

0. 646
Do it Beta
yourself

① Feststellung Skalenniveau ② deskriphve Statistiken


unten nach oben Median (Daten) QUARTIL INKL (Daten ; 2)/QUANTIL
durchgehen MEDIAN / INKL
=
.
1 : =
·

von . .

(Daten ; 0
, 5)
unterscheidbar ? Ja Nominalskal
· . Mittelwert
2 MITTELWERT (Daten)
Werte -D : =

Werte der nach sortierbar ! Nein .


3 Modalwert MODUS EINF (Daten)
Grüße
: =
.

(natürliche Ordnung) Ordinalshala


Ya-n
·

4
. Min : =
MIN (Daten)
Abstände interpretierbar ? Nein
- 5.
5 Max : = MAX (Daten)
Intervallshala
Ja-d
·

mehrere Quantile berechnen :

6
. Quantie : =
QUANTIL INKL . (Daten ; Prozentangabe) /
③ Warum day Mu
für Ordinalshalen nicht =
QUARTIL .
INKL (Daten ; Anzahl Quartie z B .
.
1)
berechnet werden 25)
2
I
? 1 Quartie =
QUANTIL ($Dalen$ 0


.

, ,

↓ Autoausfällen
Zahlenweile haben keine
eigene Bedeutung 2 Quartil
·

(nicht vergleichbar) S
. Quaril 0 75
,

=> Ordinalshala gibt nur


Reihenfolge an 4. Quartie 1
sO

⑪ Quartie

beantworten also die "Welchen Wert


·
Quantile
geben immer eine
Unterschreitungs-wsh an
,
immer
Frage geben die Pers mit .

an ?
"

Welten maximal
niedrigeren
Personen
bedeutet
niedrigsten weren
>
z B .: das 10 % der mit den
-

,
.

=
QUANTIL INKL
höchstens den Skalenwert
angegeben haben
.

(Daten : 0, 1) = 1 1

welchen Werf mit hohen weren mindestens ?


Gegenteil geben Personen
·
:
an

-
D z B .
· bedeutet das 40 % der Personen mit den höchsten Ween
,
.

=
QUANTIL INKL .

(Daten ; 4) 8 mind 8 angeben


=
1-0 , .

Zwischen die mittleren


welchen Skalenwerten
liegen %?
·

X
-
z B Quantil (Daten ; 0 3)
>
-

mittlere 30 % (z B) .
=
Median = 15
.
.
,

=> untere Grenze :


50-15 =
35 => obere Grenze :
50 + 15 =
65 ① ZÄHLENWENN ( 8) =

-
①- ②
1) 65) E

·
QUANTIL (Daten ; 0, 35) QUANTIL (Daten ;
=
= =
0 =
, -

↳ wie viele Personen


liegen tatsächlich Zwischen den beiden Grenzen ?
=
ZÄHLENWENN (Daten
;
" =
8") -
ZÄHLENWENN (Daten ; "3") /n

(die Leute, die 3


angegeben haben ,
fallen noch in den mittleren Bereiche müssen nicht mit
abgezogen werden)
Abweichungsquadratsumme

- WarmdieQuadrierungifferenzen entsteht , loswerdein


& >
- kommt
vielen stat.
im

-
>
Verfahren vor !

Warum der Mu ?: minimier Summe


,

die bei
Berechnung entsteht
=> bei 2 Stichproben mit unterschiedl .

nicht mehr
QS
vergleichbar
n :

Varianz

mittleres Abweichungquadrat aller n Beob .

Xn - --
Yn vom Mittelwert s2(x) =
& i(X -
* )2
D
erfasst mittlere quadrierte Streuung Mu
-

um
↳a unterschied Zu Q?
·

wenn Datenwert keine Streuung hat ist so sonst immer O

-
,
-

je größer die Streuung , desto größer die Variant


·

anfällig gegenüber Außreißen !


·

je größer die
Streuung ,
desto
größer die Varianz 2
-
-
-

Problem :
Varianz ist nicht äquivariant zu linearen
Skalentransformationen !
&

S
+5

-D
verändert Lage ·
Addition :
ander nichts an

Lösung Standardabweichung
:

-
M
17797 aber nicht
breite
Vor/SD

·Multiplikation
%...,
-- 11
der Konstanten
X - verände SD nur um Konst selbst!
=
.

20050 10 .
=
500

wird breite
10-PVerteilung
·

=> das sollte sich in


Streuungsmaßzeigen !
Problem wird nicht 10 mal so
groB,
: Var
sondern 100 mal so gro
Quadrat
P
wegen
Einschub : dichotome Variablen

·
dichotome Variablen haben
eigente.
nur Nominalskalenniveau
((un)-gleichheit) nach Lehrbuch
Intransitivitäten sind (nahrliche Ordnung als
ausgeschlossen da 2 Auspr der Variable
gibt
-

es nur
,
.

Vorbedingung wird
entsch
-D
gleiche Abstände zwischen Shalenwerten : immer
efüllt Les gibt nur 2) eher
vernachlässigt) Transitivität
Merkmal betrachten
als

=> dichotome Variablen erfüllen Voraussetzungen für Intervallshala e werden oft so


angenomme
welche intervallshalierte Verfahren kann anwenden auf dichotome Variablen ?
·

man

S
>
-

y = 0 + 1 + 1 + 1 +
0 + 1 + 0 +
1 +1

dadurch können auch


n
>
anderen
Mur einer 0/1 alle
Verfahren
-

+1 +
1 0
-
=

1 +1 +1 + 1 + 0 + + 0

M
kodierten angewandt werden
,
die
auf Mur basieren
Datenreihe (SD, QS, Kovaranz Korrelation)
1
vor
Y 20
( f(x) der
,

z f(x)
= + = = ,
= =

M
Ausprägung 1 -
dürfen auch als Prädiktoren in multiple Regression
=> X =

f(x
=
1) eingesetzt werden

Achtung ?: bei Interpretation der Kennwerte-D Ordnung der Skalenwerk hat keine natürliche Bedeutung !

Beispiel
⑥ Grafische Beschreibung :
Box-whisher-Peol

↑ 2 , 58 x SD(y)
Whisher ender
da wo sie ander müssen a -
Y
~
d 2 58xSP(y)

-
M ,

R *
2 58
,
x
SD(x)
V

* Ausreiße
Hier kamen noch ein paar Anwendungsaufgaben (noch nicht rausgeschrieben)

Das könnte Ihnen auch gefallen