Sie sind auf Seite 1von 50

Deskriptive Statistik

Tutorium

|Tutorium deskriptive Statistik SoSe 15|


Folie 1

Vorstellung

• Marie-Christin Schoofs

• marie-christin.schoofs@stud.hn.de

|Tutorium deskriptive Statistik SoSe 15|


Folie 3

Organisatorisches

• Unterlagen auf Moodle


• Bitte bringt die Unterlagen ausgedruckt mit zum Tutorium!
• Lösungen werden nicht online gestellt!

• Da wir nicht wöchentliche Tutorientermine haben & weniger Stunden


werden Übungen zu Hause gerechnet werden müssen
• Jeder ist für seinen Lernerfolg verantwortlich!

• Repetitorium Anmeldung bis zum 13.5.15

|Tutorium deskriptive Statistik SoSe 15|


Folie 4

Fragen

• Gibt es bereits Fragen aus der Vorlesung?


• Sollten Sie Fragen haben, können Sie mir auch gerne eine Email
schreiben

• Was werden wir im Tutorium machen?


• Wiederholung teilweise der Vorlesung
• Weitere Rechenaufgaben und Beispiele
• Beantwortung der auftretenden Fragen
• Klausurvorbereitung

|Tutorium deskriptive Statistik SoSe 15|


Folie 5

Grundbegriffe
• Grundgesamtheit
= alle Individuen, denen ein zu untersuchendes Merkmal gemeinsam ist
• Stichprobe
= repräsentative Teilmenge der Grundgesamtheit
• Stichprobenumfang (n)
= Anzahl der vorliegenden Beobachtungen (Fallzahl)
• Beobachtungseinheit
= eine Person
• Merkmal
= eine Variable (Kenngröße), die verschiedene Werte
Merkmalsausprägungen) annehmen kann
• Merkmalsausprägung
= verschiedene Werte eines Merkmals

|Tutorium deskriptive Statistik SoSe 15|


Folie 6

Merkmale

• Qualitativ
= Merkmalsausprägung von unterschiedlicher Art oder Qualität (Worte)
• Quantitativ
= mess- oder zählbare Merkmale
• Stetig
= beliebige Merkmalsausprägung; Stufenlos
• Diskret
= abzählbar viele Werte; in Stufen

|Tutorium deskriptive Statistik SoSe 15|


Folie 7

Aufgabe 1

• In Deutschland leben 80 Mio. Menschen. Davon leiden 1,4 Mio. an Krebs.


In einer Studie werden 500 Krebskranke Deutsche genauer befragt.
Erhoben werden die folgenden Daten: Alter, Geschlecht, Anzahl der
tumorinduzierten OP‘s, Blut-Werte, Krebsart und Temperatur.
• Ermitteln Sie die Grundgesamtheit, den Stichprobenumfang, die
Beobachtungseinheit, das Merkmal und die Merkmalsausprägung.

• Welche Merkmale sind qualitativ, quantitativ stetig oder quantitativ


diskret?

|Tutorium deskriptive Statistik SoSe 15|


Folie 8

Lösung Aufgabe 1

• Grundgesamtheit: 1,4 Mio. Menschen


• Stichprobenumfang: 500 Krebskranke Deutsche
• Beobachtungseinheit: Krebskranke
• Merkmale:
• Alter (quantitativ diskret)
• Geschlecht (qualitativ)
• Anzahl der tumorinduzierten OP(quantitativ diskret)
• Blut-Werte (quantitativ stetig)
• Krebsart (qualitativ)
• Temperatur (quantitativ stetig)

|Tutorium deskriptive Statistik SoSe 15|


Folie 9

Häufigkeiten

• Absolute Häufigkeit
= Anzahl gleichartiger Beobachtungen
• Relative Häufigkeit
= abs. Häufigkeit/ Stichprobenumfang
• Kumulierte absolute Häufigkeit
= Kumulierte (aufsummiert) absolute Häufigkeiten
• Kumulierte relative Häufigkeit
= Kumulierte relative Häufigkeiten

|Tutorium deskriptive Statistik SoSe 15|


Folie 10

Aufgabe 2

• In einer Studie wurden 50 Personen bezüglich Ihres Familienstandes


befragt.
• 1= ledig; 2= verheiratet; 3= geschieden; 4= verwitwet
• Berechnen Sie die absolute, relative und kumulierte Häufigkeit!

|Tutorium deskriptive Statistik SoSe 15|


Folie 11

Lösung Aufgabe 2

|Tutorium deskriptive Statistik SoSe 15|


Folie 12

Zentrale Tendenz

• Arithmetisches Mittel bzw. Mittelwert (x)


= Summe Einzelbeobachtungen/ Fallzahl
• Median
= mittlerer Wert der Größe nach geordneten Einzelbeobachtungen
• Modalwert
= häufigste Merkmalsausprägung
• Quantile

|Tutorium deskriptive Statistik SoSe 15|


Folie 13

Quantile

|Tutorium deskriptive Statistik SoSe 15|


Folie 14

Streuungsmaße

• Spannweite
= Maximum - Minimum
• Varianz
= mittlerer quadratischer Abstand der Beobachtungen vom
arithmetischen Mittelwert
• Interquartilabstand
= 3. Quartil – 1.Quartil
• Standardabweichung
= Positive Wurzel aus der Varianz

|Tutorium deskriptive Statistik SoSe 15|


Folie 15

Aufgabe 3

• Siehe Übungsblatt

|Tutorium deskriptive Statistik SoSe 15|


Folie 16

Wiederholungsfragen

• Welche Arten von Merkmalen gibt es? Nennt zu jeder Art ein Beispiel!
• Wie groß ist der Stichprobenumfang?
• Stellt mit Hilfe der Buchstaben das arithmetische Mittel dar!

• Wie berechnet man den Median?

|Tutorium deskriptive Statistik SoSe 15|


Folie 17

Hausaufgabe

• Besprechung der Hausaufgabe


• Klären der aufgetretenen Fragen

|Tutorium deskriptive Statistik SoSe 15|


Folie 18

Lineare Regression
Korrelationskoeffizient r
• Maß für den linearen Zusammenhang
• r kann folgende Werte annehmen: -1 < r < 1
• Je besser die Punkte einer steigenden (fallenden) Graden folgen, desto
näher an +1 (-1) liegt r.
• r nahe 0, wenn große Streuung
• Merken:
Wert von r Linearer Zusammenhang
+ 0,1 - 0,1 nicht nennenswert
+ 0,3 - 0,3 gering
+ 0,5 - 0,5 mäßig
+ 0,7 - 0,7 deutlich
+ 0,9 - 0,9 stark
+ 1,0 - 1,0 perfekt

|Tutorium deskriptive Statistik SoSe 15|


Folie 19

Bestimmtheitsmaß r²

• r² ist ein lineares Maß


• r² beschreibt, welcher Anteil der Varianz des abhängigen Merkmals sich,
statistisch gesehen, aus der Varianz des freien Merkmals erklären lässt
• Indirekt gibt es den Zusammenhang zwischen der abhängigen und
unabhängigen Variablen an
• Merken:
r Bestimmtheitsmaß r² Erklärte Varianz
1 -1 1 100%
0,9 - 0,9 0,81 81%
0,5 - 0,5 0,25 25%
0,2 - 0,2 0,04 4%
0 0 0 0%
|Tutorium deskriptive Statistik SoSe 15|
Folie 20

Regressionsgerade

• Zeichen von Regressionsgeraden von y (abhängige Variable) auf x


(unabhängige Variable)
• Gerade auf die Punktwolke beschränkt zeichnen
• Geradengleichung: y=bx+a

|Tutorium deskriptive Statistik SoSe 15|


Folie 21

Residuen

• Senkrechter Abstand einer Y-Beobachtung von der Regressionsgeraden

|Tutorium deskriptive Statistik SoSe 15|


Folie 22

Übungsaufgaben zur Korrelation und Regresseion

• S. Übungsblätter Aufgabe 4

|Tutorium deskriptive Statistik SoSe 15|


Folie 23

Regression mit SPSS

• Auszug aus dem Ausgaben-Fenster von SPSS zur Regression:

• Wie lautet die Regressionsgerade?

|Tutorium deskriptive Statistik SoSe 15|


Folie 24

Regression mit SPSS

• Geradengleichung: y=bx+a
• a= y-Achsenabschnitt
• b= Steigung der Geraden

a
b

|Tutorium deskriptive Statistik SoSe 15|


Folie 25

Regression mit SPSS

• Übung 6
• Übung 5 als Hausaufgabe!!

|Tutorium deskriptive Statistik SoSe 15|


Folie 26

Interpretation der Regression

|Tutorium deskriptive Statistik SoSe 15|


Folie 27

Interpretation der Regression

|Tutorium deskriptive Statistik SoSe 15|


Folie 28

Epidemiologische Maße
Maße der deskriptiven Epidemiologie

|Tutorium deskriptive Statistik SoSe 15|


Folie 29

Epidemiologische Maße
Zusammenhang Exposition und Erkrankung

• Wichtig ist hierbei die Unterscheidung der verschiedenen Kennzahlen


für die unterschiedlichen Studientypen!
• Querschnittsstudie
• Kohortenstudie mit kumulativen Inzidenzdaten oder mit Personenzeitdaten
• Fall-Kontroll-Studie
• Querschnittsstudie
• Prävalenz, relative Prävalenz, Odds Ratio
• Kohortenstudie mit kumulativen Inzidenzdaten
• Kumulative Inzidenz, Risikodifferenz, Relative Risiko
• Kohortenstudie mit Personenzeit-Daten
• Inzidenzdichte, Inzidenzratendifferenz, relative Inzidenzrate
• Fall-Kontroll-Studie
• Odds Ratio
• Übung 8

|Tutorium deskriptive Statistik SoSe 15|


Folie 30

Epidemiologische Maße
Störgröße (S) - Confounding

• Verzerrung der Assoziation zwischen der Exposition und der Krankheit


auf Grund einer Störgröße, welche sowohl mit der Exposition als auch
mit der Krankheit assoziiert ist

|Tutorium deskriptive Statistik SoSe 15|


Folie 31

Epidemiologische Maße
Effektmodifikation

• Variation der Expositions-Erkrankungs-Assoziation zwischen


verschiedenen Untergruppen der Studienpopulation
• Hier kommt es bei Nicht-Berücksichtigung nicht zu einer Verzerrung,
aber wichtige Informationen könnten unberücksichtigt bleiben

• Beispiele zu Confounding und Effektmodifikation aus der Vorlesung


• inhaltliche Besprechung

|Tutorium deskriptive Statistik SoSe 15|


Folie 32

Wiederholungsübung Hausaufgabe

• Übung 9 als Hausaufgabe zu nächster Woche

|Tutorium deskriptive Statistik SoSe 15|


Folie 33

Einstieg

• Wiederholungsfragen:

 Was ist der Unterschied zwischen einem Confounder und einem


Effektmodifikator?
 Nennen Sie die Formeln für Prävalenz, kumulative Inzidenz und
Inzidenzdichte?

• Bersprechung Übung 9

|Tutorium deskriptive Statistik SoSe 15|


Folie 34

Überlebenszeitanalysen

• Mit Hilfe von Überlebenszeitanalysen können z.B. folgende


Fragestellungen geklärt werden:

• Wie lange überleben Pat. nach einer Herztransplantation?


• Wie lange überleben Krebspatienten ab Diagnosestellung?

|Tutorium deskriptive Statistik SoSe 15|


Folie 35

Überlebenszeit

• Was versteht man unter der Überlebenszeit?

= Zeit von Beginn der Beobachtung (Eintritt in die Studie) bis


Eintritt des Zielereignisses (z.B. Tod, Herzinfarkt, Rezidiv…)
oder bis
Studienende, Austritt aus der Beobachtung („Zensurdatum“)

|Tutorium deskriptive Statistik SoSe 15|


Folie 36

Arten von Überlebenszeitanalysen

• Sterbetafelmethode („Cutler-Ederer-Verfahren“)
• Unterteilung der Beobachtungszeit in definierte Zeitintervalle

• Kaplan-Meier-Verfahren
• Zeitabschnitte definiert durch Eintritt der Zielereignisse,
jeweils variable Länge

 Übung 10 und 11

|Tutorium deskriptive Statistik SoSe 15|


Folie 37

Hausaufgabe

• Besprechung der restlichen Aufgabe 10 und der Aufgabe 11

|Tutorium deskriptive Statistik SoSe 15|


Folie 38

Statistisches Testen

• Ist darauf ausgelegt, Annahmen bzw. Hypothesen für eine


Studienpopulation bzw. für einen Datenkörper mit der Grundgesamtheit
zu vergleichen
• Das Ergebnis eines statistischen Test liegt mit einem bestimmten
Sicherheitsgrad vor
• Der Unterschied zwischen der Studienpopulation und der
Grundgesamtheit kann bedeutsam, also signifikant sein oder eben nur
zufallsbedingt durch die ausgewählte Studienpopulation hervorgerufen
werden und deshalb als unbedeutsam eingestuft werden
• Für unterschiedliche Zwecke sind verschiedene Test entwickelt worden

|Tutorium deskriptive Statistik SoSe 15|


Folie 39

Statistisches Testen
alltagsnahes Beispiel

• Der Verkäufer in einem Lebensmittelgeschäft bietet einem verschiedene


Käsesorten zum Probieren an und sagt zu dem einen besonderen Käse:
„Testen Sie den mal, der schmeckt sehr gut!“
• Das entspricht im Prinzip der Hypothese
• Die Stichprobe entspricht den genommenen Bissen. Ist die Stichprobe
ausreichend groß, können wir unser Urteil ziemlich genau fällen
• Schmeckt der Käse, wird die Hypothese aufrecht erhalten
• Schmeckt der Käse nicht, wird die Hypothese verworfen
• Ist das Ergebnis unklar, muss der Test mit einer größeren Stichprobe
wiederholt werden

|Tutorium deskriptive Statistik SoSe 15|


Folie 40

Statistisches Testen
Hypothesen und Signifikanzniveau

• Hₒ = Hypothese
• H1 = Gegenhypothese bzw. Alternativhypothese

• Beispiel für Hₒ:


„Die Studenten eines bestimmten Semesters sind durchschnittlich 23
Jahre alt“

• Beispiel für H1:


„ Die Studenten des Semesters sind nicht durchschnittlich 23 Jahre alt“

• Festlegung des Signifikanzniveaus z.B. mit ά gleich 5% oder 1%

|Tutorium deskriptive Statistik SoSe 15|


Folie 41

Statistisches Testen
2-seitig

|Tutorium deskriptive Statistik SoSe 15|


Folie 42

Statistisches Testen
1-seitig rechtsseitig

|Tutorium deskriptive Statistik SoSe 15|


Folie 43

Statistisches Testen
1-seitig oder 2-seitig?

• Abhängig von der Fragestellung!

• Einseitig: > ≥ ≤ <


• Zweiseitig: = ≠

|Tutorium deskriptive Statistik SoSe 15|


Statistische Tests
Zur näheren Untersuchung des Zufalls

1. Formulierung der Hypothesen:


• Null-Hypothese (H0)
• Alternativ-Hypothese (H1)

2. Bestimmen eines Signifikanzniveaus:


• α = Irrtumswahrscheinlichkeit

|Tutorium deskriptive Statistik SoSe 15|


Statistische Tests
Zur näheren Untersuchung des Zufalls

3. Ablesen des p-Wertes


 kleinstmögliches α, zu dem H0 abgelehnt werden kann

4. Ergebnis:
Vergleich von α- & p-Wert
 p < α = H0 kann abgelehnt werden!
 p > α = H0 kann nicht abgelehnt werden!

|Tutorium deskriptive Statistik SoSe 15|


SPSS

|Tutorium deskriptive Statistik SoSe 15|


Beispiel
Prinzip eines statistischen Tests

• Bekannt: mittleres Geburtsgewicht gesunder Kinder


3500g
• Ein Arzt hat die Vermutung, dass Neugeborene,
deren Mütter während der Schwangerschaft einem
bestimmten Risiko ausgesetzt waren, im
Durchschnitt weniger wiegen.
• Er misst das Geburtsgewicht von 20 „Risikobabys“
und vergleicht deren mittleres Geburtsgewicht mit
den 3500 g.

|Tutorium deskriptive Statistik SoSe 15|


Beispiel - Vorgehen
Prinzip eines statistischen Tests

• Formulierung der Hypothesen:


‐ Zweiseitige Fragestellung
▫ Es besteht kein Unterschied :
• H0: μ = 3500 g
▫ Es besteht ein Unterschied :
• H1: μ ≠ 3500 g
‐ Einseitige Fragestellung
▫ Kinder wiegen mehr : H0: μ ≥ 3500 g
▫ Kinder wiegen weniger : H1: μ < 3500 g

|Tutorium deskriptive Statistik SoSe 15|


Beispiel - Vorgehen
Prinzip eines statistischen Tests

• Festlegung des Signifikanzniveaus


▫ z.B. α = 5%

• Ergebnis:
▫ z.B. p = 3%
▫ z.B. p = 7%

• Aussage:
‐ p > oder < als α ?
‐ H0 ablehnbar ja/nein?

|Tutorium deskriptive Statistik SoSe 15|


Folie 50

Übung zum statistischen Testen

• Bitte bearbeitet Übung 13!

|Tutorium deskriptive Statistik SoSe 15|