Sie sind auf Seite 1von 10

Dateien zusammenfgen

a) Gleiche Variablen, zustzliche Flle anfgen


Nr anpassen: Transformieren Var. Berechnen Zielvar. Auswhlen + X
(X ist Anzahl die bereits in alter Datei besteht- ab wievielter Nr in neuer, angefgter Datei
weitergezhlt werden soll)
Zusammenfgen:
Daten Dateien zusammenfgen (Ausgangspunkt alte datei) Flle hinzufgen
markieren OK

b) Zustzliche Variablen, gleiche Anzahl von Fllen


Schlsselvariable = welche in beiden Datenstzen gleich ist (Fragebogennummer)
Achtung!!: variablen mssen gleiche Reihenfolge besitzen:
Daten Flle sortieren Var die sortiert werden soll auswhlen
Daten Dateien zusammenfgen (Ausgangspunkt alte Datei) variablen hinzufgen
markieren OK
-Ausgeschlossene variable = Schlsselvar = soll nicht zusammengefhrt werden

c) Zustzliche Variablen, unterschiedliche Anzahl von Fllen


s.o.
entscheiden, ob nur Flle mit gleichen Var angefgt werden sollen oder nicht,
Nur die Flle, welche Var. Ergnzen

Dateien importieren
a) Ungeordnete Daten (ASCII):
Datei Textdaten lesen ---- Assistent : vordefiniertes Format NEIN - Weiter
Mit Trennzeichen/feste Breite? nein weiter
In welcher Zeile erster Dateneintrag: siehe Vorschau
Wie sind Flle dargestellt?: jede Zeile = 1 Falle / bestimmte Anzahl von Var. Ist ein Fall
Wie viele Flle importieren?:
Welches Zeichen trennt Var?
Neue Var benennen, format angeben

Diagramme erstellen
Grafik -

Tabellen erstellen
1) Eindimensional
Analysieren Tabelle - . Variable Spalten
Auswertungsstatistik gltige N als Spalten = rel. Hufigkeit Auswahl zuweisen
Titel hinzufgen: Reiter Titel
2) Zweidimensional (ZB Quali abhngig von Geschlecht)
Analysieren Tabelle
In Spalte: 1. Quali 2. Geschlecht
Auswertungsstatistik
Kategorien + Gesamtsummen!
3) Kreuztabelle
Analysieren deskriptive Statistik Kreuztabellen
Erwartete Hfk anzeigen: Zellen Hufigkeiten beobachtet/erwartet
Balkendiagramm: Hkchen setzen

Testverfahren
a) Mittelwert berprfen einfacher t-Test s. Tabelle: Mittelwerttests 2seit.
Analysieren Mittelwerte vergleichen T-Test bei einer Stichprobe Testvar. Auswhlen Optionen:
Konfidenzintervall festlegen
Wenn Intervall fr Mittelwert berechenen: Testwert =0
Wenn signifikanz einens vorgegebenen Mittekwertes bestimmt wird: Testwert=Mittelwert eingeben
Schriftlich:

Annahme: Die Variable Wohnungsgre entstammt einer normalverteilten Grundgesamtheit mit


Erwartungswert und unbekannter Varianz .
Nullhyp.

H0: = 0 : Das/Der mittlere --- betrgt im Mittel


H1: 0 : Das/Der --- betrgt im Mittel nicht

Mit einer Wahrscheinlichkeit von ..% liegt das zwischen (Intervall)


Sig (2seit) < : Test ist signifikat, H0 muss abgelehnt werden
Sig (2seit) > : Test ist nicht signifikant, H0 kann nicht abgelehnt werden

b) berprfen, ob Var 1 Einfluss auf Var 2 hat m.H. des Mittelwertes doppelter T-Test
Annahme: Die Var1 der Frauen sowie die Var1 der Mnner entstammen jeweils einer normalverteilten
Grundgesamtheit mit Erwartungswerten 1 und 2 und unbekannten Varianzen 1 und 2.
H0: Das Var2 hat keinen Einfluss auf die mittlere Var1 (unabhngig)
H1: Das Var2 hat einen Einfluss auf die mittlere Var1 (besteht Zusammenhang)
2

Levene-Test (H0: 1 =2 (.Die Varianz der Var 1 der Var2 ist gleich der Varianz der Var1 der Var2.- gegen H1:
2
2
1 2 Die Varianz der Var 1 der Var2 und Varianz der Var1 der Var2 sind nicht gleich.
Wenn Levene-Test Sig > : Besttigt Varianzgleichheit ,
T-Test: sig H0 ablehnen, H1 annehmmen -> Einfluss vorhanden!
Analysieren Mittelwerte vergleichen t-Test bei unabhngigen Stichproben Testvar auswhlen
Gruppierungsvar festlegen!!! Konfidenzintervall (ber Optionen)
C) einseitige Fragestellungen einfacher t-test (bei einer Stichprobe)
Die xxx entstammt einer normalverteilten Grundgesamtheit mit Erwartungswert und unbekannter Varianz .
H0: 0 (Die mittlere xxx (Wohnungsgre) ist kleiner gleich 0.)
H1: > 0 (Die mittlere xxx (Wohnungsgre) ist grer als 0.)

Analysieren Mittelwerte vergleichen test bei einer Stichprobe Testgre eingeben, Konfidenzintervall
eingeben
Interpretation Ausgabe: bersicht Mittelwerttest bei einseitiger Fragestellung, UMRECHNUNG!!!
d) berprfen, ob sich Mittelwert innerhalb Zeitspanne verndert hat t-Test bei verbundenen
Stichproben
Annahme: Die Differenz des derzeitigen Einkommens und des Einkommens vor drei Jahren entstammt einer
2
normalverteilten Grundgesamtheit mit Erwartungswert und unbekannter Varianz .
H0: Das mittlere xxx (Einkommen) hat sich in den letzten drei Jahren nicht geandert.
H1: Das mittlere xxx (Einkommen) hat sich in den letzten drei Jahren geandert
Analysieren Mittelwerte vergleichen T-test bei verbundenen Stichproben
p< H0 ablehnen, signifikant, H1 annhemen, sich sich signifikant verndert
p> H0 annehmen, nicht signifikant
Zustzlich Aussage ber mittlere Vernderung (Mittelwert) und Korrelation (fr Mittelwert unwichtig)
e) Hat Var1 (mit mehreren Ausprgungen) Einfluss auf Var 2 (ebenfalls mehrere Ausprgungen) ANOVA

Annahme: Die Var2 entstammt fr jede Var1stufe einer normalverteilten Grundgesamtheit mit
Erwartungswerten 1, 2, , 5 und unbekannten Varianzen 1, 2, , 5.
H0: Die mittlere Var2 ist unabhngig von Var1. (hat keinen Einfluss)
H1: Die mittlere Var2 hngt von der Var1 ab. (hat Einfluss)
Analysieren mittelwerte vergleichen einfaktorielle Varianzanalyse abhngige Var. 2, Faktor:
Var1
Optionen: Test auf Homogenitt der Varianzen!!
Wenn Varianzen nicht gleich (also p< 0,05 Ho: Varianzen sind gleich ablehnen) liefert ANOVA
Test keine zuverlssige Aussage
Auswertung m.H. bersicht

Chi-quadrat Anpassungstest / Unabhngigkeitstest / Test ob Stichprobe signifikant/


Zusammenhang zweier variablen, unbekannte verteilung der Grundgesamtheit
Der chi-Quadrat-Anpassungstest ist ein statistisches Verfahren zur berprfung einer
Verteilungsannahme.
Test1: beobachtete Hfk entspricht vorgegebener Hfk
Test2: Beobachtung entspricht Gleichverteilung
Achtung: Var ggf verdichten wenn Voraussetzung. In hchstens 20% der Zellen tritt eine erwartete
Hufigkeit kleiner als 5 auf.
Analysieren deskriptive Statistik Kreuztabelle Statistiken Chi-Quadrat (gruppierte
Balkendiagramme anzeigen)
H0: Die Variable Familienstand mit den Ausprgungen verheiratet und nicht verheiratet sowie
die Variable Qualifikation mit den Ausprgungen kein Abschluss, Facharbeiter und hherer
Abschluss sind unabhngig.
H1: Die beiden Variablen besitzen einen Zusammenhang.
P : Ho ablehnen, signifikant, H1 annehmen
P> Ho annehmen, nicht signifikant

Chi-Quadrat Homogenittstest Gleichverteilung von 2 Variablen Zusammenhang von variablen


Identisches Vorgehen wie bei Anpassungstest
H0: Das Haushaltsnettoeinkommen in drei Klassen besitzt bei Mnnern und Frauen die gleiche
Verteilung.
H1: Das Haushaltsnettoeinkommen in drei Klassen besitzt bei Mnnern und Frauen unterschiedliche
Verteilungen.
P : Ho ablehnen, signifikant, H1 annehmen
P> Ho annehmen, nicht signifikant

Falls chi-quadrat test nicht signifikant genug ist (p sehr nah an )


Fisher Test

Der exakte Fisher-Test ist ein nichtasymptotischer Test auf Unabhngigkeit und als solcher eine
direkte Alternative fr die Gruppe der asymptotischen Chi-Quadrat-Tests.
Keine Faustregel (hchsten 20% der Zellen) > somit keine Klassifizierung notwendig
Analysieren -Deskriptive Statistiken - KreuztabellenK -ExaktK exakte Tests
Im Fall eines exakten Tests kann auf die Interpretation des entsprechenden asymptotischen Tests
verzichtet werden.

Test, ob Grundgesamtheit Normalverteilt ist (mehr als 40 Mglichkeiten!!)


1) Kolmogorov-Smirnov-Test: nichtparametrische Anpassungstest dient allgemein zur berprfung
einer Verteilungsannahme einer Grundgesamtheit, wobei der Test auf Normalverteilung von
zentralem Interesse ist.
Vorteil nichtparametrischer Tests: keine Annahmen ber die Verteilung der Beobachtungen notw.
Einzige theoretische Voraussetzung fr diesen Standardtest ist, dass die zugrundeliegende
(unbekannte) Verteilung stetig ist.
kein statistischer Nachweis, dass eine Normalverteilung vorliegt. Es ist lediglich ein signifikanter
Nachweis des Nichtvorliegens mglich.
H0: Die Variable Krpergre ist normalverteilt.
H1: Die Variable Krpergre ist nicht normalverteilt.
Mittelwert und Standardabweichung vorher berechnen!
Analysieren nichtparametrische tests eine Stichprobe kolmogorov optionen
benutzerdefiniert Mittelwert und StAbw eingeben!
Zur Untersttzung, QQ oder PP Diagramme einfgen!

Analysieren deskriptive Statistik QQ/PP Plots


Die Interpretation der Wahrscheinlichkeitsplots erfolgt ber die Abweichungen der empirischen
Verteilung von der hypothetischen Verteilung. Eine geringe und unsystematische Streuung der
Punkte um die eingezeichnete Diagonale spricht demnach fr die theoretische Verteilung. Groe
oder systematische Abweichungen von der Geraden deuten hingegen auf eine abweichende
Verteilung der empirischen Daten hin.
robustere Variante stellt der Kolmogorov-Smirnov-Lilliefors-Test
Analysieren - Deskriptive Statistiken - Explorative Datenanalyse- -Diagramme
Korrektur nach Lillifors + Shapiro-Wilk-Test
Der Kolmogorov-Smirnov-Lilliefors-Test ist analog auch beim Test auf Exponentialverteilung
mit unbekannten Parametern anwendbar.

Simulation von Zufallsvariablen


Transformieren Variable berechnen
Funktionsgruppe Zufallszahlen wird die Funktion Rv.Normal
Mittelwert und die Standardabweichung entsprechend der Aufgabenstellung angepasst
Stichprobe reprsentativ?
Chi-quadrat Anpassungstest
Eine entsprechende Kreuztabelle mit den beobachteten und erwarteten Hufigkeiten fr die
neue Variable kann ber Analysieren Nichtparametrische Tests Alte Dialogfelder
Chi-Quadrat erstellt werden.

Binomialtest (11)
H0: Der Anteil der mnnlichen Whler betrgt 48,062% und der Anteil der weiblichen Whler
entspricht 51,938%.
H1: Die Anteile der mnnlichen und weiblichen Whler weichen signifikant von obiger Verteilung
ab.
Analysieren nichtparametrischer Test eine Stichprobe Test auf Binomialverthypothetischer Anteil Erfolgswert

linearen Zusammenhnge zwischen Variablen Prfen


deskriptive lineare Regressionsanalyse
1) Variablen metrisch messbar
- Korrelationsanalyse der Korrelationskoeffizient nach Pearson
Analysieren Korrelation Bivariat var auswhlen - Pearson (bei metrisch auswhlen)
- Test auf Signifikanz zweiseitig (da unbekannt)
Korrelationskoeffizient: betragsmig relativ klein deutet auf schwachen linearen
Zusammenhang hin
Signifikanz: wenn p , dann H0 ablehnen, Test ist signifikant
Wenn p >, dann ist Test nicht signifikant, Unkorreliertheit kann nicht
signifikant abgelehnt werden
Test auf Unkorreliertheit (Unabhngigkeit)
Voraussetzung: (X1;X2) normalverteilt

H0 : 12 = 0: unkorreliert und unabhngig


H1 : 12 0:
Testen auf eine bestimmte Korrelation.
setzen wir voraus, dass (X1;X2) normalverteilt sind.
H0 : 12 = 0
Wenn Korrelationskoeffizient gegen 0, aber nicht signifikant, dann Kolmogorov Smirnov Test
durchfhren. Nachweis von Normalverteilung Unabhngigkeit gezeigt.
2) wenn mind. 1 Variable ordinal messbar monotoner Zusammenhang testen

Spearmans: Abhngigkeiten zwischen den Variablen X1 und X2 testen Rangstichproben erfassen


H0: Zwischen den Variablen besteht keine Rangkorrelation.
H1: Zwischen den Variablen besteht eine Rangkorrelation
Rangkorrelationskoeffizient nach Spearman = 0,602 > 0 : Hinweis auf monotonen Zusammenhang
(zweiseitige Test auf Unkorreliertheit): wenn p < 0,05 = : H0 verwerfen (signifikant) h1
annehmen, es besteht Rangkorrelation
Die Variablen werden also als korreliert und demnach stochastisch abhngig angesehen.
Wenn Rangkorrelationskoeffizient positiv ist Stichprobe tendenziell identische Rangordnung
P > : H0 annehmen nicht signifikant, Keine Rangkorrelation Var unkorreiert, kein monotoner
Zusammenhang
Oder Kendalls Tau
Test auf (Un)korreliertheit
H0: Zwischen den Variablen besteht keine Rangkorrelation.
H1: Zwischen den Variablen besteht eine Rangkorrelation

Regressionsanalyse (Korrelation vorhanden)


Zusammenhang in Diagramm darstellen + Regressionsgerade:
Streudiagramm ber Diagramme Diagrammerstellung Streu-/Punktdia
Einfaches Streudiagramm mit entsprechender Regressionsgerade veranschaulichen.
Letztere wird im Diagramm- Editor ber Elemente Anpassungslinie bei Gesamtwert
hinzugefgt.
Bei Untergruppen (zB mnnl/weibl getrennt): gruppiertes Streudiagramm; Anpassungslinie bei
Untergruppen!

Regressionsgleichung bestimmen: inkl. Varianzanalyse: y(x) = b1 x + b0.


Analysieren Regression Kurvenanpassung
Modellzusammenfassung und Parameterschtzer+ANOVA auswhlen
Bestimmtheitsma R : wie gro der Anteil der erklrten Totalvariation durch das gewhlte
Regressionsmodell ist Gte der Nherung mittels des gewhlten Modells
0 R2 1 gilt, Wert nahe 1 = gute Approximation, ein Wert nahe 0 = schlechte Approximation.
ANOVA: Varianzanalyse
H0: Die Variablen sind unabhngig. H1: Die Variablen sind abhngig.)
Regressionserklrung mithilfe eines F-Tests.
P : H0 ablehnen, Var sind abhngig Angabe der Regressionsgleichung sinnvoll
p> : H0 kann nicht abgelehnt werden, Test trifft keine Aussage darber, Regressionsgleichung
nicht sinnvoll.

parametrische Tests fr die Steigung im einfachen linearen Regressionsmodell mit folgenden


Hypothesen gibt an, ob die empirische Regressionsgleichung angewendet werden kann
wenn: Schtzwert b1 signifikant verschieden von Null Anwendung!
H0: Der Anstieg der Regressionsgeraden = Null, d.h. der Koeffizient b1 = Null.
H1: Der Anstieg der Regressionsgeraden Null, d.h. der Koeffizient b1 Null.
H1 angenommen unabhngige Variable hat demnach einen Einfluss auf die Regression und es
besteht ein linearer Zusammenhang zwischen der unabhngigen und der abhngigen Variable
y-Achsenabschnitt im einfachen linearen Regressionsmodell mit folgenden Hypothesen:
H0: Die Regressionsgerade geht durch den Ursprung, d.h. der Koeffizient b0 = Null.
H1: Die Regressionsgerade geht nicht durch den Ursprung, d.h. der Koeffizient b0 Null.

partielle Korrelationsanalyse
1. berprfen, ob Normalverteilung vorliegt Kolmogorov-Smirnov-Test
H0: Die Variable Krpergre ist normalverteilt.
H1: Die Variable Krpergre ist nicht normalverteilt.
Zuerst Bivariat durchfhren und bewerten
Dann partiell.
Auswertung partielle Korrelation Aufdecken evtl Scheinkorrelation
Wenn = 0,632 > 0,
(und Korrelationskoeffizienten der einfachen bivariaten Korrelationsanalyse = 0,675 entspricht)
beide Variablen positiv korreliert, Kontrollvar hat geringen Einfluss auf andere Var
Analyse des partiellen Korrelationskoeffizienten zeigt in diesem Fall keine Scheinkorrelation auf.