Beruflich Dokumente
Kultur Dokumente
Man unterscheidet bei der Erfassung von Daten bzw. der Aufstellung von Erhebungsbögen unter:
1. optische Kriterien die messbar sind, wie Größe, Gewicht und als abhängige Variabeln
bzw. Merkmale bezeichnet werden und
2. objektive Kriterien, die in gleich große Einheiten z.B. cm, mm, kg oder als feste Zahl
z.B. Jahre festgelegt bzw. definiert werden können,
3. subjektive Kriterien, sind zunächst nicht messbar, können aber je nach persönlicher
Abschätzung in eine Skala eingeteilt werden und somit messbar werden.
Variabeln, wie z.B. Geschlecht werden als intervenierende Variabeln bezeichnet, weil sie das
Ergebnis, durch die zählbare Anzahl z.B. wie viel männl. und wie viel weibl. bzw. die
Verwertbarkeit der optischen Kriterien beeinflussen. Diese Variabeln haben wiederum
Merkmalsausprägungen wie z.B. männlich, weiblich.
Eindeutigkeitder Variabel muss vorhanden sein, weil die Variabel nur ein isoliertes Merkmal
des Objektes beschreibt.
Variabel:
Wert:
istfür Computer wichtig(Fallbez. Infos zum Thema, verwendet werden Ziffern 0,1,2,3, usw.
oder 0,6 usw. mit Dezimal oder ohne je nach Skala(Code).
Wert-Labelist die Bezeichnung/Beschreibung z.B. Eltern = 1, usw.
Skalen:
nominal ist das geringste Skalenniveau (sind Bennungen ohne jeden Bezug zueinander)
nominal/ordinal sind:
stetige Skalen(fest)
intervallskalierte/
metrische sind:
1 2 3 4 5 6=
Die erste Datei öffnen über Symbolleiste DatenDaten zusammenfügenindem Fälle hinzugefügt
werden. Fälle sind die anderen Dateien. Auswahl der Datei, wenn Fehlermeldung links im Fenster
auftaucht, dann markieren, und zwar den Variabel-Namen mit (+) und korrigierendann
Variabel-Namen mit (*) suchen, beide markieren und als Paar auf die reichte Seite übernehmen,
dann oke’ und die Fälle der anderen Datei werden in der Datenblattansicht hinzugefügt.
Die Variabel-Namen müssen identisch sein beim Daten zusammen fügen !!!
Deskriptive Statistik ist eine beschreibende Statistik, wie z.B. bei der Häufigkeit = Auszählung. Die
Auswahl wird im linken Fenster gewählt und oke’. PC zeigt Liste der gewählten Variabeln und ein
Abgleich bzw. Vergleich oder Fehlersuche kann beginnen.
Mit transformierenBerechnung der Variabel möglich, wie z.B. das Berechnen des Alters der
Patienten mit transformierenBerechnenEingabe der Zielvariabel 2004 – gebjahr = Alter des
Patienten
Absolute Werte sind = Häufigkeit, Anzahl nach Alter, wie viel Fälle, welches Alter
Grafiken:
Histogramm:
o Ist geeignet für Variabel mit vielen Kategorien(Werte) und
o für intervallskalierte/metrische Variabeln bzw. Skalen
o N = number of cases = Anzahl der gültigen Fälle
o erstellt eine Normalverteilungskurve sowie eine Zusammenfassung in 5er/10er Schritten
Berechnungen sind möglich
Normalverteilungskurve:
o versucht die Verteilung zu vergrößern, indem sie glättet und anzeigt wo die Fälle zu wenig
oder zu viel vorhanden sind
o verteilt die Fälle in Intervalle/in 5er und 10er Schritten
o ist geeignet für Variabeln mit sehr großen Ausprägungen/Kategorien; also Variabeln mit
Intervallen (diskreten)
Balkendiagramm:
o ist geeignet für Variabel mit wenig Ausprägungen/Kategorien
o nominal/ordinal Skalen
Format - Änderungen der Diagramme können mit Doppelklick auf das jeweilige zu verändernde
Format z.B. Farbe, Schrift usw. im SPSS-Editor vorgenommen werden.
T-Teststeht für zwei Mittelwerte und vergleicht sie; vergleicht Mittelwerte für Variablen, die
intervallskaliert sind; es wird unterschieden zwischen:
Gruppenvariabl in DBgeschl
x
Irrtumswahrscheinlichkeit
p < .001 0,1%
p < .01 1%
19 22 22 6 Anzahl Kreuze 10 20 35
5 2
X 19
2,16 Probanten
von 1 bis 5 sind 100% bei Mittelwerterrechnung mit
1 2 3 4 5 Extremwerten Können den Mittelwert erheblich
gut schlecht beeinflussen
X X
1,62 2,70
Untergrenze Obergrenze
⇒ die Spanne ist ohne Extremwerte; dadurch werden die Unterschiede
deutlicher
Kreuztabellen mit chi2 nach Pearson steht auch für p< bei d.
Signifikanz
⇒ sind für die Analyse von nominal/ordinal Variablen am aussagekräftigsten, da
bei diesen Variablen kein Mittelwert und keine Varianzanalyse =
Untersuchung der Verteilung stattfindet
⇒ Skalen bzw. Variablen sollten also für die Ausführung von Kreuztabellen
wenig Ausprägungen bzw. Kategorien haben
⇒ Kreuztabellen sind aber mit ordinal intervallskalierten s. Tabelle 2
durchführbar ohne Umkodierung; dabei erhält man eine annährend
deskeptive/beschreibende Aussage (bei Häufigkeit)
Dabei wird von einer beobachteten Häufigkeit und einer erwarteten
Häufigkeit ausgegangen:
⇒ beobachtete Häufigkeit ist die, von den in der Datenbank vorhandenen
Daten mit der Angabe von Prozentanteiele von 100% pro Zeile
⇒ erwartete Häufigkeit ist die zu errechnende Anzahl = absoluter Wert, wenn
kein Unterschied in der beobachteten Häufigkeit besteht;
i. Gesamtanzahl einer Gruppe z.B. männl.* Prozentanteil einer Ausprägung der
anderen Gruppe z.B. weibl./überhaupt nicht dividiert durch 100 = Anzahl
der erwarteten Häufigkeit der Ausprägung z.B. männl./überhaupt nicht s.
Tabelle 1
⇒ man spricht dann von der so genannten NULL-HYPOTHESE = KEIN
UNTERSCHIED
Bedingungen für die Relevanz des chi2 sind:
⇒ die erwartete Häufigkeit darf nicht unter 5 sein
⇒ die Tabelle sollte wenig Felder haben, muss mehr als 5 Felder haben und
sollte nicht zu viel Felder haben Spanne zwischen 6 und 15 Felder relevant
⇒ je größer die Felderanzahl/Tabelle, desto unzuverlässiger der chi2 – Test = die
statistische Auswertung nimmt ab
⇒ ist auch mit vier Tafeln mit besonders mäßiger Rechnung möglich
Streuungsmaße/Verteilungsmaße sind:
⇒ Modalwert = erster Wert, der in der Skala am häufigsten vorkommt = „Häufigkeitswert“/ist
kennzeichnet für nominal/ordinal Skalen
⇒ Median = 50% Perzentil (Prozentanteil der Prozente) eine Stichprobe die das Ganze
annährend in zwei gleich große Teile aufteiltwird durch die Verteilung d. angegebenen Werte
ermittelt
⇒ Mittelwert = Summe der gültigen Werte, dividiert durch deren Anzahl
⇒ Spannweite = Maximum und Minimum
⇒ Varianz = Summe des quadrierten Abstandes zum Mittelwert
⇒ Standardabweichung = Wurzel aus der Varianz (Maßeinheit wie Skala) = durchschnittlicher
Abstand zum Mittelwert
⇒ Formel für Varianz = √∑ quadrierten Abst. z. X = Standardabweichung
Fallzahl
X
2,16
1 2 3 4 5
„Standardabweichung“
+1
Normalverteilungskurve = Standardverteilung
X
2,16 -2
1 2 3 4 5
nominal/ordinal sind:
stetige Skalen(fest)
z.B. 1+1
x x Mittelwert
Gruppe definiert
Wert= Abhängige Variable = gesund
m w
0m 1=w
Gruppenvariabl in DBgeschl
z.B.
Mittelwert
x x
Eine Gruppe
gesund alter
19 22 22 6 Anzahl Kreuze 10 20 35
5 2
Dabei werden z.B. die unabhängig voneinander stehenden Gruppen vom Anova Faktor
mit der abhängiger Variable hier „gesund“ verglichen
⇒ Anova Faktor „pausen“Wert = 319x angekreuzt = 19 Probanten
X 19
2,16 Probanten
von 1 bis 5 sind 100% bei Mittelwerterrechnung mit
1 2 3 4 5 Extremwerten Können den Mittelwert erheblich
gut schlecht beeinflussen
X X
1,62 2,70
Untergrenze Obergrenze
⇒ die Spanne ist ohne Extremwerte; dadurch werden die Unterschiede deutlicher
Kreuztabellen
Begründung:
desto kleiner die Zahl/Prozent, desto höher die Signifikanz(Aussagekraft)
desto höher die Zahl/Prozent, desto niedriger bzw. keine Signifikanz ab p < .05 =
5% (Aussagekraft)
anhand der Verteilung der Werte, wird die Signifikanz errechnet
Spannweite ist
...der größte Wert (max.) minus dem kleinsten Wert (min.)
...der Abstand zwischen Min. und Max.
Median wird
...durch die Verteilung der angegeben Werte ermittelt
...auch 50% - Perzentil = Prozentanteil der Prozente genannt
...teilt die Stichprobe = das Ganze in zwei gleich große Teile
⇒ Ist die Steilheit gleich Null dann 45°C weicht nicht von Normalverteilung ab
„Standardabweichung“
+1
Normalverteilungskurve = Standardverteilung
X
2,16 -2
1 2 3 4 5