Sie sind auf Seite 1von 117
Biomathe Computerseminar Kursunterlagen Bernhard Haller Monika Bruderl¨ Raymonde Busch Alexander Hapfelmeier Victoria
Biomathe Computerseminar Kursunterlagen Bernhard Haller Monika Bruderl¨ Raymonde Busch Alexander Hapfelmeier Victoria
Biomathe Computerseminar Kursunterlagen Bernhard Haller Monika Bruderl¨ Raymonde Busch Alexander Hapfelmeier Victoria

Biomathe Computerseminar

Kursunterlagen

Bernhard Haller Monika Bruderl¨ Raymonde Busch Alexander Hapfelmeier Victoria Kehl Kurt Ulm Stefan Wagenpfeil Petra Wolf

5. Auflage, WS 2012/13

Inhaltsverzeichnis

1 Vorwort

 

1

2 Woche 1

3

2.1 Datenstruktur und Datenmanagement

 

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

3

2.2 Erstellen einfacher Grafiken

 

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

19

2.3 Import und Export von Daten

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

21

 

¨

2.4

Ubung

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

22

3 Woche 2

 

25

3.1 Erste Schritte

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

27

3.2 Deskriptive Statistik, Maßzahlen und tabellarische Darstellung

.

.

.

.

.

.

.

.

.

31

3.3 Grafiken

 

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

40

 

3.3.1 S¨aulendiagramm

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

40

3.3.2 Boxplot

 

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

46

¨

3.4 Ubungsaufgaben

 

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

54

3.5 L¨osungsvorschlag

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

55

4 Woche 3

 

59

4.1 Streudiagramm

 

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

59

4.2 Korrelation

 

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

64

4.3 Lineare Regression

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

69

 

¨

4.4 Ubungsaufgaben

 

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

74

ii

INHALTSVERZEICHNIS

4.5

L¨osungsvorschlag

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

75

5 Woche 4

81

5.1 Der Chi-Quadrat-Test

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

82

¨

Uberprufung¨

5.2 der Normalverteilung

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

86

5.3 Der t-Test .

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

91

5.3.1

t-Test fur¨

unverbundene Stichproben

 

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

91

5.3.2

t-Test fur¨

verbundene Stichproben

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

94

¨

5.4 Ubungsaufgaben

 

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

97

5.5 L¨osungsvorschlag

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

98

6 Anhang

103

Kapitel 1

Vorwort

Das vorliegende Skript ist als schriftliche Erg¨anzung zu dem Biomathematik Computerkurs gedacht. Es ist naturlich¨ auf keinen Fall als Ersatz fur¨ gute Standardtexte zu verstehen. Eine Auswahl statistischer Fachbucher¨ und Software-Handbucher¨ ist im Anhang angegeben. Das Hauptaugenmerk dieses Skripts liegt darin, die Umsetzung von statistischen Verfahren mittels SPSS zu beschreiben. Uns ist bewusst, dass dies nur einen kleinen Aspekt der statistischen Auswertung darstellt. Fur¨ alle weiteren Aspekte der statistischen Auswertung, wie Fallzahl- planung, Datenbankdesign, Auswahl der statistischen Methoden, Ergebnisinterpretation etc., steht Ihnen unser statistischer Beratungsservice zur Verfugung.¨ N¨ahere Informationen dazu finden Sie im Internet unter http://www.med.tu-muenchen.de/de/gesundheitsversorgung/statistik. Hier finden Sie auch Informationen uber¨ regelm¨aßig stattfindende EXCEL- und SPSS-Auf- baukurse. Computerprogramme bieten eine große Anzahl von m¨oglichen statistischen Berechnungen. Alle M¨oglichkeiten k¨onnen und sollen hier nicht erl¨autert werden. In der ersten Woche wird das Datenmanagement in EXCEL beschrieben, in der zweiten Woche werden deskriptive Maß- zahlen und grundlegende Grafiken in SPSS besprochen. Regression und Korrelation sind das Thema der dritten Woche. Im letzten Kapitel wird der Chi-Quadrat-Test sowie der t-Test durchgefuhrt.¨

Kapitel 2

Woche 1

Im Rahmen jeder experimentell-wissenschaftlichen Arbeit werden Daten erhoben, gesammelt und aufbewahrt. Bevor mit der statistischen Auswertung begonnen werden kann, ist es erfor- derlich, sich mit der Datenstruktur und der Datenaufbereitung zu befassen. Das Microsoft-Programm EXCEL zeichnet sich durch seine große Verfugbarkeit¨ aus, da es auf nahezu jedem PC installiert ist. Zielsetzung dieses ersten Computerseminares ist es deshalb, eine Einfuhrung¨ in das Datenmanagement mit Microsoft EXCEL zu geben und zu vermitteln, wie ein Datensatz fur¨ die statistische Analyse aufbereitet werden sollte. Daruber¨ hinaus wird die Erstellung einfacher Grafiken in EXCEL besprochen.

2.1 Datenstruktur und Datenmanagement

Allgemeines

Daten sollten in rechteckiger Form“ als sogenannte Datenmatrix vorliegen. Die Zeilen der Datei stellen die einzelnen Beobachtungseinheiten (z. B. Patienten, Probanden, Versuchstie- re) dar. Grunds¨atzlich sollte also fur¨ jede Beobachtungseinheit genau eine Zeile vorliegen. In den Spalten der Datei stehen die Variablen (z. B. Alter, Geschlecht, Blutdruck etc.), die an den Beobachtungseinheiten erhoben wurden. EXCEL stellt im Gegensatz zu vielen Stati- stikprogrammen keine Bedingungen an die Variablennamen. M¨ochte man Daten aber nicht nur mit EXCEL verwenden, sollten die entsprechenden Namenskonventionen von vornherein

4

2. Woche 1

eingehalten werden und Variablennamen grunds¨atzlich keine Sonderzeichen oder Leerzeichen enthalten, nicht zu lang sein und nicht doppelt vergeben werden. Die Merkmalsauspr¨agungen (= Eintr¨age in den einzelnen Zellen) sollten dabei in numerischer Form (Zahlen) vorliegen. Um flexible Analysen zu erm¨oglichen und um unn¨otige Tippar- beit zu vermeiden, ist es sinnvoll, bei alphanumerischer Mermalsauspr¨agung (z. B. m¨annlich, weiblich; ja, nein) mit einheitlichen Kodierungen (z. B. 1, 2 oder 1, 0) zu arbeiten. Es ist zu bedenken, dass bestimmte Analyseprogramme Texteintr¨age nicht verarbeiten k¨onnen. Datumsangaben werden am besten in der Form TT.MM.JJJJ angegeben. Zum Umgang mit fehlenden Werten gibt es verschiedene M¨oglichkeiten. Auf alle F¨alle sollte die Kodierung einheitlich sein. Die Verwendung eines Wertes als Platzhalter (z. B. -999), der in den theoretisch m¨oglichen Werten der Beobachtungen nicht vorkommen kann, erm¨oglicht es unterschiedliche Arten von fehlenden Werten unterscheidbar zu machen. In Statistikprogram- men k¨onnen solche besonderen Codes als fehlende Werte angegeben und interpretiert werden. Auswertungen, z. B. Mittelwertberechnungen, liefern dann korrekte Werte. In EXCEL gibt es eine solche Funktion nicht. Um Berechnungen in EXCEL durchzufuhren¨ empfiehlt es sich deshalb, die entsprechende Zelle der Merkmalsauspr¨agung einfach leer zu lassen, da sonst falsche Ergebnisse geliefert werden. Liegen mehrere Messungen pro Beobachtungseinheit vor (z. B. wiederholte Messun- gen des Blutdrucks im Verlaufe einer Therapie), sollte fur¨ jede dieser Messungen eine Spalte angelegt werden.

Beispiel

jede dieser Messungen eine Spalte angelegt werden. Beispiel Abbildung 2.1: Datenstruktur Diese Datei besteht aus vier

Abbildung 2.1: Datenstruktur

Diese Datei besteht aus vier Beobachtungseinheiten und acht Variablen. Bei Patient 4 wurde

das Gewicht nicht bestimmt. Fur¨

den systolischen Blutdruck liegen zwei Messungen vor.

2.1 Datenstruktur und Datenmanagement

5

¨

Zum Zwecke der

tenbestand auf mehrere Dateien aufzuteilen, z. B. Datei 1: Demographische Angaben; Datei

2: Blutdruckwerte; Datei 3: Laborwerte. Dabei ist darauf zu achten, dass jede dieser Dateien

nach dem oben beschriebenen Muster aufgebaut ist. Um Dateien fur¨ eine gemeinsame Aus-

wertung kombinieren zu k¨onnen, ist es wesentlich, dass in allen Dateien eine einheitliche und

eindeutige Identifikationsvariable (wie z. B. die Patientennummer) existiert. Diese Variable

wird auch als Schlusselvariable¨ bezeichnet.

Ubersichtlichkeit kann es unter Umst¨anden sinnvoll sein, den Gesamtda-

Lassen sich die Beobachtungseinheiten in zwei oder mehr Gruppen (z. B. unterschiedliche

Therapien) aufteilen und sollen diese Gruppen getrennt analysiert bzw. verglichen werden, so

muss eine zus¨atzliche Variable (= Spalte) eingefugt¨ werden, in der fur¨ jede Beobachtungsein-

heit die zugeh¨orige Gruppe eingetragen ist. Hier ist wiederum auf eine geeignete Kodierung

zu achten.

Beispiel

wiederum auf eine geeignete Kodierung zu achten. Beispiel Abbildung 2.2: Identifizierung der Gruppen uber¨

Abbildung 2.2: Identifizierung der Gruppen uber¨

Gruppenvariable

Hier geh¨oren die Patienten 1 und 6 zur Gruppe 1, w¨ahrend die Patienten 2 und 4 zur Gruppe

2 geh¨oren.

Das EXCEL-Anwendungsfenster

Das EXCEL-Anwendungsfenster besteht aus den fur¨ Office-Programme ublichen¨ Leisten und

Feldern sowie aus der EXCEL-spezifischen Arbeitsmappe und der dazugeh¨origen Bearbei-

tungsleiste. Die jeweiligen Buttons und Menupunkte¨ auf dem EXCEL-Bildschirm werden ak-

tiviert, indem man mit dem Mauspfeil darauf f¨ahrt und die linke (manchmal auch die rechte)

Maustaste druckt.¨ Dies wird oft als Klicken auf einen Menupunkt¨ bzw. Button bezeichnet.

Sichtbare Bestandteile der Arbeitsmappe sind das aktuelle Tabellenblatt, bestehend aus Spal-

6

2. Woche 1

ten und Zeilen, sowie das Blattregister, das auf die zur Mappe geh¨origen Tabellenbl¨atter weist.

¨

Uber dieses Register kann zwischen den verschiedenen Bl¨attern der EXCEL-Arbeitsmappe ge-

wechselt werden. Reicht der Platz zur Anzeige der Tabellenbl¨atter nicht aus, kann uber¨ die

sogenannte Seitensteuerung zu den vorhandenen Bl¨attern gewechselt werden. Umgeben ist

die Arbeitsmappe von Leisten und Feldern. Die Bearbeitungsleiste dient unter anderem der

Ansicht und der Editierung der aktuellen Zelle/Zellen im aktiven Tabellenblatt.

Aufbau einer EXCEL-Arbeitsmappe

Die Arbeitsmappe besteht aus maximal 256 Tabellenbl¨attern (Voreinstellung 3 Bl¨atter)

Ein Tabellenblatt besteht aus maximal 256 Spalten und 65536 Zeilen (bis Version 2003)

Bearbeitungsleiste Aktuelles Feld Aktuelles Tabellenblatt Seitensteuerung Tabellenbl ä tter Bildlaufleiste
Bearbeitungsleiste
Aktuelles Feld
Aktuelles Tabellenblatt
Seitensteuerung Tabellenbl ä tter
Bildlaufleiste
Blattregister

Abbildung 2.3: EXCEL-Anwendungsfenster

2.1 Datenstruktur und Datenmanagement

7

Hilfe in EXCEL

¨

Uber das Menu¨ ?“ (Microsoft EXCEL-Hilfe) erscheint am rechten Rand ein Hilfe Fenster.

” ?“ (Microsoft EXCEL-Hilfe) erscheint am rechten Rand ein Hilfe Fenster. Abbildung 2.4: Dialogfenster Hilfe

Abbildung 2.4: Dialogfenster Hilfe

8

2. Woche 1

Arbeiten in Tabellen

Arbeiten mit Tabellenbl¨attern

Tabellenbl¨atter einfugen¨

Menu:¨ Einfugen¨

Kontextmenu:¨ Klick mit der rechten Maustaste auf das Tabellenblattregister Einfu-¨

gen.

Tabellenblatt

¨

Uber die Registerkarte Allgemein“ Tabelle ausw¨ahlen OK.

Tabellenbl¨atter l¨oschen

Menu:¨ Bearbeiten Blatt l¨oschen.

Kontextmenu:¨ Rechter Mausklick auf das Blattregister L¨oschen.

Tabellenbl¨atter umbenennen

Menu:¨ Format Blatt Umbenennen.

Kontextmenu:¨ Rechter Mausklick auf das Blattregister Umbennen.

Maus: Doppelklick auf den Blattnamen.

Tabellenbl¨atter verschieben / kopieren

Menu:¨ Bearbeiten Blatt verschieben/kopieren.

Angabe im Dialogfenster, welche Mappe an welche Blattposition verschoben/kopiert

werden soll.

Fur¨ das Kopieren die Option Kopieren aktivieren.

Kontextmenu:¨ Rechter Mausklick auf das Blattregister Verschieben / Kopieren.

Es ¨onet sich das gleiche Dialogfenster wie oben beschrieben.

Arbeiten mit Zeilen, Spalten, Zellen

Neue Zeilen, Spalten, Zellen einfugen¨

Zeile / Spalte / Zellen markieren, vor die eingefugt¨ werden soll. Menu:¨ Einfugen¨

Zeilen / Spalten / Zellen

Fur¨ das Einfugen¨ von Zellen ¨onet sich ein Dialogfenster, im dem angegeben werden

kann, wie die bereits vorhandenen Zellen verschoben werden sollen.

Kontextmenu:¨ Rechter Mausklick auf den markierten Zeilenkopf / Spaltenkopf / Zell-

2.1 Datenstruktur und Datenmanagement

9

bereich Zellen einfugen.¨

Fur¨

das Einfugen¨

von Zellen ¨onet sich ein Dialogfenster wie oben beschrieben.

Zeilen, Spalten, Zellen l¨oschen Zeile / Spalte / Zellen markieren. Menu:¨ Bearbeiten Zellen l¨oschen. Fur¨ das L¨oschen von Zellen ¨onet sich ein Dialogfenster, in dem angeben werden kann, wie die entstehende Lucke¨ aufgefullt¨ werden soll. Kontextmenu:¨ Rechter Mausklick auf den markierten Zeilenkopf / Spaltenkopf / ZellbereichZellen l¨oschen. Fur¨ das L¨oschen von Zellen ¨onet sich ein Dialogfenster wie oben beschrieben.

Zeilen, Spalten, Zellen verschieben bzw. kopieren Zeilen / Spalten / Zellen markieren. Menu:¨ Bearbeiten Ausschneiden (oder Kopieren) Zeilen / Spalten / Zellen markieren, in die eingefugt¨ werden soll Bearbeiten Einfugen.¨ Kontextmenu:¨ Rechter Mausklick auf die markierten Zeilen / Spalten / Zellen Aus- schneiden (oder Kopieren) Zeilen / Spalten / Zellen markieren, in die eingefugt¨ werden soll Einfugen.¨

Hinweis:

Bleibende flimmernde“ Zellumrandungen nach Kopier- oder Ausschneideaktionen k¨onnen mit der Escape-Taste entfernt werden.

Die Dateneingabe

Elemente der Bearbeitungsleiste zur Dateneingabe

Zelladresse: Gibt die Koordinaten der aktuellen Zelle an.

Stornierschalter: Bricht die begonnene Eingabe in der aktuellen Zelle ab.

Eingabeschalter: Schließt die Dateneingabe in der aktuellen Zelle ab (entspricht dem Befehl ENTER).

Formelschalter: Leitet die Eingabe einer Formel in die markierte Zelle ein.

10

2. Woche 1

Zellinhaltsfeld: Zeigt den Inhalt der aktuellen Zelle an. Durch Positionierung des Cursors in diese Zelle werden Stornier- und Eingabeschalter sichtbar.

diese Zelle werden Stornier- und Eingabeschalter sichtbar. Abbildung 2.5: Bearbeitungsleiste Eingabe von Text EXCEL

Abbildung 2.5: Bearbeitungsleiste

Eingabe von Text EXCEL erkennt automatisch, dass es sich um Text handelt, wenn Buchstaben (Ausnahme:

Datumsangaben) oder Sonderzeichen (Ausnahme: + - =) eingegeben werden. Sollen Zahlen oder Datumsangaben als Text eingegeben werden, sind sie in Anfuhrungsstriche¨ (z. B. 01.01.1999“) oder Hochkommata (z. B. ’01.01.98’) zu setzen. Ist die Zelle nicht bereits vorformatiert, wird der Text automatisch linksbundig¨ ausgerichtet.

Eingabe von Zahlen Werden nur Zahlen und fakultativ Plus-/Minuszeichen, Komma als Dezimaltrenner, Punkt als Tausendertrenner eingetragen, wird der Inhalt automatisch als Zahl erkannt. Ist die Zelle nicht bereits vorformatiert, wird die Zahl rechtsbundig¨ angeordnet.

2.1 Datenstruktur und Datenmanagement

11

Eingabe von Datumsangaben Alle Datumsangaben mit/ohne fuhrende¨ Null bei Tages- und Monatsangaben sowie mit/ohne Jahrhundertangabe und Punkt oder Bindestrich als Trenner zwischen Tag, Monat, Jahr wer- den automatisch als Datum erkannt und in folgendes Standardformat gebracht: TT.MM.JJJJ. Intern werden Datumsangaben als fortlaufende Zahlen gespeichert, beginnend mit 1 fur¨ den 01.01.1900 und endend am 31.12.9999 (erkennbar an der rechtsbundigen¨ Ausrichtung). Datumsangaben vor 1900 werden nicht als Datum interpretiert, sondern als Text gespeichert (erkennbar an der linksbundigen¨ Ausrichtung). Soll das Jahrhundert bei Datumsangaben nicht erkennbar sein, k¨onnen die Zellen uber¨ das Menu¨ Format Zellen entsprechend formatiert werden. Der Zellinhalt wird durch die For- matierung nicht ver¨andert.

Eingabe von Uhrzeit Stunden, Minuten und Sekunden sind jeweils durch einen Doppelpunkt zu trennen. Datum und Uhrzeit k¨onnen in eine Zelle eingetragen werden, sie sind dann durch ein Leer- zeichen zu trennen. Die interne Verwaltung der Uhrzeit erfolgt als Dezimalzahl. Beispiel: 12:00:00 0,5. In Verbindung mit einem Datum: 31.01.1900 12:00:00 31,5.

Hinweis:

Soll eine Tabelle nach SPSS exportiert werden, empfiehlt es sich Datumsangaben im Format TT.MM.JJJJ zu speichern, da es sonst zu Fehlern beim Export kommt. Menu:¨ Format Zelle Benutzerdefiniert TT.MM.JJJJ. Kontextmenu:¨ Rechter Mausklick auf die markierten Zelle Zellen formatieren Benutzer- definiert TT.MM.JJJJ.

Transformation von Daten

Nach Beendigung der Datensammlung und -eingabe k¨onnen sich verschiedenste Vorg¨ange der Datentransformation anschließen. So k¨onnen aus eingegebenen Variablen neue Variablen berechnet werden (z. B. Bodymaß-Index aus K¨orpergr¨oße und -gewicht) oder vorhandene

12

2. Woche 1

Variablen zu neuen Variablen umkodiert werden (z. B. Altersklasse aus Alter). Die Beobach- tungen der Tabelle k¨onnen in einer definierten Reihenfolge angeordnet oder nach festgelegten Kriterien selektiert werden (z. B. nach Gruppenzugeh¨origkeit). Schließlich kann es n¨otig sein, dass Daten der zu untersuchenden Beobachtungen aus verschiedenen Tabellen zusammen- gefuhrt¨ werden mussen.¨ Das Berechnen und Umkodieren von Variablen erfolgt in EXCEL anhand von Formeln. Da Formeln in EXCEL auch Grundlage der Berechnung statistischer Maßzahlen sind, wird ein ausfuhrlicher¨ Abschnitt Formeln in EXCEL“ vorangestellt.

Formeln in EXCEL

Aufbau einer Formel Beispiel einer Formel in EXCEL:

= (E2+F2+G2)/3

= Mittelwert(E2:G2)

In beiden dargestellten Formeln wird der Mittelwert (arithmetisches Mittel) aus 3 Zahlen berechnet, die sich in den Zellen E2, F2 und G2 befinden. Im Gegensatz zur ersten Formel liefert die zweite Formel auch dann einen korrekten Mittelwert, wenn fehlende Werte in den Zellen vorkommen. In der nachfolgenden Abbildung ist fur¨ den ersten und zweiten Teilnehmer des Untersuchungs- kollektivs Fitness“ der Mittelwert der 3 gemessenen Pulsfrequenzen mithilfe dieser Formel berechnet worden. In der Bearbeitungsleiste ist die Formel zu sehen, die der Berechnung der Zahl in der aktuellen Zelle zugrunde liegt. Die aktuelle Zelle ist schwarz umrandet. Der Gesamtdatensatz Fitness“ ist im Anhang dieses Skripts beschrieben.

Bestandteile einer Formel k¨onnen sein:

Gleichheitszeichen (=) an erster Position (immer)

Konstanten (im Beispiel: 3)

Zellbezuge,¨

das sind die Koordinaten eines Zellenbereichs (im Beispiel: E2, F2, G2,

abgekurzt¨

E2:G2).

Operatoren (+ - * /ˆ)

2.1 Datenstruktur und Datenmanagement

13

2.1 Datenstruktur und Datenmanagement 13 Abbildung 2.6: Mittelwertfunktion in EXCEL • Funktionen (im Beispiel:

Abbildung 2.6: Mittelwertfunktion in EXCEL

Funktionen (im Beispiel: Mittelwert() )

Eingabe einer Formel mit Operatoren und Zellbezugen¨ Durchfuhrung¨

Die Zelle fur¨

die Formel markieren.

Das Gleichheitszeichen in der Bearbeitungsleiste eingeben.

Die Formel in das Zellinhaltsfeld (weiße Fl¨ache) der Bearbeitungsleiste eingeben, wobei die Zellbezuge¨ (= Koordinaten der Zellen, deren Inhalt in die Berechnung eingehen soll) durch Zeigen per Mausklick auf die Zelle bzw. Zellen in der Tabelle automatisch in die Bearbeitungszeile ubernommen¨ werden k¨onnen.

Abschluss der Formeleingabe mit der Enter-Taste oder Eingabeschalter. Die Berechnung wird sofort durchgefuhrt¨ und das Ergebnis in die vorgesehene Zelle eingetragen. Die Formel der aktuellen Zelle ist in der Bearbeitungszeile sichtbar.

Absolute und relative Zellbezuge¨ Wird in EXCEL eine Zelle kopiert, deren Inhalt aus einer Formel mit Zellbezugen¨ besteht, so werden diese Zellbezuge¨ automatisch an die neue Position angepasst. Das heißt, die neuen

14

2. Woche 1

Zellbezuge¨ befinden sich immer noch im gleichen Abstand zum Formelfeld. Diese Bezuge,¨ die beim Kopieren automatisch angepasst werden, nennt man relative Zellbezuge.¨ Sollen Zellbe- zuge¨ beim Kopieren nicht automatisch angepasst werden, die Koordinaten der Bezuge¨ also unver¨andert bleiben, so spricht man von absoluten Zellbezugen.¨ Dazu ist den Zellkoordinaten ein Dollarzeichen $“ voranzustellen (z. B. $A$1). Es sind auch Mischbezuge¨ m¨oglich (z. B. $A1 absoluter Spaltenbezug, angepasster Zeilenbezug bzw. A$1 angepasster Spalten- bezug, absoluter Zeilenbezug). Beachten Sie: Die Zellkoordinaten von absoluten (ebenso wie von relativen) Bezugen¨ werden automatisch ge¨andert, wenn neue Zeilen oder Spalten in das Datenblatt eingefugt¨ werden. So ist das Formelergebnis auch nach dem Einfugen¨ immer noch das Gleiche.

Aufbau einer Funktion Beispiel einer Funktion in EXCEL:

Funktionen sind Berechnungsanweisungen mit Platzhaltern. Werte, die an die Funktion uber-¨ geben werden, sogenannte Argumente, werden an Stelle der Platzhalter eingesetzt und das Funktionsergebnis kann errechnet werden.

MITTELWERT(ZAHL1;ZAHL2;

)

Bestandteile einer Funktion k¨onnen sein:

Funktionsname (im Beispiel: MITTELWERT)

Funktionsargumente (im Beispiel: ZAHL1; ZAHL2)

Argumente, die unbedingt angegeben werden mussen,¨ werden fett dargestellt, optionale Ar-

gumente sind normal dargestellt. Auslassungspunkte (

Argumente angegeben werden k¨onnen. Einzelne Argumente werden durch ein Semikolon von- einander getrennt. Besteht die Argumentliste aus einer fortlaufenden Sequenz von Zellbezugen,¨ reicht die Eingabe von Beginn und Ende, durch einen Doppelpunkt getrennt (z. B. MITTEL- WERT(C8:C16)). Bei Funktionsargumenten ist auf den passenden Datentyp zu achten (Zahl, Zeichen usw.), wobei die Argumente per Tastatur eingegeben, als Zellbezug gezeigt werden oder selbst wieder Resultat einer anderen Funktion sein k¨onnen (geschachtelte Funktionen).

kennzeichnen, dass mehrere dieser

)

2.1 Datenstruktur und Datenmanagement

15

Eingabe einer Funktion mithilfe des Funktionsassistenten Durchfuhrung¨

Die Zelle fur¨

die Formel ausw¨ahlen.

Den Formelschalter in der Bearbeitungsleiste anklicken.

Aus dem pull-down Menu¨ links des Gleichheitszeichens die gewunschte¨ Funktion aus- w¨ahlen oder uber¨ weitere Funktionen“ das Dialogfenster Funktion ausw¨ahlen“ ¨onen, das alle Funktionen kategorisiert anbietet.

In das sich daraufhin ¨onende Fenster (= Funktionsassistent oder Formelpalette) die Funktionsargumente eingeben, entweder per Tastatur oder durch Zeigen auf die ent- sprechenden Tabellenzellen oder durch Aufruf einer weiteren Funktion (auf diese Weise werden verschachtelte Funktionen gebildet).

OK

Der Funktionsassistent enth¨alt Eingabefelder fur¨ die ben¨otigten Argumente, eine Beschrei- bung der Funktion und der ben¨otigten Argumente.

Beschrei- bung der Funktion und der ben¨otigten Argumente. Abbildung 2.7: Eingabe einer Funktion mit dem

Abbildung 2.7: Eingabe einer Funktion mit dem Funktionsassistenten

16

2. Woche 1

Variablen umkodieren

Anwendungen:

Bilden neuer Variablen, z. B. (neue) Gruppenvariable.

Klassifizierung von Merkmalen, z. B. Bildung von Altersklassen aus dem Merkmal Alter.

Durchfuhrung¨

In die Variablenspalte den neuen Variablennamen eintragen.

Cursor in die erste Zelle der neuen Variablen positionieren.

Je nach Art der Umkodierung, z. B. eine WENN()-Funktion oder verschachtelte WENN()- Funktionen erstellen, mit dem Zellbezug zur entsprechenden Zelle der umzukodierenden Variablen.

Diese Zelle mit der erstellten Funktion kopieren und fur¨ alle weiteren Beobachtungen in die entsprechenden Zellen der neuen Variablenspalte einfugen.¨ Durch das Arbeiten mit relativen Zellbezugen¨ (Voreinstellung) bezieht sich die kopierte Formel jeweils auf die zugeh¨orige Zelle der umzukodierenden Variablen.

auf die zugeh¨orige Zelle der umzukodierenden Variablen. Abbildung 2.8: Umkodierung einer Variablen mit

Abbildung 2.8: Umkodierung einer Variablen mit verschachtelten WENN-Funktionen

2.1 Datenstruktur und Datenmanagement

17

Die Variable WORKOUT“ des Datensatzes Fitness“ ist in eine neue Gruppenvariable GRP NEU“ umkodiert worden. Teilnehmer mit 1 oder 2 Workouts pro Woche bilden die neue Gruppe 1, Teilnehmer mit 3 oder 4 Workouts die Gruppe 2. Teilnehmer ohne Eintrag zum Workout werden keiner Gruppe zugeordnet. Die der Umkodierung zugrunde liegende verschachtelte Wenn-Funktion ist in der Bearbeitungsleiste zu sehen. Das Berechnen einer neuen Variablen aus bereits bestehenden Variablen funktioniert analog zum Umkodieren.

Sortieren von Beobachtungen

Anwendungen:

Information uber¨

die Streuung der Daten (Minima, Maxima, Spannweite).

Datencheck, Ausreißeridentifikation

Neue Anordnung der Beobachtungen, z. B. nach Gruppenzugeh¨origkeit.

Vorbereitung fur¨

Durchfuhrung¨

Auswertungen nach Gruppenzugeh¨origkeit.

Die Originaltabelle kopieren und in ein neues Tabellenblatt einfugen,¨ zustand der Datentabelle zu erhalten (fakultativ).

um den Original-

Die ganze Datentabelle markieren oder den Cursor in eine Zelle der Tabelle positionie- ren.

Das Menu¨ Daten Sortieren aufrufen.

In den Feldern Sortieren nach“, Anschließend nach“, Zuletzt nach“ die Variablen, nach denen sortiert werden soll oder (keine)“ ausw¨ahlen.

Die Sortierreihenfolge aufsteigend“ oder absteigend“

fur¨

jede Sortiervariable angeben.

Angeben, ob die Tabelle einen Zeilenkopf“ (das heißt eine erste Zeile mit Variablenna- men) enth¨alt.

18

2. Woche 1

Hinweise:

Wird statt der ganzen Datentabelle nur die Spalte markiert, nach der sortiert werden soll, so bleiben alle anderen Spalten von der Sortierung unberuhrt.¨ Das bedeutet, dass die Integrit¨at des Datensatzes einer Beobachtung verletzt wird. Bei Daten rechts und links neben der mar- kierten Spalte erkennt EXCEL das Problem und gibt einen entsprechenden Warnhinweis. Soll nach mehr als 3 Variablen sortiert werden, ist obige Prozedur mehrfach durchzufuhren:¨ Begin- nend mit den unbedeutendsten und endend mit den bedeutendsten Sortiermerkmalen. Dabei ist aber innerhalb einer Sortierprozedur wieder mit den bedeutendsten Sortiermerkmalen zu beginnen.

2.2 Erstellen einfacher Grafiken

19

2.2 Erstellen einfacher Grafiken

Oft m¨ochte man seine Daten veranschaulichen oder seine Ergebnisse optisch ansprechend pr¨a-

sentieren, deshalb ist es sinnvoll bereits in EXCEL einfache Grafiken erstellen zu k¨onnen.

Grundlegende Schritte bei der Grafikerstellung in EXCEL:

Markieren Sie die Daten, die grafisch dargestellt werden sollen.

Klicken Sie auf den Button Diagramm-Assistent“ in der Menuleiste.¨

W¨ahlen Sie den gewunschten¨

Diagrammtyp aus.

Folgen Sie den Menuanweisungen¨ fur¨ die Auswahl von Diagrammoptionen und der Plat-

zierung des Diagramms.

Nachbearbeitung von Grafiken ist m¨oglich durch Klicken mit der rechten Maustaste auf

die nachzubearbeitenden Bereiche innerhalb der Grafik. Dadurch wird ein Menu¨ mit

Nachbearbeitungsoptionen ge¨offnet.

Beispiel Kuchendiagramm

¨

1. Offnen Sie den Datensatz Fitness“.

2. Erstellen Sie eine Tabelle, in der fur¨ die jeweiligen Merkmalsauspr¨agungen (1 Workout,

2, 3 oder 4 Workouts) die absoluten H¨aufigkeiten des Vorkommens angegeben werden.

Dazu kann z. B. der Autofilter im Menu¨ Daten Filter benutzt werden. Alternativ

¨

¨

kann auch die Funktion Z AHLENWENN“ verwendet werden, vgl. letzte Ubung.

Ergebnis:

1

workout

10

2

workouts

19

3 workouts

12

4

workouts

4

20

2. Woche 1

4. Klicken Sie auf den Button Diagramm-Assistent“.

5. W¨ahlen Sie in Schritt 1 von 4 des Diagramm-Assistenten den Menupunkt¨ Untertyp aus.

Kreis“, 1.

6. W¨ahlen Sie in Schritt 2 des Diagramm-Assistenten die 1. Spalte der Tabelle als Kreissegment- bzw. Rubrikenachsenbeschriftung aus und versehen Sie die Grafik mit einem Diagramm- titel.

7. W¨ahlen Sie in Schritt 3 im Register Datenbeschriftungen“ den Punkt Beschriftung und Prozent anzeigen“ aus.

8. Mit einem Klick auf Fertig stellen“ wird das Diagramm erstellt.

Klick auf ” Fertig stellen“ wird das Diagramm erstellt. Abbildung 2.9: Kuchendiagramm zur Darstellung der Workouts

Abbildung 2.9: Kuchendiagramm zur Darstellung der Workouts

2.3 Import und Export von Daten

21

2.3 Import und Export von Daten

Zur Sicherstellung des Datenaustauschs mit anderen Programmen bestehen verschiedene M¨og-

lichkeiten Daten zu exportieren oder importieren, von denen im Folgenden einige wichtige

Beispiele aufgefuhrt¨ werden.

Export von EXCEL-Tabellen in andere Programme

Export als Text

Menu:¨ Datei Speichern unter

Dateityp: Es stehen verschiedene Texttypen zur Verfugung,¨ u. a. Formatierter Text

(Leerzeichen getrennt) (*.prn), Text (Tabs getrennt) (*.txt).

Export als Word-Tabelle

EXCEL-Tabelle schließen.

 

¨

In Word: Menu:¨ Datei

Offnen.

Dateityp: Microsoft EXCEL-Arbeitsblatt (*.xls, *xlw)

Oder: Daten der EXCEL-Tabelle kopieren und in Winword einfugen¨

Menu:¨ Bearbeiten Inhalte einfugen

¨

.

Import von SPSS-Dateien

(Cut & Paste).

SPSS-Dateien mussen¨ bereits im SPSS-Programm als EXCEL-Datei gespeichert werden.

SPSS-Menu:¨ Datei Speichern unter.

Dateityp: EXCEL-Datei ausw¨ahlen.

Dateinamen vergeben.

Abspeichern mit OK.

Diese Datei mit dem Suffix .xls kann nun direkt in EXCEL oder auch wieder in SPSS

ge¨offnet werden.

22

2. Woche 1

¨

2.4 Ubung

¨

Ubung: Dateneingabe

Geben Sie ein Geburtsdatum und ein Aufnahmedatum ein.

Formatieren Sie die Zellen in der Weise, dass das Jahrhundert nicht angezeigt wird

(Hinweis: Menu:¨ Format Zellen Registerblatt Zahlen).

Geben Sie in eine beliebige Zelle das Datum 31.01.1900 18:00 ein. Formatieren Sie diese

Zelle als Zahl mit 2 Dezimalstellen, um zu sehen, wie EXCEL intern diese Datumsangabe

gespeichert hat.

Geben Sie die ersten vier Ziffern Ihrer Handynummer ein.

¨

Ubung: Formeln und Funktionen

Berechnen Sie im Datensatz Fitness“ fur¨ die Variablen Ruhefreq1, Messung2, Messung3

die mediane Pulsfrequenz (Hinweis: Funktion MEDIAN).

Bilden Sie eine neue Gruppierungsvariable, die fur¨ alle Beobachtungen mit Ruhefre-

quenzwerten Ruhefreq1 <= 75 den Gruppenwert 1 zuweist und fur¨ alle anderen den

Gruppenwert 2 (Hinweis: Funktion WENN).

¨

Errechnen Sie aus den beiden Datumsangaben aus der Ubung Dateneingabe“ das Al-

ter in ganzen Jahren (Hinweis: Funktion ABRUNDEN((Aufnahmedatum - Geburtsda-

tum)/365; 0).

Selektieren Sie die Frauen aus dem Kollektiv und kopieren Sie die selektierten Daten-

s¨atze in ein neues Tabellenblatt mit dem Namen Frauen“ (Hinweis: Menu:¨ Daten

Autofilter Auswahl der Frauen uber¨ das entsprechende pull-down Menu).¨

*Fur¨ Geubte:¨ Wie h¨aufig fuhren¨ Frauen 1, 2, 3 oder 4 Workouts pro Woche durch

¨

(Hinweis: Funktion Z AHLENWENN, Suchkriterien 1, 2, 3 und 4)?

¨

Ubung: Grafiken

Erstellen Sie aus den H¨aufigkeitsangaben zu den Workouts im Datensatz Fitness“ ein

Kuchendiagramm (Kreisdiagramm) wie im Beispiel.

¨

2.4 Ubung

23

Ver¨andern Sie die Farben der einzelnen Kuchensegmente (Rechtsklicken auf ein einzelnes

Segment Datenpunkt formatieren).

Ver¨andern Sie die Darstellung in 3-D (Rechtsklicken in das Diagramm Diagrammtyp).

Ver¨andern Sie den 3-D Ansichtswinkel durch Nachbearbeitung im Menu¨ 3-D Ansicht.

Erstellen Sie mithilfe des Diagrammassistenten aus den gleichen Daten ein S¨aulendia-

gramm.

¨

Andern Sie den Diagrammtyp des S¨aulendiagramms in ein Kreisdiagramm.

*Fur¨ Geubte:¨ Erstellen Sie aus den beiden Variablen Alter“ und Ruhefre1“ des Da-

tensatzes Fitness“ einen Scatterplot. Benutzen Sie dazu im Diagrammassistenten den

Diagrammtyp Punkt (xy)“. Welchen Zusammenhang erkennt man?

*Fur¨ Geubte:¨ Erstellen Sie mit dem Diagrammtyp Punkt (xy)“ einen zweiten Scatter-

plot aus den Variablen Ruhefre1“ und Messung2“. Welcher Zusammenhang besteht

¨

hier?

Ubung: Datenexport

Transferieren Sie die EXCEL-Tabelle des Datensatzes Fitness“ nach Word.

24

2. Woche 1

Kapitel 3

Woche 2

¨

die vorliegenden

Werte der einzelnen Variablen verschaffen, wobei insbesondere Lage und Verteilung von In-

teresse sind. Durch die deskriptive Analyse lassen sich Besonderheiten in der Datenstruktur

erkennen, zum Beispiel k¨onnen extreme Werte und eventuelle Ausreißer leicht identifiziert wer-

den. Zudem unterstutzt¨ sie die Datenvalidierung, das heißt, Fragen wie Liegen alle Messungen

im dazugeh¨origen Wertebereich?“ oder Gibt es unplausible Werte oder auch Eingabefehler?“

k¨onnen beantwortet werden.

Des Weiteren ist es Aufgabe der deskriptiven Statistik, die Daten zu ordnen sowie grafisch

und mit geeigneten Kennzahlen darzustellen.

Zu Beginn einer Datenanalyse sollte man sich zuerst einen

Uberblick uber¨

In diesem Kurs wird zur Analyse der Daten das Programm SPSS, Version 19 verwendet. Alle

¨

Beispiele und Ubungsaufgaben werden anhand folgendem Datensatz durchgefuhrt:¨

Datensatz Blutdruck“

Im Folgenden handelt es sich um eine klinische Studie, bei der die Wirksamkeit eines neuen

Medikaments zur Blutdrucksenkung gepruft¨ werden soll. Dazu wurden 120 Patienten rekru-

tiert, die zuf¨allig in zwei Behandlungsgruppen aufgeteilt wurden. Die an diesen Patienten

erhobenen Variablen sind in nachstehender Tabelle aufgelistet.

26

3. Woche 2

Variablenbeschreibung

26 3. Woche 2 Variablenbeschreibung

3.1 Erste Schritte

27

3.1 Erste Schritte

Daten in SPSS einlesen

 

¨

Datei

Offnen Daten

gespeicherten Datensatz aufrufen

Es k¨onnen verschiedene Dateitypen eingelesen werden: die ubliche¨ Endung fur¨ SPSS-Dateien

ist *.sav. Es k¨onnen aber auch andere Endungen ausgew¨ahlt werden, wie zum Beispiel *.xls,

*.csv oder *.txt, wobei ein Assistent zum Import der Datei ge¨offnet wird und die Daten Schritt

fur¨ Schritt eingelesen werden. Hinweis: Die zu importierende Datei darf nicht ge¨offnet sein.

Die zu importierende Datei darf nicht ge¨offnet sein. Abbildung 3.1: Datenquelle ¨ o ff n e

Abbildung 3.1: Datenquelle ¨onen

Vorarbeit

Nach dem Einlesen der Datei wird der Dateneditor gestartet. Dieser besteht aus den beiden

Registerkarten Datenansicht (Abb. 3.2), in der der Datensatz angezeigt wird, sowie einer Va-

28

3. Woche 2

28 3. Woche 2 Abbildung 3.2: Datenansicht Abbildung 3.3: Variablenansicht Bevor mit der eigentlichen Analyse begonnen

Abbildung 3.2: Datenansicht

28 3. Woche 2 Abbildung 3.2: Datenansicht Abbildung 3.3: Variablenansicht Bevor mit der eigentlichen Analyse begonnen

Abbildung 3.3: Variablenansicht

Bevor mit der eigentlichen Analyse begonnen werden kann, sollten noch einige Einstellungen

in der Variablenansicht uberpr¨

uft¨

werden:

3.1 Erste Schritte

29

Name: Die Variable kann hier umbenannt werden (Restriktionen: keine Leer- oder Son- derzeichen und keine Zahl am Anfang des Namens)

Typ: ad¨aquates Format der Variable angeben

Spaltenformat: maximale Anzahl der Zeichen, die eingegeben werden kann

Dezimalstellen: Fur¨ werden.

numerische Variablen kann die Anzahl der Dezimalstellen angepasst

Variablenlabel: Soll ein anderer Name fur¨

ein Variablenkurzel¨

in den Outputs angezeigt

werden, so kann das hier eingegeben werden (hier keine Restriktionen).

Wertelabels: Bei nominalen oder kategorialen Merkmalen kann die Zahlenkodierung hier in Worten angegeben werden. Die eingegebene Labels werden sp¨ater bei den Outputs angezeigt.

Labels werden sp¨ater bei den Outputs angezeigt. Abbildung 3.4: Wertelabels • Fehlende Werte: Eine

Abbildung 3.4: Wertelabels

Fehlende Werte: Eine spezielle Kodierung (z.B. -999) kann hier als fehlender Wert defi- niert werden.

Spalten: angezeigte Spaltenbreite in der Datenansicht

Ausrichtung: Ausrichtung der Daten in der Datenansicht (links, mittig oder rechts)

Messniveau: Skala, Ordinal, Nominal; Dieses Feld muss fur¨ jede Variable spezifiziert sein: wichtig fur¨ Auswahl statistischer Tests und Grafiken.

Rolle: Rolle der Variable im Datensatz (z.B. Eingabevariable oder Zielvariable)

30

3. Woche 2

Die Ergebnisse zu den durchgefuhrten¨

ten Fenster, dem Ausgabefenster dargestellt:

Analysen (Tabellen, Grafiken,

)

werden in einem drit-

den durchgefuhrten¨ ten Fenster, dem Ausgabefenster dargestellt: Analysen (Tabellen, Grafiken, ) werden in einem drit-

3.2 Deskriptive Statistik, Maßzahlen und tabellarische Darstellung

31

3.2 Deskriptive Statistik, Maßzahlen und tabellarische Dar- stellung

In der Statistik unterscheidet man zwei Merkmalstypen:

Quantitative Merkmale:

Die Auspr¨agungen dieser Merkmale entsprechen Messungen oder Z¨ahlungen (quantum = Menge).

Qualitative Merkmale:

Fur¨ die Auspr¨agungen dieser Merkmale existiert keine sinnvolle Metrik. Nominale Merk- male lassen sich nur benennen, wie z. B. Haarfarbe, Blutgruppe, Medikament. Ordinalen Merkmalen liegt eine Rangfolge zugrunde, Differenzen oder Quotienten sind jedoch nicht interpretierbar.

Hintergrund

Quantitative Gr¨oßen werden wiederum in intervall- und verh¨altnisskalierte Merkmale ein- geteilt. Bei intervallskalierten Gr¨oßen kann nur die Differenz betrachtet werden, da der Null- punkt willkurlich¨ festgelegt ist. Beispiel hierfur¨ ist die Temperatur in Grad Celsius. Bei ver- h¨altnisskalierten Merkmalen k¨onnen auch Quotienten miteinander verglichen werden, da der Nullpunkt absolut ist, wie z. B. beim metrischen L¨angenmaß. Fur¨ stetige Variablen berech- net man statistische Maßzahlen wie Mittelwert, Standardabweichung, Minimum, Maximum, Quartile etc., die Lage und Streuung der erhobenen Werte beschreiben. Grafisch werden die Verteilungen oft durch Boxplots oder Fehlerbalken dargestellt. Qualitative Gr¨oßen teilen sich auf in ordinal- und nominalskalierte Merkmale. Ordinalska- lierte Merkmale k¨onnen bezuglich¨ ihrer Auspr¨agungen in einer Rangfolge geordnet werden. Die Abst¨ande zwischen den Werten sind jedoch nicht definiert, z. B. Schweregrad einer Erkran- kung. Die Nominalskala setzt hingegen nur Gleichheit oder Ungleichheit von Eigenschaften (z. B. Geschlecht) bzw. die M¨oglichkeit mehrklassiger Einteilungen (z. B. Beruf, Muttersprache, Studienzentrum etc.) in Kategorien voraus. Fur¨ qualitative Merkmale berechnet man in der Regel relative oder absolute H¨aufigkeiten und stellt diese mithilfe von S¨aulendiagrammen dar.

32

3. Woche 2

Die Unterscheidung stetig und diskret wird oft als Synonym fur¨ quantitativ und qualitativ

verwendet, es lassen sich jedoch auch quantitative Merkmale in diskret und stetig unterschei-

den. Diskrete Merkmale k¨onnen nur bestimmte Werte annehmen. Beispiele sind die Zahl der

Kinder einer Familie oder die Zahl der im letzten Jahr zugelassenen Medikamente. Zwischen-

werte gibt es nicht. Stetige Merkmale (Synonyme: kontinuierlich, metrisch) k¨onnen hingegen

jeden Zwischenwert annehmen. Diese Gr¨oßen beruhen auf instrumentelle Messungen wie z.

B. Gewicht und K¨orpergr¨oße.

Statistische Maßzahlen sind eine Zusammenfassung der vorhandenen Dateninformation. Fur¨

quantitative Gr¨oßen beschreiben diese charakteristischen Kennzahlen u. a. Lage und Streuung

einer Verteilung. Die wichtigsten Lagemaße sind der Median bzw. Zentralwert und der Mit-

telwert, auch arithmetisches Mittel genannt. Der Mittelwert ist die Summe der Einzelwerte

geteilt durch die Anzahl der Einzelwerte.

x¯ = 1

n

n

i=1

x i

(3.2.1)

Den Median erh¨alt man, indem die beobachteten Werte in aufsteigender Reihenfolge sortiert

werden. Bei einer ungeraden Anzahl an Beobachtungen ist der Median der Wert der mittleren

Beobachtung, ansonsten der Mittelwert aus den beiden mittleren Beobachtungen.

x 50% =


  x ( n+1

2

) ,

2 x ( n ) + x ( n

1

2

2

+1) ,

f alls n ungerade

f alls n gerade

(3.2.2)

Weitere Lagemaße sind Quantile, die man beliebig uber¨ den Parameter α, α (0, 1) definieren

kann. Sie geben den Wert an, den der definierte Anteil der Daten nicht uberschreitet.¨ Beispiel:

α = 30%, d. h. 30% der Daten sind kleiner gleich diesem Wert. Eine m¨ogliche Berechnungs-

formel lautet:

Dabei steht N fur¨

x α =

 

x ([nα]+1) ,

1 2 x ()

f alls nα / N

+ x (nα+1) , f alls nα N

die naturlichen¨

Zahlen und [ ] fur¨

einen ganzzahligen Rest.

(3.2.3)

3.2 Deskriptive Statistik, Maßzahlen und tabellarische Darstellung

33

Spezialf¨alle der Quantile sind die Quartile, die die Daten in 4 Teile teilen, also fur¨ (25%, 50%, 75%):

Unteres Quartil = 25% Quantil = x 25%

Median = 50% Quantil = x 50%

Oberes Quartil = 75% Quantil = x 75%

α

H¨aufig verwendete Streuungsmaße (Dispersionsmaße) zur Beschreibung der Datenvariabilit¨at sind die Varianz s 2 bzw. ihre Quadratwurzel, die Standardabweichung s.

s 2 =

s

=

1

n 1

+ s 2

n

i=1

(x i x¯) 2

(3.2.4)

Eine weiteres Streuungsmaß ist der Variationskoeffizient, bei dem die Standardabweichung durch den Mittelwert geteilt wird. Dieser relative Ausdruck ist eine dimensionslose Gr¨oße und daher unabh¨angig von der Maßskala. Dies erm¨oglicht den Vergleich von Messungen in unterschiedlichen Einheiten, wie z. B. bei Laborparametern, die in mg, mmol etc. erhoben werden. Voraussetzung fur¨ die sinnvolle Verwendung des Variationskoeffizienten ist, dass eine verh¨altnisskalierte Variable vorliegt.

34

3. Woche 2

Beispiel

In unserem Beispieldatensatz Blutdruck.sav befinden sich die Daten von 120 Hypertonikern,

von denen Blutdruckmessungen und einige Parameter zu Studienbeginn, nach einem Monat

und nach 12 Monaten medikament¨oser Therapie erhoben wurden.

Ziel:

Uberblick verschaffen und sie

durch H¨aufigkeiten und statistische Maßzahlen beschreiben. Es interessiert uns, wieviele M¨an-

ner und Frauen an der Studie teilgenommen haben, wie sie auf beide Medikamentengruppen

Zun¨achst wollen wir uns uber¨ die vorhandenen Daten einen

¨

aufgeteilt sind und wie deren Blutdruckverteilung zu Beginn aussieht. Schließlich wollen wir

die Blutdruckverteilung beider Geschlechter in jeder Behandlungsgruppe betrachten.

Durchfuhrung¨

H¨aufigkeiten von M¨annern und Frauen

Analysieren Tabellen Benutzerdefinierte Tabellen

ok

Variablen: Geschlecht auf Spalten ziehen

Definieren: Auswertungsstatistik

Anzahl als Zeilen% in Statistik ausw¨ahlen und mit Pfeil zu Anzeigen hinzufugen¨

Der Auswahl zuweisen

Definieren: Kategorien und Gesamtsummen

Auch anzeigen: Gesamtergebnis

Zuweisen

ok

3.2 Deskriptive Statistik, Maßzahlen und tabellarische Darstellung

35

H¨aufigkeiten von M¨annern und Frauen pro Behandlungsgruppe

Analysieren Tabellen Benutzerdefinierte Tabellen ok Variablen: Geschlecht auf Spalten ziehen Definieren: Auswertungsstatistik Anzahl als Zeilen% in Statistik ausw¨ahlen und mit Pfeil zu Anzeigen hinzufugen¨ Der Auswahl zuweisen Definieren: Kategorien und Gesamtsummen Auch anzeigen: Gesamtergebnis Zuweisen Variablen: Behandlung auf Zeilen ziehen Definieren: Kategorien und Gesamtsummen Auch anzeigen: Gesamtergebnis Zuweisen ok

und Gesamtsummen Auch anzeigen: Gesamtergebnis Zuweisen ok Abbildung 3.5: Eingabemenu¨ Benutzerdefinierte Tabellen

Abbildung 3.5: Eingabemenu¨ Benutzerdefinierte Tabellen

36

3. Woche 2

36 3. Woche 2 Abbildung 3.6: Eingabemenu¨ Auswertungsstatistik Ausgabe Abbildung 3.7: H¨aufigkeiten von M¨annern und

Abbildung 3.6: Eingabemenu¨ Auswertungsstatistik

Ausgabe

2 Abbildung 3.6: Eingabemenu¨ Auswertungsstatistik Ausgabe Abbildung 3.7: H¨aufigkeiten von M¨annern und Frauen in

Abbildung 3.7: H¨aufigkeiten von M¨annern und Frauen in jeder Medikamentengruppe

3.2 Deskriptive Statistik, Maßzahlen und tabellarische Darstellung

37

Blutdruckverteilung von M¨annern und Frauen

Analysieren Tabellen Benutzerdefinierte Tabellen ok Variablen: Blutdruck 0 auf Spalten ziehen Definieren: Auswertungsstatistik Standardabweichung in Statistik ausw¨ahlen und mit Pfeil zu Anzeigen hinzufugen¨ Der Auswahl zuweisen Variablen: Geschlecht auf Zeilen ziehen Definieren: Kategorien und Gesamtsummen Auch anzeigen: Gesamtergebnis Zuweisen ok

Blutdruckverteilung von M¨annern und Frauen pro Behandlungsgruppe

Analysieren Tabellen Benutzerdefinierte Tabellen ok Variablen: Blutdruck 0 auf Spalten ziehen Definieren: Auswertungsstatistik Standardabweichung in Statistik ausw¨ahlen und mit Pfeil zu Anzeigen hinzufugen¨ Der Auswahl zuweisen Variablen: Geschlecht auf Spalten ziehen Definieren: Kategorien und Gesamtsummen Auch anzeigen: Gesamtergebnis Zuweisen Variablen: Behandlung auf Zeilen ziehen Definieren: Kategorien und Gesamtsummen Auch anzeigen: Gesamtergebnis Zuweisen ok

38

3. Woche 2

38 3. Woche 2 Abbildung 3.8: Eingabemenu¨ Benutzerdefinierte Tabellen Abbildung 3.9: Eingabemenu¨ Auswertungsstatistik

Abbildung 3.8: Eingabemenu¨ Benutzerdefinierte Tabellen

38 3. Woche 2 Abbildung 3.8: Eingabemenu¨ Benutzerdefinierte Tabellen Abbildung 3.9: Eingabemenu¨ Auswertungsstatistik

Abbildung 3.9: Eingabemenu¨ Auswertungsstatistik

3.2 Deskriptive Statistik, Maßzahlen und tabellarische Darstellung

39

Ausgabe

Maßzahlen und tabellarische Darstellung 39 Ausgabe Abbildung 3.10: Mittelwert und Standardabweichung fur¨ den

Abbildung 3.10: Mittelwert und Standardabweichung fur¨ den Blutdruck von M¨annern und Frauen in jeder Medikamentengruppe

Interpretation

In unserer Studie ist das Verh¨altnis von M¨annern zu Frauen in etwa 1:1. Dies gilt auch fur¨ die

beiden Behandlungsgruppen. Insgesamt haben die Frauen einen leicht niedrigeren Blutdruck-

Ausgangswert, was ebenso fur¨ die beiden Behandlungsgruppen gilt. Zwischen den Behand-

lungsgruppen sind die Blutdruck-Ausgangswerte in den Geschlechtern aber ann¨ahernd gleich.

Zieht man die Standardabweichung hinzu, so erkennt man, dass die Unterschiede nicht sehr

groß sind. Beide Behandlungen sind hinsichtlich dieser Baseline-Variablen vergleichbar.

Die Frage, ob die beobachteten Blutdruckunterschiede statistisch zuf¨allig sind oder ein signi-

fikanter Unterschied nachgewiesen werden kann, l¨asst sich mit den in Kapitel 5 beschriebenen

statistischen Tests untersuchen.

40

3. Woche 2

3.3

Grafiken

Die bekanntesten Darstellungsformen kategorialer oder diskreter Merkmale sind S¨aulen-, Balken- und Kreisdiagramme. Sie sind vor allem angebracht, wenn die Anzahl k der verschiedenen Merkmalsauspr¨agungen klein ist. Wir wollen uns hierbei auf das S¨aulendiagramm beschr¨an- ken.

wollen uns hierbei auf das S¨aulendiagramm beschr¨an- ken. Abbildung 3.11: S¨aulen-, Balken- und Kreisdiagramm 3.3.1

Abbildung 3.11: S¨aulen-, Balken- und Kreisdiagramm

3.3.1

S¨aulendiagramm

Hintergrund

Bei einem S¨aulendiagramm werden auf horizontaler Achse die verschiedenen Auspr¨agungen einer diskreten Variablen abgetragen und auf der vertikalen die absoluten bzw. relativen H¨au- figkeiten der jeweiligen Auspr¨agung in Form einer S¨aule dargestellt. Diese Rechtecke werden mittig uber¨ die Auspr¨agung gezeichnet und stoßen nicht aneinander. Das Balkendiagramm ergibt sich als Variante, indem man die beiden Achsen vertauscht. Das S¨aulendiagramm erm¨oglicht es, bei ordinalskalierten Daten die Rangfolge mit darzustellen. Dies ist bei der Darstellung durch ein Kreisdiagramm nicht m¨oglich.

3.3 Grafiken

41

Beispiel

Die oben berechneten H¨aufigkeiten aus unserem Beispieldatensatz Blutdruck.sav wollen wir nun grafisch darstellen. Wir tragen dazu die absoluten bzw. relativen H¨aufigkeiten von M¨an- nern und Frauen in der Studie in einem S¨aulendiagramm ab. Die bedingten relativen H¨aufigkeiten der Geschlechter in jeder Behandlungsgruppe lassen sich in einem gruppierten S¨aulendiagramm darstellen. Dabei entspricht die bedingte relative H¨au- figkeit eines Geschlechts einzelnen S¨aulen oder sie l¨asst sich durch den fl¨achenm¨aßigen Anteil an der S¨aule der jeweiligen Behandlungsgruppe darstellen.

Durchfuhrung¨

H¨aufigkeiten von M¨annern und Frauen

Diagramme Diagrammerstellung Galerie Balken Einfache Balken ausw¨ahlen Variablen Geschlecht auf x-Achse? ziehen

Elementeigenschaften: Statistik Anzahl fur¨ figkeiten ausw¨ahlen Zuweisen ok

absolute oder Prozentsatz() fur¨

relative H¨au-

42

3. Woche 2

42 3. Woche 2 Abbildung 3.12: Eingabemenu¨ Balkendiagramm ( einfach ) Ausgabe Abbildung 3.13: Absolute H¨aufigkeiten
42 3. Woche 2 Abbildung 3.12: Eingabemenu¨ Balkendiagramm ( einfach ) Ausgabe Abbildung 3.13: Absolute H¨aufigkeiten

Abbildung 3.12: Eingabemenu¨ Balkendiagramm (einfach)

Ausgabe

3.12: Eingabemenu¨ Balkendiagramm ( einfach ) Ausgabe Abbildung 3.13: Absolute H¨aufigkeiten von M¨annern und

Abbildung 3.13: Absolute H¨aufigkeiten von M¨annern und Frauen (gr¨oßere Achsenbeschrif- tung)

Die Diagramme k¨onnen in SPSS nachtr¨aglich noch bearbeitet werden, indem durch Dop-

pelklick auf die Grafik der Diagramm-Editor gestartet wird. Entsprechende Details (Farben,

3.3 Grafiken

43

H¨aufigkeiten von M¨annern und Frauen pro Behandlungsgruppe

Diagramme Diagrammerstellung Galerie Balken Gruppierte Balken ausw¨ahlen Variablen Behandlung auf x-Achse? ziehen Variablen Geschlecht auf Clustervariable auf X: Farbe festlegen ziehen Elementeigenschaften: Statistik Prozentsatz() ausw¨ahlen Zuweisen ok durch Doppelklick den Diagramm-Editor starten Elemente Datenbeschriftungen ein- blenden Anzahl in Angezeigt: schieben Zuweisen Diagramm-Editor schließen

in Angezeigt: schieben Zuweisen Diagramm-Editor schließen Abbildung 3.14: Eingabemenu¨ Balkendiagramm ( gruppiert )
in Angezeigt: schieben Zuweisen Diagramm-Editor schließen Abbildung 3.14: Eingabemenu¨ Balkendiagramm ( gruppiert )

Abbildung 3.14: Eingabemenu¨ Balkendiagramm (gruppiert)

44

3. Woche 2

Werden als y-Achse die Prozentwerte ausgegeben, kann bei der Diagrammerstellung wie oben unter Elementeigenschaften Statistiken Prozentsatz Parameter festlegen zuweisen

der Nenner fur¨

die Prozentberechnung angegeben werden.

der Nenner fur¨ die Prozentberechnung angegeben werden. Abbildung 3.15: Wahlm¨oglichkeit fur¨ Ausgabe die

Abbildung 3.15: Wahlm¨oglichkeit fur¨

Ausgabe

die Berechnung der Prozentwerte

fur¨ Ausgabe die Berechnung der Prozentwerte Abbildung 3.16: Gesamtverteilung von Therapie und Geschlecht

Abbildung 3.16: Gesamtverteilung von Therapie und Geschlecht ( Gesamtergebnis“)

3.3 Grafiken

45

3.3 Grafiken 45 Abbildung 3.17: Geschlechterverteilung in den Behandlungsgruppen ( ” fur¨ Kategorie“) jede

Abbildung 3.17: Geschlechterverteilung in den Behandlungsgruppen ( fur¨ Kategorie“)

jede X-Achsen-

( ” fur¨ Kategorie“) jede X-Achsen- Abbildung 3.18: Therapieverteilung in den

Abbildung 3.18: Therapieverteilung in den Geschlechtergruppen ( fur¨

gendenvariablen (selbe Fullfarbe)¨

“)

jede Kategorie der Le-

Zur alternativen Darstellung der bedingten H¨aufigkeiten des Geschlechts durch den fl¨achen-

m¨aßigen Anteil an einer S¨aule verf¨ahrt man wie oben, jedoch w¨ahlt man im ersten Menufenster¨

Gestapelte Balken statt Gruppierte Balken aus:

Diagramme Diagrammerstellung Galerie Balken

Gestapelte Balken ausw¨ahlen

46

3. Woche 2

Interpretation

Die grafische Darstellung sollte immer mit den berechneten H¨aufigkeiten verglichen werden, um m¨ogliche Fehlinterpretationen zu vermeiden. Schließlich soll eine Grafik die Ergebnisse unterstreichen bzw. verdeutlichen. In den S¨aulendiagrammen der absoluten H¨aufigkeiten des Geschlechts sowie der relativen H¨aufigkeiten bedingt auf die Medikamentengruppe spiegelt sich das Verh¨altnis von etwa 1:1 von M¨annern zu Frauen wider. Es sind etwas mehr Patienten in der Alphasan-Behandlungsgruppe.

3.3.2

Boxplot

Fur¨ eine zusammenfassende Beschreibung von Verteilungen mussen¨ Lage- und Streuungsmaße angegeben werden. So kann etwa in zwei Behandlungsgruppen der mittlere Blutdruck identisch sein, obwohl in einer Gruppe erhebliche Schwankungen vorliegen, w¨ahrend die andere Gruppe recht homogen ist. Die oben erw¨ahnten Quantile und die daraus abgeleiteten Boxplots als grafische Zusammenfassung sind geeignete Mittel, um die Verteilung der Daten punktuell zu charakterisieren. Gruppenunterschiede, Symmetrie bzw. Schiefe der Verteilungen sind sofort sichtbar. Hierbei werden keine Voraussetzungen wie Symmetrie oder Normalverteilung an die Daten gestellt. Viele statistische Softwarepakete, wie auch SPSS, stellen Ausreißer, also Beobachtungen, die relativ zu ihrer Gruppe sehr extrem ausfallen, als einzelne Datenpunkte dar. Dadurch lassen sich mithilfe des Boxplots auch Extremwerte einfach identifizieren.

Hintergrund

Die oben definierten Quartile (vgl. Abschnitt 3.2 Seite 33) geben zusammen mit dem Median auf einfache Art Hinweise auf die Verteilung der Daten: Unterhalb des unteren Quartils liegen etwa 25% der Daten und oberhalb des oberen Quartils ebenfalls etwa 25%. Im mittleren Bereich liegen die restlichen 50% der Daten. Ist die Verteilung ann¨ahernd symmetrisch zum Median, so sind x 25% und x 75% etwa gleich weit vom Median entfernt. Andernfalls ist die Verteilung schief.

3.3 Grafiken

47

Die Quartile geben auch Aufschluss daruber,¨

sende Maßzahl hierfur¨

wie groß die Streuung der Daten ist. Eine pas-

ist der Interquartilsabstand:

IQR = x 75% x 25%

(3.3.5)

Interessant fur¨ die Verteilung sind außerdem die beiden Extremwerte x min = x (1) und x max = x (n) . Die Differenz dieser beiden Werte wird als Spannweite oder Range bezeichnet. Die Quartile, Minimum und Maximum teilen den Datensatz somit in vier Teile, wobei jeder Teil ein Viertel der Beobachtungswerte enth¨alt. Diese vier Werte bilden zusammen mit dem Median die Funf-Punkte-Zusammenfassung¨ , die als Boxplot visulalisiert wird:

Boxplot

1. x 25% = Anfang der Box x 75% = Ende der Box IQR = L¨ange der Box

2. Median = durchgezogene Linie innerhalb der Box

3. Zwei Linien ( whiskers“) außerhalb der Box gehen bis zu x min und x max

Modifizierter Boxplot

Eine Faustregel zur Identifizierung von Ausreißern, die auch SPSS verwendet, ist: Bilde den inneren Zaun“ mit der Untergrenze z u = x 25% 1.5 IQR und der Obergrenze z o = x 75% + 1.5 IQR. Daten kleiner als z u und gr¨oßer als z o sind dann Ausreißerkandidaten, die genauer zu inspizieren sind. Die Linien außerhalb der Box ( whiskers“) werden nur bis zu x min bzw. x max gezogen, falls x min und x max innerhalb des Bereichs [z u , z o ] der Z¨aune liegen. Ansonsten gehen die Linien nur bis zum kleinsten bzw. gr¨oßten Wert innerhalb der Z¨aune. Die außerhalb liegenden Werte werden individuell eingezeichnet, in SPSS als Punkte (Ausreißer, mehr als 1.5 IQR von Ober- oder Untergrenze entfernt) bzw. Sterne (Fernpunkte, mehr als 3 IQR von Ober- oder Untergrenze entfernt). Die mit angegebenen Zahlen entsprechen der Zeilennummer im Datensatz.

48

3. Woche 2

Bei Bedarf kann diese Zahl im Diagrammeditor Button Datenbeschriftungsmodus“ auf den Punkt/Stern klicken, ein- oder ausgeblendet werden.

auf den Punkt/Stern klicken, ein- oder ausgeblendet werden. Abbildung 3.19: Boxplot Abbildung 3.20: Modifizierter

Abbildung 3.19: Boxplot

ein- oder ausgeblendet werden. Abbildung 3.19: Boxplot Abbildung 3.20: Modifizierter Boxplot Beispiel Das stetige

Abbildung 3.20: Modifizierter Boxplot

Beispiel

Das stetige Merkmal Blutdruck 0“ l¨asst sich durch einen Boxplot univariat beschreiben, mit Hinzunahme der Behandlungsgruppe als Faktor lassen sich die Blutdruckverteilungen fur¨ jede Behandlungsgruppe darstellen und damit visuell vergleichen.

Durchfuhrung¨

Diagramme Diagrammerstellung Galerie Boxplot Einfacher Boxplot ausw¨ahlen Variablen Behandlung auf x-Achse? ziehen Variablen Blutdruck 0 auf y-Achse? ziehen ok

3.3 Grafiken

49

3.3 Grafiken 49 Abbildung 3.21: Eingabemenu¨ Boxplot ( einfach ) Ausgabe Abbildung 3.22: Blutdruckverteilung in den

Abbildung 3.21: Eingabemenu¨ Boxplot (einfach)

Ausgabe

49 Abbildung 3.21: Eingabemenu¨ Boxplot ( einfach ) Ausgabe Abbildung 3.22: Blutdruckverteilung in den beiden

Abbildung 3.22: Blutdruckverteilung in den beiden Behandlungsgruppen

50

3. Woche 2

Blutdruckverteilung von M¨annern und Frauen pro Behandlungsgruppe

Diagramme Diagrammerstellung Galerie Boxplot Gruppierter Boxplot ausw¨ahlen Variablen Behandlung auf x-Achse? ziehen Variablen Blutdruck 0 auf y-Achse? ziehen Variablen Geschlecht auf Clustervariable auf X: Farbe festlegen ziehen ok

Geschlecht auf Clustervariable auf X: Farbe festlegen ziehen ok Abbildung 3.23: Eingabemenu¨ Boxplot ( gruppiert )

Abbildung 3.23: Eingabemenu¨ Boxplot (gruppiert)

3.3 Grafiken

51

Ausgabe

3.3 Grafiken 51 Ausgabe Abbildung 3.24: Blutdruckverteilung von M¨annern und Frauen pro Behandlungsgruppe (Nr. 12

Abbildung 3.24: Blutdruckverteilung von M¨annern und Frauen pro Behandlungsgruppe (Nr. 12 entspricht Beobachtungsnummer im Datensatz)

¨

Anderung der Skala der y-Achse

H¨aufig beginnt die y-Achse in SPSS bei 0. In manchen F¨allen ist es aber erwunscht,¨

deutlichung nur den Abschnitt zu zeigen, in dem sich auch die Daten befinden. Dies kann im

Nachhinein noch wie folgt ge¨andert werden:

Doppelklick auf Grafik

im Diagrammeditor Die y-Achse ausw¨ahlen

Skala

Minimum auf 120 setzen

zuweisen

zur Ver-

52

3. Woche 2

52 3. Woche 2 ¨ Abbildung 3.25: Eingabemenu¨ Andern der Skala Ausgabe Abbildung 3.26: Blutdruckverteilung von

¨

52 3. Woche 2 ¨ Abbildung 3.25: Eingabemenu¨ Andern der Skala Ausgabe Abbildung 3.26: Blutdruckverteilung von

Abbildung 3.25: Eingabemenu¨ Andern der Skala

Ausgabe

2 ¨ Abbildung 3.25: Eingabemenu¨ Andern der Skala Ausgabe Abbildung 3.26: Blutdruckverteilung von M¨annern und Frauen

Abbildung 3.26: Blutdruckverteilung von M¨annern und Frauen pro Behandlungsgruppe mit ge¨anderter y-Skalierung

3.3 Grafiken

53

Interpretation

Der Blutdruck-Ausgangswert ist in beiden Behandlungsgruppen nahezu gleich (Median ca. 150 mmHg). Die Boxengr¨oßen sind ebenfalls fast gleich groß, d.h. die mittleren 50% haben eine ¨ahnlich große Streuung in beiden Gruppen. Die Verteilung bei der Betasan-Behandlungsgruppe ist sehr symmetrisch um den Median, wohingegen der Median bei der Alphasan-Behandlungs- gruppe etwas n¨aher am 25%-Quantil liegt (linkssteile Verteilung). Ausreißer gibt es keine. Die Frauen der Alphasan-Behandlungsgruppe haben zu Beginn einen ¨ahnlichen Blutdruck in Vergleich zur Betasan-Behandlungsgruppe, jedoch die mitlleren 50% der Frauen sind in der Alphasan-Behandlungsgruppe wesentlich homogener. Die Blutdruckverteilung der M¨anner ist in beiden Behandlungsgruppen sehr ¨ahnlich. Keine Verteilung ist exakt symmetrisch um den Median. Bei den Frauen in der Alphasan-Behandlungsgruppe gibt es formal einen Ausreißer, was durch den vergleichsweise kleinen Interquartilsabstang IQR bedingt ist. Alternative: Histogramm

54

3. Woche 2

¨

3.4 Ubungsaufgaben

¨

Verwenden Sie fur¨

Ergebnisse zu interpretieren.

Zum Nachweis eines Therapieeffekts in einer klinischen Studie sollten die beiden Behand-

lungsgruppen zu Beginn der Studie hinsichtlich s¨amtlicher Variablen vergleichbar sein. Erst

die Ubungen den Datensatz Blutdruck.sav und versuchen Sie auch, die

dann kann ein beobachteter Effekt der Therapie zugeschrieben werden. Wie wir bereits gese-

hen haben gibt es keinen Unterschied in der Geschlechts- und Blutdruckverteilung zu Beginn

zwischen beiden Behandlungsgruppen.

¨

1. Sie daruber¨

Uberprufen¨

hinaus, ob sich die beiden Behandlungsgruppen hinsichtlich der

K¨orpergr¨oße und des Alters ¨ahnlich sind. Verwenden Sie dazu ausschließlich die M¨og-

lichkeiten der deskriptiven Statistik und stellen Sie den Vergleich durch Berechnung

von geeigneten Maßzahlen an. Daruber¨ hinaus vergleichen Sie auch den Cholesterin-

Ausgangswert, sowie die BMI-Kategorien beider Behandlungsgruppen. Stellen Sie die

Ergebnisse ubersichtlich¨ und sinnvoll dar! Vergessen Sie nicht durch eine grafische Dar-

stellung die Zahlen zu verdeutlichen.

2. Stellen Sie die relativen H¨aufigkeiten des Geschlechts in jeder Behandlungsgruppe dar.

Verwenden Sie dazu entweder die Option clustered oder stacked. Interpretieren Sie das

Ergebnis vor dem Hintergrund der berechneten H¨aufigkeiten richtig.

3. Fleißaufgabe (nicht behandelt): Machen Sie sich mit dem Chart Editor vertraut. Spielen

Sie ein wenig mit der Achsenskalierung, -beschriftung etc

3.5 L¨osungsvorschlag

55