Sie sind auf Seite 1von 28

Statistik

mit R
Erwin Grner
Veranstaltungs-
beschreibung
Einfhrung
Entw.umgebung
Erste Schritte
Hilfen
Statistik mit R
Erwin Grner
FB Psychologie Uni Marburg
27.10.2005
Statistik
mit R
Erwin Grner
Veranstaltungs-
beschreibung
Einfhrung
Entw.umgebung
Erste Schritte
Hilfen
Themenbersicht
Veranstaltungsbeschreibung
Inhalte der Lehrveranstaltung
Lernziel
Ablauf
Organisatorische Hinweise
Einfhrung
Was ist R?
Eigenschaften von R
Nachteile von R
Einige Packages
Web-Adressen
Literatur zu S/S-Plus und R
Die Entwicklungsumgebung
Arbeitsweise von R
Fenster und Mens
Tastatureingaben
Erste Schritte
Aufruf von Demoprogrammen
Eingabe von Ausdrcken
Verwendung eines eingebauten Datensatzes
Zugri auf die Variablen eines Datensatzes
Aufruf von Hypothesentests
Hilfen
Statistik
mit R
Erwin Grner
Veranstaltungs-
beschreibung
Inhalte
Lernziel
Ablauf
Hinweise
Einfhrung
Entw.umgebung
Erste Schritte
Hilfen
Inhalte der Lehrveranstaltung
Einfhrung in die Mglichkeiten und Konzepte von R
Praxisorientierte Einfhrung in die Arbeit mit R
Verwendung von GUIs
Arbeiten im Kommandofenster
Anwendungen aus verschiedenen Bereichen der Statistik
(z. B. EDA, lineare Modelle)
Entwicklung eigener Funktionen
Statistik
mit R
Erwin Grner
Veranstaltungs-
beschreibung
Inhalte
Lernziel
Ablauf
Hinweise
Einfhrung
Entw.umgebung
Erste Schritte
Hilfen
Lernziel
Anwendung von Standardverfahren zur Statistik und
Graphik
Erstellung mageschneiderter, spezieller Lsungen bei
komplexeren Auswertungsproblemen
Zielgruppe: Mitarbeiter von Forschungsprojekten,
Diplomanden
Statistik
mit R
Erwin Grner
Veranstaltungs-
beschreibung
Inhalte
Lernziel
Ablauf
Hinweise
Einfhrung
Entw.umgebung
Erste Schritte
Hilfen
Ablauf
Die Veranstaltung besteht aus zwei gleich gewichtigen
Teilen:
Vorlesung
Vermittlung der neuen Inhalte
Anwendungsbeispiele
Demonstrationen am PC
Praktische bung im PC-Saal
Statistik
mit R
Erwin Grner
Veranstaltungs-
beschreibung
Inhalte
Lernziel
Ablauf
Hinweise
Einfhrung
Entw.umgebung
Erste Schritte
Hilfen
Organisatorische Hinweise
Benutzung der Rechner im PC-Saal
Webseite (Folien, bungsaufgaben, . . . )
Schein
. . .
Statistik
mit R
Erwin Grner
Veranstaltungs-
beschreibung
Einfhrung
Was ist R
Eigenschaften
Nachteile
Packages
Web-Adressen
Literatur
Entw.umgebung
Erste Schritte
Hilfen
Was ist R?
R ist eine umfassende Software fr die Analyse und
Visualisierung von Daten.
R ist GNU S, d.h. eine unter der GNU-Lizenz
stehende Implementierung von S. Damit ist R freie
Software, d.h. auch kostenlos.
S wurde bei AT&T Bell Laboratories von John
Chambers und Mitarbeitern entwickelt
1
.
S-Plus ist eine kommerzielle Implementierung von S.
R ist ein Dialekt von S: uerlich weitgehend identisch,
aber innere Unterschiede sind vorhanden.
Die meisten S- bzw. S-Plus-Programme laufen auch
unter R.
1
Titel des Blue Book (Becker, Chambers & Wilks): The New S
Language. A Programming Environment for Data Analysis and
Graphics
Statistik
mit R
Erwin Grner
Veranstaltungs-
beschreibung
Einfhrung
Was ist R
Eigenschaften
Nachteile
Packages
Web-Adressen
Literatur
Entw.umgebung
Erste Schritte
Hilfen
Eigenschaften von R
Funktionsvielfalt
Dierenzierte Datentypen und -strukturen, viele
eingebaute Funktionen, Funktionsbibliotheken fr viele
Anwendungen
Erweiterbarkeit
Entwicklungsumgebung und Programmiersprache
Objektorientiertheit
Alle Gren (auch die Ausgaben von Funktionen) sind
Objekte, auf die man Zugri hat.
Oenheit
Datenschnittstelle zu SPSS, SAS u.a.
Statistikdatenformaten
Statistik
mit R
Erwin Grner
Veranstaltungs-
beschreibung
Einfhrung
Was ist R
Eigenschaften
Nachteile
Packages
Web-Adressen
Literatur
Entw.umgebung
Erste Schritte
Hilfen
Eigenschaften von R (Forts.)
Open Source
Freie Software, Quelltext verfgbar, kostenfrei
Qualitt
Weltweite renommierte Entwicklergemeinde
Aktualitt
Neue Algorithmen sind im allgemeinen implementiert
Universalitt
Luft unter allen gngigen Betriebssystemen
Umfangreiche Dokumentation, Support
Bcher und Artikel, pdf-Dateien, Online-Hilfen,
Mailinglisten
Statistik
mit R
Erwin Grner
Veranstaltungs-
beschreibung
Einfhrung
Was ist R
Eigenschaften
Nachteile
Packages
Web-Adressen
Literatur
Entw.umgebung
Erste Schritte
Hilfen
Nachteile von R
R ist komplex und sehr mchtig.
R ist weniger benutzerfreundlich als beispielsweise
SPSS.
Die graphische Benutzungsoberche Rgui.exe bietet
nur rudimentre Untersttzung
2
.
Die volle Leistungsfhigkeit wird nur durch Verwendung
von Kommandos erreicht: man muss die Funktionen
kennen und die Syntax von R beachten.
2
Die Entwicklung von GUIs zu R schreitet aber voran, siehe z.B. R
Commander.
Statistik
mit R
Erwin Grner
Veranstaltungs-
beschreibung
Einfhrung
Was ist R
Eigenschaften
Nachteile
Packages
Web-Adressen
Literatur
Entw.umgebung
Erste Schritte
Hilfen
Packages zu Bchern
MASS Funktionen/Daten zu Modern Applied
Statistics with S (Venables & Ripley)
DAAG Funktionen/Daten zu Data Analysis And
Graphics (Maindonald & Braun)
ISwR Funktionen/Daten zu Introductory Statistics
with R (Dalgaard)
UsingR Funktionen/Daten zu Using R for
Introductory Statistics (Verzani)
car Funktionen/Daten zu An R and S-PLUS
Companion to Applied Regression (J. Fox)
faraway Funktionen/Daten zu Linear Models with R
u.a. (Faraway)
. . . . . .
Statistik
mit R
Erwin Grner
Veranstaltungs-
beschreibung
Einfhrung
Was ist R
Eigenschaften
Nachteile
Packages
Web-Adressen
Literatur
Entw.umgebung
Erste Schritte
Hilfen
Sonstige Packages
foreign Prozeduren zum Lesen von Fremdformaten
nlme hierarchische Regressionsmodelle
nortest Normalverteilungstests
psy verschiedene Psychometrie-Prozeduren
sem Strukturgleichungsmodelle
survival Survival-Analyse
tseries Zeitreihenanalyse
lattice Trellis Graphiken
rimage Bildbearbeitungsprozeduren
R2HTML HTML-Ausgabe
Rcmdr R Commander (GUI)
. . . . . .
. . . . . .
Statistik
mit R
Erwin Grner
Veranstaltungs-
beschreibung
Einfhrung
Was ist R
Eigenschaften
Nachteile
Packages
Web-Adressen
Literatur
Entw.umgebung
Erste Schritte
Hilfen
Web-Adressen
http://www.r-project.org/
Homepage des R-Projekts
http://cran.r-project.org/
Comprehensive R Archive Network
http://cran.r-project.org/bin
Binaries zum Installieren von R
http://cran.r-project.org/manuals.html
Manuale zu R
http://lib.stat.cmu.edu/R/CRAN/other-docs.html
Weitere Dokumentation
Statistik
mit R
Erwin Grner
Veranstaltungs-
beschreibung
Einfhrung
Was ist R
Eigenschaften
Nachteile
Packages
Web-Adressen
Literatur
Entw.umgebung
Erste Schritte
Hilfen
Web-Adressen (Forts.)
http://cran.r-project.org/src/contrib/PACKAGES.html
Packages
http://socserv.mcmaster.ca/jfox/Misc/Rcmdr/
R Commander
http://www.math.montana.edu/Rweb/
Statistical Analysis On The Web
http://lib.stat.cmu.edu/S
Statlib S Archive
Statistik
mit R
Erwin Grner
Veranstaltungs-
beschreibung
Einfhrung
Was ist R
Eigenschaften
Nachteile
Packages
Web-Adressen
Literatur
Entw.umgebung
Erste Schritte
Hilfen
Literatur zu S/S-Plus und R
Venables, W. N., & Ripley, B. D. (2002). Modern
Applied Statistics with S. (4th Ed.). Springer-Verlag.
Venables, W. N., & Ripley, B. D. (2000). S
Programming. Springer-Verlag.
Dalgaard, P. (2002). Introductory Statistics with R.
Springer-Verlag.
Venables, W. N., & Smith, D. M. () An Introduction to
R. Network Theory Ltd.
Fox, J. (). An R and S-Plus Companion to Applied
Regression. Sage Publications.
Pinheiro, J. C., & Bates, D. M. (2001). Mixed-Eects
Models in S and S-PLUS. Springer-Verlag.
Weitere Dokumentation in Form von PDF-Dateien ndet
man im Internet, vor allem auch auf der CRAN-Seite.
Statistik
mit R
Erwin Grner
Veranstaltungs-
beschreibung
Einfhrung
Entw.umgebung
Arbeitsweise
Fenster und Mens
Tastatureingaben
Erste Schritte
Hilfen
Arbeitsweise von R
R ist ein Interpreter.
Im interaktiven Modus arbeitet R in einer sog.
Read-Eval-Print-Loop:
1
Eingabe: der Benutzer gibt einen Ausdruck ein
2
Evaluierung: das System wertet den Ausdruck aus
3
Ausgabe: das System gibt das Ergebnis (oder eine
Fehlermeldung) auf dem Bildschirm aus
. . . (weiter mit 1.)
R kann auch im Batch-Modus betrieben werden.
Statistik
mit R
Erwin Grner
Veranstaltungs-
beschreibung
Einfhrung
Entw.umgebung
Arbeitsweise
Fenster und Mens
Tastatureingaben
Erste Schritte
Hilfen
Fenster und Mens
Rgui.exe startet den interaktiven Modus unter Windows.
Die graphische Benutzungsoberche enthlt:
Hauptfenster mit einer Menleiste und evtl. einer
Symbolleiste sowie weiteren Fenstern . . .
Konsolfenster fr Benutzereingaben und
Systemausgaben
Statistik
mit R
Erwin Grner
Veranstaltungs-
beschreibung
Einfhrung
Entw.umgebung
Arbeitsweise
Fenster und Mens
Tastatureingaben
Erste Schritte
Hilfen
Tastatureingaben
Eingaben werden mit der RETURN -Taste
abgeschlossen.
Sollen mehrere Kommandos bzw. Ausdrcke auf einmal
eingegeben werden, so sind sie mit Semikolon zu
trennen.
Der Eingabeprompt ist
>
Bei syntaktisch unvollstndigen Eingaben erscheint als
Fortsetzungprompt
+
Das Kommando fr das Beendigen von R ist
q()
Statistik
mit R
Erwin Grner
Veranstaltungs-
beschreibung
Einfhrung
Entw.umgebung
Erste Schritte
Demoprogramme
Ausdrcke
Eingebaute Datenstze
Variablenzugri
Hypothesentests
Hilfen
Einige Demoprogramme
Aufruf von Demo-Programmen
> demo()
bersicht ber die Demos
> demo(graphics) Graphik-Demos
> demo(image)
Hhenlinien u.hnl.
> demo(persp) 3D-Graphik
Statistik
mit R
Erwin Grner
Veranstaltungs-
beschreibung
Einfhrung
Entw.umgebung
Erste Schritte
Demoprogramme
Ausdrcke
Eingebaute Datenstze
Variablenzugri
Hypothesentests
Hilfen
Eingabe von Ausdrcken
R kann als Tischrechner verwendet werden:
Zahlen
> 1
> 1.57
> .2356
> -1305.234
> -1.23456e8
Arithmetische Ausdrcke
> 1 + 2
> 3 / 7 * 2 - 5.7
> 3/0 Inf (Innity)
> 0/0 NaN (Not a Number)
Verwendung numerischer Funktionen
> sqrt(2*3.141593)
> log(10)
> exp(sin(pi/6))
Statistik
mit R
Erwin Grner
Veranstaltungs-
beschreibung
Einfhrung
Entw.umgebung
Erste Schritte
Demoprogramme
Ausdrcke
Eingebaute Datenstze
Variablenzugri
Hypothesentests
Hilfen
Verwendung eines eingebauten Datensatzes
Informationen ber verfgbare Datenstze:
> data()
Aufruf des Datensatzes women:
> data(women)
Infos zum Datensatz women
> help(women)
Auisten der Daten:
> women
Aufruf statistischer Funktionen:
> mean(women) Mittelwerte
> sd(women) Standardabweichungen
> cov(women) Kovarianzmatrix
> cor(women) Korrelationsmatrix
Erstellung einer Graphik:
> plot(women) Streuungsdiagramm
Statistik
mit R
Erwin Grner
Veranstaltungs-
beschreibung
Einfhrung
Entw.umgebung
Erste Schritte
Demoprogramme
Ausdrcke
Eingebaute Datenstze
Variablenzugri
Hypothesentests
Hilfen
Zugri auf die Variablen eines Datensatzes
Aufruf des Datensatzes women
3
:
> data(women)
Zugri auf Variablen (Auisten der Variable height):
> women$height
Aufruf einer Funktion (Korrelation):
> cor(women$height,women$weight)
3
Neuerdings sind manche Datenstze standardmig verfgbar, d.h.
dieser Aufruf ist dann nicht notwendig.
Statistik
mit R
Erwin Grner
Veranstaltungs-
beschreibung
Einfhrung
Entw.umgebung
Erste Schritte
Demoprogramme
Ausdrcke
Eingebaute Datenstze
Variablenzugri
Hypothesentests
Hilfen
Komfortabler Zugri auf einen Datensatz
Die
Variablen eines Datensatzes in den Suchpfad aufnehmen:
> attach(women) Datensatz women
Auisten der einzelnen Variablen:
> height
> weight
Aufruf statistischer Funktionen:
> mean(height)
> sd(height)
> cov(height,weight)
> cor(height,weight)
Statistik
mit R
Erwin Grner
Veranstaltungs-
beschreibung
Einfhrung
Entw.umgebung
Erste Schritte
Demoprogramme
Ausdrcke
Eingebaute Datenstze
Variablenzugri
Hypothesentests
Hilfen
Komfortabler Zugri auf einen Datensatz (Forts.)
Erstellung von Graphiken (Streuungsdiagramm,
Histogramm, Boxplot):
> plot(height,weight)
> hist(height)
> boxplot(height)
Die Variablen eines Datensatzes aus dem Suchpfad
entfernen:
> detach(women)
Statistik
mit R
Erwin Grner
Veranstaltungs-
beschreibung
Einfhrung
Entw.umgebung
Erste Schritte
Demoprogramme
Ausdrcke
Eingebaute Datenstze
Variablenzugri
Hypothesentests
Hilfen
Durchfhrung von Hypothesentests,
Modellanpassung
Daten verfgbar machen:
> data(sleep)
> attach(sleep)
t-Test:
> t.test(extra~group)
Anpassung eines linearen Regressionsmodells:
> lm(extra~group)
Statistik
mit R
Erwin Grner
Veranstaltungs-
beschreibung
Einfhrung
Entw.umgebung
Erste Schritte
Hilfen
Hilfen
Hilfe zu einem Objekt (z.B. einer Funktion) erhlt man
mit der Eingabe
> help(objekt) oder krzer mit
> ?objekt
Informationen zu einem Paket:
> help(package=packagename) oder
> library(,packagename)
Auistung aller Funktionen, deren Namen einen
gegebenen String enthalten:
> apropos(string)
Beispiel zu einem angegebenen Thema:
> example(topic)
Statistik
mit R
Erwin Grner
Veranstaltungs-
beschreibung
Einfhrung
Entw.umgebung
Erste Schritte
Hilfen
Hilfen (Forts.)
Aufruf der HTML-Hilfe:
> help.start()
ber das Help-Men knnen darber hinaus noch
weitere Hilfen aufgerufen werden:
Frequently Asked Questions (FAQ)
HTML-Hilfen
Die Handbcher zu R als PDF-Dateien
Statistik
mit R
Erwin Grner
Veranstaltungs-
beschreibung
Einfhrung
Entw.umgebung
Erste Schritte
Hilfen