Beruflich Dokumente
Kultur Dokumente
Datum: 01.04.2022
Prüfungsfach: STATISTIK (TEIL B) (WiSe 2021/22)
Themensteller: E. Bergherr, A. Silbersdorff, A. Berner, M. Fülle
Kandidat
Matrikel-Nr.:
Fachrichtung: ...............................................................
Raum: ...............................................................
Platz: ...............................................................
Bitte beachten Sie: • Versehen Sie alle Seiten mit Ihrer Matrikel-Nummer.
• Schreiben Sie leserlich.
• Lösen Sie nicht die Heftung der Klausur.
• Beachten Sie auch die Hinweise auf der nächsten Seite!
Zugelassene Hilfsmittel: • Zugelassener Taschenrechner
• Schreibutensilien
• Ein (auch beidseitig) handschriftlich beschriebenes DIN A4-
Blatt, das mit Ihrer Matrikelnummer, Raum und Platznummer
gekennzeichnet ist und mit der Klausur abgegeben werden muss.
Seitenumfang: 4 + Deckblatt + Hinweise
Anzahl der Aufgaben: 1
Gesamtpunktzahl: 45
Identitätskontrolle: ..........................................................
Formelblatt: ⇤ handschriftlich ⇤ Kopie ⇤ nicht vorhanden
Klausurergebnis
Punktzahl Änderungen Punktzahl Note
(1. Durchlauf) (Endergebnis)
.
⼀般的:
提示
• 您的答案只能⽤ILIAS 书写。因此,评估中只会考虑在 ILIAS 上提交的解决⽅案。
• 定期保存您的数字书⾯答案和发票,尤其是R 脚本。
• 仅在⽂档⽂件夹中⼯作。
• 仔细阅读提问内容和回答⽅法。
• 每项任务都给出了可达到的最⼤分数。
• 处理时间为60 分钟
Hinweise
Allgemeines:
• Lesen Sie genau, wonach gefragt wird und wie die Lösung anzugeben ist.
• Für jede Aufgabe ist die maximal erreichbare Punktzahl angegeben.
• Die Bearbeitungszeit beträgt 60 Minuten.
• Die Struktur Ihrer Antworten in ILIAS gliedert sich pro Teilaufgabe in bis zu zwei
Blöcke.
Je nach Aufgabenstellung werden Sie aufgefordert, inhaltliche Antworten und/oder
R-code und R-output in die dafür vorgesehenen Antwortboxen in ILIAS zu verfas-
sen.
Hinblicklich der Struktur Ihrer Antworten, orientieren Sie sich an der unten auf-
geführten Beispielantwort. Insbesondere beim R-code und dem R-ouput sind Sie
angehalten auf eine nachvollziehbare Struktur zu achten.
• Ggf. werden Sie auch aufgefordert eine über R erstellte graphische Darstellung in
ein vorgegebenes Dateiformat abzuspeichern und die Datei auf ILIAS hochzuladen.
Die hochzuladene Grafik ist – sofern gefordert – ggf. auszudrucken und bei der
Abgabe mit einzureichen. Auf der Grafik ist zwingend der Aufgabenteil, Die Matri-
kelnummer und die Sitzplatznummer im Titel der Grafik (über die Option main)
beizufügen. Des Weiteren sind die Achsen der Aufgabenstellung entsprechend zu
benennen.
Nutzen Sie den Datensatz data.csv mit 100 Beobachtungen der Zufallsvariablen X
und Y um die folgenden Fragen zu beantworten:
(a) Speichern Sie den Datensatz in R als Dataframe unter dem Objektnamen d ab.
Nutzen Sie hierfür die Antwortbox der Frage 1 in Ilias. (2 Punkte)
(c) Visualisierung Sie einen Kerndichteschätzer (Hinweis: müssen Sie nicht kennen!)
von der Verteilung der Variable Y .
Nutzen Sie hierfür die Antwortbox der Frage 4 und 5 in Ilias. (5 Punkte)
(d) Nennen Sie einen Vorteil von dem Median als Lagemaß gegenüber dem arithmeti-
schen Mittel.
Nutzen Sie hierfür die Antwortbox der Frage 6 in Ilias. (2 Punkte)
Beispielantwort: 问答框1(《伊利亚特》):
在下⾯的框中,以 R 代码和 R 输出的形式输⼊您对 a) 部分的答案。关于答
Geben Sie im folgenden Kästchen Ihre Antwort für den Aufgabenteil a) in Form von R-
code und R-output an. Beachten Sie hinsichtlich der Struktur Ihrer Antwort die Hinweise
auf dem Aufgabenzettel!
1 > mean ( d $ X )
2 [1] 1.17
1 plot ( density ( d $ Y ) ,
2 main = " Sitz 00 , Matr . Nr . 31415926 ,
Klausur Statistik (Teil B), 01.04.2022, Seite 4 Matrikel-Nr.
3 Beispielaufgabe ( c ) " ,
4 xlab = " Y " , ylab = " Dichte " )
Der Median ist robuster gegenüber Extremwerten als das arithmetische Mittel.
Die hochgeladene pdf für Aufgabenteil (c) sollte folgende Grafik enthalten:
0.12
0.10
0.08
Dichte
0.06
0.04
0.02
0.00
10 15 20 25 30
Y
Klausur Statistik (Teil B), 01.04.2022, Seite 1 Matrikel-Nr.
Taverne die Chiffre der Taverne gemäß der Systematisierung des Barden
Nutzen Sie für Ihre Antwort das Kästchen zu Frage 1 in Ilias. (2 Punkte)
(b) Speichern Sie die in der Datei hinterlegten Daten als Data Frame Objekt d in R
ab und geben Sie ersten 6 Zeilen des Data Frame Objektes wieder.
将存储在⽂件中的数据另存为 R 中的数据框对象
Nutzen Sie für Ihre Antwort die Kästchen zu Fragen 2 in Ilias. d,并重现数据框对象的前 6 ⾏。
(4 Punkte)
对于您的答案,请使⽤伊利亚斯中问题 2 的框。
(c) Der erstellte Data Frame ist eine spezielle Form der Liste, welche wiederum eine
Klausur Statistik (Teil B), 01.04.2022, Seite 2 Matrikel-Nr.
Nutzen Sie für Ihre Antwort die Kästchen zu den Fragen 3 und 4 in Ilias. (4 Punkte)
计算并命名 va- 的中位数和四分位数距离
可怜的战⽃时间。将结果四舍五⼊到⼩数点后 2 位。
(d) Berechnen und nennen Sie den Median und den Interquartilsabstand für die Va-
riable Kampfzeit. Runden Sie Ihr Ergebnis auf 2 Nachkommastellen.
Nutzen Sie für Ihre Antwort die Kästchen zu den Fragen 5 und 6 in Ilias. (4 Punkte)
(e) Erstellen Sie ein Streudiagramm für die gegebenen Daten mit der Variable Kampfzeit
为给定数据创建散点
auf der x-Achse und der Variable Muenzen auf der y-Achse. Die Punkte sollten ge-
图,在 x 轴上使⽤变量
战⽃时间,在 y 轴上使 füllt sein (nutzen Sie hierfür die Option pch=16) und auf dreißig Prozent der Größe
⽤变量铸币。点应填充
(使⽤选项 pch=16)
并缩放到⼤⼩的 30% skaliert werden (nutzen Sie hierfür die Option cex=0.3). Die Graphische Darstel-
(使⽤选项
cex=0.3)。图形表示
应具有以下标题:
lung sollte folgenden Titel tragen:
座位号XX,Matr.Nr。
YY,任务部分 e), Sitznr. XX, Matr.Nr. YY, Aufgabenteil e),
其中XX代表您分配的座
位,YY代表您的⼊学编
号。x 轴应包含可变战
wobei XX Ihren zugewiesenen Sitzplatz und YY Ihre Matrikelnummer darstellt.
⽃时间的所有特征值,
并命名为战⽃时间(分 Die x-Achse sollte alle Merkmalsausprägungen der Variable Kampfzeit enthalten
钟)。y 轴应包含可变
硬币的所有特征值,并
命名为硬币。 und mit Kampfzeit (min.) betitelt werden. Die y-Achse sollte alle Merkmals-
然后将图形另存为⼯作
⽬录中 Plot8e 下的.pdf
⽂件.pdf并上传此⽂
ausprägungen der Variable Muenzen enthalten und mit Muenzen betitelt werden.
件。
Anschließend speichern Sie Ihre Grafik als .pdf Datei unter Plot8e.pdf im Working
Directory ab und laden diese Datei hoch.
Nutzen Sie für Ihre Antwort das Kästchen zu Fragen 7 und 8 in Ilias. (8 Punkte)
Die Variable Muenzen.4 stellt eine vereinfachte Darstellung der Variable Muenzen
mit vier Ausprägungen dar:
{Bis zu 10 Münzen, Mehr als 10 Münzen aber maximal 20,
Mehr als 20 Münzen aber maximal 30, Mehr als 30 Münzen}. Die Variable sollte
als Factor-Object abgespeichert und als 7. Spalte dem Datensatz d hinzugefügt
werden.
Nutzen Sie für Ihre Antwort die Kästchen zu den Fragen 9 in Ilias. (5 Punkte)
(g) Erstellen Sie eine Kontingenztafel für die zwei Variablen Muenzen.4 und Kampfzeit.3
und nutzen Sie diese, um zu bestimmen, wie häufig bei einer Kampfzeit zwischen
5 Minuten und einer Stunde die Anzahl der Münzen zwischen 10 und 20 lag.
Nutzen Sie für Ihre Antwort die Kästchen zu den Fragen 10 und 11 in Ilias. (4 Punkte)
(h) Betrachten Sie nun nur jene Beobachtungen im Datensatz bei welchem die Kampf-
zeit 5 Minuten oder mehr aber weniger als 60 Minuten betrug. Für diese Merk-
malsausprägung der Variable Kampfzeit.3 notieren Sie die Randverteilung für die
Variable Muenzen.4, indem Sie für für jede Ausprägung die Wahrscheinlichkeits-
masse benennen. Runden Sie Ihre Ergebnisse auf 2 Nachkommastellen.
Nutzen Sie für Ihre Antwort die Kästchen zu den Fragen 12 und 13 in Ilias. (6 Punkte)
(i) Zwar kann sich Yennefer in ruhigen Minuten mit Jaskier auch über ihr gemeinsames
Faible für Statistik unterhalten, aber sie muss schnell feststellen, dass theoretische
Überlegungen zur Erweiterung einfacher deskriptiver Statistik Jaskier überfordern.
Entsprechend bleibt Yennefer von Vengerberg nichts anderes übrig, als folgende
Überlegungen zur Erweiterung von einfachen Kontingenztafeln wie folgt nieder zu
schreiben:
Jenseits der klassischen Kontingenztafel, bei welcher die Fallzahlen einzelne Varia-
blenkombinationen in Matrixform notiert wären, wäre es eine spannende Erwei-
terung, wenn im Rahmen einer dritten Dimension eine weitere Variable betrachtet
Klausur Statistik (Teil B), 01.04.2022, Seite 4 Matrikel-Nr.
würde. Sei also A eine Matrix, in welcher die Frequenzen für gemeinsame Merk-
malsausprägungen der zwei Variablen X und Y notiert würden, wie sie Jaskier
für seine Auswertungen häufig benutzt. Analog hierzu könnten wir uns auch eine
Hypermatrix B vorstellen, in welcher die Frequenzen für gemeinsame Merkmals-
ausprägungen der drei Variablen X , Y und Z notiert würden. Leider scheint mir dies
händisch sehr aufwändig zu sein und bei all den Abenteuern komme ich nicht dazu
eine solche Auswertung selber durchzuführen.
Hinweis: Eine Hypermatrix mit drei Dimension kann über den Befehl array() in
R erstellt werden. Ferner ist die for Schleife ggf. hilfreich.
Nutzen Sie für Ihre Antwort das Kästchen zu Frage 14 in Ilias. (8 Punkte)
erreichte Punkte