Sie sind auf Seite 1von 10

Wirtschaftswissenschaftlicher Prüfungsausschuss

der Georg-August-Universität Göttingen

Klausur des 1. Studienabschnitts


für alle wirtschaftswissenschaftlichen Bachelor-Studiengänge

Datum: 01.04.2022
Prüfungsfach: STATISTIK (TEIL B) (WiSe 2021/22)
Themensteller: E. Bergherr, A. Silbersdorff, A. Berner, M. Fülle
Kandidat
Matrikel-Nr.:
Fachrichtung: ...............................................................
Raum: ...............................................................
Platz: ...............................................................
Bitte beachten Sie: • Versehen Sie alle Seiten mit Ihrer Matrikel-Nummer.
• Schreiben Sie leserlich.
• Lösen Sie nicht die Heftung der Klausur.
• Beachten Sie auch die Hinweise auf der nächsten Seite!
Zugelassene Hilfsmittel: • Zugelassener Taschenrechner
• Schreibutensilien
• Ein (auch beidseitig) handschriftlich beschriebenes DIN A4-
Blatt, das mit Ihrer Matrikelnummer, Raum und Platznummer
gekennzeichnet ist und mit der Klausur abgegeben werden muss.
Seitenumfang: 4 + Deckblatt + Hinweise
Anzahl der Aufgaben: 1
Gesamtpunktzahl: 45

Auszufüllen nur durch eine Aufsichtsperson

Identitätskontrolle: ..........................................................
Formelblatt: ⇤ handschriftlich ⇤ Kopie ⇤ nicht vorhanden
Klausurergebnis
Punktzahl Änderungen Punktzahl Note
(1. Durchlauf) (Endergebnis)

.
⼀般的:
提示
• 您的答案只能⽤ILIAS 书写。因此,评估中只会考虑在 ILIAS 上提交的解决⽅案。
• 定期保存您的数字书⾯答案和发票,尤其是R 脚本。
• 仅在⽂档⽂件夹中⼯作。
• 仔细阅读提问内容和回答⽅法。
• 每项任务都给出了可达到的最⼤分数。
• 处理时间为60 分钟

Hinweise
Allgemeines:

• Ihre Antworten sollen ausschließlich in ILIAS verfasst werden. Entsprechend werden


bei der Bewertung ausschließlich die auf ILIAS eingereichten Lösungen berücksich-
tigt.
• Speichern Sie Ihre digital verfassten Antworten und Rechnungen regelmäßig, ins-
besondere das R-Skript.
• Arbeiten Sie ausschließlich in dem Ordner Dokumente.

• Lesen Sie genau, wonach gefragt wird und wie die Lösung anzugeben ist.
• Für jede Aufgabe ist die maximal erreichbare Punktzahl angegeben.
• Die Bearbeitungszeit beträgt 60 Minuten.

Form der Einträge in ILIAS:

• Die Struktur Ihrer Antworten in ILIAS gliedert sich pro Teilaufgabe in bis zu zwei
Blöcke.
Je nach Aufgabenstellung werden Sie aufgefordert, inhaltliche Antworten und/oder
R-code und R-output in die dafür vorgesehenen Antwortboxen in ILIAS zu verfas-
sen.
Hinblicklich der Struktur Ihrer Antworten, orientieren Sie sich an der unten auf-
geführten Beispielantwort. Insbesondere beim R-code und dem R-ouput sind Sie
angehalten auf eine nachvollziehbare Struktur zu achten.
• Ggf. werden Sie auch aufgefordert eine über R erstellte graphische Darstellung in
ein vorgegebenes Dateiformat abzuspeichern und die Datei auf ILIAS hochzuladen.
Die hochzuladene Grafik ist – sofern gefordert – ggf. auszudrucken und bei der
Abgabe mit einzureichen. Auf der Grafik ist zwingend der Aufgabenteil, Die Matri-
kelnummer und die Sitzplatznummer im Titel der Grafik (über die Option main)
beizufügen. Des Weiteren sind die Achsen der Aufgabenstellung entsprechend zu
benennen.

• Nicht numerische Antworten sollten in vollen Antwortsätzen beantwortet werden.


• Numerische Antworten (auch jene in Antwortsätzen) sollten – sofern nicht ander-
weitig spezifiziert – auf drei Nachkommastellen gerundet werden.
• Ihre Antwortsätze in ILIAS inklusive des angehängten R-Outputs sollten eindeu-
tig und von widersprüchlichen Mehrfachlösungen frei sein. Fehlerhafter R-code,
welcher nicht Teil der Antwort ist, ist aus der Antwort in ILIAS entsprechend zu
streichen und sollte nicht mit eingereicht werden.
ILIAS 中的条⽬形式:
• ILIAS 中的答案结构针对每个⼦任务分为最多两个块。
根据任务的不同,您将被要求在 ILIAS 提供的答案框中写下与内容相关的答案和/或 R 代码和 R 输出。
关于您的答案结构,请使⽤下⾯的示例答案作为指导。特别是对于 R 代码和 R 输出,您需要注意结构的可理解性。
• 系统可能还会提示您以指定的⽂件格式保存使⽤ R 创建的图形表示并将⽂件上传到 ILIAS。如有需要,应将要上传的图形打印出来并
与提交⼀起提交。图形标题中的任务部分、⼊学编号和座位号(通过主要选项)必须包含在图形中。此外,轴必须根据任务命名。
• ⾮数字答案应该⽤完整的句⼦来回答。
• 除⾮另有说明,数字答案(包括答案句⼦中的数字答案)应四舍五⼊到⼩数点后三位。
• 你在ILIAS 中的回答语句(包括附加的R 输出)应该清晰并且没有相互⽭盾的多个解决⽅案。不属于响应⼀部分的错误 R 代码应从
ILIAS 的响应中删除,不应提交。
使⽤具有 100 个随机变量 X 和 Y 观测值的数据.csv数据集来回答以下问题:
(a) 将 R 中的数据集另存为对象名称 d 下的数据帧。使⽤伊利亚斯中问题 1 的答案
框。
(b) 计算X观测值的算术平均值。 使⽤《伊利亚特》中问题 2 和 3 的答案框。
Klausur Statistik (Teil B), 01.04.2022, Seite 3 Matrikel-Nr.
(c)从变量Y的分布中可视化核⼼密度估计器(注意:你不需要知道!)。
使⽤《伊利亚特》中问题 4 和 5 的答案框。
(d) 指出中位数相对于算术平均值的优势。
Beispielaufgabe: 使⽤《伊利亚特》中问题6的答案框。

Nutzen Sie den Datensatz data.csv mit 100 Beobachtungen der Zufallsvariablen X
und Y um die folgenden Fragen zu beantworten:

(a) Speichern Sie den Datensatz in R als Dataframe unter dem Objektnamen d ab.
Nutzen Sie hierfür die Antwortbox der Frage 1 in Ilias. (2 Punkte)

(b) Berechnen Sie das arithmetische Mittel der Beobachtungen von X.


Nutzen Sie hierfür die Antwortbox der Frage 2 und 3 in Ilias. (3 Punkte)

(c) Visualisierung Sie einen Kerndichteschätzer (Hinweis: müssen Sie nicht kennen!)
von der Verteilung der Variable Y .
Nutzen Sie hierfür die Antwortbox der Frage 4 und 5 in Ilias. (5 Punkte)

(d) Nennen Sie einen Vorteil von dem Median als Lagemaß gegenüber dem arithmeti-
schen Mittel.
Nutzen Sie hierfür die Antwortbox der Frage 6 in Ilias. (2 Punkte)

Beispielantwort: 问答框1(《伊利亚特》):
在下⾯的框中,以 R 代码和 R 输出的形式输⼊您对 a) 部分的答案。关于答

Frage und Antwortbox 1 (in Ilias):


案的结构,请按照任务表上的说明进⾏操作!

Geben Sie im folgenden Kästchen Ihre Antwort für den Aufgabenteil a) in Form von R-
code und R-output an. Beachten Sie hinsichtlich der Struktur Ihrer Antwort die Hinweise
auf dem Aufgabenzettel!

1 > setwd ( path . expand ( " ~ " ) ) 检查⽂件是否存在


2 > d <- read . table ( " data . csv " , sep = " ; " )

Frage und Antwortbox 2 (in Ilias):


Geben Sie im folgenden Kästchen den für Ihre Antwort erforderlichen R-code und R-
output zum Aufgabenteil b) an. [...]

1 > mean ( d $ X )
2 [1] 1.17

Frage und Antwortbox 3 (in Ilias):


Geben Sie im folgenden Kästchen Ihre inhaltliche Antwort (ohne R-code und R-output)
für den Aufgabenteil b) an. [...]

Das arithmetische Mittel der Variable X ist 1.170.

Frage und Antwortbox 4 (in Ilias):


Geben Sie im folgenden Kästchen den für Ihre Antwort erforderlichen R-code und R-
output zum Aufgabenteil c) an. [...]

1 plot ( density ( d $ Y ) ,
2 main = " Sitz 00 , Matr . Nr . 31415926 ,
Klausur Statistik (Teil B), 01.04.2022, Seite 4 Matrikel-Nr.

3 Beispielaufgabe ( c ) " ,
4 xlab = " Y " , ylab = " Dichte " )

Frage und Antwortbox 5 (in Ilias):


Laden Sie die pdf Datei mit der zu erstellenden Grafik für Aufgabenteil c) hoch. Zusätzlich
ist die erstellte Grafik zu drucken und am Ende in gedruckter Form einzureichen.

Bereits abgegebene Dateien


Dateiname Datum
RplotC.pdf 28. Sep 2021, 21:30

Frage und Antwortbox 6 (in Ilias):


Im folgenden Kästchen geben Sie bitte Ihre inhaltliche Antwort zu Aufgabenteil d) an.
[...]

Der Median ist robuster gegenüber Extremwerten als das arithmetische Mittel.

Die hochgeladene pdf für Aufgabenteil (c) sollte folgende Grafik enthalten:

Sitz 00, Matr.Nr. 31415926,


Beispielaufgabe (c)

0.12

0.10

0.08
Dichte

0.06

0.04

0.02

0.00

10 15 20 25 30

Y
Klausur Statistik (Teil B), 01.04.2022, Seite 1 Matrikel-Nr.

Aufgabe 8 (45 Punkte)


In dem Lied „Toss A Coin To Your Witcher” zu der Netflix Serie „The Witcher” versucht
der Barde Jaskier, der die Hauptcharaktere Geralt von Riva und Yennefer von Venger-
berg begleitet, mit seiner Strophe „Toss a coin to your Witcher, Oh Valley of Plenty”
wiederholt die Bewohner eines der vielen Täler der mystischen Welt der Serie zu moti-
vieren, eine Münze ihm bzw. „dem Witcher” Geralt von Riva zuzuwerfen. Neben seinem
künstlicherischen Engagement ist Jaskier auch ein begeisterter angewandter Statistiker
und sammelt entsprechend für jeden Tavernenbesuch Daten über den Ertrag seiner Per-
formance. Die Daten sind in der Datei WitcherData2.csv hinterlegt. Diese Datei ist
auf Ihrem lokalen Laufwerk in dem Ordner Dokumente hinterlegt. In diesem Ordner
sollten Sie auch mit R arbeiten und jegliche Dateien (Skripte, Abbildungsdateien, etc.),
在 Netflix 剧集“巫师”的歌曲“向你的巫师投硬币”中,与主要⻆⾊杰洛特·冯·⾥瓦 (Geralt von Riva)
welche Sie abspeichern, hinterlegen. 和叶妮芙·冯·⽂格伯格 (Yennefer von Vengerberg) 伴奏的吟游诗⼈ Jaskier 尝试⽤他的诗句“向你
的巫师投硬币,哦丰盛⾕”反复激励该系列神秘世界众多⼭⾕之⼀的居⺠向他或“巫师”杰洛特·冯·
⾥维亚扔硬币。除了他的艺术承诺外,Jaskier 还是⼀位热情的应⽤统计学家,因此他会为每次
Der Datensatz enthält folgende Variablen: 酒馆访问收集有关他的表演收益的数据。数据存储在 WitcherData2.csv ⽂件中。此⽂件存储在
本地驱动器的 Documents ⽂件夹中。您还应该在此⽂件夹中使⽤ R 并存储您保存的任何⽂件
(脚本、图像⽂件等)。
Variablenbezeichnung Erläuterung 数据记录包含以下变量:

Taverne die Chiffre der Taverne gemäß der Systematisierung des Barden

Tal Verortung des Tals der Taverne

Monster Beschreibung des durch den Witcher besiegten Monsters

Muenzen Die Anzahl der erhaltenen Münzen

Kampfzeit Die Zeit (in Minuten) zur Besiegung des Monsters

(a) Setzen Sie mittels setwd(path.expand("~")) ihr Working Directory um in dem


lokalen Ordner Dokumente zu arbeiten.
使⽤ setwd(path.expand(“~”)) 将⼯作⽬录转换为
要⼯作的本地⽂件夹⽂档。
对于您的答案,请使⽤⽅框在《伊利亚特》中提问 1。

Nutzen Sie für Ihre Antwort das Kästchen zu Frage 1 in Ilias. (2 Punkte)

(b) Speichern Sie die in der Datei hinterlegten Daten als Data Frame Objekt d in R
ab und geben Sie ersten 6 Zeilen des Data Frame Objektes wieder.
将存储在⽂件中的数据另存为 R 中的数据框对象
Nutzen Sie für Ihre Antwort die Kästchen zu Fragen 2 in Ilias. d,并重现数据框对象的前 6 ⾏。
(4 Punkte)
对于您的答案,请使⽤伊利亚斯中问题 2 的框。

(c) Der erstellte Data Frame ist eine spezielle Form der Liste, welche wiederum eine
Klausur Statistik (Teil B), 01.04.2022, Seite 2 Matrikel-Nr.

可能不同的对象类型的集合。使⽤合适的 R 命令,确定并命名存储对象 d、酒馆和战⽃时间中包


含的两个变量的对象类型。
Sammlung potentiell verschiedener Objekttypen darstellt. Ermitteln und nennen
Sie unter Einbezug eines passenden R-Befehls die Objekttypen der zwei im gespei-
cherten Objekt d enthaltenen Variablen Taverne und Kampfzeit.

Nutzen Sie für Ihre Antwort die Kästchen zu den Fragen 3 und 4 in Ilias. (4 Punkte)
计算并命名 va- 的中位数和四分位数距离
可怜的战⽃时间。将结果四舍五⼊到⼩数点后 2 位。

(d) Berechnen und nennen Sie den Median und den Interquartilsabstand für die Va-
riable Kampfzeit. Runden Sie Ihr Ergebnis auf 2 Nachkommastellen.

Nutzen Sie für Ihre Antwort die Kästchen zu den Fragen 5 und 6 in Ilias. (4 Punkte)

(e) Erstellen Sie ein Streudiagramm für die gegebenen Daten mit der Variable Kampfzeit

为给定数据创建散点
auf der x-Achse und der Variable Muenzen auf der y-Achse. Die Punkte sollten ge-
图,在 x 轴上使⽤变量
战⽃时间,在 y 轴上使 füllt sein (nutzen Sie hierfür die Option pch=16) und auf dreißig Prozent der Größe
⽤变量铸币。点应填充
(使⽤选项 pch=16)
并缩放到⼤⼩的 30% skaliert werden (nutzen Sie hierfür die Option cex=0.3). Die Graphische Darstel-
(使⽤选项
cex=0.3)。图形表示
应具有以下标题:
lung sollte folgenden Titel tragen:
座位号XX,Matr.Nr。
YY,任务部分 e), Sitznr. XX, Matr.Nr. YY, Aufgabenteil e),
其中XX代表您分配的座
位,YY代表您的⼊学编
号。x 轴应包含可变战
wobei XX Ihren zugewiesenen Sitzplatz und YY Ihre Matrikelnummer darstellt.
⽃时间的所有特征值,
并命名为战⽃时间(分 Die x-Achse sollte alle Merkmalsausprägungen der Variable Kampfzeit enthalten
钟)。y 轴应包含可变
硬币的所有特征值,并
命名为硬币。 und mit Kampfzeit (min.) betitelt werden. Die y-Achse sollte alle Merkmals-
然后将图形另存为⼯作
⽬录中 Plot8e 下的.pdf
⽂件.pdf并上传此⽂
ausprägungen der Variable Muenzen enthalten und mit Muenzen betitelt werden.
件。

Anschließend speichern Sie Ihre Grafik als .pdf Datei unter Plot8e.pdf im Working
Directory ab und laden diese Datei hoch.

Nutzen Sie für Ihre Antwort das Kästchen zu Fragen 7 und 8 in Ilias. (8 Punkte)

(f) Ergänzen Sie Ihren Datensatz um die folgenden zwei Variablen:


Die Variable Kampfzeit.3 stellt eine vereinfachte Darstellung der Variable Kampfzeit
mit drei Ausprägungen dar:
{Weniger als 5 Minuten, 5 Minuten oder mehr & bis zu eine Stunde, Eine Stunde oder mehr}.
Die Variable sollte als Factor-Object abgespeichert und als 6. Spalte dem Daten-
satz d hinzugefügt werden.
Klausur Statistik (Teil B), 01.04.2022, Seite 3 Matrikel-Nr.

Die Variable Muenzen.4 stellt eine vereinfachte Darstellung der Variable Muenzen
mit vier Ausprägungen dar:
{Bis zu 10 Münzen, Mehr als 10 Münzen aber maximal 20,
Mehr als 20 Münzen aber maximal 30, Mehr als 30 Münzen}. Die Variable sollte
als Factor-Object abgespeichert und als 7. Spalte dem Datensatz d hinzugefügt
werden.

Nutzen Sie für Ihre Antwort die Kästchen zu den Fragen 9 in Ilias. (5 Punkte)

(g) Erstellen Sie eine Kontingenztafel für die zwei Variablen Muenzen.4 und Kampfzeit.3
und nutzen Sie diese, um zu bestimmen, wie häufig bei einer Kampfzeit zwischen
5 Minuten und einer Stunde die Anzahl der Münzen zwischen 10 und 20 lag.

Nutzen Sie für Ihre Antwort die Kästchen zu den Fragen 10 und 11 in Ilias. (4 Punkte)

(h) Betrachten Sie nun nur jene Beobachtungen im Datensatz bei welchem die Kampf-
zeit 5 Minuten oder mehr aber weniger als 60 Minuten betrug. Für diese Merk-
malsausprägung der Variable Kampfzeit.3 notieren Sie die Randverteilung für die
Variable Muenzen.4, indem Sie für für jede Ausprägung die Wahrscheinlichkeits-
masse benennen. Runden Sie Ihre Ergebnisse auf 2 Nachkommastellen.

Nutzen Sie für Ihre Antwort die Kästchen zu den Fragen 12 und 13 in Ilias. (6 Punkte)

(i) Zwar kann sich Yennefer in ruhigen Minuten mit Jaskier auch über ihr gemeinsames
Faible für Statistik unterhalten, aber sie muss schnell feststellen, dass theoretische
Überlegungen zur Erweiterung einfacher deskriptiver Statistik Jaskier überfordern.
Entsprechend bleibt Yennefer von Vengerberg nichts anderes übrig, als folgende
Überlegungen zur Erweiterung von einfachen Kontingenztafeln wie folgt nieder zu
schreiben:

Jenseits der klassischen Kontingenztafel, bei welcher die Fallzahlen einzelne Varia-
blenkombinationen in Matrixform notiert wären, wäre es eine spannende Erwei-
terung, wenn im Rahmen einer dritten Dimension eine weitere Variable betrachtet
Klausur Statistik (Teil B), 01.04.2022, Seite 4 Matrikel-Nr.

würde. Sei also A eine Matrix, in welcher die Frequenzen für gemeinsame Merk-
malsausprägungen der zwei Variablen X und Y notiert würden, wie sie Jaskier
für seine Auswertungen häufig benutzt. Analog hierzu könnten wir uns auch eine
Hypermatrix B vorstellen, in welcher die Frequenzen für gemeinsame Merkmals-
ausprägungen der drei Variablen X , Y und Z notiert würden. Leider scheint mir dies
händisch sehr aufwändig zu sein und bei all den Abenteuern komme ich nicht dazu
eine solche Auswertung selber durchzuführen.

Erstellen Sie mittels R eine entsprechende Hypermatrix, wobei die Variable X


die die in Aufgabenteil (f) verwendete Variable Muenzen.4, die Variable Y die
ebenda verwendete Variable Kampfzeit.3 darstellt. Die Variable Z stellt die im
ursprünglichen Datensatz gegebene Variable Tal mit allen 12 Ausprägungen dar.
Erstellen Sie entsprechend eine Hypermatrix der Dimension 4 ◊ 3 ◊ 12 und füllen
Sie jedes deren Elemente mit der jeweilige Frequenz für X = x, Y = y, Z = z.
Das somit erstellte Hypermatrix-Objekt ist Kontingenz.array zu benennen.

Hinweis: Eine Hypermatrix mit drei Dimension kann über den Befehl array() in
R erstellt werden. Ferner ist die for Schleife ggf. hilfreich.

Nutzen Sie für Ihre Antwort das Kästchen zu Frage 14 in Ilias. (8 Punkte)

erreichte Punkte

Das könnte Ihnen auch gefallen