Sie sind auf Seite 1von 15

ANGI RÖSCH & HARALD SCHMIDBAUER, FOM 1

Quantitative Methoden der Informatik


SS 2023

Aufgaben

Anmerkungen:

• Der Zweck der Aufgaben ist, die Methoden besser zu lernen. Alle Aufgaben sind nützlich.

• Nicht alle Aufgaben sind klausurrelevant.

Aufgabe 1: Eine Autowerkstatt analysiert regelmäßig die Anzahl der Kunden pro Tag (d.h. die
Anzahl der täglich zur Reparatur oder Inspektion eingegangenen Autos), um rechtzeitig auf mögliche
Veränderungen reagieren zu können. Im November 2002 wurden die folgenden Eingänge verzeichnet:

Datum Wochentag Anzahl Datum Wochentag Anzahl Datum Wochentag Anzahl


01.11.2002 Freitag 43 11.11.2002 Montag 45 21.11.2002 Donnerstag 28
02.11.2002 Samstag 23 12.11.2002 Dienstag 39 22.11.2002 Freitag 26
03.11.2002 Sonntag 0 13.11.2002 Mittwoch 28 23.11.2002 Samstag 26
04.11.2002 Montag 42 14.11.2002 Donnerstag 35 24.11.2002 Sonntag 3
05.11.2002 Dienstag 30 15.11.2002 Freitag 22 25.11.2002 Montag 27
06.11.2002 Mittwoch 22 16.11.2002 Samstag 34 26.11.2002 Dienstag 26
07.11.2002 Donnerstag 30 17.11.2002 Sonntag 11 27.11.2002 Mittwoch 34
08.11.2002 Freitag 30 18.11.2002 Montag 42 28.11.2002 Donnerstag 31
09.11.2002 Samstag 34 19.11.2002 Dienstag 22 29.11.2002 Freitag 28
10.11.2002 Sonntag 16 20.11.2002 Mittwoch 34 30.11.2002 Samstag 31

a) Es wird hier die Variable Anzahl betrachtet. Welche Skalierung hat sie?
Um welche Population geht es hier?

b) Zeichnen Sie ein Stamm-und-Blatt-Diagramm der Verteilung der Variablen Anzahl.

c) Berechnen und interpretieren Sie das arithmetische Mittel dieser Verteilung.

(Hinweise: Die nach Größe geordnete Reihe ist: 0, 3, 11, 16, 22, 22, 22, 23, 26, 26, 26, 27, 28, 28, 28, 30,
P
30, 30, 31, 31, 34, 34, 34, 34, 35, 39, 42, 42, 43, 45. Es ist: xi = 842.)

Aufgabe 2: Ein Auto fährt zwei Strecken mit unterschiedlichen Geschwindigkeiten:


Strecke Geschwindigkeit
10 km 100 km/h
20 km 40 km/h
Wie groß ist die Durchschnittsgeschwindigkeit auf der gesamten Strecke von 30 km?
(Das Ergebnis nennt man harmonisches Mittel der Geschwindigkeiten auf den einzelnen Strecken.)

© Angi Rösch / Harald Schmidbauer, 2023


ANGI RÖSCH & HARALD SCHMIDBAUER, FOM 2

Aufgabe 3: Am 4. Januar 2005 hatte der DAX den Wert 4290.50, am 6. September 2005 den Wert
4968.28. Berechnen Sie für diesen Zeitraum den durchschnittlichen wöchentlichen Wertzuwachs in Pro-
zent.
(Hinweis: Zwischen dem ersten und dem zweiten Datum liegen 35 Wochen.)

Aufgabe 4: Einem Zeitungsartikel aus dem Jahr 1996 kann man die beiden folgenden statistischen
Aussagen entnehmen:
A: 347 von 1 000 Haushalten in Deutschland sind Ein-Personen-Haushalte,
317 von 1 000 Haushalten sind Zwei-Personen-Haushalte.
B: Zwei Drittel der Bevölkerung in Deutschland leben allein oder zu zweit.

a) Welche Population betrachtet man in Aussage A, welche Population in Aussage B?

b) Nehmen Sie an, die Aussage A war richtig. — Was kann man dann über den Anteil der Bevölkerung
in Deutschland sagen, der allein oder zu zweit lebte? Trifft auch die Aussage B zu?

Aufgabe 5: Fehlerfreie Daten zu bekommen ist oft ein aufwendiger Prozess.


Die Datei insurance data w errors.xls enthält (simulierte, aber realistische) Daten über 1 000 Versi-
cherungsnehmer: das Geburtsdatum, das Datum des Vertragsbeginns, das Geschlecht des Versicherungs-
nehmers, die Zahl der Schäden, die der Versicherungsnehmer im Jahr 2008 erlitt, und die zugehörige
gesamte Schadenssumme (in Euro). — Unglücklicherweise haben sich 11 typische Fehler in diese Daten
eingeschlichen.

a) Finden Sie die 11 Fehler und versuchen Sie, diese auf plausible Weise zu beheben.

b) Wie viele Personen gibt es, die 2008 mindestens einen Schaden erlitten?

c) Berechnen Sie die durchschnittliche Schadenssumme, die eine Person mit mindestens einem Schaden
im Jahr 2008 verursachte.

Aufgabe 6: Die Datei bank customers.xls enthält (simulierte, aber realistische) Daten über 5 868
Kunden einer Bank. Jede Zeile bezieht sich auf jeweils einen Kunden. Die Variablen und ihre Werte sind
in der folgenden Tabelle beschrieben:

symbol description values


deficit Credit limit exceeded within last 6 months? 0: no
1: yes
age age in completed years positive integer number
m.status marital status 0: single or not specified
1: married
edu highest level of education achieved 1: no graduation or general-education graduation
2: vocational school, apprenticeship
3: university of applied sciences, university
econ.activity economic activity 0: unemployed or inactive
1: employee or public servant
2: self-employed (or family member)
urban Is place of residence in urban area? 0: no
1: yes
stability Is residential area stable? (Many moves 0: no
during recent period indicate “no”.) 1: yes
cellphone number of cellular phone contracts 0: no contract
1: one contract
2: two or more contracts

© Angi Rösch / Harald Schmidbauer, 2023


ANGI RÖSCH & HARALD SCHMIDBAUER, FOM 3
a) Welche Skalierung haben diese Variablen?

b) Wie hoch ist der Prozentsatz der Kunden mit deficit = 1?

c) Berechnen Sie das durchschnittliche Alter der Kunden mit deficit = 0.

d) Berechnen Sie das durchschnittliche Alter der Kunden mit deficit = 1.

e) Berechnen Sie den Prozentsatz der Kunden mit deficit = 1 unter denjenigen Kunden, die bisher
keinen Handyvertrag (einen, zwei oder mehr Handyverträge) hatten.

Aufgabe 7: Yaya plant eine Studie zur Messung der Zufriedenheit der Studierenden mit der Mensa auf
ihrem Campus. (Dort gibt es nur eine Mensa.)
Für Interviews mit ausgewählten Studierenden entwarf sie einen Fragebogen.

a) Was ist die Zielpopulation für diese Studie?

b) Unter den Studierenden, die sie an einem Dienstag in der Mensa findet, nimmt Yaya eine Stichprobe
von 50 Personen.
Wird diese Stichprobe repräsentativ für die Population in (a) sein?
Haben Sie eine bessere Idee, wie man eine Stichprobe von 50 Studierenden zieht?

c) Bei einer der Fragen im Fragebogen geht es um Preise. Yaya will erfahren, ob die Studierenden die
Speisen in der Mensa teuer oder preiswert finden. Sie bittet die Studierenden um deren Meinung
über die Preise auf der folgenden Skala:

Ich finde die Speisen . . .


(1) zu teuer / (2) teuer / (3) weder teuer noch preiswert / (4) preiswert / (5) sehr preiswert

Welche Skalierung hat die Variable, die Yaya hier analysiert?

d) Welche Art von Diagramm ist geeignet, um einen ersten Einblick in die Verteilung der Antworten
bei der Variablen in (c) zu bekommen?

e) Später entscheidet sich Yaya dazu, die Preise in ihrer Mensa mit den Preisen in der Mensa auf dem
anderen Campus zu vergleichen.
Dazu berechnet Yaya die Preisdifferenzen für dieselben Speisen in ihrer und der anderen Mensa.
Zum Beispiel: Wenn Reis in Yayas Mensa ¥ 0.80 kostet und ¥ 1.20 in der Mensa auf dem anderen
Campus, dann ist die Preisdifferenz ¥ 0.40. Yaya berechnet die Preisdifferenzen für 30 Speisen. Das
folgende Diagramm ist ein Histogramm der Preisdifferenzen:
8
6
4
2
0

−2 0 2 4

Was kann man über die Preise in Yayas Mensa im Vergleich zu den Preisen in der Mensa auf dem
anderen Campus sagen?

© Angi Rösch / Harald Schmidbauer, 2023


ANGI RÖSCH & HARALD SCHMIDBAUER, FOM 4

Aufgabe 8: In einem Interview Fragen zu stellen, die als peinlich oder indiskret empfunden werden, ist
manchmal in der Forschung notwendig, stellt aber eine Herausforderung für die Statistik dar.

a) Finden Sie Beispiele von Fragen, deren Beantwortung für die Gesellschaft wünschenswert ist, die
man aber in Deutschland kaum direkt stellen kann, weil sie von den Befragten als peinlich oder
indiskret empfunden werden können.

b) Umgekehrt: Gibt es Fragen, die in einem anderen Land oder Kulturkreis als peinlich oder indiskret
empfunden werden, in Deutschland aber nicht?

Aufgabe 9: Die monatlichen Preisänderungen von Brent-Rohöl in Prozent in den Jahren 2003 und 2004
waren (auf eine Nachkommastelle gerundet):

Jan Feb Mar Apr Mai Jun Jul Aug Sep Okt Nov Dez
2003 4.8 7.7 −17.5 −15.9 12.6 8.7 −0.7 5.9 −7.5 −0.7 3.8 4.7
2004 −2.5 11.5 −2.0 9.1 5.0 −10.2 24.8 −4.0 20.0 0.8 −8.2 −8.7

a) Zeichnen Sie ein Histogramm der Verteilung der monatlichen Preisänderungen. Wählen Sie dazu
die folgende Klasseneinteilung: −25 bis unter −10“, −10 bis unter 0“, 0 bis unter 10“ und 10
” ” ” ”
bis 25“.

b) Berechnen und interpretieren Sie das arithmetische Mittel der Verteilung der monatlichen Preisän-
derungen.

c) Berechnen und interpretieren Sie den Median.

d) Berechnen und interpretieren Sie das untere und das obere Quartil.

e) Zeichnen Sie ein Boxplot der Verteilung.

f) Berechnen Sie die Varianz und die Standardabweichung.

g) Was besagt die 1-σ-Regel in diesem Beispiel? Überprüfen Sie, ob diese Regel hier zutrifft.
P P 2
(Hinweise: xi = 41.5, xi = 2 536.4.
Die Preisänderungen, der Größe nach angeordnet, sind:
−17.5, −15.9, −10.2, −8.7, −8.2, −7.5, −4.0, −2.5, −2.0, −0.7, −0.7, 0.8, 3.8, 4.7, 4.8, 5.0, 5.9, 7.7, 8.7,
9.1, 11.5, 12.6, 20.0, 24.8.)

Aufgabe 10: Die Bevölkerung der Türkei umfasste im Jahr 1990:


Im Altersintervall Millionen Personen
Unter 15 Jahre 19.74
15 bis unter 40 Jahre 23.70
40 bis unter 65 Jahre 10.56
65 Jahre und älter 2.42

a) Zeichnen Sie ein Histogramm dieser Verteilung.

b) Zeichnen Sie die empirische Verteilungsfunktion.

c) Aus den gegebenen Informationen kann man den Median der Altersverteilung nicht genau bestim-
men. Aber man kann sagen, in welchem Altersintervall der Median liegt. Welches Intervall ist das?
Mit linearer Interpolation kann man einen Näherungswert für den Median finden. Wie geht das?
Welchen Näherungswert bekommt man? Interpretieren Sie Ihr Ergebnis.

© Angi Rösch / Harald Schmidbauer, 2023


ANGI RÖSCH & HARALD SCHMIDBAUER, FOM 5

Aufgabe 11: Koch/Köchin gilt in Deutschland als schlecht bezahlter Beruf. Im November 2017 (2017-11-
29) berichtete die Nachrichten-Website Focus Online über das Brutto-Jahresgehalt von Köchen/Köchinnen
(die Zahlen sind hier gerundet wiedergegeben):

• Im Durchschnitt verdienen Köche 29 640 Euro

• 25 Prozent verdienen weniger als 24 200 Euro

• 50 Prozent verdienen weniger als 27 850 Euro

• am oberen Ende verdienen 25 Prozent mehr als 32 690 Euro

(Der Link zu dem Artikel ist hier.)

a) Um welche Population geht es hier? Was ist die Variable? Welche Skalierung hat sie?

b) Wie nennt man die vier angegebenen Werte in der Statistik?

c) Worauf weist die relative Lage von Median und arithmetischem Mittel zueinander hin? Diskutieren
Sie kurz.

d) Warum reichen die Angaben von Focus Online nicht aus, um ein Boxplot der Einkommensverteilung
zu zeichnen?

e) In anderen Internet-Quellen (aus der betreffenden Zeit) findet man die Angaben, dass Köche/Köchinnen
nach der Ausbildung brutto mindestens 1500 Euro monatlich verdienen; Spitzenköche und -köchinnen
können ein Brutto-Monatsgehalt bis etwa 8000 Euro bekommen. Zeichnen Sie mit diesen Angaben
ein Boxplot der Einkommensverteilung.

f) Welches Jahresgehalt bekommen Köche/Köchinnen in China? In einem Land Ihrer Wahl? Bitte
recherchieren Sie im Internet. Falls Sie Angaben zum Durchschnittsgehalt“ finden: Um welche Art

von Durchschnitt“ handelt es sich — arithmetisches Mittel oder Median? Ist die Angabe damit

eher etwas optimistisch oder eher neutral? Diskutieren Sie kurz.

Aufgabe 12: Ein Zeitschriftenhändler analysiert die Verkaufszahlen eines Wochenmagazins in den letz-
ten 50 Wochen:
Verkaufszahl 9 10 11 12 13 14 15 16 17
Zahl der Wochen 1 3 6 8 10 10 7 4 1

a) Berechnen und interpretieren Sie das arithmetische Mittel der Verteilung der Variablen Verkaufs-
zahl.

b) Berechnen und interpretieren Sie den Median.

c) Berechnen und interpretieren Sie das untere und das obere Quartil.

d) Welche Möglichkeiten zur graphischen Darstellung der Verteilung einer Variablen kennen Sie?
Welche Darstellung ist hier geeignet?
Stellen Sie die Verteilung der Variablen Verkaufszahl graphisch dar.

e) Was lässt sich (ohne Rechnung) über die Schiefe der Verteilung sagen?

f) Berechnen Sie die Varianz und die Standardabweichung.

g) Was besagt die 1-σ-Regel in diesem Beispiel? Überprüfen Sie, ob diese Regel hier zutrifft.

h) Was besagt die 2-σ-Regel in diesem Beispiel? Überprüfen Sie, ob diese Regel hier zutrifft.
P P 2
(Hinweis: xi = 657, xi = 8 797.)

© Angi Rösch / Harald Schmidbauer, 2023


ANGI RÖSCH & HARALD SCHMIDBAUER, FOM 6

Aufgabe 13: Eine elementare Analyse von Monatsrenditen in Prozent (prozentuale Änderungen von
Monat zu Monat) beim chinesischen Aktienindex SSEC (Shanghai Stock Exchange Composite Index) in
der Zeit vom Januar 2000 bis Oktober 2008 (105 Beobachtungen) zeigt die folgenden Ergebnisse:
arithmetisches Mittel, r̄ 0.83 Minimum −20.31
Varianz, s2 67.96 unteres Quartil −4.68
Standardabweichung, s 8.24 Median 0.81
Schiefe, γ1 0.03 oberes Quartil 5.57
Kurtosis, γ2 0.76 Maximum 27.45

a) Was besagt die 3-σ-Regel in diesem Fall?

b) Skizzieren Sie ein Diagramm der Verteilung der Monatsrenditen, das zu den Ergebnissen in der
Tabelle passt.

Aufgabe 14: In einer Umfrage über Internetgewohnheiten wurden unter anderem die beiden folgenden
Fragen gestellt:
A: Nutzen Sie einen Instant-Messaging-Dienst?
◦ ja ◦ nein
B: Wie viel Zeit verbringen Sie durchschnittlich pro Tag mit Aktivitäten bei einem
Instant-Messaging-Dienst?
◦ weniger als 60 Minuten ◦ 60 bis unter 180 Minuten ◦ 180 Minuten und mehr

a) Welche Skalierung haben die Variablen A und B?


Diskutieren Sie für jede der beiden Variablen, ob es sinnvoll und auch möglich ist, die folgenden
Maßzahlen zu bestimmen: Modus, Median, arithmetisches Mittel, Standardabweichung.

b) Diskutieren Sie mögliche Konsequenzen, wenn man die beiden Fragen als offene Fragen, d.h. ohne
vorgegebene Antworten, formulieren würde.

Aufgabe 15: Im Januar 2014 führte das Forschungsinstitut infratest dimap eine Umfrage unter den
Wahlberechtigten in Deutschland durch. Die Umfrage erfolgte im Auftrag der ARD und hatte unter
anderem das Ziel, herauszufinden, was Wahlberechtigte über die Zuwanderung aus anderen EU-Ländern
nach Deutschland denken. Eine der Aussagen im Fragebogen war:

Unsere Wirtschaft braucht qualifizierte Arbeitskräfte aus anderen Ländern, um weiterhin



erfolgreich zu sein.“

Die Befragten wurden gebeten zu sagen, ob sie dieser Aussage zustimmen würden (JA / NEIN). In einer
repräsentativen Stichprobe von 1004 Wahlberechtigten sagten 68% JA.
Es sei p der Anteil derjenigen unter allen Wahlberechtigten in Deutschland, die im Januar 2014 auf die
obige Frage JA gesagt hätten.

a) Was bedeutet es, wenn man von einer repräsentativen Stichprobe spricht?
Wie könnte man eine repräsentative Stichprobe in der Praxis bekommen? Könnte man einfach
Leute auf der Straße fragen, um 10 Uhr morgens an einem Arbeitstag?
Warum ist es wichtig eine repräsentative Stichprobe zu haben?

b) Urnenmodelle zeigen das Ziehen von Stichpoben aus einer Population. Welches Urnenmodell be-
nutzen wir für die Population der Wahlberechtigten in Deutschland?

c) Welches stochastische Modell benutzen wir, wenn ein Wahlberechtigter zufällig ausgewählt und
befragt wird? Was ist hier zufällig?

© Angi Rösch / Harald Schmidbauer, 2023


ANGI RÖSCH & HARALD SCHMIDBAUER, FOM 7
d) Wir kennen p nicht (warum nicht?), aber weil es nur JA und NEIN als Antwort auf die obige Frage
gibt, setzt jemand p = 50%. Zeigt das die Meinung aller Wahlberechtigten? Warum oder warum
nicht?

e) Wenn 68% der Befragten in der Stichprobe JA sagen, dann will man damit auch eine Aussage
(Schlussfolgerung) über die Population machen. Ist diese Schlussfolgerung deduktiv oder induktiv?
Warum?

f) Nehmen Sie nun an, dass p tatsächlich 50% ist. Ist es dann überhaupt möglich, dass 68% in einer
Stichprobe von 1004 Befragten JA sagen?

g) Nehmen Sie wieder an, dass p tatsächlich 50% ist. Die Wahrscheinlichkeit, dass in einer Stich-
probe von 1004 Befragten mindestens 68% JA sagen, ist dann sehr klein. Im Hinblick auf diese
Wahrscheinlichkeit: Ist p = 50%“ eine sichere Annahme? Begründen Sie Ihre Antwort.

Aufgabe 16: In einer Stadt gibt es zwei Taxiunternehmen mit unterschiedlicher Wagenfarbe: blau und
grün. 85% der Taxis auf der Straße sind grün.
Es ist in einer Nacht ein Unfall mit einem Taxi passiert. Das Taxi fuhr aber davon. Ein Augenzeuge sagt:
Es war ein blaues Taxi!“ Aber wie gut kann der Augenzeuge bei Nacht die Farben unterscheiden? Man

testet ihn: Er sagt bei 80% der Tests die richtige Farbe.
Welche der folgenden Aussagen halten Sie für richtig?
a) Die Wahrscheinlichkeit, dass das Taxi blau war, ist 80%.

b) Es ist wahrscheinlicher, dass das Taxi blau war, aber die Wahrscheinlichkeit ist kleiner als 80%.

c) Die Wahrscheinlichkeit, dass das Taxi blau war, ist genauso groß wie die Wahrscheinlichkeit, dass
das Taxi grün war.

d) Es ist wahrscheinlicher, dass das Taxi grün war.


Nach Hacking, Ian (2001): Probability and Inductive Logic.

Aufgabe 17: In einem großen Fabrikgebäude ist eine Alarmanlage installiert. Laut Hersteller der Alarm-
anlage ist in langen Versuchsreihen festgestellt worden, dass für die Zuverlässigkeit der Alarmanlage
folgendes gilt:
• Wenn in einer Nacht eingebrochen wird, wird der Alarm mit der Wahrscheinlichkeit 0.99 ausgelöst.

• In einer Nacht, in der kein Einbruch stattfindet, kann der Alarm dennoch ausgelöst werden, aller-
dings nur mit der Wahrscheinlichkeit 0.01.
Laut Einbruchsstatistik ist die Wahrscheinlichkeit, dass in einer bestimmten Nacht eingebrochen wird,
1/250.
a) Zeichnen Sie einen Wahrscheinlichkeitsbaum der relevanten Ereignisse.

b) Mit welcher Wahrscheinlichkeit wird in dieser Nacht der Alarm ausgelöst?

c) Der Alarm wird ausgelöst. Beurteilen Sie das Einbruchsrisiko: Berechnen Sie die Wahrscheinlichkeit
dafür, dass tatsächlich ein Einbruch stattfindet.

d) Nehmen Sie nun folgendes an: Noch bevor der Alarm ausgelöst wird, hört der Nachtwächter ein
verdächtiges Geräusch. Daher sagt er sich: Die Wahrscheinlichkeit für einen Einbruch heute nacht ist
nicht 1/250, sondern 1/10. Nun geht der Alarm los. Beurteilen Sie das Einbruchsrisiko: Berechnen
Sie unter Verwendung dieser Einschätzung des Nachtwächters die Wahrscheinlichkeit dafür, dass
der Alarm von einem Einbrecher ausgelöst wird.

© Angi Rösch / Harald Schmidbauer, 2023


ANGI RÖSCH & HARALD SCHMIDBAUER, FOM 8

Aufgabe 18: Bevor Fluggäste zu ihrem Abfluggate gelangen, passieren sie eine Passagier- und Hand-
gepäckkontrolle. Ein typischer Sprengstoff-Detektor ist nicht zu 100% zuverlässig: Er kann bei der Kon-
trolle eines Passagiers Sprengstoff übersehen (wir nehmen an, das passiert mit einer Wahrscheinlichkeit
von 0.1%), und es kann zu einem Fehlalarm kommen (wir nehmen an, das passiert mit einer Wahrschein-
lichkeit von 5%). Wenn ein Gepäckstück Sprengstoff-Alarm auslöst, wird der Besitzer zu einer weiteren
Kontrolle gebeten.
Folgendes passierte am Flughafen München im Januar 2010: Die Computer-Tasche eines Mannes löste
Sprengstoff-Alarm aus. Der Mann verließ eilig den Sicherheitsbereich und verschwand in der Menge.
Sicherheitspersonal war nicht in der Lage, ihn zu stoppen und erneut zu kontrollieren. Es war daher
unklar, ob der Alarm berechtigt oder ein Fehlalarm war.
Nehmen Sie an, dass die a-priori-Wahrscheinlichkeit, dass der Mann tatsächlich Sprengstoff mit sich
führte, 0.1% ist.

a) Zeichnen Sie einen Ereignisbaum mit allen relevanten Ereignissen und Wahrscheinlichkeiten.

b) Der Sprengstoff-Detektor löste Alarm aus. Wie groß ist mit dieser Information die a-posterori-
Wahrscheinlichkeit, dass der Mann tatsächlich Sprengstoff mit sich führte? Schreiben Sie den ma-
thematischen Ausdruck für diese Wahrscheinlichkeit auf und setzen Sie alle gegebenen Werte korrekt
ein; berechnen Sie den Wert dieser Wahrscheinlichkeit.

c) Die Wahrscheinlichkeit in (b) ist kleiner als 2%. Was würden Sie dem Flughafenmanagement emp-
fehlen? Wählen Sie unter den folgenden Optionen:

1. Ignoriere den Vorfall.


2. Schließe den Flughafen, evakuiere alle Flugzeuge und suche nach dem Mann, um sein Gepäck
einer erneuten Kontrolle zu unterziehen.

Begründen Sie Ihre Antwort.

d) Charakterisieren Sie kurz den Begriff der a-priori-Wahrscheinlichkeit in diesem Beispiel aus philo-
sophischer Sicht.

Aufgabe 19: Statistik-basierte Argumente werden zunehmend auch bei juristischen Entscheidungen
eingesetzt. Hier ist ein Beispiel. — AMEG ist ein großes Unternehmen mit 10 000 Mitarbeitern; darunter
sind 4 100 weiblich. Das Top-Management der AMEG besteht aus einer Gruppe von 10 Personen.

a) Nehmen Sie an, dass die 10 Personen im Top-Management eine zufällige Auswahl aus allen 10 000
Personen darstellen.

– Wie viele Frauen würde man dann unter den 10 Personen im Top-Management erwarten?
– Wie groß ist die Wahrscheinlichkeit, dass sich im Top-Management überhaupt keine Frau
befindet?
– Wie groß ist die Wahrscheinlichkeit, dass sich im Top-Management genau eine Frau befindet?
– Wie groß ist die Wahrscheinlichkeit, dass sich im Top-Management mindestens eine Frau be-
findet?

(Hinweis: Man kann hier näherungsweise von einem Ziehen mit Zurücklegen ausgehen.)

b) Nehmen Sie nun an, dass sich im Top-Management der AMEG tatsächlich überhaupt keine Frau
befindet. Was ist Ihre Schlussfolgerung?

© Angi Rösch / Harald Schmidbauer, 2023


ANGI RÖSCH & HARALD SCHMIDBAUER, FOM 9

Aufgabe 20: In einem Call-Center rufen freitags zwischen 10 und 10:15 Uhr durchschnittlich 5 Kunden
an.

a) Schlagen Sie ein Verteilungsmodell für die Anzahl der Kunden vor, die freitags zwischen 10 und
10:15 Uhr anrufen, und begründen Sie Ihren Vorschlag.
Berechnen Sie damit die Wahrscheinlichkeit, dass kein Kunde anruft.

b) Die Wahrscheinlichkeit, dass ein Kunde bei einem Anruf sofort bedient wird (d.h. ohne Wartezeit
für den Kunden), ist erfahrungsgemäß 80%.
Stellen Sie sich nun vor, an einem Freitagvormittag versuchen 5 Kunden unabhängig voneinander
anzurufen.
Schlagen Sie ein Verteilungsmodell für die Anzahl derjenigen unter diesen 5 Kunden vor, die sofort
bedient werden, und begründen Sie Ihren Vorschlag.
Berechnen Sie damit die Wahrscheinlichkeit, dass alle 5 Kunden sofort bedient werden.

Aufgabe 21: Aus einem Stadtteil Istanbuls wird 36 Wochen lang über die wöchentliche Zahl der
Stromausfälle berichtet. Es ergibt sich die folgende Häufigkeitsverteilung:
Zahl der Stromausfälle Zahl der Wochen
0 16
1 14
2 4
3 2
Die Zufallsvariable wöchentliche Anzahl der Stromausfälle wird aufgrund dieser Beobachtungen als nähe-
rungsweise poissonverteilt zum Parameter λ = 0.78 angesehen.

a) Berechnen Sie das arithmetische Mittel und die empirische Varianz der empirischen Verteilung.

b) Begründen Sie die Verteilungsannahme.

c) Berechnen Sie mit der Poissonverteilung die Wahrscheinlichkeit, dass eine Woche ohne Stromausfall
bleibt, und vergleichen Sie Ihr Ergebnis mit dem entsprechenden Beobachtungsergebnis.

d) Nennen Sie zwei weitere Beispiele, in welchem eine Zufallsvariable als poissonverteilt angesehen
werden könnte.

Aufgabe 22: In der Psychologie wird mit speziellen Tests der Intelligenzquotient (IQ) als Kenngröße des
intellektuellen Leistungsvermögens einer Person ermittelt. Die Tests werden an repräsentativen Gruppen
von Personen erprobt.
Der IQ-Wert wird dabei als eine normalverteilte Zufallsgröße X modelliert: X ∼ N(100, 225).

a) Berechnen Sie die Wahrscheinlichkeit, dass sich bei einer zufällig ausgewählten Person einen IQ-
Wert von weniger als 115 ergibt.

b) Bestimmen Sie einen IQ-Wert so, dass 10% aller Personen mit ihrem Wert darüber liegen. (Man
nennt diesen Wert das 90%-Quantil der Verteilung von X.)

c) Berechnen Sie die Wahrscheinlichkeit, dass sich bei 100 zufällig ausgewählten Personen durchschnitt-
lich ein IQ-Wert zwischen 97 und 103 ergibt.

© Angi Rösch / Harald Schmidbauer, 2023


ANGI RÖSCH & HARALD SCHMIDBAUER, FOM 10

Aufgabe 23: Das Gewicht von Hühnereiern und die Schlüpfzeit von Küken sind wichtige Themen in
der Geflügelzucht.

a) Das Gewicht von Eiern (gemessen in Gramm) von Hennen eines bestimmten Alters hat eine Nor-
malverteilung mit Erwartungswert 57.8 und Standardabweichung 3.2. Geben Sie ein Intervall an,
das das Gewicht von etwa 95% dieser Eier abdeckt.

b) Welcher Anteil der Eier wird ein Gewicht von mehr als 60 Gramm aufweisen?

c) Nun betrachten wir eine Schachtel mit 10 Eiern. Wie groß ist die Wahrscheinlichkeit, dass die 10
Eier insgesamt über 600 Gramm wiegen? Vergleichen Sie das Ergebnis mit dem Ergebnis in (b)!

d) In einer Stichprobe von 100 Eiern schlüpften die ersten Küken nach einer Brutzeit von 450 Stunden,
die letzten nach 504 Stunden. Nehmen wir an, die Brutzeit sei normalverteilt. Bestimmen Sie
die Standardabweichung und die Varianz der Brutzeit unter dieser Annahme. Geben Sie auch die
Maßeinheiten dieser Streuungsmaße an. Kennen wir damit die wahre (tatsächliche) Varianz der
Brutzeit?

Aufgabe 24: Für ein bestimmtes Fernsehprogramm wird eine Einschaltquote von 10% typisch genannt.
An einem bestimmten Tag wird in einer Zufallsstichprobe bei 4 000 Personen ermittelt, ob sie das Pro-
gramm gesehen haben.

a) Schlagen Sie ein Verteilungsmodell für die Zahl der Personen in der Stichprobe vor, die das Pro-
gramm gesehen haben, und begründen Sie Ihren Vorschlag.
Welchen Erwartungswert und welche Varianz hat diese Verteilung?

b) Wie groß ist die Wahrscheinlichkeit, dass die Zahl der Personen in der Stichprobe, die das Programm
gesehen haben,
– genau so groß ist wie ihr Erwartungswert?
– um mindestens 50 Personen geringer ist als ihr Erwartungswert?
– um mindestens 50 Personen von ihrem Erwartungswert abweicht?
Eine Approximation dieser Wahrscheinlichkeiten mit Hilfe der Normalverteilung genügt.

Aufgabe 25: Eine der Fragen in einer Studie über das Wissen junger Erwachsener in Deutschland war:
Nennen Sie die beiden Länder mit jeweils mehr als einer Milliarde Einwohner.“ In einer Zufallsstichprobe

von 300 jungen Erwachsenen wussten 84 die richtige Antwort.

a) Berechnen Sie ein (approximatives) 95%-Konfidenzintervall für den Anteil derjenigen jungen Er-
wachsenen in Deutschland, welche die richtige Antwort wissen.

b) Jemand sagt: Mehr als ein Viertel der jungen Erwachsenen in Deutschland weiß die richtige Ant-

wort.“ Ist diese Aussage überzeugend? Begründen Sie Ihre Antwort.

c) Das Konfidenzintervall in (a) ist ca. 10 Prozent-Punkte lang. Deutschland hat etwa 80 Millionen
Einwohner. China hat mehr als 15-mal so viele Einwohner! Angenommen, der Wert für p in China
ist ähnlich groß wie in Deutschland: Bedeutet das, dass man in China eine mindestens 15-mal so
große Stichprobe ziehen müßte, um ein ähnlich genaues Ergebnis zu erhalten? Begründen Sie Ihre
Antwort.

© Angi Rösch / Harald Schmidbauer, 2023


ANGI RÖSCH & HARALD SCHMIDBAUER, FOM 11

Aufgabe 26: Die Firma Alpha produziert Stahlrohre. Diese werden in einem Schneideverfahren her-
gestellt. Es entstehen Rohre, deren Länge (in Inch gemessen) normalverteilt ist, mit Erwartungswert µ
und Standardabweichung σ. Aus bisherigen Prozessabläufen ist σ = 0.1 bekannt. Aber µ ist wegen einer
Neujustierung des Schneideprozesses unbekannt.
Eine Stichprobe von 15 Rohren ergab die folgenden Längen:

11.73, 12.02, 11.99, 11.86, 12.11, 12.11, 12.02, 12.01, 11.89, 11.96, 12.12, 11.91, 11.98, 12.03, 11.95

(xi − x̄)2 = 0.1513.)


P P
(Hinweise: xi = 179.69,

a) Berechnen Sie einen Punktschätzer für µ.

b) Kann man sagen, dass µ mit dem Wert des Punktschätzers übereinstimmt? Begründen Sie Ihre
Antwort.

c) Berechnen Sie ein 95%-Konfidenzintervall für µ.

d) Die Solllänge eines Rohrs beträgt 12 Inch. Geben die Beobachtungen in der Stichprobe Anlass zur
Nachjustierung der Maschine? Begründen Sie Ihre Antwort.

Aufgabe 27: In dieser Aufgabe geht es um die Schätzung der Parameter einer Normalverteilung.

a) Simulieren Sie (zum Beispiel mit R oder MS-Excel) (i) n = 100, (ii) n = 1000 Realisationen einer
Normalverteilung mit Mittelwert µ = 10 und Varianz σ 2 = 5.

b) Verwenden Sie Ihre simulierten Daten, um µ und σ 2 zu schätzen.

c) Was bedeutet es, wenn wir sagen, µ̂ und σ̂ 2 haben eine Wahrscheinlichkeitsverteilung?

Aufgabe 28: Xiaoyao hat den Verdacht, dass ihr neu gekaufter Würfel verfälscht (nicht fair) ist. Sie
will 120-mal würfeln und einen Signifikanztest auf die unbekannte Wahrscheinlichkeit p für das Ereignis
Augenzahl Vier“ durchführen. Xiaoyaos Hypothese lautet H0 : p = 1/6, die Alternative H1 : p ̸= 1/6.

Als Signifikanzniveau wählt sie 5%.
120 unabhängige Wurfversuche ergaben 30-mal Augenzahl Vier“.

a) Xiaoyao lehnt die Hypothese ab. — Was bedeutet das? (Was haben wir beobachtet? Was wissen
wir nun über den Würfel? Sind wir sicher?)

b) Könnte bei Xiaoyaos Testentscheidung unter (a) ein Fehler erster Art passiert sein? Ein Fehler zwei-
ter Art? — Falls ja, was bedeutet dieser Fehler und was können Sie über seine Wahrscheinlichkeit
sagen?

Aufgabe 29: Als der Euro eingeführt wurde, hatten Statistiker den Verdacht, dass bei der 1-Euro-Münze
die Wahrscheinlichkeiten, auf Kopf“ oder auf Zahl“ zu fallen, nicht gleich sind. Sie behaupteten, die
” ”
Münze falle häufiger auf Kopf“, wenn man sie auf einer glatten Oberfläche dreht.

In einem Dreh-Experiment“, das Studenten 1000-mal wiederholten, landete die Münze 537-mal auf

Kopf“.

a) Bestimmen Sie ein approximatives 95%-Konfidenzintervall für die Wahrscheinlichkeit p, dass die
Münze auf Kopf“ fällt, wenn man sie auf einer glatten Oberfläche dreht.

b) Mit dem Ergebnis in (a) können wir auch die Nullhypothese H0 : p = 0.5 gegen die Alternative
H1 : p ̸= 0.5 testen. Was ist das Ergebnis dieses Tests? Könnten wir einen Fehler 1. Art oder einen
Fehler 2. Art gemacht haben? Was bedeutet das?

© Angi Rösch / Harald Schmidbauer, 2023


ANGI RÖSCH & HARALD SCHMIDBAUER, FOM 12
c) Den Test in (b) kann man auch über den prob-value durchführen. Weil p̂ = 0.537 beobachtet worden
ist, hat der prob-value von H0 : p = 0.5 den Wert 0.0192 = 1.92%.
Bitte erklären Sie, was dieser Wert bedeutet und wie man ihn berechnet.
d) Wenn man den Test nochmal — mit frischen Daten — durchführt, wäre vielleicht der Test einer
einseitigen Nullhypothese sinnvoll. Welche der folgenden beiden Varianten ist in unserer Situation
geeigneter?

Variante 1: H0 : p ≥ 0.5 gegen H1 : p < 0.5


Variante 2: H0 : p ≤ 0.5 gegen H1 : p > 0.5

Bitte begründen Sie Ihre Antwort!


e) Testen Sie die geeignete Variante. Nehmen Sie dabei wieder an, dass p̂ = 0.537 beobachtet worden
ist. (Hinweis: Ein Teilergebnis aus (c) kann Ihnen beim Test weiterhelfen.)
f) Warum sollte man den Test in (e) besser mit frischen“ Daten durchführen?

Aufgabe 30: Ein Eistee-Fabrikant hat eine neue Geschmacksrichtung gefunden. Es sei p der unbekannte
Anteil seiner potenziellen Kunden, welche die neue Geschmacksrichtung gegenüber der traditionellen
bevorzugen. Die neue Geschmacksrichtung soll von 100 zufällig ausgewählten Personen beurteilt werden.
Auf der Basis der Beobachtungen in dieser Stichprobe möchte der Fabrikant einen Signifikanztest auf p
durchführen. Als Hypothese wählt er H0 : p ≤ 50%, als Alternative H1 : p > 50%. Sein Signifikanzniveau
ist 5%.
a) Welches konkrete Interesse hat der Fabrikant, wenn er die Hypothese und Alternative so formuliert?
Begründen Sie Ihre Antwort.
b) In der Stichprobe waren 55 Personen, die die neue Geschmacksrichtung bevorzugen. Was versteht
man in diesem Beispiel unter dem prob-value von H0 ?
c) Der prob-value von H0 ist 0.1587 = 15.87%. Testen Sie damit H0 gegen H1 .
d) Der Test des Fabrikanten führt nicht zur Ablehnung der Hypothese. — Interpretieren Sie dieses
Testergebnis.
e) Könnte bei der Testentscheidung unter (d) ein Fehler erster Art passiert sein? Ein Fehler zweiter
Art? — Was bedeutet dieser Fehler hier und was können Sie über seine Wahrscheinlichkeit sagen?
f) Was empfehlen Sie dem Eistee-Fabrikanten?

Aufgabe 31: Das arithmetische Mittel der Tagesrenditen eines Aktienindex (mit Beobachtungen aus
einem Jahr, 250 Werte) war 0.3%, und die empirische Standardabweichung der Tagesrenditen war 2.6%.
a) Testen Sie die Nullhypothese, dass der Erwartungswert µ der Tagesrenditen gleich 0% ist: Welche
Testgröße benutzen wir? Welche Werte der Testgröße sind kritisch? Was ist unsere Testentschei-
dung? Könnten wir einen Fehler 1. Art oder einen Fehler 2. Art gemacht haben? Was bedeutet das?
(Benützen Sie dazu ein Signifikanzniveau von α = 5%.)
b) Nehmen wir an, die Nullhypothese in (a) sei wahr. Die Wahrscheinlichkeit, dass das arithmetische
Mittel der Tagesrenditen aus 250 Tagen einen Wert außerhalb des Intervalls [−0.3%, +0.3%] an-
nimmt, ist dann 0.0672 = 6.72%.
Was bedeutet dieser Wert im Hinblick auf den Test in (a)?
c) Bestimmen Sie ein approximatives 95%-Konfidenzintervall für den Erwartungswert µ der Tagesren-
diten. Wie lässt sich dieses Intervall interpretieren? Wie lässt sich der Signifikanztest in (a) damit
durchführen?

© Angi Rösch / Harald Schmidbauer, 2023


ANGI RÖSCH & HARALD SCHMIDBAUER, FOM 13

Aufgabe 32: Eine Zuckerfabrik benutzt eine Abfüllanlage. Das Füllgewicht einer Zuckerpackung (in
Gramm) wird als normalverteilte Zufallsgröße X ∼ N(µ, σ 2 ) angesehen.
Es soll das erwartete Füllgewicht µ einer Zuckerpackung geschätzt werden.
In einer Stichprobe von n = 16 Packungen aus der laufenden Produktion ergab sich ein Gesamtgewicht
xi = 7 920 Gramm, und es war (xi − x̄)2 = 540.
P P
in Höhe von
a) Berechnen Sie einen Punktschätzer für µ.

b) Berechnen Sie ein (approximatives) 95%-Konfidenzintervall für µ.

c) Das Sollgewicht einer Zuckerpackung ist 500 Gramm. Stehen die Beobachtungen in der Stichprobe
im Einklang mit dem Sollgewicht? Begründen Sie Ihre Antwort.

Aufgabe 33: Eine der Fragen in einer Umfrage (konzipiert und durchgeführt von Yilmazsoy, Schmid-
bauer & Rösch) über Einkaufsgewohnheiten von Studierenden in China, Deutschland und der Türkei
war, ob die Studierenden es vorzögen, elektronische Produkte wie einen MP3-Spieler online zu kaufen
oder in einem traditionellen Geschäft.
Die folgenden Kontingenztafeln zeigen die Antworten der Studierenden zusammen mit deren Geschlecht:
China Deutschland Türkei
online traditionell online traditionell online traditionell
w 14 230 53 110 28 224
Geschlecht m 17 133 116 78 64 333

a) Führen Sie für alle drei Fälle einen χ2 -Test auf Unabhängigkeit durch; benutzen Sie dazu ein
Signifikanzniveau von 5%.

b) Mit Blick auf Ihre Ergebnisse in (a): Können Sie sich Konsequenzen für das Management eines
Online-Handels vorstellen, der sowohl in Deutschland als auch in der Türkei aktiv ist?

Aufgabe 34: In einem Restaurant wird das Servicepersonal auf Stundenbasis beschäftigt und je nach Be-
darf eingesetzt. Für eine Personalkostenanalyse werden fünfzehn Wochen lang die folgenden wöchentlichen
Größen notiert und verglichen:

Variable Bedeutung
customers Anzahl der bedienten Gäste
hours Anzahl der Arbeitsstunden

Ein lineares Regressionsmodell, mit hours als abhängige Variable und customers als unabhängige Va-
riable, wurde an die Daten gefittet. Der folgende R-Output zeigt das Ergebnis:

Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 23.78343 8.49968 2.798 0.0151 *
customers 0.46385 0.04517 10.268 1.32e-07 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 12.61 on 13 degrees of freedom


Multiple R-squared: 0.8902,Adjusted R-squared: 0.8818
F-statistic: 105.4 on 1 and 13 DF, p-value: 1.323e-07

a) Schreiben Sie die Gleichung der Regressionsgeraden auf.

b) Halten Sie diese Regression für angemessen?

© Angi Rösch / Harald Schmidbauer, 2023


ANGI RÖSCH & HARALD SCHMIDBAUER, FOM 14
c) Wie könnten die Parameter der Regressionsgeraden in diesem Beispiel gedeutet werden?

d) Wie hoch ist der R2 -Wert für dieses Regressionsmodell? Erklären Sie, was dieser Wert bedeutet.

e) Laut R-Output hat die Variable customers in diesem Modell einen Pr(>|t|)-Wert 1.32e-07“

(= 1.32 · 10−7 ). Erklären Sie, was dieser Wert bedeutet.

Aufgabe 35: Die folgende Tabelle enthält Daten von 66 Ländern (um das Jahr 2004):

piracy = der Prozentsatz von Software, die in diesem Land ohne gültige Lizenz installiert
ist,
gdp.pc = Bruttosozialprodukt pro Kopf in USD,
hdi = der Human Development Index (je höher der Index, desto höher ist der Ent-
wicklungsstand des Landes),
tri = der Internationale Korruptionsindex (je höher der Index, desto geringer ist die
im Land wahrgenommene Korruption).

country piracy gdp.pc hdi tri country piracy gdp.pc hdi tri
Argentina 71 13700 0.863 2.5 Latvia 57 13000 0.836 4.0
Australia 31 32000 0.955 8.8 Lithuania 58 13900 0.852 4.6
Austria 27 32900 0.936 8.4 Luxembourg 27 55600 0.949 8.4
Belgium 29 31900 0.945 7.5 Macedonia 72 7600 0.797 2.7
Bosnia 70 6800 0.786 3.1 Malaysia 63 10400 0.796 5.0
Brazil 61 8400 0.792 3.9 Mexico 63 10100 0.814 3.6
Bulgaria 71 9000 0.808 4.1 Netherlands 33 30600 0.943 8.7
Canada 35 32900 0.949 8.5 New Zealand 23 24200 0.933 9.6
Chile 63 11300 0.854 7.4 Norway 32 42400 0.963 8.9
China 92 6300 0.755 3.4 Panama 69 7100 0.804 3.7
Colombia 53 7100 0.785 3.8 Peru 68 6100 0.762 3.5
Costa Rica 68 10100 0.838 4.9 Philippines 72 5100 0.758 2.6
Croatia 59 11600 0.841 3.5 Poland 58 12700 0.858 3.5
Czech Republic 40 18100 0.874 4.2 Portugal 41 18600 0.904 6.3
Denmark 26 33400 0.941 9.5 Romania 73 8400 0.792 2.9
Dominican Rep. 76 6600 0.749 2.9 Russia 87 10700 0.795 2.8
Egypt 69 4400 0.659 3.2 Saudi Arabia 54 12900 0.772 7.5
Estonia 54 16400 0.853 6.0 Singapore 43 29900 0.907 9.3
Finland 31 30600 0.941 9.7 Slovakia 50 15800 0.849 4.0
France 45 30000 0.938 7.1 Slovenia 52 21000 0.904 6.0
Germany 30 29800 0.930 8.2 South Africa 36 12100 0.658 4.6
Greece 62 22800 0.912 4.3 Spain 44 25200 0.928 7.1
Hong Kong 52 37400 0.916 8.0 Sweden 27 29800 0.949 9.2
Hungary 42 16100 0.862 4.8 Switzerland 31 35300 0.947 9.1
India 73 3400 0.602 2.8 Thailand 80 8300 0.778 3.6
Indonesia 88 3700 0.697 2.0 Turkey 66 7900 0.750 3.2
Ireland 41 34100 0.946 7.5 UAE 34 29100 0.849 6.1
Israel 35 22300 0.915 6.4 UK 29 30900 0.939 8.6
Italy 49 28400 0.934 4.8 Ukraine 91 6800 0.766 2.2
Japan 29 30700 0.943 6.9 Uruguay 67 16000 0.840 6.2
Kazakhstan 85 8800 0.761 2.2 USA 22 42000 0.944 7.5
Korea 48 20400 0.901 4.5 Venezuela 72 6500 0.772 2.3
Kuwait 68 22800 0.844 4.6 Vietnam 92 3000 0.704 2.6

Mehrere multiple lineare Regressionsmodelle, jeweils mit piracy als abhängige Variable und einer Aus-
wahl anderer Variablen als unabhängige Variablen, wurden an die Daten gefittet. Drei dieser Modelle
sind:

© Angi Rösch / Harald Schmidbauer, 2023


ANGI RÖSCH & HARALD SCHMIDBAUER, FOM 15

Modell 1:
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 281.127 17.244 16.30 <2e-16 ***
log(gdp.pc) -23.627 1.788 -13.21 <2e-16 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 10.31 on 64 degrees of freedom


Multiple R-Squared: 0.7317, Adjusted R-squared: 0.7275
F-statistic: 174.6 on 1 and 64 DF, p-value: < 2.2e-16

Modell 2:
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 201.3720 25.0783 8.030 3.17e-11 ***
log(gdp.pc) -13.2630 3.0248 -4.385 4.50e-05 ***
tri -3.6566 0.9044 -4.043 0.000146 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 9.259 on 63 degrees of freedom


Multiple R-Squared: 0.787, Adjusted R-squared: 0.7802
F-statistic: 116.4 on 2 and 63 DF, p-value: < 2.2e-16

Modell 3:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 207.9137 25.9999 7.997 4.01e-11 ***
log(gdp.pc) -16.8516 4.8061 -3.506 0.000851 ***
hdi 33.1889 34.5281 0.961 0.340177
tri -3.6956 0.9058 -4.080 0.000131 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 9.264 on 62 degrees of freedom


Multiple R-Squared: 0.7901, Adjusted R-squared: 0.78
F-statistic: 77.8 on 3 and 62 DF, p-value: < 2.2e-16

a) Welches dieser Modelle würden Sie für einen Forschungsbericht auswählen? Warum?

b) Laut R-Output hat die Variable log(gdp.pc) in Modell 1 einen Pr(>|t|)-Wert von <2e-16“.

Erklären Sie, was das bedeutet.

c) Schreiben Sie die Regressionsgleichung von Modell 2 auf.

d) Der R2 -Wert für Modell 2 ist 0.787. Erklären Sie, was das bedeutet.

e) Berechnen Sie den geschätzten Wert von piracy für die Türkei auf der Basis von Modell 2.

f) Wie würde sich der geschätzte Wert von piracy für die Türkei nach Modell 2 verändern, wenn das
Bruttosozialprodukt pro Kopf um 10% anstiege und alle anderen Variablen unverändert blieben?

© Angi Rösch / Harald Schmidbauer, 2023

Das könnte Ihnen auch gefallen