Sie sind auf Seite 1von 8

Hypothesentesten / t-Test

1. Sie vergleichen mit einem t-Test die Mittelwerte zweier Stichproben und erhalten einen empirischen t-Wert von t emp .

Sie machen einen einseitigen Test und erhalten für t emp ein signifikantes Ergebnis. Angenommen, Sie machen einen zweiseitigen Test, dann ist t emp

a)

t emp notwendigerweise auch signifikant

b)

t emp möglicherweise signifikant

c)

t emp auf keinen Fall signifikant

d)

t emp in genau der Hälfte aller Fälle signifikant

Richtig ist b. Der kritische t-Wert (für ein bestimmtes Signifikanzniveau ) ist bei einem einseitigen Test im- mer niedriger als bei einem zweiseitigen Test. Deshalb kann, falls t emp > t krit , der zweiseitige Test auch signifi- kant werden, muss aber nicht. Wird umgekehrt t emp bei einem zweiseitigen Test signifikant, dann ist auch der einseitige Test signifikant, allerdings nur dann, wenn das Vorzeichen von t emp richtig ist (wenn also die einsei- tige Hypothese die Richtung korrekt angibt!).

2.

Sie messen in einer Stichprobe die Korrelation zwischen zwei Variablen X und Y; sie erhalten eine Korrelation von r

= 0.8. Sie wissen jetzt, dass

a)

in der Population die Korrelation ebenfalls 0.8 beträgt

b)

in der Population die Korrelation ganz sicher nicht 0.8 beträgt

c)

die wahre Korrelation mit 95%er Sicherheit zwischen 0 und 0.8 beträgt

 

d)

die Korrelation nicht signifikant von 0 verschieden ist

e)

die Korrelation von r = 0.8 ihre bestmögliche Schätzung der Korrelation in der Population ist

 

Richtig ist e. Vermutlich ist die wahre Korrelation (in der Population) nicht genau 0.8, aber möglich ist das na- türlich. Aber r gibt Ihnen die bestmögliche Punktschätzung. Genau genommen ist aber r nicht der optimale

Schätzer, denn ein erwartungstreuer Schätzer ist r adjusted :

Schätzer, denn ein erwartungstreuer Schätzer ist r a d j u s t e d :

. Aus traditionellen

Gründen wird aber meist r berichtet (Howell, p. 255).

3.

Der Standardfehler des Mittelwerts (bei einer Stichprobe des Umfangs N)

 

a)

steigt mit größerem N

b)

ist von N unabhängig

c)

entspricht der Standardabweichung mit N - 1

d)

sinkt mit größerem N

Richtig ist d. Ergibt sich einfach aus der Formel für den Standardfehler

Richtig ist d. Ergibt sich einfach aus der Formel für den Standardfehler

.

4.

Verändert man die Irrtumswahrscheinlichkeit von = 0.05 auf = 0.10, dann

a)

steigt die Wahrscheinlichkeit eines Fehlers 1. Art

b)

steigt die Wahrscheinlichkeit eines Fehlers 2. Art

c)

sinkt die Wahrscheinlichkeit eines signifikanten Ergebnisses

d)

sinkt die Wahrscheinlichkeit eines Fehlers 3. Art

Richtig ist a. Einen Fehler 1. Art macht man, wenn man die Nullhypothese zurückweist, obwohl sie wahr ist. Das Signifikantniveau ist per definition die Wahrscheinlichkeit eines Fehlers 1. Art. Über den Fehler 2. Art sagt uns nichts, und einen Fehler 3. Art gibt es (bisher) nicht.

5.

Eine Stichprobe liefert eine Teststatistik t, deren p-Wert = 0.15 beträgt. Das bedeutet, dass (H0 und H1 sind die Null-

und Alternativhypothese)

a)

P(t | H1) = 0.15

b)

P(H0 | t) = 0.15

c)

P(t | H0) = 0.15

d)

P(t | H0) = 1 - 0.15

Richtig ist c. Teststatistiken sind Verteilungen von Stichprobenfunktionen unter der H0. Ein p-Wert für t (wie er von Statistikprogrammen üblicherweise ausgegeben wird) ist die bedingte Wahrscheinlichkeit P(t | H0).

6.

Für einen 2-seitigen t-Test mit 24 Freiheitsgraden - was ist der kritische t-Wert für ein = 0.01 (laut Tabellierung der

t-Verteilung)?

a) 2,592

b) 1,711

#c) 2,797

d)

2,064

Richtig ist c. Hier der Ausschnitt aus der t-Verteilungstabelle:

ist c. Hier der Ausschnitt aus der t-Verteilungstabelle: In R bekommen Sie den entsprechenden Wert durch

In R bekommen Sie den entsprechenden Wert durch qt(0.995, 24).

7.

Die Stichprobenkennwerteverteilung (sampling distribution) einer Statistik bezeichnet

die Verteilung von -Werten, die man erhalten würde, wenn man theoretisch unendlich viele Zufalls- stichproben (der Größe N) aus der Population ziehen und jeweils berechnen würde

Korrelation und Regression

1.

Der Korrelationskoeffizient r wird berechnet als

a)

standardisierte Kovarianz

 

b)

unstandardisierte Kovarianz

c)

Kovarianz geteilt durch Stichprobengröße

d)

Produkt der Standardabweichungen

e)

standardisierte Summe der Abweichungsquadrate

Richtig ist a.

Richtig ist a. , d.h. die Kovarianz wird durch das Produkt der jeweiligen Standardabweichun-

, d.h. die Kovarianz wird durch das Produkt der jeweiligen Standardabweichun-

gen geteilt und damit in Bezug auf die Standardabweichungen standardisiert (auf den Bereich -1 bis +1).

2.

Die z-Standardisierung ist eine lineare Transformation einer ursprünglichen Variable X. Wie lautet bei dieser linea-

ren Transformation der Steigungskoeffizient b von X?

a)

Standardabweichung von X

b)

Standardabweichung von X minus Mittelwert von X

 

c)

1 geteilt durch Standardabweichung von X

d)

Standardabweichung von X geteilt durch Mittelwert von X

d) Standardabweichung von X geteilt durch Mittelwert von X  
 

Richtig ist c. Aus der üblichen Formel für die z-Standardisierung

ergibt sich durch Umfor-

mung der rechten Seite

. Man sieht, dass die z-Standardisierung eine lineare

. Man sieht, dass die z-Standardisierung eine lineare

Transformation mit b = 1/s x ist.

 

3.

In einem Scatterplot (Streudiagram) werden

a)

Messwertpaare zweier Variablen X und Y so dargestellt, dass sie möglichst nah beieinander liegen

b)

die Messwerte einer Variable X in eine Punktwolke überführt

 

c)

die Korrelation zwischen X und Y anschaulich als Punkteverteilung dargestellt

 

d)

Messwertpaare zweier Variablen X und Y in einem kartesischen Koordinatensystem dargestellt

Richtig ist d. Jeder Punkt in einem Scatterplot stellt eine Beobachtung dar mit ihren Messwerten auf X (Abszis- se) und Y (Ordinate). Man kann zwar vermuten, was dann die Korrelation ist (Antwort c), aber eine Darstel- lung der Korrelation ist das nicht.

4.

In der Gleichung

der Korrelation ist das nicht. 4. In der Gleichung steht "y Dach" für a) die bestmögliche

steht "y Dach" für

a) die bestmögliche Schätzung von Y auf Basis der Prädiktoren

b) den Residualwert von Y

c) den Regressionskoeffizient von X bei der Schätzung von Y

d) der Fehler, der bei der Schätzung von Y auftritt

Richtig ist a. Qua Vereinbarung sind Dach -Variablen immer Schätzungen.

5.

Mit der Methode der kleinsten Quadrate werden Koeffizienten für eine lineare Regressionsgleichung bestimmt, so

dass

a) die quadrierten Differenzen zwischen Residuen und Fehler so klein wie möglich werden

b) die Summe der quadrierten Abweichungen zwischen Regressionsschätzung und Messwert so gering wie möglich

wird

c)

die durchschnittliche quadrierte Distanz zwischen den Mittelwerten von X und Y so klein wie möglich wird

d)

die quadrierten Regressionsschätzungen eine möglichst kleine Summe bilden

Richtig ist b. Man will ja mit der Schätzung möglichst dicht an den Messwert rankommen.

6.

Der Regressionskoeffizient b in der einfachen (bivariaten) Regressionsanalyse berechnet sich durch

a)

Kovarianz durch Varianz von Y

 

b)

Kovarianz durch Standardabweichung von X und Y

c)

Varianz von X durch Kovarianz

 

d)

Kovarianz durch Varianz von X

Richtig ist d.

Richtig ist d. , ergibt sich als Lösung der kleinsten Quadrate (Howell, p. 256).

, ergibt sich als Lösung der kleinsten Quadrate (Howell, p. 256).

7.

Das Symbol r² bzw. R² steht für

a)

den Anteil vorhersagbarer Varianz im Kriterium Y

b)

den Anteil vorhersagbarer Varianz im Prädiktor X

c)

die multiple Korrelation zwischen X und Y

d)

die Korrelation zwischen Y und den Residuen

Richtig ist a.

, d.h. dass r 2 den Anteil an der gesamten Summe der Abweichungsquadrate der Krite-

, d.h. dass r 2 den Anteil an der gesamten Summe der Abweichungsquadrate der Krite-

riumsvariable Y (SS Y ) angibt, der durch die Schätzungen ( ) erfasst wird.

8.

Welche der folgenden Aussagen ist falsch?

a)

Der Mittelwert der Schätzung ist gleich dem Mittelwert des Kriteriums

b)

Die Korrelation zwischen Schätzung und Fehler ist R²

c)

Der Mittelwert der Residuen ist Null

 

d)

Die Korrelation zwischen Prädiktor und Residuen ist Null

Richtig ist b. D.h. die Aussage b) ist falsch: Die Korrelation zwischen Schätzung und Fehler ist Null, da die Schätzungen ja die bestmöglichen Vorhersagen sind; der Rest, der nicht vorhersagbar ist, macht ja den Fehler (die Residuen) aus.

9.

Die folgende Formel

 
(die Residuen) aus. 9. Die folgende Formel   steht für a) den t-Test für die H0:

steht für

a) den t-Test für die H0: die Korrelation in der Population ist Null

b) den t-Test für die H0: der Regressionskoeffizient j ist in der Population Null

c) den t-Test für die H0: die Steigung b j in der Stichprobe ist Null

Richtig ist b. Nullhypothesen machen immer Aussagen über die Population; auf Grund der Stichprobenkenn- werte prüfen wir, ob diese Aussagen plausibel sind.

10. Angenommen, ein Regressionskoeffizient ist in der Population = 0. Die Regressionsgerade einer entsprechenden

Stichprobe wäre dann erwartungsgemäß

a) horizontal

b) vertikal

c) diagonal

d) nicht bestimmbar

Richtig ist a. Der Regressionskoeffizient bezeichnet die Steigung der Regressionsgerade; eine Steigung von Null impliziert eine Horizontale. In der Stichprobe wird die Steigung natürlich meistens nicht exakt 0 sein.

11. Die Partialkorrelation zwischen 2 Variablen X und Y hinsichtlich einer dritten Variable Z ist identisch mit

a) der Korrelation der Schätzungen nach Auspartialisieren von Z aus X und Y

b) der Korrelation zwischen Schätzung von X und Residuen von Y nach Auspartialisieren von Z

c) der Korrelation zwischen X und Y nach Auspartialisieren von X und Y aus Z

d) der Korrelation der Residuen nach Auspartialisieren von Z aus X und Y

Richtig ist d. Qua Definition (Howell, pp. 552ff.).

12. Bei der semipartiellen Korrelation r(x,y.z) wird

a) Z nur aus X auspartialisiert

b) Z nur aus den Residuen von X auspartialisiert

c) Z erst aus X, dann erst aus Y auspartialisiert

d) Z nur aus Y auspartialisiert

Richtig ist d. Die Schreibweise mit dem Punkt . bezeichnet das Auspartialisieren: y.z heißt, z wurde aus y aus- partialisiert.

13. Durch Hinzunahme von weiteren Prädiktoren in ein Regressionsmodell wird R²

a) immer größer

b) mal größer mal kleiner

c) größer oder bleibt gleich

d) kleiner oder bleibt gleich

Richtig ist c. Selbst wenn ein weiterer Prädiktor keinerlei Vorhersage macht, kann das Modell insgesamt nicht schlechter werden, da die alten Prädiktoren ja weiterhin vorhanden sind.

14. Sie berechnen die Regression von y auf x1 und x2 mit drei Modellen: (1) y = b1x1 + a1, (2) y = b2x2 + a2, sowie

(3) y = b1x1 + b2x2 + a. Alle Variablen sind korreliert. Was erwarten Sie für die Regressionskoeffizienten von Modell (3) im Vergleich zu (1) und (2)?

a) die Koeffizienten sind verschieden

b) die Koeffizienten sind identisch

c) die Koeffizienten sind alle größer

d) die Koeffizienten sind alle kleiner

Richtig ist a. Regressionskoeffizienten sind immer Schätzer im Kontext des Gesamtmodells (aller Prädiktoren). Je nach Korrelation zwischen den Prädiktoren verändern sich die b-Koeffizienten.

16. Unter einem standardisierten Regressionskoeffizienten versteht man

a) den Koeffizienten unter Verwendung normalverteilter Variablen

b) den Koeffizienten, der nachträglich auf Werte zwischen 0 und 1 normiert wurden

c) den Koeffizienten unter Verwendung z-standardisierter Variablen

d) den Koeffizienten unter Verwendung z-standardisierter Residuen

Richtig ist c. Qua Definition.

17. Bei einer multiplen Regression erhalten Sie ein R² = 0,50. Die Varianz ihres Kriteriums y beträgt s² = 9. Wie groß

ist der Anteil der Varianz des Kriteriums, den Sie durch die Prädiktoren erklären können?

a) 4

b) 4,5

c) 0,25

d) 0,50

Richtig ist b. R 2 bezeichnet den Anteil erklärter Varianz im Kriterium: 0,50 x 9 = 4,5.

18. Der t-Test für Regressionskoeffizienten überprüft die H0

a) b = 0

b) b = 1

c) ß = b

d) ß = 0

Richtig ist d. Nullhypothesen beziehen sich auf Populationsparameter (Vorsicht: den Populationsparameter nicht verwechseln mit dem standardisierten Regressionskoeffizienten !).

19. Welche der folgenden Aussagen ist falsch?

a) Durch ein signifikantes Regressionsmodell kann man Ursache und Wirkung nachweisen

b) Durch ein signifikantes Regressionsmodell kann man Vorhersagen machen

c) Durch ein signifikantes Regressionsmodell kann man statistische Zusammenhänge beschreiben

d) Durch ein signifikantes Regressionsmodell kann man eine Hypothese bestätigen

Richtig is a. D.h. es ist falsch, das man durch ein Regressionsmodell irgend etwas über Ursache und Wirkung nachweisen kann. Die Interpretation einer statistischen Analyse hinsichtlich Ursache-Wirkung muss das Unter- suchungsdesign berücksichtigen.

20. Bei einer Regressionsanalyse mit zwei Prädiktoren x1 und x2 erhalten Sie die nicht-standardisierten Koeffizienten

b1 und b2, wobei b2 > b1 ist. Beide Koeffizienten sind signifikant. Welche der folgenden Aussagen ist korrekt

a) x2 beeinflusst y stärker als x1

b) der Einfluss von x1 und x2 auf y ist gleich

c) eine Veränderung um 1 Einheit auf x2 wirkt sich stärker auf y aus als eine Veränderung um 1 Einheit auf x1

d) eine Veränderung um 1 Einheit auf x2 kommt vor einer entsprechenden Veränderung um 1 Einheit auf x1

Richtig ist c. Regressionskoeffizienten sind maßstabsabhängig (vom Maßstab der Prädiktoren), ob z.B. Länge in Metern oder Zentimetern gemessen wurde. Das sagt nichts über die Stärke des Einflusses.

Varianzanalyse

1.

Die Varianzanalyse benutzt man vor allem zur Auswertung von

a)

Fragebögen

b)

Psychologischen Tests

c)

Fallstudien

d)

Experimenten

Richtig ist d.

2.

Die einfaktorielle Varianzanalyse untersucht die Beziehung zwischen

a)

zwei abhängigen Variablen

b)

einer abhängigen und mehreren unabhängigen Variablen

c)

einer unabhängigen und einer abhängigen Variable

d)

zwei unabhängigen Variablen

Richtig ist c. Einfaktoriell bedeutet, es gibt einen Faktor = eine unabhängige Variable (die in mehreren Stufen = experimentellen Bedingungen vorkommt).

3.

die unterschiedlichen Ausprägungen eines Faktors heißen

a)

Stufen

b)

Treppen

c)

Blöcke

d)

Messungen

Richtig ist a. Terminologie.

4.

Unter Randomisierung versteht man

a)

Die zufällige Zuordnung von Untersuchungseinheiten zu experimentellen Bedingungen

b)

Die Erstellung einer repräsentativen Stichprobe aus einer Population

c)

Die zufällige Ziehung eines Messwerts aus einer Menge von Messwerten

d)

Das zufällige Auswählen einer Person für ein Experiment

Richtig ist a. Damit wird gewährleistet, dass die experimentellen Bedingungen hinsichtlich Störvariablen zufäl- lig zusammengesetzt sind (d.h. sich theoretisch mit N -> ausgleichen). Nicht verwechseln mit dem Ziehen ei- ner Zufallsstichprobe (random sampling).

5.

Das Grundmodell der einfaktoriellen Varianzanalyse lautet

Das Grundmodell der einfaktoriellen Varianzanalyse lautet Dabei bedeutet j : a) Der Effekt des Zufalls in

Dabei bedeutet j :

a) Der Effekt des Zufalls in Bedingung j

b) Der Effekt der j-ten Bedingung

c) Der Effekt der j-ten Person

d) Der durchschnittliche Effekt aller j Bedingungen

Richtig ist b.

der j-ten Bedingung c) Der Effekt der j-ten Person d) Der durchschnittliche Effekt aller j Bedingungen

6.

Die Alternativhypothese bei der einfaktoriellen Varianzanalyse lautet

a)

mindestens zwei Mittelwerte sind nicht gleich

b)

alle Mittelwerte sind verschieden

c)

einige Mittelwerte sind mindestens nicht gleich

d)

höchstens zwei Mittelwerte sind gleich

Richtig ist a. Denn die Nullhypothese lautet: alle Mittelwerte sind gleich.

7.

Der Ausdruck

lautet: alle Mittelwerte sind gleich. 7. Der Ausdruck (j: Index der Faktorstufen, n: Umfang der Stichprobe

(j: Index der Faktorstufen, n: Umfang der Stichprobe pro Bedingung, K: Anzahl Stufen, i: Index der Personen) be- zeichnet:

a)

die Fehler-Quadratsumme SS(error)

b)

die totale Quadratsumme SS(total)

c)

die Treatment-Quadratsumme SS(treat)

d)

die Stufenquadratsumme SS(jk)

Richtig ist c. Berechnet wird die Differenz zwischen Mittelwert eines Treatments (einer Bedingung) und dem Gesamtmittelwert, quadriert und aufsummiert über alle Treatments. Auf deutsch auch SAQ zwischen (Summe der Abweichungsquadrate zwischen) genannt, weil die Differenzen zwischen den Treatments betrachtet werden.

8.

Angenommen, die H1 gilt. Der F-Test der Varianzanalyse liefert dann einen F-Wert

a)

der wahrscheinlich deutlich kleiner als 1 ist

b)

der wahrscheinlich deutlich größer als 0 ist

c)

der wahrscheinlich in der Nähe von 1 liegt

d)

der wahrscheinlich deutlich größer als 1 ist

Richtig ist d. Unter der H0 erwarten wir, dass MS treatment und MS error gleich sind, also F=MS treatment /MS error = 1 ist. Unter der H1 erwarten wir, dass MS treatment großer wird, weil ein echter Treatment-Effekt zur Varianz beiträgt; entsprechend wird F erwartungsgemäß größer als 1.