Beruflich Dokumente
Kultur Dokumente
Heteroskedastizität
5.1 Form und Auswirkung
In dem multiplen Regressionsmodell ist bisher unterstellt worden, dass die Stör-
größe u homoskedastisch ist, d.h. in allen Perioden bzw. für alle statistische Ein-
heiten die gleiche Varianz besitzt. Zusammen mit der Annahme fehlender Auto-
korrelation bedeutet dies, dass die Varianz-Kovarianz-Matrix skalar ist:
Wir behalten zunächst die Annahme fehlender Autokorrelation bei, lassen aber
unterschiedliche Varianzen der Störgröße u zu. Folgen etwa die exogenen Vari-
ablen z.B. einem aufsteigenden Trend, dann kann bei zeitabhängigen Daten mit
der Zeit steigende Störgrößenvarianz vorliegen. Bei Querschnittsdaten tritt in der
Regel der Fall auf, dass die Konsumausgaben in den höheren Einkommensklas-
sen bei gegebenem Einkommen stärker streuen als in den unteren Einkommens-
klassen, In beiden Fällen die die Varianz der Störgröße u nicht mehr konstant,
sondern variiert innerhalb der Zeit oder der Querschnittseinheiten. Man spricht in
diesem Fall von Heteroskedastizität. Im Falle einer heteroskedastischen Stör-
Größe ist ihre Varianz-Kovarianz-Matrix nicht durch (2.7) sondern durch
σ 2 0 0
1 2
σ 0
Cov(u) E(uu' )
0 2
(5.1)
2
0 0 σ n
(5.3) x t x y t x t x u t
β̂ 2 β2
x t x x t x
2 2
da β2 als Konstante eine Varianz von 0 hat. Während man bei einer homoskedas-
tischen Störvariablen ut den gesamten Bruch wegen Var u t herausziehen
2
kann,
x t x 2 Var u t
(5.4)
Var β̂ 2
1
σ2
x t x
22 x t x
2
x t x Var u t x t x t
2 2 2
Var ˆ 2
x t x 2 2
(5.5)
22
x t x
Obwohl im Falle von Heteroskedatizität die Varianz (5.5) gültig ist, wird bei
einer OLS-Schätzung die Varianz von β̂ 2 auf der Basis der Beziehung (5.4)
verzerrt geschätzt. Damit verliert aber gleichzeitig die t-Statistik ihre Gültigkeit,
da sie im Nenner die Wurzel von Var ˆ 2 enthält. Folglich lassen sich bei hetero-
skedastischen Störvariablen aufgrund der gewöhnlichen Kleinst-Quadrate-
Schätzung (OLS-Schätzung) keine gültigen Aussagen mehr über die Signifikanz
der geschätzten Regresssionskoeffizienten machen.
5.2 Tests auf Heteroskedastizität
5.2.1 Goldfeld-Quandt-Test
Mit dem Goldfeld-Quandt-Test stellen wir hier ein eher traditionelles Verfahren zur
Überprüfung der Nullhypothese homoskedastischer Störterme vor, das sich jedoch
in der Praxis großer Beliebtheit erfreut. Für die Störgrößen gelten die bereits disku-
tierten Annahmen,
u t 0 , t 1, , n
Cov(u t , u s ) u t u s 0 , t s , t 1,, n
d.h., die Störterme haben einen Erwartungswert von 0 und sind nicht miteinander
korreliert. Jedoch wird die Hypothese der Varianzhomogenität in Zweifel gezogen.
Beim Goldfeld-Quandt-Test werden normalverteilte Störterme unterstellt.
Die Grundidee des Tests besteht darin, dass sich die Varianz der Störterme von
den Regressoren abhängig entwickelt. Variiert die Störvarianz etwa mit steigenden
Werten der j-ten exogenen Variablen in der Form
(5.6) σ 2t σ 2 x 2jt , t 1,2,...,n
Alternativhypothese: H1: σ1² < σ2² oder H1: σ1² > σ2²
Durchführung des Goldfeld-Quandt-Tests
nach der OLS-Methode durchgeführt, wobei der Index i die jeweilige Stichprobe
bezeichnet. Aus den geschätzten Regressionen lassen sich dann die OLS-Resi-
duen
(5.8) uˆ i y i Xiβˆ i i = 1,2
berechnen.
Im Falle von σ1² > σ2² wird anstelle von GQ der Kehrwert der Teststatistik 1/GQ
verwendet.
Als Quotient zweier unabhängiger χ²-verteilter Zufallsvariablen ist die Teststatistik
GQ F-verteilt mit (n-c)/2-k Zähler- und Nennerfreiheitsgraden.
Testentscheidung:
1. Stichprobe 2. Stichprobe
ln y t Jahr ln y t Jahr
Testentscheidung:
GQ=5,1808 > F6;6;0,95 = 4,28 H0 ablehnen
GQ=5,1808 < F6;6;0,99 = 8,47 H0 annehmen
5.2.2 Breusch-Pagan-Test
(5.11) y t x 't β u t
unter der Alternativhypothese H1 als Funktion der beobachtbaren Variablen z2, z3,
…, zp in der Form
(5.12a)
σ 2t h α1 α 2 z 2t α p z pt
oder mit
α' α1 α 2 α p und
z 't z1t 1 z 2t z pt
(5.12b)
σ 2t h z 't α
darstellen lassen. Die Funktion h braucht hierbei nicht näher spezifiziert zu werden.
Mit dem Ansatz lassen sich somit verschiedene Fälle möglicher Heteroskedastizi-
tät wie z.B.
2t exp z 't α oder 2t z 't α
abdecken. Dabei kann die Varianz der Störterme über den gesamten Zeitraum vari-
ieren. Gefordert wird allerdings, dass diese Variation vollständig auf die Variablen
z2, z3, …, zp zurückführbar ist.
Für p=2 ist die Varianz σt² der Störvariablen ut allein von einer Variablen z=z2 ab-
hängig:
σ 2t h α1 α 2 z t
Speziell ist die Störvarianz σt² bei Linearität in diesem Fall durch
σ 2t α1 α 2 z t
gegeben. Als z-Variable kommt hierbei eine bestimmte exogene Variable z.B. x2 in
Betracht, die auch in logarithmischer Form (ln x2) oder quadratischer Form (x2²) ver-
wendet werden kann.
Nullhypothese H 0 : α2 = α3 = … = αp = 0
Alternativhypothese H1: Mindestens ein αj ≠ 0, j=2,3,…,p
Die Nullhypothese gibt den Fall der Homoskedastizität wieder, da aus ihr σt² = σ²
für alle t folgt. Unter der Alternativhypothese sind mindestens zwei Varianzen un-
gleich, σt² ≠ σs² für t≠s, was Heteroskedastizität bedeutet.
Durchführung des Breusch-Pagan-Tests
Bei einer Normalverteilung der Störgröße ut ist die Teststatistik BP1 bzw. BP2
unter der Nullhypothese asymptotisch, d.h. bei großen Stichproben, χ²-verteilt
mit p-1 Freiheitsgraden.
Testentscheidung:
Die logarithmierte Form von y ist hier in Übereinstimmung mit der Geldnachfrage-
funktion gewählt worden.
2
Zur Bestimmung des ML-Schätzers ̂ ML für die Varianz σ² der Störvariablen ut
des ökonometrischen Geldnachfragemodells (2.28) übernehmen wir die in Ab-
schnitt 2.1 ermittelte Residualquadratsumme
uˆ 2t uˆ 'uˆ 0,054376
mit der sich
ˆ ˆ 0,054376
u'u
ˆ 2ML 0,002862
n 19
ergibt. Hiermit lassen sich die Größen û 2t ˆ 2ML berechnen, die auf ln y regressiert
werden.
Aus der OLS-Schätzung
uˆ 2t ˆ ML
2
8,156 1,192
0,348
ln(y ) ,
0,391
t R 2 0,061
lässt sich die Residualquadratsumme SSR= 40,50927 ermitteln. Mit SST= 43,14451
erhält man die durch die Hilfsregression erklärte Abweichungsquadratsumme
Teststatistiken: 1
BP1 SSE 1,317622
1,318 und 2 n R 2 19 0,061 1,159
2
Kritischer Wert (α=0,05; p=2): χ²1;0.95 = 3,841
Testentscheidung:
BP1=1,318 < χ²1;0,95 = 3,841 H0 beibehalten
BP2=1,159 < χ²1;0,95 = 3,841 H0 beibehalten
Beide Teststatistiken BP1 und BP2 weisen aus, dass die Nullhypothese der Ho-
moskedastizität kann auf einem Signifikanzniveau von 5% nicht verworfen wer-
den kann.
5.2.3 White-Test
Der White-Test beruht auf einem Vergleich der geschätzten Varianz-Kovarianz-
Matrizen des OLS-Schätzers für den Parametervektor β. Dabei wird die Kovarianz-
matrix des klassischen Modells, die nur bei homoskedastischen Störprozessen
konsistent ist, einer Schätzung gegenübergestellt, die sowohl bei hetero- als auch
bei homoskedastischen Störtermen konsistent ist.
Der Test wird implementiert, in dem die Residuen des ursprünglichen Modells
quadriert und anschließend gemäß
2 k k k
(5.16) û t α 0 αi x it α ij x it x jt v t
i2 i 2 ji
auf die k-1 ursprünglichen Regressoren, ihre Quadrate und ihre Kreuzprodukte re-
gressiert werden. Die Größe vt ist in der Hilfsregression (5.16) die Störvariable.
Teststatistik: (5.17) W n R2
û 2t α 0 α1 ln y t α 2 ln rt α3 (ln y t ) 2 α 4 (ln rt ) 2 α5 ln y t ln rt v t
Testentscheidung:
W=4,522 < χ²5;0,95 = 11,070 H0 beibehalten, d.h. die Nullhypothese der
Homoskedastizität kann auf einem Signifi-
kanzniveau von 5% nicht verworfen werden
5.3 Modellschätzung bei Heteroskedastizität
5.3.1 Verallgemeinerte Methode der kleinsten Quadrate (GLS)
σ2 0 0
1
0 σ 22 0
(5.19) Cov(u)
0 0 σ2
n
gegeben. (5.19) wird jedoch typischerweise in der Form (5.18) dargestellt. Allge-
mein lässt sich die Heteroskedastizität über eine Skalierungsvariable t modellie-
ren. Sie wird in der Regel durch eine Funktion einer (allgemeiner: mehrerer) exo-
genen Variablen zt erfasst. Ein einfaches Modell zur Bestimmung der hetero-
skedastischen Varianzen σt² ist dann durch
(5.20a) 2t 2 t 2zt ,t 1,...,n
gegeben. In (5.20a) sind nur noch die Parameter σ2 und δ unbekannt. Während
σ² jetzt ein Skalenfaktor ist, muss der Parameter δ so gewählt werden, dass die
Störvarianzen σt² positiv sind.
Beschäftigen wir uns aber zunächst grundsätzlich mit der Schätzung eines Regres-
sionsmodells mit heteroskedastischen Störtermen. Wie sich zeigen wird, ist in
diesem Fall die OLS-Methode durch die GLS-Methode zu ersetzen. Um die Grund-
struktur des verallgemeinerten Kleinst-Quadrate-Schätzers im linearen Regressions-
modell transparenter zu machen, wird hier zunächst einmal unterstellt, dass die nn-
Matrix Ω bekannt ist.
Wenn Ω symmetrisch und positiv definit ist, gilt dies ebenfalls für ihre Inverse Ω-1
die sich dann wie folgt faktorisieren lässt:
(5.21) Ω 1 T' T
[ Eine nn-Matrix A ist positiv definit, wenn ihre quadratische Form positiv ist, d.h.
für alle n1-Vektoren x≠0 muss x'Ax>0 gelten.]
T ist darin eine reguläre Matrix der Ordnung n. Wird nun das ökonometrische Modell
(2.5) y Xβ u
von links mit der Matrix T, die zunächst als bekannt unterstellt wird, multipliziert, folgt
(5.22) Ty TXβ Tu
Gleichung (5.22) ist ein transformiertes Regressionsmodells des Typs (2.5),
(5.23) y* X*β u*
mit
Der entscheidende Punkt ist nun, dass die transformierte Störvariable u* die
Standardannahmen
(5.25)
E u* 0 und (5.26)
Cov(u*) E u*u*' 2I
erfüllt, was bei Heteroskedastizität für die originäre Störvariable u nicht der Fall
ist. Aus diesem Grund kann der unbekannte Vektor der Regressionskoeffizien-
ten, β, aus dem transformierten Modell in gewohnter Form mit der Kleinst-Qua-
drate-Methode geschätzt werden. Da die Schätzung jedoch nicht aus dem ori-
ginären Regressionsmodell (2.5), sondern aus dem transformierten Modell (5.23)
erfolgt, bezeichnet man diese Schätzung als verallgemeinerte Kleinst-Qua-
drate-Schätzung (GLS-Schätzung).
Beweis von (5.25):
E u* ETu TE(u) 0 □
[ Die Berechnung der Inversen erfolgt nach der Regel (AB) -1 = B-1A-1. ]
(5.27a) βˆ GLS X*' X*
1 *' *
X y
Bei der Bestimmung des GLS-Schätzers β̂ GLS braucht jedoch keinesfalls auf die
Transformationsmatrix T zurückgegriffen werden. Vielmehr lässt er sich unmittel-
bar aus
(5.27b)
βˆ GLS X' Ω 1X 1 X'Ω1y
bestimmen, worin allein die Inverse der bis auf den Skalar σ² gegebenen Kova-
rianzmatrix Ω eingeht.
oder mit X* = TX
(5.28b) Cov βˆ GLS 2 X' Ω 1X
1
gegeben ist. Die unbekannte Störvarianz σ² kann hierbei durch
2 uˆ *' uˆ *
(5.29a) ˆ GLS
n-k
Aus den originären Daten lässt sich der GLS-Schätzer (5.29a) der Störvarianz
σ² unter Verwendung von
2
y Xβˆ GLS ' Ω 1 y Xβˆ GLS
(5.29b) ˆ GLS
n-k
bestimmen. Wie man anhand der Formeln (5.27b), (5.28b) und (5.29b) sieht,
ist eine Kenntnis der Transformationsmatrix T zur Durchführung der GLS-
Schätzung nicht notwendig erforderlich. Allein die Kovarianzmatrix Ω muss be-
kannt sein oder geschätzt werden. Mit ihrer Bestimmung auf der Grundlage
des Modells (5.20a) zur Bestimmung der heteroskedastischen Varianzen σt²
werden wir uns im folgenden Abschnitt beschäftigen.
5.3.2 Gewichtete Methode der kleinsten Quadrate (WLS)
für die Varianzen σt² basiert. Die Validität dieses Ansatzes kann empirisch mit
dem Breusch-Pagan-Test auf Heteroskedastizität überprüft werden. Im einfachsten
Fall setzt man den Parameter δ, der gerade sein muss, gleich 2:
Unter der Annahme (5.20b) ist die Kovarianzmatrix der Störvariablen Cov(u) durch
2z 2 0 0 z2 0 0
1 1
2 0 2z 2 0 2 0 z 22 0
Cov(u) Ω 2
0 2 z 2n 0 0 z2
n
gegeben.
Aus
z2 0 0
1
0 z 22 0
Ω
0 0 z2
n
kann auf einfache Art und Weise die Transformationsmatrix T bestimmt werden.
Da die Inverse von Ω
1 z 2 0 0
1
1 0 1 z 2 0
2
Ω
0 0 1 z 2n
aufgrund von (5.21) durch die Produktmatrix T’T gegeben ist, folgt unmittelbar
1 z1 0 0
0 1 z 2 0
T
0 0 1 zn
Sofern die z-Werte durch die Beobachtungen einer einzigen exogenen Variablen
z.B. x2 gegeben sind, spezifiziert sich die Transformationsmatrix T zu
1 x 21 0
0
0 1 x 22 0
T
0 0 1 x 2n
Man erhält dann einen GLS-Schätzer für β indem man die Variablen der Modell-
gleichung
(2.1a) y t 1 2 x 2t 3x 3t k x kt u t
u
Var u*t Var t
x 2t
1
x 22t
Var u t
1
x 22t
σ 2 z 2t ,
Var u*t 2
erhält. ]
Die Heteroskedastizität wird nach dieser Verfahrensweise mithin durch eine Ge-
wichtung der Modellvariablen beseitigt. Die Gewichte sind hierbei allgemein
durch den Faktor 1/zt gegeben. Die Schätzung des Vektors der Regressions-
Koeffizienten, β, des multiplen Regressionsmodells (2.1a) unter Verwendung
der transformierten Variablen
y x x x u
y*t t , x1*t 1t , x*2t 2t , , x*kt kt , u*t t
zt zt zt zt zt
mit der OLS-Methode wird aus diesem Grund auch als WLS-Schätzung [ge-
wichtete Kleinst-Quadrate-Schätzung (weighted least-squares)] bezeichnet.
Beispiel:
Zur Modellierung der Heteroskedastizität verwenden wir den Ansatz (5.20b), nach
dem die Heteroskedastizität auf eine exogene Variable zurückzuführen ist. Wählt
man hierzu den Regressors ln y. dann lässt sich die Störvarianz σt² in der Form
2t 2 ln y t 2
spezifizieren. Das Regressionsmodell der gewichteten Methode der kleinsten
Quadrate (WLS-Methode) als Spezialfall der GLS-Methode lautet hier
^
ln m
t 1 ln rt u *
(5.32) 1 2 3 t
ln y t ln y t ln y t
mit ut* = ut/ln yt. OLS-Schätzung des ökonometrischen Modells (5.32) führt zu
den GLS-Schätzern
ˆ 1,GLS 15, 025 t 12,114
ˆ
2,GLS 2,812 t 17, 679
und
ˆ 3,GLS 0,188 t 6, 261 ,
deren t-Statistiken zum Zwecke von gültigen Signifikanztests und Konfidenz-
Intervallen verwendet werden können.
Man beachte, dass der Determinationskoeffizient der OLS-Schätzung von ROLS² =
0,984 nicht unmittelbar mit dem z.B. von Programmpaketen wie EViews oder
SPSS ausgewiesenem Bestimmtheitsmaß der WLS-Schätzung, RWLS² = 0,973,
vergleichbar ist, da sich letzteres auf die transformierten Variablen bezieht.
Um ein zu ROLS² vergleichbares Bestimmheitsmaß zu erhalten, sind zunächst
die WLS-Regressionswerte für die (nicht für die transformierten!) originären
Beobachtungen zu bestimmen:
ln m t,WLS 15,02488 2,81211 ln y t 0,18835 ln rt
So erhält man z.B. für die Periode 1 den WLS-Regressionswert
ln m1,GLS 15, 02488 2,81211 ln y1 0,18835 ln r1
5, 71135.
Führt man die entsprechenden Berechnungen für den Stützzeitraum der Re-
gression durch, dann erhält man die Zeitreihe der Regressionswerte ln m t ,WLS :
t 1 2 3 4 5 6
ln m t , WLS 5,71135 5,84489 5,94334 5,99917 6,05650 6,14945
t 7 8 9 10 11 12
ln m t , WLS 6,14098 6,21915 6,30482 6,39293 6,47248 6,50900
t 13 14 15 16 17 18
ln m t , WLS 6,55275 6,62531 6,67728 6,79804 7,01496 7,03007
t 19
ln m t , WLS 7,26515
Mit der Varianz der logarithmerten Geldmenge s²ln m = 0,1860949 und der durch
Regression erklärten Varianz s 2 = 0,1828249 erhält man das Bestimmt-
ln m,WLS
heitsmaß der WLS-Schätzung für die Variablen auf originärem Messniveau:
s2 ^
ln m,WLS 0,1828249
R2WLS 0,982
2 0,1860949
sln m □
5.3.3 Heteroskedastizität-konsistente (HC) Standardfehler
Wenn die Heteroskedastizität tatsächlich auf eine exogene Variable auf der Basis
des Ansatzes (5.20a) zurückgeführt werden kann, kann lässt sich der Vektor der
Regressionskoeffizienten, , in der Tat mit der verallgemeinerten Methode der
kleinsten Quadrate (GLS) oder gewichteten Methode der kleinsten Quadrate
(WLS) effizient schätzen. Wie sieht die Situation aber aus, wenn Unsicherheit
über die Form der Heteroskedastizität besteht?
(5.33a) Cov(βˆ ) (X' X)1 X' diag (12 , 22 ,..., 2n )X(X' X)1
mit
2 0 0
1 2
0
Cov(u) 2 Ω diag (12, 22,..., 2n )
0 2
(5.1)
2
0 0 n
lautet. Unter Verwendung der Matrix
1 2 2 2 1 n 2
(5.34) S0 X' diag (1 , 2,..., n )X t x t x t'
n n t 1
berechnen.
Im Falle der einfachen Regression (k=2) ist der HC-Schätzer für die Varianz des
Regressionskoeffizienten β̂ 2 (= Steigungsmaß) nach White durch
x t x uˆ t
2 2
V a r(ˆ 2 )
x t x 2 2
(5.37)
gegeben. Gleichung (5.37) lässt sich als Stichprobenäquivalent der Gleichung (5.5),
x t x t
2 2
Var ̂ 2
x t x
(5.5)
22
(5.39) HC2 (X' X)1 X' diag [ uˆ 12 /(1 h11 ),..., uˆ 2n /(1 h nn )]X(X' X)1
.
Hierin sind die Größen htt die Hauptdiagonalelemente der Hat-Matrix H (Projektions-
matrix, die den Vektor der abhängigen Variablen y in den Vektor der Regressions-
werte ŷ transformiert),
(5.40) H X(X' X)1 X' ,
mit der die Beziehung
(5.41) uˆ (I H) u
zwischen den OLS-Residuen û t und den unbekannten Störgrößen u t herge-
stellt werden kann. Angesichts der Notwendigkeit, die Störgrößen u t durch die
Residuen û t ersetzen zu müssen, stellt der HC1-Schätzer (5.39) auf die Bezie-
hung zwischen diesen beiden Größen ab.
Mit x t' als t-ten Zeile der Beobachtungsmatrix X lassen sich die Diagonalelemen-
te htt direkt aus
(5.42) h tt x t' (X' X)1 x t
ermitteln.
Eine weitere Modifikation bei der Konstruktion eines HC-Schätzers für die Varianz-
Kovarianz-Matrix (5.33a/b) ergibt sich durch einen Bezug der Residuenquadrate
û 2t auf die quadrierten Größen (1 h tt )2 . Hiermit ist der HC3-Schätzer
(5.42) HC3 (X' X)1 X' diag [ uˆ 12 /(1 h11 )2 ,..., uˆ 2n /(1 h nn )2 ]X(X' X)1
definiert, der sich in Simulationsstudien bei kleinen Stichproben als vorteilhaft er-
wiesen hat.
Hierzu werden die in der Hauptdiagonale stehenden geschätzten Varianzen der Re-
gressionskoeffizienten ̂ j extrahiert:
die bei einer OLS-Schätzung im Falle von Heteroskedastizität anstelle der unkorri-
gierten Standardfehler bei den Signifikanztests der geschätzten Regressionskoeffi-
zienten zu verwenden sind.
Standardfehler bei homoske- Heteroskedastizität-konsis-
Variable dastischer Störvariablen tente Standardfehler (HC3)
C 1.23616 0.83941
LNY 0.15837 0.10734
LNR 0.02964 0.02506
Die t-Werte steigen bei Verwendung der HC3-Standardfehler z.T. beträchtlich an.
Aufgrund der bereits bestehenden hohen Signifikanz der geschätzten Regres-
sionskoeffizienten im Falle der unkorriierten Tests ändern sich in diesem Beispiel
jedoch die Testergebnisse qualitativ nicht.