Sie sind auf Seite 1von 35

Lect. univ. dr.

Vasile Alecsandru STRAT

konometrie

Vorlesung 7-8
Die lineare Einfachregression
Die Statistik und konometrie Abteilung

konometrie

Lect. univ. dr. Vasile Alecsandru STRAT

Inhalt
1.

Die Voraussetzungen (Hypothesen) des linearen Regressionsmodells grundlegende


Konzepte.

2.

Voraussetzung 1 Die Variablen werden ohne Messfehler beobachtet.

3.

Voraussetzung 2 Der Mittelwert der Zufallsvariable (Strterm) ist null.

4.

Voraussetzung 3 Die Homoskedastizitt Hypothese.

5.

Voraussetzung 4 Die Residuen sollten untereinander nicht korrelieren .

6.

Voraussetzung 5 Die Residuen sollten (annhernd) normalverteilt sein.

7.

Vorhersagen treffen: Punktprognose und Prognoseintervall.

8.

Beispiel.

Die Statistik und konometrie Abteilung

konometrie

Lect. univ. dr. Vasile Alecsandru STRAT

konometrische Modellrechnungen Schritte


4. Bewerten Sie die Gltigkeit des Modells

Man prft, ob die Variation der X ein guter Indikator fr die Variation Y ist

Dies bedeutet:

1.

Statistische Inferenz fr die Parameter des Regressionsmodells.

2.

Prfung der Gltigkeit des Regressionsmodells mit Varianzanalyse.

3.

Bestimmung der Qualitt der Anpassen.

4.

berprfung der Voraussetzungen des Regressionsmodells.

5. Voraussagen mit der Hilfe des Regressionsmodells

Die Statistik und konometrie Abteilung

konometrie

Lect. univ. dr. Vasile Alecsandru STRAT

Die Annahme (Hypothesen) des linearen Regressionsmodells


A1: Die zwei Variablen yi und xi werden ohne Messfehler beobachtet.
A2: Die Zufallsvariable hat einen null Mittelwert, E(i) = 0.
A3: Die Varianz der Residuen, 2 ist konstant und nicht abhngig von dem
exogenen Variablen X die Homoskedastizitt Hypothese.
Beispiel:
Es gilt ein Modell, das den Verbrauch
der privaten Haushalte nach Einkommen
beschreibt. In diesem Fall bedeutet der
Verbrauch von den Haushalten mit
grerem Einkommen eine grere
Streuung als der Verbrauch der
Haushalte mit niedrigem Einkommen.
So
wird
die
Homoskedastizitt
Annahme nicht erfllt.

Die Statistik und konometrie Abteilung

4
konometrie

Lect. univ. dr. Vasile Alecsandru STRAT

Die Annahme (Hypothesen) des linearen Regresionsmodells


A4. Die Residuen sollten untereinander nicht korrelieren. Es gibt keine
Autokorrelation.

A5: Die Zufallsvariable ist normalverteilt und hat einen Mittelwert gleich
Null und eine konstante Varianz.

Wenn die frhere Annahme eingehalten wird, erhalten wir B.L.U.E.


Schtzer ( Best Linear Unbiased Estimators)
Die Statistik und konometrie Abteilung

5
konometrie

Lect. univ. dr. Vasile Alecsandru STRAT

A1: Die zwei Variablen yi und xi werden ohne Messfehler beobachtet

Diese Annahme wird mit Hilfe der 3 Sigma Regel berprft:

Wenn die Werte von diesen zwei Variablen zu den folgenden


Intervallen gehren:

knnen wir die Annahme 1 akzeptieren.


Die Statistik und konometrie Abteilung

6
konometrie

Lect. univ. dr. Vasile Alecsandru STRAT

A3: Die Homoskedastizitt Annahme


Fr das lineare Regressionsmodell
werden die Residuen
homoskedastik, wenn deren Varianzen konstant und unabhngig von dem exogenen
i y i y i y i a bxi
Variablen X werden:
Das Gegenteil der Homoskedastizitt ist die Heteroskedastizitt, und das bedeutet,
dass die Varianz den Residuen nicht konstant, aber unterschiedlich ist.
Methoden zur Erkennung von Heteroskedastizitt:
1. Graphische Methode besteht in dem Aufbau von Variablen Korrelogrammen
zwischen der exogenen Variablen X und die Residuen . Wenn auf der Zunahme
(Abnahme) der Werte der exogenen Variablen X man eine Zunahme (Abnahme) die
Werte der Residuen beobachtet, dann korrelieren die beiden Variablen und sind nicht
i
unabhngig.

a. Positive Korrelation

b. Negative Korrelation
Die Statistik und konometrie Abteilung

konometrie

Lect. univ. dr. Vasile Alecsandru STRAT

A3: Die Homoskedastizitt Annahme


2. Der White Test:
Das ursprngliche Modell der Parameterschtzung und Berechnung der geschtzten
Residuen, .
Bau von Hilfs-Regressionen bei der Annahme einer Beziehung der Abhngigkeit
zwischen dem Quadrat der Fehler, der exogenen Variable im ursprnglichen Modell und
dem Quadrat der exogenen Variable im ursprnglichen Modell:

Berechnung des Bestimmtheitsma R2, fr diese Hilfs-Regression.


berprfen Sie die Signifikanz der neugebauten Modellparameter. H0:
Wenn einer von ihnen signifikant von Null verschieden ist, so wird der Fehler
Heteroskedastizitt der Hypothese akzeptiert.

Die Statistik und konometrie Abteilung

8
konometrie

Lect. univ. dr. Vasile Alecsandru STRAT

A3: Die Homoskedastizitt Annahme


Man kann den White Test in zwei Wegen verwenden:
Durch die Verwendung des Fisher-Snedecor Tests, basiert auf der
Grundlage, dass die Modellparameter null sind, H0:
Wenn man die Nullhypothese akzeptiert ( Fc F ;v1 ;v2 ) muss man auch die
Annahme, dass die Residuen Homoskedastik sind, akzeptieren;
Der gegenteilige Fall bedeutet, dass wir Heteroskedastizitt haben.
Durch Verwendung des LM Tests; berechnet man den Testwert als die
Anzahl der Beobachtungen (n) multipliziert mit R2 des Hilfs-Modells:
k die Anzahl der Parametern des Hilfs-Modell

Wenn
, haben wir Heteroskedastizitt. Im gegenteiligen Fall
haben wir Homoskedastizitt und die Parametern sind
Die Statistik und konometrie Abteilung

9
konometrie

Lect. univ. dr. Vasile Alecsandru STRAT

A3: Die Homoskedastizitt Annahme


Beseitigen wir das Phnomen der Heteroskedastizitt von Fehlern durch
gewichtete Regression:
Die Gleichung

wird durch xi teilt:

Notiert man mit

Erhalten wir das Modell


und die Parameter
werden durch KQM geschtzt, prfen wir die Homoskedastizitt
Annahme fr die neuen Fehlern mit dem White Test.

Die Statistik und konometrie Abteilung

10
konometrie

Lect. univ. dr. Vasile Alecsandru STRAT

A4: Autokorrelation
Man muss in diesem Fall die folgenden Aspekte beobachten:
1. Die Ermittlung der Ursachen fr das Auftreten von Fehler-Korrelation.
2. Statistische Tests zur Autokorrelation erkennen.
3. Methoden, um das Phnomen der Autokorrelation des Fehlers zu
beseitigen.

Wenn wir das Phnomen der Autokorrelation von Fehlern haben, kov (i,j) 0;
KQM erlaubt nicht, effiziente Schtzer zu erhalten, die Werte der
Koeffizienten zeigen Verzerrung zu der tatschlichen Werte der Koeffizienten.
Die Schtzer sind noch konsistent, aber das erfordert lange Datenreihen
(Stichproben mit vielen Werte).

Die Statistik und konometrie Abteilung

11
konometrie

Lect. univ. dr. Vasile Alecsandru STRAT

Die Ursachen fr das Auftreten von Fehlern Autokorrelation

Das Fehlen von einem oder mehreren wichtigen erklrenden Variablen


Nichtaufnahme von einem oder mehreren erklrenden Variablen
knnen die Autokorrelation der Fehler erzeugen.
Beispiel: y i a bx1i cx 2i i
Die exogene Variable x3 wird weggelasen Der Strterm zeigt
Autokorrelation und die Residuen werden durch diese
i x 3i u i
weggelassenen Variablen erklrt:

Das Regressionsmodell wird nicht richtig angegeben: entweder wird


das Modell als eine Linearkombination der Variablen ausgedrckt
und unter korrekter Spezifikation des Modells muss es als eine
lineare Kombination von exogenen Variablen Logarithmen
ausgedrckt werden usw.

Es wurden unangemessene nderungen vorgenommen oder


Interpolationen in der Datenreihe gemacht.

Die Statistik und konometrie Abteilung

12
konometrie

Lect. univ. dr. Vasile Alecsandru STRAT

Methoden, die man fr die Erkennung der Autokorrelation


verwenden kann.
2.1. Die Graphische Methode Man zeichnet das Korrelogramm zwischen
den geschtzten Werten der endogenen Variable und die Strterm Werte.

i
y i
Graphisch wird die Autokorrelation von Fehlern durch eine regelmige Oszillation der
Residuen von den geschtzten Werten der endogenen Variable manifestiert.

Die Statistik und konometrie Abteilung

13
konometrie

Lect. univ. dr. Vasile Alecsandru STRAT

Methoden, die man fr die Erkennung der Autokorrelation


verwenden kann.
2.2.
Durch
die
Berechnung
Korrelationskoeffizient von Residuen:
n

r1


i 2
n 1

i i 1

der

ersten

Ordnung


i 2
n

i 1

Die Statistik und konometrie Abteilung

i i 1

i 1

r1 1; 1

i2

konometrie

Lect. univ. dr. Vasile Alecsandru STRAT

Methoden, die man fr die Erkennung der Autokorrelation


verwenden kann.
2.3. Der Durbin-Watson Test:
n

DW

i i 1
i 2

i
i 1

Dieser berechnete DW Wert, wird mit zwei theoretischen Werten, d1 und d2,
vergleicht. Diese Werte nimmt man von der Durbin-Watson Tabelle fr ein
Signifikanzniveau , ( = 0,05 oder = 0,01), und fr die Anzahl der exogenen
Variablen (k) und fr die Anzahl der beobachteten Werte (n).

Die Statistik und konometrie Abteilung

konometrie

Lect. univ. dr. Vasile Alecsandru STRAT

Methoden, die man fr die Erkennung der Autokorrelation


verwenden kann.

Bemerkungen:
Der Durbin-Watson Test prft
nur die Existenz der ersten
Ordnung Autokorrelation;
Man kann den Durbin Watson
Test nur verwenden, wenn:
Das Modell freie Koeffizienten
hat;
Unter den erklrenden Variablen
haben wir nicht die endogene
Variable mit Lag;
Die Datenreihen sind numerisch
Die Statistik und konometrie Abteilung

16
konometrie

Lect. univ. dr. Vasile Alecsandru STRAT

Methoden, die man fr die Erkennung der Autokorrelation


verwenden kann
Entscheidungsregeln der Umsetzung des Durbin-Watson-Tests

0 DW d1

d1 DW d2

d2 DW 4-d2

4-d2 DW 4-d1

4-d1 DW <4

Positive
Autokorrelation

Unentschlossenhei
t

keine
Autokorrelation

Unentschlossenheit

Negative
Autokorrelation

0 < DW < d1 positive Autokorrelation.


d1 DW d2 Unentschlossenheit, es wird die Akzeptanz der positiver Autokorrelation empfohlen.
d2 < DW < 4-d2 die Residuen sind nicht korreliert.
4-d2 DW 4-d1 Unentschlossenheit, es wird die Akzeptanz der negativer Autokorrelation
empfohlen.
4-d1< DW <4 negative Autokorrelation.
Die Statistik und konometrie Abteilung

17
konometrie

Lect. univ. dr. Vasile Alecsandru STRAT

Methoden, die man fr die Erkennung der Autokorrelation


verwenden kann
H0: r1 = 0
H1: r1 0, r1 = die erste Ordnung des Autokorrelationskoeffizienten.
n

DW

i 2

i 2

i 2


i 2
n 1

i i 1


i 1

2
i

Fr n

i
i 2

i 2

2
i 1

i
i 1

i 1

DW 2 2

i 1 2 ii 1
2

DW 2 1 r1 r1 1

DW
d [0,4]
2

1 autocorela re strict negativ


4
indecizie

r1 0 independen
d 2
indecizie

1 autocorela re strict pozitiv


0

Die Statistik und konometrie Abteilung

18
konometrie

Lect. univ. dr. Vasile Alecsandru STRAT

Wie kann man die Autokorrelation vom Strterm entfernt


Es gibt das lineare Modell:
Man verwendet die kleinste Quadrate Methode um
Man berechnet die eingestellten Werte fr
die Residuen. i y i y i y i a bxi (1)

zu schtzen

y i a bxi

und

Man verwendet den DW Test;


Wenn die Hypothese der Unabhngigkeit der Residuen nicht akzeptiert
werden kann, gibt es eine Autokorrelation erster Ordnung von Fehlern:
(2)
und wo vi ist eine Zufallsvariable
Wissend, dass: i 1 y i 1 y i 1 y i 1 a bxi 1 (3)

Einsetzen (1) und (3) in (2) gibt es: y i a bxi r1 ( y i 1 a bxi 1 ) vi

y i r1 y i 1 a (1 r1 ) b( xi r1 xi 1 ) vi

Die Statistik und konometrie Abteilung

19
konometrie

Lect. univ. dr. Vasile Alecsandru STRAT

Entfernen der Autokorrelation vom Strterm


Berechnet man die Autokorrelationskoeffizient mit der Formel:
n

r1


i 2
n 1


i 1

Notiert man:

i 1

2
i

yi* yi r1 yi 1

xi* xi r1 xi 1

a1 a(1 r1 )
b b
1

*
*
y

b
x
Es gibt das folgende Modell: i
1
1 i vi

Schtzt man die Parameter fr das Modell und dann geht man zurck an
das erste Modell.
Die Statistik und konometrie Abteilung

20
konometrie

Lect. univ. dr. Vasile Alecsandru STRAT

Die normalverteilte Residuen Annahme


Wenn die Residuen normalverteilt mit dem Mittelwert Null und der Standardabweichung
sind, dann haben wir die Beziehung:

P i t 1

Abhngig von den unterschiedlichen Signifikanzniveaus , whlen wir die geeignete


Werte fr t von der Normalverteilung Tabelle oder der Studenten Verteilung Tabelle.
1.Procedeul grafic

Die Statistik und konometrie Abteilung

um die X Achse reprsentieren wir die


Dach-Werte fr y (i), und um O-y-Achse
reprsentieren wir die geschtzten Werte
fr den Strterm i.
Wenn die Residuen in das Band ( t )
fallen, mit einem Signifikanzniveau ,
akzeptieren wir die Hypothese der
Normalverteilung
mit
dem
Signifikanzniveau .
21
konometrie

Lect. univ. dr. Vasile Alecsandru STRAT

Der Test fr die normalverteilte Residuen


2. Der Jarque-Bera Test(JB):

H0: die Residuen werden normalverteilt


H1: die Residuen werden nicht normalverteilt

Der JB Testwert:

S 2 K 3 2
2
JB n

~ ;2
24
6

Er basiert auf der Annahme, dass die Normalverteilung einen Schiefekoeffizient gleich
Null (S = 0) und einen Steilheitskoeffizient gleich drei hat (K = 3).
Wenn der Steilheitskoeffizient grer als 3 ist, dann ist die Verteilung schmal und wenn
der Steilheitskoeffizient kleiner als 3 ist, so ist die Verteilung flach
n= die Stichprobengre;
S= der Schiefekoeffizient (skewness) fr die Residuen:
Die Statistik und konometrie Abteilung

1 n
yi y
n i 1
S
3

22
konometrie

Lect. univ. dr. Vasile Alecsandru STRAT

Der Test fr die normalverteilte Residuen

K = der Pearson Steilkoeffizient (kurtosis), misst wie hoch die


Verteilung ist(wie schmal ist die Verteilung im Vergleich zu der
Normalverteilung):

Die Entscheidung:

1 n
yi y
n i 1
K
4

Wenn der Testwert weniger als der tabellierte JB-Wert ist, wird H0 akzeptiert und die
Residuen werden normalverteilt;
Wenn der Testwert grer als der tabellierte JB-Wert ist, wird H0 ablehnt und die
Residuen werden nicht normalverteilt.

Die Statistik und konometrie Abteilung

23
konometrie

Lect. univ. dr. Vasile Alecsandru STRAT

Vorhersagen treffen

1.

Vorhersagen Typen
Einzelwerte Vorhersagen
Konfidenzintervall Vorhersagen

2.

Was ist das Objekt der Vorhersage?


Der individuelle Wert (Yi) fr einen bestimmten Wert von X

Wenn wir annehmen, dass die unabhngige Variable den angegebenen Wert, Xn+v,
nimmt, und die lineare Beziehung aufrechterhalten wird, dann wird der entsprechende
Wert der abhngigen VariableYn+v :
Y X
nv

nv

Um fr Einzelwerte Vorhersagen zu machen, verwenden wir die Regressionsgleichung


fr die Stichprobe: yi = a + bxi. Wir wechseln den Xi Wert mit dem bestimmten Wert:

Yn v a bX n v
Die Statistik und konometrie Abteilung

24
konometrie

Lect. univ. dr. Vasile Alecsandru STRAT

Vorhersagen treffen

Um das Konfidenzintervall fr die Vorhersage zu bilden, brauchen wir die Verteilung (der
Mittelwert und die Varianz), fr
.y
nv
n vist Studentenverteilt (t-verteilt) mit (n k 1) Freiheitsgrade.
Die Variable y

Bestimmung des Prognoseintervalls:

n v t / 2 , n k 1 s y nv
yn v y

Die Varianz fr die Prognosefehler bei der Probe ist:

2
y n v

1 ( xn v x)

s 1 n

n
2
( xi x)

i 1

Die Statistik und konometrie Abteilung

25
konometrie

Lect. univ. dr. Vasile Alecsandru STRAT

Die Annahme des Regressionsmodells - Beispiel


Fr 15 Versicherungsvertreter, die Mitarbeiter von Lebensversicherungen Unternehmen sind, hat
man Daten fr die durchschnittliche verbrauchte Zeit (in Minuten) von einem Agenten mit einem
potenziellen Kunden und der Anzahl der unterschriebenen Vertrge in einer Woche.

Durchsnittliche
Zeit
(Min.)

25

23

30

25

20

33

18

21

22

30

26

26

27

29

20

Vertrge Anzahl

10

11

14

12

18

10

10

15

11

15

12

14

11

A. Testen Sie die Homosketastizitt Annahme;


B. Testen Sie die Autokorrelation Annahme;
C. Testen Sie die Normalverteilung Annahme;
D. Bilden Sie ein Konfidenzintervall fr die erwartete Anzahl der Vertrge, wenn die
erwartete durchschnittliche Zeit, die ein Agent mit einem potenziellen Kunden
verbringt, 35 Minuten ist. Verwenden Sie eine Sicherheitswahrscheinlichkeit von 95%!
Die Statistik und konometrie Abteilung

konometrie

Lect. univ. dr. Vasile Alecsandru STRAT

Die Annahme des Regressionsmodells - Beispiel

Die Statistik und konometrie Abteilung

27
konometrie

Lect. univ. dr. Vasile Alecsandru STRAT

Die Homoskedastizitt Annahme - Beispiel


berprfung der Homoskedastizitt Hypothese durch:
1. Die Graphische Methode
Wie die Grafik zeigt, ist die
empirische Verteilung der
Punkte oszillierend und
deswegen
kann
die
Hypothese, dass die beiden
Variablen
x
und

unabhngig
sind,
akzeptiert werden.

Die Statistik und konometrie Abteilung

28
konometrie

Lect. univ. dr. Vasile Alecsandru STRAT

Die Homoskedastizitt Annahme - Beispiel


berprfung der Homoskedastizitt Hypothese durch:
2. Der White Test
Stufe 1 : Man schtzt die Parameter des Regressionsmodells: y i 1,73 0,5492 xi
Stufe 2 : Man berechnet die Residuen
schtzt man das nchste Modell:
Man erhlt:

und mit diesen Werten

, R2=0.014

Stufe 3: Man berechnet den LM Testwert:

LM 0.216 02,05; 2 5,99

=>man akzeptiert die Nullhypothese H0 =>die


Residuen zeigen Homoskedastizitt.
Man berechnet den F-Testwert, um die Gltigkeit des Modells zu prfen:
Fc=0.087<F0,05;2;12=3.88=>das Modell ist nicht gltig =>die Residuen
zeigen Homoskedastizitt.
Die Statistik und konometrie Abteilung

29
konometrie

Lect. univ. dr. Vasile Alecsandru STRAT

Die Autokorrelation Annahme - Beispiel


berprfung der Autokorrelation Hypothese durch:
1. Die Graphische Methode

Die Statistik und konometrie Abteilung

Korrelogramm zwischen i und i-1

30
konometrie

Lect. univ. dr. Vasile Alecsandru STRAT

Die Autokorrelation Annahme - Beispiel


berprfung der Autokorrelation Hypothese durch:
2. Den Durbin-Watson Test
Stufe 1 : Man schtzt den Parametern des linearen Modells :

y i 1,73 0,5492 xi
Stufe 2 : Man berechnet die Residuen:
Stufe 3 : Man berechnet den Durbin Watson Wert :

DW


i 2

i 1


i 1

2.39

Stufe 4 : Fr = 0,05 (das Signifikanzniveau), k = 1 (die Anzahl der exogenen Variablen)


und n =15 (die Anzahl der Einheiten), die theoretische Werte fr den Durbin-Watson
variable, sind: d1=1,08 i d2=1,36.
Stufe 5 : Im Vergleich mit diesen, der berechnete DW Wert, steht somit:
d2=1,36<DW(2,39)<4-d2 (4-1,36).
wir knnen also die Unabhngigkeit Annahme akzeptieren.
Die Statistik und konometrie Abteilung

31
konometrie

Lect. univ. dr. Vasile Alecsandru STRAT

berprfung der Normalitt Hypothese


1. Grapische Methode

Die Statistik und konometrie Abteilung

32
konometrie

Lect. univ. dr. Vasile Alecsandru STRAT

berprfung der Normalitt Hypothese


2. Der Jarque-Bera Test(JB):

H0: die Residuen werden normalverteilt


H1: die Residuen werden nicht normalverteilt

Von Excel:
Skew=0.38

Von Excel:
Kurt=-0.38

Der JB Testwert:

Wenn der berechnete Wert fr den JB-Test kleiner ist als der theoretische
Wert fr ein Signifikanzniveau von 5%, akzeptiert man die Nullhypothese H0
und lehnt man die Alternativhypothese H1 ab. Die Residuen werden
normalverteilt.
Die Statistik und konometrie Abteilung

33
konometrie

Lect. univ. dr. Vasile Alecsandru STRAT

Vorhersagen treffen
Wenn die durchsnittliche Zeit

Einzelwert
Vorhersagen

xn v 35 ist , dann

Yn v 1.73 0.5492 X n v 1.73 0.5492 * 6 17.492


Das Konfidenzintervall fr die Anzahl der unterschriebenen Vertrge von
einem Agenten, wenn die durchschnittliche Zeit 35 Min. ist:

yn v y n v t 2;n k 1 s y nv

t / 2;n 2 t0.025,13 2,53


s2

y
i i

n k 1

22.35
1,719
13

Die Varianz fr die Prognosefehler bei der Probe ist :

1 ( x x)
1 (35 25)
s y2nv s2 1 n n v
1.719 1

n
15
264

( xi x) 2

i 1

2.484

Sicherheitswahr
scheinlichkeit.95%

yn v 17.492 2,53 1.576 13,5;21,5

Die Statistik und konometrie Abteilung

34
konometrie

Lect. univ. dr. Vasile Alecsandru STRAT

Dankeschn!

Die Statistik und konometrie Abteilung

konometrie