Sie sind auf Seite 1von 27

Lect. univ. dr.

Vasile Alecsandru STRAT

konometrie

Vorlesung 5
Die lineare Einfachregression
Die Statistik und konometrie Abteilung

konometrie

Lect. univ. dr. Vasile Alecsandru STRAT

Inhalt
1.

Testen des Signifikanz der Modellparameter.

2.

bung.

3.

P-Wert Konzept.

4.

Der Bau der Konfidenzintervalle fr Modellparameter.

5.

Testen der Signifikanz mit dem linearen Pearson


Korrelationskoeffizient.

Die Statistik und konometrie Abteilung

konometrie

Lect. univ. dr. Vasile Alecsandru STRAT

konometrische Modellrechnungen Schritte


1.

Spezifikation des Modells

- Man bestimmt die endogene Variable Y und die exogene Variable X.

y=f(x)+

2.

Modellidentifizierung

- man muss eine Funktion auswhlen, die die Werte der endogenen Variable durch die nderung der exogenen
Variable beschreibt.

- Dazu kann man grafische oder algebraische Berechnungen nutzen (Analyse der Varianz)

Yi a b X i i Yi i

Yi a b X i

yi = vorhersagbare Komponente (deterministisch) + Strterm

3.

Schtzung der Modellparameter

- Methode der kleinsten Quadrate (fr die Summe der quadrate Strterm)

S (a, b) min i2 min ( yi a bxi ) 2


i

Die Statistik und konometrie Abteilung

konometrie

Lect. univ. dr. Vasile Alecsandru STRAT

konometrische Modellrechnungen Schritte


4. Bewertung der Gltigkeit des Modells

Man prft, ob die Variation von X ein guter Indikator fr die Variation von Y ist

Dies bedeutet:

1.

Statistische Inferenz fr die Parameter des Regressionsmodells.

2.

Prfung der Gltigkeit des Regressionsmodells mit Varianzanalyse.

3.

Bestimmung der Qualitt der Anpassung.

4.

berprfung der Voraussetzungen (Hypothesen) des Regressionsmodells.

5. Voraussagen mit der Hilfe des Regressionsmodells

Die Statistik und konometrie Abteilung

konometrie

Lect. univ. dr. Vasile Alecsandru STRAT

Die Modellparameter
Statistische Inferenz in Bezug
folgenderweise erreicht werden:

auf

Modellparameter

kann

Testen der statistischen Hypothese ber die Signifikanz der


Regressionsparameter;

Schtzung der Modellparameter der Grundgesamtheit innerhalb


eines Konfindenzintervals

Fr die lineare Regressionsgleichung sind die Regressionskoeffizienten


der Stichprobe (a und b) die Schtzungen der Koeffizienten der
Regressionsgleichung fr die Grundgesamtheit ( und ).
Die Statistik und konometrie Abteilung

konometrie

Lect. univ. dr. Vasile Alecsandru STRAT

Die Modellparameter
Theorem: Wenn der Strterm i normalverteilt ist, mit einem null Mittelwert =
0 und der Varianz 2, dann ist der M-L (maximale Wahrscheinlichkeit)
gleichbedeutend mit der KQM

Die Schtzer mit der maximalen Wahrscheinlichkeit sind


unverzerrte, konsistente und effiziente Schtzer:
a.

M (a ) , M (b)

b.

a , b

c.

Irgendein Schtzer fr und hat eine grere Varianz als a und b (die
Schtzer sind effizient).

(die Schtzer sind unverzerrt);


(die Schtzer sind konsistent);

Wenn wir die Normalverteilung fr die Strterme annehmen, dann sind die
Schtzer, die man durch die Methode der kleinesten Quadrate berechnet,
unverzerrt, konsistent und effizient. (sie knnen als die besten Schtzer in der
konometrischen Modellierung betrachtet werden)
Die Statistik und konometrie Abteilung

konometrie

Lect. univ. dr. Vasile Alecsandru STRAT

Die Modellparameter

Theorem:
Wenn der Strterm normalverteilt ist, mit dem Mittelwert Null
2

e
und der Varianz
, dann

Schtzer fr die Varianz

S e2

n2

i 1

ei 2

ist ein unverzerrter

e2 der Strterm (Parameter der

Grundgesamtheit).

Die Statistik und konometrie Abteilung

konometrie

Lect. univ. dr. Vasile Alecsandru STRAT

Die Modellparameter
Testen von Parameter

Der Koeffizient misst die nderung der resultierenden Variable durch


die Vernderung der exogenen Variable um eine Einheit.

(Y/X = xi) =

Yxi

= + xi

Yxi ist der Mittelwert von Y in der Grundgesamtheit, wenn


die exogene Variable X die xi Wert hat.
Wenn = 0, dann ist die Regressionsgerade horizontal.

Die Statistik und konometrie Abteilung

konometrie

Lect. univ. dr. Vasile Alecsandru STRAT

Die Modellparameter
Theorem:
Wenn der Strterm normalverteilt mit dem Mittelwert Null und
2
der Varianz e ist, dann b normalverteilt ist, wie folgt:

Man notiert:

N ,

x
n

i 1

(b)

Der Mittelwert der Schtzer b mit


Die Varianz der Schtzer b mit

e2

sb2

e2

x x
n

i 1

Die Statistik und konometrie Abteilung

konometrie

Lect. univ. dr. Vasile Alecsandru STRAT

Die Modellparameter
Der zweiseitige Test:
H0: = 0 (der Schtzer ist statistich nicht signifikant)

H1: 0 (der Schtzer ist statistisch Signifikant.)

Wenn es um einen groen Stichprobenumfang geht:

Z-test Wert:

zcalc

b M b b 0

sb
sb

s b s e2

1
n

( xi x ) 2
i 1

sb= die Standardabweichung des Schtzers b;


Der Verwerfungsbereich: ob z calc z / 2 oder
ab.

Das Konfidenzintervall fr den Parameter :

se
n

( x
i 1

x )2

z calc z / 2 lehnt man die Ho

b z / 2 sb b z / 2 sb

Die Statistik und konometrie Abteilung

10
konometrie

Lect. univ. dr. Vasile Alecsandru STRAT

Die Modellparameter
Wenn es um einen kleinen Stichprobengroe geht:

Der t Test:

tcalc

b M b b 0 b

sb
sb
sb
s b s e2

sb= die Standardabweichung der Schtzer b;

t calc t / 2,n 2

Der Verwerfungsbereich : ob
H0 ab.

Das Konfidenzintervall fr den Parameter:

1
n

( xi x ) 2
i 1

oder

t calc t / 2,n 2

se
n

( x
i 1

x )2

lehnt man die

b t / 2 , n 2 s b b t / 2 , n 2 s b
Die Statistik und konometrie Abteilung

konometrie

Lect. univ. dr. Vasile Alecsandru STRAT

Die Modellparameter
2. Parameter Testen :
Lehrsatz
Wenn der Strterm normalverteilt mit dem Mittelwert Null und dem Varianz

e2

ist, dann ist a normalverteilt mit

Die Varianz der Schtzer a mit


Die Statistik und konometrie Abteilung

e2

x x
n

i 1

x x
n

i 1

sa2

1
N , e2

Man notiert:
Der Mittelwert der Schtzer a
mit
M( a )

konometrie

Lect. univ. dr. Vasile Alecsandru STRAT

Die Modellparameter
Zweiseitige Test:
o
H0: = 0 (der Schtzer ist nicht statistich Signifikant)
o
H1: 0 (der Schtzer ist statistich Signifikant)
Wenn wir ber eine groe Stichprobenumfang sprechen:
Z-test Wert:
a M a a 0

zcalc

sa

sa

2
i

1
x
i 1
s a se
n
se
n
sa= die Standardabweichung der Schtzer a; n ( xi x )2
n ( xi x ) 2
i 1

Der Verwerfungsbereich: ob z calc z / 2 oder


ab.

i 1

z calc z / 2 man lehnt die Ho

Das Konfidenzintervall fr den Parameter :

a z / 2 sa a z / 2 sa

Die Statistik und konometrie Abteilung

konometrie

Lect. univ. dr. Vasile Alecsandru STRAT

Die Modellparameter
Wenn es um einen kleinen Stichprobenumfang geht:

T-test :

tcalc

a M a a 0 a

sa
sa
sa
n

sa= die Standardabweichung des Schtzers a;

s a se

x
n

( x
i 1

t calc t / 2,n 2

Der Verwerfungsbereich: ob
Ho ab.

Das Konfidenzintervall fr den Parameter :

oder

x)

se
2

x
i 1

2
i

n ( xi x ) 2
i 1

t calc t / 2,n 2lehnt man die

a t / 2, n 2 sa a t / 2, n 2 sa

Die Statistik und konometrie Abteilung

konometrie

Lect. univ. dr. Vasile Alecsandru STRAT

Beispiel
Fr 15 Versicherungsvertreter, die Angestellten eines Lebensversicherungsunternehmens sind, hat
man Daten fr die von einem Agenten mit einem potenziellen Kunden durchschnittliche verbrachte
Zeit (in Minuten) und der Anzahl der in eine Woche unterschriebenen Vertrge.
.
durchschnittliche
Zeit (Min)

Vertrge Zahl

25 23 30 25 20 33 18 21 22 30 26 26 27 29 20
10 11 14 12

18

10 10 15 11 15 12 14 11

Testen Sie bitte die Signifikanz der Regressionparameter;

Bauen Sie die Konfidenzintervalle fr beide Parameter;

Messen Sie die Intensitt der Verbindung zwischen den beiden Variablen mit
Pearson linearem Korrelationskoeffizient und testen Sie auch ihre Signifikanz.
Die Statistik und konometrie Abteilung

konometrie

Lect. univ. dr. Vasile Alecsandru STRAT

Beispiel

Die Statistik und konometrie Abteilung

konometrie

Lect. univ. dr. Vasile Alecsandru STRAT

Beispiel
Anzahl

Durchschnittliche Zeit
(min.)
i

Vertrge
Zahl

yi

xi2

x i yi

y i 1,73 0,5492 x i

25

10

625

250

12

14

29

14

841

406

14,1968

15

20

11

400

220

9,254

375

180 xi2 9639

x y
i

4645

180

a 1,73

y i 1,73 0,5492 xi

375a 9639b 4645 b 0,5492

15a 375b 180

Die Statistik und konometrie Abteilung

konometrie

Lect. univ. dr. Vasile Alecsandru STRAT

Beispiel

R2=78.07%

ist nicht signifikant


von Null verschieden
ist signifikant von Null
verschieden

Fcalc=46.30

Der Modell ist gltig

Die Statistik und konometrie Abteilung

konometrie

Lect. univ. dr. Vasile Alecsandru STRAT

ist nicht signifikant


Von Null verschieden
ist signifikant
Von Null verschieden

Beispiel

Wir testen die folgende Hypothesen


a)

H0: = 0
H 1: 0

t 1calc

a 1.73

0.846
sa 2.046

tcritic t0, 025;13 2,160


b) H0: = 0
H 1: 0

calc

b 0.549

6.804
sb
0.08

Weil n = 15 30 haben wir eine kleine Stichprobengroe und wir verwenden


den t-Test.
Die Statistik und konometrie Abteilung

konometrie

Lect. univ. dr. Vasile Alecsandru STRAT

Beispiel

Die Entscheidung:

1
Weil t calc t / 2;n 2 0.846 2.160ist , akzeptiert man die Ho, und das bedeutet, dass

nicht signifikant ist, von Null verschieden, also ist nicht signifikant.

Weil

2
tcalc
t / 2;n 2 6.804 2.160 ist , lehnt man die Ho ab und akzeptiert man die H1;

das bedeutet, dass signifikant ist , von Null verschieden, also ist signifikant.

Die Statistik und konometrie Abteilung

konometrie

Lect. univ. dr. Vasile Alecsandru STRAT

P-Wert
Bevor man einen klassischen statistischen Test durchfhrt, muss man ein
Signifikanzniveau whlen. Es stellt das maximale Irrtumsrisiko dar, das man bereit ist,
einzugehen (meist 5%, 1% oder kleiner), wenn man die Entscheidung trifft, die
Nullhypothese abzulehnen.
Moderne Software ermglicht es, umgekehrt umzugehen, und zwar: Man
schtzt das Risiko ab, eine falsche Entscheidung zu treffen, aufgrund der
Daten, ber die man verfgt. Dann hngt es von jeder Person ab, ob sie
dieses Risiko eingeht oder nicht. Dieses aufgrund der Daten abgeschtztes
Risiko erscheint in den Tabellen bei jedem Signifikanztest und heit P-Wert.
Damit ein Koeffizient signifikant und von Null verschieden ist, also
damit die ihm entsprechende unabhngige Variable die anhngige Variable
beeinflusst, mssen die P-Werte unter dem Signifikanzniveau (5%) liegen.

Die Statistik und konometrie Abteilung

konometrie

Lect. univ. dr. Vasile Alecsandru STRAT

P-Wert
Fr Parameter :
Der P-Wert = 0.412843 > (0,05) Signifikanzniveau;
Wir knnen behaupten: wenn wir die Nullhypothese ablehnen, laut deren der
Schnittpunkt (Intercept)=0) Null ist, machen wir einen groen Fehler
(41.28%). Deswegen akzeptieren wir Ho, laut deren der Parameter nicht
signifikant verschieden von Null ist.
Fr Parameter :
Der P-Wert = 0,000013 < (0,05) Signifikanzniveau;
Wir knnen behaupten: Wenn wir die Nullhypothese ablehnen, laut deren der
Parameter Null ist, machen wir einen kleinen Fehler (0.0013%). Also, wir
lehnen diese Hypothese ab und akzeptieren die Hypothese H1 , dass ist
signifikant verschieden von Null.
Die Statistik und konometrie Abteilung

konometrie

Lect. univ. dr. Vasile Alecsandru STRAT

Konfidenzintervall

Das Konfidenzintervall fr :

a t / 2, n 2 sa a t / 2, n 2 sa
1.73 2.160 2.046 1.73 2.160 2.046
6.15 2.68

Das Konfidenzintervall fr :

b t / 2 , n 2 s b b t / 2 , n 2 s b
0.549 2.160 0.08 0.549 2.160 0.08

0.374 0.723

Die Statistik und konometrie Abteilung

konometrie

Lect. univ. dr. Vasile Alecsandru STRAT

Der lineare Korrelationkoeffizient


Der Pearson lineare Korelationskoeffizient (r) ist ein Schtzer fr den
Parameter ; ist der lineare Korelationskoeffizient fr die ganze
Grundgesamtheit.
N

COV ( X ,Y )

x y

xy

x y

( x

i 1

X )( yi Y )

Der Mittelwert des Schtzers r ist


Die Standardabweichung ist

Die Statistik und konometrie Abteilung

( xi X )
i 1

2

i 1

( yi Y ) 2

( r )

1 r2
sr
n2
konometrie

Lect. univ. dr. Vasile Alecsandru STRAT

Der lineare Korrelationskoeffizient


Er ist ein synthetischer Indikator, der die Intensitt des linearen Zusammenhangs
zwischen zwei Variablen messt und wird als Mittelwert der Produkte der standardisierten
n
n
n
Werte berechnet.

cov( x, y )
r

sx s y

n xi y i xi y i

i 1

i 1

n 2
n x xi n y i
i 1 i 1

i 1
n

2
i

1,1

i 1

y
i 1

Testen der Signifikanz des linearen Korrelationskoeffizients. (r) kann man mit der tTest: (Student) machen

H 0 : 0 (ist nicht signifikant von Null verschieden)


H1 : 0

(ist signifikant von Null verschieden)

Der test Wert:

tcalc

r n2
1 r2

t critic t / 2,n 2

Die Entscheidung: wenn t calc t critic (t / 2, n 2 ) ist, lehnt man die Ho ab und akzeptiert H1,
er ist signifikant.
Die Statistik und konometrie Abteilung

konometrie

Lect. univ. dr. Vasile Alecsandru STRAT

Der lineare Korrelationskoeffizient


Die Validierung des Korrelationskoeffizients, der zuvor berechnet wurde.(r=0.8836):
S1:

H0 : 0

(ist nicht signifikant von Null verschieden)

S2:

H1 : 0

(ist signifikant von Null verschieden)

S3: man whlt die Sicherheitswahrsheinlichkeit

(1 ) 95% 0.05

S4: Man berechnet den t Test Wert (Student):

tcalc

r n2
1 r2

0,8836 15 2
1 0,8836 2

3,185
6,804
0,468

S5: Man nimmt den theoretischen Wert fr t (Student), bercksichtigt den

Freiheitsgrade (n-2):
S6: Die Entscheidung:

Wert und die

tcritic t0, 025;13 2,160

tcalc t / 2,n 2

man lehnt Ho ab, man akzeptiert H1, die Korrelationkoeffizient ist

signifikant von Null verschieden.


Die Statistik und konometrie Abteilung

konometrie

Lect. univ. dr. Vasile Alecsandru STRAT

Dankeschn!

Die Statistik und konometrie Abteilung

konometrie