Wirtschaftswissenschaftliche Fakultt
Ladislaus von Bortkiewicz Chair of Statistics
Bachelorarbeit
von
Iryna Karpenka
file://C:\arbeit\timeseries\case.gif
8.01.2012, Berlin
Inhaltsverzeichnis
1 Einfhrung
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
4
4
5
5
7
9
10
11
13
13
13
15
15
15
16
17
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
18
18
18
19
19
22
.
.
.
.
25
25
31
32
36
5 Modellschtzung
5.1 Modellbildung der Spotpreise . . . . . . . . . . . . . . . . . . . . . . .
5.2 Modellbildung der Dieselpreise . . . . . . . . . . . . . . . . . . . . . . .
5.3 Korrelation zwischen den Kraftstoffpreisen und den Spotpreisen . . . .
39
39
42
44
6 Zusammenfassung
48
7 Literaturverzeichnis
50
8 Anhang
52
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
Einfhrung
Es wird in der Presse oft diskutiert, ob und wie die Spotpreise die Kraftstoffpreise an
den Tankstellen beeinflussen. Man merkt oft, wie zum Wochenende die Kraftstoffpreise
an den Tankstellen steigen und danach wieder fallen. Zu betonen ist auch die Tatsache,
dass die Preise am Wochenende im Durchschnitt hher als werktags sind. In diesem
Zusammenhang wre es fr den Endverbraucher sinnvoll, im Voraus zu planen, an welchen Tagen man am besten tanken wird. Die Schuld an solchem Verhalten der Preise
wird oft den Tankstellen zugeschrieben, weil sie den Endpreis des an den Konsumenten
zu verkaufenden Kraftstoffes bestimmen.
Die kurzfristige nderung des Kraftstoffpreises an der Zapfsule hngt von den Tankstellen selbst ab, das langfristige Verhalten wird aber durch den Welterdlpreis und die
fnf groen Minerallunternehmen BP (Aral), ConocoPhilipps (Jet), ExxonMobil (Esso), Shell und Total bestimmt. Die Macht dieser fnf groen Konzerne in Deutschland
hat in den letzten Jahren sehr zugenommen. Das Bundeskartellamt hat eine umfangreiche Recherche durchfhren lassen. In dem am 26. Mai 2011 verffentlichten Abschlussbericht zur Sektoruntersuchung der Kraftstoffe wurde eine eingehende Analyse
der Wettbewerbsverhltnisse auf den Tankstellenmrkten in Deutschland durchgefhrt.
Der Prsident des Bundeskartellamtes Andreas Mundt hat dazu folgende Stellung bezogen: Die fnf groen Tankstellenbetreiber in Deutschland machen sich gegenseitig
keinen wesentlichen Wettbewerb, sie bilden ein marktbeherrschendes Oligopol. Unsere
Studie weist im Einzelnen nach, wie die Mechanismen der Preissetzung funktionieren. Es
bedarf bei solchen Marktstrukturen nicht zwingend einer Absprache. Die Unternehmen
verstehen sich ohne Worte. Das fhrt zu berhhten Preisen (Bundeskartellamt, 2011).
Das Ziel dieser Arbeit besteht in dem Aufzeigen vom Verhalten der Kraftstoffpreise
und deren Zusammenhangs mit den Spotpreisen anhand der Zeitreihenanalysemethoden und mittels der spezialisierten Software (Excel und Eviews) zu analysieren. Da
die zur Verfgung stehenden empirischen Daten whrend eines Zeitraums von etwas
mehr als einem Jahr erhoben wurden, wird mehr auf das wchentliche Verhalten der
Kraftstoffpreise eingegangen. Es wird nach dem Modell gesucht, das optimalerweise die
empirischen Daten beschreibt und eine gut geeignete Prognose liefert.
Das Bundeskartellamt hat festgestellt, dass die Freitagspreise fr die Dieselpreise am
hchsten sind. Am Sonntag sinken die Preise, so dass sie sonntags und montags am
niedrigsten sind (Bundeskartellamt, 2011). So lautet die erste Hypothese, die im Rahmen dieser Arbeit berprft wird:
Hypothese 1: Der Freitagspreis der Kraftstoffpreise ist der hchste Preis der Woche.
Darber hinaus hat das Bundeskartellamt festgestellt, dass die Spotpreise die Kraftstoffpreise mit einer Verzgerung beeinflussen (Bundeskartellamt, 2011). Insbesonde2
re schlagen die Rohlpreissteigerungen schneller auf die Kraftstoffpreise durch als die
Rohlpreissenkungen (Wettbewerbskommission, 2008; Dudenhfer, 2011).
Hypothese 2: Die Spotpreise beeinflussen die Benzinpreise mit einer Verzgerung.
Im zweiten Kapitel werden die modelltheoretischen Grundlagen und Methoden dargestellt. Es werden Stationaritt und Saisonalitt als wichtigste Charakteristika sowie
die Grundlagen der Modellbildung der Zeitreihen vorgestellt.
Im dritten Kapitel wird die Analyse der empirischen Daten mittels Einheitswurzel-Tests
auf Stationaritt durchgefhrt. Das Eliminieren der Nicht-Stationaritt der Zeitreihen
ist die Voraussetzung fr eine gute Modellschtzung.
Im vierten Kapitel werden solche Charakteristika der Zeitreihen wie Periodizitt und
Saisonalitt detailliert untersucht. Basierend auf den Ergebnissen dieser Untersuchung
wird die Entscheidung zwischen dem additiven und multiplikativen Modell getroffen,
um ein geeignetes Modell fr die saisonbereinigte Zeitreihe zu generieren.
Im fnften Kapitel werden die Modelle gebildet, die die Entwicklung von Spotpreisen
und Kraftstoffpreisen am Beispiel der Dieselpreise beschreiben. Der Zusammenhang
zwischen den Spotpreisen und den Kraftstoffpreisen wird mittels eines Regressionsmodells geschtzt.
In der Zusammenfassung werden die Ergebnisse der Arbeit vorgestellt. Im Anhang
finden sich die detaillierten Tabellen der Resultate der Tests auf Stationaritt.
2
2.1
Die Daten, die der konometer in den Modellen analysiert, sind zum grten Teil
Zeitreihen, also Folgen von Beobachtungen von Merkmalen, die in meist regelmigen
Zeitpunkten erhoben werden. Nachdem die Beobachtungen in zeitlicher Ordnung erhoben werden, muss damit gerechnet werden, dass die jeweils aktuelle Beobachtung
Information ber die Vergangenheit enthlt. Das aktuelle Konsumverhalten wird sich
von dem in den letzten Perioden nicht allzu sehr unterscheiden. hnliches gilt fr Investitionen oder andere konomische Variable. Wenn aber die Beobachtungen der jngeren Vergangenheit zur Erklrung des aktuellen Verhaltens beitragen knnen, werden
sie bei der Modellierung zu bercksichtigen sein, wenn von der in den Daten verfgbaren Information in effizienter Weise Gebrauch gemacht werden soll. Zeitreihen-Modelle,
die von der Abhngigkeitsstruktur Gebrauch machen, haben sich insbesondere fr das
Prognostizieren von konomischen Variablen als sehr erfolgreich erwiesen (Hackl, 2005).
Die ARMA-Modelle einschlielich AR- und MA-Modelle beschreiben die aktuelle Beobachtung im Wesentlichen als gewichtete Summe verzgerter Realisationen der interessierenden Variablen. Zum begrifflichen Hintergrund von Zeitreihen-Modellen gehren die
stochastischen Prozesse, ihre Eigenschaften wie die Stationaritt und ihre Charakteristika wie die Autokorrelations- oder AC-Funktion und die Partielle Autokorrelations- oder
PAC-Funktion sowie deren graphische Gegenstcke, das Korrelogramm und das Partielle Korrelogramm. Letztere eignen sich besonders zur Visualisierung der Abhngigkeitsstruktur der Variablen. Den Zeitreihen-Modellen wie den ARMA-Modellen entsprechen
bestimmte Formen der Abhngigkeitsstruktur der Variablen, die durch die AC- und
PAC- Funktionen charakterisiert werden knnen. Aus der Form dieser Funktionen kann
auf den Modelltyp rckgeschlossen werden, durch den die Zeitreihe dargestellt werden
kann.
Unter einer Zeitreihe versteht man eine Folge von Beobachtungen einer Zufallsvariablen
Y , beispielsweise die jhrlichen Werte des BIP, die quartalsweisen Zuwchse des Kapitalbestandes oder die monatlichen Importe. Hat man n solche Beobachtungen, so kann
man sie als Realisationen der Zufallsvariablen Y1 , ..., Yn schreiben. Bei einer Zeitreihe
spricht man auch von der Realisation eines stochastischen Prozesses; die der Zeitreihe
entsprechenden Zufallsvariablen Y1 , ..., Yn sind ein Ausschnitt aus der unendlichen Folge
{Yt , t = , ..., } von Zufallsvariablen, die den stochastischen Prozess reprsentiert
(Hackl, 2005).
Von einem Zeitreihen-Modell erwartet man, dass es in der Lage ist, die Charakteristika
wie Trend, Saisonalitt und irregulre Fluktuationen darzustellen. Dazu stehen unterschiedliche Typen oder Klassen von Modellen zur Verfgung. Ein Modell kann darauf
zielen, den Verlauf der Zeitreihe in globaler Weise zu beschreiben. Fr die Entwicklung
4
4
P
i Dit + ut ,
(2.1)
i=1
wobei die i-te Dummy-Variable Dit den Wert Eins hat, wenn t dem Quartal i entspricht,
und ansonsten den Wert Null hat. Andere Modelle beschreiben nur das lokale Verhalten
und passen sich flexibel den sich ndernden Trends, Saisonmuster etc. an (Hackl, 2005).
2.2
Stationaritt
2.2.1
konomische Zeitreihen sind Realisationen von stochastischen Prozessen. Die meisten konomischen Zeitreihen zeigen einen Trend und sind die Realisation eines nichtstationren Prozesses. Die Regressionsmodelle bilden den Zusammenhang zwischen den
abhngigen Variablen und ihren erklrenden Regressoren als statische Beziehung ab.
Das Vorhandensein der speziellen Abhngigkeitsstruktur und von Trends legt es aber
nahe, die in diesen Spezifika der Daten enthaltene Information in der Modellierung zu
5
(2.3)
oder 4Yt =Yt -Yt1 =+ut mit Weiem Rauschen u beschreibt ein irregulres oder zuflliges Fluktuieren der Differenzen 4Yt um den Erwartungswert . Ein Prozess, der
diesem Modell folgt, heit Random walk mit Trend. Das Einsetzen der Modellgleichung
fr Yt1 , Yt2 etc. liefert die Beziehung
P
Yt =Y0 + t+ ui ,
(2.4)
it
wobei den Trendparameter darstellt. Der Prozess setzt sich aus zwei Komponenten
P
zusammen, aus dem Wachstumspfad Y0 + t und den kumulierten Strgren
i ui
(Hackl, 2005).
Die Eigenschaften von Random Walk sind:
6
2.2.2
Einheitswurzel-Tests
Wenn ein Trend in einem Modell korrekt bercksichtigt werden soll, muss bekannt sein,
ob es sich um einen deterministischen oder einen stochastischen Trend handelt. Ein
wichtiges Hilfsmittel dazu sind die Einheitswurzel-Tests, mit deren Hilfe das Vorliegen
von nicht-stationren Zeitreihen diagnostiziert werden kann.
Man geht von einer Variablen Y aus, welche die Realisation eines Prozesses ist, der
dem Modell Yt = Yt1 +ut folgt; u ist Weies Rauschen mit der Varianz 2 . Ist Y ein
differenz-stationrer Prozess, so hat den Wert Eins: Y ist dann ein Random Walk.
Zum Prfen, ob es zutrifft, dass Y ein Random Walk ist, testet man die Nullhypothese
H0 : = 1 gegen die Alternative H1 : < 1.
n
P
Yt Yt1
t=2
n
P
t=2
2
Yt1
|| < 1, ist Yt stationr, so ist die Teststatistik des t-Tests: t(n 1). Ist Yt
nicht-stationr, so gilt =1, so folgt auch bei Zutreffen der Nullhypothese nicht der
t-Verteilung. Fuller (1976) gibt Perzentile fr die Verteilung von unter H0 an, die
aus Monte Carlo Simulationen geschtzt worden sind. Auf der Basis von kritischen
Schranken nach Fuller kann die Entscheidung zwischen H0 : =1 und H1 : <1 mit der
-Statistik in Analogie zum t-Test getroffen werden. Der Name Einheitswurzel kommt
daher, dass die Nullhypothese dem Fall entspricht, dass das Charakteristische Polynom
(2.5)
(2.6)
Der Test von H0 : =0 gegen die Alternative H1 : < 0 ist quivalent dem oben geschriebenen Einheitswuzel-Test von H0 : =1 und H1 : <1. Zum Entscheiden ber H0
d
verwendet man die Teststatistik = se(d)
.
Der OLS-Schtzer d fr ergibt sich zu d=-1,
(2.7)
und die Einheitswuzel-Hypothese. Die Erweiterung ist das Testen der Unit-Root Hypothese fr einen AR(p)-Prozess
Yt =1 Yt1 +...+p Ytp +ut .
(2.8)
(2.9)
Die Koeffizienten sind Funktionen der 1 ; z.B. = 1 + ... + p - 1. Der Test von
H0 : =0 wird wie der Dickey-Fuller-Test ausgefhrt. Die Nullhypothese sagt die NichtStationaritt der Zeitreihe aus. Die Teststatistik wird mit den gleichen kritischen
Schranken verglichen. Das Modell kann um ein Interzept oder um einen deterministischen Trend + t erweitert werden.
Die Ordnung p des AR(p)-Prozesses, den man dem Modell des ADF-Tests zugrunde
legt, ist im Allgemeinen nicht bekannt. Man geht zum Auffinden des korrekten Modells
vom allgemeinen zum engeren Modell vor. Dazu wird eine Obergrenze pmax der Ordnung p festgelegt. Eine Formel zum Bestimmen von pmax , die (Schwert, 1989) auf der
Basis umfangreicher Monte Carlo Simulationen vorgeschlagen hat, ist (Hackl, 2005)
pmax =int{12(n/100)0.25 }
8
(2.10)
Beim Dickey-Fuller-Test nimmt man an, dass die Strgren unabhngig sind und ber
eine konstante Varianz verfgen. Im diesem Zusammenhang treten einige Probleme auf:
1. der Schtzer fr und Standardfehler ist ungenau, bis alle AR-Prozesse in der
Schtzungsgleichung bercksichtigt sind. Anders gesagt, wenn man die genaue
Ordnung des AR-Prozesses nicht kennt, tritt das Problem der richtigen Wahl der
Anzahl von p.
2. Der Dickey-Fuller-Test bercksichtigt nur eine Einheitswurzel. Das heit, ein Prozess mit p Ordnungen und d<p Einheitswurzeln muss d-mal differenziert werden,
um zur Stationaritt zu gelangen.
3. Es gibt Zeitreihen, die erste Differenzierung und auch solche, die eine saisonale
Differenzierung voraussetzen. Man muss eine Methode entwickeln, die zwischen
den beiden Arten von Einheitswurzelprozessen unterscheiden kann.
4. Es knnen strukturelle Brche in den Daten vorkommen, die einen scheinbaren
Trend an die Daten vermitteln (Enders, 2010).
2.2.3
Residuen-Analyse
Unter bestimmten Annahmen ber die Strungen Ut haben die geschtzten Koeffizienten j Optimalittseigenschaften. Sofern die Ut unabhngig normalverteilt mit Erwartungswert 0 und Varianz 2 sind, handelt es sich bei Schtzern, die mit dem Kleinstquadrateprinzip gewonnen wurden, um beste unverzerrte Schtzer. Werden diese Annahmen allerdings verletzt, so besitzen die Kleinstquadratschtzer keine oder nur noch
unrealistisch eingeschrnkte Optimalittseigenschaften (wie beste lineare Unverzerrtheit) (Schlittgen & Streitberg, 1989). Es ist daher wichtig, die Gltigkeit der Annahmen
jeweils kritisch zu berprfen.
Grundlegend dabei sind die sogennanten Residuen, d.h. die Abweichungen von Daten xt
und geschtztem Trend m
t . Unter Normalverteilungsannahmen sollte das Histogramm
der Residuen nherungsweise einer Normalverteilung folgen - insbesondere sollten keine Ausreier auftreten. Kleinstquadrateschtzer werden von untypischen Werten sehr
stark beeinflusst. In eine quadratische Zielfunktion geht z.B. eine Abweichung 10 ebenso
stark ein wie 100 Abweichungen der Gre 1. Gegebenenfalls ist es notwendig, vor der
Schtzung von mt etwaige Ausreier zu beseitigen.
Der Erwartungswert aller Ut sollte gleich 0 sein - dies drckt inhaltlich aus, dass keine
systematischen Effekte im Modell fr m(t) vernachlssigt wurden. berprft werden
kann diese Annahme dadurch, dass die Residuen ut gegen andere relevante Variablen,
z.B. die Zeit t aufgetragen werden, um systematische Zusammenhnge zu entdecken.
In Reihen mit Saisonschwankungen ist die Annahme E[Ut ]=0 bei einer Trendbestimmung im allgemeinen nicht erfllt, da die Residuen ut =xt -m
t systematisch mit der
Saison variieren. Es werden sich daher im Regelfall andere Trendschtzungen ergeben,
9
wenn man von vornherein ein gemeinsames Modell fr Trend und Saison unterstellt.
Man achte bei einer Zeichnung der ut gegen t insbesondere auf sogenannte Strukturbrche, d.h. tiefgreifende Vernderungen des Gesamtbildes (Schlittgen & Streitberg, 1989).
Die Unabhngigkeitsannahme impliziert insbesondere, dass die Strungen ut nicht autokorreliert sind. Die Residuen sollten zufllig um 0 schwanken. Allzu langsame Schwankungen deuten auf positive, allzu schnelle und regelmige Schwankungen auf negative
Autokorrelation hin.
Ein Test auf Autokorrelation zum Lag (Verzgerung) 1 ist der Durbin-Watson-Test.
Die Teststatistik ist
N
N
P
P
(2.11)
d= (ut ut1 )2 / ut 2
t=2
t=1
2.3
Saisonalitt
S
P
Ds(t) s + %t
(2.12)
s=1
Groteile der Streuung quantitativer Variablen xt erklren (beispielsweise beim Konsum nichtdauerhafter Gter erklrten deterministische Saisonfiguren rund 97 Prozent
der Variablenstreuung). Dabei waren xt erste Differenzen logarithmierter Daten und
%t ein als stationr unterstellter Residualprozess. Ds (t) reprsentiert eine sogenannte
saisonale Dummy-Variable fr eine Teilperiode s, die den Wert eins annimmt, wenn
t zu eben dieser Teilperiode gehrt und ansonsten gleich Null ist. Fr Preisvariablen
wie insbesondere Zinsen und Lhne spielten deterministische Saisoneinflsse kaum eine
Rolle bei der Varianzzerlegung. Bei Nominal-und Realzins betrugen die Streuungsanteile, z.B. nur 1 bzw. 6 Prozent (Herwatz, 1995).
10
Der Verwendung saisonaler Dummy-Variablen liegt die Vorstellung einer deterministischen Saisonfigur zugrunde, die strukturkonstant im Periodenverlauf beibehalten wird.
Ein sich allmhlich vernderndes saisonales Aktivittsmuster kann so nicht reprsentiert
werden. Schtzt man die obige Gleichung sukzessive fr steigende Stichprobenumfnge
T =S, S +1, S +2,..., T (rekursive KQ-Schtzung), so zeigen die Schtzkoeffizienten s
fr bestimmte Variablen eine deutliche Bewegung im Zeitablauf. Streuungszerlegungen
in der Art von Barsky & Miron (1989) bleiben damit rein deskriptiv.
Mgliche Ursachen fr ein saisonal geprgtes Verlaufsmuster von Zeitreihen sind vielfltig, selten isoliert wirksam und zumeist einer wirtschaftspolitischen Steuerung entzogen. Sie reichen von Kalendereffekten (z.B. Weihnachtsfeiertage) und sogenannten
timing decisions (Ferienzeiten, Termine von Gewinnausschttungen etc.) ber klimatische Einflsse bis hin zu Erwartungen ber saisonales Verhalten der Wirtschaftssubjekte. Man beachte, dass sich einige dieser Verursacher im Zeitablauf verndern knnen,
a priori spricht einiges fr ein im Zeitablauf variables Bild saisonaler Strukturen.
In der spektralen Darstellung der Zeitreihe entspricht das beschriebene zyklische Verlaufsmuster einem hohen Anteil spektraler Dichte im Bereich der saisonalen Frequenzen.
Derartige Spitzen im Zeitreihenspektrum definieren eine gegebene Zeitreihe als saisonal.
Fr die Erklrung konomischer Zusammenhnge wird saisonalen Schwankungen zumeist wenig Bedeutung beigemessen. Saisonale Einflsse gelten oft als Variablenfehler,
zu deren Identifikation angenommen wird, dass sie ausschlielich zur spektralen Masse
an saisonalen Frequenzen (bzw. zu einem engen umliegenden Frequenzband) beitragen.
Implizit geht man also davon aus, dass Saisonzyklen einerseits und lngerfristige Zyklen
andererseits unabhngig voneinander sind (Orthogonalittsannahme). Begrndet liegt
diese Minderschtzung saisonaler Verlaufsmuster sicher mit in dem hohen Interesse der
quantitativen Forschung an Wachstums- und Konjunkturmodellen. Vor diesem Hintergrund ist es verstndlich, dass vergleichsweise gut prognostizierbare Niveauschwankungen innerhalb einer Periode geringere Bedeutung erhalten als eine als dauerhaft
unterstellte Vernderung aggregierter wirtschaftlicher Aktivitt (Herwatz, 1995).
2.3.1
chen Schtzungen nicht der Fall, die den Daten ein restringiertes Modell anpassen.
Sims (1974) zeigt mit Hilfe der Fouriertransformation der Modellkoeffizienten im sogenannten distributed-lag-Modell fr zwei Zeitreihen konomischer Variablen wt , xt ,
wt =+xt 0 +xt1 1 +...+ut ,
(2.13)
das auf beobachtbare, von saisonalen Einflssen geprgte Daten angewendet wird, die
Grenordnung der Abweichung von wahren d.h. hier saisonfreien Wirkungszusammenhang. Die Tatsache, dass saisonale Komponenten die spektrale Dichte annahmegem nur an saisonalen Frequenzen beeintrchtigen, hat zur Folge, dass die Verzerrung
der Schtzkoeffizienten nur an saisonalen Frequenzen von Bedeutung ist. Besonders
schwerwiegend kann diese Verzerrung werden, falls den Schtzkoeffizienten Restriktionen auferlegt werden. Unter bestimmten Bedingungen werden saisonal bedingte Verzerrungen abgemildert:
1. Der strukturelle Zusammenhang ist fr die interessierenden d.h. saisonbereinigten
Variablen der gleiche wie fr die saisonalen Komponenten. Eine Verzerrung tritt
nicht auf.
2. Die Saisonkomponenten der abhngigen Variablen einerseits und der unabhngigen Variablen andererseits korrelieren nicht oder kaum miteinander (Herwatz,
1995).
Der Bereinigung saisonaler Daten liegt die Annahme zugrunde, dass saisonale Datenvariationen fr eine Reihe von Fragestellungen der empirischen oder auch theoretischen
Arbeit von untergeordneter Bedeutung sind. Die Bereinigung saisonaler Einflsse ist
jedoch z.B. von folgenden Problemen belastet:
1. Selbst wenn saisonale Einflsse als Variablenfehler einzelner Zeitreihen behandelt
werden knnen, so ist dennoch die Annahme kritisch, dass diese Fehler unabhngig voneinander in verschiedenen Zeitreihen auftreten. Bei abhngigen Fehlern
beraubt sich aber die quantitative Analyse im multiplen Modell von vornherein
bereits mglicher Erkenntnisse struktureller Zusammenhnge.
2. Zeitreihenfilter zur Saisonbereinigung beziehen in aller Regel fr jeden Zeitpunkt
t, sowohl vergangene als auch zuknftige Realisierungen von xt ein (z.B. gleitende
Durchschnitte). Zumeist sind derartige Filter symmetrisch, d.h. die Beobachtungen xt+h und xth , h=0,1,2.. erhalten bei der Kalkulation des saisonbereinigten
Wertes xt jeweils gleiche Gewichte. Die Verwendung eines solchen zweiseitigen
linearen Filters zum Erhalt der saisonbereinigten Reihe xt = a (B)xt ist am
aktuellen Rand der Zeitreihe nicht mglich. Einseitige Filter dienen in diesem Bereich zur Ermittlung vorlufiger Werte, die gegebenenfalls dann spter korrigiert
werden mssen (Herwatz, 1995).
12
2.3.2
Die Box-Jenkins Technik fr die Modellierung der saisonalen Daten ist etwas andere als
die fr die nicht-saisonalen Daten. Die Saisonalitt in den Daten mit der Periode s entsteht eher durch die saisonalen Koeffizienten der AC-Funktion und der PAC-Funktion
der zeitlichen Verzgerungen s, 2s, 3s, ..., als die der 1, 2, 3. Zwei reine saisonale Modelle
der Quartalsdaten sind in den Gleichungen 2.14 und 2.15 dargestellt.
yt =a4 yt4 + t , ka4 k < 1 und
(2.14)
yt =t + 4 t4
(2.15)
Das theoretische Korrelogramm fr die erste Gleichung zeigt, dass p = (a4 )i/4 , wenn i/4
ein Integer ist und pi = 0, wenn sonst. Die AC-Funktion weist eine Spitze an den Verzgerungsstellen 4, 8, 12, ... auf. In der Praxis wird die Identifikation durch die Tatsache
erschwert, dass die saisonale Komponente mit der nicht-saisonalen Komponente in den
Daten in Verbindung gert. Die AC- und PAC-Funktionen widerspiegeln zugleich beide
Komponenten. Fr Quartalsdaten, der saisonale MA-Term wird folgende Form haben:
yt =a1 yt1 + t + 1 t1 + 4 t4
(2.16)
(2.17)
Beide Methoden in den Gleichungen 2.16 und 2.17 sind additive Methoden der saisonalen Koeffizienten: ein AR- oder MA-Koeffizient wurde in der Saisonalitt bercksichtigt.
Die multiplikative Methode ermglicht das Zusammenwirken vom ARMA-Modell und
der saisonalen Effekte, siehe Gleichung 2.18 (Enders, 2010).
(1a1 L)yt = (1+1 L)(1+4 L4 ) t
2.4
2.4.1
(2.18)
Neben der Bestimmung des globalen Trends ist oft eine Glttung der Zeitreihe von
Interesse. Glttung bedeutet Ausschaltung von irregulren Schwankungen durch lokale Approximationen. Der Vorteil liegt u.a. darin, dass man mit Polynomen niedrigen
Grades auskommt. Im klassischen Komponentenmodell entspricht dies der nherungsweisen Bestimmung der glatten Komponente. Es ist naheliegend, im ersten Ansatz zum
Gltten einer Zeitreihe die Beobachtung xt durch ein lokales arithmetisches Mittel yt
zu ersetzen:
yt =
1
2q+1
q
P
xtu , t = q + 1, ..., N q
u=q
13
(2.19)
Dies ist ein Beispiel fr eine lineare Transformation einer Zeitreihe (xt ) in eine andere
(yt ). Eine lineare Transformation L einer Zeitreihe (xt ) in eine andere (yt ) gem
yt = L xt =
s
P
au xtu , t = s + 1, ..., N q
(2.20)
u=q
wird als linearer Filter L bezeichnet. Anstatt durch das formale Symbol L wird der
Filter auch durch seine Gewichte au in der Form (aq , ..., as ) bzw. (au ) angegeben. Die
Anwendung eines Filters auf eine Zeitreihe (xt ) wird als Filtration der Reihe bezeichnet.
(xt ) heit auch der Input und die gefilterte Reihe (yt ) der Output des Filters. Bei der
Filtration einer Zeitreihe (xt ) ist zu beachten, dass die gefilterte Reihe (yt ) krzer als
die Input-Reihe ist. Im Fall s > 0 wird der Anfang, im Fall q > 0 das Ende gekappt
(Schlittgen & Streitberg, 1989).
Dieses Verfahren zur Glttung der Zeitreihen wird als einfacher gleitender Durchschnitt bezeichnet. Der entsprechende P
Filter hat die Gewichte au = 1/(2q + 1) mit
P
au = 1. Ein linearer Filter (au ) mit
au = 1 heit ein gleitender Durchschnitt. Im
Fall au = 1/(2q + 1), u = q, ..., q, spricht man von einem einfachen gleitenden Durchschnitt. Beispiel von zwei einfachen gleitenden Durchschnitten, bei denen je drei bzw.
fnf Werte einbezogen wurden, sieht folgenderweise aus:
yt = xt1 +x3t +xt+1
zt = xt2 +xt1 +x5t +xt+1 +xt+2
Einfache gleitende Durchschnitte knnen auch fr gerade Anzahlen von Werten bestimmt werden. Der Output ist dann aber jeweils der Mitte zwischen zwei Zeitpunkten
zugeordnet, so etwa 1/4(x1 +x2 +x3 ) dem Zeitpunkt 2.5. Man kann diesen ungewnschten Effekt dadurch vermeiden, dass man jeweils ber zwei aufeinander folgende Werte
des Outputs mittelt:
3 +x4
y2.5 = x1 +x2 +x
und
4
4 +x5
y3.5 = x2 +x3 +x
, als Mittelwert entsteht
4
14
2.4.2
Bei der Anpassung eines Polynoms an eine Zeitreihe und bei der lokalen Glttung
durch Polynome stellte sich die Frage, welcher Grad fr das Polynom gewhlt werden soll. f (t) sei ein Polynom vom Grade p > 0: f (t)=a0 + a1 t + ... + ap tp . Dann ist
g(t) = f (t)f (t1) ein Polynom vom Grade hchstens p-1. Die Differenzenbildung reduziert den Polynomgrad um 1. Wird das Verfahren p-1-mal angewendet, so erhlt man
bei einem Polynom p-ten Grades einen konstanten Wert. Die Anwendung der Differenzenbildung auf Zeitreihen fhrt wieder auf eine lineare Transformation oder Filtration.
Der lineare Filter , der definiert ist durch xt = xt xt1 , t = 2, 3, ..., N heit
Differenzenfilter 1. Ordnung. Differenzenfilter p-ter Ordnung, p>1, sind rekursiv definiert durch p xt =p1 xt p1 xt1 , t = p+1, ..., N . Ist bei dem der Trendbestimmung
zugrundegelegten Ansatz ein Polynom, so lsst sich durch Differenzenbildung der Trend
eliminieren bzw. der Grad des Polynoms bestimmen.
Fr konomische Zeitreihen ist es oft ausreichend, die Differenzen 1. Ordnung zu bilden,
um Vernderungen im Niveau zu beseitigen. Da die ersten Differenzen als Zuwchse auch
inhaltlich bedeutsam sind, wird dieses Vorgehen hufig praktiziert. Falls ntig, werden
die zweiten Differenzen gebildet, um zustzliche Nicht-Stationaritt der Steigungen zu
beseitigen (Schlittgen & Streitberg, 1989).
2.5
2.5.1
Modellschtzung
ARMA-Modelle
Eine sehr allgemeine Klasse von Modellen sind die ARMA-Modelle. Die ARMA-Modelle
sind eine Klasse von Zeitreihen-Modellen, die beispielsweise fr die Prognose eine wichtige Rolle spielen. Ihre Bedeutung verdanken sie auch der von Box und Jenkins (1976)
entwickelten Technik, die in der Literatur umfassend dokumentiert ist und deren Anwendung durch die Verfgbarkeit von exzellenten Software-Paketen untersttzt wird.
Fr die Zwecke der trigonometrischen Modellierung sind die Mglichkeiten der ARMAModelle als Analyseverfahren weniger interessant als die mit den Modellen verbundenen
AC- und PAC-Funktionen, die ein wichtiges Instrument zum Spezifizieren eines geeigneten Modells ist (Hackl, 2005).
Es ist mglich zum ARMA-Modell zu gelangen, indem man den Moving-Average Prozess mit der linearen Differentialgleichung zusammenfhrt. Wenn man die p-Ordnung
der Differentialgleichung bercksichtigt, so sieht das Modell wie in der Gleichung 2.21
aus.
p
P
yt =a0 + ai yti +xt ,
(2.21)
i=1
15
Und wenn xt ein Moving Average Prozess von der Ordnung q ist, wird das Modell
folgende Form haben:
p
q
P
P
yt =a0 + ai yti + i ti
(2.22)
i=1
i=0
Wenn sich die charakteristischen Wurzeln der zweiten Gleichung im Einheitskreis befinden, liegt ein ARMA-Modell fr yt vor. Der autoregressive Teil des Modells ist die
Differentialgleichung, gegeben durch den homogenen Teil der ersten Gleichung. Wenn
er die p-Ordnung enthlt und das Modell fr xt der q-Ordnung ist, heit das Modell das
ARMA (p,q)-Modell. Wenn q=0 ist, so ist es ein reiner autoregressiver Prozess AR(p),
und wenn p=0, liegt ein reiner moving-average Prozess MA(q). Wenn sich die charakteristischen Wurzel der zweiten Gleichung nicht im Einheitskreis befinden, so ist yt ein
autoregressiver integrierter moving-average (ARIMA) Modell (Enders, 2010).
Wie aus einem ARMA-Modell ein AR-Modell und MA-Modell hergeleitet werden kann,
wird im folgenden dargestellt. Die allgemeine Form eines ARMA(p,q)-Modells lautet:
Yt = + 1 Yt1 + ... + p Ytp + t ,t = ut - 1 ut1 - ... - q utq ,
(2.23)
wobei die Variablen u Weies Rauschen sind, also identisch und unabhngig verteilte
Variable mit Erwartungswert Null und Varianz 2 .
Voraussetzung fr die Darstellbarkeit des ARMA(p,q)-Prozesses als MA()-Prozess
ist die Stationaritt des AR-Teils Yt =Yt1 +t . u wird als gewichtete Summe von verzgerten Komponenten des Weien Rauschens dargestellt, indem man wiederholt die
Modellgleichung verwendet, um verzgerte u0 s zu eliminieren:
Yt = o +
o uti
(2.24)
i=1
AR(p)-Prozess
(2.25)
Die Variable Y wird also auf ihre eigenen verzgerten Werte regressiert. Fr den AR(p)Prozess ist die Invertierbarkeit immer gegeben. Fr den AR(1)-Prozess mssen bestimmte Stationaritts-Bedingungen erfllt sein: Fr die Wurzeln zi des Charakteristischen Polynoms (z)= 1- 1 z-...- p z p muss gelten:|zi | > 1, i = 1,...,p.
Die AC-Funktion des AR(p)-Prozesses verluft exponentiell abnehmend mit oder ohne alternierende Werte oder in Form einer gedmpften Sinusschwingung. Die PACFunktion ist nur fr k p von Null verschieden. Ab k = p + 1 hat sie den Wert Null;
die PAC-Funktion bricht also in p ab (Hackl, 2005).
2.5.3
MA-Prozess
Der Name MA-Modell kommt von moving average, also gleitende Mittelung, jene Operation, welche die Generierung der Y charakterisiert. Unter dem MA(q)-Modell versteht
man ein ARMA(p,q)-Modell mit p=0, also ein Modell, das die Variable als gewichtete
Summe von verzgerten Komponenten des Weien Rauschens beschreibt. Der entsprechende MA-Prozess ist eine Folge von Zufallsvariablen Yt , t=1,...,n, die entsprechend
dem MA-Modell generiert werden.
Der MA(1)-Prozess ist eine Folge von Zufallsvariablen Yt , fr die gilt
Yt = + ut - ut1 , ut IID(0, 2 )
(2.26)
(2.27)
17
3
3.1
3.2
Vorlufige Analyse
Am Anfang ist die graphische Darstellung der Diesel-, Benzin-, Superplus- und Spotpreisen zu analysieren. In der Abbildung 1 sind die Originaldaten der Benzin-, Diesel-,
SuperPluspreise per Liter dargestellt, die um die konstante Steuerkomponente bereinigt
sind, und die Spotpreise in Euro auch per Liter. Man sieht deutlich an der Graphik,
dass alle drei Kraftstoffpreise den Verlauf voneinander wiederholen. Es ist fast immer
der gleiche Prozentsatz, um welchen sie sich voneinander unterscheiden. Man beobachtet auch einen hnlichen Verlauf der Kraftstoffpreise und der Spotpreise. Es ist einen
positiven Trend zu erkennen, der sich zum Ende des Zeitraums abschwcht. Im nchsten Schritt werden die Zeitreihen auf die Stationaritt untersucht, um mgliche Trends
oder Saisonalitten festzustellen.
18
0,65
0,6
0,55
0,5
0,45
0,4
0,35
Spotpreis
Netto_Diesel
Netto_Benzin
Netto_SP
0,3
0,25
3.3
3.3.1
liegt. Es gibt mindestens eine Einheitswurzel und somit liegt eine differenz-stationre
Zeitreihe vor.
t-Statistic
Prob.*
-2.853337
-3.988333
-3.424579
-3.135349
0.1795
t-Statistic
Prob.*
-2.754462
-3.983684
-3.422321
-3.134016
0.2155
t-Statistic
Prob.*
-6.275240
-3.988333
-3.424579
-3.135349
0.0000
t-Statistic
Prob.*
-18.96369
-3.984496
-3.422716
-3.134249
0.0000
these wird verworfen, wenn p-Wert sehr klein ist (Hackl, 2005).
Der Augmented Dickey-Fuller Unit Root Test fr den Spotpreis in der Abbildung 5
zeigt, dass t-Statistic von 18, 96369 kleiner als der kritische Wert bei 5 Prozent
3, 422716 ist. Das heit, die Entscheidung liegt im Bereich der Annahme von H1 . Es
liegt eine stationre Zeitreihe vor. Der P-Wert gleich 0, 000 deutet auf die Signifikanz
der Ergebnisse.
3.3.2
Kwiatkowski-Phillips-Schmidt-Shin-Test
0.219196
0.216000
0.146000
0.119000
22
0.166831
0.216000
0.146000
0.119000
23
0.050980
0.216000
0.146000
0.119000
0.048129
0.216000
0.146000
0.119000
24
4.1
In diesem Kapitel werden die Daten auf Periodizitt und Saisonalitt untersucht.
Um die Abhngigkeit der Nachbarelemente zu eliminieren, werden die ersten Differenzen der Zeitreihen gebildet. Danach werden die Korrelogramme fr die ersten Differenzen mit der Formel fr die Autokorrelationsfunktion berechnet (siehe 4.1). Fr
das Beschreiben des Verhaltens eines stochastischen Prozesses ist die AC-Funktion gut
geeignet, da sie unabhngig von der Maeinheit ist. Die graphische Darstellung der
AC-Funktion nennt man Korrelogramm (Hackl, 2005). Die Gre der Spitze rk im Korrelogramm charakterisiert die Korrelation zwischen dem Wert der Zeitreihe im Moment
t und dem Wert der Zeitreihe im Moment
t k. Die Strichlinien bedeuten zwei Grenzen
(yt
y )(ytk
ytk )/(T k)
k = t=k+1
T
P
, ytk =
ytk /T k
(4.1)
(yt
y )2 /T
t=1
1,00E+00
Corrcoef_FirstDiff_Spot
8,00E-01
6,00E-01
4,00E-01
2,00E-01
0,00E+00
0
5 10 15 20 25 30 35 40 45 50 55 60 65 70 75 80 85 90 95 100
-2,00E-01
25
Partial Correlation
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
AC
PAC
Q-Stat
Prob
-0.020
0.057
-0.055
-0.095
0.005
-0.015
-0.001
-0.003
-0.005
0.018
0.013
-0.001
0.012
-0.009
0.078
0.017
-0.053
-0.107
-0.043
-0.047
-0.010
-0.017
-0.009
-0.016
-0.060
-0.063
-0.025
-0.049
0.021
0.045
-0.104
0.053
-0.047
-0.002
0.045
-0.011
0.096
0.038
-0.005
-0.016
-0.018
0.025
-0.025
-0.072
-0.069
0.029
-0.003
0.155
0.033
0.062
-0.030
-0.050
0.028
-0.019
-0.027
-0.027
0.028
-0.021
-0.025
-0.012
0.037
0.054
0.026
-0.026
-0.015
0.012
0.003
-0.021
0.029
0.022
0.072
0.014
-0.010
-0.041
-0.108
0.064
0.021
0.031
-0.063
-0.047
-0.020
0.057
-0.053
-0.101
0.007
-0.007
-0.013
-0.011
-0.004
0.016
0.013
-0.004
0.011
-0.003
0.080
0.022
-0.062
-0.107
-0.023
-0.040
-0.031
-0.038
-0.020
-0.027
-0.073
-0.082
-0.031
-0.056
0.003
0.032
-0.125
0.038
-0.008
-0.014
0.028
-0.010
0.085
0.048
-0.015
-0.016
0.012
0.029
-0.043
-0.113
-0.117
0.029
-0.027
0.106
0.003
0.040
-0.038
-0.060
0.013
0.006
-0.003
-0.019
0.035
-0.026
-0.037
0.016
0.041
0.032
0.010
-0.049
-0.014
0.060
0.015
-0.002
0.013
0.018
0.074
-0.010
0.002
-0.005
-0.097
0.056
0.019
-0.018
-0.046
-0.044
0.1492
1.3364
2.4618
5.7693
5.7768
5.8636
5.8637
5.8665
5.8749
5.9981
6.0641
6.0644
6.1166
6.1459
8.4788
8.5886
9.6711
14.056
14.755
15.620
15.658
15.775
15.809
15.913
17.300
18.857
19.110
20.055
20.226
21.014
25.342
26.465
27.342
27.343
28.152
28.205
31.917
32.515
32.526
32.627
32.765
33.025
33.289
35.435
37.429
37.781
37.785
47.785
48.230
49.844
50.232
51.302
51.636
51.782
52.093
52.397
52.743
52.928
53.194
53.258
53.843
55.118
55.421
55.714
55.812
55.871
55.876
56.073
56.445
56.662
59.000
59.092
59.141
59.898
65.250
67.130
67.335
67.785
69.649
70.693
0.699
0.513
0.482
0.217
0.329
0.439
0.556
0.662
0.752
0.815
0.869
0.913
0.942
0.963
0.903
0.929
0.917
0.725
0.738
0.740
0.789
0.827
0.863
0.891
0.871
0.842
0.866
0.862
0.886
0.887
0.752
0.743
0.745
0.784
0.788
0.820
0.706
0.721
0.758
0.790
0.817
0.838
0.857
0.818
0.781
0.800
0.829
0.482
0.504
0.480
0.504
0.501
0.527
0.560
0.586
0.612
0.635
0.664
0.688
0.719
0.730
0.720
0.740
0.760
0.785
0.808
0.832
0.849
0.861
0.875
0.845
0.862
0.880
0.882
0.782
0.756
0.776
0.789
0.765
0.762
Die Korrelationsfunktion der ersten Differenzen der Spotpreise in Excel in der Abbildung 10 sowie das Korrelogramm in Eviews 11 (Abbildung 11 )zeigen zwei Spitzen
an den Verzgerungsstellen 48 und 75. Die Werte dieser Spitzen befinden sich aber in
den Grenzen des Standardfehlers (in den Grenzen der Strichlinie). Deswegen kann man
diese Spitzen auer Acht lassen und behaupten, dass es keine klare Periodizitt der
Spotpreise vorhanden ist.
Die Korrelogramme der ersten Differenzen der Diesel-, Benzin-, SuperPluspreise sind
in den Abbildungen 13, 14 und 15 dargestellt. Es ist interessant zu beobachten, dass
alle drei Korrelogramme groe Spitzen an den durch 6 teilbaren Verzgerungsstellen
aufweisen. Zu bemerken ist, dass diese Spitzen bedeutend grer als der doppelte Standardfehler sind. Diese Tatsache besagt, dass es eine Periodizitt mit einer Verzgerung
6 vorhanden ist. Da die Daten nur 6 Tage die Woche beinhalten, das heit alle Wochentage auer Samstag, muss man schlieen, dass es sich hier um eine wchentliche
Periodizitt handelt. Die in Excel generierte Korrelationsfunktion am Beispiel der Dieselpreise verdeutlicht das gleiche Ergebnis einer Verzgerung 6 (Abbildung 12).
1
0,9
0,8
Corrcoef_FirstDiff_Diesel
0,7
0,6
0,5
0,4
0,3
0,2
0,1
0
-0,1 0
10 15 20 25 30 35 40 45 50 55 60 65 70 75 80 85 90 95 100
-0,2
-0,3
-0,4
-0,5
-0,6
27
Autocorrelation
Partial Correlation
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
AC
PAC
Q-Stat
Prob
-0.471
0.062
-0.144
0.079
-0.280
0.559
-0.290
0.076
-0.138
0.051
-0.249
0.542
-0.296
0.083
-0.111
0.032
-0.245
0.521
-0.281
0.112
-0.146
0.027
-0.227
0.507
-0.266
0.055
-0.120
0.051
-0.234
0.494
-0.254
0.067
-0.143
0.035
-0.193
0.479
-0.471
-0.206
-0.276
-0.172
-0.517
0.199
0.065
0.058
-0.004
-0.076
-0.277
0.139
0.030
0.024
0.049
-0.011
-0.177
0.080
0.026
0.086
0.028
-0.032
-0.142
0.047
0.045
-0.075
-0.091
-0.036
-0.136
0.012
0.023
-0.022
-0.085
-0.116
-0.136
-0.003
85.728
87.218
95.254
97.676
128.17
250.52
283.53
285.79
293.31
294.33
318.81
435.78
470.77
473.56
478.53
478.95
503.05
612.91
644.83
649.89
658.56
658.84
679.98
785.70
814.82
816.06
822.03
823.11
845.88
948.01
975.12
977.00
985.63
986.15
1001.9
1099.4
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
28
Autocorrelation
Partial Correlation
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
AC
PAC
Q-Stat
Prob
-0.460
0.042
-0.125
0.066
-0.277
0.569
-0.301
0.062
-0.111
0.042
-0.255
0.558
-0.302
0.058
-0.072
-0.001
-0.222
0.520
-0.287
0.107
-0.136
0.028
-0.237
0.517
-0.274
0.055
-0.104
0.027
-0.232
0.504
-0.250
0.040
-0.103
0.007
-0.174
0.477
-0.460
-0.215
-0.266
-0.169
-0.514
0.229
0.048
0.036
-0.004
-0.070
-0.275
0.159
0.044
0.013
0.071
-0.049
-0.162
0.084
0.017
0.119
0.007
-0.003
-0.148
0.035
0.033
-0.057
-0.063
-0.047
-0.163
-0.015
0.040
-0.059
-0.061
-0.109
-0.097
0.038
81.756
82.448
88.494
90.202
120.18
246.86
282.49
284.01
288.87
289.57
315.29
438.88
475.18
476.53
478.63
478.64
498.49
607.59
641.01
645.64
653.17
653.48
676.41
786.01
816.85
818.09
822.62
822.93
845.32
951.44
977.52
978.19
982.69
982.71
995.56
1092.4
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
29
Autocorrelation
Partial Correlation
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
AC
PAC
Q-Stat
Prob
-0.461
0.040
-0.115
0.058
-0.269
0.559
-0.299
0.052
-0.091
0.034
-0.252
0.551
-0.293
0.045
-0.058
-0.008
-0.217
0.501
-0.262
0.086
-0.118
0.016
-0.226
0.503
-0.257
0.032
-0.084
0.018
-0.219
0.486
-0.235
0.019
-0.077
-0.012
-0.166
0.479
-0.461
-0.220
-0.258
-0.168
-0.503
0.226
0.049
0.017
-0.004
-0.063
-0.278
0.158
0.059
0.015
0.065
-0.048
-0.166
0.056
0.031
0.117
0.011
-0.007
-0.143
0.037
0.038
-0.061
-0.066
-0.047
-0.153
-0.012
0.034
-0.065
-0.055
-0.121
-0.115
0.066
82.065
82.677
87.789
89.117
117.38
239.39
274.34
275.40
278.67
279.13
304.34
424.89
459.13
459.93
461.30
461.32
480.33
581.79
609.70
612.71
618.34
618.44
639.38
743.12
770.39
770.81
773.73
773.87
793.89
892.37
915.44
915.58
918.07
918.13
929.81
1027.4
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
30
4.2
Bei der Analyse der Zeitreihe auf Periodizitt ist es von Vorteil, die Zeitreihe in einige
Komponenten zu teilen. Man muss aus den Originaldaten Komponenten eliminieren,
die dazu fhren, dass es groe Spitzen in den Korrelogrammen gibt. Sie spielen in der
Periodizitt eine dominante Rolle, da diese Spitzen auch andere Spitzen unterdrcken
knnen, die durch die anderen saisonalen und periodischen Komponenten hervorgerufen
werden.
Bei der Modellierung besteht die Wahl zwischen einem additiven oder einem multiplikativen Modell. Die Idee dieser Modelle besteht darin, dass die Prognosen nicht nur
auf den Beobachtungen selbst beruhen, sondern auch auf den Zeitverzgerungen (Lags),
so dass man die saisonale und die Trendkomponenten unabhngig voneinander schtzen
kann.
Die Idee von einem additiven und multiplikativen Modell kann man am Beispiel des
Spielzeugverkaufs darstellen. Der Verkauf an Spielzeugen steigt im Dezember vor Weihnachten oder whrend der Sommerferien. Das heit, es wird jedes Jahr eine groe Spitze
im Dezember geben und eine kleinere im Zeitraum der Sommerferien. Diese saisonale
Abhngigkeit wiederholt sich jedes Jahr. An diesem Beispiel kann man den Unterschied
zwischen der additiven und multiplikativen Komponenten beobachten. Zum Beispiel
steigt im Dezember der Verkauf an Spielzeugen um 3 Millionen Euro. Um die saisonale
Komponente zu bercksichtigen, kann man in die Prognose fr den Dezember 3 Millionen Euro hinzufgen. In diesem Fall wre die Saisonalitt additiv.
Der Verkauf an Spielzeugen kann aber auch im Dezember um 40 Prozent steigen, das
bedeutet mit 1,4 multipliziert. Wenn der Durchschnittsumsatz (in Euro) an Spielzeugen gering ist, so ist der absolute Zuwachs der Verkufe im Dezember auch gering (der
prozentuale Zuwachs ist konstant). Wenn Spielzeuge gut verkauft werden, dann fllt der
prozentuale Zuwachs (in Euro) deutlich grer aus. Der Umsatz steigt 1,4 mal und es
liegt eine multiplikative Saisonalitt vor. In diesem Fall wre der Parameter der multiplikativen saisonalen Komponente gleich 1,4. Graphisch gesehen, wre der Unterschied
zwischen den beiden Saisonalitten folgenderweise zu beurteilen: im additiven Modell
werden die saisonalen Schwankungen konstant sein, deren Gre vom allgemeinen Niveau der Werte der Reihe nicht abhngig ist, in einem multiplikativen Modell wird aber
die Gre der Schwankungen vom allgemeinen Niveau der Werte der Reihe abhngen.
Additives Modell
Xt =Tt +Zt +St +It
Multiplikatives Modell
Xt =T Zt +St +It
31
Die Zeitreihe besteht aus vier verschiedenen Komponenten: der saisonalen Komponente
St im Moment t, des Trends Tt , der zyklischen Komponente Ct und der zuflligen, nicht
regulren Komponente oder Fluktuationen It . Die saisonale Komponente hat einen regulren (saisonalen) Verlauf, die zyklische hat aber eher einen lngerfristigen Effekt,
der sich zyklisch ndern kann. Xt bedeutet den Wert der Zeitreihe im Moment t.
Um die periodische (additive und multiplikative) Komponente zu bestimmen, muss man
zuerst die Originalzeitreihe gltten, um irregulre Schwankungen zu eliminieren. Mit
diesem Ziel wird die Methode der gleitenden Durchschnitte angewendet. Dies geschieht
mit der Formel 4.2. Die erzeugte Reihe wird als MA6 bezeichnet.
MAt (k)=
4.2.1
+...+xt
MAt (6)= xt5 +xt4
6
(4.2)
1,1
Sunday
1,05
Monday
Tuesday
1
Wednesday
Thursday
0,95
Friday
0,9
Jun Jul Aug Sep Okt Nov Dez Jan Feb Mrz Apr Mai Jun Jul Aug
09 09 09 09 09 09 09 10 10 10 10 10 10 10 10
eher einen negativen Trend haben und die Sonntagspreisnderungen eher einen positiven Trend. Die Dienstagspreisnderungen weisen ber den ganzen Zeitraum eher einen
negativen Trend auf.
Die Werte von TS/MA6 liegen generell zwischen Sonntags- und Freitagspreisen. So
ist an der Graphik deutlich zu sehen, dass die Freitagspreise viel hher als die Durchschnittspreise sind und das ca. um 2,5 bis 7,5 Prozent ber dem Durchschnitt. Die
prozentualen Sonntagspreisschwankungen liegen ca. 1 bis 8 Prozent unter dem Durchschnitt.
Auf diese Weise entsteht ein so genannter Kanal, in dem sich die Werte von TS/MA6 verndern. Man merkt, dass die Breite dieses Kanals im Winter enger als im Sommer ist.
Das heit, dass die Variabilitt in den Preisschwankungen im Sommer grer ist als im
Winter. Deswegen ist es sinnvoll, die Durchschnittswerte von TS/MA6 fr jeweils jeden
Wochentag (auer Samstag) fr jeweils jeden Zeitabschnitt des Jahres darzustellen, so
die Abbildung 17.
1,08
Sunday
1,06
1,04
Monday
1,02
Tuesday
1
Wednesday
0,98
0,96
Thursday
0,94
Friday
0,92
Summer 09 Autumn 09
Winter 09
Spring 10
Summer 10
33
0,04
Sunday
0,03
0,02
Monday
0,01
Tuesday
0
-0,01
Jun Jul Aug Sep Okt Nov Dez Jan Feb Mrz Apr Mai Jun Jul Aug
09 09 09 09 09 09 09 10 10 10 10 10 10 10 10
Wednesday
Thursday
-0,02
Friday
-0,03
-0,04
0,03
Sunday
0,02
Monday
0,01
Tuesday
0
Summer 09 Autumn 09 Winter 09
Spring 10 Summer 10
-0,01
Wednesday
-0,02
Thursday
-0,03
Friday
-0,04
0,08
MA6_additives model
0,06
0,04
0,02
0
Jun Jul Aug Sep Okt Nov Dez Jan Feb Mrz Apr Mai Jun Jul Aug
09 09 09 09 09 09 09 10 10 10 10 10 10 10 10
0,2
MA6_multiplikatives model
0,15
0,1
0,05
0
Jun Jul Aug Sep Okt Nov Dez Jan Feb Mrz Apr Mai Jun Jul Aug
09 09 09 09 09 09 09 10 10 10 10 10 10 10 10
35
4.2.2
Die additive Komponente muss jetzt gebildet werden. Mithilfe der Tabelle in der Abbildung 22 bestimmt man den theoretischen Prozess TeorDiffDiesel der saisonalen Komponente. In jeder Zelle befindet sich der durchschnittliche Wert der Differenz TS-MA6
fr jeden Wochentag fr jede Jahreszeit.
Sommer
Herbst
W inter F r
uhling
Sonntag
0, 02678 0, 02844 0, 01443 0, 02747
Montag
0, 01102
0, 02068 0, 01120
0, 00926
0, 00163
0, 00646 0, 00301 0, 00312
Dienstag
Mittwoch
0, 01283
0, 01217
0, 00926
0, 00592
0, 00058
0, 01357
0, 01141
0, 00678
Donnerstag
Freitag
0, 02480
0, 02154
0, 01583
0, 01734
Abbildung 22: Durchschnittswerte der Differenz TS-MA6
Anhand der Tabelle wird die Matrix Di j gebildet, wo die Werte i der Nummer der Zeile
(1 bis 6) und die Werte j der Nummer der Spalte (1 bis 4) entsprechen. Die saisonalen
Effekte werden in einem Modell mittels Dummy-Variablen beschrieben. Es werden die
Dummy-Variablen Aj T und BiT eingefhrt:
A1T
A2T
A3T
A4T
B1T
B2T
B3T
36
B4T
B5T
B6T
Auf diese Weise wird die saisonale Komponente St ermittelt, die mit der Formel 4.3
berechnet wird. Danach wird die saisonale Komponente St von der Originalzeitreihe
der Dieselpreise subtrahiert. Die neue Zeitreihe TS_Teordiffdiesel ist saisonbereinigt. Zu beachten ist, dass im Korrelogramm der ersten Differenzen der saisonbereinigten Zeitreihe TS_Teordiffdiesel in der Abbildung 23 keine Spitzen an den durch 6
teilbaren Verzgerungsstellen zu sehen sind. Das Ziel der saisonalen Zerlegung wurde
erreicht. Das ARMA-Modell wird im weiteren auf die neue saisonbereinigte Zeitreihe
angewendet.
St =
4 P
6
P
Bit Aj t Dij
j=1 i=1
37
(4.3)
Partial Correlation
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
AC
PAC
Q-Stat
Prob
-0.457
-0.021
0.017
0.043
-0.081
0.088
-0.076
0.025
-0.005
0.004
-0.017
0.051
-0.074
0.029
0.046
-0.029
-0.031
0.039
-0.070
0.128
-0.057
-0.035
0.002
0.035
-0.068
0.016
-0.005
0.020
-0.027
0.025
-0.034
0.027
-0.023
-0.030
0.056
-0.004
-0.457
-0.290
-0.175
-0.048
-0.103
0.013
-0.053
-0.035
-0.030
-0.027
-0.029
0.029
-0.043
-0.034
0.039
0.024
-0.016
0.002
-0.078
0.082
0.052
-0.006
-0.028
-0.010
-0.058
-0.083
-0.074
-0.025
-0.041
-0.027
-0.049
-0.034
-0.037
-0.092
-0.035
-0.010
80.523
80.686
80.803
81.526
84.091
87.146
89.398
89.634
89.642
89.647
89.760
90.783
92.962
93.294
94.151
94.479
94.854
95.457
97.450
104.12
105.42
105.91
105.92
106.43
108.36
108.46
108.47
108.65
108.96
109.21
109.70
110.01
110.23
110.61
111.93
111.93
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
38
Modellschtzung
5.1
Am Anfang wird das Modell fr den Spotpreis gebildet. Fr die Bildung der ARMAModelle werden die ersten und die zweiten Differenzen untersucht. Beide Zeitreihen
weisen die Stationaritt auf und sind fr die Modellbildung geeignet.
Abbildung 24: Histogramm der Verteilung der ersten Differenz der Spotpreise
Abbildung 25: Histogramm der Verteilung der zweiten Differenz der Spotpreise
Die Histogramme in den Abbildungen 24 und 25 zeigen die empirischen Verteilungen
der ersten und der zweiten Differenzen der Spotpreise. Man sieht, dass die Verteilungen
39
symmetrisch sind. Die beiden Verteilungen werden auf die Schiefe Skewness und die
Wlbung Kurtosis der Dichtefunktion geprft und mit der Schiefe und der Wlbung
der Normalverteilung verglichen. Es wird diejenige Zeitreihe fr die Modellbildung bevorzugt, deren Wlbung der Dichtefunktion einer Normalverteilung hnlicher ist und
deren Schiefe am geringsten ist (Weigend & Gershenfeld, 1994).
Die Wlbung 2 misst die Steilheit der Dichtedunktion. Die Normalverteilung hat
die Wlbung von 2 = 3. Die Schiefe v zeigt, ob die Verteilung rechts- oder linksschief ist. Die Normalverteilung weist eine Schiefe von Null auf. q
Die beiden Mazahlen
2
Pn
3
4
/N ,
werden nach den Formeln 2 =e
3 /e
und v=e
4 /e
mit
e =
i=1 Xi X
3
4
Pn
e4 = Xi X /N und X =
e3 = Xi X /N ,
i=1 Xi /N berechnet (Agung,
2010).
Skewness der zweiten Differenzen hat den Wert 0, 004380 und ist nher an 0 als
Skewness der ersten Differenzen mit dem Wert von 0, 079631. Kurtosis der zweiten Differenzen hat den Wert 3, 280693 und ist nher an 3 als Kurtosis der ersten
Differenzen mit dem Wert von 3, 332442. Aus diesem Grund wird die zweite Differenz
der Spotpreise fr den ARMA-Modellbau bevorzugt.
Coefficient
Std. Error
t-Statistic
Prob.
C
MA(1)
7.77E-06
-0.995859
3.00E-06
0.003449
2.594081
-288.7182
0.0099
0.0000
R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
F-statistic
Prob(F-statistic)
Inverted MA Roots
0.509672
0.508381
0.005810
0.012825
1425.603
394.9908
0.000000
-3.92E-09
0.008286
-7.453421
-7.432765
-7.445226
2.037616
1.00
Abbildung 26: Modellierung des MA-Prozesses fr die zweite Differenz der Spotpreise
Die zweite Differenz der Spotpreise wird mit dem ARMA-Modell (2,0,1) approximiert,
das heit mit dem MA-Prozess (p = 0). Aus der Abbildung 26 ist ersichtlich, dass der
MA-Prozess mit der Ordnung 1 fr die Beschreibung der zweiten Differenzen der Spotpreise signifikant ist, denn die p-Werte von MA(1) und C nah an 0 sind. Durbin-Watson-Stat
40
.2
.0
-.2
-.4
-.6
2
10
12
Partial autocorrelation
Actual
14
16
18
20
22
24
18
20
22
24
Theoretical
.2
.0
-.2
-.4
-.6
2
10
12
Actual
14
16
Theoretical
(5.1)
Mittels Integralrechung wird das Modell fr die Originalreihe der Spotpreise Xt gebildet:
Xt =X0 + t (X1 X0 ) +
t t1
P
P
( ( + + + ))
(5.2)
=1 =
Man setzt und in die Formel 5.2 ein und bekommt folgendes Modell:
Xt =X0 + t (X1 X0 ) +
t t1
P
P
( (0, 00000891 + 0, 995859 + + ))
=1 =
41
(5.3)
Dies ist das gesuchte Modell fr die Originalzeitreihe der Dieselpreise, das man fr
die Prognose verwenden kann. Wenn man ber die Beobachtungswerte der vorherigen
Perioden t=0,1,2 verfgt, kann man eine Vorhersage fr die Werte von Xt ab der Periode
t=5 machen.
5.2
Im Weiteren wird nach dem Modell fr die Kraftstoffpreise am Beispiel der Dieselpreise
gesucht. Fr die Modellbildung nimmt man die zweite Differenz der saisonbereinigten
Zeitreihe der Dieselpreise.
Dependent Variable: N_D2TEORDIESEL
Method: Least Squares
Date: 12/30/11 Time: 16:20
Sample (adjusted): 6/05/2009 8/20/2010
Included observations: 379 after adjustments
Convergence achieved after 15 iterations
MA Backcast: 6/04/2009
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
AR(1)
AR(2)
AR(3)
MA(1)
6.18E-05
-0.652585
-0.393598
-0.172214
-0.992617
5.34E-06
0.050772
0.057060
0.050773
0.003104
11.55575
-12.85317
-6.897959
-3.391823
-319.7419
0.0000
0.0000
0.0000
0.0008
0.0000
R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
F-statistic
Prob(F-statistic)
Inverted AR Roots
Inverted MA Roots
0.760435
0.757873
0.018800
0.132181
970.8537
296.7907
0.000000
-.06-.57i
.99
-7.63E-05
0.038206
-5.096853
-5.044907
-5.076239
2.016632
-.53
Abbildung 28: Modellierung des ARMA-Prozesses fr die zweite Differenz der Spotpreise
Die zweite Differenz der Dieselpreise wird mit dem ARMA-Modell (2,3,1) approximiert.
Aus der Abbildung 28 ist ersichtlich, dass das ARMA-Modell (2,3,1) fr die Beschreibung der zweiten Differenzen der Dieselpreise signifikant ist, denn die p-Werte von
AR(1), AR(2), AR(3), MA(1) und C nah an 0 sind. Durbin-Watson-Stat mit dem
Wert von 2, 016 ist nah an 2.
In der Abbildung 29 sieht man eine bereinstimmung zwischen dem Korrelogramm
fr ARMA-Modell(2,3,1) und dem Korrelogramm fr die zweiten Differenzen der Dieselpreise. Dies bedeutet, es liegt ein hoch signifikantes Modell vor.
42
(5.4)
Mittels Integralrechung wird das Modell fr die Originalreihe der Dieselpreise Xt gebildet:
Xt = X 4 +
t1
X
=5
((X4 X3 ) +
t1
X
( + 1 (X1 X 2 ) (1 2 )(X2 X3 )
(2 3 )(X3 X4 ) 3 (X4 X5 ) + 1 + ))
(5.5)
Man setzt , , 1 , 2 und 3 in die Formel 5.5 ein und bekommt folgendes Modell:
43
X t = X4 +
t1
t1
X
X
((X4 X3 ) +
(0, 0000000498 0, 652585(X1 X 2 )
=5
5.3
In der Abbildung 30 sind gleitende Durchschnitte MA6 der Kraftstoffpreise und die
Originalzeitreihe der Spotpreise dargestellt. Es ist deutlich eine Gesetzmigkeit zu
erkennen: wenn sich die Spotpreise ndern, dauert es ungefhr eine Woche, bis sich
die Kraftstoffpreise ndern. Dies wird in Acht genommen und im Weiteren untersucht.
Darber hinaus merkt man, dass die Erhhungsschritte schneller durchschlagen als die
Senkungssschritte.
0,65
0,6
0,55
0,5
Spot
MA6_Diesel
0,45
MA6_Benzin
MA6_Super
0,4
0,35
0,3
0,25
45
lag
lead
0
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
0.0415
-0.0450
0.0880
0.0821
0.1064
-0.0337
0.0327
-0.0515
0.0290
0.0218
-0.0826
0.0212
0.0206
-0.0162
0.0473
-0.0703
0.0021
0.0356
-0.0441
0.0843
-0.0033
-0.0712
0.0105
0.0907
-0.0748
-0.0366
-0.0256
-0.0443
0.0017
0.0172
-0.0302
-0.0042
-0.0111
0.0447
-0.0859
0.0904
-0.0582
0.0415
0.0269
-0.0425
-0.0044
0.0167
-0.0785
0.1155
-0.0347
-0.0460
0.0275
-0.0409
0.0527
0.0074
-0.0428
-0.0737
0.0325
0.0237
-0.0547
0.0985
-0.0483
-0.0244
-0.0021
0.0005
-0.0401
-0.0207
-0.0290
0.0793
-0.0733
0.0314
-0.0356
0.0049
0.0060
0.0369
-0.0512
0.0278
0.0375
0.0128
46
Coefficient
Std. Error
t-Statistic
Prob.
C
SPOTPREIS(-6)
0.037043
1.333410
0.010412
0.030138
3.557547
44.24308
0.0004
0.0000
R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
F-statistic
Prob(F-statistic)
0.838865
0.838437
0.021401
0.172212
917.7930
1957.450
0.000000
0.495140
0.053243
-4.845466
-4.824646
-4.837203
1.199158
Zusammenfassung
Viele empirische Untersuchungen basieren auf der Analyse von Zeitreihen. In dieser
Arbeit wurde das Verhalten von Spot- und Kraftstoffpreisen mittels Zeitreihenanalyse
untersucht. Die erhobenen Spot-, Diesel-, Benzin- sowie SuperPluspreise umfassen den
Zeitraum von 31.05.2009 bis 20.08.2010. Die Vorbereitung und die Bereinigung der Daten forderte einen wesentlichen Zeitaufwand. Die vorlufige Analyse hat ergeben, dass
alle drei Kraftstoffpreise den Verlauf voneinander wiederholen. Aus diesem Grund kann
fr eine zeitaufwendige Analyse eine Sorte der Kraftstoffe untersucht werden, die ein
gltiges Ergebnis fr alle Kraftstoffpreise liefert.
Am Anfang werden die Einheitswurzel-Tests, der erweiterte Dickey-Fuller-Test und
der Kwiatkowski-Phillips-Schmidt-Shin-Test auf die Spotpreise und die Kraftstoffpreise
am Beispiel der Benzinpreise angewendet. Die beiden Tests zeigen, dass die Originalzeitreihen der Benzin- und Spotpreise Nicht-Stationaritt aufweisen. Deswegen werden
die ersten Differenzen der Zeitreihen auf Stationaritt geprft. Die ersten Differenzen
der Zeitreihen weisen nach der Durchfhrung des erweiterten Dickey-Fuller-Tests und
des Kwiatkowski-Phillips-Schmidt-Shin-Tests Stationaritt auf. Diese Eigenschaft der
Zeitreihe wird einer aus statistischer Sicht guten Prognose vorausgesetzt.
Fr die Spot- und Kraftstoffpreise erfolgt eine weitere Analyse auf Periodizitt. Das
Korrelogramm fr die ersten Differenzen der Spotpreise weist keine klare Periodizitt
auf, da die Werte der Spitzen an den Verzgerungsstellen 48 und 75 in den Grenzen
des Standardfehlers sind. Dies lsst jegliche Periodizitt der Spotpreise bezweifeln. Die
Korrelogramme fr die ersten Differenzen aller Kraftstoffpreise zeigten dagegen groe
Spitzen an den durch 6 teilbaren Verzgerungsstellen. Dies deutete von einer wchentlichen Periodizitt. Genau dieses Problem hatte Enders (2010) im Zusammenhang mit
dem Dickey-Fuller Test angesprochen:Es gibt Zeitreihen, die erste Differenzierung und
auch solche, die eine saisonale Differenzierung bentigen. Man muss eine Methode entwickeln, die zwischen den beiden Arten von Einheitswurzelprozessen unterscheiden kann.
Wenn die Korrelogramme groe Spitzen aufweisen, die die kleinen dominieren knnen, knnen die Ergebnisse des Modells dadurch beeinflusst sein. Deswegen wird die
saisonale Zerlegung der Dieselpreise durchgefhrt. Im ersten Schritt werden gleitende Durchschnitte fr die Zeitreihe der Dieselpreise generiert und in beiden Modellen additivem und multiplikativem - getestet. Es wird nicht einfach zwischen den beiden
Modellen zu entscheiden. Zum Vorschein kommt das Problem des relativ kurzen Zeitraumes, der sich als nicht ausreichend fr eine detaillierte saisonale Analyse erweist.
Die beiden Modelle zeigen aber, dass der Freitagspreis im Wochenverlauf am hchsten
ist. Dies besttigt die erste Hypothese. Im Weiteren wird das additive Modell aufgrund
deutlicherer saisonaler Abhngigkeiten bevorzugt. Die saisonale Komponente wird mittels eines Modells mit Dummy-Variablen ermittelt und eliminiert. Damit ist eine weitere
Voraussetzung fr die Modellbildung erfllt. Die neue saisonbereinigte Zeitreihe wird
48
im Regressionsmodell angewendet.
Der Groteil der Arbeit liegt in der Modellbildung fr die Diesel- und Spotpreise mit
der Software Eviews. Es wird festgestellt, dass die Spotpreise durch den MA-Prozess
der 1. Ordnung und die Dieselpreise durch den ARMA-Prozess (2,3,1) gut beschrieben
werden. Mithilfe der Kreuzkorrelationsfunktion wird deutlich, dass das Verhalten der
Dieselpreise das Verhalten der Spotpreise wiederholt. Das Regressionsmodell der Dieselpreise und der Spotpreise mit einer vorgerckten Woche besttigt, dass die Spotpreise
auf die Kraftstoffpreise in einem Zeitabstand von ca. einer Woche durchschlagen. Die
zweite Hypothese wird besttigt.
49
Literaturverzeichnis
[1] Agung G (2010), Time series data analyses using EViews
[2] Assenmacher W (2002), Einfhrung in die konometrie, Oldenbourg Verlag
[3] Barsky R, Miron J (1989), The Seasonal Cycle and the Business Cycle, Journal
of Political Economy
[4] Bundeskartellamt (2011), Abschlussbericht zur Sektoruntersuchung der Kraftstoffe
[5] Dudenhfer F (2011), Lahme Erkenntnis vom Kartellamt, Wirtschaftswoche,
23.05.2011
[6] Enders W (2010), Applied econometric time series, New York
[7] Energieportal, http://www.energiesparer24.net/Sprit/Informationen/
[8] Fuller W (1976), Introduction to Statistical Time Series, New York
[9] Hackl P (2005), Einfhrung in die konometrie, Pearson Studium
[10] Herwatz H (1995), Analyse saisonaler Zeitreihen mit Hilfe periodischer Zeitreihenmodelle, Verlag Josef Eul
[11] Holding Company Finam, http://www.finam.ru/analysis/export
[12] Kendall M (1971), Time series, London
[13] Schlittgen R, Streitberg B (1989), Zeitreihenanalyse, Oldenbourg Verlag
50
[14] Schwert G (1989), Tests for Unit Roots: A Monte Carlo Investigation, Journal
of Business and Economic Statistics
[15] Shumway R, Stoffer D (2000), Time Series Analyses and Its Applications,
Springer Verlag
[16] Sims C (1974), Seasonality in Regression, Journal of the American Statistical
Association
[17] Weigend A, Gershenfeld N (1994), Time Series Prediction: Forecasting the
Future and Understanding the Past
[18] Wettbewerbskomission (2008), Gutachten der Wettbewerbskommission gem
16 Abs. 1 Wettbewerbsgesetz an den Bundesminister fr Wirtschaft und Arbeit,
Wien
51
Anhang
Augmented Dickey-Fuller Unit Root Test on BENZIN
t-Statistic
Prob.*
-2.853337
-3.988333
-3.424579
-3.135349
0.1795
Coefficient
Std. Error
t-Statistic
Prob.
BENZIN(-1)
D(BENZIN(-1))
D(BENZIN(-2))
D(BENZIN(-3))
D(BENZIN(-4))
D(BENZIN(-5))
D(BENZIN(-6))
D(BENZIN(-7))
D(BENZIN(-8))
D(BENZIN(-9))
D(BENZIN(-10))
D(BENZIN(-11))
D(BENZIN(-12))
C
@TREND(5/31/2009)
-0.166658
-0.511941
-0.370748
-0.282126
-0.189083
-0.186902
0.176904
0.087434
0.009391
-0.070570
-0.128564
-0.151965
0.183284
0.068249
6.76E-05
0.058408
0.075649
0.078806
0.080090
0.080454
0.080536
0.081901
0.082566
0.080994
0.078782
0.074320
0.068002
0.057812
0.023999
2.60E-05
-2.853337
-6.767320
-4.704568
-3.522616
-2.350197
-2.320723
2.159985
1.058961
0.115945
-0.895764
-1.729861
-2.234715
3.170350
2.843815
2.602199
0.0046
0.0000
0.0000
0.0005
0.0194
0.0210
0.0316
0.2905
0.9078
0.3711
0.0847
0.0262
0.0017
0.0048
0.0097
R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
F-statistic
Prob(F-statistic)
0.605944
0.586986
0.021156
0.130242
753.3825
31.96241
0.000000
0.000357
0.032919
-4.826029
-4.643500
-4.753030
2.002246
52
t-Statistic
Prob.*
-2.754462
-3.983684
-3.422321
-3.134016
0.2155
Coefficient
Std. Error
t-Statistic
Prob.
SPOT(-1)
C
@TREND(5/31/2009)
-0.044055
0.013135
1.09E-05
0.015994
0.004670
5.28E-06
-2.754462
2.812670
2.068606
0.0062
0.0052
0.0393
R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
F-statistic
Prob(F-statistic)
0.021645
0.016179
0.005733
0.011766
1352.591
3.960123
0.019902
7.96E-05
0.005780
-7.476956
-7.444638
-7.464107
2.019651
53
t-Statistic
Prob.*
-6.275240
-3.988333
-3.424579
-3.135349
0.0000
Coefficient
Std. Error
t-Statistic
Prob.
D(BENZIN(-1))
D(BENZIN(-1),2)
D(BENZIN(-2),2)
D(BENZIN(-3),2)
D(BENZIN(-4),2)
D(BENZIN(-5),2)
D(BENZIN(-6),2)
D(BENZIN(-7),2)
D(BENZIN(-8),2)
D(BENZIN(-9),2)
D(BENZIN(-10),2)
D(BENZIN(-11),2)
C
@TREND(5/31/2009)
-3.324279
1.670189
1.179644
0.794662
0.517020
0.252132
0.361390
0.377572
0.320216
0.192189
0.017734
-0.167411
0.000156
1.07E-06
0.529745
0.506793
0.478037
0.446459
0.412700
0.375951
0.332727
0.278797
0.224326
0.167812
0.112041
0.058243
0.002570
1.16E-05
-6.275240
3.295600
2.467684
1.779921
1.252776
0.670652
1.086143
1.354287
1.427461
1.145261
0.158280
-2.874348
0.060602
0.091851
0.0000
0.0011
0.0142
0.0761
0.2113
0.5030
0.2783
0.1767
0.1545
0.2530
0.8743
0.0043
0.9517
0.9269
R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
F-statistic
Prob(F-statistic)
0.862192
0.856056
0.021413
0.133886
749.1606
140.5297
0.000000
0.000110
0.056439
-4.804972
-4.634611
-4.736839
1.993761
Abbildung 36: Augmented Dickey-Fuller Unit Root Test fr den Benzinpreis. Erste
Differenz
54
t-Statistic
Prob.*
-18.96369
-3.984496
-3.422716
-3.134249
0.0000
Coefficient
Std. Error
t-Statistic
Prob.
D(SPOT(-1))
C
@TREND(5/31/2009)
-1.022017
0.000439
-1.99E-06
0.053893
0.000620
2.81E-06
-18.96369
0.709095
-0.710088
0.0000
0.4787
0.4781
R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
F-statistic
Prob(F-statistic)
0.508932
0.506102
0.005845
0.011854
1304.646
179.8116
0.000000
-3.17E-05
0.008317
-7.437977
-7.404909
-7.424815
2.016351
Abbildung 37: Augmented Dickey-Fuller Unit Root Test fr den Spotpreis. Erste Differenz
55
0.219196
0.216000
0.146000
0.119000
0.001105
0.007723
Coefficient
Std. Error
t-Statistic
Prob.
C
@TREND(5/31/2009)
0.416580
0.000365
0.003452
1.56E-05
120.6831
23.44339
0.0000
0.0000
R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
F-statistic
Prob(F-statistic)
0.595059
0.593977
0.033330
0.415462
746.3745
549.5923
0.000000
0.486757
0.052306
-3.959439
-3.938537
-3.951142
0.924051
56
0.050980
0.216000
0.146000
0.119000
0.001024
8.42E-05
Coefficient
Std. Error
t-Statistic
Prob.
C
@TREND(5/31/2009)
0.001011
-3.24E-06
0.003368
1.52E-05
0.300186
-0.213573
0.7642
0.8310
R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
F-statistic
Prob(F-statistic)
0.000124
-0.002593
0.032082
0.378755
748.6008
0.045613
0.830998
0.000386
0.032040
-4.035680
-4.014526
-4.027277
2.929652
57
0.166831
0.216000
0.146000
0.119000
0.000352
0.004176
Coefficient
Std. Error
t-Statistic
Prob.
C
@TREND(5/31/2009)
0.290016
0.000282
0.001936
8.76E-06
149.7707
32.21098
0.0000
0.0000
R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
F-statistic
Prob(F-statistic)
0.737131
0.736421
0.018822
0.131082
951.0089
1037.547
0.000000
0.343889
0.036662
-5.102198
-5.081129
-5.093831
0.094394
58
0.048129
0.216000
0.146000
0.119000
3.33E-05
2.86E-05
Coefficient
Std. Error
t-Statistic
Prob.
C
@TREND(5/31/2009)
0.000378
-1.56E-06
0.000604
2.73E-06
0.625741
-0.571999
0.5319
0.5677
R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
F-statistic
Prob(F-statistic)
0.000911
-0.001872
0.005785
0.012015
1348.805
0.327183
0.567681
7.96E-05
0.005780
-7.461525
-7.439980
-7.452959
2.066421
59
Hiermit versichere ich, dass ich die vorliegende Arbeit zum Thema Anwendung der Methoden und Modelle der Zeitreihenanalyse auf Spot- und Kraftstoffpreise selbstndig und nur unter
Verwendung der angegebenen Quellen und Hilfsmittel verfasst
habe. Die Prfungsordnung ist mir bekannt. Ich habe in meinem Studienfach bisher keine Bachelorarbeit eingereicht bzw.
sie nicht endgltig nicht bestanden.
Iryna Karpenka
8. Januar 2012
60