Sie sind auf Seite 1von 40

Zeitreihenanalyse 365

10

Zeitreihenanalyse
Schlüsselwörter

ARIMA-Modell Partielle Autokorrelation


Autokorrelation Prognosezeitraum
Beobachtungszeitraum Residualanalyse
BOX-JENKINS-Verfahren Sequenzdiagramm
Ex-post-Prognose Stochastischer Prozess
Gleitende Durchschnitte Trend-Saison-Modell
Korrelogramm Zeitreihe

Gegenstand. Die Zeitreihenanalyse hat die statistische Beschreibung und die


kurzfristige statistische Vorhersage von zeitlich geordneten Merkmalswerten ei-
nes oder mehrerer metrischer Merkmale mit Hilfe mathematisch-statistischer
Verfahren und Modelle zum Gegenstand. Im Unterschied zur Regressionsanaly-
se, die auf die Modellierung der statistischen Abhängigkeit eines zu erklärenden
Merkmals von einem oder mehreren erklärenden Merkmalen abstellt, steht in der
Zeitreihenanalyse die Modellierung der statistischen Abhängigkeit eines zeitlich
geordneten metrischen Merkmals von der Zeit und/oder von seinen vorhergehen-
den und/oder nachfolgenden Werten im Vordergrund.
Zielstellung. Das Ziel dieses Kapitels besteht darin, anhand praktischer Sach-
verhalte paradigmatisch zu zeigen, wie in SPSS unter Verwendung grafischer
und numerischer Verfahren die statistische Analyse von unterjährigen Zeitrei-
hendaten bewerkstelligt werden kann. Dabei stehen Bau und Interpretation so-
wohl von methodisch einfachen als auch von methodisch anspruchsvollen Zeit-
reihenmodellen im Vordergrund. In die paradigmatischen Betrachtungen einge-
schlossen ist die Verwendung der konstruierten Zeitreihenmodelle für kurzfristi-
ge statistische Vorausberechnungen. h

P. P. Eckstein, Statistik für Wirtschaftswissenschaftler, DOI 10.1007/978-3-658-10221-0_10,


© Springer Fachmedien Wiesbaden 2016
366 Zeitreihenanalyse

10.1 Zeitreihen
Motivation. In der empirischen Wirtschaftsforschung im Allgemeinen und in der
angewandten Statistik und Ökonometrie im Speziellen ist man vor allem zu
prognostischen Zwecken an der Betrachtung von Merkmalswerten eines metri-
schen Erhebungsmerkmals in seiner zeitlichen Entwicklung interessiert. Das
führt unmittelbar zum statistischen Begriff einer Zeitreihe.
Zeitreihe
Eine Zeitreihe {yt, t = 1,2,...,n} ist eine zeitlich geordnete Folge von Merkmals-
werten yt eines metrischen statistischen Erhebungsmerkmals Y eines sachlich
und örtlich wohl definierten Merkmalsträgers J.
Hinweise. Für das Verständnis des statistischen Konstrukts einer Zeitreihe er-
weisen sich die folgenden Hinweise als hilfreich: i) Merkmalsträger. Der
Merkmalsträger kann sowohl ein reales Objekt oder ein Vorgang als auch eine
statistische Gesamtheit von Merkmalsträgern sein. ii) Zeitvariable. Um eine Zeitreihe
{yt, t = 1,2,...,n}, die formal als eine Menge von Merkmalswerten yt dargestellt wird, ei-
ner statistischen Analyse zugänglich machen zu können, ist die Vereinbarung einer ge-
eigneten Zeitvariablen erforderlich, welche die Chronologie (grch.: chronos o Zeit + lo-
gos o Lehre), also die zeitlich logische Abfolge eines statistisch beobachteten Zustandes
oder Prozesses widerspiegelt. In der Zeitreihenanalyse hat sich die Bezeichnung ti
(i = 1,2,...,n) für eine Zeitvariable durchgesetzt (lat.: tempus bzw. engl.: time o Zeit). Da
in den folgenden Abschnitten ausschließlich Zeitreihen betrachtet werden, die auf einer
äquidistanten (lat.: aequus o gleich + distantia o Abstand) Zeitvariablen t beruhen, ge-
nügt es, die Zeitvariable t nur auf den natürlichen Zahlen variieren zu lassen, so dass
t = 1,2,...,n gilt. Dies hat den Vorteil, dass die Zeitvariable t gleichzeitig als Zeiger bzw.
als Index (lat.: index o Register, Verzeichnis) für die zeitlich geordneten Werte yt einer
Zeitreihe {yt, t = 1,2,...,n} und als äquidistante Zeitvariable t fungieren kann. iii) Index-
mengen. In der Zeitreihenanalyse bedient man sich zur Beschreibung des Zeithorizonts
einer äquidistanten Zeitreihe {yt, t = 1,2,...,n} in der Regel der folgenden Indexmengen:
Während die Indexmenge TB = {t | t = 1,2,...,n} den Beobachtungszeitraum von der Län-
ge n, die Indexmenge TP = {t | t = n + 1, n + 2,..., n + h} den Prognosezeitraum von der
Länge h kennzeichnet, bezeichnet man die Vereinigungsmenge TR = TB ‰ TP aus den
beiden disjunkten (lat.: disiunctio o Trennung) Zeiträumen TB und TP als den Relevanz-
zeitraum TR von der Länge n + h. iv) Stochastischer Prozess. In Anlehnung an die Be-
trachtungen im Kontext zur Stochastik (vgl. Kapitel 6) kann eine empirisch beobachtete
Zeitreihe {yt, t  T} auch als eine (mögliche) Realisierung eines stochastischen Prozesses
{Yt, t  T} gedeutet werden. Ein stochastischer Prozess wird dabei als eine Folge von
Zufallsgrößen Yt aufgefasst, die über einem (endlichen) Zeitbereich T definiert sind. Im
Zuge der Modellierung eines stochastischen Prozesses {Yt, t  T} in seinem zeitlichen
Verlauf wird unterstellt, dass er gleichsam in Vergangenheit, Gegenwart und Zukunft
existiert und nur zeitdiskret zu bestimmten äquidistanten Zeitpunkten t bzw. in bestimm-
ten äquidistanten Zeitintervallen t statistisch beobachtet wird, wobei der diskrete Zeitbe-
reich T = {t | t = 0, r1, r2,...} jetzt im Bereich der ganzen Zahlen variiert. i
Zeitreihenanalyse 367
Klassifikation. Ein Erhebungsmerkmal Y bzw. ein stochastischer Prozess Yt
kann im erfassungsstatischen Sinne hinsichtlich seiner Ausprägungen bzw. Rea-
lisationen yt zu bestimmten Zeitpunkten oder in bestimmten Zeitintervallen beo-
bachtet werden. Aus diesem Grunde unterscheidet man zwischen Zeitintervall-
reihen und Zeitpunktreihen.
Zeitintervallreihe
Eine Zeitreihe {yt, t = 1,2,...,n}, die den zahlenmäßigen Stand einer Erscheinung
oder eines Prozesses Y für bestimmte Zeitintervalle t angibt bzw. beschreibt,
heißt Zeitintervallreihe.
Hinweise. Für das Verständnis des statistischen Konstrukts einer Zeitintervall-
reihe erweisen sich die folgenden Hinweise als hilfreich: i) Charakteristikum.
Kennzeichnend für eine Zeitintervallreihe ist, dass sich die Zeitreihenwerte yt auf
eine Folge von (meist äquidistanten) Zeiträumen t beziehen. Dabei wird für jeden Zeit-
raum t ein Wert yt statistisch erfasst, der durch das Wirken des beobachteten Prozesses Y
während des gesamten Zeitraumes entstanden ist. Zwischenwerte sind nicht nur nicht er-
fasst, sie existieren per definitionem auch nicht. ii) Beispiele. Charakteristische ökonomi-
sche Zeitintervallreihen sind zum Beispiel der mengen- oder wertmäßige Monats-, Quar-
tals- oder Jahresumsatz eines Unternehmens. i

Zeitpunktreihe
Eine Zeitreihe {yt, t = 1,2,...,n}, die den zahlenmäßigen Stand einer Erscheinung
oder eines Prozesses Y zu bestimmten Zeitpunkten t angibt, heißt Zeitpunktreihe.
Hinweise. Für das Verständnis des statistischen Konstrukts einer Zeitpunktreihe
erweisen sich die folgenden Hinweise als hilfreich: i) Charakteristikum. Die
Wesenheit einer Zeitpunktreihe besteht darin, dass die Zeitreihenwerte yt für eine
genau festgelegte Folge von (meist äquidistanten) Erfassungsmomenten t statistisch erho-
ben werden. ii) Beispiele. Typische ökonomische Zeitpunktreihen sind zum Beispiel der
Bevölkerungsstand eines Territoriums jeweils am Jahresende, der Bargeldbestand einer
Kasse jeweils am Ende eines Geschäftstages, die Spareinlagenhöhe inländischer Privat-
personen jeweils am Jahresende oder der Kassakurs eines Wertpapiers am Ende eines
Börsentages. iii) Spezifikum. Zeitpunktreihen sind untrennbar verbunden mit der statisti-
schen Erhebung von Beständen über die Zeit hinweg. Während die Zeitreihenanalyse auf
die Analyse von Beständen in ihrer zeitlichen Entwicklung abstellt, hat die Bestandsana-
lyse die statistische Analyse eines Bestandes aus seinen Zugängen und seinen Abgängen
zum Gegenstand. i
Sequenzdiagramm. Der zeitliche Verlauf eines Zustandes oder Prozesses,
kann mit Hilfe eines Sequenzdiagramms grafisch dargestellt werden.
Sequenzdiagramm
Die grafische Darstellung von Zeitreihenwerten yt einer Zeitreihe {yt, t  TR} in
einem kartesischen Koordinatensystem mit Hilfe eines Polygonzuges bzw. einer
Trajektorie heißt Sequenzdiagramm.
368 Zeitreihenanalyse
Hinweise. Für die Konstruktion und Interpretation eines Sequenzdiagramms er-
weisen sich die folgenden Hinweise als hilfreich: i) Konstruktion. Ein Sequenz-
diagramm (lat.: sequentia o Aufeinanderfolge) ist ein Liniendiagramm in Gestalt
eines Polygonzuges (grch.: polys o viel + gonia o Winkel) bzw. einer Trajektorie (lat.:
traicere o hinübertragen), bei dem in der Regel auf der Abszisse die Zeitvariablenwerte t
und auf der Ordinate die Zeitreihenwerte yt einer Zeitreihe {yt, t = 1,2,...,n} abgetragen
werden. ii) Interpretation. Bei der Interpretation eines Sequenzdiagramms ist zu beach-
ten, dass die Zeitreihenwerte yt nur für die Zeitvariablenwerte t beobachtet wurden. Zwi-
schenwerte sind nicht definiert bzw. existieren nicht. Der Polygonzug bzw. die Trajekto-
rie zwischen den Punkten {(t, yt), t = 1,2,...,n} ist streng genommen nicht zulässig und
dient lediglich einem besseren Sichtbarmachen des zeitlichen Verlaufes eines beobachte-
ten und in einer Zeitreihe {yt, t = 1,2,...,n} erfassten Prozesses. i
Beispiel 10.1-1: Zeitintervallreihe
Motivation. Die SPSS Datendatei Flug.sav beinhaltet die Zeitreihe, welche die
Anzahl Y der FLUGgäste (Angaben in 1000 Personen) beschreibt, die jeweils im
Verlaufe eines Monats auf den Berliner Flughäfen statistisch erfasst wurde. Die
Zeitreihe {yt, t = 1,2,...,n} ist ihrem Wesen nach eine Zeitintervallreihe. Dies er-
klärt sich sachlogisch daraus, dass die Anzahl Y der Fluggäste aus statistisch-
methodischer Sicht ein ökonomischer Prozess ist, der nicht zu einem bestimmten
Zeitpunkt t, sondern nur in einem bestimmten Zeitraum t statistisch erfasst wer-
den kann. Da im konkreten Fall die Anzahl Y der Fluggäste auf den Berliner
Flughäfen für den Beobachtungszeitraum von Januar 2009 bis Dezember 2014
chronologisch erfasst wurde, hat man wegen a = 6 „vollständigen“ Wirtschafts-
jahren (lat.: anus o Jahr) mit jeweils m = 12 Monaten (lat.: mensis o Monat)
letztlich eine äquidistante (lat.: aequus o gleich + distantia o Abstand) und zu-
gleich unterjährige Zeitintervallreihe {yt, t = 1,2,...,n} mit n = 6 u 12 = 72 monat-
lichen Zeitreihenwerten yt verfügbar.
Zeitvariable. Für eine statistische Analyse, Modellierung und Prognose der
monatlichen Fluggästezahlen erweist es sich als erforderlich, eine geeignete
Zeitvariable t zu vereinbaren. Da es sich bei den Fluggästezahlen um eine äqui-
distante Zeitintervallreihe handelt, kann man sich in Anlehnung an das Beispiel
4.6.4-2 zum Beispiel mit Hilfe der SPSS Funktion $CASENUM eine äquidistante
Zeitvariable t erzeugen, die für den ersten Zeitreihenwert y1 = 1330 (1000 Flug-
gäste) den Wert t = 1 und in logischer Konsequenz für den letzten statistisch er-
fassten Zeitreihenwert y72 = 2058 (1000 Fluggäste) den Wert t = 72 annimmt.
Gleichwohl diese Form der Zeitvariablenvereinbarung leicht nachvollziehbar ist,
erweist sie sich vor allem bei der statistischen Analyse und Modellierung von
unterjährigen Zeitreihendaten als nicht ausreichend.
Datum definieren. Sehr hilfreich und nützlich erweisen sich Zeitvariablen,
die man in SPSS via Sequenz 10.1-1 aus einer breiten Palette von Variablenkon-
strukten erzeugen und für eine Zeitreihenanalyse verwenden kann.
Zeitreihenanalyse 369
Sequenz 10.1-1: Datum definieren
Daten
Datum definieren o Abbildung 10.1-1
Abbildung 10.1-1: SPSS Dateneditor mit Dialogfeld Datum definieren

Aufgrund der Vereinbarungen, die gemäß Abbildung 10.1-1 im Dialogfeld Da-


tum definieren getroffenen wurden, sind in die SPSS Arbeitsdatei automatisch
die Zeitvariablen YEAR_, MONTH_ und DATE_ zur Beschreibung der unterjäh-
rigen Zeitintervallreihe der Fluggästezahlen eingefügt worden. Beachtenswert ist
dabei, dass die in die Arbeitsdatei automatisch eingefügten Zeitvariablen durch
einen „Unterstrich“ gekennzeichnet sind und zur Vermeidung von Perturbationen
(lat.: perturbatio o Verwirrung, Störung) ihre „SPSS interne“ Kennzeichnung
nicht verändert werden sollte.
Beobachtungszeitraum. Auf der Grundlage der vereinbarten äquidistanten
Zeitvariablen t, die im SPSS Dateneditor innerhalb der Abbildung 10.1-1 unter
dem Namen Zeit firmiert, ist man nunmehr in der Lage, den Beobachtungszeit-
raum TB der Anzahl Y der Fluggäste von der Länge n = 72 Monate mit Hilfe der
folgenden Indexmengen zu beschreiben:
TB = {t | t = 1,2,...,72} = {t* | t* = Jan 2009, Feb 2009,..., Dez 2014}.
Dabei wurden der Einfachheit halber die SPSS Variablen Zeit und DATE_ durch
die Bezeichnungen t bzw. t* ersetzt.
Sequenzdiagramm. Im Vorfeld einer Zeitreihenanalyse erweist es sich aus
Anschaulichkeitsgründen stets als vorteilhaft, den zeitlichen Verlauf eines zu
analysierenden Prozesses via Sequenz 10.1-2 in einem Sequenzdiagramm gra-
fisch darzustellen.
Sequenz 10.1-2: Sequenzdiagramm
Analysieren
Vorhersage
Sequenzdiagramme... o Abbildung 10.1-2
370 Zeitreihenanalyse
Abbildung 10.1-2: SPSS Dateneditor mit Dialogfeld Sequenzdiagramme

Die Abbildung 10.1-3 beinhaltet das Sequenzdiagramm der monatlichen Flug-


gästezahlen im Beobachtungszeitraum TB in Gestalt eines sogenannten Polygon-
zuges (grch.: polys o viel + gonia o Winkel) und einer sogenannten Trajektorie
(lat.: traicere o hinübertragen).
Abbildung 10.1-3: Sequenzdiagramm als Polygonzug und als Trajektorie

Aus den beiden inhaltsgleichen, aber statistisch-methodisch wohl zu unterschei-


denden Sequenzdiagrammen wird ersichtlich, dass die äquidistante Zeitintervall-
reihe {yt, t = 1,2,...,72} der Fluggästezahlen yt im Beobachtungszeitraum TB zum
einen durch eine steigende Tendenz und zum anderen durch ausgeprägte und pe-
riodisch wiederkehrende Schwankungen mit nahezu gleichen Amplituden ge-
kennzeichnet ist, die es im Zuge einer Zeitreihenanalyse modellhaft zu beschrei-
ben gilt. Dabei ist zu beachten, dass die Zeitreihenwerte yt nur für die Zeitvariab-
lenwerte t statistisch beobachtet und in Gestalt eines Punktes grafisch dargestellt
wurden. Zwischenwerte sind nicht definiert bzw. existieren nicht. Sowohl der
„gestrichelte“ Polygonzug als auch die „interpolierte“ Trajektorie zwischen den
Punkten {(t, yt), t = 1,2,...,72} dienen lediglich einer besseren Sichtbarmachung
des zeitlichen Verlaufs der beobachteten Fluggästezahlen yt mit t  TB. h
Zeitreihenanalyse 371
Beispiel 10.1-2: Zeitpunktreihe
Motivation. Die SPSS Datendatei Daimler.sav beinhaltet eine Zeitreihe, welche
für das Wirtschaftsjahr 2014 die an der Frankfurter Börse börsentäglich erfassten
Schlusskurse der Aktie der Daimler Aktiengesellschaft (Angaben in Punkten)
zum Inhalt hat. Die n = 246 empirisch erfassten Schlusskurse yt bilden im statis-
tischen Sinne eine Zeitpunktreihe {yt, t = 1,2,...,n}. Dies erklärt sich sachlogisch
daraus, dass der börsentägliche Schlusskurs Y einer Aktei aus statistisch-
methodischer Sicht ein ökonomischer Indikator ist, der stets nur zu einem be-
stimmten Zeitpunkt t statistisch erfasst werden kann. Im konkreten Fall wurde
der Kurs der Daimler-Aktie jeweils zum Ende eines Börsentages notiert.
Beobachtungszeitraum. Der Beobachtungszeitraum der Zeitpunktreihe {yt,
t = 1,2,...,n} der Schlusskurse der Daimler-Aktie von der Länge n = 246 Börsen-
tage kann im Sinne einer äquidistanten Fünf-Arbeitstage-Chronologie mit Hilfe
der folgenden Indexmengen beschrieben werden:
TB = {t | t = 1,2,...,246} = {t* | t* = 6. Januar 2014,…, 19. Dezember 2014}.
Die SPSS Variablen Zeit und DATUM_ durch die Bezeichnungen t bzw. t* ersetzt.
Sequenzdiagramm. Die Abbildung 10.1-4 beinhaltet die beiden jeweils via
Sequenz 10.1-2 erstellten Sequenzdiagramme für die Zeitpunktreihe der Schluss-
kurse der Daimler-Aktie, die einerseits auf der Basis der originären und anderer-
seits auf der Basis der logarithmierten Schlusskurse erstellt wurden.
Abbildung 10.1-4: Sequenzdiagramm, originäre und logarithmierte Werte

In der technischen Wertpapieranalyse benutzt man in der Regel nicht die originä-
ren, sondern die logarithmierten Schlusskurse eines Wertpapiers. Ungeachtet die-
ses später noch zu motivierenden und zu erklärenden Spezifikums wird aus den
beiden Sequenzdiagrammen innerhalb der Abbildung 10.1-4 ersichtlich, dass im
Beobachtungszeitraum TB die börsentäglichen Schlusskurse yt der Daimler-Aktie
durch einen volatilen (lat.: volare o beweglich) Verlauf gekennzeichnet sind,
der (etwa im Unterschied zur Zeitreihe der Fluggästezahlen in der Abbildung
10.1-3) augenscheinlich nicht saisonal bedingt ist. h
372 Zeitreihenanalyse

10.2 Gleitende Durchschnitte


Motivation. Gleitende Durchschnitte gehören zu den einfachen und in praxi
zweifelsfrei häufig applizierten Verfahren im Kontext einer Zeitreihenanalyse.
Ihre Zweckbestimmung besteht in der Sichtbarmachung der Grundrichtung einer
volatilen (lat.: volare o beweglich) Zeitreihe, die mehr oder weniger starken
Schwankungen unterliegt. Die Grundidee der Methode der gleitenden Durch-
schnitte besteht darin, eine volatile Zeitreihe {yt, t = 1,2,...,n} mittels einer einfa-
chen und schrittweise über die beobachteten Zeitreihenwerte yt hinweg „gleiten-
den“ Durchschnittsbildung derart zu „glätten“, dass die Grundrichtung der Zeit-
reihe „leichter und besser“ erkennbar wird. In der Zeitreihenanalyse bedient man
sich verschiedener Arten von gleitenden Durchschnitten, wozu auch die soge-
nannten zentrierten gleitenden Durchschnitte (engl.: moving averages) zählen,
die wie folgt skizziert werden können:
Gleitende Durchschnitte
Ist {yt, t = 1,2,...,n} eine äquidistante Zeitreihe und k t 0 eine ganzzahlige Kon-
stante, dann heißen die (n  2˜k) arithmetischen Mittel
1 k
yj ˜ ¦ y i  j mit j k  1, k  2,..., n  k
r i k
bzw. die (n  2˜k + 1) arithmetischen Mittel
1 k 1
yj ˜ ¦ y i j mit j k  1, k  2,..., n  k  1
r i k
aus jeweils r chronologischen Zeitreihenwerten yt gleitende Durchschnitte zum
ungeraden Stützbereich r = 2˜k + 1 bzw. zum geraden Stützbereich r = 2˜k.
Hinweise. Für die Berechnung und Nutzung von gleitenden Durchschnitten er-
weisen sich die folgenden Hinweise als hilfreich: i) Wortursprung. Die Be-
zeichnung „gleitender Durchschnitt“ resultiert aus dem Umstand, dass man „glei-
tend“ über eine originäre Zeitreihe {yt, t = 1,2,...,n} hinweg jeweils aus r < n Zeitreihen-
werten yt einen Durchschnitt berechnet. ii) Saisonbereinigung. Wählt man für eine vola-
tile und saisonal bedingte Zeitreihe {yt, t = 1,2,...,n} den Stützbereich r < so, dass er der
„Länge der Saison“ (frz.: Saison o Jahreszeit) entspricht, dann werden durch die gleiten-
den Durchschnitte die Saisonschwankungen eliminiert. Die Verwendung eines geradzah-
ligen Stützbereiches r ist vor allem dann vorteilhaft, wenn eine Zeitreihe mit „geradzahli-
gen“ Saisonkomponenten (etwa vier Quartale oder zwölf Monate) saisonbereinigt werden
soll. iii) Stützbereich. Die ganzzahlige Konstante k heißt Stützbereichskonstante. Für
k = 0 stimmen die n gleitenden Durchschnitte der Ordnung t mit den originären Zeitrei-
henwerten yt überein. Ist die Länge n der Zeitreihe ungerade und gilt k = (n  1) / 2, dann
ergibt sich nur ein gleitender Durchschnitt, der mit dem arithmetischen Mittel aus allen
Zeitreihenwerten yt übereinstimmt. Die Wahl der Stützbereichskonstante k hängt vom
Umfang n und von der Beschaffenheit einer zu glättenden Zeitreihe ab. Je kleiner (grö-
ßer) die Stützbereichskonstante k ist, desto kleiner (größer) ist der Stützbereich r für die
Zeitreihenanalyse 373
Berechnung der gleitenden Durchschnitte. Je kleiner (größer) der Stützbereich r ist, umso
geringer (stärker) ist die Glättung einer Zeitreihe. iv) Funktionen. In SPSS werden via
Sequenz 10.2-1 zwei Funktionen zur Berechnung von gleitenden Durchschnitten bereit-
gestellt: die sogenannte MA-Funktion (engl.: moving average o gleitender Durchschnitt)
zur Berechnung von „zentrierten gleitenden Durchschnitten“ und die sogenannte PMA-
Funktion (engl.: prior moving average o vorgezogener gleitender Durchschnitt) zur Be-
rechnung von „zurückgreifenden gleitenden Durchschnitten“. Der Unterschied zwischen
den beiden SPSS Funktionen liegt nicht in der Art und Weise der gleitenden Durch-
schnittsberechnung, sondern lediglich in der grafischen Projektion des jeweiligen Durch-
schnittswertes auf der Zeitachse. Während bei der MA-Funktion ein Durchschnittswert in
seiner grafischen Projektion in der „zeitlichen Mitte“ abgetragen wird, erfolgt die zeitli-
che Projektion eines gleitenden Durchschnitts bei der PMA-Funktion „zeitlich vorgezo-
gen“ (oder je nach Blickrichtung „zeitlich zurückgreifend“) des jeweils letzten und zu-
gleich „aktuellen“ Wertes einer Durchschnittsberechnung. v) Vorteile und Nachteile. Ein
Vorteil der Methode der gleitenden Durchschnitte liegt in ihrer Einfachheit, Praktikabili-
tät und Wirksamkeit bei der Aufdeckung der Grundtendenz einer volatilen bzw. saisonal
bedingten Zeitreihe. Ein Nachteil besteht darin, dass eine geglättete Zeitreihe auf der Ba-
sis einer Stützbereichskonstante k nur noch aus (n  2 u k) Zeitreihenwerten besteht, wo-
bei jeweils am Anfang und am Ende k geglättete Werte entfallen. i
Beispiel 10.2-1: Gleitende Durchschnitte für Fluggästezahlen
Motivation. In Weiterführung des Beispiels 10.1-1 und unter Verwendung der
SPSS Datendatei Flug.sav soll mit Hilfe von gleitenden Durchschnitten die Zeit-
intervallreihe {yt, t = 1,2,...,72} der monatlichen Fluggästezahlen yt auf den Ber-
liner Flughäfen derart geglättet werden, dass die Entwicklungsrichtung der Flug-
gästezahlen im Beobachtungszeitraum TB augenscheinlicher wird. Da es sich bei
den Fluggästezahlen yt um Monatsdaten mit offensichtlich jährlich wiederkeh-
renden Schwankungen handelt, soll die Glättung der „unterjährigen“ Zeitinter-
vallreihe mit Hilfe zentrierter gleitender Durchschnitte auf der Basis eines Stütz-
bereiches von r = 7 Monaten und von r = 12 Monaten praktiziert werden.
Sequenz. Eine Zeitreihenglättung mit Hilfe von gleitenden Durchschnitten
kann via Sequenz 10.2-1 bewerkstelligt werden. Im Zuge der im Dialogfeld Zeit-
reihen erstellen innerhalb der Abbildung 10.2-1 getroffenen Vereinbarungen
wird in die Arbeitsdatei automatisch eine Variable M(oving)A(verage)7 einge-
fügt, die im konkreten Fall wegen
r = 2 u k + 1 = 7 und k = (7  1) / 2 = 3 sowie
n  (2 u k) = 72 – (2 u 3) = 66
zentrierte gleitende Durchschnitte auf der Basis eines Stützbereiches von r = 7
Monaten beinhaltet. Analog wird durch die SPSS Zeitreihenfunktion zur Gene-
rierung von gleitenden Durchschnitten in die Arbeitsdatei automatisch eine nu-
merische Variable MA12 eingefügt, die im konkreten Fall
r = 2 u k = 12 und k = 12 / 2 = 6 sowie n  (2 u k) = 72 – (2 u 6) = 60
zentrierte gleitende Durchschnitte zum Stützbereich r = 12 Monate beinhaltet.
374 Zeitreihenanalyse
Sequenz 10.2-1: Gleitende Durchschnitte
Transformieren
Zeitreihen erstellen... o Abbildung 10.2-1
Abbildung 10.2-1: SPSS Dateneditor mit Dialogfeld Zeitreihen erstellen

Sequenzdiagramm. Die Abbildung 10.2-2 beinhaltet die Sequenzdiagramme


der beobachteten monatlichen Fluggästezahlen yt mit den jeweils daraus entlehn-
ten zentrierten gleitenden Durchschnitten MA auf der Basis einer Spanne bzw.
eines Stützbereiches von r = 7 Monaten bzw. von r = 12 Monaten, die jeweils
durch eine „fett“ gezeichnete Trajektorie kenntlich gemacht sind.
Abbildung 10.2-2: Sequenzdiagramme mit gleitenden Durchschnitten

MA7 MA12

Mit der Hilfe der gleitenden Durchschnitte werden die statistisch beobachteten
monatlichen Schwankungen der Fluggästezahlen in einem augenscheinlichen
Maße „gedämpft“ und „geglättet“. Mehr noch: Während die zentrierten gleiten-
den Durchschnitte zum Stützbereich von r = 7 Monaten (MA7) einen ansteigen-
den und sinusförmigen Verlauf indizieren, werden durch die zentrierten gleiten-
den Durchschnitte zum Stützbereich von r = 12 Monaten (MA12), der mit der
Periodizität der Fluggästezahlen von m = 12 Monaten identisch ist, die saisona-
Zeitreihenanalyse 375
len Schwankungen eliminiert, so dass die linear ansteigende Entwicklungsrich-
tung der monatlichen Fluggästezahlen im Beobachtungszeitraum TB noch besser
sichtbar wird.
Analysebefunde. Bemerkenswert sind im konkreten Fall zwei elementare und
zugleich augenscheinliche Analysebefunde: Zum einen sind die Fluggästezahlen
im Beobachtungszeitraum TB durch eine steigende Tendenz gekennzeichnet, die
offensichtlich hinreichend genau durch eine Gerade bzw. durch eine lineare
Trendfunktion beschrieben werden kann. Zum anderen wird dieser lineare Trend
in den monatlichen Fluggästezahlen noch durch einen volatilen, sinusförmigen
und offensichtlich saisonal bedingten Verlauf überlagert und getragen. Diese
beiden allein mittels der gleitenden Durchschnittstrajektorien augenscheinlichen
Phänomene gilt es bei der Konstruktion eines geeigneten Zeitreihenmodells zur
kurzfristigen statistischen Vorausberechnung der monatlichen Fluggästezahlen
zu berücksichtigen. Die Konstruktion eines geeigneten Trend-Saison-Modells ist
ein spezieller Gegenstand des Abschnitts 10-3. h
Beispiel 10.2-2: Gleitende Durchschnitte für DAX-Schlusskurswerte
Motivation. In Weiterführung des Beispiels 10.1-2 soll unter Verwendung der
SPSS Datendatei Daimler.sav mit Hilfe von gleitenden Durchschnitten die Zeit-
punktreihe {yt, t = 1,2,...,n} der n = 246 im Wirtschaftsjahr 2014 börsentäglich
erfassten Schlusskurse yt der Aktie der Daimler AG derart geglättet werden, dass
die Entwicklungsrichtung der Schlusskurse im Beobachtungszeitraum
TB = {t | t = 1,2,...,246} = {t* | t* = 6. Januar 2014,…, 19. Dezember 2014}
augenscheinlicher wird.
Abbildung 10.2-3: SPSS Dateneditor und Dialogfeld Zeitreihen erstellen

Einzig und allein aus didaktisch-methodischen und Vergleichbarkeitsgründen


soll analog zur Abbildung 10.2-3 die Glättung der Zeitpunktreihe der Schlusskur-
se der Daimler-Aktie sowohl mit Hilfe der MA-Funktion als auch der PMA-
376 Zeitreihenanalyse
Funktion zur Erzeugung sogenannter zentrierter bzw. zurückgreifender gleitender
Durchschnitte auf der Basis eines Stützbereiches von r = 50 Börsentagen prakti-
ziert und paradigmatisch skizziert werden.
Sequenzdiagramme. In der Abbildung 10.2-4 sind die beiden Sequenzdia-
gramme für die logarithmierten Schlusskurse skizziert, die jeweils durch die „ge-
stutzte“ Zeitreihe der sogenannten zentrierten (MA) bzw. zurückgreifenden
(PMA) gleitenden Durchschnitte ergänzt wurden.
Abbildung 10.2-4: Sequenzdiagramme mit gleitenden Durchschnitten

PMA

MA

Im konkreten Fall ist es leicht nachvollziehbar, dass die Trajektorien der „ge-
stutzten“ Zeitreihen der gleitenden Durchschnitte MA und PMA zum Stützbe-
reich von 50 Börsentagen wegen
r = 2 u k = 50 und k = 50 / 2 = 25 sowie
n  (2 u k) = 246 – (2 u 25) = 196
jeweils aus 196 gleitenden Durchschnittswerten bestehen, die lediglich „zeitlich
verschoben“ im jeweiligen Sequenzdiagramm abgebildet werden. Während zum
Beispiel der gleitende Durchschnitt der Ordnung i = 221, der aus den „letzten“ 50
beobachteten Schlusskursen {yt, t = 171, 172,…,221} berechnet wurde und ge-
mäß Abbildung 10.2-3 einen Wert von MA221 # 63,41 Punkten lieferte, als loga-
rithmierter zentrierter gleitender Durchschnitt ln(63,41) # 4.1496 im linken Se-
quenzdiagramm in der „zeitlichen Mitte“ zum Zeitvariablenwert
t = 196 + 50 / 2 = 221
abgebildet wurde, erfolgte seine grafische Darstellung im rechten Sequenzdia-
gramm als logarithmierter zurückgreifender gleitender Durchschnitt PMA „zeit-
verschoben“ zum Zeitvariablenwert t = 196 + 50 = 246.
Kernaussage. Im der technischen Wertpapieranalyse würde man den Schluss-
kursen der Daimler-Aktie im Beobachtungszeitraum TB insgesamt eine Hausse
(frz.: hausse o Anstieg) zuschreiben, die zwischenzeitlich durch eine Baisse
(frz.: baisse o Rückfall) überlagert wird und sowohl im MA- als auch im PMA-
gestützten Chart (engl.: chart o Zeichnung) bildhaft untermauert wird. h
Zeitreihenanalyse 377

10.3 Trend-Saison-Modelle
Motivation. Die in diesem Abschnitt skizzierten Trend-Saison-Modelle stellen
auf die statistische Beschreibung und Modellierung der Trendkomponente yt*
und/oder der Saisonkomponente st* einer äquidistanten Zeitreihe {yt, t = 1,2,...,n}
ab. In praxi häufig konstruierte und applizierte Trend-Saison-Modelle sind das
additive und das multiplikative Trend-Saison-Modell. Beide Modelle finden vor
allem wegen ihrer Einfachheit, Praktikabilität und Leistungsfähigkeit bei der
kurzfristigen statistischen Vorausberechnung von trendbehafteten und/oder sai-
sonal bedingten Prozessen eine breite Anwendung.
Trend-Saison-Modell
Ist {yt, t = 1,2,...,n} eine äquidistante Zeitreihe, die einen trendbehafteten und/
oder einen saisonal bedingten Prozess zahlenmäßig beschreibt, dann kennzeich-
nen die Modelle yt = yt** + ut = yt* + st* + ut bzw. yt = yt** + ut = yt* u st* + ut
ein additives bzw. ein multiplikatives Trend-Saison-Modell zur statistischen Pro-
zessbeschreibung.
Hinweise. Für die Charakteristik und für die Konstruktion eines additiven bzw.
multiplikativen Trend-Saison-Modells erweisen sich die folgenden Hinweise als
hilfreich und nützlich: i) Additives Modell. Bei einem additiven Modell wird un-
terstellt, dass die Zeitreihenwerte yt durch drei sich in ihrer Wirkung additiv überlagernde
Komponenten beschrieben werden können: durch eine Trendkomponente in Gestalt eines
Trendmodells yt* (engl.: trend o Richtung), durch eine Saisonkomponente st* (frz.: sai-
son o Jahreszeit) und durch eine Residualkomponente ut (lat.: residuum o Rest). In die-
se Betrachtung sind wegen yt = yt* + ut bzw. yt = st* + ut die Spezialfälle eines Trend-
bzw. eines Saisonmodells eingeschlossen. yt** = yt* + st* bezeichnet den Modellwert
zum Zeitpunkt t. Charakteristisch für die Saisonkomponente st* in einem additiven
Trend-Saison-Modell ist die Existenz periodisch wiederkehrender und in ihrem Ausmaß
mehr oder weniger gleichbleibender bzw. homoskedastischer (grch.: homos o gleich +
skedastikos o abweichen, streuen) Schwankungen der Zeitreihenwerte yt um die Werte
yt* des Trendmodells. ii) Multiplikatives Modell. In der Zeitreihenanalyse werden ver-
schiedene Versionen eines multiplikativen Trend-Saison-Modells appliziert. Für die wei-
teren Betrachtungen wird die multiplikative Verknüpfung yt* u st* einer Trendkomponen-
te in Gestalt einer Trendfunktion yt* mit einer Saisonkomponente st* und deren additive
Überlagerung durch eine Residualkomponente ut angenommen. yt** = yt* u st* bezeich-
net den Modellwert zum Zeitpunkt t. Charakteristisch für die Saisonkomponente st* in ei-
nem multiplikativen Modell ist die Existenz periodisch wiederkehrender und sich in ih-
rem Ausmaß mehr oder weniger proportional zum Verlauf des Trendmodells yt* verhal-
tender saisonaler bzw. heteroskedastischer (grch.: heteros o anders, verschieden + ske-
dastikos o abweichen, streuen) Schwankungen st* in den Zeitreihenwerten yt. iii) Bei-
spiele. Während die Trend-Saison-Modelle in den Beispielen 10.3-1 und 10.3-2 „per
Hand gebastelt“ wurden, können in SPSS Zeitreihen auch mittels des sogenannten Expert
Modeler auf automatisiertem und heuristischem (grch.: heuriskein o finden) Wege ana-
lysiert und modelliert werden. i
378 Zeitreihenanalyse
Beispiel 10.3-1: Additives Trend-Saison-Modell
Motivation. Die äquidistante Zeitintervallreihe der monatlichen Fluggästezahlen
aus der SPSS Datendatei Flug.sav soll für den Beobachtungszeitraum
TB = {t | t = 1,2,...,72} = {t* | t* = Jan 2009,..., Dez 2014}
mit Hilfe eines geeigneten Trend-Saison-Modells beschrieben werden. Mit Hilfe
des Modells gilt es, die monatlichen Fluggästezahlen für das Jahr 2015 zu prog-
nostizieren und dabei das sogenannte ex-post-Prognosekonzept zu skizzieren
(vgl. Beispiel 10.3-3).
Trendkomponente. Im Beispiel 10.2-1 wurde mit Hilfe der Methode der glei-
tenden Durchschnitte für die Zeitreihe des monatlichen Fluggästeaufkommens
auf den Berliner Flughäfen ein linear steigender Trend diagnostiziert. Die ge-
schätzten Parameterwerte und der Graph des linearen Trendmodells
y*(t) = 1677,522 + 10,067 u t
zur Beschreibung der Entwicklungsrichtung der monatlichen Fluggästezahlen yt
in Abhängigkeit von der Zeitvariablen t  TB sind gemeinsam mit dem SPSS
Dateneditor, dem Sequenzdiagramm und dem Ergebnisprotokoll in der Abbil-
dung 10.3-2 dargestellt.
Abbildung 10.3-2: SPSS Dateneditor mit Sequenzdiagramm und Protokoll

Aus statistisch-methodischer Sicht und mit Bezug auf die paradigmatischen Be-
trachtungen im Kontext der Abschnitte 9.1 und 9.3 kann das lineare Trendmodell
y*(t) = 1677,522 + 10,067 u t
als eine inhomogene bivariate lineare Kleinste-Quadrate-Regressionsfunktion der
monatlichen Fluggästezahlen yt über der Zeitvariablen t  TB gedeutet werden.
Im konkreten Fall wurden die erforderlichen Kennzahlen für das lineare Trend-
modell via Analysieren, Regression, Kurvenanpassung in der Rubrik Modelle
über die Option linear angefordert.
Parameterinterpretation. Die mit Hilfe der Methode der kleinsten Quadrate-
summe aus den beobachteten Fluggästezahlen yt geschätzten und in der Abbil-
Zeitreihenanalyse 379
dung 10.3-2 in der Rubrik Parameterschätzer aufgelisteten Trendparameter kön-
nen wie folgt interpretiert werden: Unter Verwendung der inhomogenen linearen
Trendfunktion y*(t) = 1677,522 + 10,067 u t mit t  TB hätte man wegen t = 0
das Fluggästeaufkommen im Dezember 2008 wegen
y*(0) = 1677,522 + 10,067 u 0 = 1677,522
auf 1,678 Millionen Fluggäste geschätzt. Unter sonst gleichen Bedingungen ist
im Beobachtungszeitraum TB wegen
dy* / dt = 10,067 (1000 Fluggäste pro Monat)
das Fluggästeaufkommen auf den Berliner Flughäfen von Monat zu Monat im
Durchschnitt um 10067 Fluggäste gestiegen.
Bestimmtheitsmaß. Aufgrund eines Bestimmtheitsmaßes von R² # 0,382 ist
man mit Hilfe der linearen Trendfunktion y*(t) = 1677,522 + 10,067 u t bereits
in der Lage, zu 38,2 % die Varianz der empirisch beobachteten Fluggästezahlen
yt auf den Berliner Flughäfen allein aus der Varianz der Zeitvariablen t statistisch
zu erklären. Der „verbleibende und nicht erklärte“ Varianzanteil der Fluggäste-
zahlen von (1 – 0,382) u 100 % = 61,8 % ist zweifelsfrei und augenscheinlich
vor allem den saisonal bedingten Schwankungen der Fluggästezahlen st um die
lineare Trendfunktion y*(t) geschuldet. Da offensichtlich die lineare Trendfunk-
tion y*(t) für brauchbare Prognosen der Fluggästezahlen allein wenig bzw. nicht
geeignet ist, bedarf es zudem noch einer sachlogischen und operationalen Be-
rücksichtigung und Modellierung der periodisch wiederkehrenden Schwankun-
gen in den Fluggästezahlen um die lineare Trendfunktion y*(t), die in der Zeit-
reihenanalyse unter dem Begriff einer Saisonkomponente st* subsumiert werden.
Unterjährigkeit. Bei der Modellierung einer Saisonkomponente st* für unter-
jährige und äquidistante Zeitreihendaten geht man davon aus, dass der Beobach-
tungszeitraum TB insgesamt a  Ǧ Jahre und jedes Jahr insgesamt m  Ǧ Unter-
zeiträume (etwa Tage, Wochen, Monate, Quartale, Tertiale, Halbjahre) umfasst,
wobei letztlich insgesamt n = a u m Zeiträume betrachtet werden, in denen der zu
analysierende ökonomische Prozess bzw. Zustand statistisch beobachtet wurde.
Die im Bereich der natürlichen Zahlen Ǧ = {1, 2, …} variierenden Variablen a
und m sollen der Anschaulichkeit und der symbolischen Assoziation halber für
die lateinischen Termini a(nus) o Jahr und m(ensis) o Monat stehen. Im Falle
der äquidistanten Zeitintervallreihe {yt, t = 1,2,...,n} der monatlichen Fluggäste-
zahlen yt umfasst der (eingangs vereinbarte) Beobachtungszeitraum TB die Jahre
2009 bis 2014, also insgesamt a = 6 Jahre. Aufgrund dessen, dass die Fluggäste-
zahlen yt monatlich erfasst wurden, beläuft sich die Anzahl m der Perioden eines
Jahres auf m = 12 Monate, so dass der Beobachtungszeitraum TB im betrachteten
Fall insgesamt n = a u m = 6 u 12 = 72 Monate und die beobachtete äquidistante
und unterjährige Zeitintervallreihe {yt, t = 1,2,...,n} insgesamt n = 72 zeitlich ge-
ordnete Fluggästezahlen yt umfasst.
380 Zeitreihenanalyse
Symbolik. Für die Modellierung einer saisonalen Komponente und für die
Konstruktion eines additiven Trend-Saison-Modells ist es aus vorteilhaft, die in
der Tabelle 10.3-1 vereinbarte Symbolik zu verwenden.
Tabelle 10.3-1: Trend-Saison-Modell-Symbole und ihre Semantik
Symbol Semantik
yjk Zeitreihenwert in Periode k = 1,2,...,m des Jahres j = 1,2,...,a
yjk* Trendwert in der Periode k des Jahres j
sjk = yjk  yjk* Saisonwert in der Periode k des Jahres j (Trendresiduum)
sjk* durchschnittlicher Saisonwert in der Periode k des Jahres j
yjk**= yjk* + sjk* Modellschätzwert in der Periode k des Jahres j
Trendresiduen. Zur Modellierung der Saisonkomponente st* benötigt man
die für alle t = k + m u (j  1)  TB die Abweichung st = yt  yt* = sjk = yjk  yjk*
der beobachteten Fluggästezahlen yt = yjk vom jeweiligen Trendwert yt* = yjk*.
Da es sich bei der linearen Trendfunktion yt* = y*(t) aus statistisch-methodischer
Sicht um eine inhomogene bivariate lineare Regressionsfunktion handelt, die mit
Hilfe der Methode der kleinsten Quadratesumme aus den Zeitreihendaten ge-
schätzt wurde, kann man für alle t  TB die saisonal bedingten Schwankungen st,
die im konkreten Fall als Residuen (lat.: residuum o Rest) des linearen Trend-
modells y*(t) erscheinen, am einfachsten via Analysieren, Regression, Kurven-
anpassung berechnen, indem man analog zur Abbildung 10.3-3 im Unterdialog-
feld Kurvenanpassung: Speichern in der Rubrik Variable speichern die Optionen
Vorhergesagte Werte und Residuen vereinbart.
Abbildung 10.3-3: SPSS Dialogfelder Kurvenanpassung

Im Zuge der optional vereinbarten Anforderungen werden in die SPSS Arbeits-


datei automatisch die Variablen Pre(dicted)_1 und Res(idual)_1 eingefügt, die
Zeitreihenanalyse 381
zum einen die mittels der linearen Trendfunktion y*(t) geschätzten Trendwerte
yt* und zum anderen die geschätzten Trendresiduen st = yt  yt* beinhalten, die in
der SPSS Arbeitsdatei der Anschaulichkeit halber auf die Namen Trend bzw.
Residuen umbenannt wurden.
Berechnung. Im konkreten Fall berechnet man unter Verwendung der inho-
mogenen linearen Trendfunktion y*(t) zum Beispiel für den Dezember 2014, also
für das Jahr der Ordnung j = 6 und für den Monat der Ordnung k = 12 wegen
t = k + m u (j  1) = 12 + 12 u (6  1) = 72
einen Trendwert von
y*(72) = 1677,522 + 10,067 u 72 # 2402,356 (1000 Fluggäste)
und ein Trendresiduum in Höhe von
s72 = 2058 – 2402,356 = 344,356 (1000 Fluggäste).
Demnach lag zum Zeitpunkt t = 72 bzw. im Dezember 2014 die beobachtete
Fluggästeanzahl um 344,356 (1000 Fluggäste) unter dem linearen Trend. Analog
sind gemäß Abbildung 10.3-4 für alle t  TB die restlichen Trendresiduen st zu
berechnen und zu interpretieren.
Sequenzdiagramm. Die Abbildung 10.3-4 beinhaltet das Sequenzdiagramm
der Trendresiduen st  TB für die Zeitintervallreihe {yt, t = 1,2,...,n} der monatli-
chen Fluggästezahlen yt, die auf der Grundlage der inhomogenen linearen Trend-
funktion y*(t) = 1677,522 + 10,067 u t mit t  TB berechnet und gemäß Abbil-
dung 10.3-4 in der SPSS Arbeitsdatei in der numerischen Variablen Residuen
gespeichert wurden.
Abbildung 10.3-4: SPSS Dateneditor mit Sequenzdiagramm „Trendresiduen“

Trajektorie der Trendresiduen

Während im Beobachtungszeitraum TB die Fluggästezahlen yt jeweils in den


Hauptsaison-Monaten Juli bis Oktober mit etwa 300 (1000 Fluggäste) über dem
Trend lagen, ist vor allem in den Monaten zum jeweiligen Jahresende bzw. Jah-
resanfang auf den Berliner Flughäfen ein unterdurchschnittliches Fluggästeauf-
kommen zu beobachten, welches das Niveau von 400 (1000 Fluggäste) teilwei-
382 Zeitreihenanalyse
se noch weit unterschreitet. Dieser augenscheinliche empirische Tatbestand legt
es nahe, die Saisonkomponente st* im Beobachtungszeitraum TB als eine jahres-
durchschnittliche und monatsspezifische Abweichung der Fluggästezahlen yt
vom jeweiligen Trendmodellwert yt* zu modellieren.
Saisonkomponente. Die als eine durchschnittliche monatliche und saisonal
bedingte Schwankung erscheinende Saisonkomponente st* berechnet man am
einfachsten via Sequenz 10.3-1, wobei im konkreten Fall als abhängige Variable
die Variable T(rend)Res(iduum) und als unabhängige Variable die SPSS Variable
MONTH_ (engl.: month o Monat) fungieren. Um allerdings die in der zugehöri-
gen Mittelwerttabelle aufgelisteten Werte der Saisonkomponente st* in Gestalt
der monatsspezifischen durchschnittlichen Trendresiduen in das weitere Analy-
sekalkül einbeziehen zu können, ist es erforderlich, die berechneten „Mittelwer-
te“ vom SPSS Viewer in die Arbeitsdatei „manuell“ zu kopieren. Der Anschau-
lichkeit halber und zu Vergleichszwecken sind in der Abbildung 10.3-5 die Sai-
sonkomponentenwerte st* im Sequenzdiagramm grafisch und auszugsweise im
SPSS Dateneditor in der Variablen Saison numerisch dargestellt.
Sequenz 10.3-1: Saisonkomponente
Analysieren
Mittelwerte vergleichen
Mittelwert(e) o Abbildung 10.3-5
Abbildung 10.3-5: SPSS Dateneditor, Sequenzdiagramm Saisonkomponente

Saisonkomponente

Interpretation. Unter Verwendung der Symbolik, die in der Tabelle 10.3-2


vereinbart wurde, beläuft sich der Saisonkomponentenwert sjk* (Angabe in 1000
Fluggästen) zum Beispiel im Monat der Ordnung k = 7 bzw. k = 12, also jeweils
im Juli bzw. im Dezember eines der a = 6 Beobachtungsjahre j = 1,2,...,a auf
sj7* # 268,161 bzw. sj12* # 325,508.
Demnach lag im Beobachtungszeitraum TB das Passagieraufkommen in den a = 6
Monaten Juli bzw. Dezember durchschnittlich um 268.161 Fluggäste über der
Zeitreihenanalyse 383
linearen Trendfunktion bzw. um 325.508 Fluggäste unter der linearen Trendfunk-
tion. Beachtenswert ist dabei das Faktum, dass sich im konkreten Fall wegen der
Methode der kleinsten Quadratesumme zur Bestimmung der Trendfunktion so-
wohl die Trendresiduen st als auch die Saisonkomponentenwerte st* zu null ad-
dieren und somit jeweils die Zahl Null als ihr „Schwankungszentrum“ haben.
Trend-Saison-Modell. So bestimmt man unter Verwendung eines additiven
Trend-Saison-Modells, für das man im konkreten Fall via Transformieren, Vari-
able berechnen die Berechnungsvorschrift
Modell = Trend + Saison
appliziert, gemäß Abbildung 10.3-6 zum Beispiel für den Dezember 2014 wegen
m = 12, j = 6, k = 12, t = 12 + 12 u (6  1) = 72
und s72* # 325,508 (1000 Fluggäste)
schlussendlich eine Fluggästezahl auf den Berliner Flughäfen von
y**(72) = 1677,522 + 10,067 u 72  325,508 # 2076,848 (in 1000)
bzw. von ca. 2,077 Millionen Fluggästen.
Abbildung 10.3-6: SPSS Dateneditor, Basis: additives Trend-Saison-Modell

Gemäß Abbildung 10.3-6 bezeichnet man die Differenz


u72 = y72  y72** = 2058 – 2076,848 # 18,848 (1000 Fluggäste)
aus der im Dezember 2014 beobachteten Fluggästeanzahl y72 = 2058 (in 1000)
und dem Modellwert y**(72) = 2076,848 (in 1000) bezeichnet man als das Resi-
duum ut der Ordnung t = 72 des additiven Trend-Saison-Modells, das in der Ab-
bildung 10.3-6 mit dem Etikett MResiduen versehen wurde.
Residualstandardfehler. Für die n = 72 Modellresiduen
ut = yt – yt**, t  TB,
die in der Arbeitsdatei unter dem Variablennamen M(odell)Residuen gespeichert
sind und via Sequenz 4.6.4-2 mittels der Berechnungsvorschrift
MResiduen = Flug – Modell
bestimmt wurden, berechnet man gemäß Abbildung 10.3-6 einen Residualstan-
dardfehler in Gestalt der Standardabweichung der Modellresiduen von 49,040
384 Zeitreihenanalyse
(1000 Fluggästen). Demnach hat man ceteris paribus und unter Verwendung des
additiven Trend-Saison-Modells
y**(t) = y**(72) = 1677,522 + 10,067 u t + st* mit t  TR
sowohl im Zuge der statistischen Modellierung als auch ceteris paribus bei einer
statistischen Prognose (grch.: pro o vorher + gnosis o Wissen bzw. Vorhersa-
ge) der monatlichen Fluggästezahlen yt auf den Berliner Flughäfen mit einem
mittleren Modellfehler von 49.040 Fluggästen zu rechnen.
Prognose. Ist man in einem finalen Analyseschritt daran interessiert, auf der
Basis des konstruierten additiven Trend-Saison-Modells die monatlichen Flug-
gästezahlen auf den Berliner Flughäfen für die zwölf Monate des Wirtschaftsjah-
res 2012 zu prognostizieren, so ergeben sich die in der Abbildung 10.3-7 nume-
risch und grafisch präsentierten Prognosewerte.
Abbildung 10.3-7: SPSS Dateneditor, Modellprognose mit Sequenzdiagramm

additives Trend-Saison-Modell

Modellprognose

Modellprognose Beobachtungszeitraum Prognosezeitraum

Das praktizierte Prognose-Szenario lässt sich unter Verwendung der in den Ab-
bildungen 10.3-5 und 10.3-7 vermerkten Analysebefunde zum Beispiel für den
Monat August 2015 wie folgt skizzieren: Der Prognosezeitraum
TP = {t | t = 73, 74,..., 84} = {t* | t* = Jan 2015,..., Dez 2015}
erstreckt sich über h = 12 Monate, wobei man für den August 2015 wegen
j = 7, k = 8, m = 12 und t = 8 + 12 u (7 – 1) = 80
auf den Berliner Flughäfen ein Fluggästeaufkommen in Höhe von
y**(80) = 1677,522 + 10,067 u 80 + 177,260 # 2660,153
(1000 Fluggästen) bzw. von ca. 2,66 Millionen Fluggästen prognostiziert.
Prämisse. In diesem Zusammenhang ist es geboten, nochmals zu vermerken,
dass die praktizierte statistische Prognose der monatlichen Fluggästezahlen an
die sogenannte ceteris-paribus-Prämisse (lat.: ceteris paribus o (wenn) das Üb-
rig gleich (ist)) gebunden ist, wonach insbesondere die gleichen gesamtwirt-
schaftlichen und marktspezifischen Rahmenbedingungen unterstellt werden, die
im Beachtungszeitraum TB galten. h
Zeitreihenanalyse 385
Beispiel 10.3-2: Multiplikatives Trend-Saison-Modell
Motivation. In Anlehnung an das Beispiel 10.3-1, das den Bau und die Interpre-
tation eines additiven Trend-Saison-Modells zum Gegenstand hatte, soll im Kon-
text dieses Beispiels zum Zwecke eines Modellvergleichs die äquidistante Zeitin-
tervallreihe der monatlichen Fluggästezahlen (in 1000 Personen) aus der SPSS
Datendatei Flug.sav mit Hilfe eines multiplikativen Trend-Saison-Modells be-
schrieben und mit dessen Hilfe sowohl eine Prognose der Fluggästezahlen für das
Wirtschaftsjahr 2015 bewerkstelligt werden.
Trendkomponente. Zur statistischen Beschreibung der Entwicklungsrichtung
der Zeitreihe der Fluggästezahlen wird gemäß dem Beispiel 10.3-1 wiederum das
inhomogene lineare Trendmodell
y*(t) = 1677,522 + 10,067 u t
der monatlichen Fluggästezahlen yt in Abhängigkeit von der Zeitvariablen
t  TB = {t | t = 1,2,...,72} = {t* | t* = Jan 2009,..., Dez 2014}
verwendet.
Saisonkomponente. Die Trajektorie der Trendresiduen st innerhalb der Ab-
bildung 10.3-4 zeigt vor allem für die unterdurchschnittlichen bzw. negativen
Trendresiduen einen „fallenden“ Trend, der nichts anderes beschreibt, als das
Faktum, dass die jeweiligen monatlichen Schwankungen st der Fluggästezahlen
mit dem steigenden Fluggästezahlentrend y*(t) auch in ihrem absoluten Niveau
stärker „ausschlagen“. In einem solchen Fall ist es angebracht, ein multiplikati-
ves Trend-Saison-Modell y**(t) zu konstruieren etwa derart, dass man die
Trendkomponente y*(t) und die Saisonkomponente st* multiplikativ verknüpft,
so dass jetzt y**(t) = y*(t) u st* gilt.
Abbildung 10.3-8: SPSS Dateneditor mit Dialogfeld Mittelwert

Quotient = Flug / Trend

Saisonkomponente

Die Saisonkomponentenwerte st*, die gemäß Abbildung 10.3-8 im konkreten Fall


als ein monatsspezifisches arithmetisches Mittel aus den Quotienten
st = yt / yt* = sjk = yjk / yjk* mit t = k + m u (j  1)  TB
386 Zeitreihenanalyse
der beobachteten Fluggästeanzahlen yjk und dem zugehörigen Trendwert yjk*
berechnet wurden, sind in der Arbeitsdatei in der Variablen Saison gespeichert.
Ihre Interpretation ergibt das folgende Bild: Während in den a = 6 Jahren der
Ordnung j = 1,2,…,a des Beobachtungszeitraumes TB zum Beispiel im Monat der
Ordnung k = 1, also jeweils im Monat Januar, wegen sj1* = 0,779 die Fluggäste-
zahlen yj1 im Durchschnitt um
(0,779 – 1) u 100 % # 22,1 %
unter dem linearen Trend yj1* lagen, indiziert der Wert sj5* # 1,084 der Saison-
komponente sjk* für den Monat der Ordnung k = 5, also jeweils für den Monat
Mai, eine Fluggästeanzahl yjk, die im Jahresdurchschnitt um
(1,070  1) u 100 % # 7,0 %
über dem linearen Trend yjk* lag. Analog sind die übrigen Saisonkomponenten-
werte sjk* zu interpretieren, die gemeinsam mit den Quotienten sjk aus den beo-
bachteten Flug(gästezahlen) und den geschätzten Trend(werten) in den Sequenz-
diagrammen innerhalb der Abbildung 10.3-9 grafisch dargestellt sind.
Abbildung 10.3-9: Fluggäste-Trendwert-Quotient und Saisonkomponente

Trend-Saison-Modell. Die in der Arbeitsdatei in der Variablen Saison ge-


speicherten und stets um den Wert Eins schwankenden Saisonkomponentenwerte
st* der Fluggästezahlen yt sowie die Trendwerte yt* bilden nunmehr den Erweite-
rungsbaustein für die Konstruktion des multiplikativen Trend-Saison-Modells
y**(t) = (1677,522 + 10,067 u t) u st* mit t  TR und
TR = TB ‰ TP = {t | t = 1,2,…,84} = {t* | t* = Jan 2009,..., Dez 2015}.
Die Berechnung der zugehörigen Modellwerte y**(t) bewerkstelligt man am ein-
fachsten via Transformieren, Variable berechnen im SPSS Dialogfeld Variable
berechnen mittels der Berechnungsvorschrift Modell = Trend * Saison.
Residualstandardfehler. Für die n = 72 Modellresiduen
ut = yt – yt**, t  TB,
die in der Arbeitsdatei unter dem Variablennamen M(odell)Residuen gespeichert
sind und mittels der Berechnungsvorschrift
Zeitreihenanalyse 387
MResiduen = Flug – Modell
bestimmt wurden, berechnet man gemäß Abbildung 10.3-10 einen Residualstan-
dardfehler in Gestalt der Standardabweichung der Modellresiduen von 38,509
(1000 Fluggästen). Demnach hat man ceteris paribus und unter Verwendung des
multiplikativen Trend-Saison-Modells bei einer kurzfristigen statistischen Prog-
nose der monatlichen Fluggästezahlen yt auf den Berliner Flughäfen mit einem
mittleren Fehler von 38.509 Fluggästen zu rechnen, wobei [yt** r 38,509] den
Toleranzbereich der Prognose kennzeichnet.
Abbildung 10.3-10: Dateneditor, Basis: multiplikatives Trend-Saison-Modell

Prognose. Das praktizierte Prognose-Szenario lässt sich analog zur Abbildung


10.3-11 zum Beispiel für den Monat Mai 2015 wie folgt skizzieren:
Abbildung 10.3-11: SPSS Dateneditor mit Modellprognosewerten
multiplikatives Trend-Saison-Modell Modellprognose

Prognosezeitraum

Beobachtungszeitraum

Der Prognosezeitraum
TP = {t | t = 73, 74,..., 84} = {t* | t* = Jan 2015,..., Dez 2015}
erstreckt sich über h = 12 Monate, wobei man für den Mai 2015 wegen
j = 7, k = 5, m = 12 und t = 5 + 12 u (7 – 1) = 77
auf den Berliner Flughäfen unter sonst gleichen Marktbedingungen ein Fluggäs-
teaufkommen in Höhe von
y**(77) = (1677,522 + 10,067 u 77) u 1,070 # 2624,380
(1000 Fluggäste) bzw. von ca. 2,624 Millionen Fluggästen prognostiziert. h
388 Zeitreihenanalyse
Beispiel 10.3-3: Ex-post-Prognosekonzept
Motivation. Spätestens im Rahmen der nachfolgenden Ausführungen leuchtet es
ein, warum im Kontext der Beispiele 10.3-1 und 10.3-2 der Beobachtungszeit-
raum TB = {t | t = 1,2,…,72} = {t* | t* = Jan 2009,..., Dez 2014} zur Konstrukti-
on eines additiven und eines multiplikativen Trend-Saison-Modells für die Flug-
gästezahlen auf den Berliner Flughäfen auf die n = 72 Zeitreihenwerte yt be-
grenzt wurde, obgleich in der SPSS Datendatei Flug.sav insgesamt n = 76 Flug-
gästezahlen yt erfasst wurden: Einzig und allein, um die Grundidee einer soge-
nannten ex-post-Prognose (lat.: ex post o aus nachträglicher Sicht) paradigma-
tisch skizzieren zu können, die (vereinfacht formuliert) in einer Qualitätsbewer-
tung einer Modellprognose „im Nachhinein“ kulminiert.
JANUS-Koeffizient. In Anlehnung an den altrömischen Gott JANUS, der (ana-
log zum beigefügten Abbild einer sogenannten Janusmünze) mit einem Dop-
peltantlitz, nach innen (in den Beobachtungszeitraum) und nach außen (in den
Prognosezeitraum) schauend, bildhaft dargestellt wird, soll zur Bewertung der
Prognosegüte der sogenannte JANUS-Koeffizient J  Ǯ+ mit

୬ା୦ ୬
ͳ ͳ
ൌ  ඩቌ ή ෍ ሺ›୲ െ ›୲‫ ככ‬ሻଶ ቍ൙൭ ή ෍ሺ›୲ െ ›୲‫ ככ‬ሻଶ ൱
Š 
୲ୀ୬ାଵ ୲ୀଵ

herangezogen werden, mit dessen Hilfe im konkreten Fall für den Prognosezeit-
raum in Gestalt des ersten Quartals 2015
TP = {t | t = 73, 74, 75, 76} = {t* | t* = Jan 2015,…,Apr 2015}
von der Länge h = 76 – 72 = 4 Monate die „ex post“ beobachteten yt Fluggäste-
zahlen den geschätzten yt** Fluggästezahlen und für den Beobachtungszeitraum
TB = {t | t = 1,2,…,72} = {t* | t* = Jan 2009,…,Dez 2014}
von der Länge n = 72 Monate die „ex ante“ beobachteten yt den geschätzten yt**
Fluggästezahlen vergleichend gegenübergestellt werden.
Regeln. Für eine Bewertung der Güte eines Zeitreihenmodells und einer da-
rauf basierenden Prognose mit Hilfe des dimensionslosen und für die Menge der
positiven reellen Zahlen Ǯ+ definierten JANUS-Koeffizienten gelten die folgenden
Regeln: Ein J # 1 indiziert homogene Streuungs- bzw. Abweichungsverhältnisse
von „ex-post“ beobachteten und prognostizierten Werten im Beobachtungs- und
im Prognosezeitraum. Ein J > 1 ist als ein Indiz für eine Verringerung und ein
J < 1 für eine Erhöhung der Prognosegüte eines Zeitreihenmodells zu deuten.
Residualquadratsumme. Für das im Kontext des Beispiels 10.3-1 konstruier-
te additive Trend-Saison-Modell erhält man im konkreten Fall die folgenden
Analyseergebnisse, wobei es im Falle eines numerischen Nachvollziehens vor-
Zeitreihenanalyse 389
teilhaft ist, zum Beispiel via Sequenz 10.3-2 analog zur Abbildung 10.3-12 im
SPSS Dialogfeld Distanzen die angezeigten Analyseschritte einerseits für den
Beobachtungszeitraum TB mit Hilfe des SPSS Filters Zeit <= 72 und andererseits
für Prognosezeitraum TP mittels des SPSS Filters Zeit >= 73 & Zeit <= 76 zu
bewerkstelligen.
Sequenz 10.3-2: Distanzen
Analysieren
Korrelation
Distanzen o Abbildung 10.3-12
Abbildung 10.3-12: SPSS Dateneditor mit Dialogfeld Distanzen

ex-post verfügbar

Basis: Prognosezeitraum

Die im Dialogfeld Distanzen optional angeforderte quadrierte euklidische Dis-


tanz „zwischen“ den beiden metrischen Variablen Flug und Modell liefert analog
zu den Tabellen 10.3-2 und 10.3-3 für das additive Trend-Saison-Modell und
analog zu den Tabellen 10.3-4 und 10.3-5 für das multiplikative Trend-Saison-
Modell die jeweilige Distanz- bzw. Unähnlichkeitsmatrix, die in ihrer zeitraum-
bezogenen bzw. filterbasierten Betrachtung die Grundlage für die Berechnung
des JANUS-Koeffizienten bilden.
Tabelle 10.3-2: Distanzmatrix, Filter: Zeit <= 72

Tabelle 10.3-3: Distanzmatrix, Filter: Zeit >= 73 & Zeit <= 76


390 Zeitreihenanalyse
Die jeweilige Residualquadratsumme hätte man auch mittels der Beziehung
RQS = (Flug – Modell)**2 = MResiduen**2
bestimmen können, indem man für die Variable RQS im Unterdialogfeld Häufig-
keiten: Statistik die Option Summe vereinbart.
Tabelle 10.3-4: Distanzmatrix, Filter: Zeit <= 72

Tabelle 10.3-5: Distanzmatrix, Filter: Zeit >= 73 & Zeit <= 76

Modellvergleich. Während man für das additive Trend-Saison-Modell einen


JANUS-Koeffizienten in Höhe von
ଵ ଵ
୅ ൌ  ටቀ ή ͶͷͲͳͲǡͺʹͺቁൗቀ ή ͳ͹Ͳ͹Ͷ͸ǡͻͶͺቁ ؆ ʹǡͳ͹ͺ
ସ ଻ଶ
errechnet, erhält man für das multiplikative Trend-Saison-Modell einen augen-
scheinlich „besseren“ JANUS-Koeffizienten in Höhe von
ଵ ଵ
୑ ൌ  ටቀ ή ͺ͵ͻ͵ǡͷͶͻቁൗቀ ή ͳͲͷͶʹͶǡͺʹʹቁ ؆ ͳǡͳͻ͹
ସ ଻ଶ
und interpretiert beide Koeffizienten wie folgt: Wegen
2,178 > 1 bzw. 1,197 > 1
konstatiert man sowohl für das additive als auch für das multiplikative Trend-
Saison-Modell eine „Verringerung“ der Prognosegüte der monatlichen Fluggäs-
tezahlen auf den Berliner Flughäfen für das erste Quartal 2015. Diese Aussage
leuchtet ein, zumal (etwa für das additive Modell) im Zähler des JANUS-
Koeffizienten der sogenannte ex-post Residualstandardfehler
RSP = —(45010,828 / 4) # 106,079 (1000 Fluggäste)
vermerkt ist, der wegen
106,079 / 48,698 # 2,178
geringfügig mehr als zweimal höher bemessen ist als der in der Tabelle 10.3-2
indizierte, auf den Beobachtungszeitraum bezogene und im Nenner des Koeffi-
zienten JA platzierte Residualstandardfehler in Höhe von
RSB = —(170746,948 / 72) # 48,698 (1000 Fluggäste(n)).
Analoge Aussagen gelten auch für die beiden vergleichsweise „homogeneren“
Residualstandardfehler des multiplikativen Trend-Saison-Modells. h
Zeitreihenanalyse 391

10.4 ARIMA-Modelle
Motivation. Im Unterschied zu den im Abschnitt 10.3 konstruierten und skiz-
zierten Trend-Saison-Modellen, die in der Regel auf die „bloße“ statistische De-
skription und Modellierung einer unterjährigen und saisonal bedingten Zeitreihe
{yt, t = 1,2,...,n} zum Zwecke ihrer kurzfristigen statistischen Vorausberechnung
abstellen, wird bei der Konstruktion von stochastischen Zeitreihenmodellen, wo-
runter auch die Familie der ARIMA-Modelle gehört, von der Prämisse ausgegan-
gen, dass eine zu modellierende Zeitreihe {yt, t  T} ein „beobachtetes Abbild“
eines stochastischen Prozesses {Yt, t  T} ist.
Stochastischer Prozess
Eine Folge {Yt, t  T} von Zufallsgrößen Yt, die über einem (endlichen) Zeitbe-
reich T definiert ist, heißt stochastischer Prozess.
Hinweise. Für das Verständnis eines stochastischen Prozesses erweisen sich die
folgenden Hinweise als hilfreich: i) Zufallsgröße. Eine Zufallsgröße (vgl. Ab-
schnitt 6.4) ist eine reellwertige Funktion zur Beschreibung zufälligen Geschehens.
ii) Zeitbereich. In praxi geht man davon aus, dass ein stochastischer Prozess {Yt, t  T}
gleichsam in Vergangenheit, Gegenwart und Zukunft existiert und nur zeitdiskret zu be-
stimmten äquidistanten Zeitpunkten bzw. Zeitintervallen t in Gestalt einer Zeitreihe
{yt, t  TB} in einem „begrenzten Zeitfenster“ des abzählbar endlichen Zeitbereiches
T = {t | t = 0, r1, r2,...} statistisch beobachtet wird. iii) Charakterisierung. Für die Mo-
dellierung eines stochastischen Prozesses (etwa mit Hilfe eines ARIMA-Modells) ist seine
Charakterisierung und Identifikation im Kontext der Dichotomie von stationär (lat.: sta-
tionarius o stillstehend, zeitlich unveränderlich) oder integriert (lat.: integrare o einbe-
ziehen (einer Trend- und/oder Saisonkomponente)) erforderlich. iv) Integrationsgrad.
Im weitesten Sinne heißt ein stochastischer Prozess integriert zum Grade d  Ǧ, wenn die
Differenzenfolge {'d yt, t = d + 1, d + 2,...} der Ordnung d = 0, 1, 2, … stationär ist. Der
griechische Großbuchstabe ' (lies: Delta) fungiert als Differenzen-Operator. 'd yt kenn-
zeichnet den Differenzenfilter der Ordnung d, der auf der Menge Ǧ der natürlichen Zah-
len mit 'dyt = '('d1yt) = 'd1yt  'd1yt1 rekursiv definiert ist und in seiner Konstruktion
und Anwendung auf integrierte und saisonale Zeitreihen erweitert werden kann. v) Sta-
tionarität. Ein stochastischer Prozess {Yt, t  T} heißt (schwach) stationär, wenn für alle
t  T (zumindest) der Erwartungswert E(Yt) = Pt = P und die Varianz V(Yt) = V²t = V² > 0
konstant bzw. zeitinvariant sind sowie für beliebige k = 1,2,... die Kovarianz C(Yt, Yt-k)
(und damit auch die sogenannte Autokorrelation) nur vom Timelag k (engl.: timelag o
Zeitverschiebung) abhängt. Stationäre stochastische Prozesse ermöglichen eine sinnvolle
und wahrscheinlichkeitstheoretisch begründete Zeitmittelbetrachtung. Diese Prämisse gilt
auch für die Konstruktion von ARIMA-Modellen. vi) ARIMA-Modell. Das Initialwort
ARIMA basiert auf dem englischen Terminus Auto-Regressive Integrated Moving Avera-
ge (Model) und kennzeichnet eine ganze Familie von Modellen zur Nachbildung autore-
gressiver und schockwirkungsbasierter stochastischer Prozesse, worin auch die Betrach-
tung saisonaler Komponenten eingeschlossen ist. Aus der Anzahl p der in Folge signifi-
kanten Autoregressionskoeffizienten, des Integrationsgrades d und der Anzahl q der in
392 Zeitreihenanalyse
Folge signifikanten Schockwirkungskoeffizienten, die mittels des BOX-JENKINS- Verfah-
rens identifiziert, spezifiziert und modelliert werden können, erklärt sich auch die in
SPSS übliche Notation und Spezifikation eines ARIMA(p, d, q)-Modells ohne saisonale
Komponenten bzw. eines ARIMA(p, d, q)(sp, sd, sq)-Modells mit saisonalen Komponenten.
vii) Korrelogramme. Als zwei nützliche Werkzeuge erweisen sich in der Diagnostik ei-
nes stochastischen Prozesses die Autokorrelationsfunktion ACF (engl.: Auto-Correlation-
Function) und die partielle (lat.: partialis o anteilig) Autokorrelationsfunktion PACF
(engl.: Partial-Auto-Correlation-Function), deren grafische Darstellungen auch als Kor-
relogramme bezeichnet werden und die aus statistisch-methodischer Sicht in einem un-
mittelbaren Zusammenhang mit der bivariaten und der partiellen linearen Maßkorrelati-
onsanalyse (vgl. Abschnitt 8.3) stehen. viii) Literaturhinweis. Eine paradigmatische Ein-
führung in die Konstruktion von ARIMA-Modellen unter Nutzung des sogenannten BOX-
JENKINS-Verfahrens, das nach den beiden britischen Statistikern Georg E. P. BOX
(*1919, †2013) und Gwilym M. JENKINS (*1932, †1982) benannt ist, findet man u.a. bei
ECKSTEIN, Peter P.: Angewandte Statistik mit SPSS – Praktische Einführung für Wirt-
schaftswissenschaftler, 8., aktualisierte Auflage, SPRINGER GABLER Wiesbaden 2015. i
Beispiel 10.4-1: ARIMA-Modell ohne saisonale Parameter
Motivation. In Anlehnung an das Beispiel 10.1-2 soll unter Verwendung der
SPSS Datendatei Daimler.sav die Zeitpunktreihe {yt, t = 1,2,...,n} der n = 246
börsentäglichen Schlusskurse yt der an der Frankfurter Börse notierten und im
Deutschen Aktienindex DAX gelisteten Aktie der Daimler Aktiengesellschaft
(Angaben in Punkten) mit Hilfe des sogenannten BOX-JENKINS-Verfahrens diag-
nostiziert werden mit dem Ziel, für die beobachteten Zeitreihenwerte ein geeig-
netes ARIMA-Modell zu konstruieren.
Korrelogramme. In der Abbildung 10.4-2 sind die via Sequenz 10.4-1 in Dia-
logfeld Autokorrelationen angeforderten Korrelogramme auf der Basis der origi-
nären und der logarithmisch transformierten Zeitreihenwerte dargestellt.
Sequenz 10.4-1: Korrelogramme
Analysieren
Vorhersage
Autokorrelationen o Abbildung 10.4-1
Abbildung 10.4-1: SPSS Dateneditor mit Dialogfeld Autokorrelationen
Zeitreihenanalyse 393
Abbildung 10.4-2: Korrelogramme, Basis: logarithmierte Schlusskurse

Diagnose. Die Prozessdiagnose anhand der beiden Korrelogramme innerhalb


der Abbildung 10.4-2 ergibt gemäß dem BOX-JENKINS-Verfahren das folgende
Bild: Aufgrund dessen, dass die empirischen Autokorrelationskoeffizienten
ACF(k) für die Timelags der Ordnung k = 1,2,…,16 nur „langsam aussterben“,
deutet man diesen diagnostischen Befund als einen „augenscheinlichen und un-
umstößlichen“ Hinweis darauf, dass die Zeitreihe {yt, t  TB} der n = 246 loga-
rithmierten börsentäglichen Schlusskurse yt der Daimler-Aktie im Beobachtungs-
zeitraum TB = {t | t = 1,2,…,n} trendbehaftet bzw. integriert ist. Dieses Analy-
seergebnis koinzidiert mit dem zugehörigen rechten Sequenzdiagramm innerhalb
der Abbildung 10.1-4, das eine volatile und trendbehaftete Trajektorie indiziert.
Mehr noch: Aufgrund dessen, dass der geschätzte Koeffizient PACF(k) der Ord-
nung k = 1 der partiellen Autokorrelationsfunktion PACF nahezu bei eins liegt,
während die restlichen partiellen Autokorrelationskoeffizienten im Konfidenzbe-
reich von null liegen und im induktiven Sinne als nicht signifikant verschieden
von null gedeutet werden, ist dieser Befund zudem noch ein Hinweis darauf, dass
der den Schlusskursen der Daimler-Aktie innewohnende stochastische Prozess
seinem Wesen nach ein „Random Walk“ (engl.: random o Zufall + walk o
Spaziergang) ist, der auch als „Irrfahrt“ bezeichnet wird.
Differenzenfolge. Die Abbildung 10.4-3 beinhaltet der Anschaulichkeit und
der Vergleichbarkeit halber die via Sequenz 10.1-2 erstellten Sequenzdiagramme
für die originären und mittels des Differenzfilters erster Ordnung „trendbereinig-
ten“ logarithmierten Schlusskurse der Daimler-Aktie, die aus sachlogischer Sicht
und bei einer Gewichtung mit dem Faktor 100 % als börsentägliche prozentuale
Wachstumsraten bzw. Renditen der Daimler-Aktie gedeutet werden können. Im
Unterschied zur Trajektorie im linken Sequenzdiagramm, die augenscheinlich
durch einen volatilen Verlauf der logarithmierten Schlusskurse getragen wird,
kann aufgrund der um null schwankenden Trajektorie im rechten Sequenzdia-
gramm davon ausgegangen werden, dass die Zeitreihe der börsentäglichen pro-
394 Zeitreihenanalyse
zentualen Renditen der Daimler-Aktie zumindest schwach stationär ist. Aufgrund
dieses scheinbar trivialen Analysebefundes deutet man die zugrunde liegende
originäre Zeitreihe der logarithmierten Schlusskurse im Beobachtungszeitraum
TB als trendbehaftet und integriert zum Grade d = 1.
Abbildung 10.4-3: Sequenzdiagramm, integrierte und stationäre Zeitreihe

Chart. Sowohl anhand der beiden Sequenzdiagramme innerhalb der Abbil-


dung 10.4-3 als auch angesichts des spektakulär anmutenden Charts (engl.: chart
o Schaubild) in der Abbildung 10.4-4, das originalgetreu der Frankfurter All-
gemeinen Zeitung vom Freitag, dem 12. Juni 2009 auf der Seite 21 entnommen
wurde, kann man sich an dieser Stelle zudem noch von einem fundamentalen
Arbeitsprinzip der technischen Wertpapieranalyse überzeugen: Der Nutzung ei-
ner logarithmischen Skala bei der grafischen Darstellung und Bewertung einer
(stets als ein zeitstetiger Prozess aufgefassten) Wertpapierentwicklung.
Abbildung 10.4-4: Chart einer technischen Analyse des DAX
Zeitreihenanalyse 395
Abbildung 10.4-5: SPSS Dateneditor, Basis: Daimler-Aktie

Wachstumsrate. Zur Verdeutlichung des sogenannten zeitstetigen Analyse-


konzeptes sollen die originären und im SPSS Dateneditor innerhalb der Abbil-
dung 10.4-5 aufgelisteten Schlusskurse der Daimler-Aktie dienen. Demnach ist
der Schlusskurs in seiner zeitdiskreten Betrachtung am 19. Dez 2014 (t = 246) im
Vergleich zum Vortag (t = 245) absolut um
'y246 = y246 – y245 = 68,93  69,00 = 0,07 Punkte
und wegen
r246* = (('y246) / y245) u 100 % = ((0,07) / 69,00) u 100 % # 0,101 %
relativ und prozentual um 0,10 % gefallen. Gemäß der stetigen Zinsformel
yt = yt1 u exp(rt)
berechnet sich die stetige Wachstumsrate rt, die im technischen Wertpapieranaly-
se auch als stetige Rendite bezeichnet wird, wie folgt: Bezeichnet exp(rt) den Ex-
ponenten der stetigen Wachstumsrate rt zur Basis e = 2,71828…, so gilt wegen
(yt) / (yt1) = exp(rt)
für die stetige Wachstumsrate bzw. Rendite
rt = ln((yt) / (yt1)) = ln(yt)  ln(yt1).
Im konkreten Fall überzeugt man sich leicht von der Tatsache, dass die zeitsteti-
ge Betrachtung der benachbarten Schlusskurswerte
y246 = 68,93 Punkte und y245 = 69,00 Punkte
in Gestalt der mit dem Faktor 100 % gewichteten Differenz aus den natürlichen
Logarithmen wegen
r246 = (ln(68,93)  ln(69,00)) u 100 % # 0,102 %
zu einem Ergebnis führt, das wegen des sogenannten zeitstetigen Ansatzes nur
geringfügig und praktisch vernachlässigbar von der „zeitdiskreten“ prozentualen
börsentäglichen Wachstumsrate r246* = 0,101 % abweicht.
Trendelimination. Beachtenswert ist es in diesem Zusammenhang, dass man
mit dem praktizierten Analysekonzept des Differenzenfilters erster Ordnung aus
den logarithmierten Schlusskurswerten nichts anderes bewerkstelligt hat, als die
Elimination eines linearen Trends aus den logarithmierten Schlusskursen bzw.
eines exponentiellen Trends aus den börsentäglich in Punkten erfassten originä-
396 Zeitreihenanalyse
ren Schlusskurswerten. Hinzu kommt noch, dass die volatile, um den Wert Null
schwankende und somit schwach stationäre Trajektorie der börsentäglichen pro-
zentualen Renditen der Daimler-Aktie den Aufzeichnungen eines Oszillographen
(lat.: oscillare o schwingen + grch.: graphein o schreiben) ähnelt, woraus sich
wiederum die in der Zeitreihenanalyse gern benutzte mit der Metapher vom
„weißen Rauschen“ semantisch erklären lässt.
Weißes Rauschen. In der stochastischen Zeitreihenmodellierung ist der Be-
griff des „weißen Rauschens“ untrennbar mit dem Begriff eines „reinen Zufalls-
prozesses“ verbunden. Bei einem reinen Zufallsprozess besteht (vereinfacht aus-
gedrückt) zwischen den Werten einer Zeitreihe sowohl in „unmittelbarer als auch
in ferner Nachbarschaft“ keinerlei Beziehung bzw. Wechselwirkung. Man sagt
daher auch: Die Zeitreihenwerte sind stochastisch voneinander unabhängig. Zur
empirischen Überprüfung der stochastischen Unabhängigkeit von Zeitreihenwer-
ten erweisen sich die bewährten diagnostischen Instrumente der Autokorrelati-
onsfunktion ACF und der partiellen Autokorrelationsfunktion PACF als hilfreich.
In der Abbildung 10.4-6 sind Korrelogramme mit den Koeffizienten der empiri-
schen Autokorrelationsfunktion ACF und der empirischen partiellen Autokorre-
lationsfunktion PACF für die börsentäglichen prozentualen Renditen der Daim-
ler-Aktie grafisch dargestellt.
Abbildung 10.4-6: Korrelogramme, Basis: börsentägliche Renditen

Die beiden grafischen Diagnosebefunde innerhalb der Abbildung 10.4-6 können


wie folgt interpretiert werden: Da sowohl die empirischen Autokorrelationskoef-
fizienten ACF(k) als auch die empirischen partiellen Autokorrelationskoeffizien-
ten PACF(k) für alle Timelags k = 1,2,…,16 die Konfidenzgrenzen auf einem
vorab vereinbarten Konfidenzniveau von 0,95 nicht überschreiten, deutet man die
aus den empirisch beobachteten prozentualen Renditen geschätzten Autokorrela-
tionskoeffizienten im wahrscheinlichkeitstheoretischen Sinne als nicht signifi-
kant verschieden von null und den zugrunde liegenden schwach stationären
stochastischen Prozess als einen reinen Zufallsprozess, dessen Trajektorie dem
Zeitreihenanalyse 397
„weißen Rauschen“ auf einem Oszillographen gleicht. Der jeweilige Timelag k
markiert dabei das Ausmaß der Zeitverschiebung im Kontext der praktizierten
Autokorrelationsanalyse, das im konkreten Fall von einem Börsentag bis zu
sechzehn Börsentagen reicht.
Random Walk. Aufgrund dessen, dass man im Beobachtungszeitraum TB die
prozentualen börsentäglichen Wachstumsraten bzw. Renditen der Schlusskurse
der Daimler-Aktie als Realisationen eines stationären und „reinen“ stochasti-
schen Prozesses identifizieren kann, kennzeichnet man die Trajektorie der zuge-
hörigen Zeitreihe {yt, t  TB} der originären Schlusswerte yt innerhalb der Ab-
bildung 10.4-1 bzw. 10.4-3 unter dem Begriff eines „Random Walk“ oder eines
„Irrweges“.
Normalverteilung. Untrennbar verbunden mit dem Phänomen des „weißen
Rauschens“ ist das Modell einer Normalverteilung, das im Kontext des Abschnit-
tes 6.5.2 paradigmatisch skizziert wurde und die Kernbotschaft der Abbildung
10.4-7 ist. Die beiden Diagramme innerhalb der Abbildung 10.4-7 zeigen sehr
anschaulich, dass sich hinter dem zufallsbedingten, unsystematischen und
scheinbar chaotischen Auf und Ab der börsentäglichen prozentualen Renditen
der Daimler-Aktie ein „ehrenwertes“ Verteilungsgesetz verbirgt: das Modell ei-
ner Normalverteilung, das im konkreten Fall einerseits durch die GAUßsche Glo-
ckenkurve über dem normierten und nahezu symmetrischen Histogramm und
andererseits durch ein „ideales“ Q(uantil)-Q(uantil)-Diagramm plakatiert wird.
Abbildung 10.4-7: Histogramm mit Normalverteilungsdichte und Q-Q-Plot

In der Explorativen Datenanalyse (vgl. Beispiel 5.1-5) wird ein Quantil-Quantil-


Diagramm bzw. Q-Q-Plot als „ideal“ klassifiziert und als ein „unmissverständli-
cher“ Hinweis auf eine Normalverteilung gedeutet, wenn sich die „Punktekette“
aus dem Zusammenspiel von empirischen Quantilen (vgl. Beispiel 5.2.2-2) und
den Quantilen der Standardnormalverteilung N(0; 1) (vgl. Beispiel 6.5.2-4) an
der sogenannten Normalitätsgeraden analog zur rechten Grafik innerhalb der Ab-
bildung 10.4-7 „eng anliegend entlang schlängelt“.
398 Zeitreihenanalyse
ARIMA-Modell. Aufgrund dessen, dass man in Anlehnung an die Prozess-
diagnostik nach Georg BOX (*1919, †2013) und Gwilym JENKINS (*1932,
†1982) die börsentäglichen prozentualen Renditen der Daimler-Aktie als einen
stationären und zugleich reinen stochastischen Prozess aufgedeckt hat, der „bar“
jeglicher signifikanter autoregressiver AR(p)-Komponente und/oder Störterm-
Komponente MA(q) ist, diagnostiziert für die originären Schlusskurse einen zum
Grade d = 1 integrierten stochastischen Prozess, der wegen
p = 0, d = 1 und q = 0
mit einem ARIMA(0, 1, 0)-Modell „nachgebildet“ werden kann. Das so spezifi-
zierte ARIMA(0, 1, 0)-Modell wurde analog zur Abbildung 10.4-?? via Analysie-
ren, Vorhersage, Traditionelle Modelle erstellen im Unterdialogfeld Zeitreihen-
modellierung: ARIMA-Kriterien fixiert und angefordert.
Abbildung 10.4-8: Schlusskurs-Prognose, Basis: ARIMA(0, 1, 0)-Modell

Prognose

Prognose

Prognose. In der Abbildung 10.4-8 sind auszugsweise die mit Hilfe des ARI-
MA(0, 1, 0)-Modells bestimmten Prognosewerte yt** für den Prognosezeitraum
TP = {t | t = 247,…, 256}
in der Variablen Arima aufgelistet und zugleich die Trajektorie der börsentägli-
chen Schlusskurse der Daimler-Aktie für den Relevanzzeitraum
TR = TB ‰ TP = {t | t = 151,…,256}
skizziert, worin auch die Prognosewerte für die verbleibenden und fiktiven
h = 10 Börsentage der ersten beiden Börsenwochen des Jahres 2015 eingeschlos-
sen sind. Beachtenswert ist dabei, dass die praktizierte Prognose der Schlusskur-
se der Daimler-Aktie letztlich nichts anderes darstellt als die Fortschreibung ei-
nes sogenannten Hausse-Trends (frz.: hausse o Anstieg, Aufschwung).
Gerade. Die kurzfristige Prognose der börsentäglichen Schlusskurse der
Daimler-Aktie mittels eines ARIMA(0, 1, 0)-Modells ist gemäß Abbildung 10.4-8
in ihrer bildhaften Darstellung nichts anderes als die „bloße Fortschreibung“ ei-
Zeitreihenanalyse 399
nes steigenden linearen Trends, den man sich analog zur Abbildung 10.4-9 so-
wohl grafisch als auch analytisch wesentlich einfacher wie folgt verdeutlichen
kann: Gemäß dem geometrischen Lehrsatz, wonach „eine Gerade die kürzeste
Verbindung zwischen zwei Punkten ist“, braucht man nur mit Hilfe eines Lineals
die Trajektorie der börsentäglichen Schlusskurse yt durch eine Gerade zu ergän-
zen, die den Anfangs- und den Endpunkt mit den Koordinaten
(t = 1, yt = 61,67) und (t = 246, yt = 68,93)
schneidet. In Anlehnung an die sogenannte Zwei-Punkte-Geradengleichung be-
stimmt man die zugehörige Geradengleichung
ሺ͸ͺǡͻ͵ െ ͸ͳǡ͸͹ሻ
›୲‫ ככ‬ൌ ˆሺ–ሻ ൌ ͸ͳǡ͸͹ ൅ ή –ǡ
ሺʹͶ͸ െ ͳሻ
deren Graph in der Abbildung 10.4-9 für den Relevanzzeitraum TR = TB ‰ TP
von der Länge n + h = 246 + 10 = 256 Börsentage skizziert ist und mit deren Hil-
fe man zum Beispiel für den Börsentag der Ordnung t = 256 wegen
‫ככ‬
ሺ͸ͺǡͻ͵ െ ͸ͳǡ͸͹ሻ
›ଶହ଺ ൌ ˆሺʹͷ͸ሻ ൌ ͸ͳǡ͸͹ ൅ ή ʹͷ͸ ؆ ͸ͻǡʹ͸
ሺʹͶ͸ െ ͳሻ
einen Schlusskurs in Höhe von 69,26 Punkten prognostiziert.
Abbildung 10.4-9: Trajektorie mit linearem Trend

Quintessenz. Die paradigmatisch skizzierten zeitreihenanalytischen Betrach-


tungen kulminieren in einer ernüchternden Quintessenz (lat.: quinta essentia o
das fünfte Seiende bzw. das Wesen einer Sache): Weder akribisch gestaltete
Charts noch theoretisch anspruchsvolle statistische Analyse- und Modellierungs-
verfahren sind ein wirkungsvolles und vertrauenswürdiges Instrument für kurz-
fristige und schon gar nicht für mittel- oder langfristige Prognosen von Wertpa-
pierentwicklungen. Was über eine sogenannte Hausse und/oder eine Baisse hin-
aus bleibt, die ihrem französischen Wortursprung gemäß eine Phase nachhaltig
ansteigender bzw. fallender Wertpapierkurse etikettieren, ist letzten Endes und in
der Regel nur das „weiße Rauschen“ eines zufallsbedingten Oszillogramms. h
400 Zeitreihenanalyse
Beispiel 10.4-2: ARIMA-Modell mit saisonalen Parametern
Motivation. Die Konstruktion eines ARIMA-Modells mit saisonalen Parametern
soll exemplarisch anhand der SPSS Datendatei Flug.sav demonstriert werden, in
welcher die äquidistante Zeitintervallreihe {yt, t  TB} für die Anzahl Y der
Fluggäste auf den Berliner Flughäfen gespeichert ist. In Anlehnung an die Bei-
spiele im Abschnitt 10.3 soll auch hier der Beobachtungszeitraum
TB = {t | t = 1,2,…,72} = {t* | t* = Jan 2009,…, Dez 2014}
nur die ersten 72 der insgesamt 76 erfassten Fluggästezahlen umspannen. Des
Weiteren ist im Vorfeld der angestrebten Zeitreihenanalyse zu beachten, dass via
Sequenz 10.1-1 und gemäß Abbildung 10.1-1 im Dialogfeld Datum vereinbaren
die Zeitvariablen YEAR_, MONTH_ und DATE_ zu definieren sind.
Korrelogramme. Gemäß der Abbildung 10.4-10 wurden im konkreten Fall
die via Sequenz 10.4-1 angeforderten und in der Abbildung 10.4-11 skizzierten
Korrelogramme auf der Basis der n = 72 originären Zeitreihenwerte der Fluggäs-
tezahlen {yt, t  TB} mit einer optional vereinbarten maximalen Timelag-Länge
von k = 20 Monaten erstellt.
Abbildung 10.4-10: SPSS Dateneditor mit Dialogfeldern Autokorrelationen

Abbildung 10.4-11: Korrelogramme, Basis: originäre Fluggästezahlen

Die alleinige Betrachtung der Korrelogramme innerhalb der Abbildung 10.4-11


liefert den folgenden diagnostischen Befund: Aufgrund dessen, dass die empiri-
Zeitreihenanalyse 401
schen Autokorrelationskoeffizienten ACF(k) mit steigendem Timelag k nur „sehr
langsam aussterben“ und zudem noch durch eine saisonale Bewegung getragen
werden, geht man davon aus, dass die originäre Zeitreihe {yt, t  TB} der Flug-
gästezahlen im Beobachtungszeitraum TB sowohl trend- als auch saisonbehaftet
ist. Diese Aussage koinzidiert mit den deskriptiven Analysebefunden im Kontext
der Beispiele 10.2-1 und 10.3-1.
Integrationsgrad. Anhand des Sequenzdiagramms innerhalb der Abbildung
10.4-12 überzeugt man sich leicht von der Tatsache, dass man bereits mit einem
Differenzfilter erster Ordnung und einem saisonalen Differenzfilter ersten Ord-
nung eine schwach stationäre Zeitreihe erzeugen kann.
Abbildung 10.4-12: Sequenzdiagramm der stationären Zeitreihe

Differenzenfilter. Die Grundidee eines Differenzenfilters und saisonalen Dif-


ferenzenfilters ersten Ordnung kann man sich anhand der originären Zeitreihe
{yt, t = 1,2,...,72} der Fluggästezahlen wie folgt verdeutlichen: Bezeichnet
'1yt = yt – yt1
die Differenz der Ordnung d = 1, also die Veränderung in den Fluggästezahlen
im Monat t im Vergleich zum Vormonat t  1, so kennzeichnet
'1(s)yt = yt – yts
in logischer Konsequenz die saisonale Differenz der Ordnung d = 1, also die
Veränderung der Fluggästezahlen im Monat t im Vergleich zu einem vorherge-
henden Monat der Ordnung t  s. Da augenscheinlich bereits aus dem Sequenz-
diagramm innerhalb der Abbildung 10.1-3 ersichtlich ist, dass jeweils für die
Länge von s = 12 Monaten die Fluggästezahlen durch einen mehr oder minder
gleichen und saisonalen Verlauf gekennzeichnet sind, misst im konkreten Fall
'1(12)yt = yt – yt12
die absolute Veränderung der Fluggästezahlen im Monat t im Vergleich zum
vorhergehenden Monat der Ordnung t  12, also im Vergleich zum gleichen Vor-
jahresmonat. Anhand der auf der Abszisse im Sequenzdiagramm 10.4-12 abge-
402 Zeitreihenanalyse
tragenen Zeitvariablenwerte überzeugt man sich von der Tatsache, dass man im
Falle der originären Zeitintervallreihe {yt, t = 1,2,...,72} der Fluggästezahlen auf-
grund der beiden Differenzfilter erster Ordnung letztlich eine trendbereinigte und
zugleich auch saisonbereinigte Zeitreihe {xt, t = 14, 15,..., 72} mit insgesamt
„nur noch“ 72  1  12 = 59 Werten
xt = '1(12)('yt)
verfügbar hat. Die Trajektorie dieser offensichtlich stationären und hinsichtlich
ihres Umfangs auf n = 59 Werte „gestutzten“ Zeitreihe der Fluggästezahlen ist in
der Abbildung 10.4-12 grafisch dargestellt.
Korrelogramme. Die autokorrelationsbezogene Analyse der trend- und sai-
sonbereinigten Zeitreihe {xt, t = 14,...,72} mit ihren 72 – 14 + 1 = 59 Werten xt
ergibt unter Verwendung der Abbildung 10.4-13 das folgende Bild:
Abbildung 10.4-13: Korrelogramme, trend- und saisonbereinigte Zeitreihe

Aufgrund dessen, dass die Autokorrelationskoeffizienten ACF(k) mit wachsen-


dem Timelag k „in Folge rasch aussterben“ und die partiellen Autokorrelations-
koeffizienten PACF(k) in der chronologischen Abfolge der Timelags der Ord-
nung k = 1,2,...,16 nur die zwei PACF-Koeffizienten der Ordnung k = 1 und
k = 2 in Folge die „gestrichelten“ 0,95-Konfidenzgrenzen überschreiten, diagnos-
tiziert man auf der Basis des BOX-JENKINS-Verfahrens für die trend- und saison-
bereinigte Zeitreihe der Fluggästezahlen {xt, t = 14, 15,..., 72} einen autoregres-
siven Prozess zweiter Ordnung, der mit einem AR(2)-Modell beschrieben werden
kann. Dies entspricht der Spezifikation eines
ARIMA(2, 1, 0)(0, 1, 0)-Modells
für die originäre Zeitintervallreihe {yt, t = 1,2,...,72} der Fluggästezahlen.
Identifikationsregeln. Im Zuge der Analyse eines stochastischen Prozesses,
seiner Spezifikation und seiner Nachbildung in einem ARIMA-Modell sowohl
ohne als auch mit saisonalen Parametern erweisen sich die folgenden auf dem
sogenannten BOX-JENKINS-Verfahren beruhenden Identifikationsregeln als hilf-
reich und nützlich.
Zeitreihenanalyse 403
Regel 1. Sterben die Koeffizienten ACF(k) der Autokorrelationsfunktion ACF
mit zunehmendem Lag k nicht bzw. nur langsam aus und zeigt der partielle Au-
tokorrelationskoeffizient PACF(k) der Ordnung k = 1 (einem Nagel gleich) einen
Wert nahe eins, dann ist ein nicht stationärer bzw. integrierter stochastischer Prozess an-
gezeigt, der durch einen geeigneten Differenzenfilter der Ordnung d in einen zumindest
schwach stationären stochastischen Prozess zu transformieren ist. Für den schwach stati-
onären stochastischen Prozess gilt es, ein geeignetes ARIMA(p, d, q)-Modell zu finden.
Regel 2. Sind für einen schwach stationären stochastischen Prozess sowohl die Koeffi-
zienten ACF(k) der Autokorrelationsfunktion ACF als auch die Koeffizienten PACF(k)
der partiellen Autokorrelationsfunktion PACF für alle Lags k nicht signifikant verschie-
den von null, also „bereits ausgestorben“, dann handelt es sich um einen „reinen“ stochas-
tischen Prozess, der auch als „weißes Rauschen“ gekennzeichnet wird und „nur“ mittels
eines ARIMA(0, 0, 0)-Modells beschrieben werden kann. Ein zum Grade d integrierter
stochastischer Prozess, der auf einem reinen stochastischen Prozess beruht und mittels ei-
nes ARIMA(0, d, 0)-Modells beschrieben werden kann, wird auch als „Irrweg“ oder
„Random Walk“ bezeichnet. Regel 3. Sind für einen schwach stationären stochastischen
Prozess in Folge die ersten p < k Koeffizienten PACF(k) der partiellen Autokorrelations-
funktion PACF signifikant verschieden von null und sterben die Koeffizienten ACF(k)
der Autokorrelationsfunktion ACF mit zunehmendem Lag k rasch aus, dann ist ein
AR(p)- bzw. ein ARIMA(p, 0, 0)-Modell zur Nachbildung des schwach stationären
stochastischen Prozesses bzw. ein ARIMA(p, d, 0)-Modell für einen zum Grade d inte-
grierten stochastischen Prozesses geeignet. Regel 4. Sind für einen schwach stationären
stochastischen Prozess in Folge die ersten q < k Koeffizienten ACF(k) der Autokorrelati-
onsfunktion ACF signifikant verschieden von null und sterben die Koeffizienten
PACF(k) der partiellen Autokorrelationsfunktion PACF mit zunehmendem Lag k rasch
aus, dann ist ein MA(q)- bzw. ein ARIMA(0, 0, q)-Modell zur Nachbildung des schwach
stationären stochastischen Prozesses bzw. ein ARIMA(0, d, q)-Modell für einen zum Gra-
de d integrierten stochastischen Prozesses geeignet. Regel 5: Sterben sowohl die Koeffi-
zienten ACF(k) der Autokorrelationsfunktion ACF als auch die Koeffizienten PACF(k)
der partiellen Autokorrelationsfunktion PACF mit zunehmendem Lag k rasch aus, dann
ist ein ARMA(p, q)- bzw. ein ARIMA(p, 0, q)-Modell zur Nachbildung des schwach statio-
nären stochastischen Prozesses bzw. ein ARIMA(p, d, q)-Modell für einen zum Grade d
integrierten stochastischen Prozesses geeignet. Die Modellparameter der Ordnung p und q
sind aus den Zeitreihendaten zu schätzen und statistisch auf Signifikanz zu prüfen. i
ARIMA-Modell. In den Abbildungen 10.4-14 und 10.4-15 sind die Spezifika-
tion und die geschätzten Parameter des inhomogenen (mit einer Ausgleichskon-
stanten konstruierten) ARIMA(2, 1, 0)(0, 1, 0)-Modells zusammengefasst. Auf-
grund dessen, dass für die beiden AR-Parameter der Ordnung p = 1 und p = 2 das
empirische Signifikanzniveau mit D* = 0,001 bzw. D* = 0,003 kleiner ist als das
auf D = 0,05 festgelegte Signifikanzniveau, deutet man den geschätzten autore-
gressiven Koeffizienten in Höhe von -0,423 und -0,382 als signifikant verschie-
den von null und die autoregressiven Komponenten neben der Trend- und der
Saisonkomponente als wesentliche Faktoren zur statistischen Erklärung der mo-
natlichen Fluggästezahlen.
404 Zeitreihenanalyse
Abbildung 10.4-14: ARIMA-Modellspezifikation

Modellspezifikation: ARIMA(2,1,0)(0,1,0)

Prognose. In der Abbildung 10.4-15 sind auszugsweise die prognostizierten


Fluggästezahlen für den Prognosezeitraum
TP ={t | t = 73, 74,…, 84} = {t*| t*= Jan 2015, ..., Dezember 2015}
von der Länge h = 12 Monate sowie das zugehörige Sequenzdiagramm mit den
beobachteten und prognostizierten Fluggästezahlen dargestellt.
Abbildung 10.4-13: Prognosewerte für das ARIMA(2,1,0)(0,1,0)-Modell

Modellprognose

JANUS-Koeffizient. Bleibt noch zu vermerken, dass im Gegensatz zu den bei-


den vergleichsweise „einfachen“ Trend-Saison-Modellen, deren Konstruktion im
Abschnitt 10.3 skizziert wurde, der JANUS-Koeffizient für das „kompliziertere“
ARIMA-Modell wegen J # 2,180 > 1 die vergleichsweise „geringste“ Prognosegü-
te der Fluggästezahlen für das erste Quartal 2015 indiziert. h

Das könnte Ihnen auch gefallen