Beruflich Dokumente
Kultur Dokumente
10
Zeitreihenanalyse
Schlüsselwörter
10.1 Zeitreihen
Motivation. In der empirischen Wirtschaftsforschung im Allgemeinen und in der
angewandten Statistik und Ökonometrie im Speziellen ist man vor allem zu
prognostischen Zwecken an der Betrachtung von Merkmalswerten eines metri-
schen Erhebungsmerkmals in seiner zeitlichen Entwicklung interessiert. Das
führt unmittelbar zum statistischen Begriff einer Zeitreihe.
Zeitreihe
Eine Zeitreihe {yt, t = 1,2,...,n} ist eine zeitlich geordnete Folge von Merkmals-
werten yt eines metrischen statistischen Erhebungsmerkmals Y eines sachlich
und örtlich wohl definierten Merkmalsträgers J.
Hinweise. Für das Verständnis des statistischen Konstrukts einer Zeitreihe er-
weisen sich die folgenden Hinweise als hilfreich: i) Merkmalsträger. Der
Merkmalsträger kann sowohl ein reales Objekt oder ein Vorgang als auch eine
statistische Gesamtheit von Merkmalsträgern sein. ii) Zeitvariable. Um eine Zeitreihe
{yt, t = 1,2,...,n}, die formal als eine Menge von Merkmalswerten yt dargestellt wird, ei-
ner statistischen Analyse zugänglich machen zu können, ist die Vereinbarung einer ge-
eigneten Zeitvariablen erforderlich, welche die Chronologie (grch.: chronos o Zeit + lo-
gos o Lehre), also die zeitlich logische Abfolge eines statistisch beobachteten Zustandes
oder Prozesses widerspiegelt. In der Zeitreihenanalyse hat sich die Bezeichnung ti
(i = 1,2,...,n) für eine Zeitvariable durchgesetzt (lat.: tempus bzw. engl.: time o Zeit). Da
in den folgenden Abschnitten ausschließlich Zeitreihen betrachtet werden, die auf einer
äquidistanten (lat.: aequus o gleich + distantia o Abstand) Zeitvariablen t beruhen, ge-
nügt es, die Zeitvariable t nur auf den natürlichen Zahlen variieren zu lassen, so dass
t = 1,2,...,n gilt. Dies hat den Vorteil, dass die Zeitvariable t gleichzeitig als Zeiger bzw.
als Index (lat.: index o Register, Verzeichnis) für die zeitlich geordneten Werte yt einer
Zeitreihe {yt, t = 1,2,...,n} und als äquidistante Zeitvariable t fungieren kann. iii) Index-
mengen. In der Zeitreihenanalyse bedient man sich zur Beschreibung des Zeithorizonts
einer äquidistanten Zeitreihe {yt, t = 1,2,...,n} in der Regel der folgenden Indexmengen:
Während die Indexmenge TB = {t | t = 1,2,...,n} den Beobachtungszeitraum von der Län-
ge n, die Indexmenge TP = {t | t = n + 1, n + 2,..., n + h} den Prognosezeitraum von der
Länge h kennzeichnet, bezeichnet man die Vereinigungsmenge TR = TB TP aus den
beiden disjunkten (lat.: disiunctio o Trennung) Zeiträumen TB und TP als den Relevanz-
zeitraum TR von der Länge n + h. iv) Stochastischer Prozess. In Anlehnung an die Be-
trachtungen im Kontext zur Stochastik (vgl. Kapitel 6) kann eine empirisch beobachtete
Zeitreihe {yt, t T} auch als eine (mögliche) Realisierung eines stochastischen Prozesses
{Yt, t T} gedeutet werden. Ein stochastischer Prozess wird dabei als eine Folge von
Zufallsgrößen Yt aufgefasst, die über einem (endlichen) Zeitbereich T definiert sind. Im
Zuge der Modellierung eines stochastischen Prozesses {Yt, t T} in seinem zeitlichen
Verlauf wird unterstellt, dass er gleichsam in Vergangenheit, Gegenwart und Zukunft
existiert und nur zeitdiskret zu bestimmten äquidistanten Zeitpunkten t bzw. in bestimm-
ten äquidistanten Zeitintervallen t statistisch beobachtet wird, wobei der diskrete Zeitbe-
reich T = {t | t = 0, r1, r2,...} jetzt im Bereich der ganzen Zahlen variiert. i
Zeitreihenanalyse 367
Klassifikation. Ein Erhebungsmerkmal Y bzw. ein stochastischer Prozess Yt
kann im erfassungsstatischen Sinne hinsichtlich seiner Ausprägungen bzw. Rea-
lisationen yt zu bestimmten Zeitpunkten oder in bestimmten Zeitintervallen beo-
bachtet werden. Aus diesem Grunde unterscheidet man zwischen Zeitintervall-
reihen und Zeitpunktreihen.
Zeitintervallreihe
Eine Zeitreihe {yt, t = 1,2,...,n}, die den zahlenmäßigen Stand einer Erscheinung
oder eines Prozesses Y für bestimmte Zeitintervalle t angibt bzw. beschreibt,
heißt Zeitintervallreihe.
Hinweise. Für das Verständnis des statistischen Konstrukts einer Zeitintervall-
reihe erweisen sich die folgenden Hinweise als hilfreich: i) Charakteristikum.
Kennzeichnend für eine Zeitintervallreihe ist, dass sich die Zeitreihenwerte yt auf
eine Folge von (meist äquidistanten) Zeiträumen t beziehen. Dabei wird für jeden Zeit-
raum t ein Wert yt statistisch erfasst, der durch das Wirken des beobachteten Prozesses Y
während des gesamten Zeitraumes entstanden ist. Zwischenwerte sind nicht nur nicht er-
fasst, sie existieren per definitionem auch nicht. ii) Beispiele. Charakteristische ökonomi-
sche Zeitintervallreihen sind zum Beispiel der mengen- oder wertmäßige Monats-, Quar-
tals- oder Jahresumsatz eines Unternehmens. i
Zeitpunktreihe
Eine Zeitreihe {yt, t = 1,2,...,n}, die den zahlenmäßigen Stand einer Erscheinung
oder eines Prozesses Y zu bestimmten Zeitpunkten t angibt, heißt Zeitpunktreihe.
Hinweise. Für das Verständnis des statistischen Konstrukts einer Zeitpunktreihe
erweisen sich die folgenden Hinweise als hilfreich: i) Charakteristikum. Die
Wesenheit einer Zeitpunktreihe besteht darin, dass die Zeitreihenwerte yt für eine
genau festgelegte Folge von (meist äquidistanten) Erfassungsmomenten t statistisch erho-
ben werden. ii) Beispiele. Typische ökonomische Zeitpunktreihen sind zum Beispiel der
Bevölkerungsstand eines Territoriums jeweils am Jahresende, der Bargeldbestand einer
Kasse jeweils am Ende eines Geschäftstages, die Spareinlagenhöhe inländischer Privat-
personen jeweils am Jahresende oder der Kassakurs eines Wertpapiers am Ende eines
Börsentages. iii) Spezifikum. Zeitpunktreihen sind untrennbar verbunden mit der statisti-
schen Erhebung von Beständen über die Zeit hinweg. Während die Zeitreihenanalyse auf
die Analyse von Beständen in ihrer zeitlichen Entwicklung abstellt, hat die Bestandsana-
lyse die statistische Analyse eines Bestandes aus seinen Zugängen und seinen Abgängen
zum Gegenstand. i
Sequenzdiagramm. Der zeitliche Verlauf eines Zustandes oder Prozesses,
kann mit Hilfe eines Sequenzdiagramms grafisch dargestellt werden.
Sequenzdiagramm
Die grafische Darstellung von Zeitreihenwerten yt einer Zeitreihe {yt, t TR} in
einem kartesischen Koordinatensystem mit Hilfe eines Polygonzuges bzw. einer
Trajektorie heißt Sequenzdiagramm.
368 Zeitreihenanalyse
Hinweise. Für die Konstruktion und Interpretation eines Sequenzdiagramms er-
weisen sich die folgenden Hinweise als hilfreich: i) Konstruktion. Ein Sequenz-
diagramm (lat.: sequentia o Aufeinanderfolge) ist ein Liniendiagramm in Gestalt
eines Polygonzuges (grch.: polys o viel + gonia o Winkel) bzw. einer Trajektorie (lat.:
traicere o hinübertragen), bei dem in der Regel auf der Abszisse die Zeitvariablenwerte t
und auf der Ordinate die Zeitreihenwerte yt einer Zeitreihe {yt, t = 1,2,...,n} abgetragen
werden. ii) Interpretation. Bei der Interpretation eines Sequenzdiagramms ist zu beach-
ten, dass die Zeitreihenwerte yt nur für die Zeitvariablenwerte t beobachtet wurden. Zwi-
schenwerte sind nicht definiert bzw. existieren nicht. Der Polygonzug bzw. die Trajekto-
rie zwischen den Punkten {(t, yt), t = 1,2,...,n} ist streng genommen nicht zulässig und
dient lediglich einem besseren Sichtbarmachen des zeitlichen Verlaufes eines beobachte-
ten und in einer Zeitreihe {yt, t = 1,2,...,n} erfassten Prozesses. i
Beispiel 10.1-1: Zeitintervallreihe
Motivation. Die SPSS Datendatei Flug.sav beinhaltet die Zeitreihe, welche die
Anzahl Y der FLUGgäste (Angaben in 1000 Personen) beschreibt, die jeweils im
Verlaufe eines Monats auf den Berliner Flughäfen statistisch erfasst wurde. Die
Zeitreihe {yt, t = 1,2,...,n} ist ihrem Wesen nach eine Zeitintervallreihe. Dies er-
klärt sich sachlogisch daraus, dass die Anzahl Y der Fluggäste aus statistisch-
methodischer Sicht ein ökonomischer Prozess ist, der nicht zu einem bestimmten
Zeitpunkt t, sondern nur in einem bestimmten Zeitraum t statistisch erfasst wer-
den kann. Da im konkreten Fall die Anzahl Y der Fluggäste auf den Berliner
Flughäfen für den Beobachtungszeitraum von Januar 2009 bis Dezember 2014
chronologisch erfasst wurde, hat man wegen a = 6 „vollständigen“ Wirtschafts-
jahren (lat.: anus o Jahr) mit jeweils m = 12 Monaten (lat.: mensis o Monat)
letztlich eine äquidistante (lat.: aequus o gleich + distantia o Abstand) und zu-
gleich unterjährige Zeitintervallreihe {yt, t = 1,2,...,n} mit n = 6 u 12 = 72 monat-
lichen Zeitreihenwerten yt verfügbar.
Zeitvariable. Für eine statistische Analyse, Modellierung und Prognose der
monatlichen Fluggästezahlen erweist es sich als erforderlich, eine geeignete
Zeitvariable t zu vereinbaren. Da es sich bei den Fluggästezahlen um eine äqui-
distante Zeitintervallreihe handelt, kann man sich in Anlehnung an das Beispiel
4.6.4-2 zum Beispiel mit Hilfe der SPSS Funktion $CASENUM eine äquidistante
Zeitvariable t erzeugen, die für den ersten Zeitreihenwert y1 = 1330 (1000 Flug-
gäste) den Wert t = 1 und in logischer Konsequenz für den letzten statistisch er-
fassten Zeitreihenwert y72 = 2058 (1000 Fluggäste) den Wert t = 72 annimmt.
Gleichwohl diese Form der Zeitvariablenvereinbarung leicht nachvollziehbar ist,
erweist sie sich vor allem bei der statistischen Analyse und Modellierung von
unterjährigen Zeitreihendaten als nicht ausreichend.
Datum definieren. Sehr hilfreich und nützlich erweisen sich Zeitvariablen,
die man in SPSS via Sequenz 10.1-1 aus einer breiten Palette von Variablenkon-
strukten erzeugen und für eine Zeitreihenanalyse verwenden kann.
Zeitreihenanalyse 369
Sequenz 10.1-1: Datum definieren
Daten
Datum definieren o Abbildung 10.1-1
Abbildung 10.1-1: SPSS Dateneditor mit Dialogfeld Datum definieren
In der technischen Wertpapieranalyse benutzt man in der Regel nicht die originä-
ren, sondern die logarithmierten Schlusskurse eines Wertpapiers. Ungeachtet die-
ses später noch zu motivierenden und zu erklärenden Spezifikums wird aus den
beiden Sequenzdiagrammen innerhalb der Abbildung 10.1-4 ersichtlich, dass im
Beobachtungszeitraum TB die börsentäglichen Schlusskurse yt der Daimler-Aktie
durch einen volatilen (lat.: volare o beweglich) Verlauf gekennzeichnet sind,
der (etwa im Unterschied zur Zeitreihe der Fluggästezahlen in der Abbildung
10.1-3) augenscheinlich nicht saisonal bedingt ist. h
372 Zeitreihenanalyse
MA7 MA12
Mit der Hilfe der gleitenden Durchschnitte werden die statistisch beobachteten
monatlichen Schwankungen der Fluggästezahlen in einem augenscheinlichen
Maße „gedämpft“ und „geglättet“. Mehr noch: Während die zentrierten gleiten-
den Durchschnitte zum Stützbereich von r = 7 Monaten (MA7) einen ansteigen-
den und sinusförmigen Verlauf indizieren, werden durch die zentrierten gleiten-
den Durchschnitte zum Stützbereich von r = 12 Monaten (MA12), der mit der
Periodizität der Fluggästezahlen von m = 12 Monaten identisch ist, die saisona-
Zeitreihenanalyse 375
len Schwankungen eliminiert, so dass die linear ansteigende Entwicklungsrich-
tung der monatlichen Fluggästezahlen im Beobachtungszeitraum TB noch besser
sichtbar wird.
Analysebefunde. Bemerkenswert sind im konkreten Fall zwei elementare und
zugleich augenscheinliche Analysebefunde: Zum einen sind die Fluggästezahlen
im Beobachtungszeitraum TB durch eine steigende Tendenz gekennzeichnet, die
offensichtlich hinreichend genau durch eine Gerade bzw. durch eine lineare
Trendfunktion beschrieben werden kann. Zum anderen wird dieser lineare Trend
in den monatlichen Fluggästezahlen noch durch einen volatilen, sinusförmigen
und offensichtlich saisonal bedingten Verlauf überlagert und getragen. Diese
beiden allein mittels der gleitenden Durchschnittstrajektorien augenscheinlichen
Phänomene gilt es bei der Konstruktion eines geeigneten Zeitreihenmodells zur
kurzfristigen statistischen Vorausberechnung der monatlichen Fluggästezahlen
zu berücksichtigen. Die Konstruktion eines geeigneten Trend-Saison-Modells ist
ein spezieller Gegenstand des Abschnitts 10-3. h
Beispiel 10.2-2: Gleitende Durchschnitte für DAX-Schlusskurswerte
Motivation. In Weiterführung des Beispiels 10.1-2 soll unter Verwendung der
SPSS Datendatei Daimler.sav mit Hilfe von gleitenden Durchschnitten die Zeit-
punktreihe {yt, t = 1,2,...,n} der n = 246 im Wirtschaftsjahr 2014 börsentäglich
erfassten Schlusskurse yt der Aktie der Daimler AG derart geglättet werden, dass
die Entwicklungsrichtung der Schlusskurse im Beobachtungszeitraum
TB = {t | t = 1,2,...,246} = {t* | t* = 6. Januar 2014,…, 19. Dezember 2014}
augenscheinlicher wird.
Abbildung 10.2-3: SPSS Dateneditor und Dialogfeld Zeitreihen erstellen
PMA
MA
Im konkreten Fall ist es leicht nachvollziehbar, dass die Trajektorien der „ge-
stutzten“ Zeitreihen der gleitenden Durchschnitte MA und PMA zum Stützbe-
reich von 50 Börsentagen wegen
r = 2 u k = 50 und k = 50 / 2 = 25 sowie
n (2 u k) = 246 – (2 u 25) = 196
jeweils aus 196 gleitenden Durchschnittswerten bestehen, die lediglich „zeitlich
verschoben“ im jeweiligen Sequenzdiagramm abgebildet werden. Während zum
Beispiel der gleitende Durchschnitt der Ordnung i = 221, der aus den „letzten“ 50
beobachteten Schlusskursen {yt, t = 171, 172,…,221} berechnet wurde und ge-
mäß Abbildung 10.2-3 einen Wert von MA221 # 63,41 Punkten lieferte, als loga-
rithmierter zentrierter gleitender Durchschnitt ln(63,41) # 4.1496 im linken Se-
quenzdiagramm in der „zeitlichen Mitte“ zum Zeitvariablenwert
t = 196 + 50 / 2 = 221
abgebildet wurde, erfolgte seine grafische Darstellung im rechten Sequenzdia-
gramm als logarithmierter zurückgreifender gleitender Durchschnitt PMA „zeit-
verschoben“ zum Zeitvariablenwert t = 196 + 50 = 246.
Kernaussage. Im der technischen Wertpapieranalyse würde man den Schluss-
kursen der Daimler-Aktie im Beobachtungszeitraum TB insgesamt eine Hausse
(frz.: hausse o Anstieg) zuschreiben, die zwischenzeitlich durch eine Baisse
(frz.: baisse o Rückfall) überlagert wird und sowohl im MA- als auch im PMA-
gestützten Chart (engl.: chart o Zeichnung) bildhaft untermauert wird. h
Zeitreihenanalyse 377
10.3 Trend-Saison-Modelle
Motivation. Die in diesem Abschnitt skizzierten Trend-Saison-Modelle stellen
auf die statistische Beschreibung und Modellierung der Trendkomponente yt*
und/oder der Saisonkomponente st* einer äquidistanten Zeitreihe {yt, t = 1,2,...,n}
ab. In praxi häufig konstruierte und applizierte Trend-Saison-Modelle sind das
additive und das multiplikative Trend-Saison-Modell. Beide Modelle finden vor
allem wegen ihrer Einfachheit, Praktikabilität und Leistungsfähigkeit bei der
kurzfristigen statistischen Vorausberechnung von trendbehafteten und/oder sai-
sonal bedingten Prozessen eine breite Anwendung.
Trend-Saison-Modell
Ist {yt, t = 1,2,...,n} eine äquidistante Zeitreihe, die einen trendbehafteten und/
oder einen saisonal bedingten Prozess zahlenmäßig beschreibt, dann kennzeich-
nen die Modelle yt = yt** + ut = yt* + st* + ut bzw. yt = yt** + ut = yt* u st* + ut
ein additives bzw. ein multiplikatives Trend-Saison-Modell zur statistischen Pro-
zessbeschreibung.
Hinweise. Für die Charakteristik und für die Konstruktion eines additiven bzw.
multiplikativen Trend-Saison-Modells erweisen sich die folgenden Hinweise als
hilfreich und nützlich: i) Additives Modell. Bei einem additiven Modell wird un-
terstellt, dass die Zeitreihenwerte yt durch drei sich in ihrer Wirkung additiv überlagernde
Komponenten beschrieben werden können: durch eine Trendkomponente in Gestalt eines
Trendmodells yt* (engl.: trend o Richtung), durch eine Saisonkomponente st* (frz.: sai-
son o Jahreszeit) und durch eine Residualkomponente ut (lat.: residuum o Rest). In die-
se Betrachtung sind wegen yt = yt* + ut bzw. yt = st* + ut die Spezialfälle eines Trend-
bzw. eines Saisonmodells eingeschlossen. yt** = yt* + st* bezeichnet den Modellwert
zum Zeitpunkt t. Charakteristisch für die Saisonkomponente st* in einem additiven
Trend-Saison-Modell ist die Existenz periodisch wiederkehrender und in ihrem Ausmaß
mehr oder weniger gleichbleibender bzw. homoskedastischer (grch.: homos o gleich +
skedastikos o abweichen, streuen) Schwankungen der Zeitreihenwerte yt um die Werte
yt* des Trendmodells. ii) Multiplikatives Modell. In der Zeitreihenanalyse werden ver-
schiedene Versionen eines multiplikativen Trend-Saison-Modells appliziert. Für die wei-
teren Betrachtungen wird die multiplikative Verknüpfung yt* u st* einer Trendkomponen-
te in Gestalt einer Trendfunktion yt* mit einer Saisonkomponente st* und deren additive
Überlagerung durch eine Residualkomponente ut angenommen. yt** = yt* u st* bezeich-
net den Modellwert zum Zeitpunkt t. Charakteristisch für die Saisonkomponente st* in ei-
nem multiplikativen Modell ist die Existenz periodisch wiederkehrender und sich in ih-
rem Ausmaß mehr oder weniger proportional zum Verlauf des Trendmodells yt* verhal-
tender saisonaler bzw. heteroskedastischer (grch.: heteros o anders, verschieden + ske-
dastikos o abweichen, streuen) Schwankungen st* in den Zeitreihenwerten yt. iii) Bei-
spiele. Während die Trend-Saison-Modelle in den Beispielen 10.3-1 und 10.3-2 „per
Hand gebastelt“ wurden, können in SPSS Zeitreihen auch mittels des sogenannten Expert
Modeler auf automatisiertem und heuristischem (grch.: heuriskein o finden) Wege ana-
lysiert und modelliert werden. i
378 Zeitreihenanalyse
Beispiel 10.3-1: Additives Trend-Saison-Modell
Motivation. Die äquidistante Zeitintervallreihe der monatlichen Fluggästezahlen
aus der SPSS Datendatei Flug.sav soll für den Beobachtungszeitraum
TB = {t | t = 1,2,...,72} = {t* | t* = Jan 2009,..., Dez 2014}
mit Hilfe eines geeigneten Trend-Saison-Modells beschrieben werden. Mit Hilfe
des Modells gilt es, die monatlichen Fluggästezahlen für das Jahr 2015 zu prog-
nostizieren und dabei das sogenannte ex-post-Prognosekonzept zu skizzieren
(vgl. Beispiel 10.3-3).
Trendkomponente. Im Beispiel 10.2-1 wurde mit Hilfe der Methode der glei-
tenden Durchschnitte für die Zeitreihe des monatlichen Fluggästeaufkommens
auf den Berliner Flughäfen ein linear steigender Trend diagnostiziert. Die ge-
schätzten Parameterwerte und der Graph des linearen Trendmodells
y*(t) = 1677,522 + 10,067 u t
zur Beschreibung der Entwicklungsrichtung der monatlichen Fluggästezahlen yt
in Abhängigkeit von der Zeitvariablen t TB sind gemeinsam mit dem SPSS
Dateneditor, dem Sequenzdiagramm und dem Ergebnisprotokoll in der Abbil-
dung 10.3-2 dargestellt.
Abbildung 10.3-2: SPSS Dateneditor mit Sequenzdiagramm und Protokoll
Aus statistisch-methodischer Sicht und mit Bezug auf die paradigmatischen Be-
trachtungen im Kontext der Abschnitte 9.1 und 9.3 kann das lineare Trendmodell
y*(t) = 1677,522 + 10,067 u t
als eine inhomogene bivariate lineare Kleinste-Quadrate-Regressionsfunktion der
monatlichen Fluggästezahlen yt über der Zeitvariablen t TB gedeutet werden.
Im konkreten Fall wurden die erforderlichen Kennzahlen für das lineare Trend-
modell via Analysieren, Regression, Kurvenanpassung in der Rubrik Modelle
über die Option linear angefordert.
Parameterinterpretation. Die mit Hilfe der Methode der kleinsten Quadrate-
summe aus den beobachteten Fluggästezahlen yt geschätzten und in der Abbil-
Zeitreihenanalyse 379
dung 10.3-2 in der Rubrik Parameterschätzer aufgelisteten Trendparameter kön-
nen wie folgt interpretiert werden: Unter Verwendung der inhomogenen linearen
Trendfunktion y*(t) = 1677,522 + 10,067 u t mit t TB hätte man wegen t = 0
das Fluggästeaufkommen im Dezember 2008 wegen
y*(0) = 1677,522 + 10,067 u 0 = 1677,522
auf 1,678 Millionen Fluggäste geschätzt. Unter sonst gleichen Bedingungen ist
im Beobachtungszeitraum TB wegen
dy* / dt = 10,067 (1000 Fluggäste pro Monat)
das Fluggästeaufkommen auf den Berliner Flughäfen von Monat zu Monat im
Durchschnitt um 10067 Fluggäste gestiegen.
Bestimmtheitsmaß. Aufgrund eines Bestimmtheitsmaßes von R² # 0,382 ist
man mit Hilfe der linearen Trendfunktion y*(t) = 1677,522 + 10,067 u t bereits
in der Lage, zu 38,2 % die Varianz der empirisch beobachteten Fluggästezahlen
yt auf den Berliner Flughäfen allein aus der Varianz der Zeitvariablen t statistisch
zu erklären. Der „verbleibende und nicht erklärte“ Varianzanteil der Fluggäste-
zahlen von (1 – 0,382) u 100 % = 61,8 % ist zweifelsfrei und augenscheinlich
vor allem den saisonal bedingten Schwankungen der Fluggästezahlen st um die
lineare Trendfunktion y*(t) geschuldet. Da offensichtlich die lineare Trendfunk-
tion y*(t) für brauchbare Prognosen der Fluggästezahlen allein wenig bzw. nicht
geeignet ist, bedarf es zudem noch einer sachlogischen und operationalen Be-
rücksichtigung und Modellierung der periodisch wiederkehrenden Schwankun-
gen in den Fluggästezahlen um die lineare Trendfunktion y*(t), die in der Zeit-
reihenanalyse unter dem Begriff einer Saisonkomponente st* subsumiert werden.
Unterjährigkeit. Bei der Modellierung einer Saisonkomponente st* für unter-
jährige und äquidistante Zeitreihendaten geht man davon aus, dass der Beobach-
tungszeitraum TB insgesamt a Ǧ Jahre und jedes Jahr insgesamt m Ǧ Unter-
zeiträume (etwa Tage, Wochen, Monate, Quartale, Tertiale, Halbjahre) umfasst,
wobei letztlich insgesamt n = a u m Zeiträume betrachtet werden, in denen der zu
analysierende ökonomische Prozess bzw. Zustand statistisch beobachtet wurde.
Die im Bereich der natürlichen Zahlen Ǧ = {1, 2, …} variierenden Variablen a
und m sollen der Anschaulichkeit und der symbolischen Assoziation halber für
die lateinischen Termini a(nus) o Jahr und m(ensis) o Monat stehen. Im Falle
der äquidistanten Zeitintervallreihe {yt, t = 1,2,...,n} der monatlichen Fluggäste-
zahlen yt umfasst der (eingangs vereinbarte) Beobachtungszeitraum TB die Jahre
2009 bis 2014, also insgesamt a = 6 Jahre. Aufgrund dessen, dass die Fluggäste-
zahlen yt monatlich erfasst wurden, beläuft sich die Anzahl m der Perioden eines
Jahres auf m = 12 Monate, so dass der Beobachtungszeitraum TB im betrachteten
Fall insgesamt n = a u m = 6 u 12 = 72 Monate und die beobachtete äquidistante
und unterjährige Zeitintervallreihe {yt, t = 1,2,...,n} insgesamt n = 72 zeitlich ge-
ordnete Fluggästezahlen yt umfasst.
380 Zeitreihenanalyse
Symbolik. Für die Modellierung einer saisonalen Komponente und für die
Konstruktion eines additiven Trend-Saison-Modells ist es aus vorteilhaft, die in
der Tabelle 10.3-1 vereinbarte Symbolik zu verwenden.
Tabelle 10.3-1: Trend-Saison-Modell-Symbole und ihre Semantik
Symbol Semantik
yjk Zeitreihenwert in Periode k = 1,2,...,m des Jahres j = 1,2,...,a
yjk* Trendwert in der Periode k des Jahres j
sjk = yjk yjk* Saisonwert in der Periode k des Jahres j (Trendresiduum)
sjk* durchschnittlicher Saisonwert in der Periode k des Jahres j
yjk**= yjk* + sjk* Modellschätzwert in der Periode k des Jahres j
Trendresiduen. Zur Modellierung der Saisonkomponente st* benötigt man
die für alle t = k + m u (j 1) TB die Abweichung st = yt yt* = sjk = yjk yjk*
der beobachteten Fluggästezahlen yt = yjk vom jeweiligen Trendwert yt* = yjk*.
Da es sich bei der linearen Trendfunktion yt* = y*(t) aus statistisch-methodischer
Sicht um eine inhomogene bivariate lineare Regressionsfunktion handelt, die mit
Hilfe der Methode der kleinsten Quadratesumme aus den Zeitreihendaten ge-
schätzt wurde, kann man für alle t TB die saisonal bedingten Schwankungen st,
die im konkreten Fall als Residuen (lat.: residuum o Rest) des linearen Trend-
modells y*(t) erscheinen, am einfachsten via Analysieren, Regression, Kurven-
anpassung berechnen, indem man analog zur Abbildung 10.3-3 im Unterdialog-
feld Kurvenanpassung: Speichern in der Rubrik Variable speichern die Optionen
Vorhergesagte Werte und Residuen vereinbart.
Abbildung 10.3-3: SPSS Dialogfelder Kurvenanpassung
Saisonkomponente
additives Trend-Saison-Modell
Modellprognose
Das praktizierte Prognose-Szenario lässt sich unter Verwendung der in den Ab-
bildungen 10.3-5 und 10.3-7 vermerkten Analysebefunde zum Beispiel für den
Monat August 2015 wie folgt skizzieren: Der Prognosezeitraum
TP = {t | t = 73, 74,..., 84} = {t* | t* = Jan 2015,..., Dez 2015}
erstreckt sich über h = 12 Monate, wobei man für den August 2015 wegen
j = 7, k = 8, m = 12 und t = 8 + 12 u (7 – 1) = 80
auf den Berliner Flughäfen ein Fluggästeaufkommen in Höhe von
y**(80) = 1677,522 + 10,067 u 80 + 177,260 # 2660,153
(1000 Fluggästen) bzw. von ca. 2,66 Millionen Fluggästen prognostiziert.
Prämisse. In diesem Zusammenhang ist es geboten, nochmals zu vermerken,
dass die praktizierte statistische Prognose der monatlichen Fluggästezahlen an
die sogenannte ceteris-paribus-Prämisse (lat.: ceteris paribus o (wenn) das Üb-
rig gleich (ist)) gebunden ist, wonach insbesondere die gleichen gesamtwirt-
schaftlichen und marktspezifischen Rahmenbedingungen unterstellt werden, die
im Beachtungszeitraum TB galten. h
Zeitreihenanalyse 385
Beispiel 10.3-2: Multiplikatives Trend-Saison-Modell
Motivation. In Anlehnung an das Beispiel 10.3-1, das den Bau und die Interpre-
tation eines additiven Trend-Saison-Modells zum Gegenstand hatte, soll im Kon-
text dieses Beispiels zum Zwecke eines Modellvergleichs die äquidistante Zeitin-
tervallreihe der monatlichen Fluggästezahlen (in 1000 Personen) aus der SPSS
Datendatei Flug.sav mit Hilfe eines multiplikativen Trend-Saison-Modells be-
schrieben und mit dessen Hilfe sowohl eine Prognose der Fluggästezahlen für das
Wirtschaftsjahr 2015 bewerkstelligt werden.
Trendkomponente. Zur statistischen Beschreibung der Entwicklungsrichtung
der Zeitreihe der Fluggästezahlen wird gemäß dem Beispiel 10.3-1 wiederum das
inhomogene lineare Trendmodell
y*(t) = 1677,522 + 10,067 u t
der monatlichen Fluggästezahlen yt in Abhängigkeit von der Zeitvariablen
t TB = {t | t = 1,2,...,72} = {t* | t* = Jan 2009,..., Dez 2014}
verwendet.
Saisonkomponente. Die Trajektorie der Trendresiduen st innerhalb der Ab-
bildung 10.3-4 zeigt vor allem für die unterdurchschnittlichen bzw. negativen
Trendresiduen einen „fallenden“ Trend, der nichts anderes beschreibt, als das
Faktum, dass die jeweiligen monatlichen Schwankungen st der Fluggästezahlen
mit dem steigenden Fluggästezahlentrend y*(t) auch in ihrem absoluten Niveau
stärker „ausschlagen“. In einem solchen Fall ist es angebracht, ein multiplikati-
ves Trend-Saison-Modell y**(t) zu konstruieren etwa derart, dass man die
Trendkomponente y*(t) und die Saisonkomponente st* multiplikativ verknüpft,
so dass jetzt y**(t) = y*(t) u st* gilt.
Abbildung 10.3-8: SPSS Dateneditor mit Dialogfeld Mittelwert
Saisonkomponente
Prognosezeitraum
Beobachtungszeitraum
Der Prognosezeitraum
TP = {t | t = 73, 74,..., 84} = {t* | t* = Jan 2015,..., Dez 2015}
erstreckt sich über h = 12 Monate, wobei man für den Mai 2015 wegen
j = 7, k = 5, m = 12 und t = 5 + 12 u (7 – 1) = 77
auf den Berliner Flughäfen unter sonst gleichen Marktbedingungen ein Fluggäs-
teaufkommen in Höhe von
y**(77) = (1677,522 + 10,067 u 77) u 1,070 # 2624,380
(1000 Fluggäste) bzw. von ca. 2,624 Millionen Fluggästen prognostiziert. h
388 Zeitreihenanalyse
Beispiel 10.3-3: Ex-post-Prognosekonzept
Motivation. Spätestens im Rahmen der nachfolgenden Ausführungen leuchtet es
ein, warum im Kontext der Beispiele 10.3-1 und 10.3-2 der Beobachtungszeit-
raum TB = {t | t = 1,2,…,72} = {t* | t* = Jan 2009,..., Dez 2014} zur Konstrukti-
on eines additiven und eines multiplikativen Trend-Saison-Modells für die Flug-
gästezahlen auf den Berliner Flughäfen auf die n = 72 Zeitreihenwerte yt be-
grenzt wurde, obgleich in der SPSS Datendatei Flug.sav insgesamt n = 76 Flug-
gästezahlen yt erfasst wurden: Einzig und allein, um die Grundidee einer soge-
nannten ex-post-Prognose (lat.: ex post o aus nachträglicher Sicht) paradigma-
tisch skizzieren zu können, die (vereinfacht formuliert) in einer Qualitätsbewer-
tung einer Modellprognose „im Nachhinein“ kulminiert.
JANUS-Koeffizient. In Anlehnung an den altrömischen Gott JANUS, der (ana-
log zum beigefügten Abbild einer sogenannten Janusmünze) mit einem Dop-
peltantlitz, nach innen (in den Beobachtungszeitraum) und nach außen (in den
Prognosezeitraum) schauend, bildhaft dargestellt wird, soll zur Bewertung der
Prognosegüte der sogenannte JANUS-Koeffizient J Ǯ+ mit
୬ା୦ ୬
ͳ ͳ
ൌ ඩቌ ή ሺ୲ െ ୲ ככሻଶ ቍ൙൭ ή ሺ୲ െ ୲ ככሻଶ ൱
୲ୀ୬ାଵ ୲ୀଵ
herangezogen werden, mit dessen Hilfe im konkreten Fall für den Prognosezeit-
raum in Gestalt des ersten Quartals 2015
TP = {t | t = 73, 74, 75, 76} = {t* | t* = Jan 2015,…,Apr 2015}
von der Länge h = 76 – 72 = 4 Monate die „ex post“ beobachteten yt Fluggäste-
zahlen den geschätzten yt** Fluggästezahlen und für den Beobachtungszeitraum
TB = {t | t = 1,2,…,72} = {t* | t* = Jan 2009,…,Dez 2014}
von der Länge n = 72 Monate die „ex ante“ beobachteten yt den geschätzten yt**
Fluggästezahlen vergleichend gegenübergestellt werden.
Regeln. Für eine Bewertung der Güte eines Zeitreihenmodells und einer da-
rauf basierenden Prognose mit Hilfe des dimensionslosen und für die Menge der
positiven reellen Zahlen Ǯ+ definierten JANUS-Koeffizienten gelten die folgenden
Regeln: Ein J # 1 indiziert homogene Streuungs- bzw. Abweichungsverhältnisse
von „ex-post“ beobachteten und prognostizierten Werten im Beobachtungs- und
im Prognosezeitraum. Ein J > 1 ist als ein Indiz für eine Verringerung und ein
J < 1 für eine Erhöhung der Prognosegüte eines Zeitreihenmodells zu deuten.
Residualquadratsumme. Für das im Kontext des Beispiels 10.3-1 konstruier-
te additive Trend-Saison-Modell erhält man im konkreten Fall die folgenden
Analyseergebnisse, wobei es im Falle eines numerischen Nachvollziehens vor-
Zeitreihenanalyse 389
teilhaft ist, zum Beispiel via Sequenz 10.3-2 analog zur Abbildung 10.3-12 im
SPSS Dialogfeld Distanzen die angezeigten Analyseschritte einerseits für den
Beobachtungszeitraum TB mit Hilfe des SPSS Filters Zeit <= 72 und andererseits
für Prognosezeitraum TP mittels des SPSS Filters Zeit >= 73 & Zeit <= 76 zu
bewerkstelligen.
Sequenz 10.3-2: Distanzen
Analysieren
Korrelation
Distanzen o Abbildung 10.3-12
Abbildung 10.3-12: SPSS Dateneditor mit Dialogfeld Distanzen
ex-post verfügbar
Basis: Prognosezeitraum
10.4 ARIMA-Modelle
Motivation. Im Unterschied zu den im Abschnitt 10.3 konstruierten und skiz-
zierten Trend-Saison-Modellen, die in der Regel auf die „bloße“ statistische De-
skription und Modellierung einer unterjährigen und saisonal bedingten Zeitreihe
{yt, t = 1,2,...,n} zum Zwecke ihrer kurzfristigen statistischen Vorausberechnung
abstellen, wird bei der Konstruktion von stochastischen Zeitreihenmodellen, wo-
runter auch die Familie der ARIMA-Modelle gehört, von der Prämisse ausgegan-
gen, dass eine zu modellierende Zeitreihe {yt, t T} ein „beobachtetes Abbild“
eines stochastischen Prozesses {Yt, t T} ist.
Stochastischer Prozess
Eine Folge {Yt, t T} von Zufallsgrößen Yt, die über einem (endlichen) Zeitbe-
reich T definiert ist, heißt stochastischer Prozess.
Hinweise. Für das Verständnis eines stochastischen Prozesses erweisen sich die
folgenden Hinweise als hilfreich: i) Zufallsgröße. Eine Zufallsgröße (vgl. Ab-
schnitt 6.4) ist eine reellwertige Funktion zur Beschreibung zufälligen Geschehens.
ii) Zeitbereich. In praxi geht man davon aus, dass ein stochastischer Prozess {Yt, t T}
gleichsam in Vergangenheit, Gegenwart und Zukunft existiert und nur zeitdiskret zu be-
stimmten äquidistanten Zeitpunkten bzw. Zeitintervallen t in Gestalt einer Zeitreihe
{yt, t TB} in einem „begrenzten Zeitfenster“ des abzählbar endlichen Zeitbereiches
T = {t | t = 0, r1, r2,...} statistisch beobachtet wird. iii) Charakterisierung. Für die Mo-
dellierung eines stochastischen Prozesses (etwa mit Hilfe eines ARIMA-Modells) ist seine
Charakterisierung und Identifikation im Kontext der Dichotomie von stationär (lat.: sta-
tionarius o stillstehend, zeitlich unveränderlich) oder integriert (lat.: integrare o einbe-
ziehen (einer Trend- und/oder Saisonkomponente)) erforderlich. iv) Integrationsgrad.
Im weitesten Sinne heißt ein stochastischer Prozess integriert zum Grade d Ǧ, wenn die
Differenzenfolge {'d yt, t = d + 1, d + 2,...} der Ordnung d = 0, 1, 2, … stationär ist. Der
griechische Großbuchstabe ' (lies: Delta) fungiert als Differenzen-Operator. 'd yt kenn-
zeichnet den Differenzenfilter der Ordnung d, der auf der Menge Ǧ der natürlichen Zah-
len mit 'dyt = '('d1yt) = 'd1yt 'd1yt1 rekursiv definiert ist und in seiner Konstruktion
und Anwendung auf integrierte und saisonale Zeitreihen erweitert werden kann. v) Sta-
tionarität. Ein stochastischer Prozess {Yt, t T} heißt (schwach) stationär, wenn für alle
t T (zumindest) der Erwartungswert E(Yt) = Pt = P und die Varianz V(Yt) = V²t = V² > 0
konstant bzw. zeitinvariant sind sowie für beliebige k = 1,2,... die Kovarianz C(Yt, Yt-k)
(und damit auch die sogenannte Autokorrelation) nur vom Timelag k (engl.: timelag o
Zeitverschiebung) abhängt. Stationäre stochastische Prozesse ermöglichen eine sinnvolle
und wahrscheinlichkeitstheoretisch begründete Zeitmittelbetrachtung. Diese Prämisse gilt
auch für die Konstruktion von ARIMA-Modellen. vi) ARIMA-Modell. Das Initialwort
ARIMA basiert auf dem englischen Terminus Auto-Regressive Integrated Moving Avera-
ge (Model) und kennzeichnet eine ganze Familie von Modellen zur Nachbildung autore-
gressiver und schockwirkungsbasierter stochastischer Prozesse, worin auch die Betrach-
tung saisonaler Komponenten eingeschlossen ist. Aus der Anzahl p der in Folge signifi-
kanten Autoregressionskoeffizienten, des Integrationsgrades d und der Anzahl q der in
392 Zeitreihenanalyse
Folge signifikanten Schockwirkungskoeffizienten, die mittels des BOX-JENKINS- Verfah-
rens identifiziert, spezifiziert und modelliert werden können, erklärt sich auch die in
SPSS übliche Notation und Spezifikation eines ARIMA(p, d, q)-Modells ohne saisonale
Komponenten bzw. eines ARIMA(p, d, q)(sp, sd, sq)-Modells mit saisonalen Komponenten.
vii) Korrelogramme. Als zwei nützliche Werkzeuge erweisen sich in der Diagnostik ei-
nes stochastischen Prozesses die Autokorrelationsfunktion ACF (engl.: Auto-Correlation-
Function) und die partielle (lat.: partialis o anteilig) Autokorrelationsfunktion PACF
(engl.: Partial-Auto-Correlation-Function), deren grafische Darstellungen auch als Kor-
relogramme bezeichnet werden und die aus statistisch-methodischer Sicht in einem un-
mittelbaren Zusammenhang mit der bivariaten und der partiellen linearen Maßkorrelati-
onsanalyse (vgl. Abschnitt 8.3) stehen. viii) Literaturhinweis. Eine paradigmatische Ein-
führung in die Konstruktion von ARIMA-Modellen unter Nutzung des sogenannten BOX-
JENKINS-Verfahrens, das nach den beiden britischen Statistikern Georg E. P. BOX
(*1919, †2013) und Gwilym M. JENKINS (*1932, †1982) benannt ist, findet man u.a. bei
ECKSTEIN, Peter P.: Angewandte Statistik mit SPSS – Praktische Einführung für Wirt-
schaftswissenschaftler, 8., aktualisierte Auflage, SPRINGER GABLER Wiesbaden 2015. i
Beispiel 10.4-1: ARIMA-Modell ohne saisonale Parameter
Motivation. In Anlehnung an das Beispiel 10.1-2 soll unter Verwendung der
SPSS Datendatei Daimler.sav die Zeitpunktreihe {yt, t = 1,2,...,n} der n = 246
börsentäglichen Schlusskurse yt der an der Frankfurter Börse notierten und im
Deutschen Aktienindex DAX gelisteten Aktie der Daimler Aktiengesellschaft
(Angaben in Punkten) mit Hilfe des sogenannten BOX-JENKINS-Verfahrens diag-
nostiziert werden mit dem Ziel, für die beobachteten Zeitreihenwerte ein geeig-
netes ARIMA-Modell zu konstruieren.
Korrelogramme. In der Abbildung 10.4-2 sind die via Sequenz 10.4-1 in Dia-
logfeld Autokorrelationen angeforderten Korrelogramme auf der Basis der origi-
nären und der logarithmisch transformierten Zeitreihenwerte dargestellt.
Sequenz 10.4-1: Korrelogramme
Analysieren
Vorhersage
Autokorrelationen o Abbildung 10.4-1
Abbildung 10.4-1: SPSS Dateneditor mit Dialogfeld Autokorrelationen
Zeitreihenanalyse 393
Abbildung 10.4-2: Korrelogramme, Basis: logarithmierte Schlusskurse
Prognose
Prognose
Prognose. In der Abbildung 10.4-8 sind auszugsweise die mit Hilfe des ARI-
MA(0, 1, 0)-Modells bestimmten Prognosewerte yt** für den Prognosezeitraum
TP = {t | t = 247,…, 256}
in der Variablen Arima aufgelistet und zugleich die Trajektorie der börsentägli-
chen Schlusskurse der Daimler-Aktie für den Relevanzzeitraum
TR = TB TP = {t | t = 151,…,256}
skizziert, worin auch die Prognosewerte für die verbleibenden und fiktiven
h = 10 Börsentage der ersten beiden Börsenwochen des Jahres 2015 eingeschlos-
sen sind. Beachtenswert ist dabei, dass die praktizierte Prognose der Schlusskur-
se der Daimler-Aktie letztlich nichts anderes darstellt als die Fortschreibung ei-
nes sogenannten Hausse-Trends (frz.: hausse o Anstieg, Aufschwung).
Gerade. Die kurzfristige Prognose der börsentäglichen Schlusskurse der
Daimler-Aktie mittels eines ARIMA(0, 1, 0)-Modells ist gemäß Abbildung 10.4-8
in ihrer bildhaften Darstellung nichts anderes als die „bloße Fortschreibung“ ei-
Zeitreihenanalyse 399
nes steigenden linearen Trends, den man sich analog zur Abbildung 10.4-9 so-
wohl grafisch als auch analytisch wesentlich einfacher wie folgt verdeutlichen
kann: Gemäß dem geometrischen Lehrsatz, wonach „eine Gerade die kürzeste
Verbindung zwischen zwei Punkten ist“, braucht man nur mit Hilfe eines Lineals
die Trajektorie der börsentäglichen Schlusskurse yt durch eine Gerade zu ergän-
zen, die den Anfangs- und den Endpunkt mit den Koordinaten
(t = 1, yt = 61,67) und (t = 246, yt = 68,93)
schneidet. In Anlehnung an die sogenannte Zwei-Punkte-Geradengleichung be-
stimmt man die zugehörige Geradengleichung
ሺͺǡͻ͵ െ ͳǡሻ
୲ ככൌ ሺሻ ൌ ͳǡ ή ǡ
ሺʹͶ െ ͳሻ
deren Graph in der Abbildung 10.4-9 für den Relevanzzeitraum TR = TB TP
von der Länge n + h = 246 + 10 = 256 Börsentage skizziert ist und mit deren Hil-
fe man zum Beispiel für den Börsentag der Ordnung t = 256 wegen
ככ
ሺͺǡͻ͵ െ ͳǡሻ
ଶହ ൌ ሺʹͷሻ ൌ ͳǡ ή ʹͷ ؆ ͻǡʹ
ሺʹͶ െ ͳሻ
einen Schlusskurs in Höhe von 69,26 Punkten prognostiziert.
Abbildung 10.4-9: Trajektorie mit linearem Trend
Modellspezifikation: ARIMA(2,1,0)(0,1,0)
Modellprognose