Beruflich Dokumente
Kultur Dokumente
Risikotheorie
Markus Riedle
Humboldt-Universität zu Berlin
2 Kollektives Modell 17
2.1 Das Modell . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
2.2 Schadenzahlverteilungen . . . . . . . . . . . . . . . . . . . . . . . . . 19
2.3 Approximation der Gesamtschadenverteilung . . . . . . . . . . . . . . 24
2.4 Approximation des individuellen Modells . . . . . . . . . . . . . . . . 27
2.5 Schadenhöhenverteilungen . . . . . . . . . . . . . . . . . . . . . . . . 29
3 Risikoprozesse 36
3.1 Verteilungen für den Schadenzahlprozess . . . . . . . . . . . . . . . . 37
3.2 Ruinwahrscheinlichkeiten im Cramér-Lundberg-Modell . . . . . . . . 38
3.2.1 Ruinwahrscheinlichkeiten . . . . . . . . . . . . . . . . . . . . . 38
3.2.2 Abschätzung der Ruinwahrscheinlichkeit im Cramér’schen Fall 40
3.2.3 Eine Integralgleichung . . . . . . . . . . . . . . . . . . . . . . 42
3.2.4 Erneuerungsgleichungen . . . . . . . . . . . . . . . . . . . . . 43
3.2.5 Asymptotik der Ruinwahrscheinlichkeiten im Cramér’schen Fall 44
3.2.6 Asymptotik der Ruinwahrscheinlichkeit bei subexponentiellen
Schadensverteilungen . . . . . . . . . . . . . . . . . . . . . . . 45
4 Prämienkalkulation 47
4.1 Nettorisikoprinzip . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
4.2 Prämienprinzipien auf Grundlage des Nettorisikoprinzips . . . . . . . 48
4.3 Implizit definierte Prämienprinzipien . . . . . . . . . . . . . . . . . . 49
4.3.1 Nullnutzenprinzip . . . . . . . . . . . . . . . . . . . . . . . . . 49
4.3.2 Exponentialprinzip . . . . . . . . . . . . . . . . . . . . . . . . 50
4.3.3 Schweizer Prinzip . . . . . . . . . . . . . . . . . . . . . . . . . 51
4.3.4 Verlustfunktionenprinzip . . . . . . . . . . . . . . . . . . . . . 52
4.4 Das Percentile-Prinzip . . . . . . . . . . . . . . . . . . . . . . . . . . 53
4.5 Eigenschaften von Prämienprinzipien . . . . . . . . . . . . . . . . . . 54
5 Credibility Prämie 56
5.1 Heterogenes Modell . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
5.2 Bühlmann Modell . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
6 Simulation 64
6.1 Simulation von Zufallszahlen . . . . . . . . . . . . . . . . . . . . . . . 64
6.2 Simulation von Risikoprozessen . . . . . . . . . . . . . . . . . . . . . 66
6.3 Simulation der Ruinwahrscheinlichkeit . . . . . . . . . . . . . . . . . 67
6.3.1 Monte-Carlo Simulation . . . . . . . . . . . . . . . . . . . . . 68
6.3.2 Ruinwahrscheinlichkeit mittels Pollaczek-Khintchine Formel . 72
6.3.3 Via importance sampling . . . . . . . . . . . . . . . . . . . . . 74
6.3.4 Via bedingter Monte-Carlo-Simulation . . . . . . . . . . . . . 75
A Appendix 101
A.1 Parameter von Verteilungen . . . . . . . . . . . . . . . . . . . . . . . 101
A.2 Faltung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 104
A.3 Laplace-Transformierte . . . . . . . . . . . . . . . . . . . . . . . . . . 106
A.4 Erzeugende Funktion . . . . . . . . . . . . . . . . . . . . . . . . . . . 108
Literaturverzeichnis 115
3
1 Individuelles Modell
[4]; [6];[9];[19]; [20];[13]
Definition 1.1
a) Eine nichtnegative Zufallsvariable X heißt Risiko.
b) Eine Menge {Xk : k = 1, . . . , n} von Risiken Xk heißt Portfolio.
Im individuellen Modell lässt sich ein Risiko Xk als der Schaden interpretieren,
der sich aufgrund des k-ten Versicherungsvertrages (Police) in dem betrachteten
Zeitraum, z.B. ein Jahr, ergibt. Offensichtlich ist dann die Gesamtsumme, die das
Versicherungsunternehmen in einem Jahr auszahlen muss, gleich der Summe Sn der
Risiken X1 , . . . , Xn .
4
Desweiteren werden wir oft folgende Annahmen treffen:
Wir betrachten zunächst den Einfluss der Erwartungswerte und Varianzen der Ri-
siken auf den Gesamtschaden.
1) Nehmen wir den Idealfall eines homogenen Portfolios {X1 , . . . , Xn } an, d.h die
Risiken Xk sind unabhängig und identisch verteilt mit
5
die Gesamtversicherungssumme des Portfolios bezeichnet, so erhält man
E [Sn ] = vm und VarSn = vs2 . (2)
Man beachte, dass in dem unter 2) diskutierten inhomogenen Modell stets auch
das homogene Modell enthalten ist, indem man uk = 1 für alle k = 1, . . . , n
setzt.
In diesem Modell wird insbesondere auch die Varianz anteilig der Versiche-
rungssumme modelliert. Anders dagegen, wenn wir Xk = uuk0 X0 angesetzt
u2k
hätten. Dann würde VarXk = u20
VarX0 gelten.
Ein Vorteil der Zusammenfassung von Risiken verschiedener Personen durch ein
Versicherungsunternehmen, ist der so genannte Ausgleich im Kollektiv, den wir an
dem oben angenommenen inhomogenen Portfolio erläutern wollen. Mittels der Werte
in (2) folgt
VarSn vs2 1 s2
= = .
(E [Sn ])2 (vm)2 v m2
√
Dies bedeutet, dass die Standardabweichung VarSn langsamer als der Erwartungs-
wert E [Sn ] bei sich vergrößernder Gesamtversicherungssumme v wächst. Mit der
Chebyschev-Ungleichung folgt für jedes ε > 0:
³ ´ 1 s2
P |Sn − E [Sn ]| > ε E [Sn ] 6 2 ,
ε vm2
d.h. die Wahrscheinlichkeit, dass der Gesamtschaden Sn um mehr als ε · 100% von
seinem Erwartungswert abweicht, wird bei wachsender Gesamtversicherungssum-
me v kleiner. Durch die Zusammenfassung der Risiken werden also günstige und
ungünstige Schadenverläufe der Einzelrisiken nivelliert.
Ein wesentlicher Bestandteil bei der Behandlung des individuellen Modells besteht
in der Konstruktion geeigneter stochastischer Modelle für die Risiken Xk , so dass
die daraus resultierende Verteilung der Gesamtschadensumme in gewisser Weise mit
Beobachtungen der vergangenen Jahre übereinstimmt. Hierzu schätzt man aufgrund
von gesammelten Daten vergangener Beobachtungsperioden etwa den Erwartungs-
wert und die Varianz der Verteilung des Gesamtschadens, um daraus Aussagen über
das Verhalten von Sn in der aktuellen Periode treffen zu können. Diesem liegen
jedoch einige Probleme zugrunde, wie z.B:
• eine nicht ausreichende Datenlage, um “gute” Schätzungen treffen zu können;
• die Verteilung von Sn verändert sich durch variierende Anzahl von Policen und
sich verändernden Versicherungssummen von Jahr zu Jahr, siehe z. B. (2).
Eine weitere Diskussion dieser Problematiken und deren Lösung findet man in [14,
S. 43f].
Wären die Verteilungen der Einzelrisiken Xk bekannt, so würde man auch die Ver-
teilung des Gesamtschadens zumindest aus mathematischer Sicht explizit kennen:
6
Theorem 1.3 Es sei {X1 , . . . , Xn } ein Portfolio von unabhängigen Risiken Xk mit
Verteilungen PXk . Dann gilt für die Verteilung PSn des Gesamtschadens Sn :
Jedoch sind im Allgemeinen die Verteilungen der Einzelrisiken nicht bekannt. Auf-
grund einer zu geringen Beobachtungsanzahl von Realisierungen der Risiken der
vergangenen Beobachtungsperioden lassen sich auch nicht unmittelbar Verteilungen
angeben, die die Einzelrisiken ausreichend gut modellieren.
Wir beenden diesen ersten Abschnitt mit der Vorstellung eines Algorithmus nach
DePril (siehe z.B. [18]) zur Berechnung der Verteilung des Gesamtschadens mittels
eines (spielerischen) Zahlenbeispiels aus [12]:
Die folgende Tabelle ist aufgeschlüsselt nach der Sterbewahrscheinlichkeit und der
versicherten Summe. Die Einträge geben die Anzahl der jeweiligen Verträge an.
pk 1 2 3 4 5
0.000505 0 1 1 2 6
0.000525 1 0 2 7 0
0.000552 1 1 3 3 2 Es gibt z.B. 7 Policen über eine Versiche-
rungssumme 4, die jeweils eine Sterbewahr-
0.000587 0 1 3 3 3
scheinlichkeit von 0.000525 haben.
0.000630 1 4 0 4 1
0.000680 2 2 2 2 2
0.000738 1 1 0 1 7
Man erhält nun für die Verteilungen PSk der k-ten Schadensumme Sk = X1 +· · ·+Xk :
PS1 = PX1
PSk+1 = PSk ∗ PXk+1 .
7
Wie in Beispiel A.15.b folgt:
Wird nun sukzessiv für jedes k die Wahrscheinlichkeit P (Sk+1 = j) für alle Werte
j ∈ N0 , die Sk+1 annehmen kann, berechnet, so gelangt man zu der Verteilung des
Gesamtschadens Sn .
Das in diesem Beispiel vorgestellte Verfahren lässt sich erweitern auf den Fall, in
dem die Risiken endlich viele und nicht nur zwei Werte annehmen können. Jedoch
stößt man trotz moderner Rechner ab gewissen Größen des Portfolios an die Grenze
der Berechenbarkeit.
• die “Hauptmasse” von PXk liegt in oder zumindest sehr dicht an der Null,
da in fast allen Bereichen der Schadenversicherung die Mehrzahl der Risiken
schadenfrei bleiben oder nur sehr geringe Werte annehmen, sogenannte Baga-
tellschäden.
• PXk ist eine zweiparametrige Verteilung, da wir nur von einer Schätzung des
Erwartungswertes und der Varianz der Gesamtschadenverteilung ausgehen.
Um auf die Verteilung des Gesamtschadens schließen zu können, ist folgende Eigen-
schaft von Nutzen:
1.2.1 Gammaverteilung
In der Funktionentheorie wird die so genannte Gammafunktion auf der gesamten
komplexen Ebene betrachtet und dort als meromorphe Funktion nachgewiesen, siehe
8
z. B. [8]. In unserem Fall dient sie der Normierung einer Dichte, wofür das Betrachten
der Gammafunktion auf der positiven reellen Achse ausreicht. Dort besitzt sie eine
Integraldarstelllung, die wir als Definition nutzen.
4
α = 125
3
α = 0.2
2
α = 25
α = 0.05
α=5
1 α=1
0.5 1 1.5 2
Abbildung 1: Dichte der Γ-Verteilung mit α = β für verschiedene Werte
Eine Diskussion der Gammafunktion findet man z.B. in [8]. Einige wesentliche Ei-
genschaften der Gammafunktion halten wir in dem folgenden Lemma fest:
9
Definition 1.7 Die Gamma-Verteilung Γ(α, β) zu den Parametern α, β > 0 ist die
Wahrscheinlichkeitsverteilung mit der Dichte
( α
β
sα−1 e−βs , für s > 0,
f (s) := Γ(α)
0, für s 6 0.
Lemma 1.10 Es bezeichne f = fα,β die Dichte einer Γ(α, β)-Verteilung. Dann gilt:
• für α < 1 ist die Dichte f monoton fallend auf R+ mit f (0+) = ∞. Der
Modalwert ist 0.
• für α = 1 ist die Dichte f monoton fallend auf R+ mit f (0+) = β. Der
Modalwert ist 0.
• für α > 1 ist die Dichte f monoton wachsend auf [0, α−1
β
) und monoton fallend
α−1 α−1
auf ( β , ∞) mit f (0+) = 0. Der Modalwert ist β .
Da gemäß unseren Überlegungen zu Beginn dieses Abschnittes die größte Masse der
Verteilungen der Risiken in oder nahe der Null liegen soll, bieten sich gemäß dem
vorangegangenen Lemma Parameterwerte α ∈ (0, 1) zur Modellierung der Verteilung
der Einzelrisiken an.
Als eine wünschenswerte Eigenschaft erwähnten wir die explizite Berechnungsmöglich-
keit von Faltungen der Verteilungen der Risiken.
10
Theorem 1.11 Es seien Γ(αk , β) Gammaverteilungen zu den Parametern αk > 0
für k = 1, . . . , n und dem Parameter β > 0. Dann gilt:
Mittels der Gammaverteilung lässt sich ein nicht homogenes Portfolio {X1 , . . . , Xn }
von unabhängigen Risiken modellieren. Wie in Abschnitt diskutiert, geht man von
einem Referenzrisiko X0 mit Versicherungssumme u0 und
1 1
m := E [X0 ] und s2 := VarX0
u0 u0
aus. Erwartungswert und Varianz eines Risikos Xk verhalten sich dann gemäß dem
Anteil der Versicherungssumme uk bezüglich der des Referenzrisikos.
für m, s2 > 0 und uk > 0 für k = 1, . . . , n. Dann gilt für den Gesamtschaden:
³ 2 ´
Sn ∼ Γ ms2 (u1 + · · · + un ), sm2 .
Mit der Γ(α, β)-Verteilung haben wir eine Verteilung kennengelernt, deren Modal-
wert für α < 1 gleich Null ist. Auch ermöglicht diese Verteilung eine Modellierung
eines nicht homogenen Portfolios von unabhängigen Risiken mit verschiedener Ver-
sicherungssumme. Die Verteilung des Gesamtschaden ist wieder eine Gammavertei-
lung.
Ein wesentlicher Nachteil der Gammaverteilung ist, dass bei der Maximum-Likeli-
hood-Methode keine explizite Auflösung nach dem Parameter α mölich ist, siehe
z.B. [14].
Wie bei der Gammaverteilung beginnen wir mit der Zusammenfassung einiger ein-
fachen Eigenschaften der Inversen-Gauss-Verteilung:
11
8
λ = 0.05
6
λ = 150
4
λ = 0.2
λ = 50
2
λ = 0.5 λ=5
λ=1
0.5 1 1.5 2
Abbildung 2: Dichte der IG-Verteilung für µ = 1 und verschiedene λ
12
Lemma 1.15 Für die Verteilungsfunktion F = Fλ,µ der Inversen-Gaussverteilung
IG(µ, λ) gilt:
Lemma 1.16 Es sei f = fµ,λ die Dichte einer IG(µ, λ)-Verteilung. Dann gilt: f ist
monoton wachsend auf [0, c) und monoton fallend auf (c, ∞) wobei
s
µ ¶2
3µ 3µ
c := µ 1 + − .
2λ 2λ
Auch mittels der Inversen-Gauss-Verteilung lässt sich ein nicht homogenes Portfolio
{X1 , . . . , Xn } von unabhängigen Risiken modellieren. Wie zuvor geht man von einem
Referenzrisiko X0 mit Versicherungssumme u0 und
1 1
m := E [X0 ] und s2 := VarX0
u0 u0
aus. Erwartungswert und Varianz eines Risikos Xk verhalten sich dann gemäß dem
Anteil der Versicherungssumme uk an der des Referenzrisikos.
für m, s2 > 0 und uk > 0 für k = 1, . . . , n. Dann gilt für den Gesamtschaden:
³ ´
m3 2
Sn ∼ IG m(u1 + · · · + un ), s2 (u1 + · · · + un ) .
13
Bemerkung 1.19 Geht man von vorgegebenem Erwartungswert und Varianz aus,
so lässt sich sowohl bei der Gammaverteilung wie auch bei der Inversen-Gauss-
Verteilung eindeutig auf die jeweiligen Parameter schließen. Zum Vergleich der Gam-
maverteilung und der Inversen-Gauss-Verteilungen betrachtet man deshalb zwei Zu-
fallsvariablen X und Y , die entsprechend diesen Verteilungen verteilt sind, jedoch
mit demselben Erwartungswert und Varianz. Bestimmt man dann die Parameter
der jeweiligen Verteilungen, lassen sich Schiefe und Exzess sowie Form der Dichten
miteinander vergleichen.
Die Inverse-Gauss-Verteilung besitzt dieselben positiven Eigenschaften wie die Gam-
maverteilung zur Modellierung der Verteilung der Einzelrisiken. Desweiteren besitzt
sie den Vorteil, dass beide Parameter sich mit der Maximum-Likelihood-Methode
schätzen lassen, siehe [14]
Die Inverse-Gauss-Verteilung besitzt aber gewisse Nachteile, falls Erwartungswert
und Varianz in einem engen Zusammenhang stehen, siehe ebenfalls [14].
1.2.3 Lognormalverteilung
In den zwei vorangegangenen Unterabschnitten haben wir die Gammaverteilung und
die Inverse-Gauss-Verteilung als eine realistische Verteilung für den Gesamtschaden,
ausgehend von denselben Verteilungen für die Risiken, ermittelt. In diesem Abschnitt
betrachten wir dagegen unmittelbar eine Verteilung für den Gesamtschaden, ohne
die Verteilung der einzelnen Risiken zu beachten.
X := exp(Y ) ∼ LN (θ, σ 2 ).
Deshalb lässt sich die Verteilungsfunktion der Lognormalverteilung mittels der Ver-
teilungsfunktion Φ der Standardnormalverteilung angeben:
14
8
σ = 0.05
6
4 σ = 1.7
σ = 0.1
2 σ = 1.5
σ=1 σ = 0.5
0.5 1 1.5 2
σ2
Abbildung 3: Dichte der LN-Verteilung mit exp(θ + 2
) = 1 und verschiedene σ
Lemma 1.23 Es sei f = fθ,σ2 die Dichte einer LN(θ, σ 2 )-Verteilung. Dann gilt: f
ist monoton wachsend auf (0, c) und monoton fallend auf (c, ∞) wobei
c := exp(θ − σ 2 ).
15
Bei Faltung der Lognormalverteilung verlässt man die Klasse der Lognormalver-
teilungen, weshalb durch diese nur die Verteilung des Gesamtschadens und nicht
auch der Einzelrisiken modelliert wird. Gerechtfertigt ist diese Modellierung durch
die Ähnlichkeit der Lognormalverteilung zu der Gammaverteilung und der Inversen-
Gauss-Verteilung. Ein wesentlicher Vorteil der Lognormalverteilung ist die Möglich-
keit der Rückführung auf die Normalverteilung, wodurch hervorragende statistische
Methoden zur Verfügung stehen. Einen weiteren Vorteil dieser Verteilung, “heavy
tailed” zu sein, werden wir später kennen lernen. Nachteile der Lognormalvertei-
lungen bestehen dadurch, dass die Laplace-Transformierte oder charakteristische
Funktion nicht in einer geschlossenen Form angegeben werden können.
16
2 Kollektives Modell
2.1 Das Modell
Bei der Behandlung des individuellen Modells steht die Modellierung des Erwar-
tungswertes und der Varianz der Gesamtschadenverteilung im Vordergrund. Dazu
setzten wir, bis auf verschiedene Versicherungssummen, ein homogenes Portfolio
voraus. Jedoch reicht die Kenntnis bzw. Schätzung von Erwartungswert und Vari-
anz nicht aus, um die Verteilung des Gesamtschadens ausreichend beschreiben zu
können, z.B. zur Tarifkalkulation. Auch kann in den meisten Situationen in der Pra-
xis nicht von einem homogenen Portfolio ausgegangen werden. Letzteres ließe sich
zwar durch Unterteilung des Versicherungsbestandes in homogene und unabhängi-
ge Gruppen erzielen, jedoch resultiert dies in Gruppen mit zu geringer Größe, um
effiziente Schätzmethoden anwenden zu können. Ohne die Annahme identischer Ver-
teilungen, bzw. ähnlicher Verteilungen der Risiken, ist das individuelle Modell nur
sehr schwer handhabbar und wenige Aussagen können getroffen werden.
Im kollektiven Modell (F. Lundberg, H. Cramér) wird versucht, die Beschränkung
auf homogene Portfolios zu vermeiden. Bei diesem Modellierungsansatz wird nicht
beachtet, welches Risiko einen Schaden verursacht, sondern das gesamte Portfolio
von Risiken wird als Produzent einer zufälligen Anzahl von Schäden einer Beobach-
tungsperiode betrachtet.
Wie zuvor besteht ein Portfolio {X1 , . . . , Xn : k ∈ N} aus Risiken Xk . Die Anzahl
der Schäden einer Beobachtungsperiode wird modelliert durch eine Zufallsvariable
N.
Bei der Behandlung des kollektiven Modells gehen wir wie teilweise zuvor von den
folgenden Annahmen aus:
• Endlichkeit der Streuung VarXk ;
• alle Zufallsvariablen N, X1 , X2 , . . . sind auf demselben Wahrscheinlichkeits-
raum (Ω, A , P ) definiert;
17
• Xk > 0 für alle k ∈ N.
Desweiteren werden wir meistens auch folgende Voraussetzungen annehmen:
• N, X1 , X2 , . . . sind unabhängig;
Die Unabhängigkeit der Risiken diskutierten wir bereits bei Behandlung des
individuellen Modells. Die Unabhängigkeit der Schadenzahl und der Scha-
denhöhen kann als realistisch betrachtet werden, aber auch hier kann eine ge-
nauere Betrachtung notwendig sein, z.B. Autohaftpflichtversicherung in einem
Winter mit besonders viel vereisten Fahrbahnen: viele, jedoch kleine Schäden.
• X1 , X2 , . . . sind identisch verteilt;
Zunächst scheint dies unserer Motivation für das kollektive Modell, der Ver-
meidung der Annahme von homogenen Portfolios, zu widersprechen. Jedoch
werden im kollektiven Modell die Schadenhöhen nicht bestimmten Risiken zu-
geordnet, sondern es wird die Gesamtheit aller Schäden betrachtet. Deshalb
kann sehr wohl eine identische Verteilung der Risiken angenommen werden,
wenn man sich die Realisierung dieser Verteilung als ein zweistufiges Expe-
riment vorstellt: zunächst wird zufällig eine bestimmte Verteilung (aus einer
Klasse von ähnlichen, jedoch verschiedenen Verteilungen) bestimmt, und dann
wird eine Realisation dieser zufällig bestimmten Klasse ausgewählt; siehe hier-
zu die Behandlung von gemischten Verteilungen in Abschnitt 2.2.
Zufallsvariablen der Form (3) werden zusammengesetzte Summenvariablen (com-
pound random variable) genannt und entsprechend ihre Verteilung zusammengesetz-
te Summenverteilung.
18
b) Bezeichnet GN die erzeugende Funktion von N und LX1 und LSN die jeweiligen
Laplace-Transformierten von X1 und SN , dann gilt:
Beispiel 2.5 Wir betrachten ein Portefolio {Xk : k ∈ N} von unabhängigen, iden-
tisch exponential verteilten Risiken Xk zu einem Parameter λ und einer geometrisch
verteilten Schadenzahl N :
λ(1 − p) λ2 (1 − p) λ(1 − p)
E [SN ] = , VarSN = +
p p2 p
2.2 Schadenzahlverteilungen
Betrachtet man die Schadenzahl N als die Summe von laplaceverteilten Zufalls-
variablen, die nur die Werte 0 oder 1 annehmen können, so ist N gemäß einer
Binomialverteilung verteilt.
Lemma 2.7
19
b) Sind Nk , k = 1, . . . , n unabhängige, binomialverteilte Zufallsvariablen zu den
Parametern mk ∈ N und p ∈ (0, 1), so gilt:
N1 + · · · + Nn ∼ b(m1 + · · · + mn , p).
20
Mittels Induktion zeigt man:
X∞ k−1
−(λ+κx) λk X (κx)j
P (SN 6 x) = 1 − e .
k=0
k! j=0 j!
Lemma 2.10
E [N ] = λ, VarN = λ.
N1 + · · · + Nn ∼ π(λ1 + · · · + λn ).
Zwar ist die Poissonverteilung auch wenig anpassungsfähig, da sie nur von einem
Parameter abhängt, jedoch ist sie leicht handzuhaben, da viele Rechnungen expli-
zit ausgeführt werden können. Ein wesentlicher Vorteil der Poissonverteilung ist die
folgende Möglichkeit der Aufteilung eines inhomogenen Portfolios in mehrere homo-
gene Portfolios.
In vielen Situationen kann ein inhomogenes Portfolio aufgeteilt werden in m ver-
schiedene Portfolios, die jeweils aus homogenen Risiken und einer poissonverteilten
Schadenzahl bestehen, z.B. in der PKW-Haftpflichtversicherung erfahrene und un-
erfahrene Fahrer. Den verschiedenen Portfolios können unterschiedliche Risikover-
teilungen Ql und unterschiedliche Schadenintensitäten λl der Schadenzahl Nl für
l = 1, . . . , m zugrunde liegen. Jeder Gesamtschaden Sl der verschiedenen Portfolios
besitzt dann die Verteilung:
∞
X λk l
PSl = e−λl Q∗k
l . (4)
k=0
k!
21
Dann gilt für S := S1 + · · · + Sm :
N
X
S∼ Yj ,
j=1
Satz 2.11 besagt, dass ein Portfolio unabhängiger, identisch verteilter Risiken und
einer poissonverteilten Zufallsvariablen bezüglich den Verteilungen als die Zusam-
menfassung mehrerer Portfolios mit unterschiedlich verteilten Risiken und Schaden-
zahlen aufgefasst werden kann.
Betrachtet man ein Portfolio über mehrere Jahre hinweg, so sind oft trendarti-
ge und oszillatorische Veränderungen der Schadenzahl zu beobachten. Trendartige
Veränderungen sind z.B. verbesserte Schadenverhütungsmaßnahmen wie Einbau von
Sprinkelanlagen. Oszillatorische Veränderungen sind Schwankungen in der mittleren
Schadenzahl, wie z.B. regenarme Sommer führen zu einer Zunahme von Bränden.
Die oszillatorischen Veränderungen können modelliert werden, indem man den Para-
meter λ einer poissonverteilten Schadenzahl als einen zufällig gewählten Wert gemäß
einer spezifizierten Verteilung betrachtet. Diese Verteilung modelliert die oszillato-
rischen Änderungen. Diese verbale Beschreibung resultiert in dem mathematischen
Begriff der Poissonmischung:
Definition 2.12 Es sei µ eine Verteilung auf (R+ , B(R+ )). Dann wird durch
Z
θk −θ
Q({k}) = e µ(dθ) für k ∈ N0 ,
R+ k!
ein Wahrscheinlichkeitsmaß Q auf (N0 , P(N0 )) definiert. Das Maß Q heißt Pois-
sonmischung bezüglich des Mischungsmaßes µ.
die Mischung der Verteilungen (pθ )θ>0 bezüglich des Mischungsmaßes µ definiert.
22
Beispiel 2.14
a) Falls die Verteilung µ das Dirac-Maß in c > 0 ist, so ist die Poissonmischung
Q bezüglich µ die Poissonverteilung zu dem Parameter c.
b) Falls die Verteilung µ eine Dichte f besitzt, so gilt für das Mischungsmaß Q
bezüglich µ:
Z
θk −θ
Q({k}) = e f (θ) dθ für k ∈ N0 .
R+ k!
c) Falls die Verteilung µ ein diskretes Maß ist mit µ({θj }) = qj , so gilt für das
Mischungsmaß Q bezüglich µ:
∞
X θjk
Q({k}) = e−θj qj für k ∈ N0 .
j=0
k!
23
ein Wahrscheinlichkeitsmaß definiert. Ist (N, T ) ein Zufallsvektor mit der Wahr-
scheinlichkeitsverteilung P̃ , so ist N gemäß der Poissonmischung Q verteilt und es
gilt:
θk −θ
P̃ (N = k|T = θ) = e .
k!
Das bedeutet, dass die Realisierung der Zufallsvariablen N als ein zweistufiges Ver-
fahren vorstellbar ist:
1) Man realisiert die Zufallsvariable T gemäß der Verteilung µ;
Bemerkung 2.17 Mit den Notationen des Korollars 2.16 betrachten wir noch den
so genannten Dispersionskoeffizient einer Poissonmischung Q bzw. der Zufallsvaria-
blen N :
VarN VarU
=1+ .
E [N ] E [U ]
Falls µ = δc , dann ist Q die Poissonverteilung zu dem Parameter c. Folglich ist der
Dispersionsquotient von gemischten Poissonverteilungen genau dann minimal, wenn
Q eine Poissonverteilung ist.
Theorem 2.18 Es sei N eine Zufallsvariable auf (N0 , P(N0 )). Dann sind äquiva-
lent:
1) N ist entweder binomial-, poisson-, negativ binomialverteilt oder P (N = 0) =
1;
24
2) es existieren a, b ∈ R, so dass gilt:
µ ¶
b
P (N = k) = a + P (N = k − 1) für alle k ∈ N . (5)
k
Falls die Risiken nur Werte auf einem Gitter {kh : k ∈ N0 } für h > 0 annehmen, gibt
der folgende Satz einen Algorithmus zur Berechnung der Gesamtschadenverteilung
an.
25
Definition 2.21 Für zwei Wahrscheinlichkeitsmaße Q1 , Q2 auf (R, B(R)) wird
folgende Relation definiert:
Lemma 2.22 Die in (7) definierte Relation ist eine Partialordnung auf dem Raum
der Wahrscheinlichkeitsmaße auf (R, B(R)).
Der nachfolgende Satz über die Diskretisierung basiert auf dem folgenden einfachen
Lemma:
für alle k ∈ N.
In unserem Fall basiert der Fehler der Approximation auf der Diskretisierung der zu-
grunde liegenden Verteilung der Risiken. Dieser Fehler überträgt sich auf die Distanz
zwischen wahrer und approximativer Gesamtschadenverteilung. Eine quantitative
Abschätzung dieses Fehlers gelingt durch das so genannte Konzentrationsmaß, das
aber kein Maß im Sinn der Wahrscheinlichkeitstheorie ist:
Definition 2.24 Es sei Q ein Wahrscheinlichkeitsmaß auf (R, B(R)). Dann heißt
für beliebiges β > 0
lim D(Q, β) = 0.
β→0
Q̃({0}) := 0,
(8)
Q̃({kh}) := Q([(k − 1)h, kh)) für k ∈ N .
Man erhält Risiken X̃k mit der Verteilung Q̃ durch die folgende Definition:
26
Es ist {X̃k : k ∈ N0 } ein Portfolio unabhängiger, identisch verteilter Risiken, die
Werte auf {hk : k ∈ N0 } annehmen. Erfüllt N die Rekursionsformel (5), so gibt Satz
2.19 die exakte Verteilung PS̃N des Gesamtschadens S̃N dieses Portfolios an. Diese
Verteilung PS̃N kann als Approximation der eigentlichen Gesamtschadenverteilung
PSN betrachtet werden, falls Q absolutstetig ist. Eine Fehlerabschätzung gibt der
folgende Satz an:
27
Beispiel 2.29
Pm Pm
a) Für Punktmaße Q1 = j=1 αj δxj und Q2 = j=1 βj δxj mit αj , βj ∈ R+ ,
xj ∈ R gilt:
m
X
dT V (Q1 , Q2 ) = |αj − βj | .
j=1
In den folgenden zwei Lemmata halten wir einige einfache Eigenschaften des Total-
variationsabstands fest.
Lemma 2.30 Für zwei Wahrscheinlichkeitsmaße Q1 und Q2 auf (R, B(R)) gilt:
dT V (Q1 , Q2 ) = sup {Q1 (B) − Q2 (B)}
B∈B(R)
28
Satz 2.32 erlaubt nun eine Näherung der Gesamtschadenverteilung im individuel-
len Modell durch die Gesamtschadenverteilung in einem kollektiven Modell. Hierzu
wird die Verteilung von Tn mittels Satz 2.11 identifiziert als eine zusammengesetzte
Summenverteilung von identisch verteilten Risiken.
Korollar 2.33 Es sei {X1 , . . . , Xn } ein Portfolio von unabhängigen Risiken Xk mit
Verteilungen
P (Xk ∈ B) = (1 − qk )δ0 (B) + qk Qk (B) für B ∈ B(R)
für Verteilungen Qk und qk ∈ (0, 1) sowie mit Gesamtschaden Sn = X1 + . . . Xn .
Desweiteren seien {Yk : k ∈ N} ein Portfolio von unabhängigen, identisch verteilten
Risiken mit der Verteilung
n
X n
X
qj
PYk = PXj , wobei λ := qj ,
j=1
λ j=1
2.5 Schadenhöhenverteilungen
Bei der Diskussion möglicher Verteilungen des Gesamtschadens in Abschnitt 1.2
erwähnten wir bereits, dass die meisten Schäden nur von einer geringen Höhe sind.
Jedoch gerade die wenigen, aber sehr kostenintensiven Schäden sind oft für ein Ver-
sicherungsunternehmen relevant, da diese einen wesentlichen Anteil am Gesamtscha-
den haben, z.B. mehr als 80%.
Treten Schäden X extremer Höhe, so genannte Großschäden, mit einer nicht zu
vernachlässigen Wahrscheinlichkeit auf, so konvergiert die Tailwahrscheinlichkeit
P (X > x)
nicht “zu schnell” gegen 0 für wachsende Argumente x. In der Literatur gibt es
keine einheitliche Definition solcher Verteilungen, wenn auch die Unterschiede nur
marginal sind.
Definition 2.34 Eine Verteilung Q auf (R+ , B(R+ )) ist heavy-tailed, falls gilt:
Z
esx Q(dx) = ∞ für alle s > 0.
R+
29
Beispiel 2.35 Die Lognormalverteilung LN(θ, σ 2 ) ist heavy-tailed.
Zunächst betrachten wir Verteilungen, die nicht heavy-tailed sind.
Lemma 2.36 Es sei Q eine Verteilung mit Verteilungsfunktion F . Dann sind äqui-
valent:
1) es existieren s0 , b > 0, so dass gilt:
1 − F (x) 6 be−s0 x für alle x > 0;
Beispiel 2.37
1) Die Normalverteilung ist nicht heavy-tailed.
2) Die Gammaverteilung Γ(α, β) ist nicht heavy-tailed.
3) Die Inverse-Gauss-Verteilung IG(µ, λ) ist nicht heavy-tailed.
Bemerkung 2.38
1. In Abschnitt 1.2 modellierten wir die Risikoverteilungen mittels der Gamma-
und Inverse-Gauss-Verteilung, obwohl diese nicht heavy-tailed sind. Dies kann
trotzdem sinnvoll sein, wenn z.B. keine Schäden extremer Höhe zu erwarten
sind oder wenn bei der Modellierung andere Aspekte im Vordergrund stehen.
Siehe hierzu [14, S. 92f]. Die ebenfalls in Abschnitt 1.2 vorgestellte Lognormal-
verteilung ist heavy-tailed, modelliert also realistisch auch das Vorliegen von
Großschäden.
2. Für eine heavy-tailed Verteilung Q mit Verteilungsfunktion F gilt:
lim sup esx (1 − F (x)) = ∞
x→∞
Lemma 2.39 Es sei Q eine Verteilung auf (R+ , B(R+ )) mit Verteilungsfunktion
F . Falls
− ln(1 − F (x))
lim sup =0
x→∞ x
gilt, dann ist Q heavy-tailed.
30
Beispiel 2.40 Die Weibullverteilung W(r, c) zu den Parametern r, c > 0 besitzt
die Dichte
( r
rcsr−1 e−cs , für s > 0,
f (s) :=
0, für s 6 0.
1 − (F ∗ F )(x)
lim = 2. (9)
x→∞ 1 − F (x)
Beispiel 2.42 Die Paretoverteilung P(α, c) zu den Parametern α, c > 0 besitzt die
Dichte
( ¡ ¢α+1
α c
, für s > c,
f (s) := c s
0, für s 6 c.
1 − (F ∗ F )(x)
lim inf > 2.
x→∞ 1 − F (x)
Der Nachweis, dass jede subexponentielle Verteilung heavy-tailed ist, basiert auf
dem folgenden Lemma.
Lemma 2.44 Es sei Q eine subexponentielle Verteilung auf (R+ , B(R+ )) mit Ver-
teilungsfunktion F . Dann gilt
1 − F (x − y)
lim =1 für alle y > 0.
x→∞ 1 − F (x)
Theorem 2.45 Jede subexponentielle Verteilung auf (R+ , B(R+ )) ist heavy-tailed.
31
Das folgende Resultat erklärt, dass die Bedeutung der Definition von subexponenti-
ellen Verteilungen nicht in der Ziffer “2” liegt, sondern in dem Verhältnis zwischen
Potenz und Faltung der Verteilungsfunktionen. Hier heraus ergibt sich dann unmit-
telbar die Eigenschaft einer subexponentiellen Verteilung, die durch die Definition
charakterisiert wird.
Theorem 2.46 Es sei Q eine Verteilung auf (R+ , B(R+ )) mit Verteilungsfunktion
F . Dann sind äquivalent:
1) Q ist subexponentiell;
1 − F ∗n (x)
2) lim = n für alle n > 2.
x→∞ 1 − F (x)
für n > 2. Aufgrund der Unabhängigkeit und der identischen Verteilung für die
Zufallsvariablen gilt:
f (t)
f = o(g) ⇐⇒ lim = 0.
t→∞ g(t)
32
Theorem 2.48 Es seien {Xk : k ∈ N} ein Portefeuillo von unabhängigen Ri-
siken, die identisch gemäß einer subexponentiellen Verteilung verteilt sind und N
eine Schadenzahl mit
∞
X
P (N = k)(1 + ε)k < ∞
k=0
für ein ε > 0. Dann gilt für die Verteilung des Gesamtschadens:
Die Aussage des Satzes 2.48 besagt, dass die Tailwahrscheinlichkeit des Gesamtscha-
dens durch E [N ] P (X1 > x) approximiert werden kann, wobei der relative Fehler
für wachsendes x gegen Null konvergiert.
Die Kenntnis, ob die Verteilung der Risiken eines Portfolios heavy tails besitzt, ist
für Versicherungsunternehmen zur Vermeidung des Ruins von großer Bedeutung. In
der Praxis basiert diese Einschätzung auf den beobachteten Daten der vergangenen
Jahre. Im folgenden soll ein einfaches Verfahren vorgestellt werden.
(b) Falls X ein stetigverteiltes Risiko mit Dichte f und Verteilungsfunktion F ist,
dann heißt
f (x)
h : I → R+ h(x) := , I := {y ∈ R : F (y) < 1},
1 − F (x)
33
Bemerkung 2.51 Bei stetig verteiltem Risiko X gilt:
P (X 6 x + y | X > y) ≈ xh(y)
für kleine x.
Beispiel 2.53
1. Bei Lebensversicherung modelliert X die Lebensdauer eines Versicherungsneh-
mers in Jahren. Dann gibt die Hazard-Rate h(k) die Sterbewahrscheinlichkeit
im Alter von k Jahren an, falls bereits das Alter von k Jahren (am Beginn
eines Beobachtungszeitraumes) erreicht wurde.
2. Bei Feuerversicherung bezeichnet X die Dauer eines Feuers. Dann ist xh(y)
für kleine x die Wahrscheinlichkeit, das Feuer nach der Zeit x unter Kontrolle
zu haben, falls es bereits y lang gebrannt hat. Die Hazard-Rate wird extinction
rate bezeichnet.
Definition 2.54 Es sei X ein Risiko mit Verteilungsfunktion F und F (0) = 0. Die
Funktion
Z ∞
1
eF : I → R+ , eF (x) := (1 − F (y)) dy, I := {y ∈ R : F (y) < 1},
1 − F (x) x
heißt mittlere Rest-Hazard-Funktion von X.
Bemerkung 2.55
1. Die mittlere Rest-Hazard-Funktion und die Verteilungsfunktion sind durch die
jeweils andere Funktion eindeutig bestimmt.
34
für t > 0.
Die Rest-Hazard-Funktion Ft definiert eine Verteilungsfunktion. Für den Er-
wartungswert von Ft erhält man
Theorem 2.56 Es sei F eine Verteilungsfunktion mit einer Dichte f und F (0) = 0,
deren erstes Moment existiert. Falls eF (x) → ∞ für x → ∞, dann besitzt die zu F
gehörende Verteilung heavy tails.
Es seien X1 , . . . , Xn unabhängige, identischverteilte Zufallsvariablen mit Verteilungs-
funktion F . Die Funktion
n
1X
Fn : R → [0, 1], Fn (x) := 1(−∞,x] (Xk )
n k=1
Satz 2.56 legt folgende Methode nahe, aufgrund einer Beobachtung x1 , . . . , xn der
Risiken X1 , . . . , Xn zu entscheiden, ob die Verteilung F heavy tails besitzt:
1.) Schätzung der mittleren Rest-Hazard-Funktion mittels
Z ∞
1
eFn (x) := (1 − Fn (y)) dy.
1 − Fn (x) x
2.) Vergleich des asymptotischen Verhaltens von eFn mit dem Verhalten von eG
einer bekannten Verteilungsfunktion G. Üblicherweise wird G als die Vertei-
lungsfunktion der Exponentialverteilung gewählt.
Bei der hier vorgestellten Methode aufgrund der mittleren Rest-Hazard-Funktion
auf das Vorliegen einer heavy-tailed Verteilung zu schließen, erfordert eine gewisse
Umsicht.Da gerade wenige Beobachtungen der Risiken mit großen Werten x vorlie-
gen, hängt das asymptotische Verhalten von eFn (x) stark von diesen wenigen Daten
ab.
Es gibt noch zahlreiche andere Verfahren, um auf das Vorliegen einer heavy-tailed
Verteilung zu schließen., wie z.B. QQ-Plots.
35
3 Risikoprozesse
In den vorangegangenen Abschnitten modellierten wir den Gesamtschaden eines
Portfolios in einer bestimmten Zeitperiode, z.B. einem Jahr. In diesem Abschnitt
interessieren wir uns für die Wahrscheinlichkeit, dass der Gesamtschaden eines Versi-
cherungsunternehmens die Einnahmen, z.B. monatlich gezahlte Prämien, übertrifft.
Da diese Ruinsituation nicht nur am Ende einer Beobachtungsperiode geschehen
kann, führen wir noch eine zeitliche Komponente t ein, um die Anzahl der Schäden
bis zum Zeitpunkt t modellieren zu können.
Definition 3.1 Es seien W1 , W2 , . . . positive Zufallsvariablen und
∞
X
N (t) := 1{Tk 6t} für t > 0 und Tk := W1 + · · · + Wk .
k=1
b) Bezeichnet GN (t) die erzeugende Funktion von N (t) und LX1 und LSN (t) die
jeweiligen Laplace-Transformierten, dann gilt für jedes t > 0:
LSN (t) (u) = GN (t) (LX1 (u)) für alle u > 0.
36
3.1 Verteilungen für den Schadenzahlprozess
Bei Modellierung des Gesamtschadens in einem festen Zeitraum haben wir die Scha-
denzahl unter anderem durch eine poissonverteilte Zufallsvariable modelliert. In
Analogie betrachten wir jetzt mit dem zusätzlichen zeitlichen Aspekt einen soge-
nannten Poissonprozess.
Theorem 3.5 Es sei N = (N (t) : t > 0) ein Zählprozess. Dann sind äquivalent:
unabhängig;
iii) stationäre Zuwächse:
für alle 0 6 t0 < t1 < · · · < tn , n ∈ N und für alle h > 0 hängen die
Verteilungen von
c) Der Prozess N besitzt unabhängige, stationäre Zuwächse und es gilt für alle
t > 0:
37
Bemerkung 3.6 Besitzt N = (N (t) : t > 0) unabhängige Zuwächse und ist für
alle t > 0 die Verteilung von
N (t + h) − N (t)
Bemerkung 3.9 Die zeitlich abhängige Schadenzahl eines Portfolios kann durch
zahlreiche andere Prozesse als ein Poissonprozess modelliert werden, jedoch be-
schränken wir uns in diesem Abschnitt auf diesen.
38
Definition 3.10 Es seien {Xk : k ∈ N} ein Portfolio und (N (t) : t > 0) ein
Schadenzahlprozess. Definiert man für eine Konstante u > 0 und eine monoton
wachsende Funktion p : R+ → R+ mit p(0) = 0
Die (zufällige) Ruinzeit τ (u) muss keine endlichen Werte annehmen. Aus Ergebnis-
sen in der Theorie von stochastischen Prozessen folgt, dass τ (u) eine Zufallsvariable
ist, also (F -B(R̄))-messbar ist.
Man spricht auch von Ruinwahrscheinlichkeit in unendlicher Zeit (infinite-horizon
ruin), da gilt:
[
{τ (u) < ∞} = {inf R(t) < 0} = {R(t) < 0} = {R(t) < 0 für ein t > 0}
t>0
t>0
und das letzte Ereignis sich als das des Eintretens des Ruins in einer beliebig langen
Zeitspanne interpretieren lässt.
39
Lemma 3.12 erlaubt eine einfache Herleitung einer notwendigen Bedingung dafür,
dass der Ruin nicht mit Wahrscheinlichkeit 1 eintritt. Denn nach dem starken Gesetz
der großen Zahlen gilt:
1
lim Yn = E [X1 ] − β E [W1 ] P-f.s.
n→∞ n
Falls also EX1 − βEW1 > 0 gilt, dann konvergiert Yn P-f.s. gegen ∞ und gemäß
Lemma 3.12 tritt der Ruin P-f.s. ein.
Mittels Resultaten über “zufällige Irrfahrten” lässt sich auch im Fall EX1 −βEW1 =
0 nachweisen, dass der Ruin P-f.s. eintritt. Für ein Versicherungsunternehmen be-
steht nur dann die Gelegenheit, die Ruinwahrscheinlichkeit zu verringern, falls E [X1 ]−
β E [W1 ] < 0 gilt. Diese Bedingung hat in der Literatur einen eigenen Namen:
β β E [W1 ]
ρ := − 1 := −1
λµ E [X1 ]
Bemerkung 3.15 Die Nettoprofitbedingung ist genau dann erfüllt, wenn der Si-
cherheitszuschlag postiv ist.
Bemerkung 3.17
1) Falls die Nettoprofitbedingung erfüllt ist, kann keine Konstante r < 0 existie-
ren, die der Gleichung (11) genügt.
40
Dies ist äquivalent dazu, dass das exponentielle Moment E [exp(rX1 )] des Ri-
sikos X1 existiert und endlich ist. Aus der Markov-Ungleichung folgt:
Beispiel 3.19 Wir betrachten zwei Portfolios {Xk : k ∈ N} und {Yk : k ∈ N} von
unabhängigen, identisch verteilten Risiken mit
1
P (Xk = 100) = p1 , P (Xk = 0) = 1 − p1 , für p1 := ,
100
1
P (Yk = 10000) = p2 , P (Yk = 0) = 1 − p2 , für p2 := ,
10000
Der Schadenzahlprozess (N (t) : t > 0) sei ein Poissonprozess mit Intensität 1. Als
Sicherheitszuschlag erhält man ρ = β − 1, weshalb die Prämie β größer als 1 gewählt
werden muss. Man erählt
£ ¤ £ ¤ £ ¤
E er(X1 −βW1 ) = p1 E er(X1 −βW1 ) |X1 = 100 + (1 − p1 )E er(X1 −βW1 ) |X1 = 0
1
= (p1 e100r + 1 − p1 )
1 + rβ
und analog
£ ¤ 1
E er(Y1 −βW1 ) = (p2 e10000r + 1 − p1 )
1 + rβ
Aus diesen Gleichungen lässt sich numerisch r > 0 bei vorgegebenem β > 1 gemäß
folgender Tabellen bestimmen.
41
β 1.1 1.5
1. Portfolio (s1 = 100): r 1.877 · 10−3 7.627 · 10−3
u 2823 695
β 1.1 1.5
2. Portfolio (s1 = 10000): r 2.047 · 10−5 7.676 · 10−5
u 2.588 · 105 0.6903 · 105
β
wobei ρ der Sicherheitszuschlag ρ = λµ
− 1 ist.
Bemerkung 3.23
42
2) Wir werden die integrierte Tailverteilungsfunktion der Risikoverteilung eines
Portfolios {Xk : k ∈ N} betrachten, d.h.
Z x
I I 1
FX1 : R+ → [0, 1], FX1 (x) := (1 − FX1 (u)) (du),
EX1 0
wobei FX1 die Verteilungsfunktion von PX1 bezeichnet.
Diese Art von Integralgleichungen nennt man Volterra Integralgleichungen oder Er-
neuerungsgleichungen. Der erste Begriff stammt aus dem Bereich der Theorie von
Integralgleichungen, siehe z.B. [10], letzterer Begriff ist in der Risikotheorie üblich,
siehe z.B. [1]. In dem folgenden Abschnitt betrachten wir diese Integralgleichungen
kurz.
3.2.4 Erneuerungsgleichungen
Definition 3.24 Es seien f : R+ → R eine Funktion und µ ein Borel-Maß auf
(R+ , B(R+ )). Dann heißt die Integralgleichung
Z
z(t) = z(t − s) µ(ds) + f (t) für alle t > 0, (13)
[0,t]
Erneuerungsgleichung.
Falls µ(R+ ) < 1 gilt, so heißt die Erneuerungsgleichung defekt, falls µ(R+ ) = 1
gewöhnlich und falls µ(R+ ) > 1 exzessiv.
Eine Funktion x : R+ → R, die der Gleichung (13) für alle t > 0 genügt, heißt
Lösung der Erneuerungsgleichung.
Gleichungen der Form (13) werden auch als Faltungsintegralgleichungen bezeichnet.
Im allgemeinen werden Maße µ zugelassen, die sowohl negative wie auch positive
Werte annehmen können, (signierte Maße).
43
Beweis: Siehe [10, Theorem 2.3.5]. 2
In dem folgenden Lemma zitieren wir eines der wichtigsten Resultate der Erneue-
rungstheorie.
und
½ ¾
f1 (u1 + u2 )
lim sup : u1 > 0, u2 ∈ [0, h] = 1.
h→0 f1 (u1 )
Falls f (u) = f1 (u)f2 (u) und µ ein Wahrscheinlichkeitsmaß ist, dann gilt für die
Lösung x der Integralgleichung (13):
( R∞
1
mµ 0
f (u) du, falls mµ < ∞,
lim x(u) =
u→∞ 0, sonst,
44
Theorem 3.27 (Cramér-Lundberg Approximation) Im Cramér-Lundberg-Modell sei
die Nettoprofitbedingung erfüllt und es existiere der Anpassungskoeffizient r > 0. Mit
Z
∗ λ ∞ rx
m := xe (1 − FX1 (x)) dx
β 0
gilt für die Ruinwahrscheinlichkeit des klassischen Risikoprozesses,
a) falls m∗ < ∞:
ρ
lim ψ(u)eru = .
u→∞ (1 + ρ)rm∗
b) falls m∗ = ∞:
lim ψ(u)eru = 0.
u→∞
ψ(u) 1
lim I
= .
u→∞ 1 − F (u)
X1 ρ
45
Wesentliche Voraussetzung des vorangegangenen Satzes ist die geforderte Eigen-
schaft der Risikoverteilung und deren integrierte Tailverteilungsfunktion, subexpo-
nentiell zu sein. Im folgenden Satz zitieren wir hierfür eine hinreichende Bedingung.
Theorem 3.31 Es sei F eine Verteilungsfunktion auf [0, ∞), für die gilt:
Z x
1 − F (x − y)
lim (1 − F (y)) dy = 2mF ,
x→∞ 0 1 − F (x)
wobei mF das erste Moment von F bezeichnet. Dann ist sowohl F wie auch ihre
integrierte Tailverteilungsfunktion F I subexponentiell.
Beweis: Siehe [18, Theorem 2.5.6]. 2
46
4 Prämienkalkulation
4.1 Nettorisikoprinzip
Ein Versicherungsunternehmen übernimmt gegen Prämienzahlung des Versicherungs-
nehmers ein spezifiziertes Risiko. Ist die Prämienzahlung zu hoch, so ist das Versiche-
rungsunternehmen nicht konkurrenzfähig, ist sie zu niedrig, ist die Ruinwahrschein-
lichkeit zu hoch. Die Kosten eines Versicherungsunternehmens kann man aufteilen
in einen Anteil, der für die Schadenszahlungen, Rückversicherungen u.s.w. reser-
viert ist, und einen Anteil zur Deckung der Kosten von Verwaltung, Personalkosten,
Provisionen u.s.w. Wir werden (meistens) nicht die dynamische Entwicklung des
betrachteten Portfolios berücksichtigen. Deshalb gelte in diesem Abschnitt stets:
Das Risiko S kann entweder als der Gesamtschaden eines Portfolios oder aber auch
als ein einziges Risiko interpretiert werden.
Eine Prämie weist jedem Risiko S eine reellwertige Zahl zu. Mit der Bezeichnung
p : L0 (Ω, A , P ) → R ∪{∞}.
Die Prämie für ein Risiko S gemäß eines Prämienprinzips p ist p(S).
Die betrachteten Prämienprinzipien werden nur von der Verteilung PS und nicht
von S selbst abhängen, d.h. es hätte ausgereicht, das Prämienprinzip auf der Menge
der Verteilungen zu definieren.
Nimmt ein Prämienprinzip p für ein Risiko S den Wert ∞ an, so heißt S nicht
versicherbar bezüglich p.
Ein naheliegender Ansatz als Prämienprinzip ist, eine Prämie entsprechend dem
Erwartungswertes des Risikos S zu verlangen:
p(S) := E [S] .
Bemerkung 4.3 In Abschnitt 3.2 haben wir bereits gesehen, dass zumindestens im
Cramér-Lundberg-Modell das Nettorisikoprinzip nicht geeignet ist. Denn in diesem
Fall ist die Nettoprofitbedingung nicht erfüllt und der Ruin tritt mit Wahrschein-
lichkeit 1 ein.
47
4.2 Prämienprinzipien auf Grundlage des Nettorisikoprin-
zips
Da das Nettorisikoprinzip in den meisten Modellen in den Ruin führt, wird dieses
um einen proportionaler Zuschlag erhöht:
Beispiel 4.6
a) Falls S exponentialvereilt zu dem Parameter λ > 0 ist, dann gilt:
1 δ
p(S) = + 2 (Varianzprinzip).
λ λ
b) Falls S gammaverteilt zu den Parametern α, β > 0 ist, dann gilt:
β β
p(S) = +δ 2 (Varianzprinzip).
α α
Um nicht Größen verschiedener Dimensionen zu addieren, wird statt der Varianz
die Standardabweichung genutzt, um die Schwankungen des Gesamtschadens in die
Prämienkalkulation miteinzubeziehen:
48
4.3 Implizit definierte Prämienprinzipien
4.3.1 Nullnutzenprinzip
Der “Nutzen”, dem ein Versicherungsunternehmen durch Übernahme des Risikos S
bei einer Prämie p(S) entsteht, ergibt sich aus dem Wert u + p(S) − S, wobei u die
Anfangsrisikoreserve bezeichnet. Im Folgenden gehen wir davon aus, dass sich dieser
Nutzen durch einen numerischen Wert beziffern lässt.
Oft wird allgemeiner von einer Nutzenfunktion nur gefordert, monoton wachsend
und konkav zu sein.
Beispiel 4.9
a) v(x) := x, d.h. v = Id.
b) v(x) := 1 − e−x .
heißt Nullnutzenprinzip.
Bei Kalkulation der Prämie gemäß des Nullnutzenprinzips ist bei Übernahme des
Risikos S für das Versicherungsunternehmen keinen anderen Nutzen zu erwarten,
wie falls es das Risiko S nicht übernimmt.
Beispiel 4.11
49
a) Für v = Id erhält man das Nettorisikoprinzip.
b) Für v(x) = 1 − e−ax für ein a > 0 erhält man
1 £ ¤
p(S) = ln E eaS (Nullnutzenprinzip).
a
Dieses Prämienprinzip heißt Exponentialprinzip, das wir uns im folgenden Ab-
schnitt ansehen werden.
Es muss keineswegs eine Funktion v existieren, die der Gleichung (14) genügt. In den
bei uns behandelten Fällen ist das aber stets gewährleistet, falls der entsprechende
Erwartungswert existiert.
Im Allgemeinen hängt das Nullnutzenprinzip von der Anfangsrisikoreserve u ab. In
diesem Fall beeinflusst die Anfangsrisikoreserve die Prämie. Es lassen sich jedoch
auch Nutzenfunktionen wählen, für die das Nullnutzenprinzip unabhängig von der
Anfangsrisikoreserve ist, z.B.
v(x) = a + bx für Konstanten a ∈ R, b > 0,
−bx
oder v(x) = a(1 − e ) für Konstanten a, b > 0.
In vielen Fällen lässt sich das Nullnutzenprinzip zu einer Nutzenfunktion nicht ex-
plizit angeben. Einen Ansatz einer Approximation liefert das folgende Resultat.
4.3.2 Exponentialprinzip
Das Exponentialprinzip ergibt sich als ein Spezialfall des Nullnutzenprinzips durch
Wahl der Nutzenfunktion
v(x) := 1 − e−ax , x ∈ R,
für eine Konstante a > 0. In diesem Fall lässt sich explizit das Nullnutzenprinzip
bestimmen.
50
Definition 4.14 Das Prämienprinzip p mit
1 £ ¤
p(S) = ln E eaS
a
heißt Exponentialprinzip zum Parameter a > 0.
Man beachte, dass zum Exponentialprinzip keine Schäden mit einer heavy-tailed
Verteilung versichert werden können.
Theorem 4.15 Falls E [exp (aS)] < ∞ für alle a > 0 gilt, dann besitzt die Funktion
1 £ ¤
q : [0, ∞) → R, q(a) = ln(E eaS )
a
folgende Eigenschaften:
Jede beliebige Prämie, die einen Wert zwischen E [S] und F −1 (1) annimmt, kann
gemäß Satz 4.15 sich auch bei geeigneter Wahl des Parameters a aus dem Exponen-
tialprinzip ergeben. Die Prämienzahlung erhöht sich bei wachsendem Parameter a,
der auch Risikoaversion genannt wird. Insbesondere erhält man für a → 0 das Net-
torisikoprinzip. Falls F −1 (1) endlich ist, dann beziffert dieser Wert den maximalen
Gesamtschaden, und das Prämienprinzip
ρ(S) = F −1 (1)
heißt Maximalschadenprinzip.
Die Forderungen an eine Verlustfunktion kann man wie bei der Nutzenfunktion unter
Berücksichtigung der geänderten Perspektive erklären.
51
Bemerkung 4.17
a) Eine Verlustfunktion w ist eine monoton wachsende, konvexe Funktion.
b) Falls v eine Nutzenfunktion ist, dann erhält man durch
w(x) := −v(−x) für alle x ∈ R,
eine Verlustfunktion.
Definition 4.18 Es seien w eine Verlustfunktion und z ∈ [0, 1]. Das Prämienprin-
zip p, für das gilt
w((1 − z)p(S)) = E [w(S − zp(S))] , (15)
heißt Schweizer Prinzip zum Parameter z.
Falls das Versicherungsunternehmen den Anteil zS zu einer Prämie zp(S) rückver-
sichert und zp(S) eine gute Schätzung für zS ist, dann bleibt dem Unternehmen
ein Risiko S − zp(S) zu einer Prämie (1 − z)p(S). Das Schweizer Prinzip fordert,
dass bei entsprechender Gewichtung der zu erwartende Schaden von S − zp(S) der
entsprechenden Prämie entspricht.
Beispiel 4.19
a) Für z = 0 resultiert das Schweizer Prinzip in
E [w(S)] = w(p(S)).
4.3.4 Verlustfunktionenprinzip
Das Eintreten eines Schadens s, d.h. eine Realisierung s des Risikos S, verursacht
dem Versicherungsunternehmen in Abhängigkeit der Prämie einen Verlust. In diesem
Abschnitt verallgemeinern wir den bisherigen Ansatz, und bewerten einen Verlust
in Abhängigkeit des Risikos S und einer möglichen Prämie. Offensichtlich ist die
Prämie wünschenswert, die den auf dieser Weise quantifizierten Verlust minimiert.
Verlustfunktionenprinzip genannt.
52
Beispiel 4.21
Quantil-Funktion von F .
Existiert die inverse Funktion von F , dann stimmt die Quantil-Funktion mit der
inversen Funktion überein.
Definition 4.24 Es seien FS die Verteilungsfunktion des Risikos S und ε ∈ [0, 1].
Das Percentileprinzip p zum Parameter ε ist definiert durch
p(S) := F −1 (1 − ε).
Für das Percentileprinzip wird die Prämie zu einem vorgegebenen ε ∈ (0, 1) derart
bestimmt, dass die Wahrscheinlichkeit dafür, dass der Schaden S größer als die
Prämie ist, geringer als ε ist.
53
4.5 Eigenschaften von Prämienprinzipien
Sowohl aus theoretischer als auch aus praktischer Sicht sollen Prämienprinzipien be-
stimmte Eigenschaften besitzen. In der Literatur, z.B. [11], [21], werden zahlreiche
Eigenschaften diskutiert, von denen wir einige vorstellen. Es gibt jedoch keine ein-
heitliche Ansicht darüber, nach welchen Kriterien Prämienprinzipien zu beurteilen
sind.
Translationsinvarianz bedeutet, dass bei Erhöhung des Risikos um einen festen Be-
trag c, die Prämie sich um den selben Betrag erhöht.
Homogenität verhindert eine Arbitragemöglichkeit: denn wäre die Prämie von 2S
größer als zweimal die Prämie von S, dann würde man zweimal S versichern und
dadurch einen Gewinn erzielen.
Wie bei Homogenität liegt bei Nichtvorliegen der Additivität eine (theoretische)
Arbitragemöglichkeit vor. Falls Subadditivität vorliegt, kann ein hohes Risiko nicht
für eine geringere Prämie versichert werden, indem es als zwei oder mehr unterteilte
Risiken versichert wird. Subadditivität ist auch eine offensichtliche Konsequenz des
Ausgleichs im Kollektiv.
54
Die Eigenschaft einer Prämie, erwartungswertübersteigend zu sein, ist eine offen-
sichtliche Forderung. Denn ein Versicherungsunternehmen wird den Ruin nur schwer
vermeiden können, wenn die Prämien unter dem zu erwartenden Schaden liegen. Um-
gekehrt wird auch kein Versicherungsnehmer bereit sein, ein Risiko zu einer Prämie
zu versichern, die über dem maximalen Schaden liegt.
In der folgenden Tabelle fassen wir zusammen, welche Eigenschaften die von uns
betrachteten Prämienprinzipien besitzen.
Theorem 4.27
a b c d e f
Nettorisikoprinzip ja ja ja ja ja ja
Erwartungswertprinzip nein ja ja ja ja nein
Varianzprinzip ja ja nein nein ja nein
Standardabweichungsprinzip ja nein ja ja ja nein
Nullnutzenprinzip ja nein nein nein ja ja
Exponentialprinzip ja ja ja nein ja ja
Schweizer Prinzip nein nein nein nein ja ja
Percentileprinzip ja nein nein ja nein ja
Maximalschadenprinzip ja ja ja ja ja ja
Beispiel 4.28 Es sei F eine Menge von Verteilungen. Dann gilt für das Erwar-
tungswertprinzip p mit einem Sicherheitszuschlag κ:
p(S) 6 uPS = inf{x ∈ R : P (S 6 x) = 1} für alle Risiken S mit PS ∈ F ;
falls gilt:
½ ¾
uPS
1 + κ 6 inf : PS ∈ F .
E [S]
Das Erwartungswertprinzip p ist lokal maximalschadenbegrenzt.
55
5 Credibility Prämie
Einen anderen Ansatz zur Berechnung der Prämie als im vorigen Kapitel liegt der
Credibility-Theorie zugrunde. Die Anzahl und Höhen der verursachten Schäden ei-
nes Risikos der vergangenen Jahren gewähren eine Information, die zum Zeitpunkt
des Vertragabschlusses nicht zur Verfügung standen. Diese Information lässt einen
gewissen Rückschluß auf die Verteilung des entsprechenden Risikos zu und es ist
naheliegend, diese Kenntnis in eine zukünftige Prämienberechnung miteinfließen zu
lassen.
Dieses Kapitel lehnt sich an die entsprechenden Abschnitte in der Monographie von
Mikosch [16] an.
b) die Zufallsvariablen
Xi,1 , . . . , Xi,ni
56
Es stellt sich die Frage, wie eine Prämie für das i-te Risiko in diesem Modell auf
Basis der vergangenen Schadenverläufe berechnet werden kann. Wir beschränken
uns auf einen Ansatz, der auf dem Nettoprämienansatz des letzten Kapitels basiert:
Bemerkung 5.2
a) Die Risiken Xi,1 , . . . , Xi,ni sind aufgrund der Voraussetzung d) identisch ver-
teilt:
für alle t = 1, . . . , ni .
dann ist gemäß Lemma B.9 eine Funktion µ̂i : Ω → R genau dann eine Funktion
von allen Xi,t für t ∈ N und i = 1, . . . , r, falls gilt
57
Es ist jetzt naheliegend von unserer Schätzung µ̂i ebenfalls zu fordern, dass ihr
zweites Moment E |µ̂i |2 endlich ist. Dann bietet sich zur Quantifizierung des Fehlers
der Approximation die Norm in L2 (Ω, A , P ) an. Da B ⊆ A erhalten wir:
ρ : L2 (Ω, B, P ) → L2 (Ω, A , P ), ρ(Y ) := E |µ(Θi ) − Y |2 .
Bei Schätzung von µ(Θi ) durch eine Zufallsvariable Y wird ρ(Y ) als der mittlere
quadratische Fehler bezeichnet.
Unsere Aufgabe lässt sich jetzt folgendermaßen formulieren:
gesucht ist eine reellwertige Zufallsvariable µ̂i ∈ L2 (Ω, B, P ), so dass gilt:
ρ(µ̂i ) = min{ρ(Y ) : für alle Y ∈ L2 (Ω, B, P )}. (16)
Falls eine P -f.s. eindeutige Lösung existiert, nennen wir diese Credibility-Prämie
aufgrund der Schadenhistorie (Xi,1 , . . . , Xi,ni ).
Theorem 5.3 Im heterogenen Modell existiert eine P -f.s. eindeutige Lösung µ̂i von
(16). Diese Lösung µ̂i ist gegeben durch:
µ̂i = E [ µ(Θi ) | B i ] P -f.s.,
ρ(µ̂i ) = E [Var(µ(Θi ) | B i )] .
Obwohl wir über allen Funktionen, die B-messbar sind, minimieren, ist der Schätzer
µ̂i für µ(Θi ) nur eine Funktion von Xi,1 , . . . , Xi,ni bzw. (B i − B(R))–messbar. Das
bedeutet, dass die Schadenverläufe der anderen Risiken des Portfolios keine Rolle bei
der Prämienberechnung für das i-te Risiko spielen. Dies liegt an der Voraussetzung
b) in der Definition 5.1.
Im folgenden Lemma verzichten wir auf den Index i. Desweiteren bezeichne δ n das
Zählmaß auf Nn0 und λk das Lebesguemaß auf (Rk , B(Rk )).
wobei
E [h(Θ)|X = x]
Z
1
= h(y)fΘ (y)P (X1 = x1 |Θ = y) · · · P (Xn = xn |Θ = y) dy,
P (X = x)
für alle x mit P (X = x) > 0.
58
2) falls µ × ν = λn × λ, dann gilt für x = (x1 , . . . , xn ) ∈ Rn :
wobei
Z
1 fX1 ,Θ (x1 , y) fX ,Θ (xn , y)
E [h(Θ)|X = x] = h(y)fΘ (y) ··· n dy
fX (x) {fΘ >0} fΘ (y) fΘ (y)
für alle x mit fX (x) > 0. Es bezeichnet fX die Dichte von X bezüglich λ sowie
fXi ,Θ die gemeinsame Dichte von (Xi , Θ) bezüglich λ2 .
θk −θ
P (Xt = k | Θ = θ) = e für k ∈ N0 , θ > 0,
k!
und t = 1, . . . , n. Da E [Xt | Θ = θ] = θ erhält man
µ(Θ) = E [Xt | Θ] = Θ.
α 1
ρ(µ̂) =
ββ+n
L := L (Ω, B) := {Z : Ω → R : Z = a0 + aT X, a0 ∈ R, a ∈ Rm } (17)
59
Unsere Aufgabe lässt sich jetzt folgendermaßen formulieren:
gesucht ist eine reellwertige Zufallsvariable µ̂∗i ∈ L (Ω, B), so dass gilt:
2 2
E |µ(Θi ) − µ̂∗i | = min{E |µ(Θi ) − Z| : für alle Z ∈ L (Ω, B)} (18)
Falls eine P -f.s. eindeutige Lösung existiert, nennen wir diese linearisierte Credibility-
Prämie aufgrund der Schadenhistorie (Xi,1 , . . . , Xi,ni ).
Da wir das Problem vereinfacht haben, können wir das Modell etwas verallgemei-
nern.
b) die Zufallsvariablen
sind unabhängig;
Xi,1 , . . . , Xi,ni
Wegen der Bedingung a) hängen diese diese Größen tatsächlich nicht von i ab. Wir
fassen noch einige weitere einfache Eigenschaften im folgenden Lemma zusammen:
60
(
λ + ϕ, für t = s,
b) Cov(Xi,t , Xi,s ) = ;
λ, für t 6= s,
(
λ, für i = j,
c) Cov(µ(Θi ), Xj,t ) = .
0, für i 6= j
Der folgende Satz gibt nun in expliziter Form den Schätzer µ̂∗i an, der den minimalen
quadratischen Fehler unter allen anderen Zufallsvariablen in L besitzt.
Theorem 5.8 Im Bühlmann Modell existiert eine P -f.s. eindeutige Lösung µ̂∗i von
(18). Diese Lösung µ̂∗i ist gegeben durch:
ni
c X ni λ
µ̂∗i = (1 − c)µ + Xi,k für c := .
ni k=1 ϕ + ni λ
ρ(µ̂∗i ) = (1 − c)λ.
Wie zuvor bei der allgemeinen Credibility Prämie im heterogenen Modell hängt die
Lösung µ̂∗i von (18) gemäß Satz 5.8 nur von dem i-ten Schadenverlauf und nicht von
allen Schadenverläufe ab.
Für den Beweis von Satz 5.8, siehe auch [16], definieren wir:
Y := (Y1 , . . . . . . , Ym )
:= (X1,1 , . . . , X1,ni , . . . , Xr,1 , . . . , Xr,nr ),
| {z } | {z }
:=X1 :=Xr
Λ := µ(Θi )
für festes i ∈ {1, . . . , r} und führen folgende Notationen für einige Momente und
Kovarianzen ein:
Y1 E [Y1 ]
Y := ... , E [Y ] := ... ,
Ym E [Ym ]
Cov(Λ, Y1 ) Cov(Y1 , Y1 ) . . . Cov(Y1 , Ym )
.. .. ..
ΣΛ,Y := . ΣY := . ... . .
Cov(Λ, Ym ) Cov(Y1 , Y1 ) . . . Cov(Y1 , Ym )
61
Das folgende Resultat gilt für einen beliebigen Zufallsvektor Y, ohne dass dieser im
Zusammenhang mit dem Bühlmann Modell stehen muss. Um das Resultat entspre-
chend formulieren zu können, führen wir noch den Raum
L (Ω, Y) := {Z : Ω → R : Z = a0 + aT Y, a0 ∈ R, a ∈ Rn }
ein, der offensichtlich identisch zu dem in (17) definierten Raum ist. Jedoch können
wir jetzt den folgenden Satz formulieren, ohne auf das Bühlmann Modell Bezug zu
nehmen.
und die rechte Seite hängt nicht von der spezielen Wahl (a0 , a) ab.
b) für alle Z ∈ L (Ω, Y) gilt:
¯ ¯2
¯ ¯ 2
E ¯Λ − Ŷ ¯ 6 E |Λ − Z| .
Beispiel 5.10 Berechnen wir für das Beispiel 5.5 die linearisierte Credibility Prä-
mie, erhalten wir:
α
µ = E [Θ] = ,
β
α
λ = VarΘ = 2 ,
β
α
ϕ = E [VarX1 | Θ] = .
β
62
Man erhält somit:
µ ¶ n
∗ n n 1X
µ̂ = 1− E [Θ] + Xk .
β+α β + α n k=1
Dies entspricht gerade der (allgemeinen) Credibility Prämie, wie in Beispiel 5.5 be-
rechnet.
63
6 Simulation
In vielen Situationen kann die Verteilung des Gesamtschadens und erst recht die
Ruinwahrscheinlichkeit für ein Portfolio nicht explizit berechnet werden. Desweite-
ren finden in der Praxis komplizierte Modelle Anwendung, die analytisch nicht hand-
habbar sind. In solchen Situationen können Simulationen eingesetzt werden. Dabei
werden auf Computern zufällige Zahlen erzeugt, die z.B. als Schäden interpretiert
werden. Mit diesen Zahlen können neue Modelle virtuell getestet oder statistisch
ausgewertet werden.
In diesem Kapitel werden wir Algorithmen vorstellen, um Risikoprozesse und Ruin-
wahrscheinlichkeiten zu simulieren.
für Konstanten a, c, m ∈ N. Dabei wird m sehr groß gewählt. Die Zahlen Xm i+1
64
Beispiel von zwei Folgen X0 , X1 , . . . für sehr kleine Zahlen m und a:
Wir gehen im Folgenden davon aus, dass uns eine ausreichend gute Folge von Reali-
sierungen von unabhängigen, auf [0, 1] gleichverteilten Zufallsvariablen zur Verfügung
stehen. Das folgende Resultat ist Basis von vielen Algorithmen zur Erzeugung von
Zufallszahlen.
für Parameter a, b > 0. Falls U eine auf [0, 1] gleichverteilte Zufallsvariable ist, dann
ist bU −1/a paretoverteilt zu den Parametern a und b
Für viele Verteilungen kann die Quantilfunktion nicht explizit angegeben werden.
Dann kann der Umkehr-Algorithmus nicht angewandt werden oder ist nicht effizi-
ent. Ein anderes Verfahren zur Erzeugung einer Zufallsvariablen einer bestimmten
Verteilung mit einer Dichte ist das Verwerfungsverfahren von John v. Neumann.
Desweiteren kann man für viele Verteilungen effiziente Algorithmen durch Ausnut-
zen spezieller Eigenschaften der Verteilungen erhalten. Viele Verfahren findet man
z.B. in den Monographien [15] und [17]. Als ein Beispiel erwähnen wir die folgende
Methode zur Erzeugung von zwei unabhängigen, standard normalverteilten Zufalls-
variablen.
Beispiel 6.4 (Box-Muller Methode) Wir gehen zunächst den umgekehrten Weg
und betrachten zwei unabhängige, standardnormalverteilte Zufallsvariablen X und
Y . Geht man zu den Polarkoordinaten (R, Θ) des zufälligen Vektors (X, Y ) über,
so kann man leicht nachweisen, dass R und Θ unabhängig sind und die folgenden
Verteilungen besitzen:
65
Aus den Polarkoordinaten (r, ϕ) erhält man die kartesische Koordinaten mittels
folgender Abbildung zurück:
µ ¶ µ ¶
2 2 r r cos ϕ
G:R →R , G := .
ϕ r sin ϕ
Damit können wir folgenden Algorithmus formulieren, um zwei unabhängige, stan-
dardnormalverteilte Zufallsvariablen X und Y zu erhalten:
(1) erzeuge zwei unabhängige, auf [0, 1] gleichverteilte Zufallsvariablen U und V ;
(2) definiere
p
R := −2 log U , Θ := 2πV.
X := R cos Θ, Y := R sin Θ.
wobei N = (N (t) : t > 0) einen Zählprozess und SN (t) den Gesamtschaden eines
Portfolios {Xk : k ∈ N} von unabhängigen, identisch verteilten Risiken bezeichnet.
Für den Geamtschaden der Form
N (t)
X X , falls N (t) > 0,
k
SN (t) :=
k=1
0, falls N (t) = 0,
nehmen wir wie üblich an, dass der Zählprozess N und die Risiken Xk unabhängig
sind. Deshalb können diese Zufallsvariablen getrennt voneinander simuliert werden
und man kann den Risikoprozess R(t) während der Zeit [0, T ] durch folgenden Al-
gorithmus simulieren:
(1) setze T0 = 0, R(0) = u;
66
(iv) setze
(
R(Tk−1 ) + β(t − Tk−1 ), falls t ∈ (Tk−1 , Tk ),
R(t) =
R(Tk−1 ) + βWk − Xk , falls t = Tk ;
Aus diesem Algorithmus erhält man einfach den Spezialfall eines Poissonprozesses:
Beispiel 6.5 Um einen Poissonprozess N = (N (t) : t > 0) der Intensität λ bis zur
Zeit T > 0 zu simulieren, kann man den folgenden Algorithmus nutzen:
Für andere Verfahren zur Simulation von Poissonprozessen siehe auch [17].
Eine Verallgemeinerung des Poissonprozesses ist der sogenannte Erneuerungspro-
zess. Dies ist ein Zählprozess, für den die Wartezeiten W1 , W2 , . . . als unabhängig
und identisch verteilt vorausgesetzt werden. Auch solch ein Prozess kann mittels des
Algorithmus in Beispiel 6.5 simuliert werden, indem die Zufallsvariable W entspre-
chend der vorausgesetzten Verteilung simuliert wird.
67
6.3.1 Monte-Carlo Simulation
Die klassische Monte-Carlo Simulation bezeichnet die approximative Näherung eines
Wertes für den Erwartungswert E [Y ] einer Zufallsvariablen Y durch Realisierungen
von n unabängigen Zufallsvariablen Y1 , . . . , Yn mit der Verteilung PY . Mittels des
starken Gesetzes der großen Zahlen schließt man:
n
1X
Ȳn := Yk → E [Y ] P -f.s. für n → ∞.
n k=1
Mit den Algorithmen des Abschnittes 6.2 können wir den Risikoprozess R in dem
endlichen Zeitintervall [0, T ] simulieren und damit durch eine klassische Monte-
Carlo-Simulation eine Näherung für E [Y ] = P (QT < 0) erhalten. Jedoch ist auf
dieser Weise keine klassische Monte-Carlo-Simulation der Ruinwahrscheinlichkeit in
unendlicher Zeit, wir sie in Abschnitt 3 betrachtet haben, möglich. Denn wir können
den Risikoprozess R nicht in unendlicher Zeit simulieren.
68
Beispiel 6.7 Monte-Carlo-Simulationen lassen sich auch zur Schätzung von Inte-
gralen der Form
Z 1
I1 := g(x) dx
0
X 0 := E [X | Z]
E [X 0 ] = E [E [X | Z]] = E [X] = E [Y ] .
Importance Sampling: Diese Methode basiert auf der Idee, den “wichtigen” Wer-
ten von Y größeres Gewicht zu geben.
Die Zufallsvariable Y sei auf (Ω, A , P ) definiert und besitze die Verteilung PY .
Zur Simulation von E[Y ] = EP [Y ] werden in der klassischen Monte-Carlo-Methode
unabhängige Zufallsvariablen Yk auf demselben Wahrscheinlichkeitsraum bezüglich
desselben Wahrscheinlichkeitsmaßes P simuliert. Beim Importance Sampling werden
die Zufallsvariablen Yk jedoch bezüglich eines anderen Wahrscheinlichkeitsmaßes Q
69
simuliert und es wird von einer weiteren Zufallsvariablen Z ausgegangen, so dass
gilt
Z Z
EP [Y ] := Y dP = ZY dQ =: EQ [ZY ].
Beispiel 6.8 Es sei Ω = R und X(ω) = ω eine Zufallsvariable auf dem Wahrschein-
lichkeitsraum (Ω, B(R), P ). Das Wahrscheinlichkeitsmaß P besitze die Dichte f . Für
eine meßbare Funktion ϕ : R → R suchen wir eine Approximation von E[Y ] mit
Y := ϕ(X). Für eine beliebige Dichte g definiert man die Zufallsvariable
R Z(ω) :=
f (X(ω))/g(X(ω)) sowie das Maß Q auf (Ω, B(R)) durch Q(A) := A g(x) dx für
alle A ∈ B(R). Falls die Menge {ω : g(ω) = 0} eine P -Nullmenge ist, dann gilt
Z
f (X(ω))
EQ [ZY ] = EQ [Zϕ(X)] = ϕ(X(ω)) Q(dω)
Ω g(X(ω))
Z
f (ω)
= ϕ(ω)g(ω) dω
Ω g(ω)
Z
= f (ω)ϕ(ω) dω = EP [ϕ(X)] = EP [Y ].
Ω
70
Als Varianz ergibt sich
Z µ ¶2
1 f (x)
Var[Ỹn ] = − EP [Y ] g(x) dx.
n R g(x)
Je nach Wahl der Funktion g kann diese Varianz geringer als bei der klassischen
Monte-Carlo-Simulation ausfallen.
Speziell in unserem Kontext, der Simulation von Ruinwahrscheinlichkeiten, sind wir
mit dem Problem der Simulation von seltenen Ereignissen (rare events) konfrontiert.
Denn die uns interessierende Größe p := ψ(u), die Ruinwahrscheinlichkeit, ist im
Allgemeinen sehr klein, ca. 10−3 . Für eine Simulation der Ruinwahrscheinlichkeit
setzen wir wie in in Beispiel 6.6
Y := 1{Q(u)<0} ,
jedoch mit einem unendlichen Zeithorizont. Könnten wir eine klassische Monte-
Carlo-Simulation von Y durchführen, so hätte diese die Varianz
Bei abnehmendem p verringert sich zwar die Varianz, jedoch ist dieser Wert p sowieso
sehr klein. Deshalb ist von größerer Bedeutung die relative Abweichung:
√ p
VarY p(1 − p)
= → ∞ für p → 0.
p p
Im Folgenden führen wir ein Qualitätskriterium einer Monte-Carlo-Methode für sel-
tene Ereignise ein.
Definition 6.9 Es seien A(u) Ereignisse, die von einem Paremeter u > 0 abhängen,
so dass
lim P (A(u)) = 0,
u→∞
VarX(u)
lim sup < ∞.
u→∞ (P (A(u)))2
VarX(u)
lim sup <∞ für alle ε > 0.
u→∞ (P (A(u)))2−ε
71
Bemerkung 6.10
ln VarX(u)
lim inf > 2.
u→∞ ln P (A(u))
Beispiel 6.11 Für Ruinwahrscheinlichkeiten ist das Ereignis {Q(u) < 0} abhängig
von der Anfangsrisikoreserve u:
wobei τ (u) die Ruinzeit bezeichnet. Falls die Nettoprofitbedingung erfüllt ist, dann
bezeichnet A(u) ein seltenes Ereignis im Sinn von Definition 6.9, da P (A(u)) → 0
für u → ∞.
Y = 1{Q(u)<0} .
72
Dies entspricht gerade der Verteilungsfunktion des Gesamtschadens SM eines Port-
folios {Zk : k ∈ N} von unabhängigen Risiken Zk , die gemäß der integrierten
Verteilungsfunktion FXI 1 verteilt sind, und einer Schadenzahl M , die geometrisch
verteilt ist zu dem Parameter r = (1 + ρ)−1 . Denn nach Satz 2.3 gilt:
∞
X
P (SM 6 u) = P (M = k)P (Z1 + . . . Zk 6 u)
k=0
∞
X
= (1 − r) rk (FXI 1 )∗k (u)
k=0
= ϕ(u) (22)
Bemerkung 6.12
VarY1
lim sup =1
u→∞ ψ(u)
73
6.3.3 Via importance sampling
Setzt man die Existenz des Cramér-Lundberg-Koeffizienten voraus, kann man eine
Simulationsmethode für die Ruinwahrscheinlichkeit gewinnen, die einen beschränk-
ten relativen Fehler besitzt. Dieser Algorithmus basiert auf der Methode des “im-
portance samplings”. Grundlage dieser Methode ist das folgende Resultat:
Theorem 6.13 Falls der Cramér-Lundberg-Koeffizient r > 0 existiert, definiere
man
1
λr := λMX1 (r), Pr,X1 (dx) := erx PX1 (dx).
MX1 (r)
a) Es existiert ein Wahrscheinlichkeitsmaß Pr , so dass (SN (t) : t > 0) bezüglich
dieses Maßes Pr ein zusammengesetzter Poissonprozess mit Charakteristik
(λr , Pr,X1 ) ist.
b) Mit der Bezeichnung Er für den Erwartungswertoperator bezüglich des Maßes
Pr gilt:
£ ¤
ψ(u) := P (τ (u) < ∞) = Er e−r(SN (τ (u)) −βτ (u)) 1{τ (u)<∞} .
Beweis: Siehe [2, Ch. III.5]. 2
74
6.3.4 Via bedingter Monte-Carlo-Simulation
Die Simulationen dieses Abschnittes basieren auf der varianzreduizierenden Metho-
de der bedingten Monte-Carlo-Simulation. Auf diesem Weg werden wir eine Monte-
Carlo-Simulation erhalten, die logarithmisch effizent ist, falls die integrierte Vertei-
lungsfunktion FXI 1 vom Pareto-Typ ist. Man kann zeigen, dass dies der Fall ist, falls
die Verteilung der Risiken vom Pareto-Typ sind, z.B. Paretoverteilung.
Wie zuvor nutzen wir die Darstellung der Ruinwahrscheinlichkeit als die Tailver-
teilungsfunktion des Gesamtschadens SM eines Portfolios von Risken Zk mit der
Verteilung FXI 1 und geometrisch verteilter Schadenzahl M aus. Bedingt man unter
den ersten M − 1 Risiken erhält man:
Als einen Algorithmus zur Simulation von ψ(u) bietet sich an:
(1) erzeuge eine Zufallsvariable M , die zum Parameter q = (1 + ρ)−1 geometrisch
verteilt ist;
ln VarY1 (u)
lim = 1.
u→∞ ln ψ(u)
Das Korollar 6.15 zeigt, dass der oben vorgestellte Algorithmus nicht logarithmisch
effizient sein kann. Wir verbessern diesen Algorithmus durch Ausnutzung einer we-
sentlichen Eigenschaft von subexponentiellen Verteilungen: die Tailverteilung der
Summe verhält sich asypmptotisch wie die Tailverteilung des maximalen Schadens,
siehe (10).
Für beliebige reellwertige Zufallsvariablen Z1 , . . . , Zn bezeichne
Z(1) , . . . , Z(n)
75
die Zufallsvariablen in geordneter Folge, so dass Z(1) 6 . . . 6 Z(n) gilt. Diese Rei-
henfolge hängt natürlich von ω ∈ Ω ab, jedoch lässt sich leicht nachweisen, dass die
Meßbarkeit erhalten bleibt.
(4) setze
Dieser Algorithmus lässt sich jetzt als logarithmisch effizient nachweisen, falls die in-
tegrierte Verteilungsfunktion der Verteilungsfunktion der zugrundeliegenden Risiken
eine Verteilung vom Pareto-Typ ist.
Theorem 6.17 Die integrierte Verteilungsfunktion FXI 1 der Risikoverteilung sei vom
Pareto-Typ. Dann gilt für die Varianz
ln VarY2 (u)
lim inf > 2.
u→∞ ln ψ(u)
76
A Appendix
A.1 Parameter von Verteilungen
In einer Einführung zur Wahrscheinlichkeitstheorie betrachtet man eine reellwertige
Zufallsvariable X als eine messbare Abbildung von einem Wahrscheinlichkeitsraum
(Ω, A , P ) in den Raum (R, B(R)), auf dem das Bildmaß oder die Wahrscheinlich-
keitsverteilung PX induziert wird. Wie oft in der Wahrscheinlichkeitstheorie sind
wir hier nicht an den zufälligen Werten ω ∈ Ω interessiert, sondern nur an den
Werten X(ω) oder sogar meistens nur an der Verteilung PX von X. Deshalb ver-
nachlässigt man den zugrundegelegten Wahrscheinlichkeitsraum und betrachtet nur
die induzierten Wahrscheinlichkeitsverteilungen.
Definition A.1
X ∼ Q.
Außer dem Erwartungswert und der Varianz einer Zufallsvariablen gibt es noch zahl-
reiche andere Parameter, die die zugrunde liegende Verteilung beschreiben. Zunächst
nahe liegend sind höhere Momente.
Definition A.2 Es sei Q eine Verteilung und X eine Zufallsvariable mit der Ver-
teilung Q. Falls für ein k ∈ N
Z
|x|k Q(dx) < ∞
R
101
Das letzte Integral kann man, unabhängig von der Zufallsvariablen X, als einen Wert
betrachten, der von der Verteilung PX definiert wird. Deshalb spricht man auch
von dem Erwartungswert einer Verteilung, ohne eine Zufallsvariable zu benennen.
Entsprechendes gilt für die höheren Momente.
Mittels der binomischen Formel erhält man unmittelbar folgenden Zusammenhang
zwischen den gewöhnlichen und zentrierten Momenten:
für ein k ∈ N. Dann folgt für die gewöhnlichen und zentrierten Momente:
k µ ¶
X k
µk = (−1)k−j mj mk−j
1
j=0
j
mit m0 := 1.
Bei einer symmetrischen Verteilung, d.h Q(m1 +A) = Q(m1 −A) für alle A ∈ B(R),
ist das dritte zentrierte Moment Null, falls es existiert. Durch geeignete Normierung
dieses Moments erweist sich der resultierende Quotient invariant bezüglich Standar-
disierung bzw. dimensionslos.
Definition A.5 Es sei Q eine Verteilung, deren drittes Moment µ3 existiert und
endlich ist. Dann heißt
µ3
γ1 (Q) := p 3
µ2
die Schiefe der Verteilung (nach Charlier). Falls X eine Zufallsvariable mit der
Verteilung Q ist, so benutzen wir die Notation γ1 (X).
Als eine weitere Größe führen wir den Exzess einer Verteilung ein, der mittels des
vierten zentrierten Moments definiert ist. Der Exzess gibt den Grad der Steilheit
einer Verteilung an. Durch Normierung erhält man wieder die Invarianz bezüglich
Standardisierung und durch eine affine Verschiebung wird erreicht, dass der Exzess
der Standardnormalverteilung sich als 0 ergibt.
Definition A.6 Es sei Q eine Verteilung, deren viertes Moment µ4 existiert und
endlich ist. Dann heißt
µ4
γ2 (Q) := −3
µ22
der Exzess der Verteilung. Falls X eine Zufallsvariable mit der Verteilung Q ist, so
benutzen wir die Notation γ2 (X).
102
Platykurtisch γ2 < 0 Mesokurtisch γ2 = 0 Leptokurtisch γ2 > 0
Definition A.7 Es sei X eine Zufallsvariable mit der Verteilung Q. Dann heißt
die Zahl m = m(Q) ∈ R, für die gilt
1 1
P (X 6 m) > und P (X > m) >
2 2
Median von X oder Q.
Beispiel A.9
Definition A.10
a) Es sei X eine stetig verteilte Zufallsvariable mit der Verteilung Q, die die
Dichte f besitze. Dann heißt jedes relative Maximum mod=mod(X) der Dichte
f Modalwert von X oder Q.
103
b) Es sei X eine diskret verteilte Zufallsvariable mit pk = P (X = xk ) für k ∈ N0 .
Dann heißt jedes pk0 Modalwert mod=mod(X) von X oder Q, für das gilt:
Im Falle von Randpunkten wird nur die jeweilige definierte Seite betrachtet.
Falls nur ein Modalwert einer Verteilung existiert, so wird die Verteilung unimodal
genannt. Entsprechend werden die Begriffe bimodal und multimodal benutzt.
Beispiel A.12
a) Die Poissonverteilung π(λ) besitzt die Modalwerte λ und λ − 1, falls λ ∈ N,
und ansonsten den Modalwerte [λ]. ([·] Gauss-Klammer).
b) Die Binomialverteilung b(n, p) besitzt die Modalwerte
A.2 Faltung
Sind X und Y zwei unabhängige, reellwertige Zufallsvariablen, so ist X +Y eine neue
Zufallsvariable. Die Verteilung PX+Y von X + Y ist die Faltung der Verteilungen
PX und PY von X und Y , d.h.
Z
PX+Y (A) = P (X + Y ∈ A) = PX (A − x) PY (dx).
R
für A ∈ B(R).
Definition A.13
a) Es seien R und Q zwei Verteilungen auf (R, B(R)). Dann heißt die Verteilung
Z
R ∗ Q : B(R) → [0, 1], R ∗ Q(A) := R(A − u) Q(du) für A ∈ B(R)
R
104
Aufgrund der folgenden Bemerkung ist eine vertiefte Kenntnis des Lebesgue-Stieltjes-
Integrals nicht notwendig, um die Faltung von Verteilungsfunktionen zu behandeln.
Beispiel A.15
a) Es seien X und Y unabhängige, poissonverteilte Zufallsvariablen zu den Pa-
rametern λ1 , λ2 > 0. Dann besitzt die Zufallsvariable X + Y eine Poissonver-
teilung zu dem Parameter λ1 + λ2 .
b) Es seien R und Q diskrete Verteilungen auf S = {yk : k ∈ N0 } ⊆ R, d.h.
R(S) = 1 und Q(S) = 1.
Dann ist die Faltung R ∗ Q eine diskrete Verteilung auf
T = {xl : es existiert i ∈ N0 , so dass xl − yi ∈ S}
und ist gegeben durch
∞
X
(R ∗ Q)({xl }) = R({xl − yk })Q({yk }).
k=0
c) Es seien R und Q Verteilungen mit Dichten f und g. Dann besitzt die Faltung
R ∗ Q ebenfalls eine Dichte und ist gegeben durch
Z µZ ¶
(R ∗ Q)(A) = f (x − y)g(y) dy dx für alle A ∈ B(R).
A R
Die Faltung erweist sich als assoziativ, d.h. es gilt für Verteilungen Qk , k = 1, 2, 3:
(Q1 ∗ Q2 ) ∗ Q3 = Q1 ∗ (Q2 ∗ Q3 ).
Deshalb können wir folgende vereinfachende Notation einführen:
Definition A.16
a) Es sei Q eine Verteilung. Dann heißt
Q∗n := Q ∗ · · · ∗ Q für n ∈ N,
n-fache Faltung von Q. Wir setzen Q∗0 := δ0 .
b) Es sei F eine Verteilungsfunktion. Dann heißt
F ∗n := F ∗ · · · ∗ F für n ∈ N,
n-fache Faltung von F . Wir setzen F ∗0 := 1{0} .
105
A.3 Laplace-Transformierte
Ähnlich wie die charakteristische Funktion in eineindeutiger Weise eine Verteilung
beschreibt, gibt es noch weitere Integraltransformierte. Die in diesem Abschnitt
betrachtete Laplace-Transformierte eignet sich insbesondere bei Verteilungen, die
auf der positiven Achse [0, ∞) konzentriert sind.
Definition A.17 Es sei Q eine Verteilung auf (R+ , B(R+ )). Dann heißt
Z
LQ : [0, ∞) → R, LQ (t) := e−ts Q(ds)
R+
Laplace-Transformierte von Q.
Falls X eine Zufallsvariable mit Verteilung Q ist, so nennt man LX := LQ Laplace-
Transformierte von X.
Falls das Integral für ein t0 < 0 existiert, so ist die Laplace-Transformierte sogar auf
[t0 , ∞) definiert.
Ist LX die Laplace-Transformierte einer Zufallsvariablen X, dann gilt offensichtlich
Beispiel A.18
(k) dk k
£ k ¤
LX (t) := L X (t) = (−1) E X exp(−tX) für k = 0, 1, . . . .
dtk
106
b) die folgende Umkehrformel:
X nk (k)
F (x) = lim (−1)k L (n)
n→∞
k6nx
k!
Beispiel A.21
a) Für eine b(n, p)-verteilte Zufallsvariable X gilt:
(1)
E [X] = −LX (0+) = −(−pn(1 − p + pe−t )n−1 e−t )|t=0 = pn.
Theorem A.22 Es seien P und Q zwei Verteilungen auf (R+ , B(R+ )) mit Laplace-
Transformierten LP und LQ . Dann gilt für die Laplace-Transformierten LP ∗Q von
P ∗ Q:
107
Die Laplace-Transformierte erweist sich ebenfalls nützlich zur Verifikation der schwa-
chen Konvergenz von Verteilungen:
gilt, dann konvergiert (Xn )n∈N schwach gegen eine poissonverteilte Zufallsgröße zum
Parameter λ.
Im Zusammenhang mit der Stochastik wird die Laplace-Transformierte in der Mo-
nographie von Feller [7] eingeführt. Klassische Literatur ist die Monographie von
Dötsch.
Weitere Literatur:
• G. Doetsch. Anleitung zum praktischen Gebrauch der Laplace-Transformierte
und der Z- Transformation. München: R. Oldenbourg Verlag, 1989.
• P. P. G. Dyke. An introduction to Laplace transforms and Fourier series.
London: Springer, 2000.
• J. L. Schiff. The Laplace transform: Theory and applications. New York:
Springer, 1999.
Definition A.26 Es sei Q eine diskrete Verteilung auf N0 mit qk := Q({k}) für
k ∈ N0 . Dann heißt die Potenzreihe
∞
X
GQ (s) := s k qk
k=0
108
erzeugende Funktion von Q.
Für eine diskret verteilte Zufallsvariable X mit Werten in N0 und Wahrscheinlich-
keitsverteilungen pk := P (X = k) für k ∈ N0 heißt die Potenzreihe
∞
X
£ X
¤
GX (s) := E s = sk pk
k=0
Beispiel A.27
Bemerkung A.28
2) Man beachte, dass die erzeugende Funktion eine Potenzreihe ist. Ist r der
Konvergenzradius der erzeugenden Funktion G, dann ist G differenzierbar auf
(−r, r).
Für die erzeugende Funktion gelten analoge Aussagen wie für die Laplace-Trans-
formierte. Insbesondere ist die Verteilung durch die erzeugende Funktion eindeutig
bestimmt, was in diesem Fall sich sehr einfach durch Differentiation ergibt.
109
Die erzeugende Funktion ist wie die Laplace-Transformierte sehr nützlich zur Be-
rechnung der Momente:
110
B Bedingter Erwartungswert
Es
p sei H ein Hilbertraum mit Skalarprodukt h·, ·i und dazugehöriger Norm khk =
hh, hi für h ∈ H.
Definition B.3 Es seien X eine Zufallsvariable mit E |X|2 < ∞ und D ⊆ A eine
Teil-σ-Algebra. Dann heißt die lineare Projektion
π : L2 (Ω, A , P ) → L2 (Ω, A , P ) auf L2 (Ω, D, P )
bedingter Erwartungswert von X unter D.
Als Notation führen wir ein: E [X | D] := π(X).
Man definiert die bedingte Wahrscheinlichkeit auf folgender Weise:
P (X ∈ A | D) := E [1A (X) | D] für alle A ∈ B(R).
111
Bemerkung B.4 Der bedingte Erwartungswert E [X | D] ist eine Äquivalenzklasse
in dem Quotientenraum L2 (Ω, D, P ). In unserer Sprech– und Schreibweise werden
wir aber nicht unterscheiden, wenn wir uns auf einen beliebigen Repräsentanten
dieser Äquivalenzklasse beziehen. In diesem Sinn ist der bedingte Erwartungswert
E [X | D] eine Zufallsvariable auf dem Wahrscheinlichkeitsraum (Ω, D, P |D ) und alle
Aussagen für den bedingten Erwartungswert können nur P -f.s. getroffen werden.
Bemerkung B.5
a) Der bedingte Erwartungswert existiert für jede Zufallsvariable X mit E |X|2 <
∞ und ist P -fast sicher eindeutig.
Eine wesentliche Eigenschaft des bedingten Erwartungswertes ergibt sich (hier) di-
rekt aus der Definition als Projektion und Satz B.2:
Theorem B.6 Es seien X eine Zufallsvariable mit E |X|2 < ∞ und D ⊆ A eine
Teil-σ-Algebra. Dann gilt:
2 2
E |E [X | D] − X| = inf{E |Y − X| : für alle Y ∈ L2 (Ω, D, P )}.
Der bedingte Erwartungswert E [X | D] lässt sich als eine Vergröberung der Zufalls-
variablen X verstehen, die nur noch die “Informationen” der kleineren σ-Algebra
D wiedergibt. Oft möchte man aber bedingen unter den “Informationen”, die eine
andere Zufallsvariable Y bereitstellt.
Definition B.7
σ(T ) := {T −1 (A0 ) : A0 ∈ A 0 }
112
Definition B.8 Es seien X eine Zufallsvariable mit E |X|2 < ∞. Ist (Ω0 , A 0 ) ein
Messraum und Y : Ω → Ω0 eine Zufallsvariable, dann heißt
E [X | Y ] := E [X | σ(Y )]
Y : (Ω, A ) → (Ω0 , A 0 )
E [X | Y ] = g(Y ).
Im folgenden Satz geben wir einige einfache Eigenschaften des bedingten Erwar-
tungswertes wieder.
für alle x1 , . . . , xn ∈ R.
113
b) Die Zufallsvariablen X1 , . . . , Xn werden bedingt unter D identisch verteilt ge-
nannt, falls gilt:
Weder müssen unabhängige Zufallsvariablen bedingt unabhängig sein, noch gilt dies
umgekehrt, wie wir im folgenden Beispiel skizzieren.
Wir lassen hier die genaue Begründung aus, wie wir von Eigenschaften der herkömm-
lichen, unter einem Ereignis bedingten Wahrscheinlichkeit, z.B. P (X1 = 1, X2 =
1 | S2 = 1), was eine Zahl ist, auf Eigenschaften der bedingten Wahrscheinlichkeit,
z.B. P (X1 = 1, X2 = 1 | S2 ), die eine Zufallsvariable ist, schließen können.
a) Es gilt:
P (X1 = 1, X2 = 1 | S2 = 1) = 0.
für alle i ∈ {0, 1}, k ∈ {0, 1, 2} und j ∈ {0, . . . , 3}. Folglich sind S1 und
S3 bedingt unter σ(S2 ) unabhängig. Jedoch sind S1 und S3 sicherlich nicht
unabhängig (im herkömmlichen Sinn).
114
Literatur
[1] G. Alsmeyer. Erneuerungstheorie. Analyse stochastischer Regenerationssche-
mata. Stuttgart: B. G. Teubner, 1991.
[7] W. Feller. An introduction to probability theory and its applications. Vol. II.
New York: John Wiley and Sons, 1966.
[10] G. Gripenberg, S.-O. Londen, and O. Staffans. Volterra integral and functional
equations. Cambridge: Cambridge University Press, 1990.
[15] N. Madras. Lectures on Monte Carlo methods. Providence, RI: American Ma-
thematical Society, 2002.
[17] B. D. Ripley. Stochastic simulation. New York: John Wiley & Sons, 1987.
115
[18] T. Rolski, H. Schmidli, V. Schmidt, and J. Teugels. Stochastic processes for
insurance and finance. Chichester: Wiley, 1999.
116
Index
Algorithmus Laplace-Transformierte, 106
DePril, 7 Lognormalverteilung, 14, 29
Panjer-Rekursionsverfahren, 23
Anpassungskoeffizient, 39 Maximalschadenprinzip, 50
Ausgleich im Kollektiv, 6 Median, 103
Mischung von Verteilungen, 21
bedingt Modalwert, 103
identisch verteilt, 113 Moment, 101
unabhängig, 113 Monte-Carlo
bedingter Erwartungswert, 111 bedingte, 68
Binomialverteilung, 18 Definition, 67
Bühlmann Modell, 59 importance sampling, 68
117
subexponentielle Verteilung, 30
Supremumsdistanz, 24
Tailwahrscheinlichkeit, 28
Totalvariationsabstand, 26
Uberlebenswahrscheinlichkeit, 38
Varianzprinzip, 47
Verlustfunktion, 50
Verlustfunktionenprinzip, 51
Verteilung, 101
Wartezeiten, 35
Weibullverteilung, 30
zusammengesetzte Summenvariablen, 17
118