Beruflich Dokumente
Kultur Dokumente
Fakultat IV - Mathematik
Seminar
Einleitung
Stehen wir vor der Aufgabe eine Extremertstatistik zu testen, so konnten wir dieses
zum Beispiel mit der Programmiersprache R durchf
uhren. Im Rahmen dieser Seminararbeit werden wir uns eine Extremwertstatistik anschauen bei welcher eine Berchnung
mit R nicht unmittelbare durchgef
uhrt werden kann, da R manche Integrale fehlerhaft
berechnet. So erhalten wir, zum Beispiele f
ur die Funktion h(x) = x12 , folgende Resultate:
Z
1/x2 dx = 1,
1
1
2
3
h<f u n c t i o n ( x ) {1 /x 2}
i n t e g r a t e (h ,1 , Inf ) $ value )
[1] 1
1000
1/x2 dx 0,999,
1
1
2
3
h<f u n c t i o n ( x ) {1 /x 2}
i n t e g r a t e ( h , 1 , 1 e +3)$ v a l u e
[ 1 ] 0.999
1 000 000
1/x2 dx = ,
1
1
2
3
h<f u n c t i o n ( x ) {1 /x 2}
i n t e g r a t e ( h , 1 , 1 e +6)$ v a l u e
Fehler in i n t e g r a t e (h , 1 , 1000000) : the i n t e g r a l i s probably di ver ge nt
1/x2 dx 2 7 106 .
1
1
2
3
h<f u n c t i o n ( x ) {1 /x 2}
i n t e g r a t e ( h , 1 , 1 e +9)$ v a l u e
[ 1 ] 0.000002754479
Extremwertstatistik
Angenommen, wir mochten folgende Extremwertstatistik mit R1 berechnen:
=
22 (A)
m
R
u
f (x)
dx
g(x)
mit
f (x) =
(x2 u2 ),
x u (1+1/)
)
, u > 0, > 0, > 0, x u,
wobei uns nur die Berechnung des Integrals interessiert. Aus diesem Grund, werden
wir auf die Bedeutung der anderen Bestandteile der Extremwertstatistik nicht naher
eingehen.
g(x) = (1 +
Integralberechnung
Setzen wir u = 2, = 0,6 und = 1,5 und berechnen mit R das Integral
dann erhalten wir:
1
2
3
4
5
6
R
u
f (x)
dx,
g(x)
In der Hilfe von R beziehungsweise auf der CRAN-Homepage steht zur Integration folgendes: . . . an R function taking a numeric first argument and returning a numeric
vector of the same length. Returning a non-finite element will generate an error. Demnach kann ein Integral nicht berechnet werden, falls ein Funktionswert nicht existiert.
Alle anderen Hinweise beziehen sich auf die Beschrankung der numerischen Methoden.
Weitere Hinweise, warum manche Integrale nicht berechnet werden konnen, existieren
nicht - weder in der Fachliteratur noch auf der CRAN-Homepage.
Wenn nun ein nicht existierender Funktionswert zum Abbruch der Berechnung f
uhrt,
so stellt sich die Frage: Kann es sein, dass R manche Funktionswerte falsch berechnet ?
Genau diesen Gedankengang werden wir nun u
ufen.
berpr
Funktionswerte
8
4
f(x)
g(x)
10
Betrachten wir die Abbildung 0.1, so besitzt die Funktion g eine viel groere Steigung
als die Funktion f .
f(x)=sqrt(x^2-u^2)
g(x)=sigma*(1+gamma*((x-u)/sigma))^(1+1/gamma)
10
g ( 1 5 4 )>f ( 1 5 4 )
[ 1 ] TRUE
da g ( 1 5 4 ) = 1 2 0 1 4 . 1 5 und f ( 1 5 4 ) = 1 5 3 . 9 8 7
#######################################
g ( 1 e +154)>f ( 1 e +154)
[ 1 ] TRUE
da g ( 1 e +154) = 1 . 2 8 2 4 8 2 e +257 und f ( 1 e +154) = 1 e +154
#######################################
g ( 1 e +155)>f ( 1 e +155)
[ 1 ] FALSE
da g ( 1 e +155) = 5 . 9 5 2 7 5 4 e +258 und f ( 1 e +155) = I n f
f (10154 ) = 10154 ,
f (10155 ) = ,
Hieraus konnen wir schlussfolgern, dass manche groen Zahlen, unabhangig von der
tatsachlichen Groe, falschlicherweise gleich gesetzt werden. Denn eigentlich m
usste
R den Funktionswert von g in der letzten Berechnung eher gleich setzen und nicht
den Funktionwert von f , da die Funktion g eine viel groere Steigung besitzt als die
Funktion f .
106 +3
106
und
107 +3
107
107 +3
107
=1u
ufen, so folgt:
berpr
(107+3) /107==1
[ 1 ] FALSE
L
osungsvorschlag
Im Rahmen dieser Seminararbeit entstand folgender Losungsvorschlag.
F
ur das Integrieren benotigt R Funktionswerte ungleich , jedoch erzeugt bei der
R (x)
Funktionen f genau diese. Somit kann die Berechnung des Integrals u fg(x)
dx nicht
unmittelbar durchgef
uhrt werden.
Mochten wir dieses Integral trotzdem berechnen, so m
ussen wir einen Umweg einschlagen. Wir m
ussen die Funktionen f so anpassen, dass bei der Berechnung der Funktionswerte das Ergebnis nicht angenommen wird.
Dieses kann erreicht werden, wenn wir vor der Integralberechnung folgende Substitution2 durchf
uhren:
t = exp(x) x = log(t).
Bemerkung (Substitution). Es ist allgemein bekannt, dass f
ur alle x > 0 folgende
Aussage gilt:
exp(log(x)) = log(exp(x)) = x.
Wenden wir nun diese Aussage auf die Funktionen f und g an, so erhalten wir f
ur
x = 154:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
#######################################
########### e x p ( l o g ( ) ) ##############
#######################################
e x p ( l o g ( g ( 1 5 4 ) ) )>e x p ( l o g ( f ( 1 5 4 ) ) )
[ 1 ] TRUE
da e x p ( l o g ( g ( 1 5 4 ) ) ) = 1 2 0 1 4 . 1 5 und e x p ( l o g ( f ( 1 5 4 ) ) ) = 1 5 3 . 9 8 7
#######################################
e x p ( l o g ( g ( 1 e +154) ) )>e x p ( l o g ( f ( 1 e +154) ) )
[ 1 ] TRUE
da e x p ( l o g ( g ( 1 e +154) ) ) = 1 . 2 8 2 4 8 2 e +257 und e x p ( l o g ( f ( 1 e +154) ) ) = 1 e +154
#######################################
e x p ( l o g ( g ( 1 e +155) ) )>e x p ( l o g ( f ( 1 e +155) ) )
[ 1 ] FALSE
da e x p ( l o g ( g ( 1 e +155) ) ) = 5 . 9 5 2 7 5 4 e +258 und e x p ( l o g ( f ( 1 e +155) ) ) = I n f
1
2
3
4
5
6
7
8
9
10
11
12
13
14
#######################################
########### l o g ( e x p ( ) ) ##############
#######################################
l o g ( e x p ( g ( 1 5 4 ) ) )>l o g ( e x p ( f ( 1 5 4 ) ) )
[ 1 ] TRUE
da l o g ( e x p ( g ( 1 5 4 ) ) ) = I n f und l o g ( e x p ( f ( 1 5 4 ) ) ) = 1 5 3 . 9 8 7
#######################################
l o g ( e x p ( g ( 1 e +154) ) )>l o g ( e x p ( f ( 1 e +154) ) )
[ 1 ] FALSE
da l o g ( e x p ( g ( 1 e +154) ) ) = I n f und l o g ( e x p ( f ( 1 e +154) ) ) = I n f
#######################################
l o g ( e x p ( g ( 1 e +155) ) )>l o g ( e x p ( f ( 1 e +155) ) )
[ 1 ] FALSE
da l o g ( e x p ( g ( 1 e +155) ) ) = I n f und l o g ( e x p ( f ( 1 e +155) ) ) = I n f
Somit berechnet R f
ur
exp(log())
ein anderes Ergebnis als f
ur
log(exp()).
Zudem werden Funktionswerte gleich angenommen. Bei einer Substitution m
ussen
wir daher darauf achten, dass genau dieses nach einer Substitution nicht passiert.
F
uhren wir nun eine Substitution mit t = exp(x) durch, so erhalten wir:
Z
0
eu
p
(( log(t))2 u2 )
(1 + ( log(t))u
)(1+1/) t
dt.
#######################################
###### Vor d e r S u b s t i t u t i o n ###########
#######################################
f f f<f u n c t i o n ( x ) { f ( x ) / g ( x ) }
i n t e g r a t e ( f f f , u , Inf ) $ value
Fehler in i n t e g r a t e ( f f f , u , I n f ) : the i n t e g r a l i s probably divergent
#######################################
###### Nach d e r S u b s t i t u t i o n ##########
9
10
11
12
13
14
#######################################
f f<f u n c t i o n ( x ) { s q r t (( l o g ( x ) ) 2u 2 ) }
gg<f u n c t i o n ( x ) { sigma (1+gamma ((( l o g ( x ) )u ) / sigma ) ) (1+1 /gamma) }
f f f 1<f u n c t i o n ( x ) { f f ( x ) / ( gg ( x ) x ) }
i n t e g r a t e ( f f f 1 , 0 , exp(u ) ) $ v a l u e
[ 1 ] 9.254121
Durch diese simple Umformung haben wir es geschafft, dass das Integral
aus der Extremwertstatistik doch mit R berechnet werden kann.
Wenden wir dieselbe Substitution auf die Integrale aus der Einleitung an, so f
uhrt dieser
Weg auch hier zum gew
unschten Ziel:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
#######################################
###### Vor d e r S u b s t i t u t i o n ###########
#######################################
h<f u n c t i o n ( x ) {1 /x 2}
i n t e g r a t e (h ,1 , Inf ) $ value )
[1] 1
i n t e g r a t e ( h , 1 , 1 e +3)$ v a l u e
[ 1 ] 0.999
i n t e g r a t e ( h , 1 , 1 e +6)$ v a l u e
Fehler in i n t e g r a t e (h , 1 , 1000000) : the i n t e g r a l i s probably di ver ge nt
i n t e g r a t e ( h , 1 , 1 e +9)$ v a l u e
[ 1 ] 0.000002754479
#######################################
###### Nach d e r S u b s t i t u t i o n ##########
#######################################
h1<f u n c t i o n ( x ) {1 / ((( l o g ( x ) ) 2 ) x ) }
i n t e g r a t e ( h1 , 0 , exp ( 1) ) $ v a l u e
[ 1 ] 0.9974389
i n t e g r a t e ( h1 , exp ( 103) , exp ( 1) ) $ v a l u e
[ 1 ] 0.9974389
i n t e g r a t e ( h1 , exp ( 106) , exp ( 1) ) $ v a l u e
[ 1 ] 0.9974389
i n t e g r a t e ( h1 , exp ( 109) , exp ( 1) ) $ v a l u e
[ 1 ] 0.9974389
Resu
mee
Bei der Integration mit R m
ussen wir folgendes beachten:
Die Meldung: Fehler in integrate(, , ) : the integral is probably divergent, kann
richtig oder falsch sein.
Manche Integrale werden falsch berechnet, da Funktionswerte faschlicherweise gleich
gesetzt werden. Wir konnen allerdings dieses Problem durch eine geschickte
Substitution beheben.
Die verwendeten numerischen Methoden konnen allerdings auch zum Abbruch
einer Integration f
uhren.
Eine fehlerfreie Integration hangt auch von der Systemumgebung ab. Die bei uns
verwendete Umgebung war:
1
2
3
R v e r s i o n 3 . 2 . 1 (2015 06 18)
P l a t f o r m : x86 64apple darwin13 . 4 . 0 (64 b i t )
Running under : OS X 1 0 . 1 0 . 5 ( Yosemite )