Sie sind auf Seite 1von 5

155

Kennzeichen fur eine rein zufallige Folge der Werte


in einer zeitlich geordneten Beobachtungsreihe
Von H. VON SCHELLING,
Berlin-Charlottenburg
Eingegangen 1939 Mai 8
Es wird die Frage untersucht, wie sich feststellen laat, ob die Verteilung der Restfehler B-R einer langeren,
chronologisch geordneten Reihe rein zufallig ist oder ob sie irgendwelche systematische Ziige aufweist. Eine eindeutige
Antwort gibt es nicht. Jedoch werden zwei einfache Verfahren vorgeschlagen, von dem das eine nur den Wechsel im
Steigen und Fallen der Reihenwerte beriicksichtigt, wahrend das andere auch die GroRe der Reihenwerte heranzieht.
Beide Methoden erweisen sich an einem Beispiel als leistungsfahig.

Wenn eine groDere, chronologisch geordnete Reihe von Beobachtungen vorliegt, so erhebt sich
beim Vergleich mit der Theorie die Frage, ob die verbleibenden Reste zufallig verteilt sind, oder ob
die Gruppierung systematische Ziige verrat. Falls eine auffallige Tendenz auf den ersten Blick er-
kennbar ist, wird man ihr durch Anpassung einer Parabel oder einer Sinuskurve Rechnung tragen.
Es sol1 hier nur von solchen Reihen die Rede sein, die keine offensichtliche RegelmaBigkeit erkennen
lassen.
Wer sich mit der zufalligen Anordnung von GroDen nicht befafit hat, wird leicht geneigt sein,
auch in solchen Gruppenbildungen eine systematische Ursache zu vermuten, die mit hoher Wahrschein-
lichkeit dem Zufall ihre Entstehung verdanken. Die Kenntnis vom Spiel des Zufalls ist also geeignet,
voreiligen Schlussen vorzubeugen.
Eine Schwierigkeit allerdings darf nicht iibersehen werden. Jede Beobachtungsreihe hat eine end-
liche Ausdehnung. Sie ist vollstandig zu iiberblicken, die, wenn auch komplizierte ))Regel((ihres Auf-
baues ist fur uns sichtbar. Von ))Regellosigkeitcckann man nur bei Folgen sprechen, die im Entstehen
begriffen sind und die man sich als endlos fortsetzbar zu denken hat. Alles Gewordene la& die Regeln
seines Baues erkennen, nur das Werdende kann fur uns unter Umstanden den Eindruck einer voll-
standigen Regellosigkeit erwecken.
Sollen wir eine Beobachtungsreihe untersuchen, so werden wir also ihr Entstehen prufen. Nach
verschiedenen Gesichtspunkten suchen wir zu ermitteln, ob die chronologische Aufeinanderfolge der
Werte als zufallig angesehen werden kann oder nicht. Ein einheitliches Kennzeichen dafiir gibt es nicht,
vermag es bei einer endlichen Reihe gar nicht zu geben, da eine solche im strengen Sinne nicht regellos
ist. Wenn aber eine Reihe von Anzeichen dafur spricht, daB nur ein Spiel des Zufalls vorliegt, so
ist eine solche Feststellung immerhin beachtlich.
Ein neues Hilfsmittel haben W. 0. Kermack und A. G. MacKendrickl) angegeben, das aller-
dings nur dann ohne Schwierigkeiten anwendbar ist, wenn niemals zwei gleiche Beobachtungen auf-
einander folgen. An einem Beispiel sei es erlautert. Wir betrachten die Folge
3, 1, 5, 93 2 , 4, 7, 6 , 8, * * * ’
Von 3 zu I geht es abwarts, I , 5, 9 ist eine aufsteigende Folge, 9, 2 ein Lauf abwarts, 2, 4, 7 ein solcher
aufwarts u.s.f. Diese Laufe (run up, run down) fassen Kermack und MacKendrick ins Auge. Daneben
betrachten sie Sprunge (gap) von Maximum zu Maximum, also im Beispiel 3, I, 5, 9; 9, 2, 4, 7 ; 7, 6, 8.
In scharfsinniger Weise haben sie erkannt, dalj bei rein zufalliger Anordnung die Wahrscheinlichkeit
xX1eines Laufes der Lange n
n2+n--r
Xm=3 (1)
(n+2)! ’
die Wahrscheinlichkeit eines Sprunges der Lange n
n-2 2”
Xn2 -
-2-n+2 -
n!
betragt. Aus diesen Formeln gewinnen sie die folgenden numerischen Werte :
l) Tests for randomness in a series of numerical observations. Proc. Roy. SOC.Edinburgh 57.228, 332 (1937).
20*
156 H. VON SCHEUING: Kennzeichen fur eine rein zufallige Folge der Werte usw.

2 0.6250
3 0.2750 0.4000
4 0.0792 0.3333 n=2
5
6
7
8
9
0.0173
0.0031
0.0005
o.ooo06
0.1714
0.0667
0.0212
0.0057
0.0013
3 (2
nrz
n2x,, -
n= 5
n xa1)z=p2= 0.56 2 -(2
n2x,2 nxn*)” = 1.16.

I0 o.0002
Die Verfasser haben die erste Zeile durch einen strengen Beweis bestatigt.

I 2 3
n1x9L1=3 (GT!-z+----( % + I ) ! ” >
(n+2)!
I I

I
n3xn1= 3 ((n-3). (.I.)!
+-- + ___
2 5 +-----9
(%-I)! n! ( % + I ) ! ( n + z ) !
I

Bezeichnen wir das k. Moment urn n = o mit Mh, so finden wir:


M , = 3 [(e - 2) - 2 (e -Q)+ (e -?)I = I
M I = 3 [(e - I) - 2 (e - z ) + 3(e -4) - z (e- 3 1 =z
M , = 3 [e - (e - I) + 3 (e - 2 ) - 5 (e - p) + 4 (e -?)I = 6e --?
M3= 3 [g + e + (e - I) + 2 (e - z ) - 5 (e -4) + 9(e -?) - 8 ( e -%)I =?
M4= 3 1% +* + e +4(e - I) +4(e - z ) - 3 ( e -3) + 9(e -+)- 17 (e -%) + 16(e - Sg)]=4ze -? .
Unter p h verstehen wir das 4. Moment um n = Ml . Es ist also:
p, = M 2- M12 =2(24e-63) = f0.559691
p3=M3-3M2Ml+zhl3 = 123 -45e = +0.667318
p 4 = M 4-4M,M, +6M2M12-3M,4=&(4272e- 11583) = + 1.843749.
Diese Werte liefern uns schliel3lich :
P
die Schiefe p = G - +1.617596
( A‘,-

und den ExzeB ~ = P-4- 3 = +z.885796.


PL22
Ehe wir zu diesen streng gultigen Ergebnissen Stellung nehmen, wollen wir in gleicher Weise die
Spriinge behandeln. Die Wahrscheinlichkeit eines Sprunges der Lange n ist nach (2)
n-2 2,
x,,=#-- -
n + z n!
giiltig fur n =3, 4, .
H. VON SCHELLING:
Kennzeichen fur eine rein zufallige Folge der Werte usw. 157

Wir formen um :

2n

2"-2 2n-1 2" Zn+l 291+2

1
n3x,,=Q
c 8---
2tL-3

(n-3)!
4-
2n-z

(n-2)!
+10---
(%-I)!
2n-1 zn
16 -+16
n!
Z"t1
~-
(n+1)!
8 --] 2n+z

(n+z)!

2n+z I
91-4 Zn-3 2n-z p-1 Zn 2n+l
n4xn2=3 1
[ 6 ~ +16-
(n-4)'
-
(n-3)!
+IZ --22
(n-z)!
___ +32 --32
(n-I)! n!
~

(n+1)!
+ 16 ___-
(n+2)!

Das ergibt fur die Momente um n = o die Werte:


M,, = [(e2- 5) - z(e2 -?)+ (e2- 7)] = I
M , =$ [ z (e2 - 3) - 4(e2 - 5) + 4 (e2 --?) - 2 (e2 - 7)] = 4
M , = $ [4 (e2 - I) - 6(e2- 3 ) + 8 (e2- 5) - 8 (e2 - y)+ 4 (e2- 7)] = 3e2 - 5
M 3=+ [8e2 -4(e2 - I) + 10(e2 - 3) - 16(e2- 5) + 16(e2-?) -8(e2 - 7)] =9e2 + 13
8 1 8 + 16e2+ 16(e2- r) + 1 2 (e2- 3) - 2 2 (e2- 5) + 3 2 (e2-?) - 32 (e2 - 7) + 16(e2-%)I
M , = %3 [* = 57e2- 23 .

Daraus finden wir fur die Momente um n = M l :


pz= 3 e 2 -z 1 = +1.167168
p3= 201 - 27e2 = + 1.495487
pa= 2oIe2 - 1479 = +6.200266 .
SchlieBlich erhalten wir
die Schiefe p = +1.185994 und den ExzeB E = +1.551386.
Nun handelt es sich darum, diese Formein fiir unser Problem nutzbar zu machen. Angenommen,
eine vorgelegte Reihe enthalte N l Laufe, deren durchschnittliche Lange x1 sei. Bei rein zufalliger An-
ordnung ist der Erwartungswert von x, gleich 2.5. Der mittlere Fehler desselben ist, da das zweite
Moment hier bekannt ist und nicht, wie in der Regel, geschatzt zu werden braucht,

Wir bilden die GroBe


t=-(x1- 2.5)
. I
vx
10.559691
die der Verteilung w ( t )d t = I -(I+:)-?&
) ' G B ( ~ln)
,
gehorcht, die von ))Studentccim Jahre 1908 gefunden worden ist; fur n ist die Anzahl Nl der Liiufe bzw.
spatcr die Anzahl N , der Sprunge einzusetzen, B @ , q ) bedeutet das Eulersche Integral erster Gattung

zp-l (I - 2)q-l dz .
0

Das Wahrscheinlichkeitsintegral der Verteilung ist seitdem mehrfach tabuliert worden ; eine Tafel
findet sich 2.B. bei R.A. Fisher, Statistical Methods for Research Workers, 6. ed. (1936). Nur wenn die
Wahrscheinlichkeit dafur, daf3 t gleich oder absolut groaer ausfallt, als gefunden, kleiner als I O/,, ist,
wird man ein reines Spiel des Zufalls mit einiger Sicherheit ausschlienen konnen.
Wenn die Reihe weiter N , Sprunge ergibt, deren durchschnittliche Lange x, ist, laBt sich die
Betrachtung wiederholen. Sie fuhrt auf den Ausdruck
(x2 -4) VN,
t = vI.168 '
dessen Wahrscheinlichkeit in gleicher Weise zu ermitteln ist. Bei kurzen Reihen werden die beiden
Verfahren nicht immer auf dasselbe Ergebnis fuhren, zumal dann die Anzahl der Sprunge oft gar zu
klein sein diirfte.
158 H. VON SCHELLINC:
Kennzeichen fur eine rein zufallige Folge der Werte usw.

Hat man aber sehr lange Reihen zu prufen, so ist es im Gegenteil unangenehm, daD die durch-
schnittliche Lange eines Sprunges nur 4 betragt. Eine Einteilung in groBere Abschnitte scheint eine
tiefer schurfende Untersuchung zu versprechen. Das haben offenbar auch Kermack und MacKendrick
gedacht und deshalb versucht, mehr als zwei Laufe zu einer Einheit zusammenzufassen. So interessant
ihre diesbezuglichen Formeln sind, so kommen sie wegen ihrer Kompliziertheit fur die Praxis doch
nicht in Frage. Es sei darum ein kurzer Hinweis gestattet, wie sich eine von mir bereits im Jahre 1934
veroffentlichte Untersuchung auf die vorliegende Aufgabe anwenden laDt.
Wahrend Kermack und MacKendrick der Sicherheit wegen annehmen, da8 alle Ziffern ver-
schieden sind (damit niemals zwei gleiche aufeinander folgen), habe ich (Deutsch. Statist. Zbl. 26.137,
1934) im Gegenteil vorausgesetzt, daB nur K verschiedene Merkmale auftreten, die alle mit der
gleichen Wahrscheinlichkeit I : K erscheinen konnen. Es mogen nach n, Versuchen gerade 7 von den
K Merkmalen beobachtet worden sein. Der Erwartungswert B(n,) = M I , ,ist dann

das zweite Moment um diesen Erwartunpswert lautet

Diese (bis auf die Bezeichnung) in meiner Arbeit van 1934 stehenden Ausdrucke sind neuerdings von
M. G. Kendall, S. F. H. Kendall und B. Babington Smith (Biometrika 30.271, 1939) offenbar neu
gefunden und veroffentlicht worden. Die Verfasser haben die Formeln unmittelbar abgeleitet,
wahrend ich sie einst durch Spezialisierung sehr vie1 allgemeinerer Ansatze erhalten habe.
Zunachst stelle ist die Werte von MI,, und p 2 , , von K = 2 bis K = 10 in einer kleinen Ubersicht
zusammen. Zur Kontrolle haben die Gleichungen

r= 2 r= 2
gedient, die sich aus (.3) und (4) leicht beweisen lassen.

3.00 I 2.00 i 2.50 1 2.33 i 0.44


5.50 4.33 2.44 3.92 I 1.42 3.70 0.991 3.57 0.75 1 3.48 0.61 3.41 0.51 3.36
8.33 '4.44 6.42' 5.18 5.70 2.99' 5 32 2.07 5.08 1.57 4.91 1.26 4.79
11.42 25.18 8.70 8.99 7:65 I
14.70 38.99 111.15
I
5.18 7.08
13.93 1 9 74
3.57
8.01
6.71
8.96
2.70
5.51 8.46
6.46

7 ,18.15 55.93 113'74 20.01 11.96 1 1 . 5 1 10.96


8
9
I i
121:74 76.01 16.46
25.46
27.26 14.29
99.26 19.29 35.69
I I 29.29 125.69
Die Anwendung dieser Resultate auf die vorliegende Frage ist sehr einfach. Man schreibe sich
die Beobachtungsergebnisse der GroBe nach geordnet auf und teile die so entstehende Reihe, von vorn
beginnend, in 2, 3, oder K gleich lange Stucke. Den Beobachtungen im m.Abschnitt weise man die
Kennziffer m zu. So wird jeder Beobachtung in der urspriinglichen, chronologisch geordneten Reihe ein
bestimmtes Merkmal zugesprochen. Die K verschiedenen Merkmale kommen alle mit der gleichen
Wahrscheinlichkeit I : K vor. Wir konnen diese Merkmalsreihe nun, von vorn beginnend, bis zum
jeweiligen Erscheinen des IV.Merkmals in Abschnitte zerlegen, wobei im Gegensatz zur Teilung in
Laufe und Sprunge keine Uberschneidungen vorkommen. Das arithmetische Mittel der gefundenen
Abschnitte n, sei g ,ihre Anzahl N,. Wir bilden

t=
(% -MI,+) 1/z
VPGT
und verfahren wie friiher. Wenn verschiedene Wahlen von K und 7 die Moglichkeit einer rein zufalligen
Anordnung offenlassen, so ist das zu beachten. Bei wesentlich abweichenden Ergebnissen wird zunachst
zu prufen sein, ob nicht die Anzahl der betreffenden Abschnitte zu klein ist, so daB aus diesem Grunde
das Resultat kein starkes Gewicht hat. Im allgemeinen werden sich Abweichungen .van einer rein
zufalligen Verteilung mit wachsendem K , also bei einer Verfeinerung der Teilung deutlicher auspragen,
so daB gar nicht vermutet werden kann, das Verfahren miisse fur jedes K und jedes r zu dem gleichen
Ergebnis fuhren.
H. VON SCHELLING:
Kennzeichen fur eine rein zufallige Folge der Werte usw. 159

Um nicht iiber Gebuhr Raum in Anspruch zu nehmen, entwickle ich die Methoden an einer
Reihe, die eigentlich fur eine derartige Untersuchung zu kurz ist. AuBerdem handelt es sich nicht um
Einzelbeobachtungen, sondern um Normalorter, bei denen also die zufallige Unsicherheit weitgehend
ausgeschaltet ist.
In seiner Arbeit ,Baryzentrische Ephemeride des Planeten 433 Eros fur die Perihelopposition
1930-310 teilt G. Wittl) die Restabweichungen B -R fur 34 Normalorter mit, die einen Zeitraum von
38 Jahren uberdecken. Die vier letzten beziehen sich auf die gleiche Opposition; sie sind also nicht von-
einander unabhangig. Deshalb nehme ich nur Nr. 31 mit. AuRerdem beschranke ich mich auf die
Abweichungen in Rektaszension.
In der Tabelle ergibt die Nummer in der ersten
Spalte die chronologische Ordnung. In der zweiten Spalte Nr. 'OSs1 1
f i = z z 2 , fi=3
r=2 r = 3
stehen die Werte d a COSS,die Maximalzahlen sind fett ge- -
-
druckt. Zwei aufeinanderfolgende solcher Zahlen schlieDen
stets zwei Laufe ein. Diese Laufe haben, wie leicht abzu-
I
2
+4'.66
+ 1.40
+I.80
~

'
~ 2
2
1 i 3
3
1 -

2 3
lesen ist, die Lange: 2 2 4
2, 2 , 4, 6 , 2, 2, 2 , 2 , 4, 3, 2 , 2, 2, 2, 2, 21 3, 3, 2 . 1 5 I 5
Die durchschnittliche Lange der N , = I ~ Laufe betragt 7 I -O.O4 2 2

x1 -
- 119
9 -- 2.578.
Noch rascher sind die Werte der Sprunge von Maxi-
mum zu Maximum zu finden: I1 I +2.84 I 2 I i
3, 9, 3, 3, 6 , 3, 3, 3, 5 . I 4 2 5
2 2
Als durchschnittliche Lange der N , = g Spriinge erhalten +0.29
14 I 2 2
wir x , = 9 = 4 . 2 2 2 . '5 +O.M 2 2
Zur Berechnung von t haben wir die Daten: 16 +0.07 I 2 2
17 -0.51 I I 5 I1
I I8 -1.64 I I

des Mittels '9 +0.75 2 3 2 2

Laufe
Spriinge ~
I9
9 1 +0.078
+0.222
I 0.172
1 0.360
1 +0.453
j +0.617
1 ;-:; 20
21
22
+1.13
-1.23
+0.66
2
I
2
2
3
I
2
2
3

Die Berechnung von P i s t nach der erwahnten t-Tafel 23 , -3.20


2 2I I

erfolgt. Die Wahrscheinlichkeit dafur, daB die Verteilung 24 -1.40 I I


25 -1.47 I I
der Laufe und Spriinge rein zufallsbedingt ist, ubersteigt 26 -0.12 2 3 I
in beiden Fallen den Wert 0.5. Eine systematische Grup- 27 -1.15 I I

pierung der Abweichungen ist also nach den Tests von 28 - 1.92 I I
29 +I.49 2 6 3 3 9
Kermack und MacKendrick wenig wahrscheinlich, obwohl 30 +2.86 2 3
die Tabelle bei fluchtiger Betrachtung einen gegenteiligen 3' -0.66 -
I 2 I 2
Eindruck erweckt. 30 30 28
Um eine Einteilung in zwei bzw. drei gleich- 10 10 4
grol3e Abschnitte vornehmen zu konnen, brauchen wir 3.00 3.00 7.00
3.00 2.50 5.50
eine durch 6 teilbare Anzahl von Reihengliedern. Aus 0.00 +0.50+ 1.50
diesem Grunde schalte ich von nun an den sowieso nur
unsicheren Normalort Nr. I aus. In den mit R = 2 und R = 3 iiberschriebenen Spalten sind die zugeord-
neten Merkmale verzeichnet. In denen mit r = z und ~ = gekennzeichneten
3 Spalten sind die Ab-
schnittslangen jeweils am Ende der Abschnitte angegeben. Am FuD der Ubersicht sind die Durch-
schnittswerte berechnet. Wir fassen sie noch einmal zusammen und erhalten :
Bei der rohen Einteilung in
zwei Halften finden wir fiir die mitt-
lere Abschnittslange genau den er- -
warteten Wert. Beidernachst feineren k = 2 3.00
Einteilung liegen die beobachteten fi=3 3.00
Abschnittslangen deutlich uber den
theoretischen Werten. Immerhin besteht noch iin ungiinstigsten Falle K = 3, r = 2 eine Wahrscheinlich-
keit von rund I O O / ~ dafur, daR die Dehnung der Abschnitte allein dem Zufall zuzuschreiben ist. Da
aber auch die Laufe und Sprunge im Mittel weiter ausgefallen sind, als zu erwarten ist, scheint eine ge-
wisse Tendenz zur systematischen Gruppenbildung wohl doch nicht von der Hand zu weisen zu sein.
l) Astron. Abh., E r g a m - H . Astron. Nachr. 9. A I (1935).