Sie sind auf Seite 1von 10

"Wahrscheinlichkeitsmodelle für Hockey-Wetten"

Ravi Patel IB SL Mathematik


Hockey hat sich auf unbestimmte Zeit als eine der am stärksten wachsenden Sportarten in
Nordamerika etabliert. Seit ich als Kind die Hockey Night in Kanada gesehen habe, habe ich eine
große Leidenschaft für den nationalen Wintersport Kanadas entwickelt. Während meines ganzen
Lebens, in dem ich diese Spiele gesehen habe, habe ich eine Leidenschaft für die große Rivalität
zwischen den beiden riesigen Franchises in der NHL entwickelt. Dies bezieht sich natürlich auf die
gefeierte Rivalität zwischen den Toronto Maple Leafs und den Montreal Canadiens.

Während meines ganzen Tages, in dem ich diese Hockeyspiele beobachtete, bemerkte ich
immer Werbung von Wettunternehmen, die ihre Zuschauer ermutigten, gegen Geld auf die Punktzahl
und den Gewinner dieser hochrangigen sportlichen Rivalitäten zu wetten. Das gesamte Konzept der
Sportwetten schien mir extrem kompliziert zu sein, besonders als ich auf ein CBC-Video stieß, das
zeigte, dass das große Schema der Gewinner von der Sportwetten-Website Nerd-ähnliche Personen
waren, die mathematische Modelle erstellt hatten, um die Gewinner/Rankings zukünftiger Spiele
und/oder Saisons vorherzusagen. Die Komplexität dieser mathematischen Modelle präsentierte sich
erst, als ich schließlich die Konzepte der Statistik und Wahrscheinlichkeitsverteilung in meiner SL-
Mathematikklasse lernte. Mir ist aufgefallen, dass bestimmte Wahrscheinlichkeitsverteilungen unter
Verwendung von Wahrscheinlichkeitssätzen analysiert und extrapoliert werden können, um
mathematische Wahrscheinlichkeitsmodelle für zukünftige Situationen zu erstellen.

Zuerst hatte ich meine Zweifel daran, normale Wahrscheinlichkeitsverteilungen auf


Hockeywetten miteinander in Beziehung zu setzen, aber als ich verschiedene Konzepte im HL-
Mathematik-Lehrbuch recherchierte, war ich zu einem Thema aufgestiegen. Meine Begründung für
diese interne Bewertung ist es, Wahrscheinlichkeitsmodelle aus den Torzahlen von Toronto und
Montreal aus der National Hockey League-Saison 2017-18 zu erstellen und dann eine Gleichung
eines Wahrscheinlichkeitsmodells zu finden, das am besten mit den Daten übereinstimmt, um das
Ergebnis eines zukünftigen Ligaspiels vorherzusagen. Um die Parameter der Gleichung begrenzt zu
halten und jegliche Verzerrung der Heimmannschaft innerhalb meines mathematischen Modells zu
vermeiden, gehe ich davon aus, dass das Spiel in Los Angeles als jährliches "Winter Classic Game"
gespielt wird. Um extrem genaue Daten zu erstellen, runde ich keine der Zahlen, die mein
Grafikrechner anzeigt, um sicherzustellen, dass meine Parameterwerte so genau wie möglich sind.
Darüber hinaus werde ich auch auf verschiedene Variablen zugreifen und diese reflektieren, die sich
auf meine Berechnungen auswirken. Diese mathematischen Vorsichtsmaßnahmen stellen sicher, dass
meine endgültigen erwarteten Wahrscheinlichkeiten so genau wie möglich sind.
Der erste Schritt, der im mathematischen Modellierungsprozess unternommen werden muss, besteht
darin, den erwarteten Wert der Tore zu ermitteln, die jedes Team im Spiel erzielen kann. Dies
geschieht durch die Erstellung eines Histogramms der von jedem einzelnen Team während der 82-
Spiele-Saison 2017-18 weitergeleiteten Ziele (Goals Forwarded, GF). Ich habe mich auch dafür
entschieden, eine Trendlinie hinzuzufügen, um den Trend der Tordurchschnitte der Maple Leafs
während der gesamten Saison anzuzeigen. Die gesammelten Daten werden in der folgenden
Abbildung in einem Histogramm angezeigt.

(Abbildung 1.0)

GF of the Toronto Maple Leafs


25
20
20 18
FREQUENCY

15 13
11
10 7 6
5 2 3 2
0
0 1 2 3 4 5 6 7 8
# of goals forwarded

Nachdem wir nun eine Häufigkeitstabelle für die von Toronto weitergeleiteten Tore erstellt haben,
müssen diese Daten in ein Diagramm umgewandelt werden, das die Wahrscheinlichkeit anzeigt,
damit sie interpretiert werden können, um erwartete Werte der Torerfolgstendenzen des Teams zu
finden. Anfangs war es für mich schwierig, ein ausgeprägtes Kurvenmuster (z. B. exponentiell,
normal) zu finden, das mit meinen Daten übereinstimmt, da es diskret ist. Nach weiteren
Nachforschungen sehe ich, dass dieses Modell am besten zu einer Poisson-Verteilungskurve passt.
Die Poisson-Verteilung ist eine diskrete Häufigkeitsverteilung, die die Wahrscheinlichkeit angibt,
dass eine Reihe unabhängiger Ereignisse in einer festen Zeit auftreten. Um festzustellen, ob die
Anzahl der Ankünfte pro Minute einer Poisson-Verteilung folgt, werden die Null- und
Alternativhypothesen unten geschrieben:
H 0: Die Anzahl der Ankünfte pro Minute folgt einer Poisson-Verteilung

H 1: Die Anzahl der Ankünfte pro Minute folgt keiner Poisson-Verteilung

Um zu analysieren, ob meine Daten einem Poisson-Prozess folgen, muss ich zuerst den Parameter
meiner Daten bestimmen, der der Mittelwert ist, modelliert als Lambda ( ƛ ).
c

∑ mj f j
X = j=1
n
277
X= =3.37805= ƛ
82
Dieser Wert von X wird nicht auf drei signifikante Ziffern gerundet, da ich diesen Mittelwert als
Schätzung von verwende ƛ . Daher können unter Verwendung von Lambda als Schätzung des
Mittelwerts die Häufigkeiten von X Erfolgen für ( X =1 ,2 , 3 , 4 , 5 , 6 , 7 , 8) gefunden werden.
Darüber hinaus wird die theoretische Häufigkeit für jeden Wert von X aus der Multiplikation der
Stichprobengröße (N) mit jeder X-Werte-Poisson-Wahrscheinlichkeit abgeleitet.

Nun, da ich die Schätzung des Mittelwerts für die Gesamtdaten gefunden habe, muss ich die Poisson-
Wahrscheinlichkeit für 10 Intervalle von X berechnen. Diese Intervalle umfassen (
X =1 ,2 , 3 , 4 , 5 , 6 , 7.8.9∨more ). Ich muss die Wahrscheinlichkeit von 9 oder mehr berechnen, da
es wichtig ist zu beachten, dass die Poisson-Wahrscheinlichkeit ein theoretisches Konzept der von
den Toronto Maple Leafs vorgelegten Ziele darstellt. Da es theoretisch möglich ist, mehr als 9 Tore
in einem Spiel zu erzielen, liefert die Schätzung des Mittelwerts (3,37805) den erwarteten Wert von (
X = [ 9 , ∞ ])
Um die theoretische Poisson-Wahrscheinlichkeit von X zu finden, habe ich die Poisson-
Verteilungsformel entdeckt, die unten angezeigt wird:
x −ƛ
ƛ e
P ( X=x ) =
x!
Wobei:
ƛ = Wird als Parameter in der Gleichung verwendet (wie bereits erwähnt)
e = Eulersche Zahl, eine mathematische Konstante mit dem Wert 2,71828
Die Berechnung der erwarteten Wahrscheinlichkeiten der einzelnen weitergeleiteten Ziele scheint
zunächst ziemlich einfach zu sein, aber ich näherte mich einer verworrenen Phase, als ich die erwartete
Wahrscheinlichkeit von (X=0) finden musste. Zu diesem Zeitpunkt erinnerte ich mich an den Prozess,
den mein Tutor mir beigebracht hatte, um zu zeigen, dass das Faktorial von 0 gleich 1 ist.

n !=n ( n−1 )( n−2 ) ( n−3 ) … .


n !=n(n−1)!
1 !=1(1−1)!
1=1(0! )
1=0!
Mit dem Ausdruck von ersetzte n !=n ! , ich dann einen Wert von durch n 1, da ich wusste, dass sein
Faktor einfach 1 (1x1) wäre. Darüber hinaus würde mir der (n-1) -Wert auch Null geben und daher
habe ich einen gefunden, der 1= 0 ist! Ich kann nun mit meinen Berechnungen der Poisson-
Wahrscheinlichkeit fortfahren, indem ich X durch 0 und ⊲ durch 3,37805 ersetze.
0 −3.37805
3.37805 e
P ( X=0 )=
0!

P ( X=0 )=1 e−3.37805 ¿ ¿


0!
1(0.03411)
P ( X=0 )=
1
P ( X=0 )=0.03411
Jetzt, da ich meine erwartete Poisson-Wahrscheinlichkeit von (X=0) berechnet habe, muss ich
dasselbe für alle anderen Intervalle von X tun, einschließlich (X= 0,1,2,3,4,5,6,7,8,9 oder mehr). Die
folgenden erwarteten Wahrscheinlichkeiten sind unten aufgeführt:
Tabelle 1.1
Anzahl der P(X) aus Poisson-
weitergeleiteten Verteilung mit
Ziele (X) ƛ=3.37805
0 0.03411 Ich fand auch ein wenig Schwierigkeiten beim
1 0.11524 Versuch, die Wahrscheinlichkeit von 9 oder mehr
2 0.19464 zu finden, aber ich habe einfach mein Wissen über
3 0.21917 Statistik und Wahrscheinlichkeit angewendet, um
4 0.18509 die erwartete Wahrscheinlichkeit zu erhalten.
5 0.12505
P ( X ≥ 9 )=1− [ P ( X =0 ) + P ( X =1 ) + P ( X=2 ) + P ( X =3 ) + P ( X=4 )+
6 0.07040
7 0.03398 P ( X ≥ 9 )=0.00744
8 0.01435
9 oder mehr 0.00744

Jetzt, da ich jedes der P(X) für Ziele habe, die von den Toronto Maple Leafs weitergeleitet
werden, kann ich jetzt diese Daten nehmen und eine visuelle Kurve erstellen, die das
ursprüngliche GF-gegen-Frequenz-Diagramm aus Abbildung 1.1 modellieren sollte

Abbildung 1.2
GF Probablity with Lambda = 3.37805
0.25
0.21917
0.2 0.19464
0.18509
Probability of (X)

0.15
0.12505
0.11524
0.1
0.0704

0.05 0.03411 0.03398


0.01435 0.00744
0
0 1 2 3 4 5 6 7 8 9
# of goals forwarded (X)

Ich kann offensichtlich sehen, dass diese Verteilung eine Poisson-Verteilung wie in Abbildung 1.2
ist, wobei Lambda als Parameter der theoretischen Wahrscheinlichkeit mit dem ursprünglichen
Modell aus Abbildung 1.1 übereinstimmt. Ich kann dies bestätigen, da die Trendlinien zwischen den
verschiedenen Punkten die gleichen Zu- und Abnahmeintervalle aufweisen. Die Grafik zeigt jedoch
nicht perfekt die Daten der weitergeleiteten Ziele.
Anstatt qualitative mathematische Modelle zu verwenden, musste ich einen Weg finden, um einen
mathematischen Prozess zu erhalten, der meine Daten nehmen und bestimmen konnte, ob meine
Daten Poisson in der genauesten möglichen Weise waren. Um eine genauere Darstellung der Nähe
meiner Daten zu einem Poisson-Modell zu erhalten, entschied ich mich für einen Chi-Quadrat-Test.
Der Chi-Square-Fit-Test ist ein nichtparametrischer Test, der verwendet wird, um herauszufinden,
wie sich der beobachtete Wert eines bestimmten Phänomens signifikant vom erwarteten Wert
unterscheidet. Die Gleichung wird angezeigt als:
❑ 2
(f 0−f e )
=∑
2
ƛ k− p−1
k fe

Wobei:
f 0 = Ist die beobachtete Häufigkeit

f e = Ist die theoretische oder erwartete Häufigkeit

k = Die Anzahl der Kategorien oder Klassen, die nach dem Kombinieren von Klassen verbleiben
p = Die Anzahl der aus den Daten geschätzten Parameter
Wenn ich mir die folgende Gleichung anschaue, ist es offensichtlich, dass mir einige Variablen in der
Gleichung fehlen. Ich muss die theoretische Wahrscheinlichkeit finden ( f e). Diese Häufigkeit kann
entnommen werden aus: f e =( n ) ( P ( X ) ) . Die folgende Tabelle zeigt die Berechnungen, die ich
durchgeführt habe, um den endgültigen Näherungswert von Lambda zum Quadrat zu erhalten. Ich
habe dies getan, indem ich eine Gleichungstabelle erstellt habe, in der ich einen Schritt-für-Schritt-
Prozess durchführe, um die Summe der endgültigen Formel zu erhalten, die alle in der folgenden
Tabelle aufgeführt sind:
Tabelle 1.2
fe ¿) ¿ 2
( f 0−f e )
fe
2.79702 0.79702 0.635241 0.227113
9.44968 1.55032 2.40349 0.254346
15.9605 -2.9605 8.76456 0.549141
17.9719 2.0281 4.11319 0.228868
15.1774 2.8226 7.96707 0.52493
10.2541 -3.2541 10.5892 1.03268
5.7728 0.2272 0.05162 0.008942
2.78636 0.21364 0.045642 0.016381
1.1767 0.8233 0.677823 0.576037
0.61008 0.61008 0.372198 0.61008
Summe: 4.02652

Nach dem Ausfüllen der Tabelle bin ich etwas misstrauisch, wie die Ziffer für die theoretische
Frequenz von 10,2541 im Vergleich zum Rest zu einem so hohen Wert gekommen ist.
Nichtsdestotrotz stellt die Summe aus dieser Poisson-Verteilungsgleichung fest, dass ƛ 2=4.02652 .

Jetzt, da der Schritt-für-Schritt-Prozess abgeschlossen ist, muss ich den Index weiterhin unter ""
finden. Um die Indizierung unter + zu bestimmen, muss ich ein Konzept bestimmen, das mit der
Poisson-Verteilung verbunden ist, die als Freiheitsgrade bekannt ist. Die Gleichung lautet wie folgt:
2
ƛ =k −p−1
Wir erinnern uns, dass die Definitionen für die Variablen k und p bereits oben angegeben wurden.
Daher ist der Wert von k, der die Anzahl der Klassen ist, die nach dem Kombinieren von Klassen
verbleiben, 9, da dies die theoretische Klasse ist, die in den tatsächlich beobachteten Häufigkeiten
nicht erscheint. Darüber hinaus ist der Wert von p 1, da wir nur Lambda als Parameter betrachten,
der in Beziehung zum Chi-Squared-Test steht. Daher kann ich die Freiheitsgrade wie folgt finden:
k − p−1=9−1−1=7
Nun, da unsere Freiheitsgrade gefunden sind, müssen wir die alternative Hypothesentestmethode
verwenden, um endlich festzustellen, ob die Verteilung eine Poisson-Verteilung ist. Um mit dieser
Testmethode fortzufahren, muss ich die gleiche Ablehnungshypothese verwenden, die dann auf Seite
1 erwähnt wurde. Zuerst war ich sehr verwirrt, als ich die Beziehung zwischen dem
Nullhypothesentest und der Eignung meiner Daten für eine Poisson-Verteilung fand. Ich beschloss
dann, mir einige YouTube-Videos anzusehen und zu lernen, wie man die Testmethode durchführt,
die ein Konzept beinhaltet, das mir im Unterricht beigebracht wurde, bekannt als kritische Punkte.
Ich habe zuerst den Ablehnungssatz eingerichtet:
H 0 : ƛ=3.37805

H 1 : ƛ ≠3.37805

Daran wird weiter gearbeitet werden müssen. Ich fuhr mit dem nächsten Schritt meiner IA fort, da
ich bereits aus qualitativen Beobachtungen schließen konnte, dass meine Distribution Poisson war,
aber ich muss noch an dieser Berechnung arbeiten

Jetzt, da mein Chi-Squared-Test bewiesen hat, dass die Verteilung der Goals Forwarded-Zählung der
Toronto Maple Leafs eine Poisson-Verteilung ist, ist meine Arbeit immer noch nicht abgeschlossen.
Da mein Endziel darin besteht, eine Wahrscheinlichkeitsmatrix zu erstellen, um die Angriffsstärke
jedes Teams zu zeigen, muss ich auch die Poisson-Verteilung der Montreal Canadiens bestimmen.
Da mein vorheriger Chi-Squared-Test bewiesen hat, dass die Torausbeute des Maple Leaf tatsächlich
eine Giftausbeute war, kann ich nun zu dem Schluss kommen, dass die Torausbeute im
Hockeysport ein Poisson-Prozess ist. Mit diesem Wissen kann ich nun ein P(X) -Modell der
Torwertung in Bezug auf den gefundenen Lambda-Wert der Montreal Canadiens erstellen.
Abbildung 2
GF by the Montreal Canadiens
20
15 17 18
Frequency

14
10 12
10
5 6
0 2 1 1 1
0 1 2 3 4 5 6 7 8 9 10
# of goals forwaded

Diese Figur sieht der Abbildung 1 sehr ähnlich, in der die Daten der Zielweiterleitung in einer
ähnlichen Kurve verteilt waren. Um fortzufahren und mein P(X) -Diagramm zu finden, muss ich den
Wert von bestimmen ƛ und dann erneut berechnen.
c

∑ mj f j
X = j=1
n
209
X= =2.54878=ƛ
82
Anzahl der P(X) aus Poisson-
weitergeleiteten Verteilung mit
Ziele (X) ƛ=2.54878
0 0.07818
1 0.19926
2 0.25393 P ( X ≥11 )=1− [ P ( X =0 ) + P ( X =1 )+ P ( X=2 ) + P ( X =3 ) + P ( X=
3 0.21574
4 0.13747 P ( X ≥11 )=0.00006
5 0.07007
6 0.02977
7 0.01084
8 0.00345
9 0.00098
10 0.00025
11 oder mehr 0.00006
Abbildung 2.1
Probability of GF with Lambda = 2.54878
0.3
0.25393
0.25
0.21574
0.19926
0.2
Probability of (X)

0.15 0.13747

0.1 0.07818
0.07007
0.05 0.02977
0.01084 0.00345 0.00098 0.00025 0.00006
0
0 1 2 3 4 5 6 7 8 9 10 11 or
more
# of goals scored (X)

Abbildung 2.1 sieht ähnlich aus wie das Diagramm, das aus den Daten in Abbildung 2 berechnet
wurde. Ich bemerkte, dass die theoretischen Wahrscheinlichkeiten von P(7 ≤ X ≤ 11∨more ) nicht
wirklich mit den Ergebnissen der ursprünglichen Grafik übereinstimmten. Wenn man über mögliche
einschränkende Faktoren nachdenkt, liegt der Grund dafür darin, dass die beobachtete Häufigkeit von
Torschüssen in hohen Bereichen äußerst selten ist, weshalb es kleine Schwankungen zwischen o und
1 für eine P(7 ≤ X ≤ 11∨more ) noch allmähliche Abnahme des theoretischen
Wahrscheinlichkeitsdiagramms gibt.
Jetzt, da alle Poisson-Wahrscheinlichkeiten für die weitergeleiteten Ziele der Toronto Maple Leaf's
und der Montreal Canadians gefunden wurden, muss ich die Wahrscheinlichkeiten zurück in die
Poisson-Verteilungsformel berechnen und dann eine Matrix von Wahrscheinlichkeiten mit
möglichen Ergebniswerten erstellen.

Das könnte Ihnen auch gefallen